日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

OpenCV(python)版實現文本分割之水平投影法_python

作者:Keras深度學習 ? 更新時間: 2022-09-28 編程語言

對于如下一張圖片,如何將文本區域分割成一行一行的了?

在這里插入圖片描述

在文本分割領域中有一種很優秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側向右邊進行照射,每一條光線可以理解為圖像的一行,計算每一行上圖像的黑色像素點,從而可以對圖像進行分割。

import numpy as np 
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的區間
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear與[]有區別
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/1.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        水平投影從左向右投射,計算每一行的黑色像素總數
        '''
        rows,cols=binary.shape
        hor_list=[0]*rows
        for i in range(rows):
            for j in range(cols):
                #統計每一行的黑色像素總數
                if binary.item(i,j)==0:
                    hor_list[i]=hor_list[i]+1
        '''
        對hor_list中的元素進行篩選,可以去除一些噪點
        '''
        hor_arr=np.array(hor_list)
        hor_arr[np.where(hor_arr<5)]=0
        hor_list=hor_arr.tolist()

        #繪制水平投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for i in range(rows):
            pt1=(cols-1,i)
            pt2=(cols-1-hor_list[i],i)
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('水平投影',img_white)
        cv2.waitKey(0)
        
        #取出各個文字區間
        vv_list=get_vvList(hor_list)
        for i in vv_list:
            img_hor=img_bgr[i[0]:i[-1],:,:]
            cv2.imshow('文本行',img_hor)
            cv2.waitKey(0)

運行上述代碼,可以看到水平投影的效果。

在這里插入圖片描述

根據投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:

在這里插入圖片描述

原文鏈接:https://blog.csdn.net/qq_37781464/article/details/113116237

欄目分類
最近更新