網站首頁 編程語言 正文
對于如下一張圖片,如何將文本區域分割成一行一行的了?
在文本分割領域中有一種很優秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側向右邊進行照射,每一條光線可以理解為圖像的一行,計算每一行上圖像的黑色像素點,從而可以對圖像進行分割。
import numpy as np
import cv2
def get_vvList(list_data):
#取出list中像素存在的區間
vv_list=list()
v_list=list()
for index,i in enumerate(list_data):
if i>0:
v_list.append(index)
else:
if v_list:
vv_list.append(v_list)
#list的clear與[]有區別
v_list=[]
return vv_list
if __name__=='__main__':
img_bgr=cv2.imread('./testImg/1.png',1)
if not img_bgr is None:
img=img_bgr.copy()
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#二值化
t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
'''
水平投影從左向右投射,計算每一行的黑色像素總數
'''
rows,cols=binary.shape
hor_list=[0]*rows
for i in range(rows):
for j in range(cols):
#統計每一行的黑色像素總數
if binary.item(i,j)==0:
hor_list[i]=hor_list[i]+1
'''
對hor_list中的元素進行篩選,可以去除一些噪點
'''
hor_arr=np.array(hor_list)
hor_arr[np.where(hor_arr<5)]=0
hor_list=hor_arr.tolist()
#繪制水平投影
img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
for i in range(rows):
pt1=(cols-1,i)
pt2=(cols-1-hor_list[i],i)
cv2.line(img_white,pt1,pt2,(0,),1)
cv2.imshow('水平投影',img_white)
cv2.waitKey(0)
#取出各個文字區間
vv_list=get_vvList(hor_list)
for i in vv_list:
img_hor=img_bgr[i[0]:i[-1],:,:]
cv2.imshow('文本行',img_hor)
cv2.waitKey(0)
運行上述代碼,可以看到水平投影的效果。
根據投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:
原文鏈接:https://blog.csdn.net/qq_37781464/article/details/113116237
相關推薦
- 2022-07-18 Uniapp中調整web-view的高度、獲取當前的web-view頁面URL
- 2022-10-01 C#?TreeView控件使用技巧匯總_C#教程
- 2022-11-15 Flutter異步操作實現流程詳解_Android
- 2023-01-05 Python中使用jpype調用Jar包中的實現方法_python
- 2022-11-08 background-image 背景平鋪方式、 CSS3 background-size背景圖像大
- 2022-01-22 linux系統raid0測試實驗
- 2023-02-25 Golang嵌入資源文件實現步驟詳解_Golang
- 2022-12-06 react?fiber執行原理示例解析_React
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支