TW202305741A - 文字分割方法、電子設備及儲存介質 - Google Patents

文字分割方法、電子設備及儲存介質 Download PDF

Info

Publication number
TW202305741A
TW202305741A TW110127062A TW110127062A TW202305741A TW 202305741 A TW202305741 A TW 202305741A TW 110127062 A TW110127062 A TW 110127062A TW 110127062 A TW110127062 A TW 110127062A TW 202305741 A TW202305741 A TW 202305741A
Authority
TW
Taiwan
Prior art keywords
image
rectangular
average
text
adjacent
Prior art date
Application number
TW110127062A
Other languages
English (en)
Other versions
TWI795851B (zh
Inventor
王正峯
林立哲
楊潓賢
Original Assignee
鴻海精密工業股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 鴻海精密工業股份有限公司 filed Critical 鴻海精密工業股份有限公司
Priority to TW110127062A priority Critical patent/TWI795851B/zh
Publication of TW202305741A publication Critical patent/TW202305741A/zh
Application granted granted Critical
Publication of TWI795851B publication Critical patent/TWI795851B/zh

Links

Images

Abstract

本申請提供一種文字分割方法、電子設備及存儲介質,所述方法包括:獲取目標圖像的圖像特徵;根據所述圖像特徵對所述目標圖像進行增強處理,得到增強圖像;檢測所述增強圖像中文字的閉合邊緣;基於所述閉合邊緣確定所述文字對應的第一矩形輪廓;對所述第一矩形輪廓進行矯正,得到第二矩形輪廓;根據所述第二矩形輪廓對所述目標圖像進行文字分割。透過本申請可以提高文字分割的準確率。

Description

文字分割方法、電子設備及儲存介質
本申請涉及圖像檢測領域,尤其涉及一種文字分割方法、電子設備及存儲介質。
圖像文字分割在很多地方都會用到,例如車牌識別,身份證識別。目前對文字進行分割的方法主要是透過訓練神經網路模型的方式得到,這種方式需要大量的資料樣本進行訓練,且對文字的格式、大小和品質要求很高。當圖像中的文字格式不固定,清晰度不夠時,容易出現檢測不準確的情況。
鑒於以上內容,有必要提供一種文字分割方法、電子設備及存儲介質,能提高文字分割的準確率。
本申請提供一種文字分割方法,所述方法包括:獲取目標圖像的圖像特徵;根據所述圖像特徵對所述目標圖像進行增強處理,得到增強圖像;檢測所述增強圖像中文字的閉合邊緣;基於所述閉合邊緣確定所述文字對應的第一矩形輪廓;對所述第一矩形輪廓進行矯正,得到第二矩形輪廓;根據所述第二矩形輪廓對所述目標圖像進行文字分割。
在一種可能的實現方式中,所述圖像特徵包括:圖元均值、標準差、圖像長度及寬度,所述根據目標圖像的圖像特徵對所述目標圖像進行增強處理,得到增強圖像包括:比較所述圖元均值與預設均值閾值,並根據比較結果對所述二值化圖像進行圖像反轉處理,得到反轉圖像;匹配與所述標準差對應的去噪演算法;根據所述圖像長度及寬度確定所述去噪演算法的核參數,並使用所述去噪演算法對所述反轉圖像進行去噪處理,得到增強圖像。
在一種可能的實現方式中,所述基於所述閉合邊緣確定所述文字的第一矩形輪廓包括:生成與所述目標圖像大小相同的空白圖像;根據所述閉合邊緣在所述空白圖像上生成矩形輪廓,得到輪廓圖像,所述矩形輪廓在所述輪廓圖像中的位置與所述閉合邊緣對應的輪廓在所述目標圖像中的位置相同;檢測所述輪廓圖像中的所有輪廓;將每個輪廓確定為所述第一矩形輪廓。
在一種可能的實現方式中,所述對所述第一矩形輪廓進行矯正,得到第二矩形輪廓包括:計算所述第一矩形輪廓的平均面積、平均橫向間距、平均縱向間距;根據所述平均面積、所述平均橫向間距和所述平均縱向間距修正所述第一矩形輪廓,得到所述文字對應的第二矩形輪廓。
在一種可能的實現方式中,所述計算所述第一矩形輪廓的平均面積、平均橫向間距、平均縱向間距包括:確定每個所述第一矩形輪廓的四個頂點座標;根據所述頂點座標確定每個所述第一矩形輪廓的寬度和長度;根據所述寬度和所述長度確定所述平均面積;基於所述頂點座標確定水準相鄰的第一矩形輪廓;計算所述水準相鄰的第一矩形輪廓的平均橫向間距;基於所述頂點座標確定垂直相鄰的第一矩形輪廓;計算所述垂直相鄰的第一矩形輪廓的平均縱向間距。
在一種可能的實現方式中,所述根據所述平均面積、所述平均間距修正所述第一矩形輪廓,得到所述文字對應的第二矩形輪廓包括:確定水準相鄰的兩個所述第一矩形輪廓之間的相鄰橫向間距,及垂直相鄰的兩個所述第一矩形輪廓之間的相鄰縱向間距;根據所述相鄰橫向間距和所述相鄰縱向間距合併所述第一矩形輪廓,得到候選矩形框;移除小於所述平均面積第一預設倍數的候選矩形框,並拆分大於所述平均面積第二預設倍數的候選矩形框,得到所述第二矩形輪廓。
在一種可能的實現方式中,所述根據所述相鄰橫向間距和所述相鄰縱向間距合併所述第一矩形輪廓,得到候選矩形框包括:將小於所述平均橫向間距的相鄰橫向間距對應的兩個第一矩形輪廓進行合併;將小於所述平均縱向間距的相鄰縱向間距對應的兩個第一矩形輪廓進行合併。
在一種可能的實現方式中,所述檢測所述增強圖像中文字的邊緣包括:對所述增強圖像進行二值化處理,得到二值化圖像;對所述二值化圖像進行形態學處理,得到形態學圖像;對所述形態學圖像進行邊緣檢測,得到邊緣圖像;提取所述邊緣圖像中的邊緣。
本申請還提供一種電子設備,所述電子設備包括處理器和記憶體,所述處理器用於執行所述記憶體中存儲的電腦程式時實現所述的文字分割方法。
本申請還提供一種電腦可讀存儲介質,所述電腦可讀存儲介質上存儲有電腦程式,所述電腦程式被處理器執行時實現所述的文字分割方法。
本申請公開的文字分割方法及相關設備,透過獲取到的目標圖像的圖像特徵對所述目標圖像進行增強處理,得到增強圖像,檢測所述增強圖像中文字的閉合邊緣,基於所述閉合邊緣確定所述文字對應的第一矩形輪廓,對所述第一矩形輪廓進行矯正,得到第二矩形輪廓,根據所述第二矩形輪廓對所述目標圖像進行文字分割。透過對所述目標圖像進行增強,並根據所述增強圖像進行文字分割可以提高文字分割的準確率和分割效率。
為了使本申請的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本申請進行詳細描述。
請參閱圖1,圖1為本申請一實施例的電子設備的示意圖。參閱圖1所示,所述電子設備1包括,但不僅限於,記憶體11和至少一個處理器12上述元件之間可以透過匯流排連接,也可以直接連接。
所述電子設備1可以是電腦、手機、平板電腦、個人數位助理(Personal Digital Assistant,PDA)等安裝有應用程式的設備。本領域技術人員可以理解,所述示意圖1僅僅是電子設備1的示例,並不構成對電子設備1的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件,例如所述電子設備1還可以包括輸入輸出設備、網路接入設備、匯流排等。
如圖2所示,是本申請文字分割方法的較佳實施例的流程圖。所述文字分割方法應用在所述電子設備1中。根據不同的需求,該流程圖中步驟的順序可以改變,某些步驟可以省略。在本實施方式中,所述文字分割方法包括:
S11、獲取目標圖像的圖像特徵。
為了後續對所述目標圖像進行增強處理,需要獲取所述目標圖像的圖像特徵,從而根據目標圖像的圖像特徵對目標圖像進行增強處理。
在本實施方式中,所述目標圖像為包含文字的圖像,例如,IC封裝印字圖像。在IC的封裝過程中需要對IC進行印文書處理,為了保證印刷清晰完整,需要將所述IC封裝印字圖像中的文字進行精準分割。
在一個實施方式中,所述目標圖像可以為黑白圖像,例如,白字黑底,白底黑字。當目標圖像為黑白圖像時,計算目標圖像的圖元均值、標準差、圖像長度及寬度作為目標圖像的圖像特徵。
在一個實施方式中,所述目標圖像可以為彩色圖像。當目標圖像為彩色圖像時,先對所述目標圖像進行二值化處理,得到白字黑底或者白底黑字的二值化圖像,再計算二值化圖像的圖元均值、標準差、圖像長度及寬度作為目標圖像的圖像特徵。
S12、根據所述圖像特徵對所述目標圖像進行增強處理,得到增強圖像。
由於目標圖像不同,所需要的參數也不同,根據目標圖像的特徵對目標圖像進行增強處理,更具個性化,得到的增強圖像有助於提高對目標圖像中文字的分割效果。
在本實施方式中,所述根據所述圖像特徵對所述目標圖像進行增強處理,得到增強圖像包括:
(1)比較所述圖元均值與預設均值閾值,並根據比較結果對所述目標圖像進行圖像反轉處理,得到反轉圖像。
IC封裝過程中,IC封裝材質可以是塑膠,金屬或是陶瓷。對於不同的封裝材質拍攝出來IC封裝印字圖像是不同的,有黑底白字或是白底黑字兩種情況。為了方便後續的處理,將所述IC封裝印字圖像一律轉換為白底黑字。因此我們根據影像圖元的平均值,判斷拍攝的IC封裝印字圖像是黑底白字還是白底黑字。
具體實施時,預先設置均值閾值,判斷所述圖元均值是否大於所述均值閾值,當所述圖元均值大於所述均值閾值時,表明所述目標圖像中白色為主色調,即所述二值化圖像為白底黑字圖像,無需對所述目標圖像進行圖像反轉處理。當所述圖元均值小於所述均值閾值時,表明所述目標圖像中黑色為主色調,即所述目標圖像為黑底白字圖像,將所述目標圖像進行黑白色調反轉處理。
(2)匹配與所述標準差對應的去噪演算法。
即使使用相同的材質,但光源不同時,也會導致目標圖像中的噪點不同,透過標準差來判斷影像的噪點多寡,從而決定使用何種去噪方式。採用不同的去噪方式進行去噪,使得去噪更具針對性,去噪效果更佳。
具體實施時,預先設置標準差閾值,判斷所述標準差是否大於所述標準差閾值,當所述標準差大於所述標準差閾值時,說明所述反轉圖像噪點多,可以採用高斯模糊去噪演算法。當所述標準差小於所述標準差閾值時,說明所述反轉圖像噪點少,可以採用雙邊濾波器去噪演算法。
(3)根據所述圖像長度及寬度確定所述去噪演算法的核參數,並使用所述去噪演算法對所述反轉圖像進行去噪處理,得到增強圖像。
示例性的,獲取一張大小為1102圖元*1102圖元的IC封裝印字圖像,透過計算得到圖元均值為48.97,標準差為28.01。假設設置的均值閾值為128,標準差閾值為31,由於48.97小於所述均值閾值128,則表明所述IC封裝印字圖像為黑底白字圖像,將所述IC封裝印字圖像進行黑白色調反轉處理,所述IC封裝印字圖像轉化為白底黑字。由於28.01小於所述標準差閾值31,表明所述IC封裝印字圖像噪點少,所以採用雙邊濾波器去噪。由於所述IC封裝印字圖像的大小介於閾值1000到2000之間,所以去噪演算法參數的核選擇13*13。
透過利用所述目標圖像的圖像特徵增強所述目標圖像,可以更精準的對文字進行分割。
S13、檢測所述增強圖像中文字的閉合邊緣。
為了提取所述文字的輪廓,需要先提取所述文字的邊緣。由於所述增強圖像中的文字可能存在文字斷裂問題,例如,圖3所示的英文字母,因此需要將所述文字中的所有閉合邊緣提取出來。提取出的閉合邊緣參閱圖4所示。
可以使用邊緣檢測演算法檢測所述增強圖像中文字的閉合邊緣。但針對IC封裝印字圖像的特性,本實施例可以對所述增強圖像進行形態學處理,包括侵蝕和膨脹,得到形態學圖像。對所述形態學圖像進行邊緣檢測,得到邊緣圖像。提取所述邊緣圖像中的所述閉合邊緣。
透過對增強圖像進行形態學處理,能夠使得文字與背景更容易分離,基於形態學圖像進行邊緣檢測,能夠更容易檢測的提取出邊緣圖像中的閉合邊緣,閉合邊緣的提取效果更佳。
S14、基於所述閉合邊緣確定所述文字對應的第一矩形輪廓。
在本實施方式中,所述基於所述閉合邊緣確定所述文字對應的第一矩形輪廓包括:
(1)生成與所述目標圖像大小相同的空白圖像。具體實施時,可以根據所述目標圖像的長度和寬度生成所述空白圖像。
(2)根據所述閉合邊緣在所述空白圖像上生成矩形輪廓,得到輪廓圖像,所述矩形輪廓在所述輪廓圖像中的位置與所述閉合邊緣對應的輪廓圖像在所述目標圖像中的位置相同。具體實施時,根據每個所述閉合邊緣在所述目標圖像中查找與每個所述閉合邊緣對應的輪廓,並獲取所述輪廓的位置座標。根據所述位置座標在所述空白圖像上生成所述矩形輪廓。例如,圖5。
(3)檢測所述輪廓圖像中的所有輪廓。具體實施時,由於所述文字可能存在斷裂,例如,文字斷裂為兩部分,就會產生兩個閉合邊緣,因此產生兩個矩形輪廓,所述矩形輪廓可能會存在重疊的情況,需要將重疊的矩形輪廓進行合併。對所述輪廓圖像進行輪廓查找,可以將存在重疊的矩形輪廓合併為同一個矩形輪廓。例如,圖6。
(4)將每個輪廓確定為所述第一矩形輪廓。
將所有連續輪廓的邊框畫在一張空白的影像上,這時候,所有的不規則形邊框,就會合並成一個完整的矩形邊框。使用兩次輪廓查找與輪廓整合,得到文字的輪廓。並考慮到文字斷裂的情況,將斷裂的文字產生的所有重疊的矩形輪廓進行合併,可以提高文字分割的準確率。
S15、對所述第一矩形輪廓進行矯正,得到第二矩形輪廓。
所述步驟S14將所述目標圖像中斷裂文字中存在重疊的輪廓進行了合併,得到了所述第一矩形輪廓。然而還可能存在其他情況,例如,斷裂文字中的輪廓沒有發生重疊,相隔太近的文字被同一個第一矩形輪廓框選,以及被視為噪點或是不需要分割的小字元被所述第一矩形輪廓框選。
在本實施方式中,所述對所述第一矩形輪廓進行矯正,得到第二矩形輪廓包括:
(1)計算所述第一矩形輪廓的平均面積、平均橫向間距、平均縱向間距。具體實施時,以所述增強圖像正向放置時的左下角為原點O,橫向為X軸,縱向為Y軸,建立一個第三座標系(XOY)。確定每個所述第一矩形輪廓的四個頂點座標,根據所述頂點座標確定每個所述第一矩形輪廓的寬度和長度,根據所述寬度和所述長度計算得到所述平均面積。基於所述頂點座標確定水準相鄰的第一矩形輪廓,計算所述水準相鄰的第一矩形輪廓的平均橫向間距。基於所述頂點座標確定垂直相鄰的第一矩形輪廓,計算所述垂直相鄰的第一矩形輪廓的平均縱向間距。
(2)根據所述平均面積、所述平均橫向間距和所述平均縱向間距修正所述第一矩形輪廓,得到所述文字對應的第二矩形輪廓。具體實施時,確定水準相鄰的兩個所述第一矩形輪廓之間的相鄰橫向間距,及垂直相鄰的兩個所述第一矩形輪廓之間的相鄰縱向間距。將小於所述平均橫向間距的相鄰橫向間距對應的兩個第一矩形輪廓進行合併,將小於所述平均縱向間距的相鄰縱向間距對應的兩個第一矩形輪廓進行合併,得到候選矩形框。移除小於所述平均面積第一預設倍數的候選矩形框,例如,標點符號“,”。拆分大於所述平均面積第二預設倍數的候選矩形框,例如,圖7。得到所述第二矩形輪廓。其中所述第一預設倍數小於1,所述第二預設倍數大於1。
可選的,獲取所述候選矩形框包括:
S501:查找所述相鄰橫向間距小於所述平均橫向間距的第一矩形輪廓;
S502:根據所述第一矩形輪廓的頂點座標將所述第一矩形輪廓進行合併,得到第四矩形輪廓;
S503:查找所述相鄰縱向間距小於所述平均縱向間距的第四矩形輪廓;
S504:根據所述第四矩形輪廓的頂點座標將所述第四矩形輪廓進行合併,得到的第五矩形輪廓;
S505:確定水準相鄰的兩個所述第五矩形輪廓之間的相鄰橫向間距,及垂直相鄰的兩個所述第五矩形輪廓之間的相鄰縱向間距,執行所述步驟1;
S506:當所述相鄰橫向間距大於所述平均橫向間距且所述相鄰縱向間距大於所述平均縱向間距時,結束合併。
示例性的,如圖8所示,“X”斷裂為五部分,因此產生五個所述第一矩形輪廓。為了將所述五個所述第一矩形輪廓進行合併,獲取所述第一矩形輪廓的之間的相鄰水準間距,將所述相鄰橫向間距小於所述平均橫向間距的第一矩形輪廓進行合併,獲取所述第一矩形輪廓的之間的相鄰縱向間距,將所述相鄰縱向間距小於所述平均縱向間距的第一矩形輪廓進行合併,得到“X”的完整矩形輪廓。
透過對所述第一矩形輪廓進行矯正,可以提高所述目標圖像的文字分割正確率。
S16、根據所述第二矩形輪廓對所述目標圖像進行文字分割。
在本實施方式中,所述第二矩形輪廓框選一個完整的文字,因此可以根據所述第二矩形輪廓對所述目標圖像進行文字分割。
例如,圖9所示的最終的文字分割結果,其中左側圖像為利用神經網路模型得到的文字分割結果,右側圖像是利用本申請的文字分割方法得到的文字分割結果。
請繼續參閱圖1,本實施例中,所述記憶體11可以是電子設備1的內部記憶體,即內置於所述電子設備1的記憶體。在其他實施例中,所述記憶體11也可以是電子設備1的外部記憶體,即外接於所述電子設備1的記憶體。
在一些實施例中,所述記憶體11用於存儲程式碼和各種資料,並在電子設備1的運行過程中實現高速、自動地完成程式或資料的存取。
所述記憶體11可以包括隨機存取記憶體,還可以包括非易失性記憶體,例如硬碟、記憶體、插接式硬碟、智慧存儲卡(Smart Media Card,SMC)、安全數位(Secure Digital,SD)卡、快閃記憶體卡(Flash Card)、至少一個磁碟記憶體件、快閃記憶體器件、或其他易失性固態記憶體件。
在一實施例中,所述處理器12可以是中央處理單元(Central Processing Unit,CPU),還可以是其他通用處理器、數位訊號處理器 (Digital Signal Processor,DSP)、專用積體電路 (Application Specific Integrated Circuit,ASIC)、現場可程式設計閘陣列(Field-Programmable Gate Array,FPGA) 或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件等。通用處理器可以是微處理器或者所述處理器也可以是其它任何常規的處理器等。
所述記憶體11中的程式碼和各種資料如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本申請實現上述實施例方法中的全部或部分流程,例如實現延長電池服務壽命的方法中的步驟,也可以透過電腦程式來指令相關的硬體來完成,所述的電腦程式可存儲於一電腦可讀存儲介質中,所述電腦程式在被處理器執行時,可實現上述各個方法實施例的步驟。其中,所述電腦程式包括電腦程式代碼,所述電腦程式代碼可以為原始程式碼形式、物件代碼形式、可執行檔或某些中間形式等。所述電腦可讀介質可以包括:能夠攜帶所述電腦程式代碼的任何實體或裝置、記錄介質、隨身碟、移動硬碟、磁碟、光碟、電腦記憶體、唯讀記憶體(ROM,Read-Only Memory)等。
可以理解的是,以上所描述的模組劃分,為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。另外,在本申請各個實施例中的各功能模組可以集成在相同處理單元中,也可以是各個模組單獨物理存在,也可以兩個或兩個以上模組集成在相同單元中。上述集成的模組既可以採用硬體的形式實現,也可以採用硬體加軟體功能模組的形式實現。
最後應說明的是,以上實施例僅用以說明本申請的技術方案而非限制,儘管參照較佳實施例對本申請進行了詳細說明,本領域的普通技術人員應當理解,可以對本申請的技術方案進行修改或等同替換,而不脫離本申請技術方案的精神和範圍。
S11~S16:步驟 1:電子設備 11:記憶體 12:處理器 13:通訊匯流排
Figure 02_image001
圖1是本申請實現一種文字分割方法的較佳實施例的電子設備的結構示意圖。
圖2是本申請公開的一種文字分割方法的較佳實施例的流程圖。
圖3是本申請公開的一種示例性目標圖像。
圖4是本申請公開的一種示例性閉合邊緣圖。
圖5是本申請公開的一種示例性矩形輪廓圖。
圖6是本申請公開的一種示例性第一矩形輪廓圖。
圖7是本申請公開的一種示例性拆分第一矩形輪廓圖。
圖8是本申請公開的一種示例性第二矩形輪廓獲取圖。
圖9是本申請公開的一種示例性文字分割效果比較圖。
S11~S16:步驟

Claims (10)

  1. 一種文字分割方法,其中,所述文字分割方法包括: 獲取目標圖像的圖像特徵; 根據所述圖像特徵對所述目標圖像進行增強處理,得到增強圖像; 檢測所述增強圖像中文字的閉合邊緣; 基於所述閉合邊緣確定所述文字對應的第一矩形輪廓; 對所述第一矩形輪廓進行矯正,得到第二矩形輪廓; 根據所述第二矩形輪廓對所述目標圖像進行文字分割。
  2. 如請求項1所述的文字分割方法,其中,所述圖像特徵包括:圖元均值、標準差、圖像長度及寬度,所述根據目標圖像的圖像特徵對所述目標圖像進行增強處理,得到增強圖像包括: 比較所述圖元均值與預設均值閾值,並根據比較結果對所述目標圖像進行圖像反轉處理,得到反轉圖像; 匹配與所述標準差對應的去噪演算法; 根據所述圖像長度及寬度確定所述去噪演算法的核參數,並使用所述去噪演算法對所述反轉圖像進行去噪處理,得到增強圖像。
  3. 如請求項2所述的文字分割方法,其中,所述基於所述閉合邊緣確定所述文字的第一矩形輪廓包括: 生成與所述目標圖像大小相同的空白圖像; 根據所述閉合邊緣在所述空白圖像上生成矩形輪廓,得到輪廓圖像,所述矩形輪廓在所述輪廓圖像中的位置與所述閉合邊緣對應的輪廓在所述目標圖像中的位置相同; 檢測所述輪廓圖像中的所有輪廓; 將每個輪廓確定為所述第一矩形輪廓。
  4. 如請求項1至請求項3中任意一項所述的文字分割方法,其中,所述對所述第一矩形輪廓進行矯正,得到第二矩形輪廓包括: 計算所述第一矩形輪廓的平均面積、平均橫向間距、平均縱向間距; 根據所述平均面積、所述平均橫向間距和所述平均縱向間距修正所述第一矩形輪廓,得到所述文字對應的第二矩形輪廓。
  5. 如請求項4所述的文字分割方法,其中,所述計算所述第一矩形輪廓的平均面積、平均橫向間距、平均縱向間距包括: 確定每個所述第一矩形輪廓的四個頂點座標; 根據所述頂點座標確定每個所述第一矩形輪廓的寬度和長度; 根據所述寬度和所述長度確定所述平均面積; 基於所述頂點座標確定水準相鄰的第一矩形輪廓; 計算所述水準相鄰的第一矩形輪廓的平均橫向間距; 基於所述頂點座標確定垂直相鄰的第一矩形輪廓; 計算所述垂直相鄰的第一矩形輪廓的平均縱向間距。
  6. 如請求項5所述的文字分割方法,其中,所述根據所述平均面積、所述平均間距修正所述第一矩形輪廓,得到所述文字對應的第二矩形輪廓包括: 確定水準相鄰的兩個所述第一矩形輪廓之間的相鄰橫向間距,及垂直相鄰的兩個所述第一矩形輪廓之間的相鄰縱向間距; 根據所述相鄰橫向間距和所述相鄰縱向間距合併所述第一矩形輪廓,得到候選矩形框; 移除小於所述平均面積第一預設倍數的候選矩形框,並拆分大於所述平均面積第二預設倍數的候選矩形框,得到所述第二矩形輪廓。
  7. 如請求項6所述的文字分割方法,其中,所述根據所述相鄰橫向間距和所述相鄰縱向間距合併所述第一矩形輪廓,得到候選矩形框包括: 將小於所述平均橫向間距的相鄰橫向間距對應的兩個第一矩形輪廓進行合併; 將小於所述平均縱向間距的相鄰縱向間距對應的兩個第一矩形輪廓進行合併。
  8. 如請求項2所述的文字分割方法,其中,所述檢測所述增強圖像中文字的邊緣包括: 對所述增強圖像進行二值化處理,得到二值化圖像; 對所述二值化圖像進行形態學處理,得到形態學圖像; 對所述形態學圖像進行邊緣檢測,得到邊緣圖像; 提取所述邊緣圖像中的邊緣。
  9. 一種電子設備,其中,所述電子設備包括處理器和記憶體,所述處理器用於執行記憶體中儲存的電腦程式以實現如請求項1至請求項8中任意一項所述的文字分割方法。
  10. 一種電腦可讀儲存介質,其中,所述電腦可讀儲存介質儲存有至少一個指令,所述至少一個指令被處理器執行時實現如請求項1至請求項8中任意一項所述的文字分割方法。
TW110127062A 2021-07-22 2021-07-22 文字分割方法、電子設備及儲存介質 TWI795851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110127062A TWI795851B (zh) 2021-07-22 2021-07-22 文字分割方法、電子設備及儲存介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110127062A TWI795851B (zh) 2021-07-22 2021-07-22 文字分割方法、電子設備及儲存介質

Publications (2)

Publication Number Publication Date
TW202305741A true TW202305741A (zh) 2023-02-01
TWI795851B TWI795851B (zh) 2023-03-11

Family

ID=86661428

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110127062A TWI795851B (zh) 2021-07-22 2021-07-22 文字分割方法、電子設備及儲存介質

Country Status (1)

Country Link
TW (1) TWI795851B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609558A (zh) * 2017-09-13 2018-01-19 北京元心科技有限公司 文字图像处理方法及装置
US11534688B2 (en) * 2018-04-02 2022-12-27 Take-Two Interactive Software, Inc. Method and apparatus for enhanced graphics rendering in a video game environment
CN112949471A (zh) * 2021-02-27 2021-06-11 浪潮云信息技术股份公司 基于国产cpu的电子公文识别复现方法及系统

Also Published As

Publication number Publication date
TWI795851B (zh) 2023-03-11

Similar Documents

Publication Publication Date Title
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
CN108805128B (zh) 一种字符分割方法和装置
JP5492205B2 (ja) 印刷媒体ページの記事へのセグメント化
US9959475B2 (en) Table data recovering in case of image distortion
WO2023284502A1 (zh) 图像处理方法、装置、设备和存储介质
US10169673B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
US11017260B2 (en) Text region positioning method and device, and computer readable storage medium
CN111259878A (zh) 一种检测文本的方法和设备
US10169650B1 (en) Identification of emphasized text in electronic documents
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
US9235757B1 (en) Fast text detection
WO2021190155A1 (zh) 文本行中的空格识别方法、装置、电子设备及存储介质
CN114529459A (zh) 一种对图像边缘进行增强处理的方法和系统及介质
CN111563505A (zh) 一种基于像素分割合并的文字检测方法及装置
Hesham et al. Arabic document layout analysis
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
CN116597466A (zh) 一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统
JP2008011135A (ja) 画像処理装置および画像処理プログラム
TWI795851B (zh) 文字分割方法、電子設備及儲存介質
US11190684B2 (en) Image processing apparatus, image processing method, and storage medium
CN116030472A (zh) 文字坐标确定方法及装置
CN111488870A (zh) 文字识别方法和文字识别装置
CN112800824B (zh) 扫描文件的处理方法、装置、设备及存储介质
CN113936187A (zh) 文本图像合成方法、装置、存储介质及电子设备
CN114648751A (zh) 一种处理视频字幕的方法、装置、终端及存储介质