TWI814564B - 文字圖像拆分系統及其方法 - Google Patents
文字圖像拆分系統及其方法 Download PDFInfo
- Publication number
- TWI814564B TWI814564B TW111133046A TW111133046A TWI814564B TW I814564 B TWI814564 B TW I814564B TW 111133046 A TW111133046 A TW 111133046A TW 111133046 A TW111133046 A TW 111133046A TW I814564 B TWI814564 B TW I814564B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- text
- image
- initial
- split
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 65
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000000463 material Substances 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 16
- 238000012015 optical character recognition Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Apparatus For Radiation Diagnosis (AREA)
Abstract
一種文字圖像拆分系統,包含:資料庫,儲存一初始文字資料,該初始文字資料包含第一文字資料以及第二文字資料;以及伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中伺服器包含;文字拆分模組,自初始圖像資料中拆分出第一文字圖像資料以及第二文字圖像資料;文字辨識模組,自第一文字圖像資料辨識出第一辨識資料,並自第二文字圖像資料辨識出第二辨識資料;以及判斷模組,基於第一文字資料、第二文字資料、第一辨識資料以及第二辨識資料,以產生判斷資料;其中判斷資料指示出初始圖像資料是否符合初始文字資料。
Description
本發明係關於一種文字圖像拆分系統及其方法,特別係關於一種可自圖像資料中拆分出一至多個文字圖像資料的文字圖像拆分系統及其方法。
傳統的光學字元辨識(Optical Character Recognition,OCR)系統對於具固定、明確分隔界線的文字圖像可有效地進行文字圖像拆分與辨識,但對於分隔界線不明確的文字圖像則無法有效進行文字圖像拆分與辨識。因此,若圖像資料中具有多個文字圖像,且各個文字圖像間的分隔界線不明確時,則傳統的光學字元將難以準確的辨識出各個文字圖像。舉例而言,諸如手寫簽名等文字圖像中,其不同文字間的分隔界線往往並不明確,或甚至不同文字間可能略有重疊,因此往往難以將不同文字圖像拆分出來。從而,傳統的光學字元辨識便難以判斷該手寫簽名是否符合當事人的姓名。有鑑於此,將需要一種可自圖像資料中拆分出一至多個文字圖像資料的文字圖像拆分系統及其方法。
為了解決上述問題,本發明之一構想在於提供一種可自圖像資料中拆分出一至多個文字圖像資料的文字圖像拆分系統及其方法。
基於前揭構想,本發明提供一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含;一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;其中該文字拆分模組基於該第一前段辨識資料符合該第一文字資料,而決定以該第一前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;其中該文字拆分模組基於該第一前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第二前段拆分資料,該第二前段拆分資料的一第二圖像起始位置對應於該第一側邊處,該第二前段拆分資料的一第二圖像寬度等於該預設初始寬度與一預設推進寬度之和;其中該文字辨識模組自該第二前段拆分資料辨識出一第二前段辨識資料;其中該文字拆分模組基於該第二前段辨識資料符合該第一文字資料,而決定以該第二前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第三前段拆分資料,該第三前段拆分資料的一第三圖像起始位置對應於該初始圖像資料的一第一側邊處,該第三前段拆分資料的一第三圖像寬度等於一預設初始寬度與一第一當前推進寬度之和,該第一當前推進寬度為一預設推進寬度乘上一第一整數;其中該文字辨識模組自該第三前段拆分資料辨識出一第三前段辨識資料;其中該文字拆分模組基於該第三前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第四前段拆分資料,該第四前段拆分資料的一第四圖像起始位置對應於該第一側邊處,該第四前段拆分資料的一第四圖像寬度等於該預設初始寬度與一第二當前推進寬度之和,該第二當前推進寬度為該預設推進寬度乘上一第二整數,該第二整數為該第一整數加一;其中該文字辨識模組自該第四前段拆分資料辨識出一第四前段辨識資料;其中該文字拆分模組基於該第四前段辨識資料符合該第一文字資料,而決定以該第四前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第五圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;其中該文字拆分模組基於該第一接續段辨識資料符合該第二文字資料,而決定以該第一接續段拆分資料做為該第二文字圖像資料。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第五圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;其中該文字拆分模組基於該第一接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第二接續段拆分資料,該第二接續段拆分資料具有一第六圖像起始位置以及一第六圖像寬度,該第六圖像起始位置對應於該第一接續段起始位置;其中該第六圖像寬度等於該預設初始寬度與一預設推進寬度之和;其中該文字辨識模組自該第二接續段拆分資料辨識出一第二接續段辨識資料;其中該文字拆分模組基於該第二接續段辨識資料符合該第二文字資料,而決定以該第二接續段拆分資料做為該第二文字圖像資料。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該文字拆分模組自該初始圖像資料中拆分出一第三接續段拆分資料,該第三接續段拆分資料具有一第七圖像起始位置以及一第七圖像寬度,該第七圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第七圖像寬度等於一預設初始寬度與一第三當前推進寬度之和,該第三當前推進寬度為一預設推進寬度乘上一第三整數;該文字辨識模組自該第三接續段拆分資料辨識出一第三接續段辨識資料;其中該文字拆分模組基於該第三接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第四接續段拆分資料,該第四接續段拆分資料具有一第八圖像起始位置以及一第八圖像寬度,該第八圖像起始位置對應於該第一接續段起始位置;其中該第八圖像寬度等於該預設初始寬度與一第四當前推進寬度之和,該第四當前推進寬度為該預設推進寬度乘上一第四整數,該第四整數為該第三整數加一;其中該文字辨識模組自該第四接續段拆分資料辨識出一第四接續段辨識資料;其中該文字拆分模組基於該第四接續段辨識資料符合該第二文字資料,而決定以該第四接續段拆分資料做為該第二文字圖像資料。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像寬度,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;其中該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第九圖像寬度到達一預設寬度閾值,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像結束位置,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;其中該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第二圖像結束位置到達該初始圖像資料的一第二側邊處,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
於本發明之一較佳實施例中,該判斷模組基於該第一辨識資料符合該第一文字資料,且該第二辨識資料符合該第二文字資料,而使該判斷資料指示出該初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該文字辨識模組基於該第一文字圖像資料符合該第一辨識資料的機率產生一第一機率排名資料,並使該第一機率排名資料關聯於該第一辨識資料;其中該文字辨識模組基於該第二文字圖像資料符合該第二辨識資料的機率產生一第二機率排名資料,並使該第二機率排名資料關聯於該第二辨識資料;其中該判斷模組基於該第一機率排名資料小於或等於一排名預設值,而決定該第一辨識資料符合該第一文字資料;其中該判斷模組基於該第二機率排名資料小於或等於該排名預設值,而決定該第二辨識資料符合該第二文字資料。
於本發明之一較佳實施例中,該判斷模組基於該第一辨識資料不符合該第一文字資料,或基於該第二辨識資料不符合該第二文字資料,而使該判斷資料指示出該初始圖像資料不符合該初始文字資料。
根據本發明之目的,再提供一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;以及由該文字拆分模組基於該第一前段辨識資料符合該第一文字資料,而決定以該第一前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;由該文字拆分模組基於該第一前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第二前段拆分資料,該第二前段拆分資料的一第二圖像起始位置對應於該第一側邊處,該第二前段拆分資料的一第二圖像寬度等於該預設初始寬度與一預設推進寬度之和;由該文字辨識模組自該第二前段拆分資料辨識出一第二前段辨識資料;以及由該文字拆分模組基於該第二前段辨識資料符合該第一文字資料,而決定以該第二前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第三前段拆分資料,該第三前段拆分資料的一第三圖像起始位置對應於該初始圖像資料的一第一側邊處,該第三前段拆分資料的一第三圖像寬度等於一預設初始寬度與一第一當前推進寬度之和,該第一當前推進寬度為一預設推進寬度乘上一第一整數;由該文字辨識模組自該第三前段拆分資料辨識出一第三前段辨識資料;由該文字拆分模組基於該第三前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第四前段拆分資料,該第四前段拆分資料的一第四圖像起始位置對應於該第一側邊處,該第四前段拆分資料的一第四圖像寬度等於該預設初始寬度與一第二當前推進寬度之和,該第二當前推進寬度為該預設推進寬度乘上一第二整數,該第二整數為該第一整數加一;由該文字辨識模組自該第四前段拆分資料辨識出一第四前段辨識資料;以及由該文字拆分模組基於該第四前段辨識資料符合該第一文字資料,而決定以該第四前段拆分資料做為該第一文字圖像資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,其中該第五圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;以及由該文字拆分模組基於該第一接續段辨識資料符合該第二文字資料,而決定以該第一接續段拆分資料做為該第二文字圖像資料。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第五圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;由該文字拆分模組基於該第一接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第二接續段拆分資料,該第二接續段拆分資料具有一第六圖像起始位置以及一第六圖像寬度,該第六圖像起始位置對應於該第一接續段起始位置,該第六圖像寬度等於該預設初始寬度與一預設推進寬度之和;由該文字辨識模組自該第二接續段拆分資料辨識出一第二接續段辨識資料;以及由該文字拆分模組基於該第二接續段辨識資料符合該第二文字資料,而決定以該第二接續段拆分資料做為該第二文字圖像資料。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第三接續段拆分資料,該第三接續段拆分資料具有一第七圖像起始位置以及一第七圖像寬度,該第七圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;由該文字辨識模組自該第三接續段拆分資料辨識出一第三接續段辨識資料;由該文字拆分模組基於該第三接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第四接續段拆分資料,該第二接續段拆分資料具有一第八圖像起始位置以及一第八圖像寬度,該第八圖像起始位置對應於該第一接續段起始位置;由該文字辨識模組自該第四接續段拆分資料辨識出一第四接續段辨識資料;以及由該文字拆分模組基於該第四接續段辨識資料符合該第二文字資料,而決定以該第四接續段拆分資料做為該第二文字圖像資料;其中該第七圖像寬度等於一預設初始寬度與一第三當前推進寬度之和,該第三當前推進寬度為一預設推進寬度乘上一第三整數;其中該第八圖像寬度等於該預設初始寬度與一第四當前推進寬度之和,該第四當前推進寬度為該預設推進寬度乘上一第四整數,該第四整數為該第三整數加一。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像寬度,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;以及由該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第九圖像寬度到達一預設寬度閾值,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
於本發明之一較佳實施例中,該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像結束位置,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;以及由該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第二圖像結束位置到達該初始圖像資料的一第二側邊處,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該判斷模組基於該第一辨識資料符合該第一文字資料,且該第二辨識資料符合該第二文字資料,而使該判斷資料指示出該初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該文字辨識模組基於該第一文字圖像資料符合該第一辨識資料的機率產生一第一機率排名資料,並使該第一機率排名資料關聯於該第一辨識資料;由該文字辨識模組基於該第二文字圖像資料符合該第二辨識資料的機率產生一第二機率排名資料,並使該第二機率排名資料關聯於該第二辨識資料;由該判斷模組基於該第一機率排名資料小於或等於一排名預設值,而決定該第一辨識資料符合該第一文字資料;以及由該判斷模組基於該第二機率排名資料小於或等於該排名預設值,而決定該第二辨識資料符合該第二文字資料。
於本發明之一較佳實施例中,該文字圖像拆分方法進一步包含:由該判斷模組基於該第一辨識資料不符合該第一文字資料,或基於該第二辨識資料不符合該第二文字資料,而使該判斷資料指示出該初始圖像資料不符合該初始文字資料。
本發明前述各方面及其它方面依據下述的非限制性具體實施例詳細說明以及參照附隨的圖式將更趨於明瞭。
請參閱第一圖,其例示說明了根據本發明文字圖像拆分系統一具體實施例的系統架構圖。如第一圖所示實施例,文字圖像拆分系統100包含資料庫110以及伺服器120,伺服器120包含文字拆分模組122、文字辨識模組124以及判斷模組126。其中,資料庫110通訊連接伺服器120,且資料庫110可存取伺服器120。較佳地,文字拆分模組122、文字辨識模組124以及判斷模組126皆通訊連接資料庫110,且文字拆分模組122、文字辨識模組124以及判斷模組126皆可存取伺服器120。較佳地,文字拆分模組122通訊連接文字辨識模組124,文字拆分模組122通訊連接判斷模組126,文字辨識模組124通訊連接判斷模組126。較佳地,本發明之文字圖像拆分系統可包含一或多個處理器,並以硬體與軟體協同運作的方式實施資料庫以及第一伺服器。在一具體實施例中,資料庫可包含一或多個處理器,並以硬體與軟體協同運作的方式實施資料庫所具備的功能;且伺服器可包含一或多個處理器,並以硬體與軟體協同運作的方式實施伺服器所具備的功能(例如伺服器係以硬體與軟體協同運作的方式實施文字拆分模組、文字辨識模組以及判斷模組)。
如第一圖所示實施例,資料庫110可儲存初始文字資料,初始文字資料至少包含第一文字資料以及第二文字資料,第一文字資料以及第二文字資料分別指示出(或對應於)一特定文字。伺服器120可自裝置900接收初始圖像資料(伺服器120通訊連接裝置900),並可依需求而將初始圖像資料儲存於資料庫110中。其中,裝置900可為手機、電腦、處理裝置、圖像資料輸入裝置、電子手寫裝置等,但不以此為限。伺服器120的文字拆分模組122可自初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;伺服器120的文字辨識模組124可自第一文字圖像資料辨識出第一辨識資料,且文字辨識模組124可自第二文字圖像資料辨識出第二辨識資料;伺服器120的判斷模組126可基於第一文字資料、第二文字資料、第一辨識資料以及第二辨識資料,以產生判斷資料。其中,判斷資料指示出初始圖像資料是否符合初始文字資料。
在一具體實施例中,判斷模組可基於第一辨識資料符合第一文字資料,且第二辨識資料符合第二文字資料,而使判斷資料指示出初始圖像資料符合初始文字資料。在一具體實施例中,判斷模組可基於第一辨識資料不符合第一文字資料,或可基於第二辨識資料不符合第二文字資料,而使判斷資料指示出初始圖像資料不符合初始文字資料。
較佳地,文字辨識模組124可包含一至多個深度學習模組,該一至多個深度學習模組可根據一特定文字圖像資料而產生複數個機率資料,該些機率資料分別關聯於(或對應於)不同的特定文字,且該複數個機率資料其中每一者分別指示出該特定文字圖像資料符合於(或指示出)該機率資料所關聯之特定文字的機率。文字辨識模組124並可對該些機率資料進行排名(每一個機率資料分別對應於一機率排名資料)。然應了解,文字辨識模組並非僅可使用深度學習模組以辨識文字圖像資料。在不同具體實施例中,文字辨識模組亦可使用其它類型的辨識模組或辨識方式以辨識文字圖像資料(例如文字辨識模組可使用光學字元辨識以辨識文字圖像資料,但不以此為限)。
應了解,為了使文字圖像拆分系統亦可辨識出較為潦草的手寫字圖像,因此可視需求而降低其對於辨識準確度的要求。在一具體實施例中,文字辨識模組可基於第一文字圖像資料符合於第一辨識資料的機率,以產生第一機率排名資料,文字辨識模組並使第一機率排名資料關聯於第一辨識資料。文字辨識模組可基於第二文字圖像資料符合於第二辨識資料的機率,以產生第二機率排名資料,文字辨識模組並使第二機率排名資料關聯於第二辨識資料。接著,判斷模組可基於第一機率排名資料小於或等於一排名預設值,而決定第一辨識資料符合第一文字資料;且判斷模組可基於第二機率排名資料小於或等於該排名預設值,而決定第二辨識資料符合第二文字資料。藉由此種作法,將可避免文字圖像拆分系統因其對於辨識準確度的要求過高,而導致其無法辨識較為潦草的手寫字圖像。
接著請參閱第二A圖至第二K圖。其分別例示說明了根據本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。如第二A圖至第二K圖所示實施例,初始圖像資料210為一簽名圖像資料,而文字圖像拆分系統的資料庫儲存一初始文字資料,該初始文字資料包含三個文字資料,其分別指示出文字「張」、文字「林」以及文字「淑」。
請參考第二A圖(此處先以指示出文字「張」的文字資料做為第一文字資料,並以指示出文字「林」的文字資料做為第二文字資料),文字圖像拆分系統的文字拆分模組可自初始圖像資料210中拆分出第一前段拆分資料220A,第一前段拆分資料220A的第一圖像起始位置222A對應於初始圖像資料210的第一側邊212處,第一前段拆分資料220A的第一圖像寬度224A等於預設初始寬度811(預設初始寬度的數值可視需求而預先決定或預先設定)。詳細而言,文字拆分模組可將初始圖像資料210的第一側邊212做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為預設初始寬度811的圖樣,並以此圖樣做為第一前段拆分資料220A。接著,文字辨識模組可自第一前段拆分資料220A辨識出第一前段辨識資料,而若第一前段辨識資料符合第一文字資料(亦即第一前段辨識資料亦指示出文字「張」),則文字拆分模組可基於第一前段辨識資料符合第一文字資料,而決定以第一前段拆分資料220A做為第一文字圖像資料。
請參考第二B圖,若第一前段辨識資料不符合第一文字資料(亦即第一前段辨識資料並非指示出文字「張」),則文字拆分模組可基於第一前段辨識資料不符合第一文字資料,而自初始圖像資料210中拆分出第二前段拆分資料220B。其中,第二前段拆分資料220B的第二圖像起始位置222B對應於第一側邊212處,第二前段拆分資料220B的第二圖像寬度224B等於預設初始寬度811與預設推進寬度812之和。詳細而言,文字拆分模組可將初始圖像資料210的第一側邊212做為擷取起始點,並將擷取寬度設為預設初始寬度811與預設推進寬度812之和,藉以自初始圖像資料210中擷取出一圖樣,以做為第二前段拆分資料220B。接著,文字辨識模組可自第二前段拆分資料220B辨識出第二前段辨識資料,而若第二前段辨識資料符合第一文字資料(亦即第二前段辨識資料亦指示出文字「張」),則文字拆分模組可基於第二前段辨識資料符合第一文字資料,而決定以第二前段拆分資料220B做為第一文字圖像資料。
應了解,若當前的前段辨識資料不符合該前段辨識資料應當對應的文字資料,則文字拆分模組將逐次增加擷取寬度(擷取寬度每次均增加一個預設推進寬度。其中,預設推進寬度的數值可視需求而預先決定或預先設定),以自初始圖像資料210中擷取圖樣,並重複上述流程。例如請參考第二C圖以及第二D圖,文字圖像拆分系統的文字拆分模組可自初始圖像資料210中拆分出第三前段拆分資料220C,第三前段拆分資料220C的第三圖像起始位置222C對應於初始圖像資料210的第一側邊212處,第三前段拆分資料220C的第三圖像寬度224C等於預設初始寬度811與第一當前推進寬度813之和。其中,第一當前推進寬度813為預設推進寬度812乘上第一整數(亦即第一當前推進寬度813為預設推進寬度812的第一整數倍)。詳細而言,文字拆分模組可將初始圖像資料210的第一側邊212做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為第三圖像寬度224C(如前所述,第三圖像寬度224C等於預設初始寬度811與第一當前推進寬度813之和)的圖樣,並以此圖樣做為第三前段拆分資料220C。
接著,文字辨識模組可自第三前段拆分資料220C辨識出第三前段辨識資料。若第三前段辨識資料不符合第一文字資料(亦即第三前段辨識資料並非指示出文字「張」),則文字拆分模組可基於第三前段辨識資料不符合第一文字資料,而自初始圖像資料210中拆分出第四前段拆分資料220D(參見第二D圖)。其中,第四前段拆分資料220D的第四圖像起始位置222D對應於第一側邊212處,第四前段拆分資料220D的第四圖像寬度224D等於預設初始寬度811與第二當前推進寬度814之和。其中,第二當前推進寬度814為預設推進寬度812乘上第二整數(亦即第二當前推進寬度814為預設推進寬度812的第二整數倍),該第二整數為第一整數加一。或者說,第四圖像寬度224D等於預設初始寬度811、第一當前推進寬度813與預設推進寬度812之和。詳細而言,文字拆分模組可將初始圖像資料210的第一側邊212做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為第四圖像寬度224D(如前所述,第四圖像寬度224D等於預設初始寬度811與第二當前推進寬度814之和)的圖樣,並以此圖樣做為第四前段拆分資料220D。
接著,文字辨識模組可自第四前段拆分資料220D辨識出第四前段辨識資料,而若第四前段辨識資料符合第一文字資料(亦即第四前段辨識資料亦指示出文字「張」),則文字拆分模組可基於第四前段辨識資料符合第一文字資料,而決定以第四前段拆分資料220D做為第一文字圖像資料。
在文字圖像拆分系統自初始圖像資料中,拆分出第一文字圖像資料後,文字圖像拆分系統可接著自初始圖像資料中,拆分出第二文字圖像資料後。較佳地,第二文字圖像資料接續於第一文字圖像資料之後。較佳地,第一文字圖像資料對應於初始文字資料中的一特定文字資料,第二文字圖像資料對應於接續在該特定文字資料之後的另一文字資料。舉例而言,第一文字圖像資料可對應於初始文字資料中的第一文字資料,而第二文字圖像資料可對應於初始文字資料中的第二文字資料。其中,第二文字資料接續於第一文字資料之後。應了解,第一文字資料未必為初始文字資料中的第一個字,而係可視需求為初始文字資料中的第二個字或第三個字等,但不以此為限。
請參考第二E圖,文字圖像拆分系統的文字拆分模組可自初始圖像資料210中拆分出第一接續段拆分資料230E,第一接續段拆分資料230E具有第五圖像起始位置232E以及第五圖像寬度234E,第五圖像起始位置232E對應於初始圖像資料210的第一接續段起始位置214(接續段起始位置於後有進一步的說明),第五圖像寬度234E等於預設初始寬度811。詳細而言,文字拆分模組可將初始圖像資料210的第一接續段起始位置214做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為預設初始寬度811的圖樣,並以此圖樣做為第一接續段拆分資料230E。接著,文字辨識模組可自第一接續段拆分資料辨識出第一接續段辨識資料,而若第一接續段辨識資料符合第二文字資料(亦即第一接續段辨識資料亦指示出文字「林」),則文字拆分模組可基於第一接續段辨識資料符合第二文字資料,而決定以第一接續段拆分資料230E做為第二文字圖像資料。
請參考第二F圖,若第一接續段辨識資料不符合第二文字資料(亦即第一接續段辨識資料並非指示出文字「林」),則文字拆分模組可基於第一接續段辨識資料不符合第二文字資料,而自初始圖像資料210中拆分出第二接續段拆分資料230F。其中,第二接續段拆分資料230F具有第六圖像起始位置232F以及第六圖像寬度234F,第六圖像起始位置232F對應於初始圖像資料210的第一接續段起始位置214,第六圖像寬度234F等於預設初始寬度811與預設推進寬度812之和。詳細而言,文字拆分模組可將初始圖像資料210的第一接續段起始位置214做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為第六圖像寬度234F(如前所述,第六圖像寬度234F等於預設初始寬度811與預設推進寬度812之和)的圖樣,並以此圖樣做為第二接續段拆分資料230F。接著,文字辨識模組可自第二接續段拆分資料230F辨識出第二接續段辨識資料,而若第二接續段辨識資料符合第二文字資料(亦即第二接續段辨識資料亦指示出文字「林」),則文字拆分模組可基於第二接續段辨識資料符合第二文字資料,而決定以第二接續段拆分資料230F做為第二文字圖像資料。
應了解,若當前的接續段辨識資料不符合該接續段辨識資料應當對應的文字資料,則文字拆分模組將逐次增加擷取寬度(擷取寬度每次增加一個預設推進寬度。其中,預設推進寬度的數值可視需求而預先決定或預先設定),以自初始圖像資料210中擷取圖樣,並重複上述流程。例如請參考第二G圖以及第二H圖,文字圖像拆分系統的文字拆分模組可自初始圖像資料210中拆分出第三接續段拆分資料230G。其中,第三接續段拆分資料230G具有第七圖像起始位置232G以及第七圖像寬度234G,第七圖像起始位置232G對應於初始圖像資料的第一接續段起始位置214,第七圖像寬度234G等於預設初始寬度811與第三當前推進寬度823之和,第三當前推進寬度823為預設推進寬度乘上一第三整數。(亦即第三當前推進寬度823為預設推進寬度的第三整數倍)。詳細而言,文字拆分模組可將初始圖像資料210的第一接續段起始位置214做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為第七圖像寬度234G(如前所述,第七圖像寬度234G等於預設初始寬度811與第三當前推進寬度823之和)的圖樣,並以此圖樣做為第三接續段拆分資料230G。
接著,文字辨識模組可自第三接續段拆分資料230G辨識出第三接續段辨識資料。若第三接續段辨識資料不符合第二文字資料(亦即第一接續段辨識資料並非指示出文字「林」),則文字拆分模組可基於第三接續段辨識資料不符合第二文字資料,而自初始圖像資料210中拆分出第四接續段拆分資料230H(參見第二H圖),第四接續段拆分資料230H具有第八圖像起始位置232H以及第八圖像寬度234H。其中,第四接續段拆分資料230H的第八圖像起始位置232H對應於初始圖像資料210的第一接續段起始位置214處,第四接續段拆分資料230H的第八圖像寬度234H等於預設初始寬度811與第四當前推進寬度824之和,第四當前推進寬度824為預設推進寬度812乘上一第四整數(亦即第四當前推進寬度824為預設推進寬度812的第四整數倍),第四整數為第三整數加一。或者說,第八圖像寬度234H等於預設初始寬度811、第三當前推進寬度823與預設推進寬度812之和。詳細而言,文字拆分模組可將初始圖像資料210的第一接續段起始位置214做為擷取起始點,藉以自初始圖像資料210中擷取一寬度為第八圖像寬度234H(如前所述,第八圖像寬度234H等於預設初始寬度811與第四當前推進寬度824之和)的圖樣,並以此圖樣做為第四接續段拆分資料230H。接著,文字辨識模組可自第四接續段拆分資料230H辨識出第四接續段辨識資料,而若第四接續段辨識資料符合第二文字資料(亦即第四接續段辨識資料亦指示出文字「林」),則文字拆分模組可基於第四接續段辨識資料符合第二文字資料,而決定以第四接續段拆分資料230H做為第二文字圖像資料。
接著請參閱第二I圖,在第二I圖所示實施例中,第一文字圖像資料220I具有第一圖像結束位置228I,第一圖像結束位置228I對應於初始圖像資料210的拆分位置218I。在一具體實施例中,可直接將拆分位置218I做為初始圖像資料210的第一接續段起始位置。而在另一具體實施例中,係以拆分位置218I減去圖像退縮距離217I所得到的位置219I做為第一接續段起始位置(亦即第一接續段起始位置的計算方式為自初始圖像資料210的拆分位置218I處減去圖像退縮距離217I)。藉由此種做法,即便在初始圖像資料中,某兩個互相接續的文字圖像有部分重疊(例如在第二I圖中,文字圖像「林」以及文字圖像「淑」即有部分重疊)的情形發生,文字圖像拆分系統仍可有效的辨識出此兩個文字圖像(尤其是針對接續在後的文字圖像)。應了解,圖像退縮距離可視需求而預先決定或預先設定。
應了解,在拆分出前段拆分資料或拆分出接續段拆分資料的過程中,若當前的辨識資料不符合該辨識資料應當對應的文字資料,則文字拆分模組將逐次增加擷取寬度(擷取寬度每次增加一個預設推進寬度)。然而,擷取寬度並非無止境的不斷增加。若當前的拆分資料的圖像寬度符合一預定條件時,則調整拆分資料所對應的擷取起始位置及/或擷取圖像寬度。
請參閱第二J圖,在第二J圖所示實施例中,第一文字圖像資料220J具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置218J。文字拆分模組可自初始圖像資料210中拆分出第五接續段拆分資料,第五接續段拆分資料具有第九圖像起始位置以及第九圖像寬度,第九圖像起始位置對應於初始圖像資料210的第一接續段起始位置242J,第一接續段起始位置242J的計算方式為自初始圖像資料210的拆分位置218J處減去圖像退縮距離217J並加上第一當前推進距離246J,第一當前推進距離246J為預設推進距離248J乘上一第五整數。
接著,文字拆分模組可基於第五接續段辨識資料不符合第二文字資料,且第九圖像寬度到達一預設寬度閾值(預設寬度閾值的數值可預先決定或預先設定),而自初始圖像資料210中拆分出第六接續段拆分資料。第六接續段拆分資料具有第十圖像起始位置以及第十圖像寬度,第十圖像起始位置對應於第二接續段起始位置244J。其中,第二接續段起始位置244J的計算方式為自初始圖像資料210的拆分位置218J處減去圖像退縮距離217J並加上第二當前推進距離249J,第二當前推進距離249J為預設推進距離乘上一第六整數,第六整數為第五整數加一。或者說,第二接續段起始位置244J的計算方式為自初始圖像資料210的拆分位置218J處減去圖像退縮距離217J並加上第一當前推進距離246J以及加上預設推進距離248J。較佳地,第十圖像寬度等於預設初始寬度。較佳地,每當拆分資料的圖像寬度符合預定條件(在第二J圖中,預定條件為接續段辨識資料不符合第二文字資料,且圖像寬度到達一預設寬度閾值)時,則下一次的擷取圖像寬度增加一個預設推進距離248J。
請參閱第二K圖,在第二K圖所示實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料210的拆分位置218K。文字拆分模組可自初始圖像資料210中拆分出第五接續段拆分資料,第五接續段拆分資料具有第九圖像起始位置以及第九圖像結束位置,第九圖像起始位置對應於初始圖像資料的第一接續段起始位置242K,第一接續段起始位置242K的計算方式為自初始圖像資料210的拆分位置218K處減去圖像退縮距離217K並加上第一當前推進距離246K,第一當前推進距離246K為預設推進距離248K乘上一第五整數。
接著,文字拆分模組可基於第五接續段辨識資料不符合第二文字資料,且第二圖像結束位置到達初始圖像資料的第二側邊處215K,而自初始圖像資料210中拆分出第六接續段拆分資料,第六接續段拆分資料具有第十圖像起始位置以及第十圖像寬度,第十圖像起始位置對應於第二接續段起始位置244K。第二接續段起始位置244K的計算方式為自初始圖像資料210的拆分位置218K處減去圖像退縮距離217K並加上第二當前推進距離249K,第二當前推進距離249K為預設推進距離248K乘上第六整數,第六整數為第五整數加一。或者說,第二接續段起始位置244K的計算方式為自初始圖像資料210的拆分位置218K處減去圖像退縮距離217K並加上第一當前推進距離246K以及加上預設推進距離248K。較佳地,第十圖像寬度等於預設初始寬度。較佳地,每當拆分資料的圖像寬度符合預定條件(在第二K圖中,預定條件為接續段辨識資料不符合第二文字資料,且圖像結束位置到達初始圖像資料210的第二側邊處215K)時,則下一次的擷取圖像寬度增加一個預設推進距離248K。
請參閱第三圖,其例示說明了根據本發明文字圖像拆分方法一具體實施例的流程圖。如第三圖所示實施例,文字圖像拆分方法300係應用於一文字圖像拆分系統,該文字圖像拆分系統包含資料庫以及伺服器,該伺服器存取該資料庫。其中,資料庫儲存初始文字資料,該初始文字資料包含第一文字資料以及第二文字資料。文字圖像拆分方法300開始於步驟310,由伺服器接收初始圖像資料。接著,執行步驟320,由伺服器的文字拆分模組自初始圖像資料中拆分出第一文字圖像資料以及第二文字圖像資料。接著,執行步驟330,由伺服器的文字辨識模組自第一文字圖像資料辨識出第一辨識資料,並自第二文字圖像資料辨識出第二辨識資料。接著,執行步驟340,由伺服器的判斷模組,基於第一文字資料、第二文字資料、第一辨識資料以及第二辨識資料,以產生判斷資料。其中,判斷資料指示出初始圖像資料是否符合初始文字資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第一前段拆分資料。第一前段拆分資料的第一圖像起始位置對應於初始圖像資料的第一側邊處,第一前段拆分資料的第一圖像寬度等於預設初始寬度。由文字辨識模組自第一前段拆分資料辨識出第一前段辨識資料。由文字拆分模組基於第一前段辨識資料符合第一文字資料,而決定以第一前段拆分資料做為第一文字圖像資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第一前段拆分資料,第一前段拆分資料的第一圖像起始位置對應於初始圖像資料的第一側邊處,第一前段拆分資料的第一圖像寬度等於預設初始寬度。由文字辨識模組自第一前段拆分資料辨識出第一前段辨識資料。由文字拆分模組基於第一前段辨識資料不符合第一文字資料,而自初始圖像資料中拆分出第二前段拆分資料。第二前段拆分資料的第二圖像起始位置對應於第一側邊處,第二前段拆分資料的第二圖像寬度等於預設初始寬度與預設推進寬度之和。由文字辨識模組自第二前段拆分資料辨識出第二前段辨識資料。由文字拆分模組基於第二前段辨識資料符合第一文字資料,而決定以第二前段拆分資料做為第一文字圖像資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第三前段拆分資料,第三前段拆分資料的第三圖像起始位置對應於初始圖像資料的第一側邊處,第三前段拆分資料的第三圖像寬度等於預設初始寬度與第一當前推進寬度之和,第一當前推進寬度為預設推進寬度乘上第一整數。由文字辨識模組自第三前段拆分資料辨識出第三前段辨識資料。由文字拆分模組基於第三前段辨識資料不符合第一文字資料,而自初始圖像資料中拆分出第四前段拆分資料。第四前段拆分資料的第四圖像起始位置對應於第一側邊處,第四前段拆分資料的第四圖像寬度等於預設初始寬度與第二當前推進寬度之和,第二當前推進寬度為預設推進寬度乘上第二整數,第二整數為第一整數加一。由文字辨識模組自第四前段拆分資料辨識出第四前段辨識資料。由文字拆分模組基於第四前段辨識資料符合第一文字資料,而決定以第四前段拆分資料做為第一文字圖像資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第一接續段拆分資料,第一接續段拆分資料具有第五圖像起始位置以及第五圖像寬度,第五圖像起始位置對應於初始圖像資料的第一接續段起始位置,其中,第五圖像寬度等於預設初始寬度。由文字辨識模組自第一接續段拆分資料辨識出第一接續段辨識資料。由文字拆分模組基於第一接續段辨識資料符合第二文字資料,而決定以第一接續段拆分資料做為第二文字圖像資料。在一具體實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置。其中,第一接續段起始位置的計算方式為自初始圖像資料的拆分位置處減去圖像退縮距離。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第一接續段拆分資料,第一接續段拆分資料具有第五圖像起始位置以及第五圖像寬度,第五圖像起始位置對應於初始圖像資料的第一接續段起始位置,第五圖像寬度等於預設初始寬度。由文字辨識模組自第一接續段拆分資料辨識出第一接續段辨識資料。由文字拆分模組基於第一接續段辨識資料不符合第二文字資料,而自初始圖像資料中拆分出第二接續段拆分資料,第二接續段拆分資料具有第六圖像起始位置以及第六圖像寬度,第六圖像起始位置對應於第一接續段起始位置,第六圖像寬度等於預設初始寬度與預設推進寬度之和。由文字辨識模組自第二接續段拆分資料辨識出第二接續段辨識資料。由文字拆分模組基於第二接續段辨識資料符合第二文字資料,而決定以第二接續段拆分資料做為第二文字圖像資料。在一具體實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置。其中,第一接續段起始位置的計算方式為自初始圖像資料的拆分位置處減去圖像退縮距離。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第三接續段拆分資料,第三接續段拆分資料具有第七圖像起始位置以及第七圖像寬度,第七圖像起始位置對應於初始圖像資料的第一接續段起始位置。由文字辨識模組自第三接續段拆分資料辨識出第三接續段辨識資料。由文字拆分模組基於第三接續段辨識資料不符合第二文字資料,而自初始圖像資料中拆分出第四接續段拆分資料,第二接續段拆分資料具有第八圖像起始位置以及第八圖像寬度,第八圖像起始位置對應於第一接續段起始位置。由文字辨識模組自第四接續段拆分資料辨識出第四接續段辨識資料。由文字拆分模組基於第四接續段辨識資料符合第二文字資料,而決定以第四接續段拆分資料做為第二文字圖像資料。其中第七圖像寬度等於預設初始寬度與第三當前推進寬度之和,第三當前推進寬度為預設推進寬度乘上第三整數。其中第八圖像寬度等於預設初始寬度與第四當前推進寬度之和,第四當前推進寬度為預設推進寬度乘上第四整數,第四整數為第三整數加一。在一具體實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置。其中,第一接續段起始位置的計算方式為自初始圖像資料的拆分位置處減去圖像退縮距離。
在一具體實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置。文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自初始圖像資料中拆分出第五接續段拆分資料,第五接續段拆分資料具有第九圖像起始位置以及第九圖像寬度,第九圖像起始位置對應於初始圖像資料的第一接續段起始位置,第一接續段起始位置的計算方式為自初始圖像資料的拆分位置處減去圖像退縮距離並加上第一當前推進距離,第一當前推進距離為預設推進距離乘上一第五整數。由文字拆分模組基於第五接續段辨識資料不符合第二文字資料,且第九圖像寬度到達預設寬度閾值,而自初始圖像資料中拆分出第六接續段拆分資料,第六接續段拆分資料具有第十圖像起始位置以及第十圖像寬度,第十圖像起始位置對應於第二接續段起始位置。其中,第二接續段起始位置的計算方式為自初始圖像資料的拆分位置處減去圖像退縮距離並加上第二當前推進距離,第二當前推進距離為預設推進距離乘上一第六整數,第六整數為第五整數加一。其中,第十圖像寬度等於一預設初始寬度。
在一具體實施例中,第一文字圖像資料具有第一圖像結束位置,第一圖像結束位置對應於初始圖像資料的拆分位置。文字圖像拆分方法300可進一步包含以下步驟:由文字拆分模組自該初始圖像資料中拆分出第五接續段拆分資料,第五接續段拆分資料具有第九圖像起始位置以及第九圖像結束位置,第九圖像起始位置對應於初始圖像資料的第一接續段起始位置,第一接續段起始位置的計算方式為自初始圖像資料的該拆分位置處減去圖像退縮距離並加上第一當前推進距離,第一當前推進距離為預設推進距離乘上一第五整數。由文字拆分模組基於第五接續段辨識資料不符合第二文字資料,且第二圖像結束位置到達初始圖像資料的第二側邊處,而自初始圖像資料中拆分出第六接續段拆分資料,第六接續段拆分資料具有第十圖像起始位置以及第十圖像寬度,第十圖像起始位置對應於第二接續段起始位置。其中,第二接續段起始位置的計算方式為自該初始圖像資料的拆分位置處減去圖像退縮距離並加上第二當前推進距離,第二當前推進距離為預設推進距離乘上第六整數,第六整數為第五整數加一。其中,第十圖像寬度等於一預設初始寬度。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由判斷模組基於第一辨識資料符合第一文字資料,且第二辨識資料符合第二文字資料,而使判斷資料指示出初始圖像資料符合初始文字資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由文字辨識模組基於第一文字圖像資料符合第一辨識資料的機率產生第一機率排名資料,並使第一機率排名資料關聯於第一辨識資料。由文字辨識模組基於第二文字圖像資料符合第二辨識資料的機率產生第二機率排名資料,並使第二機率排名資料關聯於第二辨識資料。由判斷模組基於第一機率排名資料小於或等於排名預設值,而決定第一辨識資料符合第一文字資料。由判斷模組基於第二機率排名資料小於或等於排名預設值,而決定第二辨識資料符合第二文字資料。
在一具體實施例中,文字圖像拆分方法300可進一步包含以下步驟:由判斷模組基於第一辨識資料不符合第一文字資料,或基於第二辨識資料不符合第二文字資料,而使判斷資料指示出初始圖像資料不符合初始文字資料。
至此,本發明之文字圖像拆分系統及其方法已經由上述說明及圖式加以說明。然應了解,本發明的各個具體實施例僅是做為說明之用,在不脫離本發明申請專利範圍與精神下可進行各種改變,且均應包含於本發明之專利範圍中。因此,本說明書所描述的各具體實施例並非用以限制本發明,本發明之真實範圍與精神揭示於以下申請專利範圍。
100:文字圖像拆分系統
110:資料庫
120:伺服器
122:文字拆分模組
124:文字辨識模組
126:判斷模組
210:初始圖像資料
212:第一側邊
214:第一接續段起始位置
215K:第二側邊處
217I:圖像退縮距離
217J:圖像退縮距離
217K:圖像退縮距離
218I:拆分位置
218J:拆分位置
218K:拆分位置
219I:位置
220A:第一前段拆分資料
220B:第二前段拆分資料
220C:第三前段拆分資料
220D:第四前段拆分資料
220I:第一文字圖像資料
222A:第一圖像起始位置
222B:第二圖像起始位置
222C:第三圖像起始位置
222D:第四圖像起始位置
224A:第一圖像寬度
224B:第二圖像寬度
224C:第三圖像寬度
224D:第四圖像寬度
228I:第一圖像結束位置
230E:第一接續段拆分資料
230F:第二接續段拆分資料
230G:第三接續段拆分資料
230H:第四接續段拆分資料
232E:第五圖像起始位置
232F:第六圖像起始位置
232G:第七圖像起始位置
232H:第八圖像起始位置
234E:第五圖像寬度
234F:第六圖像寬度
234G:第七圖像寬度
234H:第八圖像寬度
242J:第一接續段起始位置
242K:第一接續段起始位置
244J:第二接續段起始位置
244K:第二接續段起始位置
246J:第一當前推進距離
246K:第一當前推進距離
248J:預設推進距離
248K:預設推進距離
249J:第二當前推進距離
249K:第二當前推進距離
300:文字圖像拆分方法
310~340:步驟
811:預設初始寬度
812:預設推進寬度
813:第一當前推進寬度
814:第二當前推進寬度
823:第三當前推進寬度
824:第四當前推進寬度
900:裝置
第一圖為本發明文字圖像拆分系統一具體實施例的系統架構圖。
第二A圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二B圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二C圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二D圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二E圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二F圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二G圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二H圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二I圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二J圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第二K圖為本發明文字圖像拆分系統自初始圖像資料中拆分文字圖像資料的一具體實施例的示意圖。
第三圖為本發明文字圖像拆分方法一具體實施例的流程圖。
無
100:文字圖像拆分系統
110:資料庫
120:伺服器
122:文字拆分模組
124:文字辨識模組
126:判斷模組
900:裝置
Claims (28)
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含:一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;其中該文字拆分模組基於該第一前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第二前段拆分資料,該第二前段拆分資料的一第二圖像起始位置對應於該第 一側邊處,該第二前段拆分資料的一第二圖像寬度等於該預設初始寬度與一預設推進寬度之和;其中該文字辨識模組自該第二前段拆分資料辨識出一第二前段辨識資料;其中該文字拆分模組基於該第二前段辨識資料符合該第一文字資料,而決定以該第二前段拆分資料做為該第一文字圖像資料。
- 如請求項1之文字圖像拆分系統,其中該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;其中該文字拆分模組基於該第一前段辨識資料符合該第一文字資料,而決定以該第一前段拆分資料做為該第一文字圖像資料。
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含:一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料; 一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字拆分模組自該初始圖像資料中拆分出一第三前段拆分資料,該第三前段拆分資料的一第三圖像起始位置對應於該初始圖像資料的一第一側邊處,該第三前段拆分資料的一第三圖像寬度等於一預設初始寬度與一第一當前推進寬度之和,該第一當前推進寬度為一預設推進寬度乘上一第一整數;其中該文字辨識模組自該第三前段拆分資料辨識出一第三前段辨識資料;其中該文字拆分模組基於該第三前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第四前段拆分資料,該第四前段拆分資料的一第四圖像起始位置對應於該第一側邊處,該第四前段拆分資料的一第四圖像寬度等於該預設初始寬度與一第二當前推進寬度之和,該第二當前推進寬度為該預設推進寬度乘上一第二整數,該第二整數為該第一整數加一;其中該文字辨識模組自該第四前段拆分資料辨識出一第四前段辨識資料; 其中該文字拆分模組基於該第四前段辨識資料符合該第一文字資料,而決定以該第四前段拆分資料做為該第一文字圖像資料。
- 如請求項1之文字圖像拆分系統,其中該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第五圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;其中該文字拆分模組基於該第一接續段辨識資料符合該第二文字資料,而決定以該第一接續段拆分資料做為該第二文字圖像資料。
- 如請求項4之文字圖像拆分系統,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含: 一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第五圖像寬度等於一預設初始寬度;其中該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;其中該文字拆分模組基於該第一接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第二接續段拆分資料,該第二接續段拆分資料具有一第六圖像起始位置以及一第六圖像寬度,該第六圖像起始位置對應於該第一接續段起始位置;其中該第六圖像寬度等於該預設初始寬度與一預設推進寬度之和; 其中該文字辨識模組自該第二接續段拆分資料辨識出一第二接續段辨識資料;其中該文字拆分模組基於該第二接續段辨識資料符合該第二文字資料,而決定以該第二接續段拆分資料做為該第二文字圖像資料。
- 如請求項6之文字圖像拆分系統,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含:一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料; 其中該文字拆分模組自該初始圖像資料中拆分出一第三接續段拆分資料,該第三接續段拆分資料具有一第七圖像起始位置以及一第七圖像寬度,該第七圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;其中該第七圖像寬度等於一預設初始寬度與一第三當前推進寬度之和,該第三當前推進寬度為一預設推進寬度乘上一第三整數;其中該文字辨識模組自該第三接續段拆分資料辨識出一第三接續段辨識資料;其中該文字拆分模組基於該第三接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第四接續段拆分資料,該第四接續段拆分資料具有一第八圖像起始位置以及一第八圖像寬度,該第八圖像起始位置對應於該第一接續段起始位置;其中該第八圖像寬度等於該預設初始寬度與一第四當前推進寬度之和,該第四當前推進寬度為該預設推進寬度乘上一第四整數,該第四整數為該第三整數加一;其中該文字辨識模組自該第四接續段拆分資料辨識出一第四接續段辨識資料;其中該文字拆分模組基於該第四接續段辨識資料符合該第二文字資料,而決定以該第四接續段拆分資料做為該第二文字圖像資料。
- 如請求項8之文字圖像拆分系統,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含:一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像寬度,該第九圖像起始位置對應於該初始 圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;其中該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第九圖像寬度到達一預設寬度閾值,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
- 一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料;其中該伺服器包含:一文字拆分模組,自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;一文字辨識模組,自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及 一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像結束位置,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;其中該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第二圖像結束位置到達該初始圖像資料的一第二側邊處,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
- 如請求項1之文字圖像拆分系統,其中該判斷模組基於該第一辨識資料符合該第一文字資料,且該第二辨識資料符合該第二文字資料,而使該判斷資料指示出該初始圖像資料符合該初始文字資料。
- 如請求項12之文字圖像拆分系統,其中該文字辨識模組基於該第一文字圖像資料符合該第一辨識資料的機率產生一第一機率排名資料,並使該第一機率排名資料關聯於該第一辨識資料;其中該文字辨識模組基於該第二文字圖像資料符合該第二辨識資料的機率產生一第二機率排名資料,並使該第二機率排名資料關聯於該第二辨識資料;其中該判斷模組基於該第一機率排名資料小於或等於一排名預設值,而決定該第一辨識資料符合該第一文字資料;其中該判斷模組基於該第二機率排名資料小於或等於該排名預設值,而決定該第二辨識資料符合該第二文字資料。
- 如請求項1之文字圖像拆分系統,其中該判斷模組基於該第一辨識資料不符合該第一文字資料,或基於該第二辨識資料不符合該第二文字資料,而使該判斷資料指示出該初始圖像資料不符合該初始文字資料。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟: 由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;由該文字拆分模組基於該第一前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第二前段拆分資料,該第二前段拆分資料的一第二圖像起始位置對應於該第一側邊處,該第二前段拆分資料的一第二圖像寬度等於該預設初始寬度與一預設推進寬度之和; 由該文字辨識模組自該第二前段拆分資料辨識出一第二前段辨識資料;以及由該文字拆分模組基於該第二前段辨識資料符合該第一文字資料,而決定以該第二前段拆分資料做為該第一文字圖像資料。
- 如請求項15之文字圖像拆分方法,進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一前段拆分資料,該第一前段拆分資料的一第一圖像起始位置對應於該初始圖像資料的一第一側邊處,該第一前段拆分資料的一第一圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一前段拆分資料辨識出一第一前段辨識資料;以及由該文字拆分模組基於該第一前段辨識資料符合該第一文字資料,而決定以該第一前段拆分資料做為該第一文字圖像資料。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料; 由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第三前段拆分資料,該第三前段拆分資料的一第三圖像起始位置對應於該初始圖像資料的一第一側邊處,該第三前段拆分資料的一第三圖像寬度等於一預設初始寬度與一第一當前推進寬度之和,該第一當前推進寬度為一預設推進寬度乘上一第一整數;由該文字辨識模組自該第三前段拆分資料辨識出一第三前段辨識資料;由該文字拆分模組基於該第三前段辨識資料不符合該第一文字資料,而自該初始圖像資料中拆分出一第四前段拆分資料,該第四前段拆分資料的一第四圖像起始位置對應於該第一側邊處,該第四前段拆分資料的一第四圖像寬度等於該預設初始寬度與一第二當前推進寬度之和,該第二當前推進寬度為該預設推進寬度乘上一第二整數,該第二整數為該第一整數加一; 由該文字辨識模組自該第四前段拆分資料辨識出一第四前段辨識資料;以及由該文字拆分模組基於該第四前段辨識資料符合該第一文字資料,而決定以該第四前段拆分資料做為該第一文字圖像資料。
- 如請求項15之文字圖像拆分方法,進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,其中該第五圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;以及由該文字拆分模組基於該第一接續段辨識資料符合該第二文字資料,而決定以該第一接續段拆分資料做為該第二文字圖像資料。
- 如請求項18之文字圖像拆分方法,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二 文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第一接續段拆分資料,該第一接續段拆分資料具有一第五圖像起始位置以及一第五圖像寬度,該第五圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第五圖像寬度等於一預設初始寬度;由該文字辨識模組自該第一接續段拆分資料辨識出一第一接續段辨識資料;由該文字拆分模組基於該第一接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第二接續段拆分資料,該第二接續段拆分資料具有一第六圖像起始位置 以及一第六圖像寬度,該第六圖像起始位置對應於該第一接續段起始位置,該第六圖像寬度等於該預設初始寬度與一預設推進寬度之和;由該文字辨識模組自該第二接續段拆分資料辨識出一第二接續段辨識資料;以及由該文字拆分模組基於該第二接續段辨識資料符合該第二文字資料,而決定以該第二接續段拆分資料做為該第二文字圖像資料。
- 如請求項20之文字圖像拆分方法,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及 由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第三接續段拆分資料,該第三接續段拆分資料具有一第七圖像起始位置以及一第七圖像寬度,該第七圖像起始位置對應於該初始圖像資料的一第一接續段起始位置;由該文字辨識模組自該第三接續段拆分資料辨識出一第三接續段辨識資料;由該文字拆分模組基於該第三接續段辨識資料不符合該第二文字資料,而自該初始圖像資料中拆分出一第四接續段拆分資料,該第二接續段拆分資料具有一第八圖像起始位置以及一第八圖像寬度,該第八圖像起始位置對應於該第一接續段起始位置;由該文字辨識模組自該第四接續段拆分資料辨識出一第四接續段辨識資料;以及由該文字拆分模組基於該第四接續段辨識資料符合該第二文字資料,而決定以該第四接續段拆分資料做為該第二文字圖像資料; 其中該第七圖像寬度等於一預設初始寬度與一第三當前推進寬度之和,該第三當前推進寬度為一預設推進寬度乘上一第三整數;其中該第八圖像寬度等於該預設初始寬度與一第四當前推進寬度之和,該第四當前推進寬度為該預設推進寬度乘上一第四整數,該第四整數為該第三整數加一。
- 如請求項22之文字圖像拆分方法,其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;其中該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及 由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像寬度,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;以及由該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第九圖像寬度到達一預設寬度閾值,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一; 其中該第十圖像寬度等於一預設初始寬度。
- 一種文字圖像拆分方法,應用於一文字圖像拆分系統,該文字圖像拆分系統包含一資料庫以及一伺服器;該資料庫儲存一初始文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;該伺服器存取該資料庫;其中該文字圖像拆分方法包含以下步驟:由該伺服器接收一初始圖像資料;由該伺服器的一文字拆分模組自該初始圖像資料中拆分出一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組自該第一文字圖像資料辨識出一第一辨識資料,並自該第二文字圖像資料辨識出一第二辨識資料;以及由該伺服器的一判斷模組,基於該第一文字資料、該第二文字資料、該第一辨識資料以及該第二辨識資料,以產生一判斷資料;其中該判斷資料指示出該初始圖像資料是否符合該初始文字資料;其中該第一文字圖像資料具有一第一圖像結束位置,該第一圖像結束位置對應於該初始圖像資料的一拆分位置;該文字圖像拆分方法進一步包含:由該文字拆分模組自該初始圖像資料中拆分出一第五接續段拆分資料,該第五接續段拆分資料具有一第九圖像起始位置以及一第九圖像結束位置,該第九圖像起始位置對應於該初始圖像資料的一第一接續段起始位置,該第一接續段起始 位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第一當前推進距離,該第一當前推進距離為一預設推進距離乘上一第五整數;以及由該文字拆分模組基於該第五接續段辨識資料不符合該第二文字資料,且該第二圖像結束位置到達該初始圖像資料的一第二側邊處,而自該初始圖像資料中拆分出一第六接續段拆分資料,該第六接續段拆分資料具有一第十圖像起始位置以及一第十圖像寬度,該第十圖像起始位置對應於該第二接續段起始位置;其中該第二接續段起始位置的計算方式為自該初始圖像資料的該拆分位置處減去一圖像退縮距離並加上一第二當前推進距離,該第二當前推進距離為該預設推進距離乘上一第六整數,該第六整數為該第五整數加一;其中該第十圖像寬度等於一預設初始寬度。
- 如請求項15之文字圖像拆分方法,進一步包含:由該判斷模組基於該第一辨識資料符合該第一文字資料,且該第二辨識資料符合該第二文字資料,而使該判斷資料指示出該初始圖像資料符合該初始文字資料。
- 如請求項26之文字圖像拆分方法,進一步包含:由該文字辨識模組基於該第一文字圖像資料符合該第一辨識資料的機率產生一第一機率排名資料,並使該第一機率排名資料關聯於該第一辨識資料; 由該文字辨識模組基於該第二文字圖像資料符合該第二辨識資料的機率產生一第二機率排名資料,並使該第二機率排名資料關聯於該第二辨識資料;由該判斷模組基於該第一機率排名資料小於或等於一排名預設值,而決定該第一辨識資料符合該第一文字資料;以及由該判斷模組基於該第二機率排名資料小於或等於該排名預設值,而決定該第二辨識資料符合該第二文字資料。
- 如請求項15之文字圖像拆分方法,進一步包含:由該判斷模組基於該第一辨識資料不符合該第一文字資料,或基於該第二辨識資料不符合該第二文字資料,而使該判斷資料指示出該初始圖像資料不符合該初始文字資料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111133046A TWI814564B (zh) | 2022-08-31 | 2022-08-31 | 文字圖像拆分系統及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111133046A TWI814564B (zh) | 2022-08-31 | 2022-08-31 | 文字圖像拆分系統及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI814564B true TWI814564B (zh) | 2023-09-01 |
TW202411945A TW202411945A (zh) | 2024-03-16 |
Family
ID=88966006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111133046A TWI814564B (zh) | 2022-08-31 | 2022-08-31 | 文字圖像拆分系統及其方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI814564B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201133359A (en) * | 2010-03-29 | 2011-10-01 | Funwish Co | Character recognition system and method for the same |
US20200372278A1 (en) * | 2019-05-24 | 2020-11-26 | Canon Information And Imaging Solutions, Inc. | Handwriting Recognition for Receipt |
TW202115603A (zh) * | 2019-09-09 | 2021-04-16 | 日商日立系統股份有限公司 | 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式 |
CN113554033A (zh) * | 2021-09-18 | 2021-10-26 | 深圳市一号互联科技有限公司 | 智能文本机器人的文本识别方法、装置及系统 |
-
2022
- 2022-08-31 TW TW111133046A patent/TWI814564B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201133359A (en) * | 2010-03-29 | 2011-10-01 | Funwish Co | Character recognition system and method for the same |
US20200372278A1 (en) * | 2019-05-24 | 2020-11-26 | Canon Information And Imaging Solutions, Inc. | Handwriting Recognition for Receipt |
TW202115603A (zh) * | 2019-09-09 | 2021-04-16 | 日商日立系統股份有限公司 | 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式 |
CN113554033A (zh) * | 2021-09-18 | 2021-10-26 | 深圳市一号互联科技有限公司 | 智能文本机器人的文本识别方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9811749B2 (en) | Detecting a label from an image | |
US8565494B2 (en) | Biometric authentication device, biometric authentication method, and computer program for biometric authentication | |
US9977955B2 (en) | Method and system for identifying books on a bookshelf | |
CN105930836B (zh) | 一种视频文字的识别方法和装置 | |
EP1434164A2 (en) | Method of extracting teeth area from teeth image and personal identification method and apparatus using the teeth image | |
US7136526B2 (en) | Character string recognition apparatus, character string recognizing method, and storage medium therefor | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
US20220207860A1 (en) | Similar area detection device, similar area detection method, and computer program product | |
CN110827189A (zh) | 一种数字图像或视频的水印去除方法及系统 | |
CN112818949A (zh) | 一种产证文字的识别方法及系统 | |
TWI814564B (zh) | 文字圖像拆分系統及其方法 | |
CN112954455B (zh) | 一种字幕跟踪方法、装置及电子设备 | |
TW202411945A (zh) | 文字圖像拆分系統及其方法 | |
CN111062199B (zh) | 一种不良信息识别方法及装置 | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
CN111126201A (zh) | 剧本中人物识别方法及装置 | |
CN111340031A (zh) | 基于图像识别的设备履历本目标信息提取与识别系统及其方法 | |
CN114359910A (zh) | 文本点读方法、计算机设备及存储介质 | |
CN111814780B (zh) | 一种票据图像处理方法、装置、设备及存储介质 | |
CN110287943B (zh) | 图像的对象识别方法、装置、电子设备及存储介质 | |
Alsimry et al. | A new approach for finding duplicated words in scanned Arabic documents based on OCR and SURF. | |
Zhu et al. | An automatic system to detect and extract texts in medical images for de-identification | |
Zhang et al. | Structure matching algorithm of fingerprint minutiae based on core point | |
JP4768358B2 (ja) | 画像検索方法 | |
CN109858473B (zh) | 一种自适应纠偏方法、装置、可读介质及电子设备 |