JP6268023B2 - 文字認識装置およびその文字切り出し方法 - Google Patents
文字認識装置およびその文字切り出し方法 Download PDFInfo
- Publication number
- JP6268023B2 JP6268023B2 JP2014073451A JP2014073451A JP6268023B2 JP 6268023 B2 JP6268023 B2 JP 6268023B2 JP 2014073451 A JP2014073451 A JP 2014073451A JP 2014073451 A JP2014073451 A JP 2014073451A JP 6268023 B2 JP6268023 B2 JP 6268023B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- boundary
- search range
- character string
- boundary position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
図1は、本発明の実施形態に係る文字認識装置の構成例を示す図である。
次に、データ処理部13の各部の基本的な構成および機能について説明する。データ処理部13は、画像メモリ12から画像データを読み出して、たとえばその画像データが多階調の濃淡画像(多値画像)である場合には、白黒2値の画像への変換を行う。また、本実施形態では、データ処理部13は、画像メモリ12に記憶されている多値画像データを二値画像データに変換するようになっている。なお、二値化処理については、既に公知となっている適当な方法によって二値化閾値を求め、多値画像データの輝度値が相対的に大きな値を示す画素を白エレメントとし、輝度値が相対的に小さな値になる画素を黒エレメントとして白黒の二値画像データに変換を行うようにしている。そして、M×N個の画素をマトリクス状に配列したM×N個の領域に文字記録領域21全体の二値画像データが生成される。
次に、本実施形態に係る文字認識装置10における特徴的な機能を有する文字切り出し部132における文字の区切り位置の検出処理(文字切り出し処理)について詳細に説明する。
図2は、本実施形態に係る文字切り出し部の構成例を示すブロック図である。図3は、図2の境界検索範囲設定部の構成例を示すブロック図である。図4は、本実施形態に係る文字認識対象の画像の一例を示す図である。図4は、3行の文字列の例を示している。この文字列は、文字と文字との間に空白領域を持った文字列として形成されている。図5は、図4の画像の一文字列とこの文字列に対応する射影曲線の例を示す図である。図5(A)が図4の最上段の文字列を拡大して示し、図5(B)が射影曲線PRCを示している。
ちなみに、図4の最上段の文字列は、左端側から「IDJPN3219876543321987654<<<<<<」となっている。
最小輝度曲線(射影曲線)PRCの全体にわたる画素値の平均値を求める。
ステップST12:
その結果、図7(A)に示すように、X軸に水平な直線Tが得られる。
最小輝度曲線(射影曲線)PRCを左からスキャンして、直線Tを下から上に横切る(交差する)画素位置を所定の個数、本実施形態では最初の3箇所E(1)、E(2)、E(3)を求める。
ステップST14:
この画素位置が文字の前端位置となる。その座標位置をE(1:Ne)とする。ここで、Neは直線Tを下から上に横切る画素位置の個数を表す。すなわち、この画素位置を文字の前端位置としていることから、全体の数Neは文字の個数に等しくなっている。
以下に、本実施形態に係る文字切り出し部132の具体的な処理例について、図4から図10に関連付けて説明する。以下の説明では境界位置設定部1323の具体的な処理について説明する。
図1の文字切り出し部132では、まず、ステップST21において、領域設定部1321により、文字列切り出し部131で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域が検出され、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域が設定される。次に、ステップST22において、境界検索範囲設定部1322の射影曲線作成部13221により、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて画像データにおける射影曲線である最小輝度曲線が作成される。次に、ステップST23において、文字端検出部13222により、境界位置を検出したい隣接する2文字を含む境界検索範囲“S”が設定され、この境界検索範囲“S”を設定することにより、最小輝度曲線(射影曲線)PRCを左からスキャンして、各文字の部の画素位置が検出される。そして、ステップST24において、境界位置設定部1323により、境界検索範囲“S”を設定した領域内の射影に関して射影を任意の位置で左右に2つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。すなわち、この境界点が、隣接する2文字の境界位置とされる。
C(1)=A+t−1=39+52−1=90
A(k)=C(k−1)、
B(k)=A(k)+E(k+1)−E(k−1)
次に、本実施形態に係る文字認識装置10の全体的な動作について図11に関連付けて説明する。図11は、本実施形態に係る文字認識装置10の全体の動作を説明するためのフローチャートである。
次に、文字切り出し部132では、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて記画像データにおける射影曲線である最小輝度曲線が作成される。次いでに、文字切り出し部132において、境界位置を検出したい隣接する2文字を含む境界検索範囲“S”が設定され、この境界検索範囲“S”を設定することにより、最小輝度曲線(射影曲線)PRCを左からスキャンして、各文字の部の画素位置が検出される。そして、文字切り出し部132において、境界検索範囲“S”を設定した領域内の射影に関して射影を任意の位置で左右に2つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。これにより、この境界点が、隣接する2文字の境界位置とされる。
以上のように、本実施形態によれば、画像認識技術に基づいて、撮像された画像内の文字列の区切り位置を検出(検索)する方法において、その文字列に関して計算される輝度投影(射影)について、境界検出処理対象となる2文字を含む処理区間を設定する。そして、その処理区間内において射影(X軸への投影)を作成し、その射影に関してこれを左右に任意の位置で2分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を2文字の分割点(境界位置)とする。その結果、本実施形態によれば、閾値のレベルに左右されず、局所的な文字のつぶれにより閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供でき、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供することができる。すなわち、本実施形態によれば、射影曲線のレベル値に基づく閾値を設定することなく、文字の境界位置を決定できるため、煩雑な閾値処理を行うことなく、境界があいまいなものについて境界線を設定することができる。
また、画像の局所ノイズに起因する射影曲線の局所的な変動がある場合でも安定的に文字の境界位置を決定することができる。
また、本実施形態によれば、最小輝度曲線により形成される射影曲線を適用していることから、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、本実施形態によれば、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。
また、本実施形態によれば、文字の境界が明確なケースに本方式を適用しても同様の結果を得ることができる。
Claims (8)
- 画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
前記画像読取部による読み取り画像を格納する画像メモリと、
前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
前記データ処理部は、
前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し部を備え、
前記文字切り出し部は、
前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定部と、
設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を設定する境界位置設定部と、を含むことを特徴とする文字認識装置。 - 前記文字切り出し部は、
前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する射影曲線作成部を含み、
前記境界検索範囲設定部は、
前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項1記載の文字認識装置。 - 前記境界位置設定部は、
前記境界検索範囲内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項1または2記載の文字認識装置。 - 前記境界検索範囲設定部は、
前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
前記境界位置設定部は、
順次設定される前記境界検索範囲ごとに境界位置を設定することを特徴とする請求項1から3のいずれか一に記載の文字認識装置。 - 媒体上の文字列を撮像して得られた画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置において、
前記画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し工程と、
前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定工程と、
設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得工程と、
を有することを特徴とする文字認識装置の文字切り出し方法。 - 前記文字切り出し工程においては、
前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値を検出し、各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する工程を含み、
前記境界検索範囲設定工程においては、
前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項5記載の文字認識装置の文字切り出し方法。 - 前記境界位置取得工程においては、
前記境界検索範囲内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項5または6記載の文字認識装置の文字切り出し方法。 - 前記境界検索範囲設定工程においては、
前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
前記境界位置設定工程においては、
順次設定される前記境界検索範囲に応じて一文字ずつ境界位置を設定することを特徴とする請求項5から7のいずれか一に記載の文字認識装置の文字切り出し方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014073451A JP6268023B2 (ja) | 2014-03-31 | 2014-03-31 | 文字認識装置およびその文字切り出し方法 |
US14/674,480 US9324001B2 (en) | 2014-03-31 | 2015-03-31 | Character recognition device and character segmentation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014073451A JP6268023B2 (ja) | 2014-03-31 | 2014-03-31 | 文字認識装置およびその文字切り出し方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015197681A JP2015197681A (ja) | 2015-11-09 |
JP6268023B2 true JP6268023B2 (ja) | 2018-01-24 |
Family
ID=54190842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014073451A Expired - Fee Related JP6268023B2 (ja) | 2014-03-31 | 2014-03-31 | 文字認識装置およびその文字切り出し方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9324001B2 (ja) |
JP (1) | JP6268023B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6804292B2 (ja) * | 2016-12-28 | 2020-12-23 | オムロンヘルスケア株式会社 | 端末装置 |
JP7247472B2 (ja) * | 2018-04-19 | 2023-03-29 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2021009539A (ja) * | 2019-07-01 | 2021-01-28 | パナソニックIpマネジメント株式会社 | 文字領域決定方法 |
CN110533030B (zh) * | 2019-08-19 | 2023-07-14 | 三峡大学 | 基于深度学习的太阳胶片图像时间戳信息提取方法 |
CN111563495B (zh) * | 2020-05-09 | 2023-10-27 | 北京奇艺世纪科技有限公司 | 一种图像中字符的识别方法、装置及电子设备 |
US11887222B2 (en) | 2021-11-12 | 2024-01-30 | Rockwell Collins, Inc. | Conversion of filled areas to run length encoded vectors |
US12002369B2 (en) | 2021-11-12 | 2024-06-04 | Rockwell Collins, Inc. | Graphical user interface (GUI) for selection and display of enroute charts in an avionics chart display system |
US11842429B2 (en) | 2021-11-12 | 2023-12-12 | Rockwell Collins, Inc. | System and method for machine code subroutine creation and execution with indeterminate addresses |
US11748923B2 (en) | 2021-11-12 | 2023-09-05 | Rockwell Collins, Inc. | System and method for providing more readable font characters in size adjusting avionics charts |
US11954770B2 (en) | 2021-11-12 | 2024-04-09 | Rockwell Collins, Inc. | System and method for recreating graphical image using character recognition to reduce storage space |
US11915389B2 (en) | 2021-11-12 | 2024-02-27 | Rockwell Collins, Inc. | System and method for recreating image with repeating patterns of graphical image file to reduce storage space |
CN115984859A (zh) * | 2022-12-14 | 2023-04-18 | 广州市保伦电子有限公司 | 一种图像文字识别的方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61269779A (ja) * | 1985-05-24 | 1986-11-29 | Agency Of Ind Science & Technol | 文書画像解析方式 |
JPH04167084A (ja) * | 1990-10-31 | 1992-06-15 | Toshiba Corp | 文字読取装置 |
JP4945739B2 (ja) | 2007-03-30 | 2012-06-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
JP5334042B2 (ja) * | 2008-11-23 | 2013-11-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
JP6039413B2 (ja) * | 2012-12-27 | 2016-12-07 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
-
2014
- 2014-03-31 JP JP2014073451A patent/JP6268023B2/ja not_active Expired - Fee Related
-
2015
- 2015-03-31 US US14/674,480 patent/US9324001B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015197681A (ja) | 2015-11-09 |
US9324001B2 (en) | 2016-04-26 |
US20150278626A1 (en) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
CN109543501B (zh) | 图像处理装置、图像处理方法和存储介质 | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
Fujinaga | Staff detection and removal | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
JP6599672B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP2014153820A (ja) | 文字切り出し装置及び文字切り出し方法 | |
CN109389115B (zh) | 文本识别方法、装置、存储介质和计算机设备 | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
US20120082372A1 (en) | Automatic document image extraction and comparison | |
JP4945739B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
US20130050765A1 (en) | Method and apparatus for document authentication using image comparison on a block-by-block basis | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
KR20010015025A (ko) | 문자인식장치의 문자추출방법 및 장치 | |
JP6144892B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
Chanda et al. | Font identification—In context of an Indic script | |
JP6493559B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4594765B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170208 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20171121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6268023 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |