JP2014164320A - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法 Download PDFInfo
- Publication number
- JP2014164320A JP2014164320A JP2013031992A JP2013031992A JP2014164320A JP 2014164320 A JP2014164320 A JP 2014164320A JP 2013031992 A JP2013031992 A JP 2013031992A JP 2013031992 A JP2013031992 A JP 2013031992A JP 2014164320 A JP2014164320 A JP 2014164320A
- Authority
- JP
- Japan
- Prior art keywords
- area
- character string
- region
- energy function
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000001514 detection method Methods 0.000 claims abstract description 63
- 238000005457 optimization Methods 0.000 claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 42
- 239000000284 extract Substances 0.000 claims description 9
- 230000006870 function Effects 0.000 description 68
- 230000010354 integration Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】領域検出部3が、画像データから罫線および空白などで囲まれた領域を検出する。文字列抽出部4が、領域内からラベルを検出し、ラベルからの距離に応じて重みづけしたエネルギ関数を生成し、領域内の最適化処理によりラベルを統合する。文字認識部5は、統合されたラベル内の文字列を認識処理する。
【選択図】図1
Description
図1に示すように、本実施の形態1に係る文字認識装置1は、二値化処理部2と、領域検出部3と、文字列抽出部4と、文字認識部5とから構成される。これら二値化処理部2、領域検出部3、文字列抽出部4および文字認識部5を各種電子回路でハードウェアとして構成してもよいし、文字認識装置1をコンピュータで構成して、CPUを二値化処理部2、領域検出部3、文字列抽出部4および文字認識部5として機能させるためのプログラムをメモリ等に格納し、CPUがそのプログラムを実行するようにしてもよい。
以下の説明では、画像データの余白(背景など)が二値化処理によって白画素に変換され、余白以外(文字、罫線、シンボル図形など)が黒画素に変換されたものとする。
あるいは、領域#1,#2を両方とも領域として検出してもよい。この場合、領域の分割数は増えるが、より局所性を考慮した処理が可能となる。また、図3(b)のように、領域を階層化(領域a,b)する場合が考えられる。階層化することで、データ構造は複雑になるが後工程の処理を増やさずに領域の局所性を考慮した処理が可能となる。
参考文献1:平野敬、岡田康裕、依田文夫、“文書画像からの罫線抽出方式”、電子情報通信学会総合大会、1998年3月
参考文献2:米山昇吾、平野敬、岡田康裕、“図面画像内シンボル抽出方式の検討”、電子情報通信学会総合大会、2006年3月
図5は、文字列抽出部4の内部構成を示すブロック図である。文字列抽出部4において、先ず、二値化処理部2の二値画像データと領域検出部3の領域検出結果をラベル検出部41に入力する。ラベル検出部41は、二値画像データの対象領域において黒画素のかたまりを検出してラベルを生成する。ラベル検出部41のラベル検出は従来技術と同様の処理を行えばよいため説明は割愛する。
図6は、統合エネルギ関数生成部42の生成するエネルギ関数を説明する図であり、二値画像データの領域#1においてラベル#1とその周辺部分に付与された重みのうち、画素列Aの各画素に付与された重みを、一次元のグラフとして示す。グラフの縦軸が重み、横軸が画素位置である。重みは、ラベルの統合される確率を示しており、重みが大きいほど統合確率が高いことを示す。そのため、すでにラベルが検出された領域(図中のラベル#1)は統合確率が高い。一般的に、ラベル間の距離が近いほど同じ文字列である確率が高く、離れるほど低くなる。そのため、重みはラベルからの距離に応じた関数とする。図中では、重みが大きいほど濃い色で表す。
罫線が存在する場合に重みを小さくする方法は、下式(1)で示すように重みαから重み定数βを減算してもよいし、下式(2)で示すように重みαに重み定数λを乗算してもよい。
重み(罫線)=α×λ (2)
先ず、ラベル検出部41が、領域内の黒画素を検出し(ステップST11)、検出した黒画素を連結させる(ステップST12)。黒画素の連結処理は、例えば処理対象の黒画素の周囲8方向を見て、黒画素が存在している場合は連結し、そうでない場合は連結しない処理が考えられる。黒画素の連結後、連結した黒画素を囲むような矩形領域をラベルとして生成する(ステップST13)。
E(x,y)=M−λmax(|(x0−x)|,|(y0−y)|) (4)
ここで、(x0,y0)はラベルの位置を示し、λは重み定数を示す。Mは重みの上限値とする。
E(x,y)=M−λmax(|x0−x)|,|(y0−y)|)
−β×φ(x,y) (5)
ここで、φ(x,y)は座標(x,y)における罫線および空白の存在有無を示し、βは罫線および空白にかかる重み定数を示す。
参考文献3:森稔、澤木美奈子、萩田紀博、村瀬洋、武川直樹、“ランレングス補正を用いた画像劣化にロバストな特徴抽出”、電子情報通信学会論文誌、Vol.J86−D2、No.7、pp.1049−1057、2003年7月
ちなみに、ガウスフィルタは下式(6)で表せる。
ちなみに、重み付けにガウスフィルタを用いる場合は、上式(6)のσを変更することでエネルギ関数を変更することができる。
図12(a)は、複数のエネルギ関数それぞれの統合結果#1〜#7を示す。統合結果#1〜#3は、図11(a)のようにラベルからの距離が近いところのみに重みをつけたエネルギ関数の最適化結果、統合結果#4,#5は、図11(b)のようにラベルからの距離がやや離れたところに重みをつけたエネルギ関数の最適化結果、統合結果#6,#7は、図11(c)のようにラベルからの距離が一番遠いところに重みをつけたエネルギ関数の最適化結果を表している。このとき、統合結果#4および統合結果#6は、統合結果#1,#2を1つに統合しているため、多数決処理により、統合結果#1,#2の領域を統合した統合結果#4を最終的な統合結果にしている(図12(b))。また、統合結果#4と同じ種類のエネルギ関数の統合結果#5も最終的な統合結果として選択されている。
λwidth=α×Width (7)
λheight=α×Height (8)
なお、統合エネルギ関数生成部42による特定のパターン抽出の手法は、例えば上述の参考文献1の手法が考えられる。
Claims (6)
- 入力された画像データから所定の領域を検出する領域検出部と、
前記領域検出部の検出した領域から文字列を抽出する文字列抽出部と、
前記文字列抽出部の抽出した文字列を認識する文字認識部とを備え、
前記文字列抽出部は、
前記領域内から非余白領域を検出するラベル検出部と、
前記ラベル検出部の検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成部と、
前記統合エネルギ関数生成部の生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って前記領域内の前記非余白領域を統合して文字列として抽出する最適化処理部とを有することを特徴とする文字認識装置。 - 前記統合エネルギ関数生成部は、前記領域内から特定のパターンを検出し、前記エネルギ関数に対して当該パターンに対応する重みを加えることを特徴とする請求項1記載の文字認識装置。
- 前記所定の領域は、連続する黒画素で囲まれた領域、連続する白画素で囲まれた領域、および予め決められた形状のシンボルの特定領域のうちの少なくとも1つの領域であることを特徴とする請求項1記載の文字認識装置。
- 入力された画像データから所定の領域を検出する領域検出ステップと、
前記領域検出ステップで検出した領域から文字列を抽出する文字列抽出ステップと、
前記文字列抽出ステップで抽出した文字列を認識する文字認識ステップとを備え、
前記文字列抽出ステップは、
前記領域内から非余白領域を検出するラベル検出ステップと、
前記ラベル検出ステップで検出した非余白領域からの距離に応じて重みづけしたエネルギ関数を生成する統合エネルギ関数生成ステップと、
前記統合エネルギ関数生成ステップで生成したエネルギ関数に基づく最適化関数を用いて最適化処理を行い、最適化結果に従って前記領域内の前記非余白領域を統合して文字列として抽出する最適化処理ステップとを有することを特徴とする文字認識方法。 - 前記統合エネルギ関数生成ステップは、前記領域内から特定のパターンを検出し、前記エネルギ関数に対して当該パターンに対応する重みを加えることを特徴とする請求項4記載の文字認識方法。
- 前記所定の領域は、連続する黒画素で囲まれた領域、連続する白画素で囲まれた領域、および予め決められた形状のシンボルの特定領域のうちの少なくとも1つの領域であることを特徴とする請求項4記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031992A JP6076128B2 (ja) | 2013-02-21 | 2013-02-21 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031992A JP6076128B2 (ja) | 2013-02-21 | 2013-02-21 | 文字認識装置および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164320A true JP2014164320A (ja) | 2014-09-08 |
JP6076128B2 JP6076128B2 (ja) | 2017-02-08 |
Family
ID=51614915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013031992A Active JP6076128B2 (ja) | 2013-02-21 | 2013-02-21 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6076128B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021149136A (ja) * | 2020-03-16 | 2021-09-27 | 株式会社アイエスピー | シリアルナンバー等文字列抽出サーバ、方法及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03172983A (ja) * | 1989-12-01 | 1991-07-26 | Ricoh Co Ltd | 表処理方法 |
JPH0855185A (ja) * | 1994-08-15 | 1996-02-27 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2001092921A (ja) * | 1999-09-17 | 2001-04-06 | Toshiba Corp | 文字行領域抽出方法と文字行領域検出に用いられる学習方法 |
JP2003208567A (ja) * | 2002-01-10 | 2003-07-25 | Ricoh Co Ltd | 画像処理装置、画像処理方法、及び同方法に用いるプログラム |
-
2013
- 2013-02-21 JP JP2013031992A patent/JP6076128B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03172983A (ja) * | 1989-12-01 | 1991-07-26 | Ricoh Co Ltd | 表処理方法 |
JPH0855185A (ja) * | 1994-08-15 | 1996-02-27 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2001092921A (ja) * | 1999-09-17 | 2001-04-06 | Toshiba Corp | 文字行領域抽出方法と文字行領域検出に用いられる学習方法 |
JP2003208567A (ja) * | 2002-01-10 | 2003-07-25 | Ricoh Co Ltd | 画像処理装置、画像処理方法、及び同方法に用いるプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021149136A (ja) * | 2020-03-16 | 2021-09-27 | 株式会社アイエスピー | シリアルナンバー等文字列抽出サーバ、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6076128B2 (ja) | 2017-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6050223B2 (ja) | 画像認識装置、画像認識方法、及び集積回路 | |
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US10438083B1 (en) | Method and system for processing candidate strings generated by an optical character recognition process | |
WO2016033710A1 (en) | Scene text detection system and method | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
CN104751093A (zh) | 用于获取宿主设备显示的图像识别码的方法和装置 | |
KR102655789B1 (ko) | 얼굴 검출 방법 및 장치 | |
WO2014129018A1 (ja) | 文字認識装置、文字認識方法及び記録媒体 | |
KR101836811B1 (ko) | 이미지 상호간의 매칭을 판단하는 방법, 장치 및 컴퓨터 프로그램 | |
US10509934B1 (en) | Methods and apparatus for improving QR code locator detectability and/or finding the corners of a locator pattern | |
Marne et al. | Identification of optimal optical character recognition (OCR) engine for proposed system | |
JP2019220014A (ja) | 画像解析装置、画像解析方法及びプログラム | |
JP6106808B2 (ja) | 文書内バーコード配置特定 | |
WO2020209046A1 (ja) | 物体検出装置 | |
US10223583B2 (en) | Object detection apparatus | |
JP6076128B2 (ja) | 文字認識装置および文字認識方法 | |
JP2019144703A (ja) | 読取システム、読取方法、プログラム、及び記憶媒体 | |
US9607398B2 (en) | Image processing apparatus and method of controlling the same | |
JP2018206260A (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
CN113807407B (zh) | 目标检测模型训练方法、模型性能检测方法及装置 | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 | |
JP5083162B2 (ja) | 画像データ判定装置、画像データ判定システム、及びプログラム | |
KR101727432B1 (ko) | 단계별 영상을 이용한 객체 인식 성능 향상 장치 및 방법 | |
US11443552B2 (en) | Image pattern similarity calculation device and recognition device | |
CN110781977A (zh) | 基于空间相关性和极限学习机的运动阴影检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6076128 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |