JP5039659B2 - 文字認識方法及び文字認識装置 - Google Patents
文字認識方法及び文字認識装置 Download PDFInfo
- Publication number
- JP5039659B2 JP5039659B2 JP2008199477A JP2008199477A JP5039659B2 JP 5039659 B2 JP5039659 B2 JP 5039659B2 JP 2008199477 A JP2008199477 A JP 2008199477A JP 2008199477 A JP2008199477 A JP 2008199477A JP 5039659 B2 JP5039659 B2 JP 5039659B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- width
- likelihood
- pattern
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Character Input (AREA)
Description
(式1)CLh = 黒画素のy座標最大値 - y座標最小値 + 1
(式2)CLw = 黒画素のx座標最大値 - x座標最小値 + 1
である。
設定値Vdを予め定めておき、この設定値Vdを用いて、
(条件式1)Ewi > CLh×Vd
を満たすエレメントのEwiの総和Elwtを算出する。次にElwtを用いて、倍角尤度Ldは、
(式3)Ld = Elwt/ΣEwi
と算出できる。
CLhとEwi及びエレメント数nを用いて、半角尤度Lhは、
(式4)Lh = CLh×n/ΣEwi
と算出できる。
設定値Vcを予め定めておき、この設定値Vcを用いて、
(条件式2)Ew/CLh > Vc
を満たすエレメントの数Ncを算出する。次にNcを用いて、文字接触尤度Lcは、
(式5)Lc = Nc×CLh/ΣEwi
と算出できる。
設定値Vb1、Vb2を予め定めておき、設定値Vb1、Vb2を用いて、
(条件式3)Vb1 < Swi <Vb2 かつ Vb1 < Shi < Vb2
を満たす連結成分の数Nbを算出する。次にNbを用いて、文字かすれ尤度Lbは、
(式6)Lb = Nb×CLh/ΣEwi
と算出できる。
設定値Vnを予め定めておき、設定値Vnを用い、
(条件式4)Shi < Vn かつ Swi < Vn
を満たす連結成分の数Nnを算出する。次にNnを用いて、ノイズ尤度Lnは、
(式7)Ln = Nn×CLh/ΣEwi
と算出できる。
設定値Vncを予め定めておき、設定値Vncを用い、
(式8)THn=文字行高さ×Vnc
によってThnを求め、入力文字パタンの幅が求められたTHnより大きい場合、全角文字が接触していると判定することができる。例えば、(式8)のVncを1と設定することによって、文字行高さよりも大きいパタンは全角文字が接触している可能性があると判定することができる。
(式9)Zx=文字行高さ×Vpc(Vpcは設定値)
によってZxを求める。例えば、Vpcを1と設定することによって、文字パタンの左端から文字行高さと同じx位置付近で文字パタンを切断することができる。すなわち、入力された文字パタン1301の左端から全角文字幅の位置で切断され、全角文字幅の文字パタンが二つ生成される。ただし、切断すべき位置を含む文字パタンが必ず入力されるとは限らない。そのため、Zx−hからZx+h区間内のすべての度数が一定値よりも高い場合は切断を行わない。
(式10)Rwh = 幅/高さ
を算出する。次に、設定値Vrwhを予め定めておき、設定値Vrwhを用いて、
(条件式5)Rwh > Vrwh
を満たす文字パタンの数Nrwhを算出する。さらに、Nrwhと文字識別結果の文字パタンの数を用いて、
(式11)Pwh = Nrwh / (文字識別結果の文字パタンの数)
を算出する。設定値THrwhを予め定めておき、Pwhと設定値THrwhを用いて文字幅の推定を行う。
(条件式6)Pwh < THrwh
を満たす場合は、文字行内の文字は半角又は倍角の文字幅であると判定される。
(条件式7)(文字パタンの幅)> H × Vv
を満たす文字パタンが存在するか否かを判定する。なお、文字行の高さは文字パタンの高さの最大値などで推定する。
102 文字行抽出処理
103 連結成分/エレメント生成処理
104 倍角判別処理
105 文字接触判別処理
106 半角判別処理
107 文字かすれ判別処理
108 ノイズ判別処理
109 プレセグメンテーション処理
110 強制切断処理
111 文字識別処理
112 知識処理
113 認識結果利用文字幅検定処理
114 文字認識結果
Claims (13)
- 画像中から文字を認識する文字認識方法であって、
文字を含む画像から文字を構成する黒画素の連なりである連結成分を生成する連結成分生成処理と、
文字が並んでいる領域である文字行を抽出する文字行抽出処理と、
文字行内にある文字の半角らしさの度合いを示す半角尤度を算出する半角判別処理と、
文字行内にある文字の倍角らしさの度合いを示す倍角尤度を算出する倍角判別処理と、
文字行内にある文字のかすれ度合いを示す文字かすれ尤度を算出する文字かすれ判別処理と、
文字行内にある文字の接触度合いを示す文字接触尤度を算出する文字接触判別処理と、
文字行内へのノイズの混入度合いを示すノイズ尤度を算出するノイズ判別処理と、
前記文字接触判別処理によって算出された文字接触尤度及び前記倍角判別処理によって算出された倍角文字尤度を用いて、一つ又は複数の連結成分を組み合わせた情報である文字パタンを生成するプレセグメンテーション処理と、
前記文字かすれ判別処理によって算出された文字かすれ尤度及び前記半角判別処理によって算出された半角文字尤度を用いて、連結成分を切断する文字パタンを選択し、連結成分の切断する位置を決定する強制切断処理と、
前記プレセグメンテーション処理及び前記強制切断処理によって生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理と、を備えることを特徴とする文字認識方法。 - 前記文字認識方法は、上下方向に重なる連結成分をまとめたエレメントを生成し、
前記半角判別処理は、前記エレメントの数と、前記エレメントの幅と、前記文字行の高さとを用いて、半角尤度を算出することを特徴とする請求項1に記載の文字認識方法。 - 前記文字認識方法は、上下方向に重なる連結成分をまとめたエレメントを生成し、
前記倍角判別処理は、前記エレメントの幅が所定の条件を満たすエレメントの幅を用いて、倍角尤度を算出することを特徴とする請求項1に記載の文字認識方法。 - 前記文字認識方法は、上下方向に重なる連結成分をまとめたエレメントを生成し、
前記文字かすれ判別処理は、前記連結成分の幅及び高さが所定の条件を満たす連結成分の数と、前記文字行の高さと、前記エレメントの幅とを用いて、文字かすれ尤度を算出することを特徴とする請求項1に記載の文字認識方法。 - 前記文字認識方法は、上下方向に重なる連結成分をまとめたエレメントを生成し、
前記文字接触判別処理は、前記エレメントの幅が所定の条件を満たすエレメントの数と、前記文字行の高さと、前記エレメントの幅とを用いて、文字接触尤度を算出することを特徴とする請求項1に記載の文字認識方法。 - 前記文字認識方法は、上下方向に重なる連結成分をまとめたエレメントを生成し、
前記ノイズ判別処理は、前記連結成分の幅及び高さが所定の条件を満たす連結成分の数と、前記文字行の高さと、前記エレメントの幅とを用いて、ノイズ尤度を算出することを特徴とする請求項1に記載の文字認識方法。 - 前記プレセグメンテーション処理は、前記算出された半角尤度、前記算出された倍角尤度、前記算出された文字かすれ尤度、前記算出された文字接触尤度、及び前記算出されたノイズ尤度の五つの尤度のうち、一つ又は複数の尤度を用いて、生成される文字パタンの幅を調整し、一つ又は複数の幅の文字パタンを生成することを特徴とする請求項1に記載の文字認識方法。
- 前記強制切断処理は、前記算出された半角尤度、前記算出された倍角尤度、前記算出された文字かすれ尤度、前記算出された文字接触尤度、及び前記算出されたノイズ尤度の五つの尤度のうち、一つ又は複数の尤度を用いて、切断を行うエレメントの幅及び強制切断を行う位置を調整することを特徴とする請求項1に記載の文字認識方法。
- プロセッサ、前記プロセッサに接続されるメモリ及び前記プロセッサに接続されるインタフェースを備え、入力された画像中から文字を認識する文字認識装置であって、
前記入力された画像から文字を構成する黒画素の連なりである連結成分を生成する連結成分生成部と、
文字が並んでいる領域である文字行を抽出する文字行抽出部と、
文字行内にある文字の半角らしさの度合いを示す半角尤度を算出する半角判別部と、
文字行内にある文字の倍角らしさの度合いを示す倍角尤度を算出する倍角判別部と、
文字行内にある文字のかすれ度合いを示す文字かすれ尤度を算出する文字かすれ判別部と、
文字行内にある文字の接触度合いを示す文字接触尤度を算出する文字接触判別部と、
文字行内へのノイズの混入度合いを示すノイズ尤度を算出するノイズ判別部と、
前記文字接触判別部によって算出された文字接触尤度及び前記倍角判別部によって算出された倍角文字尤度を用いて、一つ又は複数の連結成分を組み合わせた情報である文字パタンを生成するプレセグメンテーション部部と、
前記文字かすれ判別処理によって算出された文字かすれ尤度及び前記半角判別処理によって算出された半角文字尤度を用いて、連結成分を切断する文字パタンを選択し、連結成分の切断する位置を決定する強制切断部と、
前記プレセグメンテーション部及び前記強制切断部によって生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別部と、を備えることを特徴とする文字認識装置。 - 前記文字識別部は、
類似度の高い文字種の組み合わせと前記予め用意された単語辞書にある単語リストと照合する単語照合部と、
前記文字識別処理の結果である文字種毎の類似度と前記単語照合結果とを用いて、文字行内の文字認識結果1を決定する知識処理部と、
前記決定された文字認識結果1に含まれる文字パタンの文字種と文字パタンの幅と高さ及び文字パタンの数から、文字行内の文字パタンが半角或いは全角或いは倍角であるかを表す文字幅判定結果を算出し、文字幅判定結果に応じて、前記文字認識結果1内の文字パタンの字種と文字パタンの幅と高さを用いて、前記文字認識結果1内に不適切な認識結果が含まれているか否かを判定し、不適切な認識結果が含まれている場合には、文字幅判定結果と文字パタンの字種と文字パタンの幅と高さとを用いて、前記プレセグメンテーション処理と強制切断処理で生成された文字パタンから適切な文字パタンと識別結果を選択し、選択された文字パタンと識別結果のみを用いて、知識処理を行う認識結果利用文字幅検定部と、を備えることを特徴とする請求項9に記載の文字認識装置。 - 前記プレセグメンテーション部は、前記算出された半角尤度、前記算出された倍角尤度、前記算出された文字かすれ尤度、前記算出された文字接触尤度、及び前記算出されたノイズ尤度生成の五つの尤度のうち、一つ又は複数の尤度を用いて、生成される文字パタンの幅を調整し、一つ又は複数の幅の文字パタンを生成することを特徴とする請求項9に記載の文字認識装置。
- 前記強制切断部は、前記算出された半角尤度、前記算出された倍角尤度、前記算出された文字かすれ尤度、前記算出された文字接触尤度、及び前記算出されたノイズ尤度生成の五つの尤度のうち、一つ又は複数の尤度を用いて、切断を行うエレメントの幅及び強制切断を行う位置を調整することを特徴とする請求項9に記載の文字認識装置。
- プロセッサ、前記プロセッサに接続されるメモリ及び前記プロセッサに接続されるインタフェースを備え、入力された画像中から文字を認識する文字認識装置であって、
前記入力された画像から文字を構成する黒画素の連なりである連結成分を生成する連結成分生成部と、
文字が並んでいる領域である文字行を抽出する文字行抽出処理と、
一つ又は複数の連結成分を組み合わせた情報である文字パタンを生成するプレセグメンテーション部と、
連結成分を切断する文字パタンを選択し、連結成分の切断する位置を決定する強制切断部と、
前記プレセグメンテーション部及び前記強制切断部によって生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別部と、
前記文字識別処理で類似度の高い文字種の組み合わせと前記予め用意された単語辞書にある単語リストと照合する単語照合処理部と、
前記文字識別処理の結果である文字種毎の類似度と単語照合結果を用いて、文字行内の文字認識結果1を決定する知識処理部と、
前記文字認識結果1に含まれる文字パタンの文字種と文字パタンの幅と高さ及び文字パタンの数から、文字行内の文字パタンが半角或いは全角或いは倍角であるかを表す文字幅判定結果を算出し、文字幅判定結果に応じて、前記文字認識結果1内の文字パタンの字種と文字パタンの幅と高さを用いて、前記文字認識結果1内に不適切な認識結果が含まれているか否かを判定し、不適切な認識結果が含まれている場合には、文字幅判定結果と文字パタンの字種と文字パタンの幅と高さを用いて、前記プレセグメンテーションと強制切断処理により生成された文字パタンから適切な文字パタンと識別結果を選択し、選択された文字パタンと識別結果のみを用いて、知識処理を行う認識結果利用文字幅検定処理と、を備えることを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008199477A JP5039659B2 (ja) | 2008-08-01 | 2008-08-01 | 文字認識方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008199477A JP5039659B2 (ja) | 2008-08-01 | 2008-08-01 | 文字認識方法及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010039615A JP2010039615A (ja) | 2010-02-18 |
JP5039659B2 true JP5039659B2 (ja) | 2012-10-03 |
Family
ID=42012122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008199477A Expired - Fee Related JP5039659B2 (ja) | 2008-08-01 | 2008-08-01 | 文字認識方法及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5039659B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6327963B2 (ja) * | 2014-06-09 | 2018-05-23 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び文字認識方法 |
JP7019963B2 (ja) * | 2016-05-10 | 2022-02-16 | 凸版印刷株式会社 | 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62169286A (ja) * | 1986-01-22 | 1987-07-25 | Toshiba Corp | 文字切出方式 |
JPH01209586A (ja) * | 1988-02-17 | 1989-08-23 | Fujitsu Ltd | 倍角文字・半角文字混在文章の文字認識方式 |
JPH03225579A (ja) * | 1990-01-31 | 1991-10-04 | Mitsubishi Electric Corp | 文字パターン切り出し装置 |
JPH05182025A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
JPH05282492A (ja) * | 1992-04-01 | 1993-10-29 | Matsushita Electric Ind Co Ltd | 文字サイズ抽出方法 |
JPH09297817A (ja) * | 1996-05-01 | 1997-11-18 | Ricoh Co Ltd | 文字切り出し方法 |
-
2008
- 2008-08-01 JP JP2008199477A patent/JP5039659B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010039615A (ja) | 2010-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180137349A1 (en) | System and method of character recognition using fully convolutional neural networks | |
JP6286866B2 (ja) | 画像処理装置および画像処理方法 | |
US10885325B2 (en) | Information processing apparatus, control method, and storage medium | |
CN110569830A (zh) | 多语言文本识别方法、装置、计算机设备及存储介质 | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US9977976B2 (en) | Path score calculating method for intelligent character recognition | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US10140556B2 (en) | Arabic optical character recognition method using hidden markov models and decision trees | |
WO2018090011A1 (en) | System and method of character recognition using fully convolutional neural networks | |
JP2013033416A (ja) | 文字認識装置、文字認識方法及びプログラム | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
US9224065B2 (en) | Character-recognition method and character-recognition device and program using said method | |
JP2000315247A (ja) | 文字認識装置 | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP4686433B2 (ja) | 単語認識方法および単語認識装置 | |
JP5039659B2 (ja) | 文字認識方法及び文字認識装置 | |
JP7338159B2 (ja) | 情報処理装置及びプログラム | |
US11611678B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
JP2000207495A (ja) | 文字認識装置、文字学習装置およびコンピュ―タ可読記録媒体 | |
Kaur et al. | Adverse conditions and techniques for cross-lingual text recognition | |
JP5830996B2 (ja) | 画像処理装置及びプログラム | |
Satter et al. | Open Vocabulary Word Recognition From Transcribed Bangla Texts | |
JP3662967B2 (ja) | 文字ループ候補抽出装置及び文字補完装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120709 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |