JP5334042B2 - 文字列認識方法及び文字列認識装置 - Google Patents
文字列認識方法及び文字列認識装置 Download PDFInfo
- Publication number
- JP5334042B2 JP5334042B2 JP2008298875A JP2008298875A JP5334042B2 JP 5334042 B2 JP5334042 B2 JP 5334042B2 JP 2008298875 A JP2008298875 A JP 2008298875A JP 2008298875 A JP2008298875 A JP 2008298875A JP 5334042 B2 JP5334042 B2 JP 5334042B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- processing
- similarity
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000012545 processing Methods 0.000 claims abstract description 107
- 238000011156 evaluation Methods 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 51
- 238000003384 imaging method Methods 0.000 claims description 10
- 238000012958 reprocessing Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 11
- 230000001186 cumulative effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
図1は、本発明の実施の形態に係る文字列認識装置1の電気的構成を示すブロック図である。
図2は、本発明の実施の形態に係る文字列認識方法を示すフローチャートである。なお、本実施形態では、上述した1次元撮像素子11を用いて画像データを得るため、後述する射影計算(ステップS3)や文字切り出し(ステップS6)の処理を行っているが、場合によっては一定の処理(ステップS2〜ステップS6)を省略しても構わない。
以上説明したように本実施形態に係る文字列認識方法は、媒体上の既知の位置に印刷された既知の文字数からなる文字列を、1次元撮像素子11で主走査を行い、手動若しくは機械駆動による媒体移動で副走査を行うようにして2次元の画像情報に変換し、この画像データを適切に処理することによって、文字列の認識を行うようにした文字列認識装置において、媒体をスキャンした多値画像を2値化するステップ(ステップS1)と、媒体移動方向に沿った文字列における文字区切り位置を検出するために、射影に基づいて文字の境界を決定するための境界判定閾値を算出するステップ(ステップS4)と、この境界判定閾値によって文字境界を決定するステップ(ステップS5)と、文字境界に基づいて文字に外接する矩形を求めるステップ(ステップS6)と、外接矩形内の文字特徴量を抽出して(ステップS7)、辞書登録された基準文字の特徴量との類似度を算出するステップ(ステップS8)と、求めた類似度が高い文字を候補文字として文字判定するステップ(ステップS9)と、を含む一連のステップにより文字列を認識し、さらに認識された全文字に関する類似度をスコア値として、そのスコア値の基本統計量を含む文字列の認識結果データに基づいて、媒体画像の2値化と文字認識を再実行するパス(ステップS10,S11,S13)を有することとしているので、文字列認識の精度を向上させることができる。その結果、文字列認識の認識結果に対する信頼性を高めることができる。すなわち、スコア値の基本統計量を用いることで、文字1個1個の精度向上ではなく、文字列全体を考えた際の精度向上に大きく貢献することができる。
これまで説明した図11および図12の実施形態では、文字列の判定結果を得るための信頼性判定の基準となる基本統計量として、スコア値の最小値を用いているが、スコア値の分散、標準偏差、最大値、平均値およびばらつき、またはスコア値の総数(度数)などを適宜選択して用いてもよい。そして、選択した基本統計量(T)の特性に応じて、これらが改善するように2値化基準閾値を変更(Dを増減)した後、処理をステップS1に戻す「処理戻しステップ」に引き続き、2回目以降のサイクルを実行すればよい。具体的には、基本統計量として分散や標準偏差を採用した場合には、これらが小さくなるように変更すれば基本統計量が改善されることになる。
2 記録担体
11 撮像素子
12 画像メモリ
13 データ処理部
13a 2値化部
13b 行切り出し部
13c 射影生成部
13d 閾値算出部
13e 文字境界決定部
13f 文字切り出し部
13g 特徴抽出部
13h 特徴比較部
13i 特徴辞書格納部
13j スコア集計部
13k 再実行判定部
14 文字出力部
Claims (10)
- 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列を認識する文字列認識方法において、
前記画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する加工ステップと、
前記文字列を構成する各文字の文字特徴量を抽出して、基準文字特徴量との類似度を算出する類似度算出ステップと、
前記類似度に基づいて暫定的に文字判定を行う暫定的文字判定ステップと、
前記暫定的文字判定ステップで暫定的に判定された全ての文字に関する前記類似度の基本統計量を算出する基本統計量算出ステップと、
前記基本統計量算出ステップで算出された基本統計量に基づいて、前記2値化基準閾値を変更した後、処理を前記加工ステップに戻す処理戻しステップと、を含み、
前記処理戻しステップは、前記基本統計量算出ステップで算出された基本統計量に応じて複数の評価カテゴリに分類され、前記評価カテゴリは、前記類似度算出ステップにおける前記基準文字特徴量との類似度に基づく評価カテゴリの他に、文字列認識中に発生したハードエラー又はソフトエラーを示す評価カテゴリをも含み、分類された評価カテゴリに基づいて、前記2値化基準閾値を変更することを特徴とする文字列認識方法。 - 前記加工ステップが終了してから前記類似度算出ステップまでの間に、
前記2値画像データを前記文字列の方向にシフトさせながら、前記文字列の方向と直交する垂直方向への前記2値画像データの垂直射影を計算する射影計算ステップと、
前記射影計算ステップにより得られた垂直射影データが所定の境界判定閾値を超えた箇所を、前記文字列を構成する文字の区切り位置として検出する区切り位置検出ステップと、
前記区切り位置検出ステップで検出された文字の区切り位置に基づいて、文字に外接する矩形を求める外接矩形算出ステップと、を含み、
前記類似度算出ステップは、前記矩形内の文字特徴量を抽出して、前記基準文字特徴量との類似度を算出することを特徴とする請求項1記載の文字列認識方法。 - 前記処理戻しステップは、前記基本統計量を前記類似度の最小値として、該最小値に応じて、4個の評価カテゴリに分類するものであって、
前記4個の評価カテゴリは、前記基準文字特徴量との類似度に基づく2個の評価カテゴリの他に、文字列認識中に発生したハードエラー及びソフトエラーを示す2個の評価カテゴリであることを特徴とする請求項2記載の文字列認識方法。 - 前記処理戻しステップは、前記2値化基準閾値を少なくとも3回以上変更する場合において、第3回目のサイクルでは、第1回目のサイクルにおいて分類されたカテゴリおよび第2回目のサイクルにおいて分類されたカテゴリに基づいて前記2値化基準閾値を変更することを特徴とする請求項1から3のいずれか記載の文字列認識方法。
- 前記処理戻しステップは、前記2値化基準閾値を変更するにあたって、前記基本統計量算出ステップで算出された基本統計量が改善するように変更することを特徴とする請求項1から4のいずれか記載の文字列認識方法。
- 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列を認識する文字列認識方法において、
前記画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する加工ステップと、
前記文字列を構成する各文字の文字特徴量を抽出して、基準文字特徴量との類似度を算出する類似度算出ステップと、
前記類似度に基づいて暫定的に文字判定を行う暫定的文字判定ステップと、
前記暫定的文字判定ステップで暫定的に判定された全ての文字に関する前記類似度の基本統計量を算出する基本統計量算出ステップと、
前記基本統計量算出ステップで算出された基本統計量に基づき、全ての文字に関する文字列全体としての認識結果を複数の評価カテゴリに分類する評価カテゴリ分類ステップと、
前記分類された評価カテゴリに基づいて、前記2値化基準閾値を変更した後、処理を前記加工ステップに戻す処理戻しステップと、を含み、
前記評価カテゴリは、前記複数の評価カテゴリの他に、文字列認識中に発生したハードエラー又はソフトエラーを示す評価カテゴリをも含み、
前記処理戻しステップは、前記評価カテゴリ分類ステップで分類された評価カテゴリおよび前記基本統計量算出ステップで算出された基本統計量に基づいて、前記2値化基準閾値を変更することを特徴とする文字列認識方法。 - 前記処理戻しステップは、先行する処理戻しステップ後の再処理において前記2値化基準閾値を変更するにあたって、前記加工ステップ、類似度算出ステップおよび暫定的文字判定ステップを繰り返した結果に基づき、文字列全体としての認識結果が改善するように変更することを特徴とする請求項6記載の文字列認識方法。
- 前記処理戻しステップは、前記2値化基準閾値を少なくとも3回以上変更する場合において、第3回目のサイクルでは、第1回目のサイクルにおいて分類されたカテゴリおよび第2回目のサイクルにおいて分類されたカテゴリに基づいて前記2値化基準閾値を変更することを特徴とする請求項6又は7記載の文字列認識方法。
- 前記処理戻しステップは、前記2値化基準閾値を変更するにあたって、前記基本統計量算出ステップで算出された基本統計量が改善するように変更することを特徴とする請求項8記載の文字列認識方法。
- 請求項1から9のいずれか記載の文字列認識方法を用いて、媒体上の文字列を認識する文字列認識手段を備えたことを特徴とする文字列認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008298875A JP5334042B2 (ja) | 2008-11-23 | 2008-11-23 | 文字列認識方法及び文字列認識装置 |
US12/623,826 US8401299B2 (en) | 2008-11-23 | 2009-11-23 | Character line recognition method and character line recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008298875A JP5334042B2 (ja) | 2008-11-23 | 2008-11-23 | 文字列認識方法及び文字列認識装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010123090A JP2010123090A (ja) | 2010-06-03 |
JP2010123090A5 JP2010123090A5 (ja) | 2011-11-24 |
JP5334042B2 true JP5334042B2 (ja) | 2013-11-06 |
Family
ID=42222861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008298875A Expired - Fee Related JP5334042B2 (ja) | 2008-11-23 | 2008-11-23 | 文字列認識方法及び文字列認識装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8401299B2 (ja) |
JP (1) | JP5334042B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5159226B2 (ja) * | 2007-09-25 | 2013-03-06 | 株式会社東芝 | 画像データ処理システム |
JP5538069B2 (ja) | 2010-05-28 | 2014-07-02 | 矢崎総業株式会社 | 車両用表示装置 |
JP5630689B2 (ja) * | 2010-06-08 | 2014-11-26 | 日本電産サンキョー株式会社 | 文字認識方法及び文字認識装置 |
JP5857704B2 (ja) * | 2011-12-13 | 2016-02-10 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP6666253B2 (ja) * | 2014-01-24 | 2020-03-13 | サノフィ−アベンティス・ドイチュラント・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング | 光学式文字認識(ocr)を用いて使用者が設定した用量値を記録および表示するために注射デバイスに取り付けるための補助デバイス |
JP6268023B2 (ja) * | 2014-03-31 | 2018-01-24 | 日本電産サンキョー株式会社 | 文字認識装置およびその文字切り出し方法 |
US9430703B2 (en) * | 2014-12-19 | 2016-08-30 | Konica Minolta Laboratory U.S.A., Inc. | Method for segmenting text words in document images using vertical projections of center zones of characters |
JP6487255B2 (ja) * | 2015-03-31 | 2019-03-20 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
JP6599672B2 (ja) * | 2015-07-17 | 2019-10-30 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
TWI560641B (en) * | 2015-09-03 | 2016-12-01 | Magic Power Co Ltd | A handwriting grading system and the method thereof |
CA2997190A1 (en) * | 2015-09-04 | 2017-03-09 | Straxcorp Pty Ltd | Method and apparatus for identifying a gap between objects in an image |
CN105528606B (zh) * | 2015-10-30 | 2019-08-06 | 小米科技有限责任公司 | 区域识别方法及装置 |
US11341739B2 (en) | 2016-02-15 | 2022-05-24 | Nec Corporation | Image processing device, image processing method, and program recording medium |
US9710703B1 (en) * | 2016-07-15 | 2017-07-18 | StradVision, Inc. | Method and apparatus for detecting texts included in a specific image |
US10679101B2 (en) | 2017-10-25 | 2020-06-09 | Hand Held Products, Inc. | Optical character recognition systems and methods |
CN108509416B (zh) * | 2018-03-20 | 2022-10-11 | 京东方科技集团股份有限公司 | 句意识别方法及装置、设备和存储介质 |
JP7452060B2 (ja) * | 2020-02-12 | 2024-03-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7452059B2 (ja) * | 2020-02-12 | 2024-03-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US11861922B2 (en) * | 2020-04-17 | 2024-01-02 | Zebra Technologies Corporation | System and method for extracting target data from labels |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5825920A (en) * | 1991-01-28 | 1998-10-20 | Hitachi, Ltd. | Method and unit for binary processing in image processing unit and method and unit for recognizing characters |
CA2072934C (en) * | 1991-07-19 | 2007-08-28 | Karl William Aston | Manganese complexes of nitrogen-containing macrocyclic ligands effective as catalysts for dismutating superoxide |
JPH07129713A (ja) * | 1993-11-01 | 1995-05-19 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3335009B2 (ja) * | 1994-09-08 | 2002-10-15 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
JP2812256B2 (ja) | 1995-06-30 | 1998-10-22 | 日本電気株式会社 | 文字認識装置および方法 |
US5850474A (en) * | 1996-07-26 | 1998-12-15 | Xerox Corporation | Apparatus and method for segmenting and classifying image data |
JPH10222602A (ja) | 1997-01-31 | 1998-08-21 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JP2004118611A (ja) | 2002-09-27 | 2004-04-15 | Dainippon Printing Co Ltd | 文字読取システム |
JP4112968B2 (ja) * | 2002-12-26 | 2008-07-02 | 富士通株式会社 | ビデオテキスト処理装置 |
JP2007086954A (ja) * | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
JP4945739B2 (ja) * | 2007-03-30 | 2012-06-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
-
2008
- 2008-11-23 JP JP2008298875A patent/JP5334042B2/ja not_active Expired - Fee Related
-
2009
- 2009-11-23 US US12/623,826 patent/US8401299B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010123090A (ja) | 2010-06-03 |
US8401299B2 (en) | 2013-03-19 |
US20100135578A1 (en) | 2010-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
US7949187B2 (en) | Character string recognition method and device | |
CN101246549B (zh) | 用于识别图像信息中的边界线的方法和装置 | |
US9158986B2 (en) | Character segmentation device and character segmentation method | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
CN111368574A (zh) | 一种条形码识别方法及装置 | |
JP4945739B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JPH0896059A (ja) | バーコード読取装置 | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
JP6144892B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2898562B2 (ja) | ナンバープレート決定方法 | |
JP5379626B2 (ja) | スタック型バーコード情報読取方法及びスタック型バーコード情報読取装置 | |
CN116469090A (zh) | 喷码图案的检测方法、装置、电子设备和存储介质 | |
Siddique et al. | Development of an automatic vehicle license plate detection and recognition system for Bangladesh | |
JP2005250786A (ja) | 画像認識方法 | |
KR101070051B1 (ko) | 도트 패턴에서 불변 영역을 인식하는 방법 | |
CN112163581B (zh) | 一种车牌字母识别方法、系统、装置及存储介质 | |
JP2010086324A (ja) | 二値化処理装置、情報処理装置、二値化処理方法および二値化処理プログラム | |
CN117115701A (zh) | 一种用于海关辅助管理的月台货车作业行为识别方法 | |
JPH04373090A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111005 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5334042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |