JP4087421B2 - パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 - Google Patents
パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP4087421B2 JP4087421B2 JP2006277737A JP2006277737A JP4087421B2 JP 4087421 B2 JP4087421 B2 JP 4087421B2 JP 2006277737 A JP2006277737 A JP 2006277737A JP 2006277737 A JP2006277737 A JP 2006277737A JP 4087421 B2 JP4087421 B2 JP 4087421B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- dictionary
- input
- collation
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
好ましくは、特徴は画像の濃淡を指示し、成分は濃淡を1と0により指示し、入力照合ベクトルの1を指す成分の総数が予め設定した数値より大きいときは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の入力照合ベクトルの1を指す成分の総数に対する割合を指示する。
(実施の形態1)
(機能構成)
図1には、本実施の形態に係る文字認識装置1の要部の機能構成が示される。図2には、実施の形態に係るコンピュータの構成が示される。
本実施の形態に係る辞書データ811の一部の構成は図20に示される。
(第1ベクトル類似度算出部)
第1ベクトル類似度算出部827による具体的な類似度の算出手順は次のようである。つまり、第1ベクトル類似度算出部827は、入力文字パターンと辞書登録文字CHiの文字パターンについて、図5のメッシュ状に分割された64個の領域のうち、互いの領域ex(x=1,2,3、・・・、64)における黒色画素の割合同士を乗算する。すなわち、入力特徴ベクトルを構成する64個の成分と、辞書特徴ベクトルVTiを構成する64個の成分について対応する成分の値同士を乗算する。そして、乗算結果の値を図5の64個の領域e1〜e64(64個の成分)について、すべて加算する。この加算結果が類似度を指す。
照合ベクトル抽出部823について図6(A)〜図6(C)を参照し説明する。照合ベクトル抽出部823は、たとえば図6(A)の入力特徴ベクトル100から図6(B)の入力照合ベクトル101を生成して、その後、生成された入力照合ベクトル101に基づき図6(C)の照合ベクトルテーブル925を生成する。生成された照合ベクトルテーブル925は図7の入力照合ベクトル蓄積バッファ825に格納される。
図8(A)と(B)には、辞書照合ベクトル蓄積バッファ813の内容の一例が示される。本実施の形態では、辞書データ811の辞書登録文字CHiのそれぞれについても、対応する辞書特徴ベクトルVTjについて、入力特徴ベクトル100と同様にして入力照合ベクトルテーブル925に相当する辞書照合ベクトルテーブルD1jと入力カウントデータ926に相当する辞書カウントデータD2jが算出されて、算出された両方の値は対応付けされて辞書照合ベクトル蓄積バッファ813に格納される。
次に、照合ベクトル一致度判定部824について説明する。図10(A)〜(H)には、照合ベクトル一致度判定部824の処理手順が模式的に示される。ここでは、図10(A)と(B)の辞書特徴ベクトルVTjと入力特徴ベクトル100のそれぞれから、照合ベクトル抽出部823により、図10(C)と(D)の辞書照合ベクトルテーブルD1jと入力照合ベクトルテーブル101のそれぞれと、図10(F)と(G)の辞書カウントデータD2jと入力カウントデータ926のそれぞれが算出されていると想定する。
閾値作成部826による、入力照合ベクトルの値が‘1’を指す成分の総数を基準にした一致度判定閾値の作成方法と、辞書照合ベクトルの値が‘1’の成分の総数を基準にした一致度判定閾値の作成方法を図11(A)〜(H)に従い説明する。
図14には、パターンマッチング部821の処理手順が示される。
図15は、図14のマッチング部の処理に濃淡判定部822のための処理(S1604、S1609)が加わった場合の処理手順を示す。図15のS1604とS1609を除く他の処理は図14で説明したものと同じであるから、詳細説明を略する。
次に実施の形態2について説明する。
Claims (8)
- 複数の辞書登録文字のそれぞれに対応して、当該辞書登録文字の複数種類のフォントに従う文字パターンのそれぞれの特徴を示す複数の辞書特徴ベクトルからなるベクトル群を格納する辞書特徴ベクトル格納手段と、
前記複数の辞書特徴ベクトルそれぞれに対応して、当該辞書特徴ベクトルから生成された辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、
入力パターンに基づき、当該入力パターンの特徴を示す入力特徴ベクトルを生成する特徴ベクトル生成手段と、
前記入力特徴ベクトルから、入力照合ベクトルを生成する入力照合ベクトル生成手段と、を備え、
前記辞書特徴ベクトル格納手段の前記辞書登録文字それぞれに対応の前記ベクトル群は当該ベクトル群の平均を指す前記辞書特徴ベクトルを予め含み、
前記辞書照合ベクトル格納手段から、前記ベクトル群それぞれの前記平均を指す辞書特徴ベクトルに対応する前記辞書照合ベクトルを読出す辞書照合ベクトル読出手段と、
前記辞書照合ベクトル読出手段によって読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出する照合手段と、
前記照合手段によって算出された対応の一致度が第1の所定閾値より大きい前記辞書登録文字に対応した前記ベクトル群について、当該ベクトル群の前記辞書特徴ベクトルそれぞれと、前記入力特徴ベクトルとの前記内積に基づく類似度を算出する類似度算出手段と、
前記類似度算出手段によって算出された前記類似度の総和に基づき、当該辞書特徴ベクトルに対応の前記辞書登録文字を前記入力パターンの認識結果として出力する手段とを、さらに備え、
前記辞書特徴ベクトルは所定個数の成分からなり、
前記辞書照合ベクトルは、前記辞書特徴ベクトルの各成分の値を第2の所定閾値と比較した場合に大きいならば1を当該成分に割当て、小さいならば0を当該成分に割当てた後の前記所定個数の成分からなり、
前記入力特徴ベクトルは前記所定個数の成分からなり、
前記入力照合ベクトルは、前記入力特徴ベクトルの各成分の値を前記第2の所定閾値と比較した場合に大きいならば1を当該成分に割当て、小さいならば0を当該成分に割当てた後の前記所定個数の成分からなり、
前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの1を指す成分の総数に対する割合を指示する、パターン認識装置。 - 前記第1の所定閾値は、前記辞書照合ベクトル格納手段において前記辞書特徴ベクトル毎に予め格納されている、請求項1に記載のパターン認識装置。
- 前記特徴は画像の濃淡を指示する、請求項1または2に記載のパターン認識装置。
- 前記辞書照合ベクトルは画像の濃淡を指示し、前記成分は濃淡を1と0により指示し、
前記入力照合ベクトルの1を指す成分の総数が予め設定した数値より大きいときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1または2に記載のパターン認識装置。 - 前記辞書照合ベクトルは画像の濃淡を指示し、前記成分は濃淡を1と0により指示し、
前記入力照合ベクトルの1を指す成分の総数が予め設定した数値以下のときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記辞書照合ベクトルの1を指す成分の総数に対する割合を指示する、請求項1、2および4のいずれかに記載のパターン認識装置。 - 複数の辞書登録文字のそれぞれに対応して、当該辞書登録文字の複数種類のフォントに従う文字パターンのそれぞれの特徴を示す複数の辞書特徴ベクトルからなるベクトル群を格納する辞書特徴ベクトル格納部と、前記複数の辞書特徴ベクトルそれぞれに対応して、当該辞書特徴ベクトルから生成された辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備える情報処理装置が実行するパターン認識方法であって、
特徴ベクトル生成手段が、入力パターンに基づき、当該入力パターンの特徴を示す入力特徴ベクトルを生成する特徴ベクトル生成ステップと、
入力照合ベクトル生成手段が、前記入力特徴ベクトルから、入力照合ベクトルを生成する入力照合ベクトル生成ステップと、を備え、
前記辞書特徴ベクトル格納部の前記辞書登録文字それぞれに対応の前記ベクトル群は当該ベクトル群の平均を指す前記辞書特徴ベクトルを予め含み、
辞書照合ベクトル読出手段が、前記辞書照合ベクトル格納手段から、前記ベクトル群それぞれの前記平均を指す辞書特徴ベクトルに対応する前記辞書照合ベクトルを読出す辞書照合ベクトル読出ステップと、
照合手段が、前記辞書照合ベクトル読出手段によって読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出する照合ステップと、
類似度算出手段が、前記照合手段によって算出された対応の一致度が第1の所定閾値より大きい前記辞書登録文字に対応した前記ベクトル群について、当該ベクトル群の前記辞書特徴ベクトルそれぞれと、前記入力特徴ベクトルとの前記内積に基づく類似度を算出する類似度算出ステップと、
出力手段が、前記類似度算出手段によって算出された前記類似度の総和に基づき、当該辞書特徴ベクトルに対応の前記辞書登録文字を前記入力パターンの認識結果として出力するステップとを、さらに備え、
前記辞書特徴ベクトルは所定個数の成分からなり、
前記辞書照合ベクトルは、前記辞書特徴ベクトルの各成分の値を第2の所定閾値と比較した場合に大きいならば1を当該成分に割当て、小さいならば0を当該成分に割当てた後の前記所定個数の成分からなり、
前記入力特徴ベクトルは前記所定個数の成分からなり、
前記入力照合ベクトルは、前記入力特徴ベクトルの各成分の値を前記第2の所定閾値と比較した場合に大きいならば1を当該成分に割当て、小さいならば0を当該成分に割当てた後の前記所定個数の成分からなり、
前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記
入力照合ベクトルの1を指す成分の総数に対する割合を指示する、パターン認識方法。 - 請求項6に記載のパターン認識方法をコンピュータに実行させるためのパターン認識プログラム。
- 請求項6に記載のパターン認識方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006277737A JP4087421B2 (ja) | 2006-10-11 | 2006-10-11 | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
PCT/JP2007/064322 WO2008044380A1 (fr) | 2006-10-11 | 2007-07-20 | Dispositif de reconnaissance de motif pour reconnaître un motif de saisie à l'aide d'un motif de dictionnaire |
EP07791060A EP2073146A4 (en) | 2006-10-11 | 2007-07-20 | PATTERN DETECTION APPARATUS FOR DETECTING AN INPUT PATTERN BY USING A DICTIONARY PATTERN |
CN2007800379798A CN101553825B (zh) | 2006-10-11 | 2007-07-20 | 基于字典模式来识别输入模式的模式识别设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006277737A JP4087421B2 (ja) | 2006-10-11 | 2006-10-11 | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008097275A JP2008097275A (ja) | 2008-04-24 |
JP4087421B2 true JP4087421B2 (ja) | 2008-05-21 |
Family
ID=39282590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006277737A Expired - Fee Related JP4087421B2 (ja) | 2006-10-11 | 2006-10-11 | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2073146A4 (ja) |
JP (1) | JP4087421B2 (ja) |
CN (1) | CN101553825B (ja) |
WO (1) | WO2008044380A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120023134A1 (en) * | 2009-03-27 | 2012-01-26 | Nec Corporation | Pattern matching device, pattern matching method, and pattern matching program |
EP3159806A4 (en) * | 2014-06-19 | 2018-05-02 | Nec Corporation | Information processing device, vector data processing method, and recording medium |
JP6249263B2 (ja) | 2015-09-08 | 2017-12-20 | 日本電気株式会社 | 顔認識システム、顔認識方法、表示制御装置、表示制御方法および表示制御プログラム |
US20170185900A1 (en) * | 2015-12-26 | 2017-06-29 | Intel Corporation | Reconstruction of signals using a Gramian Matrix |
JP6618884B2 (ja) * | 2016-11-17 | 2019-12-11 | 株式会社東芝 | 認識装置、認識方法およびプログラム |
KR101990998B1 (ko) * | 2017-11-17 | 2019-06-20 | (주)위즈데이타 | 폰트 저작권 보호 시스템 및 방법 |
CN112084979B (zh) * | 2020-09-14 | 2023-07-11 | 武汉轻工大学 | 食品成分识别方法、装置、设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4259661A (en) * | 1978-09-01 | 1981-03-31 | Burroughs Corporation | Apparatus and method for recognizing a pattern |
JPH0795336B2 (ja) | 1986-10-28 | 1995-10-11 | 株式会社リコー | 文字認識方式 |
JPH0634256B2 (ja) | 1987-03-04 | 1994-05-02 | シャープ株式会社 | 接触文字切出し方法 |
JPH0281282A (ja) * | 1988-09-19 | 1990-03-22 | Hitachi Ltd | 文字認識方法 |
US5303311A (en) * | 1990-03-12 | 1994-04-12 | International Business Machines Corporation | Method and apparatus for recognizing characters |
US5121441A (en) * | 1990-09-21 | 1992-06-09 | International Business Machines Corporation | Robust prototype establishment in an on-line handwriting recognition system |
JP2938276B2 (ja) * | 1992-06-30 | 1999-08-23 | シャープ株式会社 | 文字認識装置 |
JPH0660226A (ja) * | 1992-08-11 | 1994-03-04 | Nireco Corp | 文字読取装置 |
-
2006
- 2006-10-11 JP JP2006277737A patent/JP4087421B2/ja not_active Expired - Fee Related
-
2007
- 2007-07-20 WO PCT/JP2007/064322 patent/WO2008044380A1/ja active Application Filing
- 2007-07-20 CN CN2007800379798A patent/CN101553825B/zh not_active Expired - Fee Related
- 2007-07-20 EP EP07791060A patent/EP2073146A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2008097275A (ja) | 2008-04-24 |
WO2008044380A1 (fr) | 2008-04-17 |
CN101553825B (zh) | 2012-05-23 |
EP2073146A4 (en) | 2009-10-21 |
CN101553825A (zh) | 2009-10-07 |
EP2073146A1 (en) | 2009-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4087421B2 (ja) | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
EP2553626B1 (en) | Segmentation of textual lines in an image that include western characters and hieroglyphic characters | |
US6052482A (en) | Character recognition apparatus and method | |
US6563949B1 (en) | Character string extraction apparatus and pattern extraction apparatus | |
JP4806101B2 (ja) | 物体検出装置及び物体検出方法 | |
US9025882B2 (en) | Information processing apparatus and method of processing information, storage medium and program | |
JP2008159056A (ja) | 画像中に生じる特徴の生成モデルによる分類 | |
Boiangiu et al. | Voting-based OCR system | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
CN110490199A (zh) | 一种文本识别的方法、装置、存储介质及电子设备 | |
US20020114515A1 (en) | Character string recognition apparatus, character string recognizing method, and storage medium therefor | |
US5621818A (en) | Document recognition apparatus | |
US9092688B2 (en) | Assisted OCR | |
US8472719B2 (en) | Method of stricken-out character recognition in handwritten text | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
JPH11272800A (ja) | 文字認識装置 | |
JP3730073B2 (ja) | テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体 | |
KR101937859B1 (ko) | 360도 이미지에서의 공통 객체 탐색 시스템 및 방법 | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 | |
JP2015225469A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2005149395A (ja) | 文字認識装置、ナンバープレート認識システム | |
JP2007188190A (ja) | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 | |
WO2024189739A1 (ja) | 情報処理装置、情報処理方法、記憶媒体 | |
JP7463675B2 (ja) | 情報処理装置、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4087421 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140228 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |