JP2008226030A - 単語認識方法および単語認識プログラム - Google Patents
単語認識方法および単語認識プログラム Download PDFInfo
- Publication number
- JP2008226030A JP2008226030A JP2007065522A JP2007065522A JP2008226030A JP 2008226030 A JP2008226030 A JP 2008226030A JP 2007065522 A JP2007065522 A JP 2007065522A JP 2007065522 A JP2007065522 A JP 2007065522A JP 2008226030 A JP2008226030 A JP 2008226030A
- Authority
- JP
- Japan
- Prior art keywords
- word
- matching
- character
- score
- quality score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
【解決手段】被読取物上に記載された文字情報の文字読取を行って得られる各単語候補に対する認識処理を行う単語認識方法において、上記各単語候補に対し、単語辞書内の複数の単語との照合を行い、双方が一致する度合いを示すマッチングスコアを単語毎に算出する単語マッチング処理(12)を行い、上記各単語候補を構成する文字候補が任意の文字に一致する度合いを示す文字品質スコアを算出する文字品質スコア算出処理(13)を行い、上記文字品質スコア算出処理で得られる文字品質スコアを元に上記マッチング処理で得られるマッチングスコアを補正する処理(14)を行う。
【選択図】 図6
Description
Claims (5)
- 被読取物上に記載された文字情報の文字読取を行って得られる各単語候補に対する認識処理を行う単語認識方法であって、
上記各単語候補に対し、単語辞書内の複数の単語との照合を行い、双方が一致する度合いを示すマッチングスコアを単語毎に算出するマッチング処理ステップと、
上記各単語候補を構成する文字候補が任意の文字に一致する度合いを示す文字品質スコアを算出する文字品質スコア算出ステップと、
上記文字品質スコア算出ステップで得られる文字品質スコアを元に上記マッチング処理ステップで得られるマッチングスコアを補正する補正ステップと、
を具備したことを特徴とする単語認識方法。 - 前記補正ステップは、上記マッチング処理ステップで得られるマッチングスコアから、上記文字品質スコア算出ステップで得られる文字品質スコアを差し引く処理を行うことを特徴とする請求項1記載の単語認識方法。
- 前記任意の文字は、アルファベットのうちのいずれかの文字であることを特徴とする請求項1記載の単語認識方法。
- 前記補正ステップにより補正された各マッチングスコアのうち、最も高いマッチングスコアの単語を認識結果として出力する出力ステップを更に具備したことを特徴とする請求項1記載の単語認識方法。
- コンピュータに、被読取物上に記載された文字情報の文字読取を行って得られる単語候補に対する認識処理を行わせる単語認識プログラムであって、
上記各単語候補に対し、単語辞書内の複数の単語との照合を行い、双方が一致する度合いを示すマッチングスコアを単語毎に算出するマッチング処理ステップと、
上記各単語候補を構成する文字候補が任意の文字に一致する度合いを示す文字品質スコアを算出する文字品質スコア算出ステップと、
上記文字品質スコア算出ステップで得られる文字品質スコアを元に上記マッチング処理ステップで得られるマッチングスコアを補正する補正ステップと、
を有することを特徴とする単語認識プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007065522A JP4672692B2 (ja) | 2007-03-14 | 2007-03-14 | 単語認識システムおよび単語認識プログラム |
EP08712055.6A EP2138959B1 (en) | 2007-03-14 | 2008-02-27 | Word recognizing method and word recognizing program |
KR1020087020028A KR101016544B1 (ko) | 2007-03-14 | 2008-02-27 | 단어 인식 방법 및 기록 매체 |
PCT/JP2008/053433 WO2008111399A1 (ja) | 2007-03-14 | 2008-02-27 | 単語認識方法および単語認識プログラム |
US12/184,456 US8208685B2 (en) | 2007-03-14 | 2008-08-01 | Word recognition method and word recognition program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007065522A JP4672692B2 (ja) | 2007-03-14 | 2007-03-14 | 単語認識システムおよび単語認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008226030A true JP2008226030A (ja) | 2008-09-25 |
JP4672692B2 JP4672692B2 (ja) | 2011-04-20 |
Family
ID=39759341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007065522A Expired - Fee Related JP4672692B2 (ja) | 2007-03-14 | 2007-03-14 | 単語認識システムおよび単語認識プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8208685B2 (ja) |
EP (1) | EP2138959B1 (ja) |
JP (1) | JP4672692B2 (ja) |
KR (1) | KR101016544B1 (ja) |
WO (1) | WO2008111399A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090208112A1 (en) * | 2008-02-20 | 2009-08-20 | Kabushiki Kaisha Toshiba | Pattern recognition method, and storage medium which stores pattern recognition program |
US8676001B2 (en) | 2008-05-12 | 2014-03-18 | Google Inc. | Automatic discovery of popular landmarks |
US8396287B2 (en) | 2009-05-15 | 2013-03-12 | Google Inc. | Landmarks from digital photo collections |
US9183224B2 (en) * | 2009-12-02 | 2015-11-10 | Google Inc. | Identifying matching canonical documents in response to a visual query |
US9984131B2 (en) | 2015-09-17 | 2018-05-29 | International Business Machines Corporation | Comparison of anonymized data |
JP2018088116A (ja) * | 2016-11-29 | 2018-06-07 | キヤノン株式会社 | 情報処理装置、プログラム、情報処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05205109A (ja) * | 1992-01-30 | 1993-08-13 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH06111079A (ja) * | 1992-09-30 | 1994-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 単語読み取り装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0684006A (ja) * | 1992-04-09 | 1994-03-25 | Internatl Business Mach Corp <Ibm> | オンライン手書き文字認識方法 |
JP3375766B2 (ja) * | 1994-12-27 | 2003-02-10 | 松下電器産業株式会社 | 文字認識装置 |
US5963666A (en) * | 1995-08-18 | 1999-10-05 | International Business Machines Corporation | Confusion matrix mediated word prediction |
JP2000353215A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
JP4601835B2 (ja) | 2000-01-28 | 2010-12-22 | 株式会社東芝 | 単語認識方法および単語認識プログラムおよび単語認識装置 |
US6847734B2 (en) | 2000-01-28 | 2005-01-25 | Kabushiki Kaisha Toshiba | Word recognition method and storage medium that stores word recognition program |
JP4744317B2 (ja) * | 2006-02-16 | 2011-08-10 | 富士通株式会社 | 単語検索装置、単語検索方法、及びコンピュータプログラム |
JP4686433B2 (ja) | 2006-10-13 | 2011-05-25 | 株式会社東芝 | 単語認識方法および単語認識装置 |
-
2007
- 2007-03-14 JP JP2007065522A patent/JP4672692B2/ja not_active Expired - Fee Related
-
2008
- 2008-02-27 KR KR1020087020028A patent/KR101016544B1/ko not_active IP Right Cessation
- 2008-02-27 EP EP08712055.6A patent/EP2138959B1/en not_active Expired - Fee Related
- 2008-02-27 WO PCT/JP2008/053433 patent/WO2008111399A1/ja active Application Filing
- 2008-08-01 US US12/184,456 patent/US8208685B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05205109A (ja) * | 1992-01-30 | 1993-08-13 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH06111079A (ja) * | 1992-09-30 | 1994-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 単語読み取り装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2138959A4 (en) | 2013-09-11 |
WO2008111399A1 (ja) | 2008-09-18 |
EP2138959B1 (en) | 2016-09-28 |
EP2138959A1 (en) | 2009-12-30 |
US20080292186A1 (en) | 2008-11-27 |
JP4672692B2 (ja) | 2011-04-20 |
US8208685B2 (en) | 2012-06-26 |
KR20090088304A (ko) | 2009-08-19 |
KR101016544B1 (ko) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI321294B (en) | Method and device for determining at least one recognition candidate for a handwritten pattern | |
US9613299B2 (en) | Method of identifying pattern training need during verification of recognized text | |
JP4672692B2 (ja) | 単語認識システムおよび単語認識プログラム | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
JP2014526760A (ja) | 文字認識のため機械植字をトレーニングする方法及びシステム | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
JP2015138496A (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP4686433B2 (ja) | 単語認識方法および単語認識装置 | |
JP2018147178A (ja) | コンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラム | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
CN114677689B (zh) | 一种文字图像识别纠错方法和电子设备 | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP3730073B2 (ja) | テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体 | |
JP6759955B2 (ja) | 地名抽出プログラム、地名抽出装置および地名抽出方法 | |
JP6511942B2 (ja) | 情報処理装置および情報処理プログラム | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム | |
JPH11213087A (ja) | 文字認識装置 | |
JP6260350B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5669044B2 (ja) | 文書検定システム及び文書検定方法 | |
JP6170831B2 (ja) | 文字認識装置、方法、及びプログラム | |
JP4209511B2 (ja) | 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2006235817A (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP2009129392A (ja) | 文字認識装置、文字認識方法、および、文字認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110119 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4672692 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140128 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |