JPWO2017104805A1 - プログラム、情報記憶媒体及び文字列認識装置 - Google Patents
プログラム、情報記憶媒体及び文字列認識装置 Download PDFInfo
- Publication number
- JPWO2017104805A1 JPWO2017104805A1 JP2017556464A JP2017556464A JPWO2017104805A1 JP WO2017104805 A1 JPWO2017104805 A1 JP WO2017104805A1 JP 2017556464 A JP2017556464 A JP 2017556464A JP 2017556464 A JP2017556464 A JP 2017556464A JP WO2017104805 A1 JPWO2017104805 A1 JP WO2017104805A1
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- score
- candidate
- candidates
- recognition process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 308
- 230000008569 process Effects 0.000 claims abstract description 278
- 238000012545 processing Methods 0.000 claims description 45
- 230000006870 function Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 31
- 238000000605 extraction Methods 0.000 description 26
- 238000011156 evaluation Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 201000002661 Spondylitis Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
図1に本実施形態の文字列認識装置の機能ブロック図の一例を示す。なお本実施形態の認識装置は図1の構成要素(各部)の一部を省略した構成としてもよい。
次に本実施形態の手法について図面を用いて説明する。
まず、英単語を認識する場合を例にとって説明する。英単語を認識する場合、前処理を行った後、単語照合による認識と、単語照合によらない認識を行う。
次に、日本語を認識する場合を例にとって説明する。日本語を認識する場合、特定語句との照合による認識(第1認識処理)と、特定語句との照合によらない認識(第2認識処理)を行う。日本語を認識する場合は、英単語を認識する場合と異なり、特徴点の抽出と非線形正規化を文字ごとに行う。また、文字の切り出しは、オフストロークとその前後のストロークの情報に基づいて行う。
図8は、処理部100の処理の流れの第1の例を示す図である。まず、処理部100は、文字入力部160で入力された文字パターン(入力パターン)を取得する(ステップS10)。次に、認識部110は、記憶部170に記憶された語句(単語リスト、或いは特定語句のリスト)との照合による第1認識処理を行って上位複数の認識候補を生成し(ステップS12)、記憶部170に記憶された語句との照合によらず文脈の確からしさを評価する第2認識処理を行って上位複数の認識候補を生成する(ステップS14)。
Sc(m)’=WcSc(m)
なお、Wd+Wc=1とし、重みWd、Wcは予め学習データにより学習しておく。
なお、Wd+Wc+W0=1とし、重みWd、Wc、W0は予め学習データにより学習しておく。
なお、Wd+Wc+W0+Ws=1とし、重みWd、Wc、W0、Wsは予め学習データにより学習しておく。
3−1.英単語認識の実験
本実施形態の手法を評価するために、英単語を認識する実験を行った。オンライン手書き英語データベースIAM−OnDBの学習データ(5,364文字列)を利用して、英単語辞書(MRF認識辞書、P2DMN−MQDF認識辞書、文字サイズ評価辞書、文字構造評価辞書及び文字間重なり評価辞書)を学習した。IAM−OnDBのテストデータ(3,859文字、5562単語)から単語のトライ辞書を作成した。英単語辞書に含まれる10種類の単語を3パターンずつ正しく筆記した30個の手書き単語パターン(正答単語パターン)を作成した。また、これら10種類の単語を3パターンずつ、故意に一部の文字(1文字又は2文字)を間違えて筆記した30個の手書き単語パターン(誤答単語パターン)を作成した。この2つのデータセットを用いて評価を行った。
本実施形態の手法を評価するために、日本語の語句を認識する実験を行った。朝日新聞記事データベースCD−HIASKと青空文庫を利用して、文脈処理辞書を学習した。5種類の語句を10パターンずつ正しく筆記した50個の手書き語句パターン(正答語句パターン)を作成した。また、これら5種類の語句を10パターンずつ、故意に一部の文字(1文字又は2文字)を間違えて筆記した50個の手書き語句パターン(誤答語句パターン)を作成した。この2つのデータセットを用いて評価を行った。
なお、Wc+W0+Ws0=1とし、重みWc(第2の重み)、W0(第3の重み)、Ws0は予め学習データにより学習しておく。表8の実験では、重みWcは0.3209であり、重みW0は0.3412であり、重みWs0は0.3379である。
Claims (7)
- 手書き入力された文字パターンに対して文字認識を行って複数の認識候補を生成し、各認識候補の確からしさを示すスコアを出力する認識部と、
各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択する選択部と、
選択された認識候補が正答であるか誤答であるかを判定する判定部としてコンピュータを機能させ、
前記認識部は、
記憶部に記憶された語句との照合によって認識字種を限定して認識候補を生成し、スコアを出力する第1認識処理と、前記語句との照合による認識字種の限定を行わず且つ文脈の確からしさを評価して認識候補を生成し、スコアを出力する第2認識処理と、前記語句との照合による認識字種の限定を行わず且つ文脈の確からしさを評価せずに認識候補を生成し、スコアを出力する第3認識処理と、前記第2認識処理で生成された認識候補から正答を検索し、正答と一致する認識候補がある場合には当該認識候補のスコアを出力し、正答と一致する認識候補がない場合には認識候補のスコアとして所定の最小スコアを出力する第4認識処理と、前記第3認識処理で生成された認識候補から正答を検索し、正答と一致する認識候補がある場合には当該認識候補のスコアを出力し、正答と一致する認識候補がない場合には認識候補のスコアとして所定の最小スコアを出力する第5認識処理のうち、少なくとも2つの認識処理を実行し、
前記選択部は、
前記少なくとも2つの認識処理で生成された各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択することを特徴とするプログラム。 - 請求項1において、
前記認識部は、
前記第3認識処理を含む前記少なくとも2つの認識処理を実行し、
前記選択部は、
前記第3認識処理を含む前記少なくとも2つの認識処理で生成された各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択することを特徴とするプログラム。 - 請求項1又は2において、
前記認識部は、
前記第2認識処理と前記第3認識処理と前記第4認識処理とを実行し、
前記選択部は、
前記第2認識処理、前記第3認識処理及び前記第4認識処理で生成された各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択することを特徴とするプログラム。 - 請求項1乃至3のいずれか1項において、
前記選択部は、
前記第1認識処理で生成された各認識候補のスコアを第1の重みにより調整し、前記第2認識処理で生成された各認識候補のスコアを第2の重みにより調整し、前記第3認識処理で生成された各認識候補のスコアを第3の重みにより調整し、前記第4認識処理での認識候補のスコアを第4の重みにより調整し、前記第5認識処理での認識候補のスコアを第5の重みにより調整し、複数の認識候補から、調整後のスコアの最も高い認識候補を選択することを特徴とするプログラム。 - 請求項1乃至4のいずれか1項において、
前記判定部は、
第1位の認識候補のスコアと第2位の認識候補のスコアとの差が所定の閾値よりも低い場合に、前記第3認識処理で生成された認識候補の中に正答と一致する認識候補があれば正答と判定し、前記第4認識処理で生成された認識候補の中に正答と一致する認識候補がなければ誤答と判定し、前記第3認識処理で生成された認識候補の中に正答と一致する認識候補がなく且つ前記第4認識処理で生成された認識候補の中に正答と一致する認識候補があれば判定を行わないことを特徴とするプログラム。 - コンピュータ読み取り可能な情報記憶媒体であって、請求項1乃至5のいずれか1項のプログラムを記憶したことを特徴とする情報記憶媒体。
- 手書き入力された文字パターンに対して文字認識を行って複数の認識候補を生成し、各認識候補の確からしさを示すスコアを出力する認識部と、
各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択する選択部と、
選択された認識候補が正答であるか誤答であるかを判定する判定部とを含み、
前記認識部は、
記憶部に記憶された語句との照合によって認識字種を限定して認識候補を生成し、スコアを出力する第1認識処理と、前記語句との照合による認識字種の限定を行わず且つ文脈の確からしさを評価して認識候補を生成し、スコアを出力する第2認識処理と、前記語句との照合による認識字種の限定を行わず且つ文脈の確からしさを評価せずに認識候補を生成し、スコアを出力する第3認識処理と、前記第2認識処理で生成された認識候補から正答を検索し、正答と一致する認識候補がある場合には当該認識候補のスコアを出力し、正答と一致する認識候補がない場合には認識候補のスコアとして所定の最小スコアを出力する第4認識処理と、前記第3認識処理で生成された認識候補から正答を検索し、正答と一致する認識候補がある場合には当該認識候補のスコアを出力し、正答と一致する認識候補がない場合には認識候補のスコアとして所定の最小スコアを出力する第5認識処理のうち、少なくとも2つの認識処理を実行し、
前記選択部は、
前記少なくとも2つの認識処理で生成された各認識候補のスコアに基づいて、複数の認識候補から1つの認識候補を選択することを特徴とする文字列認識装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015247379 | 2015-12-18 | ||
JP2015247379 | 2015-12-18 | ||
PCT/JP2016/087558 WO2017104805A1 (ja) | 2015-12-18 | 2016-12-16 | プログラム、情報記憶媒体及び文字列認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017104805A1 true JPWO2017104805A1 (ja) | 2018-10-04 |
JP6847421B2 JP6847421B2 (ja) | 2021-03-24 |
Family
ID=59056668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017556464A Active JP6847421B2 (ja) | 2015-12-18 | 2016-12-16 | プログラム、情報記憶媒体及び文字列認識装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6847421B2 (ja) |
WO (1) | WO2017104805A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408796B (zh) * | 2017-08-17 | 2022-11-01 | 北京搜狗科技发展有限公司 | 一种信息处理方法、装置及电子设备 |
JP6984447B2 (ja) * | 2018-01-30 | 2021-12-22 | 富士通株式会社 | 画像処理プログラム、画像処理方法および画像処理装置 |
CN109062888B (zh) * | 2018-06-04 | 2023-03-31 | 昆明理工大学 | 一种出现错误文本输入时的自纠正方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09223188A (ja) * | 1996-02-19 | 1997-08-26 | Fujitsu Ltd | 文字認識装置 |
JPH10187884A (ja) * | 1996-12-27 | 1998-07-21 | Brother Ind Ltd | 文字認識装置および記録媒体 |
JP2000306045A (ja) * | 1999-04-21 | 2000-11-02 | Fujitsu Ltd | 単語認識装置 |
JP2009129253A (ja) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | パターン認識装置、パターン認識プログラム及びパターン認識方法 |
JP2009288813A (ja) * | 2009-09-10 | 2009-12-10 | Nintendo Co Ltd | 手書き学習支援プログラムおよび手書き学習支援装置 |
JP2011081024A (ja) * | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報共有システム |
-
2016
- 2016-12-16 WO PCT/JP2016/087558 patent/WO2017104805A1/ja active Application Filing
- 2016-12-16 JP JP2017556464A patent/JP6847421B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09223188A (ja) * | 1996-02-19 | 1997-08-26 | Fujitsu Ltd | 文字認識装置 |
JPH10187884A (ja) * | 1996-12-27 | 1998-07-21 | Brother Ind Ltd | 文字認識装置および記録媒体 |
JP2000306045A (ja) * | 1999-04-21 | 2000-11-02 | Fujitsu Ltd | 単語認識装置 |
JP2009129253A (ja) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | パターン認識装置、パターン認識プログラム及びパターン認識方法 |
JP2009288813A (ja) * | 2009-09-10 | 2009-12-10 | Nintendo Co Ltd | 手書き学習支援プログラムおよび手書き学習支援装置 |
JP2011081024A (ja) * | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報共有システム |
Also Published As
Publication number | Publication date |
---|---|
JP6847421B2 (ja) | 2021-03-24 |
WO2017104805A1 (ja) | 2017-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6792408B2 (en) | Interactive command recognition enhancement system and method | |
JP7120751B2 (ja) | 単語正規化方法、単語正規化装置及び機械翻訳方法、機械翻訳装置 | |
US20080294982A1 (en) | Providing relevant text auto-completions | |
CN113435186B (zh) | 中文文本纠错系统、方法、装置及计算机可读存储介质 | |
US9575937B2 (en) | Document analysis system, document analysis method, document analysis program and recording medium | |
CN111737968A (zh) | 一种作文自动批改及评分的方法及终端 | |
CN111460083A (zh) | 文档标题树的构建方法、装置、电子设备及存储介质 | |
US10811003B2 (en) | Language phonetic processing based on fine-grained mapping of phonetic components | |
US20160140389A1 (en) | Information extraction supporting apparatus and method | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
KR101729461B1 (ko) | 자연 언어 처리 시스템, 자연 언어 처리 방법, 및 자연 언어 처리 프로그램 | |
Wemhoener et al. | Creating an improved version using noisy OCR from multiple editions | |
WO2017104805A1 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
Khirbat | OCR post-processing text correction using simulated annealing (OPTeCA) | |
Li et al. | Dimsim: An accurate chinese phonetic similarity algorithm based on learned high dimensional encoding | |
US20150169971A1 (en) | Character recognition using search results | |
Fusayasu et al. | Word-error correction of continuous speech recognition based on normalized relevance distance | |
US8208685B2 (en) | Word recognition method and word recognition program | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
JPH11328317A (ja) | 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体 | |
Liang et al. | Simple gesture-based error correction interface for smartphone speech recognition. | |
JP5252596B2 (ja) | 文字認識装置、文字認識方法及びプログラム | |
KR102468975B1 (ko) | 인공지능 기반의 판례 인식의 정확도 향상 방법 및 장치 | |
Pham et al. | Candidate word generation for OCR errors using optimization algorithm | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6847421 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |