JP7492404B2 - 情報処理装置、入力データ誤り推定方法及びプログラム - Google Patents
情報処理装置、入力データ誤り推定方法及びプログラム Download PDFInfo
- Publication number
- JP7492404B2 JP7492404B2 JP2020136792A JP2020136792A JP7492404B2 JP 7492404 B2 JP7492404 B2 JP 7492404B2 JP 2020136792 A JP2020136792 A JP 2020136792A JP 2020136792 A JP2020136792 A JP 2020136792A JP 7492404 B2 JP7492404 B2 JP 7492404B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- region
- text data
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 59
- 238000000034 method Methods 0.000 title claims description 47
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 5
- 238000012015 optical character recognition Methods 0.000 description 27
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 16
- 238000012790 confirmation Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000013479 data entry Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 241001494479 Pecora Species 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 235000001630 Pyrus pyrifolia var culta Nutrition 0.000 description 2
- 240000002609 Pyrus pyrifolia var. culta Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
図1は、本実施形態に係るシステムの構成を示す概略図である。本実施形態に係るシステムは、ネットワークに接続されることで互いに通信可能な情報処理装置1及び文書読取装置9を備える。
C(x,y-1)+C_VER,
where i=1 to n:
C(x-i,y-1)
+cost(C(x,y),C(x-i,y-1))) (式1)
C_HOR=B r=1の場合 (式2)
=cand_pos×MATCH_COF×wh×wh (式3)
式1(1行目)を用いることで、当該パスに係る編集コストは、以下の通り算出される。
C(2,2)+C_HOR
式1(2行目)を用いることで、当該パスに係る編集コストは、以下の通り算出される。
C(3,1)+C_VER
式1(3~5行目)及び式3を用いることで、当該パスに係る編集コストは、以下の通り算出される。
C(0,1)+cand_pos×MATCH_COF×wh×wh
この場合、文字領域「群」に係る文字認識候補の第1位が「群」であることにより、例えば、cand_posが0と算出される。
式1(3~5行目)及び式3を用いることで、当該パスに係る編集コストは、以下の通り算出される。
C(1,1)+cand_pos×MATCH_COF×wh×wh
この場合、文字領域「口羊」に係る文字認識候補の第7位が「群」であることにより、例えば、cand_posが6と算出される。また、例えば、文字領域「口羊」の幅高さ比が1未満である場合、whには最小値である1が用いられる。
この場合、文字領域「羊」に係る文字認識候補に、対応する入力データ中の「群」の文字が含まれていないため、式1(3~5行目)及び式4を用いることで、当該パスに係る編集コストが、以下の通り算出される。
C(2,1)+RPL×wh×wh
なお、例えば、文字領域「羊」の幅高さ比が1未満である場合、whには最小値である1が用いられる。また、直前ノードに係るコスト(C(2,1))は、入力データ中の「君」の文字と、「群」の画像の「尹」、「口」部分(文字候補領域32-1~32-2)からなる文字領域「尹口」との間の編集コストであり、例えば、文字領域「尹口」に係る文字認識候補の第1位が「君」であることにより、0として算出される。
次に、本実施形態に係る情報処理装置1によって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の態様に応じて適宜選択されてよい。
本実施形態に係るシステムでは、情報処理装置1における文字認識部22により、文字認識処理が行われることとしたが、これに限定されるものではなく、図1における文書読取装置9により、文字認識処理が行われるようにしても良い。この場合、情報処理装置1は、文字認識部22を備えなくてよい。本バリエーションでは、文書読取装置9は、文書を読み取ることで文書画像を取得し、当該文書画像に対して文字認識処理を行うことで、文書データを生成(取得)する。そして、入力データ取得部23は、文書読取装置9で生成された文書データを取得し、対象となる文字列についての認識結果を取得することで、文字列テキストデータ(入力データ)を取得する。
本実施形態に係るシステムでは、情報処理装置1における文字認識部22により、文字認識処理が行われることとしたが、これに限定されるものではなく、図1における文書読取装置9と情報処理装置1との間に接続された文字認識装置(情報処理装置)8により、文字認識処理が行われるようにしても良い。この場合、情報処理装置1は、文字認識部22を備えなくてよい。
31 文字列画像
32 文字候補領域
33 文字領域
34 文字候補領域列の高さ
36 文字列テキストデータ(入力データ)
Claims (20)
- 文書に記載された1以上の文字からなる文字列に係る画像である文字列画像を取得する文字列画像取得手段と、
前記文書に記載された文字列に係る文字列テキストデータを取得する入力データ取得手段と、
前記文字列画像から切り出された文字領域を、複数パターン生成する文字領域生成手段と、
複数パターンの前記文字領域の夫々と前記文字列テキストデータ中の文字との間の編集コストを、前記文字領域に係る文字認識候補を用いて算出する、編集コスト算出手段と、
算出された前記編集コストに基づいて、前記文字列テキストデータ中の各文字に対応するパターンの前記文字領域を決定し、該文字列テキストデータ中の各文字と前記文字領域とを対応付ける対応付け手段と、
前記対応付け手段による対応付け結果に基づき、前記文字列テキストデータの誤りを推定する誤り推定手段と、
を備える情報処理装置。 - 前記文字列画像から複数の文字候補領域を抽出する文字候補領域抽出手段を更に備え、
前記文字領域生成手段は、1又は隣接する複数の前記文字候補領域からなる文字領域を複数パターン生成する、
請求項1に記載の情報処理装置。 - 前記編集コスト算出手段は、前記編集コストに基づいて、前記文字列テキストデータと前記文字候補領域の並びである文字候補領域列との編集コストである総編集コストを算出し、
前記対応付け手段は、前記編集コストに基づき算出された前記総編集コストが最小となるような、前記文字列テキストデータ中の各文字に対応するパターンの前記文字領域を決定し、該文字列テキストデータ中の各文字と前記文字領域とを対応付ける、
請求項2に記載の情報処理装置。 - 前記編集コスト算出手段は、動的計画法に基づき、前記総編集コストを算出する、
請求項3に記載の情報処理装置。 - 前記文字領域生成手段は、前記文字領域の幅高さ比が所定の値以下になる範囲内で、隣接する複数の前記文字候補領域を結合することで、前記複数の文字候補領域からなる文字領域を生成する、
請求項2から4の何れか一項に記載の情報処理装置。 - 前記幅高さ比は、前記文字候補領域の並びである文字候補領域列全体の高さを用いて算出される、
請求項5に記載の情報処理装置。 - 前記編集コスト算出手段は、前記文字列テキストデータ中の文字が、前記文字領域に係る文字認識候補の何れかと一致する場合、該文字領域と該文字列テキストデータ中の文字との間の前記編集コストが小さくなるよう、該編集コストを算出する、
請求項1から6の何れか一項に記載の情報処理装置。 - 前記編集コスト算出手段は、前記文字列テキストデータの文字が一致する前記文字領域の文字認識候補の優先度が高いほど、該文字領域と該文字列テキストデータ中の文字との間の前記編集コストが小さくなるよう、該編集コストを算出する、
請求項7に記載の情報処理装置。 - 前記編集コスト算出手段は、前記文字領域と前記文字列テキストデータ中の文字との間の前記編集コストを、該文字領域の幅高さ比の最小値を1とした上で、該文字領域の二乗を用いて算出する、
請求項1から8の何れか一項に記載の情報処理装置。 - 前記文字列テキストデータは、前記文書に記載された文字列についての認識結果、又は、ユーザにより前記文書を参照することで入力された、該文書に記載された文字列に係るテキストデータである、
請求項1から9の何れか一項に記載の情報処理装置。 - 前記文字候補領域抽出手段は、前記文字列画像について文字の切れ目となる箇所を検出することで、前記文字候補領域を抽出する、
請求項2から6の何れか一項に記載の情報処理装置。 - 前記文字候補領域抽出手段は、前記文字列画像について、ラベリングによる孤立領域の抽出、黒画素のX軸分布の算出、X軸の線密度分布の算出、または、これら2以上の組み合わせに基づき、前記文字の切れ目となる箇所を検出する、
請求項11に記載の情報処理装置。 - 前記文字候補領域抽出手段は、抽出された前記文字候補領域の数が、前記文字列テキストデータの文字数未満である場合、幅高さ比が所定の値以上である横長の文字候補領域について、更に文字候補領域の切り出しを行う、
請求項2から6、11及び12の何れか一項に記載の情報処理装置。 - 前記文字候補領域抽出手段は、抽出された前記文字候補領域の数が、前記文字列テキストデータの文字数未満である場合、抽出された複数の該文字候補領域のうち、幅高さ比が最も大きい該文字候補領域を選択し、選択された該文字候補領域について、更に文字候補領域の切り出しを行う処理を、該文字候補領域の数が、前記文字列テキストデータの文字数になるまで繰り返し実行する、
請求項2から6、11及び12の何れか一項に記載の情報処理装置。 - 前記誤り推定手段は、前記対応付け手段による対応付け結果において、前記文字列テキストデータ中の文字と、該文字と対応する前記文字領域に係る文字認識候補とが不一致であること、該文字列テキストデータに、該文字領域に対応付かない文字があること、または、該文字列テキストデータに対応付かない前記文字領域があることを検出することにより、該文字列テキストデータの誤りを推定する、
請求項1から14の何れか一項に記載の情報処理装置。 - 前記誤り推定手段は、任意に設定された候補順位までの文字認識候補について、前記文字列テキストデータ中の文字と、該文字と対応する前記文字領域に係る文字認識候補とが不一致であることを検出する、
請求項15に記載の情報処理装置。 - 前記文字列テキストデータの誤りが推定されたことの表示を行う表示手段を更に備える、
請求項1から16の何れか一項に記載の情報処理装置。 - 前記文字列テキストデータにおいて、誤りが推定された箇所を修正する修正手段を更に備える、
請求項1に記載の情報処理装置。 - コンピュータが、
文書に記載された1以上の文字からなる文字列に係る画像である文字列画像を取得する文字列画像取得ステップと、
前記文書に記載された文字列に係る文字列テキストデータを取得する入力データ取得ステップと、
前記文字列画像から切り出された文字領域を、複数パターン生成する文字領域生成ステップと、
複数パターンの前記文字領域の夫々と前記文字列テキストデータ中の文字との間の編集コストを、前記文字領域に係る文字認識候補を用いて算出する、編集コスト算出ステップと、
算出された前記編集コストに基づいて、前記文字列テキストデータ中の各文字に対応するパターンの前記文字領域を決定し、該文字列テキストデータ中の各文字と前記文字領域とを対応付ける対応付けステップと、
前記対応付け手段による対応付け結果に基づき、前記文字列テキストデータの誤りを推定する誤り推定ステップと、
を実行する方法。 - コンピュータを、
文書に記載された1以上の文字からなる文字列に係る画像である文字列画像を取得する文字列画像取得手段と、
前記文書に記載された文字列に係る文字列テキストデータを取得する入力データ取得手段と、
前記文字列画像から切り出された文字領域を、複数パターン生成する文字領域生成手段と、
複数パターンの前記文字領域の夫々と前記文字列テキストデータ中の文字との間の編集コストを、前記文字領域に係る文字認識候補を用いて算出する、編集コスト算出手段と、
算出された前記編集コストに基づいて、前記文字列テキストデータ中の各文字に対応するパターンの前記文字領域を決定し、該文字列テキストデータ中の各文字と前記文字領域とを対応付ける対応付け手段と、
前記対応付け手段による対応付け結果に基づき、前記文字列テキストデータの誤りを推定する誤り推定手段と、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020136792A JP7492404B2 (ja) | 2020-08-13 | 2020-08-13 | 情報処理装置、入力データ誤り推定方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020136792A JP7492404B2 (ja) | 2020-08-13 | 2020-08-13 | 情報処理装置、入力データ誤り推定方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022032713A JP2022032713A (ja) | 2022-02-25 |
JP7492404B2 true JP7492404B2 (ja) | 2024-05-29 |
Family
ID=80350269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020136792A Active JP7492404B2 (ja) | 2020-08-13 | 2020-08-13 | 情報処理装置、入力データ誤り推定方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7492404B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001285716A (ja) | 2000-01-24 | 2001-10-12 | Toshiba Corp | テロップ情報処理装置及びテロップ情報表示装置 |
JP2002366899A (ja) | 2001-06-06 | 2002-12-20 | Toppan Printing Co Ltd | 文字情報認識方法および文字情報認識装置 |
-
2020
- 2020-08-13 JP JP2020136792A patent/JP7492404B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001285716A (ja) | 2000-01-24 | 2001-10-12 | Toshiba Corp | テロップ情報処理装置及びテロップ情報表示装置 |
JP2002366899A (ja) | 2001-06-06 | 2002-12-20 | Toppan Printing Co Ltd | 文字情報認識方法および文字情報認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2022032713A (ja) | 2022-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR100570224B1 (ko) | 전표정의데이터 작성방법 및 전표처리장치 | |
US20150262030A1 (en) | Image processing device, image processing method, and image processing program | |
JP7387363B2 (ja) | データ入力支援装置、データ入力支援方法及びプログラム | |
EP3757881A1 (en) | Documentation determination device and documentation determination program | |
US20170132462A1 (en) | Document checking support apparatus, document checking support system, and non-transitory computer readable medium | |
JP5538812B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2012190434A (ja) | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
US6968501B2 (en) | Document format identification apparatus and method | |
JP7492404B2 (ja) | 情報処理装置、入力データ誤り推定方法及びプログラム | |
US7111255B2 (en) | Time-based evaluation of data verification results | |
JP6680052B2 (ja) | 表データ変換方法、プログラム、画像読取装置 | |
JP7241506B2 (ja) | 光学式文字認識結果の修正支援装置および修正支援用プログラム | |
US10706337B2 (en) | Character recognition device, character recognition method, and recording medium | |
US20220292857A1 (en) | Information processing apparatus, information processing method, and recording medium | |
US20220207900A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP7206740B2 (ja) | 情報処理装置及びプログラム | |
US20170249299A1 (en) | Non-transitory computer readable medium and information processing apparatus and method | |
JP2020047138A (ja) | 情報処理装置 | |
JP2021152696A (ja) | 情報処理装置及びプログラム | |
JP2010102734A (ja) | 画像処理装置及びプログラム | |
CN112347831A (zh) | 信息处理装置以及表识别方法 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240501 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7492404 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |