JP7279382B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP7279382B2 JP7279382B2 JP2019016252A JP2019016252A JP7279382B2 JP 7279382 B2 JP7279382 B2 JP 7279382B2 JP 2019016252 A JP2019016252 A JP 2019016252A JP 2019016252 A JP2019016252 A JP 2019016252A JP 7279382 B2 JP7279382 B2 JP 7279382B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- unit
- candidates
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
また、誤認識文字列候補としては、再認識処理により認識された文字列も含めて、“FX10AA10G”、“FX1OAA10G”、“FX1oAA0G”、“FX10AA1OG”、“FX10AA1oG”等が生成された。
2 スキャナ部
3 画像形成部
4 操作部
5 表示部
6 通信部
7 記憶部
10 情報処理装置
20 OCR処理部
22 取得部
24 抽出部
26 修正部
28 出力部
30 再認識処理部
31 必要文字列抽出部
32 生成部
40 情報処理プログラム
42 正規表現情報
44 誤認識文字情報
46 誤認識パターン情報
50 画像
Claims (11)
- 文字認識処理によって画像から認識された文字列を取得する取得部と、
前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、
前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、
前記正規表現を用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、
を備え、
前記取得部は前記画像を取得し、
前記修正部は、特定の文字について学習された学習モデルを用いて、前記抽出部により抽出された前記文字列候補の前記画像についてのみ文字認識処理を再度行う文字認識処理部と、
前記文字認識処理部により認識された文字列候補と同型の文字列候補である誤認識文字列候補を生成する生成部と、
を含み、
前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する
情報処理装置。 - 前記抽出部は、前記誤認識パターンを用いて前記正規表現を修正した修正正規表現で表された修正抽出パターンを用いて前記文字列候補を抽出する
請求項1記載の情報処理装置。 - 前記生成部は、ユーザーによって指定された誤認識パターンを用いて生成した文字列を前記誤認識文字列候補に追加する
請求項1又は請求項2記載の情報処理装置。 - 前記生成部は、前記抽出パターンで表される文字列候補を除いて前記誤認識文字列候補を生成する
請求項1~3の何れか1項に記載の情報処理装置。 - 前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値以上の場合に、前記特定した文字列候補を出力する
請求項1~4の何れか1項に記載の情報処理装置。 - 前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値未満の場合に、前記特定した文字列候補を推定文字列候補として出力する
請求項1~4の何れか1項に記載の情報処理装置。 - 前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値以上で且つ前記特定した文字列候補が複数の場合に、複数の前記特定した文字列候補を推定文字列候補として出力する
請求項1~4の何れか1項に記載の情報処理装置。 - 文字認識処理によって画像から認識された文字列を取得する取得部と、
前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、
前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、
前記正規表現を用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、
を備え、
前記取得部は前記画像を取得し、
前記修正部は、特定の文字について学習された学習モデルを用いて、前記抽出部により抽出された前記文字列候補の前記画像についてのみ文字認識処理を再度行う文字認識処理部と、
前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部と、
前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する生成部と、
を含み、
前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する
前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部を更に備え、
前記生成部は、前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する
情報処理装置。 - 前記出力部は、前記正規表現で表される文字列に前記修正部で修正された文字列候補が存在しない場合、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補に近い文字列を推定文字列候補として出力する
請求項1~4の何れか1項に記載の情報処理装置。 - 前記出力部は、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補と異なる文字の数が最も少ない文字列を推定文字列候補として出力する
請求項9記載の情報処理装置。 - コンピュータを、請求項1~10の何れか1項に記載の情報処理装置の各部として機能させるための情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019016252A JP7279382B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019016252A JP7279382B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020123273A JP2020123273A (ja) | 2020-08-13 |
JP7279382B2 true JP7279382B2 (ja) | 2023-05-23 |
Family
ID=71992810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019016252A Active JP7279382B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7279382B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353215A (ja) | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
JP2017199288A (ja) | 2016-04-28 | 2017-11-02 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2586372B2 (ja) * | 1993-01-22 | 1997-02-26 | 日本電気株式会社 | 情報検索装置及び情報検索方法 |
JP2780654B2 (ja) * | 1994-12-20 | 1998-07-30 | 日本電気株式会社 | 住所読み取り装置 |
JPH09138836A (ja) * | 1995-11-13 | 1997-05-27 | N T T Data Tsushin Kk | 文字認識結果の修正方式 |
-
2019
- 2019-01-31 JP JP2019016252A patent/JP7279382B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353215A (ja) | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
JP2017199288A (ja) | 2016-04-28 | 2017-11-02 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020123273A (ja) | 2020-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5372110B2 (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
JP7149721B2 (ja) | 情報処理装置、文字認識エンジン最適化方法及びプログラム | |
CN109214381B (zh) | 数控程序转换装置 | |
US20060204094A1 (en) | Translation device, translation program, and translation method | |
JP2019169025A (ja) | 情報処理装置、文字認識エンジン選択方法及びプログラム | |
EP3147818A1 (en) | Image processing apparatus, image processing method and program | |
JP7279382B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP7279381B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
US10706337B2 (en) | Character recognition device, character recognition method, and recording medium | |
JP2020184275A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US9009026B2 (en) | Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method | |
JP7115162B2 (ja) | 電子機器、画像形成装置、電子メール作成支援方法、及び電子メール作成支援プログラム | |
Mohapatra et al. | Spell checker for OCR | |
US11972208B2 (en) | Information processing device and information processing method | |
JP2008257543A (ja) | 画像処理システム及びプログラム | |
US20150043832A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2022137634A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20140169676A1 (en) | Information processing apparatus, information processing method, and computer-readable medium | |
JP6046088B2 (ja) | 画像処理装置及び画像処理方法 | |
US20160292499A1 (en) | Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JP7463675B2 (ja) | 情報処理装置、及び情報処理プログラム | |
EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7279382 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |