JP7401202B2 - 画像処理装置、その制御方法、及びプログラム - Google Patents
画像処理装置、その制御方法、及びプログラム Download PDFInfo
- Publication number
- JP7401202B2 JP7401202B2 JP2019112063A JP2019112063A JP7401202B2 JP 7401202 B2 JP7401202 B2 JP 7401202B2 JP 2019112063 A JP2019112063 A JP 2019112063A JP 2019112063 A JP2019112063 A JP 2019112063A JP 7401202 B2 JP7401202 B2 JP 7401202B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- string
- recognition result
- characters
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 63
- 238000000034 method Methods 0.000 title claims description 34
- 238000000605 extraction Methods 0.000 claims description 70
- 230000014509 gene expression Effects 0.000 claims description 46
- 239000000284 extract Substances 0.000 claims description 12
- 238000006467 substitution reaction Methods 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
106 CPU
301 スキャン画像
501~504、801~803 文字列情報
602、606、903 優先文字情報
603、607 優先単語情報
701、901 変換テーブル
Claims (10)
- 画像を文字認識して得られた文字認識結果の文字列から日付文字列を抽出する画像処理装置であって、
前記文字認識結果の文字列において、日付における月の名称を表す英単語を構成する文字、または、日付における月の略称を表す英単語を構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換手段と、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、日付文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換手段と、
前記特定の文字コードと前記限定文字種とを用いて前記日付文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換手段および前記第2の置換手段で置換した後の文字列から、前記日付文字列を抽出する抽出手段とを備えることを特徴とする画像処理装置。 - 前記日付文字列に含まれることが想定される限定文字種とは、「0」、「1」、「2」、「3」、「4」、「5」、「6」、「7」、「8」、「9」、「/」、「-」、「.」、「年」、「月」、「日」であることを特徴とする請求項1に記載の画像処理装置。
- 画像を文字認識して得られた文字認識結果の文字列から金額文字列を抽出する画像処理装置であって、
前記文字認識結果の文字列において、通貨コードを構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換手段と、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、金額文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換手段と、
前記特定の文字コードと前記限定文字種とを用いて前記金額文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換手段および前記第2の置換手段で置換した後の文字列から、前記金額文字列を抽出する抽出手段とを備えることを特徴とする画像処理装置。 - 前記金額文字列に含まれることが想定される限定文字種とは、「0」、「1」、「2」、「3」、「4」、「5」、「6」、「7」、「8」、「9」、「¥」、「$」、「.」、「,」を含むことを特徴とする請求項3に記載の画像処理装置。
- 前記通貨コードは、「JPY」、「USD」、「EUR」を含むことを特徴とする請求項3に記載の画像処理装置。
- 前記特定の文字コードは、「@」であることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
- 画像を文字認識して得られた文字認識結果の文字列から日付文字列を抽出する画像処理装置の制御方法であって、
前記文字認識結果の文字列において、日付における月の名称を表す英単語を構成する文字、または、日付における月の略称を表す英単語を構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換ステップと、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、日付文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換ステップと、
前記特定の文字コードと前記限定文字種とを用いて前記日付文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換ステップおよび前記第2の置換ステップで置換した後の文字列から、前記日付文字列を抽出する抽出ステップとを有することを特徴とする画像処理装置の制御方法。 - 画像を文字認識して得られた文字認識結果の文字列から金額文字列を抽出する画像処理装置の制御方法であって、
前記文字認識結果の文字列において、通貨コードを構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換ステップと、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、金額文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換ステップと、
前記特定の文字コードと前記限定文字種とを用いて前記金額文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換ステップおよび前記第2の置換ステップで置換した後の文字列から、前記金額文字列を抽出する抽出ステップとを有することを特徴とする画像処理装置の制御方法。 - 画像を文字認識して得られた文字認識結果の文字列から日付文字列を抽出する画像処理装置の制御方法をコンピュータに実行させるプログラムであって、
前記画像処理装置の制御方法は、
前記文字認識結果の文字列において、日付における月の名称を表す英単語を構成する文字、または、日付における月の略称を表す英単語を構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換ステップと、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、日付文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換ステップと、
前記特定の文字コードと前記限定文字種とを用いて前記日付文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換ステップおよび前記第2の置換ステップで置換した後の文字列から、前記日付文字列を抽出する抽出ステップとを有することを特徴とするプログラム。 - 画像を文字認識して得られた文字認識結果の文字列から金額文字列を抽出する画像処理装置の制御方法をコンピュータに実行させるプログラムであって、
前記画像処理装置の制御方法は、
前記文字認識結果の文字列において、通貨コードを構成する文字を、通常の文字認識結果として出力されない特定の文字コードに置き換える第1の置換ステップと、
前記文字認識結果の文字列において、前記特定の文字コードに置き換えられる文字以外の文字についての前記文字認識結果の第一候補が、金額文字列に含まれることが想定される限定文字種でない場合は、前記文字認識結果の第一候補を、当該文字についての前記文字認識結果の第二候補以下の文字のうちの前記限定文字種に対応する文字に置き換える第2の置換ステップと、
前記特定の文字コードと前記限定文字種とを用いて前記金額文字列に対応するパターンを定義した正規表現式を用いて、前記第1の置換ステップおよび前記第2の置換ステップで置換した後の文字列から、前記金額文字列を抽出する抽出ステップとを有することを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019112063A JP7401202B2 (ja) | 2019-06-17 | 2019-06-17 | 画像処理装置、その制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019112063A JP7401202B2 (ja) | 2019-06-17 | 2019-06-17 | 画像処理装置、その制御方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020204886A JP2020204886A (ja) | 2020-12-24 |
JP7401202B2 true JP7401202B2 (ja) | 2023-12-19 |
Family
ID=73837443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019112063A Active JP7401202B2 (ja) | 2019-06-17 | 2019-06-17 | 画像処理装置、その制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7401202B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015170129A (ja) | 2014-03-06 | 2015-09-28 | 株式会社東芝 | 認識装置、認識方法およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3201207B2 (ja) * | 1995-03-14 | 2001-08-20 | 株式会社日立製作所 | 住所読取装置及び方法 |
JPH0962794A (ja) * | 1995-08-24 | 1997-03-07 | Fujitsu Ltd | 文書認識装置 |
JP2018081451A (ja) * | 2016-11-15 | 2018-05-24 | キヤノン株式会社 | 情報処理装置およびその制御方法 |
-
2019
- 2019-06-17 JP JP2019112063A patent/JP7401202B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015170129A (ja) | 2014-03-06 | 2015-09-28 | 株式会社東芝 | 認識装置、認識方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020204886A (ja) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2006092027A (ja) | 文字認識装置、文字認識方法および文字認識プログラム | |
CN115223188A (zh) | 票据信息处理方法、装置、电子设备及计算机存储介质 | |
US20110229036A1 (en) | Method and apparatus for text and error profiling of historical documents | |
JP4982587B2 (ja) | データエントリシステムおよびデータエントリ方法 | |
JP7401202B2 (ja) | 画像処理装置、その制御方法、及びプログラム | |
JP7268389B2 (ja) | 情報処理装置及びプログラム | |
JP2020184275A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
US11972208B2 (en) | Information processing device and information processing method | |
JP6763173B2 (ja) | 文書修正方法、文書修正装置、およびコンピュータプログラム | |
JP7414449B2 (ja) | データ処理システム、データ処理方法、および、プログラム | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP7139669B2 (ja) | 情報処理装置及びプログラム | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JP7463675B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JPWO2020240820A1 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
US20230419712A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7358838B2 (ja) | 情報処理装置、及び情報処理プログラム | |
US20220107711A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP2006178543A (ja) | 画像処理方法、画像処理装置 | |
JP2006343797A (ja) | 文字認識装置、文字認識方法およびコンピュータプログラム | |
JP2020123232A (ja) | 情報処理装置、及び情報処理プログラム | |
JP2022116983A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JPH11120294A (ja) | 文字認識装置および媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231207 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7401202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |