JP7370733B2 - 情報処理装置、制御方法、及びプログラム - Google Patents
情報処理装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- JP7370733B2 JP7370733B2 JP2019101280A JP2019101280A JP7370733B2 JP 7370733 B2 JP7370733 B2 JP 7370733B2 JP 2019101280 A JP2019101280 A JP 2019101280A JP 2019101280 A JP2019101280 A JP 2019101280A JP 7370733 B2 JP7370733 B2 JP 7370733B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- double
- recognized
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 57
- 230000010365 information processing Effects 0.000 title claims description 33
- 238000012545 processing Methods 0.000 claims description 139
- 238000000605 extraction Methods 0.000 claims description 71
- 238000012937 correction Methods 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 13
- 230000000717 retained effect Effects 0.000 claims description 4
- 238000010187 selection method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 3
- 240000007171 Imperata cylindrica Species 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Description
[ハードウェア構成]
図1は、本実施形態に係る情報処理装置100の内部構成のハードウェア構成を示す図である。情報処理装置100は、CPU101と、ROM102と、RAM103と、入力部104と、バス105と、外部記憶部106と、NCU107と、GPU108と、表示部109と、SCNU110と、を有する。
図2は、情報処理装置100の機能構成の一例を示す図である。情報処理装置100は、取得部201と、文字認識部202と、選定部203と、変更部204と、修正部205と、情報抽出部206と、誤認識パタン生成部207と、を有する。これらの各部の機能の説明については後述する。図2の各部の機能は、CPUがROMに記憶されているプログラムコードをRAMに展開し実行することにより実現される。または、図2の各部の一部または全部の機能をASICや電子回路等のハードウェアで実現してもよい。
図3は、文字認識処理(OCR処理)の対象となる文書の一例であるレシート301を示す図である。図3を用いて、情報処理装置100の文字認識部202によるOCR処理について説明する。レシート301の上側には、品物を購入したお店の名前、電話番号、購入日が記載されている。また、その下には、購入した物品とその価格が記載され、点線の罫線以下に、購入した物品の合計金額、支払い時に出した現金の金額、及びお釣りの金額が記載されている。
本実施形態の情報処理装置100は情報抽出部206を有する形態である。情報抽出部206は、OCR処理した文字認識結果400から、そのOCR処理の対象となった文書画像に含まれる電話番号、または購入金額の合計金額等の特定の情報を抽出する情報抽出処理をする。ここではその情報抽出処理について説明する。
図7は、OCR処理によって誤認識された文字列を検出するための、誤認識パタンを示す図である。誤認識パタンは、処理対象の文字をOCR認識処理した結果、誤認識された場合の結果のパタン(パターン)が保持されているデータである。図7(a)のテーブルは、外部記憶部106に記憶されている誤認識パタン700の一例である。誤認識パタン700には、「番号」と、「誤認識文字列」と、「正解文字」と、の各データがレコード単位で対応付けられている。
図8は、後述するOCR処理および情報抽出処理をするための準備処理を示すフローチャートである。図8のフローチャートで示される一連の処理は、CPUがROMに記憶されているプログラムコードをRAMに展開し実行することにより行われる。また、図7におけるステップの一部または全部の機能をASICや電子回路等のハードウェアで実現してもよい。なお、各処理の説明における記号「S」は、当該フローチャートにおけるステップであることを意味し、以後のフローチャートにおいても同様とする。本フローチャートでは、図5のテキスト検索規則501、図7の誤認識パタン700を用いて、抽出用誤認識パタン750を生成するものとして説明する。
図9は、本実施形態に係るOCR処理から情報抽出処理までの一連の処理を示すフローチャートである。本フローチャートが開始される前に、準備処理は終了しているものとして説明する。また、準備処理の結果、図7(b)の抽出用誤認識パタン750が生成されているものとして説明する。また本フローでは図5のテキスト検索規則501およびレイアウト検索規則502を用いて情報抽出処理を行うものとして説明する
S901において取得部201は、SCNU110により文書をスキャンすること等で得られた文書画像の画像データを取得し、外部記憶部106に格納する。
第1の実施形態では、倍角文字領域の選定のために、変更部204が修正のための画像を作成し、その画像に対して再度のOCR処理を行った結果に基づき修正部205が認識文字列の修正を行う形態を説明した。本実施形態では、変更部204による処理を行わないで認識文字列の修正を行う形態を説明する。本実施形態については、第1の実施形態からの差分を中心に説明する。特に明記しない部分については第1の実施形態と同じ構成および処理である。
前述の実施形態では、レシート等の横書きの文書画像であって横倍角文字が含まれる文書画像に対しOCR処理をした結果を修正する形態であった。本実施形態は、前述の実施形態を、縦書きの文書画像であって縦倍角文字が含まれる文書画像に対しても適用する方法を説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
202 文字認識部
700 誤認識パタン
201 取得部
203 選定部
205 修正部
Claims (16)
- 処理対象の画像に対して文字認識処理する文字認識手段と、
前記文字認識手段が倍角文字を複数の文字として誤認識する誤認識文字列が少なくとも保持されているデータを取得する取得手段と、
前記文字認識手段が前記処理対象の画像に対して前記文字認識処理することによって得られた認識文字列の中から、倍角文字を前記文字認識処理することによって得られた倍角認識文字を、前記データに基づき選定する選定手段と、
前記認識文字列に対して、前記選定された倍角認識文字を修正するための処理をする修正手段と、
前記修正手段によって前記処理が為された後の前記認識文字列から、正規表現で示される文字列パタンに対応する第1の検索文字列と、所定の文字列に対応する第2の検索文字列と、を検索し、当該検索された前記第1の検索文字列と前記第2の検索文字列との相対位置が所定の条件を満たす場合、前記認識文字列に含まれる前記第1の検索文字列が示す文字列を、項目値として抽出する情報抽出手段と、
を有することを特徴とする情報処理装置。 - 前記選定手段は、
前記認識文字列を構成する文字のうちの一続きの文字が、前記一続きの文字の順番と同じ順番で、前記データの前記誤認識文字列として保持されているか検索し、前記検索の結果に基づき前記倍角認識文字を選定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記選定手段は、
前記一続きの文字が、前記データの前記誤認識文字列として保持されている場合、
前記処理対象の画像における領域のうち、前記文字認識手段が前記一続きの文字を認識した領域を含む領域である選定領域において、文字を示す画素値が連続して検出される行方向の長さに基づき、前記文字認識手段が前記倍角認識文字を認識した領域である倍角文字領域を選定する
ことを特徴とする請求項2に記載の情報処理装置。 - 前記選定手段は、
前記選定領域において行方向と垂直な方向の射影をとり、黒色の画素値を有する画素である黒画素が検出されたときの行方向の位置が連続している区間の長さが、行方向と垂直な方向の文字の長さに基づく所定の値以上であれば、前記区間に対応する前記選定領域内の領域を前記倍角文字領域と選定する
ことを特徴とする請求項3に記載の情報処理装置。 - 前記選定手段は、
前記区間の長さが、前記行方向と垂直な方向の文字の長さの1.6倍以上の長さである場合、前記区間に対応する前記選定領域内の領域を前記倍角文字領域と選定する
ことを特徴とする請求項4に記載の情報処理装置。 - 前記倍角文字領域の画像の大きさを変更する変更手段をさらに有し、
前記文字認識手段は、
前記変更手段によって変更された変更画像に対して前記文字認識処理を行い、
前記修正手段は、
前記変更画像に対して前記文字認識処理をして得られた変更認識文字の尤度が、前記倍角認識文字の尤度より高い場合、前記倍角認識文字を、前記変更認識文字に置き換える
ことを特徴とする請求項3から5のいずれか1項に記載の情報処理装置。 - 前記変更手段は、前記倍角文字領域の部分画像を生成し、前記部分画像の縦と横とが略同じ長さになるように変更して前記変更画像を生成する
ことを特徴とする請求項6に記載の情報処理装置。 - 前記データは、
前記誤認識文字列と、前記誤認識文字列に対応する正解文字と、が紐付けられて保持されており、
前記選定手段は、
前記一続きの文字が前記データの前記誤認識文字列として保持されており、かつ、前記一続きの文字のサイズに統一性がある場合、前記一続きの文字を前記倍角認識文字と選定し、
前記修正手段は、
前記倍角認識文字を、前記データにおいて前記一続きの文字と同一の前記誤認識文字列に紐付けられている前記正解文字に置き換える
ことを特徴とする請求項2に記載の情報処理装置。 - 前記一続きの文字のサイズに前記統一性がある場合とは、
前記一続きの各文字の横サイズと縦サイズとの比をそれぞれ決定し、前記比の差分が所定の範囲内の場合である
ことを特徴とする請求項8に記載の情報処理装置。 - 前記誤認識文字列と、前記誤認識文字列に対応する正解文字と、が紐付けられて保持されている誤認識パタンから、前記第2の検索文字列に含まれる文字と同一の前記正解文字を抽出し、
抽出された前記正解文字と、該正解文字に紐付けられている前記誤認識文字列と、に基づき前記データを生成する生成手段をさらに有し、
前記選定手段は、前記生成手段によって生成された前記データに基づき、前記倍角認識文字を選定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記生成手段は、
前記取得手段が前記データを取得する前に、前記データを生成する
ことを特徴とする請求項10に記載の情報処理装置。 - 前記処理対象の画像は、二値化処理された画像である
ことを特徴とする請求項1から11のいずれか1項に記載の情報処理装置。 - 前記倍角文字は、横倍角文字または縦倍角文字である
ことを特徴とする請求項1から12のいずれか1項に記載の情報処理装置。 - 前記認識文字列を構成する文字は、該文字の尤度と、該文字のサイズと紐付けて管理されている
ことを特徴とする請求項1から13のいずれか1項に記載の情報処理装置。 - 処理対象の画像に対して文字認識処理する文字認識ステップと、
前記文字認識処理において倍角文字を複数の文字として誤認識する誤認識文字列が少なくとも保持されているデータを取得する取得ステップと、
前記文字認識ステップにおいて、前記処理対象の画像に対して前記文字認識処理することによって得られた認識文字列の中から、倍角文字を前記文字認識処理することによって得られた倍角認識文字を、前記データに基づき選定する選定ステップと、
前記認識文字列に対して、前記選定された倍角認識文字を修正するための処理をする修正ステップと、
前記修正ステップによって前記処理が為された後の前記認識文字列から、正規表現で示される文字列パタンに対応する第1の検索文字列と、所定の文字列に対応する第2の検索文字列と、を検索し、当該検索された前記第1の検索文字列と前記第2の検索文字列との相対位置が所定の条件を満たす場合、前記認識文字列に含まれる前記第1の検索文字列が示す文字列を、項目値として抽出する情報抽出ステップと、
を含むことを特徴とする制御方法。 - コンピュータを、請求項1から14のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101280A JP7370733B2 (ja) | 2019-05-30 | 2019-05-30 | 情報処理装置、制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101280A JP7370733B2 (ja) | 2019-05-30 | 2019-05-30 | 情報処理装置、制御方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020194491A JP2020194491A (ja) | 2020-12-03 |
JP7370733B2 true JP7370733B2 (ja) | 2023-10-30 |
Family
ID=73546397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019101280A Active JP7370733B2 (ja) | 2019-05-30 | 2019-05-30 | 情報処理装置、制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7370733B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004078531A (ja) | 2002-08-16 | 2004-03-11 | Ricoh Co Ltd | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム |
WO2007080642A1 (ja) | 2006-01-13 | 2007-07-19 | Fujitsu Limited | 帳票処理プログラムおよび帳票処理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02170292A (ja) * | 1988-12-23 | 1990-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識後処理方法 |
JPH02230484A (ja) * | 1989-03-03 | 1990-09-12 | Hitachi Eng Co Ltd | 文字認識装置 |
-
2019
- 2019-05-30 JP JP2019101280A patent/JP7370733B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004078531A (ja) | 2002-08-16 | 2004-03-11 | Ricoh Co Ltd | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム |
WO2007080642A1 (ja) | 2006-01-13 | 2007-07-19 | Fujitsu Limited | 帳票処理プログラムおよび帳票処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2020194491A (ja) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489682B1 (en) | Optical character recognition employing deep learning with machine generated training data | |
US20160171627A1 (en) | Processing electronic documents for invoice recognition | |
US8995768B2 (en) | Methods and devices for processing scanned book's data | |
WO2018003153A1 (ja) | 認識装置及び認識方法 | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
Clausner et al. | ICDAR2019 competition on recognition of early Indian printed documents–REID2019 | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
US9323726B1 (en) | Optimizing a glyph-based file | |
US20120014612A1 (en) | Document processing apparatus and computer readable medium | |
JP2012190434A (ja) | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
WO2021140682A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7370733B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2005165978A (ja) | 帳票ocrプログラム、方法及び装置 | |
US20230099764A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
US20230140357A1 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
US11763582B2 (en) | Information processing apparatus, control method of information processing apparatus, and non-transitory storage medium | |
US20230090313A1 (en) | Autonomously removing scan marks from digital documents utilizing content-aware filters | |
US20240193217A1 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
US20210056301A1 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230919 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231018 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7370733 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |