JP2020126326A - 帳票に含まれる文字列を認識するための装置、方法、及びプログラム - Google Patents

帳票に含まれる文字列を認識するための装置、方法、及びプログラム Download PDF

Info

Publication number
JP2020126326A
JP2020126326A JP2019017157A JP2019017157A JP2020126326A JP 2020126326 A JP2020126326 A JP 2020126326A JP 2019017157 A JP2019017157 A JP 2019017157A JP 2019017157 A JP2019017157 A JP 2019017157A JP 2020126326 A JP2020126326 A JP 2020126326A
Authority
JP
Japan
Prior art keywords
character string
image
color image
item
dropout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019017157A
Other languages
English (en)
Other versions
JP7329331B2 (ja
Inventor
淳彦 山井
Atsuhiko Yamai
淳彦 山井
加藤 真
Makoto Kato
真 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primagest Inc
Original Assignee
Primagest Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primagest Inc filed Critical Primagest Inc
Priority to JP2019017157A priority Critical patent/JP7329331B2/ja
Publication of JP2020126326A publication Critical patent/JP2020126326A/ja
Application granted granted Critical
Publication of JP7329331B2 publication Critical patent/JP7329331B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】様式情報の事前登録なしで行われる帳票の処理を支援する装置、方法及びプログラムを提供する。【解決手段】画像処理装置20は、帳票のカラー画像を取得するように構成されたカラー画像取得部201と、取得したカラー画像において、帳票に含まれる所定の項目の名称に対応する文字列を検出するように構成された項目名称検出部202と、カラー画像から少なくとも特定の色が消去されたドロップアウト画像を生成するように構成されたドロップアウト画像生成部203と、生成したドロップアウト画像において、カラー画像において検出された名称に対応する文字列の位置に少なくとも基づいて、上記所定の項目の値に対応する文字列を検出するように構成された項目値検出部204と、様々な情報を記憶する記憶部205とを備える。【選択図】図3

Description

本発明は、帳票に含まれる文字列を認識するための装置、方法、及びプログラムに関
するものである。
従来、例えば、銀行や郵便局等の金融機関に持ち込まれる帳票を処理するために、当
該帳票の種類を特定し、さらに、当該帳票に含まれる項目(対応する処理の依頼者、口
座番号、及び各種の金額等)の種類及び位置を特定することが行われている。例えば、
下記特許文献1は、事前に帳票のサイズや罫線情報、項目の位置等を様式情報として登
録しておき、帳票の読取画像と登録済みの様式情報とを照合することを開示している。
特開2005−242786号公報
しかしながら、帳票の様式は、典型的には、その作成元(例えば、収納企業や地方自
治体等)毎に異なるので、様式の数は膨大(数千又は数万等)となり、これらの様式情
報の全てを登録することが非現実的となってしまう場合がある。したがって、様式情報
の事前登録なしで帳票の処理が可能な仕組みの実現が望まれる。
本発明は、様式情報の事前登録なしで行われる帳票の処理を支援することを目的の1
つとする。本発明の他の目的は、本明細書全体を参照することにより明らかとなる。
本発明の実施形態に係る文字列認識装置は、帳票に含まれる文字列を認識するための文字列認識装置であって、前記帳票のカラー画像を取得するように構成されたカラー画像取得部と、取得した前記カラー画像において、前記帳票に含まれる所定の項目の名称に対応する第1文字列を検出するように構成された項目名称検出部と、前記カラー画像から少なくとも特定の色が消去されたドロップアウト画像を生成するように構成されたドロップアウト画像生成部と、生成した前記ドロップアウト画像において、前記カラー画像において検出された前記第1文字列の位置に少なくとも基づいて、前記所定の項目の値に対応する第2文字列を検出するように構成された項目値検出部と、を備える。
この構成によれば、帳票に含まれる所定の項目の名称に対応する第1文字列を検出し
、当該第1文字列の位置に基づいて当該所定の項目の値に対応する第2文字列を検出す
るから、帳票の様式情報の事前登録なしに、所定の項目の値(第2文字列)の認識が可
能となる。さらに、帳票のカラー画像から特定の色が消去されたドロップアウト画像に
おいて所定の項目の値(第2文字列)を検出するから、例えば、カラー画像において所
定の項目の値が特定の色の枠線/罫線等に重なっている場合であっても(こうした枠線
/罫線等との接触は不読/誤読の原因となる。)、ドロップアウト画像においては当該
特定の色の枠線/罫線が消去され、所定の項目の値の不読/誤読が抑制される。
また、上記装置において、前記ドロップアウト画像生成部は、黒色を除く色が消去されたドロップアウト画像を生成するように構成することもできる。こうすれば、黒色以外の様々な色の枠線/罫線を有する様々な帳票における所定の項目の値の不読/誤読を抑制することができる。
また、上記装置において、前記項目値検出部は、前記カラー画像における前記第1文字列との間の相対的な位置関係が所定の関係にある前記ドロップアウト画像における文字列を前記第2文字列として検出するように構成することもできる。こうすれば、第1文字列との間の相対的な位置関係に基づいて第2文字列を検出することが可能となる。
また、上記装置において、前記項目値検出部は、前記カラー画像における前記第1文字列の位置に基づいて設定される前記ドロップアウト画像における所定の領域に含まれる文字列を前記第2文字列として検出するように構成することもできる。前記所定の領域は、例えば、前記カラー画像における前記第1文字列の右側及び/又は下側の領域が少なくとも含まれるように構成され得る。こうすれば、第1文字列の位置に基づく所定の領域に含まれる文字列を第2文字列として検出することを可能とする。
また、上記装置において、前記所定の項目は、金額に関する項目であり、前記項目名称検出部は、前記第1文字列に加えて、通貨に関する所定の文字を検出するように構成されており、前記項目値検出部は、前記カラー画像において検出された前記第1文字列及び前記所定の文字の位置に少なくとも基づいて前記第2文字列を検出するように構成することもできる。通貨に関する所定の文字は、例えば、「円」又は「¥」を含む。こうすれば、第1文字列の位置に加えて、通貨に関する所定の文字の位置に基づいて第2文字列が検出されるから、当該第2文字列の検出の精度が向上し得る。
本発明の実施形態に係る文字列認識方法は、1又は複数のコンピュータによって実行
され、帳票に含まれる文字列を認識するための文字列認識方法であって、前記帳票のカ
ラー画像を取得する工程と、取得した前記カラー画像において、前記帳票に含まれる所
定の項目の名称に対応する第1文字列を検出する工程と、前記カラー画像から少なくと
も特定の色が消去されたドロップアウト画像を生成する工程と、生成した前記ドロップ
アウト画像において、前記カラー画像において検出された前記第1文字列の位置に少な
くとも基づいて、前記所定の項目の値に対応する第2文字列を検出する工程と、を備え
る。
この構成によれば、帳票に含まれる所定の項目の名称に対応する第1文字列を検出し
、当該第1文字列の位置に基づいて当該所定の項目の値に対応する第2文字列を検出す
るから、帳票の様式情報の事前登録なしに、所定の項目の値(第2文字列)の認識が可
能となる。さらに、帳票のカラー画像から特定の色が消去されたドロップアウト画像に
おいて所定の項目の値(第2文字列)を検出するから、例えば、カラー画像において所
定の項目の値が特定の色の枠線/罫線等に重なっている場合であっても(こうした枠線
/罫線等との接触は不読/誤読の原因となる。)、ドロップアウト画像においては当該
特定の色の枠線/罫線が消去され、所定の項目の値の不読/誤読が抑制される。
本発明の実施形態に係る文字列認識プログラムは、帳票に含まれる文字列を認識する
ための文字列認識プログラムであって、コンピュータに、前記帳票のカラー画像を取得
する処理と、取得した前記カラー画像において、前記帳票に含まれる所定の項目の名称
に対応する第1文字列を検出する処理と、前記カラー画像から少なくとも特定の色が消
去されたドロップアウト画像を生成する処理と、生成した前記ドロップアウト画像にお
いて、前記カラー画像において検出された前記第1文字列の位置に少なくとも基づいて
、前記所定の項目の値に対応する第2文字列を検出する処理と、を実行させる。
この構成によれば、帳票に含まれる所定の項目の名称に対応する第1文字列を検出し
、当該第1文字列の位置に基づいて当該所定の項目の値に対応する第2文字列を検出す
るから、帳票の様式情報の事前登録なしに、所定の項目の値(第2文字列)の認識が可
能となる。さらに、帳票のカラー画像から特定の色が消去されたドロップアウト画像に
おいて所定の項目の値(第2文字列)を検出するから、例えば、カラー画像において所
定の項目の値が特定の色の枠線/罫線等に重なっている場合であっても(こうした枠線
/罫線等との接触は不読/誤読の原因となる。)、ドロップアウト画像においては当該
特定の色の枠線/罫線が消去され、所定の項目の値の不読/誤読が抑制される。
本発明の様々な実施形態は、様式情報の事前登録なしで行われる帳票の処理を支援す
る。
本発明の一実施形態に係る文字列認識装置として機能する画像処理装置 20を含む帳票読取システム1のシステム構成を概略的に例示する構成図である。 画像処理装置20のハードウェア構成を概略的に例示する構成図である 。 画像処理装置20が有する機能を概略的に例示する構成図である。 画像処理装置20が実行する処理を例示するフローチャートである。 帳票の様式を例示する図である。 図5に例示した帳票に含まれる項目の一部に対して値が印刷されている状態の帳票を例示する図である。 対象の項目名称の矩形領域A1及び通貨関連文字の矩形領域A2が検出される様子を例示するための図である。 図6に例示した帳票のカラー画像に基づいて生成されるドロップアウト画像を例示する図である。 対象の項目値が検出される様子を例示するための図である。 対象の項目値が、帳票の様式における枠線/罫線に重なって印刷され てしまっている場合を説明するための図。
図1は、本発明の一実施形態に係る文字列認識装置として機能する画像処理装置20を含む帳票読取システム1のシステム構成を概略的に例示する構成図である。帳票読取システム1は、図示するように、処理対象となる帳票を光学的に読み取って画像を生成する帳票読取装置10と、当該帳票読取装置10によって生成された画像に対する画像処理を行う画像処理装置20と、当該画像処理装置20と通信ネットワークNを介して通信可能に接続されたホストサーバ30と、を備える。システム1は、帳票読取装置10によって光学的に読み取られる帳票に含まれる文字列を、画像処理装置20によって実行される画像処理を介して認識するように構成されている。本実施形態における帳票読取システム1による読取の対象となる帳票は、様々な種類の帳票が含まれ、例えば、口座振替依頼書及び税公金の領収済通知書等を含む任意の帳票である。
帳票読取装置10は、一般的な業務用スキャナとして構成されており、所定の位置にセットされた帳票を光学的にスキャンし、当該スキャンを介して生成された画像を画像処理装置20に入力するように構成されている。
ホストサーバ30は、一般的なサーバ装置として構成されており、帳票内の文字列の認識のために必要な様々な情報/データを記憶し、当該情報/データを画像処理装置20に対して適宜に提供するように構成されている。
本実施形態における画像処理装置20は、帳票読取装置10によって入力される画像を用いて、帳票内に存在する文字列を認識する。図2は、画像処理装置20のハードウェア構成を概略的に例示する構成図である。画像処理装置20は、一般的なコンピュータとしての構成を有しており、図示するように、CPU21と、メインメモリ22と、ストレージ23と、帳票読取装置インターフェイス24と、入力インターフェイス25と、表示コントローラ26と、通信インターフェイス27と、リーダ/ライタ28とを有する。
画像読取装置インターフェイス24は、CPU21と帳票読取装置10との間のデー
タ伝送を仲介し、当該装置10から入力される画像を一時的に蓄積するための画像バッ
ファ241を有している。入力インターフェイス25は、CPU21と各種の入力部と
の間のデータ伝送を仲介する。入力部には、マウス31、キーボード、及びタッチパネ
ル等が含まれる。表示コントローラ26は、液晶モニタ等のディスプレイ32が接続さ
れており、当該ディスプレイ32における表示を制御する。通信インターフェイス27
は、CPU21とパーソナルコンピュータ及びホストサーバ30等との間のデータ伝送
を仲介する。リーダ/ライタ28は、CPU21と各種の記録媒体(メモリカード33
が含まれる)との間のデータ伝送を仲介する。各インターフェイスは、例えばUSB等
の規格に従うように構成される。
画像処理装置20は、CPU21が、ストレージ23等に格納されているプログラム
をメインメモリ22に読み込んで実行することにより、各種の処理を実行する。ストレ
ージ23等に格納されているプログラムは、例えば、メモリカード33や光ディスク等
のコンピュータ読取可能な記録媒体を介して提供され、又は、インターネット等の通信
ネットワークNを介して提供される。なお、本実施形態におけるプログラムは、単体の
アプリケーションプログラムとして構成されていてもよいし、他のプログラムの一部と
して組み込まれるモジュールとして構成されていてもよい。また、こうしたプログラム
を介して実行される処理の一部又は全部は、ASIC等の専用回路を介して実行される
ように構成され得る。
図3は、本実施形態の画像処理装置20が有する機能を概略的に例示する構成図であ
る。画像処理装置20は、図示するように、カラー画像取得部201と、項目名称検出
部202と、ドロップアウト画像生成部203と、項目値検出部204と、様々な情報
をストレージ23等において記憶する記憶部205とを有する。
カラー画像取得部201は、帳票のカラー画像の取得に関する処理を実行する。例え
ば、カラー画像取得部201は、帳票読取装置10から入力されるカラー画像を取得す
るように構成されている。
項目名称検出部202は、帳票に含まれる所定の項目の名称(以下、「項目名称」と
言う場合がある。)に対応する文字列(第1文字列)の検出に関する処理を実行する。
例えば、項目名称検出部202は、カラー画像取得部201によって取得されるカラー
画像を解析することにより、当該カラー画像に含まれる、項目名称に対応する文字列を
検出するように構成されている。
本実施形態において、文字列の認識の対象となる所定の項目は、「納入金額」、「税
額」、「納付額」、「収納金額」、「請求金額」等の金額に関する項目として構成され
る。これらの項目名称に対応する文字列は、例えば、所定の形式のファイル内にリスト
化されており、当該ファイルは、記憶部205(ストレージ23)及び/又はホストサ
ーバ30等に格納される。なお、本発明の他の実施形態においては、文字列の認識の対
象となる所定の項目は、金額に関する項目以外の様々な項目が含まれ得る。
本実施形態において、項目名称検出部202は、対象の項目名称に対応する文字列に
加えて、通貨に関する通貨関連文字(所定の文字)を検出するように構成されている。
例えば、項目名称検出部202は、カラー画像に含まれる「円」及び「¥」という文字
を検出するように構成されている。
ドロップアウト画像生成部203は、ドロップアウト画像の生成に関する処理を実行
する。例えば、ドロップアウト画像生成部203は、カラー画像取得部201によって
取得されたカラー画像に対してドロップアウト処理を行うことにより、ドロップアウト
画像を生成するように構成されている。本実施形態におけるドロップアウト処理は、黒
色以外の色を除去する処理であり、例えば、カラー画像から、R成分、G成分、及び、
B成分を順に除去する処理として構成される。なお、黒色とは、R成分、G成分、及び
、B成分を完全に除去したものに限定されず、帳票に含まれる項目値を検出できる程度
に各色の成分が除去されればよい。また、本発明の他の実施形態において、ドロップア
ウト処理においてカラー画像から除去される色は、黒色以外の色に限定されず、例えば
、黒色及び他の特定の色以外の色、又は、1又は複数の特定の色であってもよい。
項目値検出部204は、帳票に含まれる所定の項目の値(以下、「項目値」と言う場
合がある。)に対応する文字列(第2文字列)の検出に関する処理を実行する。例えば
、項目値検出部204は、ドロップアウト画像生成部203によって生成されたドロッ
プアウト画像を解析し、当該解析結果と、項目名称検出部202によって検出されたカ
ラー画像における項目名称に対応する文字列の位置と、に少なくとも基づいて、当該ド
ロップアウト画像における項目値に対応する文字列を検出するように構成されている。
次に、このように構成された本実施形態の画像処理装置20の動作について説明する
。図4は、画像処理装置20が実行する処理を例示するフローチャートである。当該装
置20は、まず、図示するように、帳票読取装置10から入力される帳票のカラー画像
を取得し(S101)、当該カラー画像に含まれる対象の項目名称及び通貨関連文字を
検出する(S102)。具体的には、上述したように、項目名称としての「納入金額」
、「税額」、「納付額」、「収納金額」、「請求金額」等の文字列が検出されると共に
、関連文字としての「円」及び「¥」という文字が検出される。以下、具体例を用いて
説明する。
図5は、本実施形態における帳票の様式を例示する。図5に例示される様式は、「水
道料金等納入済み通知書」の様式であって、様々なテキスト、枠線/罫線、項目名称(
例えば、お客様番号、水道料金、開栓手数料、納入期限等)、単位(例えば、「円」等
)等の情報が印刷されている。様式として予め印刷されているこれらの情報は、黒色以
外の色(例えば、青色)で印刷されている。
図6は、図5に例示した帳票に含まれる項目の一部に対して値が印刷されている状態
の帳票を例示する。具体的には、図6の帳票においては、お客様番号、使用期間、お客
様氏名、水道料金、下水道使用料、収納金額、納入期限、及び、発行日に対する値がそ
れぞれ対応する枠内に印刷されている。また、図6の帳票においては、領収日付印が押
印されている。これらの各項目の値、及び、領収日付印は、黒色で印刷又は押印されて
いる。ステップS101では、このように項目の値が印刷されている状態の帳票のカラ
ー画像が取得されている。
例えば、図5、6の帳票における項目「収納金額」は、対象の項目名称としてリスト
化されているので、当該文字列がカラー画像において検出される。また、図5、6の帳
票における「円」という文字が通貨関連文字としてカラー画像において検出される。具
体的には、図7に例示するように、「収納金額」と印字されている1つの矩形領域A1
、及び、「円」と印字されている6つの矩形領域A2がカラー画像において検出される
図4のフローチャートに戻り、続いて、画像処理装置20は、カラー画像に基づいて
ドロップアウト画像を生成する(S103)。上述したように、本実施形態におけるド
ロップアウト画像は、黒色以外の色が除去された画像(二値画像)である。図8は、図
6に例示した帳票のカラー画像に基づいて生成されるドロップアウト画像を例示する。
図示するように、ドロップアウト画像では、帳票において黒色以外の色で印刷されてい
た様々なテキスト、枠線/罫線、項目名称、単位等の情報が除去され、黒色で印刷/押
印されていた項目値及び領収日付印が残存する。
図4のフローチャートに戻り、こうしてドロップアウト画像を生成すると、次に、画
像処理装置20は、当該ドロップアウト画像に含まれる対象の項目値を検出する(S1
04)。項目値の検出は、ステップS102において検出された項目名称及び通貨関連
文字のカラー画像上での位置に基づいて行われる。
図9は、対象の項目値が検出される様子を例示するための図である。本実施形態では
、図示するように、対象の項目名称の矩形領域A1を拡張した拡張領域A11に含まれ
る文字列が対象の項目値の候補となる。当該拡張領域A11は、領域A1を、上方向及
び左方向に第1の幅W1だけ拡張し、且つ、下方向に第1の幅W1よりも大きい第2の
幅W2だけ拡張すると共に右方向に第1の幅W1よりも大きい第3の幅W3だけ拡張し
た領域として構成される。図9の例では、拡張領域A11に含まれる「148,004
」という文字列、及び、「平成29年3月27日」という文字列が対象の項目値の候補
となる。
また、対象の項目値は、通貨関連文字の矩形領域A2との相対的な位置関係を考慮し
て検出される。具体的には、「円」という通貨関連文字の左側の文字列が優先的に対象
の項目値として検出され、例えば、図9の例では、対象の項目値の候補となる2つの文
字列「148,004」及び「平成29年3月27日」のうち、通貨関連文字の領域A
2の左側に位置する「148,004」という文字列が対象の項目値として検出される
。なお、「¥」という通貨関連文字が検出されている場合には、当該文字の右側の文字
列が優先的に対象の項目値として検出される。
ここで、対象の項目値が、帳票の様式における枠線/罫線に重なって印刷されてしま
っている場合を考える。例えば、図10の上側に例示するように、対象の項目である「
収納金額」の項目値「148,004」がカラー画像において枠の下側の枠線/罫線に
重なってしまっている場合、当該カラー画像を用いて項目値を検出しようとすると、不
読/誤読のおそれがあるが、図10の下側に例示するように、ドロップアウト画像にお
いては黒色以外の色で印刷されていた枠線/罫線が消去されるので、枠線/罫線に重な
ってしまうことに起因する項目値の不読/誤読のおそれがなくなる。
本実施形態では、対象の項目名称の矩形領域A1を拡張した拡張領域A11に含まれ
る文字列が対象の項目値として検出されるようにしたが、こうした手法は例示であって
、本発明の他の実施形態では、他の手法が適用され、例えば、対象の項目名称の矩形領
域A1との間の相対的な位置関係が所定の関係にある文字列が対象の項目値として検出
されるような様々な手法が適用される。
本実施形態では、カラー画像において、対象の項目名称に対応する文字列に加えて、
通貨に関する通貨関連文字を検出するように構成したが、本発明の他の実施形態では、
通貨関連文字の検出は行わず、例えばカラー画像に存在する罫線ないし枠線の情報を用
いて、項目名称の属する矩形領域を特定し、その右または下の矩形領域を探索対象領域として、項目値の検出を行なう手法が適用されてもよい。
以上説明した本発明の実施形態に係る画像処理装置20は、帳票に含まれる所定の項
目の名称に対応する文字列を検出し、当該名称に対応する文字列の位置に基づいて当該
所定の項目の値に対応する文字列を検出するから、帳票の様式情報の事前登録なしに、
所定の項目の値に対応する文字列の認識が可能となる。さらに、帳票のカラー画像から
特定の色(例えば、黒色以外の色)が消去されたドロップアウト画像において項目値に
対応する文字列を検出するから、例えば、カラー画像において項目値が特定の色の枠線
/罫線に重なってしまっている場合であっても、ドロップアウト画像においては当該特
定の色の枠線/罫線が消去され、項目値に対応する文字列の不読/誤読が抑制される。
1…帳票読取システム、10…帳票読取装置、20…画像処理装置、21…CPU、
22…メインメモリ、23…ストレージ、24…帳票読取装置インターフェイス、24
1…画像バッファ、25…入力インターフェイス、26…表示コントローラ、27…通
信インターフェイス、28…リーダ/ライタ、30…ホストサーバ、31…マウス、3
2…ディスプレイ、33…メモリカード、201…カラー画像取得部、202…項目名
称検出部、203…ドロップアウト画像生成部、204…項目値検出部、205…記憶
部。

Claims (8)

  1. 帳票に含まれる文字列を認識するための文字列認識装置であって、
    前記帳票のカラー画像を取得するように構成されたカラー画像取得部と、
    取得した前記カラー画像において、前記帳票に含まれる所定の項目の名称に対応する第1文字列を検出するように構成された項目名称検出部と、
    前記カラー画像から少なくとも特定の色が消去されたドロップアウト画像を生成するように構成されたドロップアウト画像生成部と、
    生成した前記ドロップアウト画像において、前記カラー画像において検出された前記第1文字列の位置に少なくとも基づいて、前記所定の項目の値に対応する第2文字列を検出するように構成された項目値検出部と、を備える、
    文字列認識装置。
  2. 前記ドロップアウト画像生成部は、黒色を除く色が消去されたドロップアウト画像を生成するように構成されている、
    請求項1の文字列認識装置。
  3. 前記項目値検出部は、前記カラー画像における前記第1文字列との間の相対的な位置関係が所定の関係にある前記ドロップアウト画像における文字列を前記第2文字列として検出するように構成されている、
    請求項1又は2の文字列認識装置。
  4. 前記項目値検出部は、前記カラー画像における前記第1文字列の位置に基づいて設定される前記ドロップアウト画像における所定の領域に含まれる文字列を前記第2文字列として検出するように構成されている、
    請求項3の文字列認識装置。
  5. 前記所定の領域は、前記カラー画像における前記第1文字列の右側及び/又は下側の領域が少なくとも含まれるように構成されている、
    請求項4の文字列認識装置。
  6. 前記所定の項目は、金額に関する項目であり、
    前記項目名称検出部は、前記第1文字列に加えて、通貨に関する所定の文字を検出するように構成されており、
    前記項目値検出部は、前記カラー画像において検出された前記第1文字列及び前記所定の文字の位置に少なくとも基づいて前記第2文字列を検出するように構成されている、
    請求項1ないし5何れかの文字列認識装置。
  7. 1又は複数のコンピュータによって実行され、帳票に含まれる文字列を認識するため
    の文字列認識方法であって、
    前記帳票のカラー画像を取得する工程と、
    取得した前記カラー画像において、前記帳票に含まれる所定の項目の名称に対応する第1文字列を検出する工程と、
    前記カラー画像から少なくとも特定の色が消去されたドロップアウト画像を生成する工程と、
    生成した前記ドロップアウト画像において、前記カラー画像において検出された前記第1文字列の位置に少なくとも基づいて、前記所定の項目の値に対応する第2文字列を検出する工程と、を備える、
    文字列認識方法。
  8. 帳票に含まれる文字列を認識するための文字列認識プログラムであって、コンピュータに、
    前記帳票のカラー画像を取得する処理と、
    取得した前記カラー画像において、前記帳票に含まれる所定の項目の名称に対応する第1文字列を検出する処理と、
    前記カラー画像から少なくとも特定の色が消去されたドロップアウト画像を生成する処理と、
    生成した前記ドロップアウト画像において、前記カラー画像において検出された前記第1文字列の位置に少なくとも基づいて、前記所定の項目の値に対応する第2文字列を検出する処理と、を実行させる、
    文字列認識プログラム。
JP2019017157A 2019-02-01 2019-02-01 帳票に含まれる文字列を認識するための装置、方法、及びプログラム Active JP7329331B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019017157A JP7329331B2 (ja) 2019-02-01 2019-02-01 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017157A JP7329331B2 (ja) 2019-02-01 2019-02-01 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2020126326A true JP2020126326A (ja) 2020-08-20
JP7329331B2 JP7329331B2 (ja) 2023-08-18

Family

ID=72083955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017157A Active JP7329331B2 (ja) 2019-02-01 2019-02-01 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7329331B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668299A (ja) * 1992-08-19 1994-03-11 Hitachi Ltd 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置
JP2001126010A (ja) * 1999-11-01 2001-05-11 Ricoh Co Ltd 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2013030040A (ja) * 2011-07-29 2013-02-07 Fujitsu Frontech Ltd 情報処理プログラム、情報処理装置および文字認識方法
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668299A (ja) * 1992-08-19 1994-03-11 Hitachi Ltd 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置
JP2001126010A (ja) * 1999-11-01 2001-05-11 Ricoh Co Ltd 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2013030040A (ja) * 2011-07-29 2013-02-07 Fujitsu Frontech Ltd 情報処理プログラム、情報処理装置および文字認識方法
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム

Also Published As

Publication number Publication date
JP7329331B2 (ja) 2023-08-18

Similar Documents

Publication Publication Date Title
KR101174536B1 (ko) 렌더링된 문서로부터의 비주얼 캡쳐 데이터 처리 기술
US8608074B2 (en) Method and apparatus for locating and decoding machine-readable symbols
RU2679209C2 (ru) Обработка электронных документов для распознавания инвойсов
US9027833B2 (en) Commodity information display apparatus and method for displaying commodity information in different forms
JP5202677B2 (ja) レシートデータ認識装置およびそのプログラム
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
CN111931771B (zh) 票据内容识别方法、装置、介质及电子设备
CN112487859A (zh) 信息处理装置、信息处理方法和计算机可读介质
Pramkeaw et al. Development of a Process to Enhance the Reimbursement Efficiency with OCR and Ontology for Financial Documents
JP5844564B2 (ja) 帳票認識システム
JP5566971B2 (ja) 情報処理プログラム、情報処理装置および文字認識方法
JP7329331B2 (ja) 帳票に含まれる文字列を認識するための装置、方法、及びプログラム
US11715318B2 (en) Systems and methods for spatial-aware information extraction from electronic source documents
Hamzah et al. Data capturing: Methods, issues and concern
TWM626292U (zh) 業務導向要項鍵值辨識系統
US20170032469A1 (en) Transaction slip search method, information processing apparatus, and computer product
US10417488B2 (en) Re-application of filters for processing receipts and invoices
JP2011008584A (ja) 情報処理装置及び情報処理プログラム
Bogahawatte et al. Online Digital Cheque Clearance and Verification System using Block Chain
JP2019016379A (ja) データ入力装置及びデータ入力プログラム
Fernando Intelligent Document Processing: A Guide For Building RPA Solutions
US20230140357A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium
TWI807467B (zh) 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法
WO2023047570A1 (ja) 情報処理装置、情報処理方法、情報処理プログラム
US20230137138A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium that stores program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230807

R150 Certificate of patent or registration of utility model

Ref document number: 7329331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150