JP2021022261A - 補正候補決定装置、補正候補決定方法およびプログラム - Google Patents

補正候補決定装置、補正候補決定方法およびプログラム Download PDF

Info

Publication number
JP2021022261A
JP2021022261A JP2019139443A JP2019139443A JP2021022261A JP 2021022261 A JP2021022261 A JP 2021022261A JP 2019139443 A JP2019139443 A JP 2019139443A JP 2019139443 A JP2019139443 A JP 2019139443A JP 2021022261 A JP2021022261 A JP 2021022261A
Authority
JP
Japan
Prior art keywords
similarity
correction candidate
true value
candidate determination
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019139443A
Other languages
English (en)
Other versions
JP7215975B2 (ja
Inventor
直也 奥村
Naoya Okumura
直也 奥村
達也 正能
Tatsuya Masano
達也 正能
将平 長谷川
Shohei Hasegawa
将平 長谷川
武志 馬路
Takeshi Baji
武志 馬路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2019139443A priority Critical patent/JP7215975B2/ja
Publication of JP2021022261A publication Critical patent/JP2021022261A/ja
Application granted granted Critical
Publication of JP7215975B2 publication Critical patent/JP7215975B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】文字認識結果の誤認識を補正することができる補正候補決定装置を提供すること。【解決手段】補正候補決定装置3は、文字認識部201の文字認識結果と誤認識パターンDB302内の真値とのレーベンシュタイン距離を測定する真値類似度測定部203と、真値類似度測定部203の測定結果、類似度が0の真値が存在しない場合、文字認識部201の文字認識結果と誤認識パターンDB302内の真値に対応する誤認識パターンとのレーベンシュタイン距離を測定するパターン類似度測定部204と、パターン類似度測定部204の測定結果、レーベンシュタイン距離が最も小さい誤認識パターンを補正候補として決定する補正候補決定部205と、を備える。【選択図】図3

Description

本発明は、補正候補決定装置、補正候補決定方法およびプログラムに関する。
従来、OCR(Optical Character Reader)などの文字認識装置は、帳票などに書かれている文字を自動的に読み取って、文字を自動入力していた。
文字認識装置として、分類器を参照して処理対象の書類に表示されている認識するべき文字列に対する正解文字に対応付けられている認識文字列を参照して正解文字列を類推して類推文字列を出力する技術が提案されている(例えば、特許文献1参照)。
また、文字認識装置として、認識文字列と知識辞書に管理されている単語との距離を測定し、測定する距離に基づいて、認識文字列の誤りを修正する技術が提案されている(例えば、特許文献2参照)。
特開2016−95662号公報 特開平11−175664号公報
しかしながら、特許文献1及び特許文献2に記載の技術では、正解の文字らしき文字候補を類推することができた場合であっても、文字候補が複数ある場合には、文字候補の絞り込みを行うことができなかった。その結果、文字認識結果の誤認識を補正することができなかった。
本発明は、上記課題に鑑み、文字認識結果の誤認識を補正することができる補正候補決定装置を提供することを目的とする。
本発明の第1の側面である補正候補決定装置は、文字認識結果とデータベース内の真値との類似度を測定する真値類似度測定部と、前記真値類似度測定部の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定するパターン類似度測定部と、前記パターン類似度測定部の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定する補正候補決定部と、を備えることを特徴とする。
本発明の他の側面である補正候補決定方法は、文字認識結果の補正候補を決定する補正候補決定装置の補正候補決定方法であって、前記補正候補決定装置が、前記文字認識結果とデータベース内の真値との類似度を測定し、前記真値との類似度の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定し、前記誤認識パターンとの類似度の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定することを特徴とする。
本発明の他の側面であるプログラムは、文字認識結果の補正候補を決定する補正候補決定装置のコンピュータに、前記文字認識結果とデータベース内の真値との類似度を測定し、前記真値との類似度の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定し、前記誤認識パターンとの類似度の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定する。
本発明の一態様によれば、文字認識結果の誤認識を補正することができる。
本実施の形態における補正候補決定装置を備える帳票処理システムのシステム構成図である。 本実施の形態における補正候補決定装置のハードウェア構成図である。 本実施の形態における補正候補決定装置の機能ブロック図である。 記憶部に記憶されているDBの一例を示す図である。 レーベンシュタイン距離に基づき補正候補を決定する一例を示す図である。 本実施の形態における補正候補決定処理の流れの一例を示すフローチャートである。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。図1は、本実施の形態における補正候補決定装置を備える帳票処理システムのシステム構成図である。
図1に示すように、帳票処理システム1は、画像読取装置2、画像読取装置2と接続された補正候補決定装置3を備える。ここで、本実施の形態の帳票処理システム1は、例えば金融機関や公共機関等に設置されている。また、本実施の形態の帳票処理システム1は、携帯通信端末に内蔵された機能としての画像読取装置2および補正候補決定装置3で構成されることも可能である。
画像読取装置2は、例えば、オーバーヘッドスキャナであり、帳票を光学的に読み取り、補正候補決定装置3に送出する。読み取りの対象となる帳票は、例えば、振込依頼書、入出金伝票など、各種手書き入力する書類である。
補正候補決定装置3は、例えば、ワークステーション、サーバ、パーソナルコンピュータ等のコンピュータの機能を備えており、補正候補決定方法に基づく後述する補正候補決定処理を実行する。
図2は、本実施の形態における補正候補決定装置のハードウェア構成図である。
図2に示すように、補正候補決定装置3は、制御部101、入力装置102、出力装置103、記憶部104、インターフェース(I/F)105がバス106に接続されて構成されている。また、補正候補決定装置3は、図2に示していない他のハードウェア構成を備えていてもよい。
制御部101は、補正候補決定装置3全体を統括的に制御するもので、プログラムを読み込んで補正候補決定処理を実行するCPU(Central Processing Unit)を有する。
入力装置102は、例えば、キーボード、ジョイスティック、ライトペン、マウス、タッチパッド、タッチパネル、トラックボール等、各種のデータや信号等を入力する。
出力装置103は、例えば、LCD(Liquid Crystal Display)等の各種ディスプレイ、プリンタ等、画像やその他の情報を出力する。
記憶部104は、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)等を有する。記憶部104は、補正候補決定装置3が補正候補決定処理を実行するプログラムの他、補正候補決定装置3の各機能を制御し実行するための制御プログラム、画面データなどを記憶する。記憶部104は、補正候補決定装置3がプログラムを実行する際の作業領域を提供する。また、記憶部104は、後述の各種データベース(DB)や、他のデータを記憶してもよい。
インターフェース105は、USB(Universal Serial Bus)等のシリアルインターフェースやイーサネット(登録商標)等のパラレルインターフェース等、画像読取装置2や図示しない外部機器と接続するためのユニットである。
本実施の形態における補正候補決定処理は、前述した補正候補決定装置3によって実行される。
図3は、本実施の形態における補正候補決定装置3の機能ブロック図である。図3に示すように、補正候補決定装置3の制御部101は、文字認識部201、補正可否判定部202、真値類似度測定部203、パターン類似度測定部204、補正候補決定部205、表示制御部206を備える。また、補正候補決定装置3の制御部101は、図3に示していない他の機能構成を備えていてもよい。記憶部104は、カテゴリデータベース(DB)301、誤認識パターンデータベース(DB)302を備える。また、記憶部104は、図3に示していないデータベース(DB)を備えていてもよい。補正候補決定装置3は、コンピュータの機能を備えており、補正候補決定プログラムにしたがって後述する補正候補決定処理を実行する。
文字認識部201は、画像読取装置2を制御して画像読取装置2に画像を読み取らせる。
文字認識部201は、画像読取装置2により読み取られて電子化された帳票画像を取得する。例えば、画像取得部31は、画像読取装置2から振込依頼書、入出金伝票など、各種手書き入力する書類の帳票画像を取得する。文字認識部201は、取得した帳票画像に基づき文字認識処理を行い、文字認識結果を取得する。文字認識部201が取得する文字認識結果として、文字列の候補が取得される。文字認識部201により文字認識結果を取得する文字認識処理については、公知の技術を採用することができるため、詳細については説明を省略する。なお、カテゴリDB301、誤認識パターンDB302は、記憶部104に記憶されているがこの限りではない。例えば、補正候補決定装置3と接続される図示しないサーバに記憶されていてもよい。
記憶部104に記憶されている、カテゴリDB301、誤認識パターンDB302について説明する。図4は、記憶部104に記憶されているDBの一例を示す図である。図4(1)は、カテゴリDB301の一例を示す図である。図4(2)は、誤認識パターンDB302の一例を示す図である。
図4(1)に示すように、カテゴリDB301には、カテゴリの項目ごとに補正可否の情報が格納されている。カテゴリの項目には、「企業名」、「銀行名」、「お振込み先」、「金額」等、帳票内において手書き入力される項目の分類の情報が格納されている。補正可否の情報には、カテゴリの項目ごとに、後述の補正候補決定処理の補正候補の決定対象とするか否かの情報が格納されている。例えば、補正候補決定処理の補正候補の決定対象とするカテゴリの項目には「可」の情報が格納され、補正候補決定処理の補正候補の決定対象としないカテゴリの項目には「不可」の情報が格納されている。例えば、本実施形態では、「金額」のカテゴリの情報は銀行員が任意に変更すべき情報ではないと考えられるため「不可」の情報が設定されている。但し、カテゴリの項目の情報及び補正可否の情報は、任意に設定変更可能である。
図4(2)に示すように、誤認識パターンDB302には、真値の項目ごとに、出現頻度の情報、誤認識パターンの情報が格納されている。図4(2)の実施形態では、説明の便宜上、誤認識パターンDB302は、カテゴリDB301に格納されている1つのカテゴリ(企業名)しか記載していないがこの限りではない。例えば、誤認識パターンDB302は、カテゴリDB301に格納されているすべてのカテゴリごとに複数格納される。真値の情報には、各カテゴリの項目に対し、ユーザが帳票に手書き入力した結果、入力されるべき正しい文字列の候補の情報が格納されている。誤認識パターンの情報には、文字認識部201により文字認識処理を行った結果、真値に対し誤って認識される可能性がある文字認識結果のパターンの情報が、真値の情報ごとに少なくとも1つ格納されている。出現頻度の情報には、文字認識部201により文字認識処理を行った文字認識結果が、各真値に対応する誤認識パターンとして出現する頻度の情報が各真値の情報ごとに格納されている。
補正可否判定部202は、文字認識部201が取得した文字認識結果は補正可であるか否か、すなわち、後述の補正候補決定処理の補正候補の決定対象とするか否かを判定する。具体的には、補正可否判定部202は、カテゴリDB301に格納されているカテゴリのうち、補正可の項目のカテゴリの項目に、文字認識部201が取得した文字認識結果が入力されたか否かを判定する。補正不可のカテゴリの項目に、文字認識部201が取得した文字認識結果が入力された場合には、補正可否判定部202は、他のカテゴリの項目に対し文字認識結果が入力されるまで処理を待機する。補正可のカテゴリの項目に、文字認識部201が取得した文字認識結果が入力された場合には、補正可否判定部202は、文字認識部201が取得した文字認識結果は補正可であると判定する。そして、補正可否判定部202は、当該カテゴリの項目の文字認識結果を補正候補決定部205の補正候補の決定対象として判定する。補正可否判定部202により補正候補決定部205の補正候補の対象を絞り込むことで、必要のない処理を省略し、処理速度の向上を図ることができる。また、「金額」のカテゴリなど、銀行員が任意に変更すべき情報は、補正候補の決定の対象外とすることで、業務上の要請を担保することができる。
真値類似度測定部203は、誤認識パターンDB302を参照して、文字認識部201が取得した文字認識結果と誤認識パターンDB302内の真値との類似度を測定する。具体的には、真値類似度測定部203は、文字認識結果と真値との類似度として、文字認識部201が取得した文字認識結果と誤認識パターンDB302内の真値とのレーベンシュタイン距離を測定する。
以下、文字認識部201が取得した文字認識結果が「ae電力」で、真値が「AB電力」である場合である例について図5を参照して説明する。図5は、レーベンシュタイン距離に基づき補正候補を決定する一例を示す図である。
真値類似度測定部203は、文字認識結果「ae電力」と、誤認識パターンDB302内の真値「AA電力」、「AB電力」、「CB電力」とのレーベンシュタイン距離をそれぞれ算出する。図5(1)は、文字認識結果と真値とのレーベンシュタイン距離の一例を示す図である。算出した結果、図5(1)に示すように、文字認識結果「ae電力」と真値「AA電力」とのレーベンシュタイン距離、文字認識結果「ae電力」と真値「AB電力」とのレーベンシュタイン距離、文字認識結果「ae電力」と「CB電力」とのレーベンシュタイン距離は、それぞれ「2」となる。
パターン類似度測定部204は、真値類似度測定部203の判定結果、類似度が0以外の真値が存在しない場合、文字認識結果と誤認識パターンDB302内の誤認識パターンとの類似度を測定する。具体的には、パターン類似度測定部204は、誤認識パターンとの類似度として文字認識結果とカテゴリDB301内の真値に対応する誤認識パターンとのレーベンシュタイン距離を測定する。
上述の実施形態では、真値類似度測定部203の測定結果、文字認識結果とのレーベンシュタイン距離が「0」の真値は存在しない。このため、パターン類似度測定部204は、文字認識結果と誤認識パターンDB302内の真値に対応する誤認識パターンとのレーベンシュタイン距離を測定する。なお、レーベンシュタイン距離が「0」の真値が存在する場合には、表示制御部206は、レーベンシュタイン距離が「0」の真値をディスプレイに出力する。
文字認識部201が取得した文字認識結果が「ae電力」であるため、パターン類似度測定部204は、文字認識結果「ae電力」と、誤認識パターンDB302内の真値に対応する誤認識パターン「Ade電力」、「Adf電力」、「Adg電力」、「Ae電力」、「Ah電力」、「he電力」、「Ce電力」とのレーベンシュタイン距離を測定する。
補正候補決定部205は、類似度が最も高い誤認識パターンが複数存在するか否かを判定する。類似度が最も高い誤認識パターンが複数存在しない場合には、補正候補決定部205は、パターン類似度測定部204の測定結果、類似度が最も高い誤認識パターンを補正候補として決定する。具体的には、補正候補決定部205は、レーベンシュタイン距離が最も小さい誤認識パターンが複数存在するか否かを判定する。パターン類似度測定部204の測定結果、レーベンシュタイン距離が最も小さい誤認識パターンを補正候補として決定する。
図5(2)は、文字認識結果と誤認識パターンとのレーベンシュタイン距離の一例を示す図である。図5(2)に示すように、文字認識結果「ae電力」と、誤認識パターン「Ade電力」、「Adf電力」、「Adg電力」、「Ae電力」、「Ah電力」、「he電力」、「Ce電力」とのレーベンシュタイン距離は、それぞれ「2」、「3」、「3」、「1」、「2」、「1」、「1」となる。したがって、文字認識結果と誤認識パターンとのレーベンシュタイン距離が最も小さい値は「1」となる。図5(2)に示すように、最も小さいレーベンシュタイン距離となる誤認識パターンは、「Ae電力」、「he電力」、「Ce電力」の3つとなる。
補正候補決定部205は、文字認識結果と誤認識パターンとのレーベンシュタイン距離が小さい順に並べる。そして、レーベンシュタイン距離が最も小さい誤認識パターンを補正候補として決定する。但し、現時点では、図5(3)に示すように、レーベンシュタイン距離が最も小さい誤認識パターンは、3つ存在するため、誤認識パターン「Ae電力」、「he電力」、「Ce電力」の順位は同率「1位」となり、補正候補の順位が決定できない。
このように、類似度が最も高い、すなわち、レーベンシュタイン距離が最も小さい誤認識パターンが複数存在する場合には、図4(2)の誤認識パターンDB302を参照して、補正候補決定部205は、類似度が最も高い、すなわち、レーベンシュタイン距離が最も小さい誤認識パターンの中から、出現頻度が多い順に誤認識パターンを決定する。その結果、図5(4)に示すように、補正候補決定部205は、レーベンシュタイン距離が最も小さい誤認識パターンを出願頻度の順に並べて順位を決定する。
図5(4)の例では、補正候補決定部205は、補正候補として、レーベンシュタイン距離が最も小さい「1」の誤認識パターンのうち、出願頻度「6」の真値を1位、出願頻度「3」の真値を2位、次にレーベンシュタイン距離が小さい「2」の誤認識パターンの真値を3位に決定する。
このように、レーベンシュタイン距離が最も小さい誤認識パターンを補正候補として決定することにより、補正候補の絞り込みを行うことができる。これにより、誤認識を補正することができる。また、誤認識パターンとレーベンシュタイン距離だけで補正候補の順位が決定できない場合であっても、補正候補の順位を出現頻度で判別することができる。これにより、文字認識結果の補正候補の絞り込みを行うことができ、誤認識を補正することができる。
表示制御部206は、補正候補決定部205が決定した補正候補をディスプレイなどの出力装置103に表示する。例えば、帳票のカテゴリを入力する欄に図5(5)の補正候補をピックアップして表示することができる。銀行員等は、ピックアップされた補正候補を選択または参照しながら入力することで、補正作業を容易に行うことができる。
図6は、本実施の形態における補正候補決定処理の流れの一例を示すフローチャートである。本実施の形態における補正候補決定処理は、図1〜5を用いて説明した補正候補決定装置3が補正候補決定処理プログラムにしたがって実行する。
補正候補決定処理プログラムは、図6に示した補正候補決定処理のフローのようにして実行される。補正候補決定処理の対象となる帳票は、上述したように、振込依頼書、入出金伝票など、各種手書き入力する書類である。
はじめに、文字認識部201は、キーボードなどの入力装置102から文字の入力を受け付けるまで処理を待機する(S11:NO)。文字認識部201は、文字の入力を受け付けると(S11:YES)、画像読取装置2を制御して画像読取装置2に画像を読み取らせる。そして、文字認識部201は、画像読取装置2により読み取られて電子化された帳票画像を取得する。文字認識部201は、取得した帳票画像に基づき文字認識処理を行い、文字認識結果(入力文字)を取得する(S12)。
補正可否判定部202は、カテゴリDB301を参照して、文字認識部201が取得した文字認識結果(入力文字)は補正可であるか否か、すなわち、補正候補の決定対象とするか否かを判定する(S13)。
文字認識部201が取得した文字認識結果(入力文字)は補正不可(S13:NO)である場合には、表示制御部206は、文字認識結果(入力文字)を補正せずにそのままディスプレイなどの出力装置103に表示する(S14)。この処理が終了すると、処理はS11に戻る。
文字認識部201が取得した文字認識結果(入力文字)は補正可(S13:YES)である場合には、真値類似度測定部203は、誤認識パターンDB302を参照して、文字認識部201が取得した文字認識結果と誤認識パターンDB302内の真値とのレーベンシュタイン距離を測定する(S15)。
パターン類似度測定部204は、真値類似度測定部203の判定結果、レーベンシュタイン距離が0の真値が存在するか否かを判定する(S16)。真値類似度測定部203の判定結果、レーベンシュタイン距離が0の真値が存在する場合(S16:YES)には、表示制御部206は、レーベンシュタイン距離が0の真値をディスプレイなどの出力装置103に表示する(S22)。この処理が終了すると、処理はS23に進む。
真値類似度測定部203の判定結果、レーベンシュタイン距離が0の真値が存在しない場合(S16:NO)には、パターン類似度測定部204は、文字認識結果と誤認識パターンDB302内の真値に対応する誤認識パターンとのレーベンシュタイン距離を測定する(S17)。
補正候補決定部205は、S17で測定した結果、レーベンシュタイン距離が最も小さい誤認識パターンが複数存在するか否かを判定する(S18)。S17で測定した結果、レーベンシュタイン距離が最も小さい誤認識パターンが複数存在しない場合(S18:NO)には、補正候補決定部205は、レーベンシュタイン距離が最も小さい誤認識パターンを補正候補として決定する(S19)。表示制御部206は、S19で決定した補正候補をディスプレイなどの出力装置103に表示する(S21)。この処理が終了すると、処理はS23に進む。
S17で測定した結果、レーベンシュタイン距離が最も小さい誤認識パターンが複数存在する場合(S18:YES)には、補正候補決定部205は、レーベンシュタイン距離が最も小さい誤認識パターンのうち、出現頻度が最も多い誤認識パターンに対応する真値を補正候補として決定する(S20)。表示制御部206は、S20で決定した補正候補を出現頻度が多い順にディスプレイなどの出力装置103に表示する(S21)。この処理が終了すると、処理はS23に進む。
文字認識部201は、帳票内のすべてのカテゴリに対して文字認識処理が終了したか否かを判定する(S23)。帳票内のすべてのカテゴリに対して文字認識処理が終了していない場合(S23:NO)には、処理はS11に戻り、帳票内のすべてのカテゴリに対して文字認識処理が行われるまで、S11〜S23の処理が繰り返し実行される。これに対し、帳票内のすべてのカテゴリに対して文字認識処理が終了した場合(S23:YES)には、補正候補決定処理は終了となる。
なお、本発明は上述した実施形態そのままに限定されるものではなく、実施段階でのその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素を適宜組み合わせても良い。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。このような、発明の趣旨を逸脱しない範囲内において種々の変形や応用が可能である。
1 :帳票処理システム
2 :画像読取装置
3 :補正候補決定装置
101 :制御部
102 :入力装置
103 :出力装置
104 :記憶部
105 :インターフェース
106 :バス
201 :文字認識部
202 :補正可否判定部
203 :真値類似度測定部
204 :パターン類似度測定部
205 :補正候補決定部
206 :表示制御部
301 :カテゴリデータベース(DB)
302 :誤認識パターンデータベース(DB)

Claims (6)

  1. 文字認識結果とデータベース内の真値との類似度を測定する真値類似度測定部と、
    前記真値類似度測定部の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定するパターン類似度測定部と、
    前記パターン類似度測定部の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定する補正候補決定部と、
    を備えることを特徴とする補正候補決定装置。
  2. 請求項1に記載の補正候補決定装置であって、
    前記補正候補決定部は、前記パターン類似度測定部の測定結果、前記類似度が最も高い誤認識パターンが複数存在する場合には、前記複数の誤認識パターンのうち、出現頻度が最も多い誤認識パターンを前記補正候補として決定する
    ことを特徴とする補正候補決定装置。
  3. 請求項1または2に記載の補正候補決定装置であって、
    前記真値類似度測定部は、前記類似度として前記文字認識結果と前記データベース内の真値とのレーベンシュタイン距離を測定し、
    前記パターン類似度測定部は、前記真値類似度測定部の測定結果、前記レーベンシュタイン距離が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとのレーベンシュタイン距離を測定し、
    前記補正候補決定部は、前記パターン類似度測定部の測定結果、前記レーベンシュタイン距離が最も小さい前記誤認識パターンを補正候補として決定する
    ことを特徴とする補正候補決定装置。
  4. 請求項1から3のいずれかに記載の補正候補決定装置であって、
    前記文字認識結果のカテゴリが、前記補正候補決定部による前記補正候補の決定対象とするか否かを判定する補正可否判定部を更に備える
    ことを特徴とする補正候補決定装置。
  5. 文字認識結果の補正候補を決定する補正候補決定装置の補正候補決定方法であって、前記補正候補決定装置が、
    前記文字認識結果とデータベース内の真値との類似度を測定し、
    前記真値との類似度の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定し、
    前記誤認識パターンとの類似度の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定する
    ことを特徴とする補正候補決定方法。
  6. 文字認識結果の補正候補を決定する補正候補決定装置のコンピュータに、
    前記文字認識結果とデータベース内の真値との類似度を測定し、
    前記真値との類似度の測定結果、前記類似度が0の真値が存在しない場合、前記文字認識結果と前記データベース内の前記真値に対応する誤認識パターンとの類似度を測定し、
    前記誤認識パターンとの類似度の測定結果、前記類似度が最も高い前記誤認識パターンを補正候補として決定する
    処理を実行させることを特徴とするプログラム。
JP2019139443A 2019-07-30 2019-07-30 補正候補決定装置、補正候補決定方法およびプログラム Active JP7215975B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019139443A JP7215975B2 (ja) 2019-07-30 2019-07-30 補正候補決定装置、補正候補決定方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019139443A JP7215975B2 (ja) 2019-07-30 2019-07-30 補正候補決定装置、補正候補決定方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2021022261A true JP2021022261A (ja) 2021-02-18
JP7215975B2 JP7215975B2 (ja) 2023-01-31

Family

ID=74573405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019139443A Active JP7215975B2 (ja) 2019-07-30 2019-07-30 補正候補決定装置、補正候補決定方法およびプログラム

Country Status (1)

Country Link
JP (1) JP7215975B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116758564A (zh) * 2023-08-15 2023-09-15 山东履信思源防伪技术有限公司 一种对比ocr字符识别结果的方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018060474A (ja) * 2016-10-07 2018-04-12 富士通株式会社 地名抽出プログラム、地名抽出装置および地名抽出方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018060474A (ja) * 2016-10-07 2018-04-12 富士通株式会社 地名抽出プログラム、地名抽出装置および地名抽出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116758564A (zh) * 2023-08-15 2023-09-15 山东履信思源防伪技术有限公司 一种对比ocr字符识别结果的方法及系统
CN116758564B (zh) * 2023-08-15 2023-11-10 山东履信思源防伪技术有限公司 一种对比ocr字符识别结果的方法及系统

Also Published As

Publication number Publication date
JP7215975B2 (ja) 2023-01-31

Similar Documents

Publication Publication Date Title
JP6938228B2 (ja) 計算機、文書識別方法、及びシステム
US20220253631A1 (en) Image processing method, electronic device and storage medium
RU2613734C1 (ru) Захват видео в сценарии ввода данных
US10769360B1 (en) Apparatus and method for processing an electronic document to derive a first electronic document with electronic-sign items and a second electronic document with wet-sign items
US12033411B2 (en) Stroke based control of handwriting input
US10755094B2 (en) Information processing apparatus, system and program for evaluating contract
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
JPWO2019008766A1 (ja) 証憑処理システムおよび証憑処理プログラム
JP2019040467A (ja) 画像処理装置およびその制御方法
US11989964B2 (en) Techniques for graph data structure augmentation
US20240296691A1 (en) Image reading systems, methods and storage medium for performing geometric extraction
JP2021043775A (ja) 情報処理装置及びプログラム
US20070230790A1 (en) Character recognition apparatus, method and program
US8010564B2 (en) Logical structure analyzing apparatus, method, and computer product
JP6565661B2 (ja) 画像処理システム、画像類似判定方法および画像類似判定プログラム
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
JP2021022261A (ja) 補正候補決定装置、補正候補決定方法およびプログラム
CN112149402B (zh) 文档对比方法、装置、电子设备和计算机可读存储介质
JP2017033139A (ja) 帳票読取装置、帳票読取方法および帳票読取システム
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
US20170177557A1 (en) Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions
JP6487100B1 (ja) 帳票処理装置及び帳票処理方法
JP2010237909A (ja) 知識補正プログラム、知識補正装置および知識補正方法
JP6250307B2 (ja) 画像情報処理装置及び画像情報処理方法
JP7360660B1 (ja) 情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230119

R150 Certificate of patent or registration of utility model

Ref document number: 7215975

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150