WO2019116466A1 - 情報処理装置、制御方法及び制御プログラム - Google Patents

情報処理装置、制御方法及び制御プログラム Download PDF

Info

Publication number
WO2019116466A1
WO2019116466A1 PCT/JP2017/044739 JP2017044739W WO2019116466A1 WO 2019116466 A1 WO2019116466 A1 WO 2019116466A1 JP 2017044739 W JP2017044739 W JP 2017044739W WO 2019116466 A1 WO2019116466 A1 WO 2019116466A1
Authority
WO
WIPO (PCT)
Prior art keywords
processing
item
parameter
value
candidates
Prior art date
Application number
PCT/JP2017/044739
Other languages
English (en)
French (fr)
Inventor
裕紀 谷崎
満 西川
清人 小坂
Original Assignee
株式会社Pfu
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Pfu filed Critical 株式会社Pfu
Priority to PCT/JP2017/044739 priority Critical patent/WO2019116466A1/ja
Publication of WO2019116466A1 publication Critical patent/WO2019116466A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

複数の項目毎に項目値が表された帳票画像から、所望の項目の項目値をより精度良く検出するための情報を提供することを可能とする。情報処理装置は、複数のサンプル帳票画像における特定項目の項目値に対応する正解値、及び、帳票画像から特定項目の項目値候補を検出する後処理の前に帳票画像の画像処理を行う前処理のための複数のパラメータ候補を記憶する記憶部と、複数のサンプル帳票画像に対して各パラメータ候補を用いて前処理を実行する前処理実行部と、パラメータ候補毎に前処理が実行された複数のサンプル帳票画像を用いて後処理を実行する後処理実行部と、パラメータ候補毎に後処理によって複数のサンプル帳票画像からそれぞれ検出された項目値候補と正解値とを比較してパラメータ候補毎の正解率を算出する算出部と、パラメータ候補の内、正解率が最大であるパラメータ候補を前処理のパラメータとして設定する設定部とを有する。

Description

情報処理装置、制御方法及び制御プログラム
 本開示は、情報処理装置、制御方法及び制御プログラムに関し、特に、複数の項目毎に項目値が表された帳票画像を処理する情報処理装置、制御方法及び制御プログラムに関する。
 生命保険会社では、保険金支払いの際、顧客から送付された医療領収書等の帳票を担当者が手作業によりデータ化している。生命保険会社によっては、顧客から膨大な数の帳票が送付されるため、担当者の業務負担は大きく、帳票のデータ化作業のアシストに対する要望が高まっている。
 入力画像データに基づく文字認識処理を実行し、実行した文字認識処理の確からしさを算出し、算出した確からしさが閾値より低い場合、実行済みの手法と異なる手法を実行する文字認識処理装置が開示されている(特許文献1を参照)。
 また、入力された帳票内の項目名を認識し、認識された項目名に対応するデータ枠を検出し、検出されたデータ枠内の文字列を認識する認識処理を実行する帳票認識装置が開示されている(特許文献2を参照)。この帳票認識装置は、認識処理で認識されなかった項目名がある場合、認識されなかった項目名に対応するデータ枠を再度検出し、検出されたデータ枠の文字列を認識する。
特開2007-86954号公報 特開2008-21068号公報
 一般に、医療領収書等の帳票には複数の項目が含まれており、各帳票は多種多様なフォーマットを有している。このような複数の項目毎に項目値が表された帳票画像を処理する装置において、所望の項目の項目値をより精度良く検出できることが望まれている。
 情報処理装置、制御方法及び制御プログラムの目的は、複数の項目毎に項目値が表された帳票画像から、所望の項目の項目値をより精度良く検出するための情報を提供することを可能とすることにある。
 実施形態の一側面に係る情報処理装置は、複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、後処理のために帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置であって、複数のサンプル帳票画像における特定項目の項目値に対応する正解値、及び、前処理のための複数のパラメータ候補を記憶する記憶部と、複数のサンプル帳票画像に対して、複数のパラメータ候補のそれぞれを用いて、前処理を実行する前処理実行部と、複数のパラメータ候補毎に、前処理が実行された複数のサンプル帳票画像を用いて、後処理を実行する後処理実行部と、複数のパラメータ候補毎に、後処理によって複数のサンプル帳票画像からそれぞれ検出された項目値候補と正解値とを比較して、複数のパラメータ候補毎の正解率を算出する算出部と、複数のパラメータ候補の内、正解率が最大であるパラメータ候補を、前処理のパラメータとして設定する設定部と、を有する。
 また、実施形態の一側面に係る制御方法は、記憶部を有し、複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、後処理のために帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置の制御方法であって、複数のサンプル帳票画像における特定項目の項目値に対応する正解値、及び、前処理のための複数のパラメータ候補を記憶部に記憶し、複数のサンプル帳票画像に対して、複数のパラメータ候補のそれぞれを用いて、前処理を実行し、複数のパラメータ候補毎に、前処理が実行された複数のサンプル帳票画像を用いて、後処理を実行し、複数のパラメータ候補毎に、後処理によって複数のサンプル帳票画像からそれぞれ検出された項目値候補と正解値とを比較して、複数のパラメータ候補毎の正解率を算出し、複数のパラメータ候補の内、正解率が最大であるパラメータ候補を、前処理のパラメータとして設定することを含む。
 また、実施形態の一側面に係る制御プログラムは、記憶部を有し、複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、後処理のために帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置の制御プログラムであって、複数のサンプル帳票画像における特定項目の項目値に対応する正解値、及び、前処理のための複数のパラメータ候補を記憶部に記憶し、複数のサンプル帳票画像に対して、複数のパラメータ候補のそれぞれを用いて、前処理を実行し、複数のパラメータ候補毎に、前処理が実行された複数のサンプル帳票画像を用いて、後処理を実行し、複数のパラメータ候補毎に、後処理によって複数のサンプル帳票画像からそれぞれ検出された項目値候補と正解値とを比較して、複数のパラメータ候補毎の正解率を算出し、複数のパラメータ候補の内、正解率が最大であるパラメータ候補を、前処理のパラメータとして設定することを情報処理装置に実行させる。
 本実施形態によれば、情報処理装置、制御方法及び制御プログラムは、複数の項目毎に項目値が表された帳票画像から、所望の項目の項目値をより精度良く検出するための情報を提供することが可能となる。
 本発明の目的及び効果は、特に請求項において指摘される構成要素及び組み合わせを用いることによって認識され且つ得られるだろう。前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。
実施形態に従った情報処理システム10の概略構成の一例を示す図である。 第1記憶装置110及び第1CPU120の概略構成を示す図である。 第2記憶装置210及び第2CPU220の概略構成を示す図である。 複数のサンプル帳票画像400、401、402の一例を示す図である。 前処理について説明するための模式図である。 前処理のための複数のパラメータ候補600の一例を示す図である。 複数のルールリスト700、701、702の一例を示す図である。 ルール辞書800の一例を示す図である。 設定処理の動作の例を示すフローチャートである。 優先順位設定処理の動作の例を示すフローチャートである。 罫線の形状に関する特徴量について説明するための図である。 項目値の検出処理の動作の例を示すフローチャートである。 認識結果画面の一例を示す図である。 変更処理の動作の例を示すフローチャートである。 最適な前処理パラメータを用いることの意義を説明するための図である。 他の検出装置の第1処理回路320の概略構成を示す図である。 他の情報処理装置の第2処理回路420の概略構成を示す図である。
 以下、本開示の一側面に係る情報処理装置について図を参照しつつ説明する。但し、本開示の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
 図1は、実施形態に従った情報処理システム10の概略構成の一例を示す図である。
 情報処理システム10は、検出装置100と、情報処理装置200とを有する。
 検出装置100及び情報処理装置200は、それぞれ、有線又は無線による通信機能を有し、ネットワーク300に接続され、ネットワーク300を介して相互に通信する。
 検出装置100は、PC(Personal Computer)、ノートPC等の情報処理装置であり、そのユーザである作業者により使用され、複数の項目毎に項目名及び項目値が表された帳票画像を処理する。帳票画像は、帳票を表す画像データであり、帳票は、複数の項目毎に項目名及び項目値が表された文書である。本実施形態では、帳票として多種レイアウトの帳票が使用される。多種レイアウトの帳票とは、複数の異なる機関によって個別に作成され、帳票毎に項目名の記載位置が異なり且つ項目名の類義語が複数存在する帳票のことをいう。帳票画像に対する処理には、前処理、後処理及び認識処理が含まれる。前処理は、後処理及び認識処理の前に、後処理及び認識処理のために帳票画像の画像処理を行う処理である。後処理は、前処理が行われた帳票画像から特定項目の項目値候補を検出する処理である。特定項目とは、電子データとして演算又は出力等の処理を行う必要がある項目である。認識処理は、後処理において検出された項目値候補から特定項目の項目値を特定する処理である。
 なお、検出装置100は、タブレットPC、多機能携帯電話(いわゆるスマートフォン)、携帯情報端末等の携帯可能な装置でもよい。検出装置100は、第1通信装置101と、入力装置102と、表示装置103と、第1記憶装置110と、第1CPU(Central Processing Unit)120とを有する。以下、検出装置100の各部について詳細に説明する。
 第1通信装置101は、TCP/IP(Transmission Control Protocol/Internet Protocol)等の有線の通信インタフェース回路を有する。第1通信装置101は、イーサネット(登録商標)等の通信方式に従って、ネットワーク300と通信接続する。第1通信装置101は、ネットワーク300を介して情報処理装置200から受信したデータを第1CPU120に供給し、第1CPU120から供給されたデータをネットワーク300を介して情報処理装置200に送信する。なお、第1通信装置101は、外部の装置と通信できるものであればどのようなものでもよい。例えば、第1通信装置101は、無線LAN(Local Area Network)通信方式に従って不図示のアクセスポイントを介して情報処理装置200と通信してもよい。または、第1通信装置101は、携帯電話通信方式に従って不図示の基地局装置を介して情報処理装置200と通信してもよい。
 入力装置102は、入力部の一例であり、タッチパネル式の入力装置、キーボード、マウス等の入力デバイス及び入力デバイスから信号を取得するインタフェース回路を有する。入力装置102は、ユーザにより入力された入力データを受け付け、受け付けた入力データに応じた信号を第1CPU120に対して出力する。
 表示装置103は、出力部の一例であり、液晶、有機EL(Electro-Luminescence)等から構成されるディスプレイ及びディスプレイに画像データ又は各種の情報を出力するインタフェース回路を有する。表示装置103は、第1CPU120と接続されて、第1CPU120から出力された画像データをディスプレイに表示する。なお、タッチパネルディスプレイを用いて、入力装置102と表示装置103を一体に構成してもよい。
 第1記憶装置110は、記憶部の一例である。第1記憶装置110は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置110には、検出装置100の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD-ROM(compact disk read only memory)、DVD-ROM(digital versatile disk read only memory)等のコンピュータ読み取り可能な可搬型記録媒体からインストールされてもよい。コンピュータプログラムは、公知のセットアッププログラム等を用いて第1記憶装置110にインストールされる。また、第1記憶装置110には、データとして、前処理パラメータ、ルール辞書及び複数のルールリスト等が記憶される。前処理パラメータ、ルール辞書及びルールリストの詳細については後述する。
 第1CPU120は、予め第1記憶装置110に記憶されているプログラムに基づいて動作する。第1CPU120は、汎用プロセッサであってもよい。なお、第1CPU120に代えて、DSP(digital signal processor)、LSI(large scale integration)等が用いられてよい。また、第1CPU120に代えて、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等が用いられてもよい。
 第1CPU120は、第1通信装置101、入力装置102、表示装置103及び第1記憶装置110と接続され、これらの各部を制御する。第1CPU120は、第1通信装置101を介したデータ送受信制御、入力装置102の入力制御、表示装置103の出力制御及び第1記憶装置110の制御等を行う。また、第1CPU120は、第1通信装置101等から取得した帳票画像を処理する。
 情報処理装置200は、検出装置100が使用する前処理パラメータ及びルール辞書等を生成するサーバである。前処理パラメータは、前処理(帳票画像の画像処理)のためのパラメータであり、前処理において使用される。ルール辞書は、帳票画像から特定項目の項目値を検出するために、使用されるデータである。情報処理装置200は、第2通信装置201と、第2記憶装置210と、第2CPU220とを有する。以下、情報処理装置200の各部について詳細に説明する。
 第2通信装置201は、第1通信装置101と同様の通信インタフェース回路を有し、第1通信装置101と同様の通信方式に従って、ネットワーク300と通信接続する。第2通信装置201は、ネットワーク300を介して検出装置100から受信したデータを第2CPU220に供給し、第2CPU220から供給されたデータをネットワーク300を介して検出装置100に送信する。
 第2記憶装置210は、記憶部の一例である。第2記憶装置210は、第1記憶装置と同様のメモリ装置、固定ディスク装置又は記憶装置等を有する。また、第2記憶装置210には、情報処理装置200の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD-ROM、DVD-ROM等のコンピュータ読み取り可能な可搬型記録媒体からインストールされてもよい。コンピュータプログラムは、公知のセットアッププログラム等を用いて第2記憶装置210にインストールされる。また、第2記憶装置210には、データとして、複数のサンプル帳票画像、各サンプル帳票画像における特定項目の項目値に対応する正解値、前処理のための複数のパラメータ候補、前処理パラメータ、ルール辞書及び複数のルールリスト等が記憶される。各情報の詳細については後述する。
 第2CPU220は、予め第2記憶装置210に記憶されているプログラムに基づいて動作する。第2CPU220は、汎用プロセッサであってもよい。なお、第2CPU220に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
 第2CPU220は、第2通信装置201及び第2記憶装置210と接続され、これらの各部を制御する。第2CPU220は、第2通信装置201を介したデータ送受信制御及び第2記憶装置210の制御等を行う。また、第2CPU220は、前処理パラメータ及びルール辞書を生成する。
 図2は、検出装置100の第1記憶装置110及び第1CPU120の概略構成を示す図である。
 図2に示すように、第1記憶装置110には、受信プログラム111、取得プログラム112、第1前処理実行プログラム113、第1後処理実行プログラム114、認識処理実行プログラム115及び受付プログラム116等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。第1CPU120は、第1記憶装置110に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、第1CPU120は、受信部121、取得部122、第1前処理実行部123、第1後処理実行部124、認識処理実行部125及び受付部126として機能する。
 図3は、情報処理装置200の第2記憶装置210及び第2CPU220の概略構成を示す図である。
 図3に示すように、第2記憶装置210には、第2前処理実行プログラム211、第2後処理実行プログラム212、算出プログラム213、パラメータ設定プログラム214、優先順位設定プログラム215、送信プログラム216、修正値取得プログラム217及び変更プログラム218等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。第2CPU220は、第2記憶装置210に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、第2CPU220は、第2前処理実行部221、第2後処理実行部222、算出部223、パラメータ設定部224、優先順位設定部225、送信部226、修正値取得部227及び変更部228として機能する。
 図4は、情報処理装置200の第2記憶装置210に記憶される複数のサンプル帳票画像400、401、402の一例を示す図である。
 各サンプル帳票画像400、401、402は、前処理パラメータ及びルール辞書を生成するために事前に登録された帳票画像である。図4に示すように、各サンプル帳票画像400、401、402には、複数の項目毎に、各項目に対応する項目名と、各項目名に対応する項目値とが対応付けて表示されている。また、各サンプル帳票画像400、401、402には、特定項目の項目値に対応する正解値が関連付けて記憶される。なお、特定項目が複数あり、特定項目の項目値が複数ある場合、各サンプル帳票画像400、401、402には、各特定項目の項目値に対応する複数の正解値が関連付けて記憶される。
 図4に示す例では、帳票として医療領収書が用いられている。この例では、医療に係る各費用が複数の項目に分類され、項目名として各費用の費用名目が記載され、項目値として各費用の金額が記載されている。また、この例では、特定項目として「患者の負担額」が指定されている。しかしながら、医療領収書のような多種レイアウトの帳票では、同一の項目に対する項目名が帳票毎に異なる可能性がある。図4に示す例では、項目「患者の負担額」に対して、サンプル帳票画像400では項目名「患者負担額」403が用いられ、サンプル帳票画像401では項目名「一部負担金」404が用いられ、サンプル帳票画像402では項目名「合計」405が用いられている。各サンプル帳票画像400、401、402が登録される際に、サンプル帳票画像400、401、402のそれぞれにおける項目「患者の負担額」に対する正解値「15000」が登録者により登録される。
 図5は、前処理について説明するための模式図である。
 図5に示す帳票画像500では、文字501の輪郭がぼけており、文字501が正しく検出されない可能性がある。このような輪郭がぼけた文字501を鮮鋭化するために、検出装置100及び情報処理装置200は、前処理としてエッジ強調処理を実行する。例えば、検出装置100及び情報処理装置200は、エッジ強調処理として、帳票画像にアンシャープマスクフィルタを適用する。
 その場合、検出装置100及び情報処理装置200は、帳票画像内の各注目画素の画素値(輝度値又は色値)を各注目画素の近傍画素(例えば注目画素及び注目画素に隣接する8画素)の画素値の平均値に置換した平滑化画像を生成する。そして、検出装置100及び情報処理装置200は、帳票画像内の各注目画素の画素値を以下の式(1)により算出される算出値に置換した処理画像を生成する。
new=Korg+N×(Korg-Ksmt)   (1)
ここで、Korgは帳票画像内の注目画素の画素値であり、Ksmtは平滑化画像において注目画素に対応する位置に配置された画素の画素値であり、Knewは処理画像において注目画素に対応する位置に配置される画素の画素値である。Nは鮮鋭化係数であり、エッジ強調の度合いを示す。検出装置100及び情報処理装置200は、この鮮鋭化係数をエッジ強調処理の前処理パラメータとして使用する。
 図5に示す処理画像510は、帳票画像500に対してエッジ強調処理が実行された画像を示す。処理画像510では、文字511の輪郭が鮮鋭化されている。
 図5に示す二値化画像520では、文字521がカスレ522を有し(かすんでおり)、文字521が正しく検出されない可能性がある。このようなカスレ522を除去するために、検出装置100及び情報処理装置200は、前処理として二値化処理及び膨張処理を実行する。検出装置100及び情報処理装置200は、二値化処理として、帳票画像(又は処理画像)を二値化した二値化画像を生成する。検出装置100及び情報処理装置200は、帳票画像内の各画素の画素値について、二値化閾値を用いて二値化処理を行い、二値化閾値未満の画素を有効画素(黒色画素)に、二値化閾値以上の画素を無効画素(白色画素)に変換した二値化画像を生成する。なお、検出装置100及び情報処理装置200は、二値化閾値以上の画素を有効画素に、二値化閾値未満の画素を無効画素に変換してもよい。二値化閾値は、予め定められた値(例えば128)にしてもよいし、各入力画像の全画素の輝度値の平均値等にしてもよい。
 次に、検出装置100及び情報処理装置200は、膨張処理として、二値化画像内の有効画素を水平方向、垂直方向及び斜め方向に膨張係数分だけ膨張させることにより膨張画像を生成する。検出装置100及び情報処理装置200は、例えば、二値化画像内の各有効画素から膨張係数の範囲内の画素を有効画素に置換することにより、膨張画像を生成する。なお、検出装置100及び情報処理装置200は、二値化画像内の有効画素を斜め方向には膨張させずに、水平方向及び垂直方向にのみ膨張させてもよい。この膨張係数は、有効画素を膨張させる回数を示す。検出装置100及び情報処理装置200は、この膨張係数を膨張処理の前処理パラメータとして使用する。
 図5に示す膨張画像530は、二値化画像520に対して膨張処理が実行された画像を示す。膨張画像530では、カスレ522が除去されている。
 図5に示す二値化画像540には、ノイズ541が含まれ、文字542が正しく検出されない可能性がある。このようなノイズ541を除去するために、検出装置100及び情報処理装置200は、前処理として二値化処理及びノイズ除去処理を実行する。検出装置100及び情報処理装置200は、ノイズ除去処理として、二値化画像(又は膨張画像)内の各有効画素が他の有効画素と連結しているか否かを判定し、連結している有効画素を一つのグループとしてラベリングする。検出装置100及び情報処理装置200は、水平方向、垂直方向及び斜め方向(8近傍)又は水平方向及び垂直方向(4近傍)に相互に隣接するエッジ画素を連結していると判定する。そして、検出装置100及び情報処理装置200は、水平方向及び垂直方向の両方の大きさがノイズ除去係数以下のグループに含まれる有効画素を無効画素に置換することにより、ノイズ除去画像を生成する。このノイズ除去係数は、二値化画像からノイズとして除去する有効画素のサイズを示す。検出装置100及び情報処理装置200は、このノイズ除去係数を膨張処理の前処理パラメータとして使用する。
 図5に示すノイズ除去画像550は、二値化画像540に対してノイズ除去処理が実行された画像を示す。ノイズ除去画像550では、ノイズ541が除去されている。
 なお、検出装置100及び情報処理装置200は、上記した前処理の内の少なくとも一つを実行すればよく、全ての前処理を実行する必要はない。
 図6は、前処理のための複数のパラメータ候補600の一例を示す図である。
 図6に示すように、第2記憶装置210には、各パラメータ候補の組合せが記憶される。組合せ番号は、各組合せを識別するための番号である。パラメータ候補として、エッジ強調レベル、膨張レベル及びノイズ除去レベル等が記憶される。各レベルは、所定数(例えば5)の段階に設定されている。エッジ強調レベルは、例えば鮮鋭化係数の大きさを示し、鮮鋭化係数が大きい程、レベルが高くなるように定められている。膨張レベルは、膨張係数の大きさを示し、膨張係数が大きい程、レベルが高くなるように定められている。ノイズ除去レベルは、ノイズ除去係数の大きさを示し、ノイズ除去係数が大きい程、レベルが高くなるように定められている。
 図7は、複数のルールリスト700、701、702の一例を示す図である。
 各ルールリスト700、701、702は、情報処理装置200により生成されて第2記憶装置210に記憶されるとともに、検出装置100に送信されて第1記憶装置110に記憶される。図7に示すように、各ルールリスト700、701、702には、各ルールリストを識別するためのルールリストIDが割り当てられる。また、各ルールリスト700、701、702には、複数のルール(図7に示す表の中の各行に対応する情報)が関連付けて規定され、各ルール毎に、ルール番号、優先順位、項目名及び位置情報等が関連付けて規定される。即ち、一つのルールは、一つの項目名に対応する。
 ルール番号は、各ルールを識別するための番号である。優先順位は、各ルールリストを用いて帳票画像から特定項目の項目値を検出する際に、各ルールで規定された項目名が検査される順序を規定するための順位である。優先順位は、後処理によって検出された複数の項目値候補の中から特定項目の項目値を検出するために用いられる。この例では、数値「1」の優先順位が最も高く、数値が大きくなる程、優先順位が低くなるように、各ルールに優先順位が割り当てられている。項目名は、各ルールリストを用いて帳票画像から特定項目の項目値を検出する際に、各ルールにおいて検査される名称である。位置情報は、各サンプル帳票画像における各項目名と各項目名に対応する項目値の表示位置関係を規定するための情報である。位置情報として、例えば項目名に対する項目値の相対位置(例えば、上、下、右、左、右上、右下、左上、左下)が規定される。位置情報は、各ルールリストを用いて帳票画像から特定項目の項目値を検出する際に、各ルールで規定された項目名に対応する項目値を特定するために使用される。
 図8は、ルール辞書800の一例を示す図である。
 ルール辞書800は、情報処理装置200により生成されて第2記憶装置210に記憶されるとともに、検出装置100に送信されて第1記憶装置110に記憶される。図8に示すように、ルール辞書800には、複数の特徴量のそれぞれと、複数のルールリストIDのそれぞれとが関連付けて規定される。
 特徴量は、各サンプル帳票画像における特徴量である。特徴量の詳細については後述する。ルール辞書800では、各ルールリストに適合するサンプル帳票画像の特徴量と、各ルールリストとが関連付けられている。
 図9は、情報処理装置200による前処理パラメータ及び優先順位の設定処理の動作の例を示すフローチャートである。
 以下、図9に示したフローチャートを参照しつつ、情報処理装置200による生成処理の動作の例を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置210に記憶されているプログラムに基づき主に第2CPU220により情報処理装置200の各要素と協働して実行される。
 ステップS101~S107の処理は、第2記憶装置210に記憶されたパラメータ候補600に係る複数の組合せ毎に実行される。最初に、第2前処理実行部221は、第2記憶装置210から何れかの組合せに係るパラメータ候補を読み出す(ステップS101)。
 ステップS102~S105の処理は、第2記憶装置210に記憶されたサンプル帳票画像毎に実行される。第2前処理実行部221は、第2記憶装置210から何れかのサンプル帳票画像を読み出す(ステップS102)。
 次に、第2前処理実行部221は、読み出したサンプル帳票画像に対して、読み出した組合せに係る各パラメータ候補を用いて、各前処理を実行する(ステップS103)。
 次に、第2後処理実行部222は、前処理が実行されたサンプル帳票画像を用いて、後処理を実行する(ステップS104)。第2後処理実行部222は、後処理において、公知のOCR(Optical Character Recognition)技術を利用して、前処理が実行されたサンプル帳票画像に含まれる各項目名を検出する。さらに、第2前処理実行部221は、公知のOCR技術を利用して、そのサンプル帳票画像に含まれる各項目値を特定項目の項目値候補として検出する。
 次に、算出部223は、第2記憶装置210に記憶された全てのサンプル帳票画像に対して処理が実行されたか否かを判定する(ステップS105)。まだ処理が実行されていないサンプル帳票画像が存在する場合、算出部223は、処理をステップS102に戻す。
 一方、全てのサンプル帳票画像に対して処理が実行された場合、算出部223は、ステップS101で読み出した組合せに係るパラメータ候補の正解率を算出する(ステップS106)。算出部223は、後処理によって各サンプル帳票画像からそれぞれ検出された項目値候補と、各サンプル帳票画像と関連付けて記憶された特定項目の項目値に対応する正解値とを比較して、正解率を算出する。算出部223は、正解値が検出された場合、即ち検出された項目値候補に正解値が含まれる場合、正解と判定し、全てのサンプル帳票画像の数に対する、正解と判定されたサンプル帳票画像の数の割合を正解率として算出する。
 なお、特定項目の項目値が複数ある場合、算出部223は、全てのサンプル帳票画像からの複数の正解値の検出率に基づいて正解率を算出する。即ち、算出部223は、全てのサンプル帳票画像に含まれる全ての特定項目の数に対する、正解と判定された特定項目の数の割合を正解率として算出する。例えば、サンプル帳票画像の数が100であり、各サンプル帳票画像に特定項目が4つずつ含まれる場合、全てのサンプル帳票画像について正解と判定された全ての項目の数を400で除算した値が正解率として算出される。これにより、算出部223は、特定項目の項目値が複数ある場合に、高精度に正解率を算出することが可能となる。
 または、算出部223は、各サンプル帳票画像毎の複数の正解値の検出率に基づいて正解率を算出してもよい。即ち、算出部223は、サンプル帳票画像毎に、各サンプル帳票画像に含まれる特定項目の数に対する、各サンプル帳票画像において正解と判定された特定項目の数の割合を検出率として算出する。そして、算出部223は、全てのサンプル帳票画像の数に対する、検出率が閾値以上であるサンプル帳票画像の数の割合を正解率として算出する。例えば、サンプル帳票画像の数が100であり、各サンプル帳票画像に特定項目が4つずつ含まれ、閾値が75%である場合、3つ以上の特定項目について正解と判定されたサンプル帳票画像の数を100で除算した値が正解率として算出される。この場合も、算出部223は、特定項目の項目値が複数ある場合に、高精度に正解率を算出することが可能となる。
 次に、パラメータ設定部224は、第2記憶装置210に記憶された全ての組合せに係るパラメータ候補に対して処理が実行されたか否かを判定する(ステップS107)。まだ処理が実行されていない組合せに係るパラメータ候補が存在する場合、パラメータ設定部224は、処理をステップS101に戻す。
 一方、全ての組合せに係るパラメータ候補に対して処理が実行された場合、パラメータ設定部224は、複数の組合せに係るパラメータ候補の内、正解率が最大である組合せに係るパラメータ候補を前処理パラメータとして設定する(ステップS108)。
 なお、パラメータ設定部224は、まだ処理が実行されていない組合せに係るパラメータ候補が存在する場合でも、正解率が閾値以上である組合せに係るパラメータ候補が存在する場合、そのパラメータ候補を前処理パラメータとして設定してもよい。この閾値は、100%又は100%に近い値(例えば99%)に設定される。これにより、パラメータ設定部224は、設定処理の処理時間を短縮することが可能となる。
 次に、優先順位設定部225は、優先順位設定処理を実行し(ステップS109)、一連のステップを終了する。優先順位設定処理において、優先順位設定部225は、設定された前処理パラメータを用いて前処理が実行された複数のサンプル帳票画像を用いて、優先順位を設定する。
 図10は、優先順位設定処理の動作の例を示すフローチャートである。図10に示す優先順位設定処理は、図9に示す設定処理のステップS109で実行される。優先順位設定処理では、ステップS108で設定された前処理パラメータを用いて前処理が実行されたサンプル帳票画像に対して処理が実行される。例えば、第2前処理実行部221は、優先順位設定処理を実行する前に、全てのサンプル帳票画像に対してステップS108で設定された前処理パラメータを用いて前処理を実行しておく。なお、第2前処理実行部221は、各サンプル帳票画像に対して処理が実行される直前に、各サンプル帳票画像に対してステップS108で設定された前処理パラメータを用いて前処理を実行してもよい。
 最初に、優先順位設定部225は、ルールリスト及びルール辞書を初期化する(ステップS201)。優先順位設定部225は、全てのサンプル帳票画像から、特定項目に対応し得る全ての項目名を抽出する。なお、特定項目に対応し得る項目名は、事前に登録されていてもよい。優先順位設定部225は、抽出した各項目名に対して、想定し得る全ての位置に対応する位置情報のそれぞれが関連付けられたルールを生成し、生成した全てのルールを含むルールリストを初期ルールリストとして生成する。初期ルールリストでは、各ルールに、任意の順序でルール番号が割り当てられ、優先順位として「不定」が設定される。また、優先順位設定部225は、特徴量及びルールリストIDとして「不定」が設定されたルール辞書を初期ルール辞書として生成する。
 次に、優先順位設定部225は、初期ルールリストから一つのルールを選択する(ステップS202)。
 次に、優先順位設定部225は、選択したルールに基づいて、生成済みのルールリストの何れにも適合していない全てのサンプル帳票画像のそれぞれから項目値を検出する(ステップS203)。ステップS203の処理が最初に実行される場合、優先順位設定部225は、全てのサンプル帳票画像から項目値を検出する。優先順位設定部225は、各サンプル帳票画像に対して後処理を実行し、項目名及び項目値候補を検出する。優先順位設定部225は、後処理で検出された項目名から、選択したルールにおける項目名を抽出する。さらに、優先順位設定部225は、抽出した項目名に対して、選択したルールにおける位置情報に規定された表示位置関係に位置する所定サイズの領域内の項目値を特定する。このように、優先順位設定部225は、ルールリストにおいて規定された表示位置関係に基づいて、各項目名に対応する項目値を検出する。
 次に、優先順位設定部225は、各サンプル帳票画像から検出した各項目値が、各項目値を検出した各サンプル帳票画像に関連付けられた正解値と一致している割合を示す一致率を算出する(ステップS204)。優先順位設定部225は、各サンプル帳票画像から検出した各項目値と、各項目値を検出した各サンプル帳票画像に関連付けられた正解値が一致するか否かを判定し、検出した項目値の数に対する、各正解値と一致する項目値の割合を一致率として算出する。
 次に、優先順位設定部225は、初期ルールリストに含まれる全てのルールについて処理が完了したか否かを判定する(ステップS205)。まだ処理が完了していないルールが存在する場合、優先順位設定部225は、処理をステップS202に戻し、未選択のルールに対して、ステップS202~S204の処理を実行する。
 一方、初期ルールリストに含まれる全てのルールについて処理が完了した場合、優先順位設定部225は、ステップS204で算出した一致率が高い順に優先順位が高くなるように各ルールの優先順位を割り当てたルールリストを生成する(ステップS206)。このように、優先順位設定部225は、複数のルールリストの何れにも適合しない各サンプル帳票画像において、正解値に対応している割合が高い項目名ほど、優先順位が高くなるようにルールリストを生成する。また、優先順位設定部225は、生成したルールリストにルールリストIDを割り当てる。
 次に、優先順位設定部225は、生成済みのルールリストの何れにも適合していないサンプル帳票画像の中から一つのサンプル帳票画像を選択する(ステップS207)。
 次に、優先順位設定部225は、ステップS206で生成されたルールリストに基づいて、選択したサンプル帳票画像から項目値を抽出する(ステップS208)。優先順位設定部225は、公知のOCR技術を利用して、ルールリストに規定された優先順位の順(優先順位が高い順)に、ルールリストに規定された各項目名がサンプル帳票画像に含まれるか否かを順次判定していく。優先順位設定部225は、最初に含まれると判定された項目名に対して、その項目名に関連付けられた位置情報に規定された表示位置関係に位置する所定サイズの領域から項目値を検出し、検出した項目値をその項目名に対応する項目値として抽出する。
 次に、優先順位設定部225は、抽出した項目値と、選択したサンプル帳票画像に関連付けられた正解値とが一致するか否かを判定する(ステップS209)。
 項目値と正解値とが一致しない場合、優先順位設定部225は、ステップS206で生成されたルールリストと、ステップS207で選択されたサンプル帳票画像が適合しないと判定し、処理をステップS213に移行する。
 一方、項目値と正解値とが一致する場合、優先順位設定部225は、ステップS206で生成されたルールリストと、ステップS207で選択されたサンプル帳票画像が適合すると判定する(ステップS210)。
 次に、優先順位設定部225は、ルールリストに適合すると判定されたサンプル帳票画像から特徴量を算出する(ステップS211)。優先順位設定部225は、サンプル帳票画像の特徴量として、罫線の形状に関する特徴量に関する特徴量を算出する。
 図11は、罫線の形状に関する特徴量について説明するための図である。
 図11に示すように、帳票画像1100に表1101が含まれる場合、表1101を構成する各罫線1102によって形状の異なる複数の頂点1103又は交点1104が形成される。優先順位設定部225は、形状の異なる頂点1103及び交点1104毎に、各形状を有する頂点1103及び交点1104の数を計数する。優先順位設定部225は、各形状を有する頂点1103及び交点1104の数を要素とするヒストグラム(特徴ベクトル)1110を帳票画像1100の特徴量として算出する。優先順位設定部225は、罫線の形状に関する特徴量を用いることにより、表が含まれる可能性の高い多種レイアウトの各帳票を高精度に識別することができる。
 なお、優先順位設定部225は、サンプル帳票画像に含まれる特定の形状を有するロゴの数、又は、特定の文字列の数等、他の特徴量をサンプル帳票画像の特徴量としてもよい。また、情報処理装置200は、各サンプル帳票画像の特徴量を事前に算出しておき、第2記憶装置210に記憶しておいてもよい。その場合、優先順位設定部225は、第2記憶装置210から各サンプル帳票画像の特徴量を取得する。これにより、優先順位設定部225は、生成処理にかかる処理負荷を低減し、より短時間でルール辞書を生成することが可能となる。
 次に、優先順位設定部225は、算出した特徴量を、ステップS206で生成されたルールリストのルールリストIDと関連付けてルール辞書に記憶(追加)する(ステップS212)。
 なお、優先順位設定部225は、算出した特徴量が過去に算出した特徴量と一致する場合、ルール辞書の更新を省略する。また、優先順位設定部225は、算出した特徴量が過去に算出した特徴量と類似する場合も、ルール辞書の更新を省略してもよい。その場合、優先順位設定部225は、算出した特徴量と、過去に算出した特徴量の類似度が閾値以上である場合に、二つの特徴量が類似すると判定する。類似度は、例えば各特徴量(特徴ベクトル)のユークリッド距離の逆数、又は、コサイン類似度等である。また、優先順位設定部225は、算出した特徴量が過去に算出した特徴量と一致又は類似する場合、ルール辞書に既に記憶されている、その特徴量に関連付けられたルールリストIDを新たに生成したルールリストのルールリストIDに更新(上書き)してもよい。
 また、優先順位設定部225は、算出した特徴量に特徴量IDを割り当てて、割り当てた特徴量IDをルールリストIDと関連付けてルール辞書に記憶してもよい。例えば、優先順位設定部225は、算出した特徴量(特徴ベクトル)の各要素を所定の有効桁数に丸めた値(ベクトル)を特徴量IDとして使用する。なお、優先順位設定部225は、算出した特徴量(特徴ベクトル)を正規化した値(ベクトル)を特徴量IDとして使用してもよい。
 次に、優先順位設定部225は、生成済みのルールリストの何れにも適合していない全てのサンプル帳票画像についてステップS207~S212の処理が完了したか否かを判定する(ステップS213)。まだ処理が完了していないサンプル帳票画像が存在する場合、優先順位設定部225は、処理をステップS207に戻し、未選択のサンプル帳票画像に対して、ステップS207~S212の処理を実行する。
 一方、各サンプル帳票画像について処理が完了した場合、優先順位設定部225は、全てのサンプル帳票画像が生成済みのルールリストの何れかと適合したか否かを判定する(ステップS214)。生成済みのルールリストの何れにも適合しないサンプル帳票画像が存在する場合、優先順位設定部225は、処理をステップS202に戻す。この場合、優先順位設定部225は、ステップS202~S206の処理により、生成済みのルールリストの何れにも適合していないサンプル帳票画像に基づいて、新たなルールリストを生成する。一方、優先順位設定部225は、ステップS207~S212の処理により、新たに生成されたルールリストを用いて、ルール辞書を更新する。
 一方、全てのサンプル帳票画像が生成済みのルールリストの何れかと適合した場合、優先順位設定部225は、一連のステップを終了する。優先順位設定処理が終了した時点で第2記憶装置210に記憶されているルール辞書が、第2後処理実行部222により生成されたルール辞書となる。
 なお、特定項目の項目値が複数ある場合、情報処理装置200は各特定項目についてルール辞書及びルールリストを生成する。
 また、ルール辞書が生成された後にサンプル帳票画像が新たに追加された場合、優先順位設定部225は、新たに追加されたサンプル帳票画像に基づいて、新たなルールリストを生成する。その場合、優先順位設定部225は、新たに追加されたサンプル帳票画像を、生成済みのルールリストの何れにも適合していないサンプル帳票画像として、ステップS202~S206の処理を実行し、新たなルールリストを生成する。一方、優先順位設定部225は、ステップS207~S212の処理により、新たに生成されたルールリストを用いて、ルール辞書を更新する。但し、新たに生成されたルールリストが生成済みのルールリストの何れかと同一である場合、優先順位設定部225は、その生成済みのルールリストを用いて、ルール辞書を更新する。
 なお、ルール辞書の作成方法は、上記したものに限定されない。例えば、優先順位設定部225は、ステップS209において項目値と正解値とが一致しなかった場合、対象のルールリストから正解値に対応する項目名を抽出し、その項目名の優先順位が最も高くなるルールリストを生成してもよい。その場合、優先順位設定部225は、対象のサンプル帳票画像から算出した特徴量を、新たに生成したルールリストのルールリストIDと関連付けてルール辞書に記憶(追加)する。
 図12は、検出装置100による帳票画像からの項目値の検出処理の動作の例を示すフローチャートである。
 以下、図12に示したフローチャートを参照しつつ、検出装置100による検出処理の動作の例を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置110に記憶されているプログラムに基づき主に第1CPU120により検出装置100の各要素と協働して実行される。
 最初に、受信部121は、第1通信装置101を介して情報処理装置200に、前処理パラメータ、ルール辞書及びルールリストの取得を要求する取得要求を送信する。受信部121は、第1通信装置101を介して情報処理装置200から前処理パラメータ、ルール辞書及びルールリストを受信する(ステップS301)。なお、情報処理装置200の送信部226は、検出装置100から取得要求を受信すると、事前に設定された前処理パラメータ、ルール辞書及びルールリストを第2記憶装置210から読出し、第2通信装置201を介して検出装置100に送信する。受信部121は、受信した前処理パラメータ、ルール辞書及びルールリストを第1記憶装置110に記憶する。なお、検出装置100は、事前に前処理パラメータ、ルール辞書及びルールリストを取得して第1記憶装置110に記憶しておいてもよい。
 次に、取得部122は、第1通信装置101を介して不図示の画像読取装置から、項目値を検出する対象となる帳票画像を取得する(ステップS302)。なお、取得部122は、USB(Universal Serial Bus)等の不図示のインタフェース回路を介して、画像読取装置から帳票画像を取得してもよい。または、検出装置100が撮像装置を有し、取得部122は、撮像装置により帳票を撮像して帳票画像を取得してもよい。
 次に、第1前処理実行部123は、図9のステップS103の処理と同様にして、取得した帳票画像に対して、受信した前処理パラメータを用いて、各前処理を実行する(ステップS303)。
 次に、第1後処理実行部124は、図9のステップS104の処理と同様にして、前処理が実行された帳票画像を用いて、後処理を実行する(ステップS304)。
 次に、認識処理実行部125は、図10のステップS211の処理と同様にして、前処理が実行された帳票画像から特徴量を算出する(ステップS305)。認識処理実行部125は、情報処理装置200の優先順位設定部225が算出する特徴量と同じ特徴量を算出する。なお、優先順位設定部225が、特徴量IDをルールリストIDと関連付けてルール辞書に記憶している場合、認識処理実行部125は、優先順位設定部225と同じ方式により、算出した特徴量に特徴量IDを割り当てる。その場合、検出装置100は、特徴量の代わりに特徴量IDを用いて以下の処理を実行する。
 次に、認識処理実行部125は、第1記憶装置110に記憶されたルール辞書に、算出した特徴量が記憶されているか否かを判定する(ステップS306)。なお、認識処理実行部125は、ルール辞書に、算出した特徴量と同一の特徴量だけでなく、類似する特徴量が記憶されている場合も、算出した特徴量が記憶されていると判定してもよい。その場合、認識処理実行部125は、算出した特徴量と、ルール辞書に記憶されている特徴量の類似度が閾値以上である場合に、二つの特徴量が類似すると判定する。類似度は、例えば各特徴量(特徴ベクトル)のユークリッド距離の逆数、又は、コサイン類似度等である。
 ルール辞書に、算出した特徴量が記憶されている場合、認識処理実行部125は、ルール辞書において、その特徴量に関連付けられたルールリストIDに対応するルールリストを抽出する(ステップS307)。
 一方、ルール辞書に、算出した特徴量が記憶されていない場合、即ち、その特徴量に関連付けられたルールリストが存在しない場合、認識処理実行部125は、ルール辞書から、代替ルールリストを抽出する(ステップS308)。認識処理実行部125は、例えば、ルール辞書において最も多くの特徴量に関連付けられたルールリストを代替ルールリストとして抽出する。これにより、認識処理実行部125は、ルール辞書に特徴量が登録されていないような帳票画像からも、特定項目の項目値を精度良く検出することが可能となる。なお、認識処理実行部125は、他の条件によって代替ルールリストを抽出してもよい。
 次に、認識処理実行部125は、抽出したルールリストに基づいて、帳票画像から項目値を検出する(ステップS309)。認識処理実行部125は、ルールリストに規定された優先順位の順(優先順位が高い順)に、ルールリストに規定された各項目名がステップS304の後処理で検出されたか否かを順次判定していく。さらに、認識処理実行部125は、最初に検出されたと判定された項目名に対して、その項目名に関連付けられた位置情報に規定された表示位置関係に位置する所定サイズの領域内の項目値を特定し、その項目名に対応する項目値として検出する。このように、認識処理実行部125は、ルールリストにおいて規定された表示位置関係に基づいて、各項目名に対応する項目値を検出する。
 次に、認識処理実行部125は、検出した項目値を含む認識結果画面を表示装置103に表示することにより、その項目値を出力する(ステップS310)。
 図13は、認識結果画面の一例を示す図である。
 図13に示すように、認識結果画面1300には、特定項目毎に、項目1301、認識結果1302、修正ボタン1303及び確定ボタン1304等が表示される。帳票画像から検出された各項目の項目値は、各項目1301と対応付けて認識結果1302として表示される。ユーザにより入力装置102を用いて修正ボタン1303が押下されると、認識結果1302が作業者により修正(編集)可能となる。また、ユーザにより入力装置102を用いて確定ボタン1304が押下されると、帳票画像から検出された各項目の項目値が、認識結果1302において指定された修正値に修正される。なお、項目毎に表示される修正ボタン1303及び確定ボタン1304の代わりに、全ての項目に共通に用いられる一つの修正ボタン及び確定ボタンが表示されてもよい。その場合、修正ボタンが押下されると、全ての認識結果1302が作業者により修正(編集)可能となり、確定ボタンが押下されると、各認識結果1302において指定された全ての修正値が項目値に反映される。
 なお、認識処理実行部125は、項目値を表示装置103に表示する代わりに、第1通信装置101を介して、帳票に係る各情報を集約するサーバ等に送信することにより、項目値を出力してもよい。
 次に、受付部126は、ユーザにより入力装置102を用いて確定ボタン1304が押下されることにより、ユーザによる、認識結果画面1300に表示された項目値の修正指示を受け付けたか否かを判定する(ステップS311)。ユーザによる修正指示が受け付けられなかった場合、検出装置100は、一連のステップを終了する。
 一方、ユーザによる修正指示が受け付けられた場合、受付部126は、エラー情報を第1通信装置101を介して情報処理装置200に送信し(ステップS312)、一連のステップを終了する。エラー情報には、修正指示を受け付けた項目の項目名及び修正値と、対象の帳票画像と、後処理において検出された項目名及び項目値候補と、これまでに処理した帳票画像の処理数等が含まれる。
 なお、特定項目の項目値が複数ある場合、検出装置100は、各特定項目毎に、各帳票画像から各特定項目の項目値を検出する。
 図14は、情報処理装置200による変更処理の動作の例を示すフローチャートである。
 以下、図14に示したフローチャートを参照しつつ、情報処理装置200による変更処理の動作の例を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置210に記憶されているプログラムに基づき主に第2CPU220により情報処理装置200の各要素と協働して実行される。
 最初に、修正値取得部227は、第2通信装置201を介して検出装置100からエラー情報を受信するまで待機する。修正値取得部227は、エラー情報を受信した場合、受信したエラー情報から、修正指示を受け付けた項目の項目名及び修正値と、対象の帳票画像と、後処理において検出された項目名及び項目値候補と、これまでに処理した帳票画像の処理数等を取得する(ステップS401)。この修正値は、設定された前処理パラメータ及び優先順位を用いて帳票画像から検出された特定項目の項目値に対して利用者により修正された修正値である。
 次に、変更部228は、修正値が、後処理において検出された複数の項目値候補に含まれるか否かを判定する(ステップS402)。
 修正値が項目値候補に含まれる場合、変更部228は、検出した項目値が誤っていた原因が後処理にあると判定し(ステップS403)、一連のステップを終了する。
 なお、この場合、変更部228は、エラー情報に含まれる帳票画像を新たなサンプル帳票画像とし、修正値をそのサンプル帳票画像に対応する正解値として第2記憶装置210に追加し、ルール辞書を更新して各優先順位を変更してもよい。
 または、変更部228は、第2記憶装置210に記憶されたルールリストの中から、エラー情報に含まれる帳票画像に対応するルールリストを抽出してもよい。その場合、変更部228は、第2記憶装置210に記憶されたルールリストの中から、後処理において検出された項目名の内、規定された優先順位が最も高い項目名に対応する項目値が修正値と一致するルールリストを抽出する。そして、変更部228は、エラー情報に含まれる帳票画像の特徴量を、抽出したルールリストのルールリストIDと関連付けてルール辞書に記憶する。
 一方、修正値が複数の項目値候補に含まれない場合、変更部228は、検出した項目値が誤っていた原因が前処理にあると判定し、前処理エラー回数をインクリメント(+1)する(ステップS404)。
 次に、変更部228は、これまでに処理された帳票画像の処理数に対する、前処理エラー回数の割合を、前処理エラー率として算出する(ステップS405)。なお、変更部228は、一つの検出装置100だけでなく、過去にエラー情報を受信した全ての検出装置100による全処理数に対する、全ての検出装置100で発生した全前処理エラー回数の割合を前処理エラー率として算出してもよい。
 次に、変更部228は、算出した前処理エラー率が閾値より大きいか否かを判定する(ステップS406)。この閾値は、予め所定値(例えば10%)に設定される。なお、この閾値は、運用中にユーザにより変更されてもよい。
 前処理エラー率が閾値以下である場合、変更部228は、特に処理を実行せずに一連のステップを終了する。一方、前処理エラー率が閾値より大きい場合、変更部228は、エラー情報に含まれる帳票画像を新たなサンプル帳票画像とし、修正値をそのサンプル帳票画像に対応する正解値として第2記憶装置210に追加する。そして、変更部228は、図9に示した設定処理を再実行し、各前処理パラメータ及び各優先順位を変更し、第2記憶装置210に記憶する(ステップS407)。
 なお、この場合、検出した項目値が誤っていた原因は前処理にあると推定されるので、変更部228は、ステップS109の優先順位設定処理を省略し、前処理パラメータの変更のみを行ってもよい。これにより、情報処理装置200は、変更処理の処理時間を短縮し、処理負荷を低減させることが可能になる。
 また、情報処理装置200は、閾値を0%に設定し、修正値が複数の項目値候補に含まれない場合、即ち検出した項目値が誤っていた原因が前処理にある場合は、常に、設定処理を再実行して前処理パラメータを変更してもよい。
 また、変更部228は、前処理エラー率を算出する際に用いた処理数の対象となる全ての帳票画像を検出装置100から取得し、取得した各帳票画像をサンプル帳票画像として設定処理を再実行してもよい。これにより、変更部228は、検出装置100の実際の運用に適した前処理パラメータ又はルール辞書を生成することができる。
 次に、変更部228は、前処理エラー回数をリセットし(ステップS408)、一連のステップを終了する。なお、運用中のエラー率を継続して監視するため、変更部228は、帳票画像の処理数についてはリセットしない。変更処理が繰り返されるたびに、前処理パラメータ及び優先順位の精度が高くなるとともに、設定処理が再実行される頻度は低下するため、情報処理装置200は、変更処理の処理時間を短縮し、処理負荷を低減させることが可能になる。
 このように、変更部228は、修正値が項目値候補に含まれない場合は前処理パラメータを変更し、修正値が項目値候補に含まれる場合は優先順位を変更する。これにより、変更部228は、前処理パラメータ又は優先順位を効率良く更新することが可能になる。
 また、図14に示した変更処理は、情報処理装置200により実行されるのではなく、各検出装置100により実行されてもよい。その場合、各検出装置100は、各装置が処理対象としている帳票画像に特化して前処理パラメータ及び優先順位を調整することができ、特定項目の項目値の検出精度を向上させることが可能となる。また、検出装置100は、受付部126が修正指示を受信するたびに変更処理を実行するのではなく、夜間等の運用停止中に変更処理を実行してもよい。これにより、検出装置100は、可用性を向上させることが可能となる。一方、情報処理装置200が変更処理を実行する場合、検出装置100は、変更処理の実行中でも稼働し続けることができ、可用性をより向上させることが可能となる。
 図15は、最適な前処理パラメータを用いて前処理を実行することの意義を説明するための図である。
 図15に示す画像1500は、適切でない前処理パラメータを用いて前処理が実行された帳票画像の一例であり、画像1510は、適切な前処理パラメータを用いて前処理が実行された帳票画像の一例である。帳票画像1500、1510における特定項目の項目名は「患者負担額」である。帳票画像1500には、ノイズ1501が含まれている。そのため、図12のステップS304において、検出装置100の第1後処理実行部124は、画像1500に対して後処理を実行したときに、特定項目の項目名「患者負担額」を検出できず、正解値である項目値「2640」を検出できない。
 また、図10のステップS208において、情報処理装置200の優先順位設定部225は、画像1500から、特定項目の項目名「患者負担額」を検出できず、正解値である項目値「2640」を検出できない。そのため、優先順位設定部225は、特定項目の項目名「患者負担額」の優先順位が高くなるように設定したルール辞書を作成できない可能性がある。したがって、図12のステップS309において、検出装置100の認識処理実行部125は、ノイズ1501が含まれない帳票画像1510からも、特定項目の項目名「患者負担額」に対応する項目値「2640」を検出できない可能性がある。
 一方、第1前処理実行部123が最適な前処理パラメータを用いて前処理を実行することにより、帳票画像1500からノイズ1501が除去され、第1後処理実行部124は、後処理において項目値「2640」を検出できるようになる。また、優先順位設定部225は、最適な前処理パラメータを用いて前処理が実行されてノイズ1501が除去されたサンプル帳票画像を用いることにより、特定項目の項目名「患者負担額」の優先順位が高くなるように設定したルール辞書を作成できるようになる。そのため、認識処理実行部125は、帳票画像1510から特定項目の項目名「患者負担額」に対応する項目値「2640」を検出できるようになる。
 以上詳述したように、情報処理装置200は、サンプル帳票画像を利用して、複数のパラメータ候補毎に前処理を実行し、その後の後処理において最も良好に項目値候補を検出することができたパラメータ候補を前処理パラメータとして設定する。これにより、情報処理装置200は、複数の項目毎に項目値が表された帳票画像から、特定項目の項目値をより精度良く検出するための情報を提供することが可能となった。
 項目値を検出すべき帳票には、コピーが繰り返し行われて文字がかすんでいたり、ノイズが発生していたり、又は、印刷が不鮮明に行われて文字がかすれているような低画質な帳票が含まれ得る。一般に、医療領収書等の帳票には複数の項目が含まれており、各帳票は多種多様なフォーマットを有している。このような帳票からは、予め定められた領域から項目値を検出する、いわゆる定型OCR方式では、特定項目の項目値を検出することができない。このような帳票から特定項目の項目値を検出するためには、帳票から検出された複数の項目値候補の中から、項目名と項目値の関係に基づいて、特定項目の項目値を特定する、いわゆる準定型OCR方式を利用する必要がある。このような準定型OCR方式では、前処理、後処理及び認識処理の三段階で処理が実行され、一般に、低画質な帳票に対しては前処理のパラメータを調整する必要がある。しかしながら、前処理のパラメータには膨大なパラメータ候補が含まれ、技術的なノウハウを有さないユーザにとって、膨大なパラメータ候補の中から、適切なパラメータを選択することは困難である。
 情報処理装置200は、複数のパラメータ候補毎に前処理を実行し、その後の後処理において最も良好に項目値候補を検出することができたパラメータ候補を前処理パラメータとして設定するので、最適な前処理パラメータを選択することが可能となる。
 また、情報処理装置200は、設定した前処理パラメータを用いて前処理が実行されたサンプル帳票画像を用いて、特定項目の項目値を検出するための優先順位を設定する。これにより、より適切に優先順位が設定され、検出装置100は、特定項目に対応する可能性が高い順に各項目名を検査していくことが可能となり、特定項目の項目値をより精度良く検出することが可能となる。
 図16は、他の実施形態に係る検出装置における第1処理回路320の概略構成を示すブロック図である。
 第1処理回路320は、第1CPU120の代わりに用いられ、第1CPU120の代わりに検出処理を実行する。第1処理回路320は、受信回路321、取得回路322、第1前処理実行回路323、第1後処理実行回路324、認識処理実行回路325及び受付回路326等を有する。
 受信回路321は、受信部の一例であり、受信部121と同様の機能を有する。受信回路321は、第1通信装置101を介して情報処理装置から前処理パラメータ、ルール辞書及びルールリストを受信し、受信した前処理パラメータ、ルール辞書及びルールリストを第1記憶装置110に記憶する。
 取得回路322は、取得部の一例であり、取得部122と同様の機能を有する。取得回路322は、第1通信装置101を介して不図示の画像読取装置から帳票画像を受信し、受信した帳票画像を第1前処理実行回路323に出力する。
 第1前処理実行回路323は、第1前処理実行部の一例であり、第1前処理実行部123と同様の機能を有する。第1前処理実行回路323は、取得回路322から帳票画像を受信し、受信した帳票画像に対して前処理パラメータを用いて前処理を実行し、第1後処理実行回路324に出力する。
 第1後処理実行回路324は、第1後処理実行部の一例であり、第1後処理実行部124と同様の機能を有する。第1後処理実行回路324は、第1前処理実行回路323から前処理が実行された帳票画像を受信し、受信した帳票画像を用いて後処理を実行し、検出した項目値候補を認識処理実行回路325に出力する。
 認識処理実行回路325は、認識処理実行部の一例であり、認識処理実行部125と同様の機能を有する。認識処理実行回路325は、第1後処理実行回路324から項目値候補を受信し、ルール辞書及びルールリストを用いて、受信した項目値候補から特定項目の項目値を検出し、表示装置103に出力する。
 受付回路326は、受付部の一例であり、受付部126と同様の機能を有する。受付回路326は、入力装置102から修正値を受信し、受信した修正値を第1通信装置101を介して情報処理装置200に出力する。
 図17は、他の実施形態に係る情報処理装置における第2処理回路420の概略構成を示すブロック図である。
 第2処理回路420は、第2CPU220の代わりに用いられ、第2CPU220の代わりに設定処理及び変更処理を実行する。第2処理回路420は、第2前処理実行回路421、第2後処理実行回路422、算出回路423、パラメータ設定回路424、優先順位設定回路425、送信回路426、修正値取得回路427及び変更回路428等を有する。
 第2前処理実行回路421は、第2前処理実行部の一例であり、第2前処理実行部221と同様の機能を有する。第2前処理実行回路421は、第2記憶装置210からサンプル帳票画像を読み出し、読み出したサンプル帳票画像に対して、各パラメータ候補を用いて前処理を実行し、第2後処理実行回路422及び優先順位設定回路425に出力する。
 第2後処理実行回路422は、第2後処理実行部の一例であり、第2後処理実行部222と同様の機能を有する。第2後処理実行回路422は、第2前処理実行回路421から前処理が実行されたサンプル帳票画像を受信し、受信したサンプル帳票画像を用いて後処理を実行し、検出した項目値候補を算出回路423に出力する。
 算出回路423は、算出部の一例であり、算出部223と同様の機能を有する。算出回路423は、後処理によって検出された項目値候補と正解値とを比較して、パラメータ候補毎の正解率を算出し、パラメータ設定回路424に出力する。
 パラメータ設定回路424は、パラメータ設定部の一例であり、パラメータ設定部224と同様の機能を有する。パラメータ設定回路424は、各パラメータ候補の内、正解率が最大であるパラメータ候補を前処理パラメータとして第2記憶装置210に記憶し、設定する。
 優先順位設定回路425は、優先順位設定部の一例であり、優先順位設定部225と同様の機能を有する。優先順位設定回路425は、設定された前処理パラメータを用いて前処理が実行された各サンプル帳票画像を用いてルールリストを生成してルール辞書を設定し、第2記憶装置210に記憶することにより、各優先順位を設定する。
 送信回路426は、送信部の一例であり、送信部226と同様の機能を有する。送信回路426は、第2記憶装置210から前処理パラメータ及びルール辞書を読み出し、読み出した前処理パラメータ及びルール辞書を第2通信装置201を介して情報処理装置に送信する。
 修正値取得回路427は、修正値取得部の一例であり、修正値取得部227と同様の機能を有する。修正値取得回路427は、第2通信装置201を介して検出装置からエラー情報を受信して取得し、変更回路428に出力する。
 変更回路428は、変更部の一例であり、変更部228と同様の機能を有する。変更回路428は、変更回路428から修正値を受信し、修正値が項目値候補に含まれるか否かに応じて、各前処理パラメータ又は各優先順位を変更し、第2記憶装置210に記憶する。
 以上詳述したように、検出装置が第1処理回路320を用い、情報処理装置が第2処理回路420を用いる場合においても、情報処理装置は、特定項目の項目値をより精度良く検出するための情報を提供することが可能となった。
 以上、本発明の好適な実施形態について説明してきたが、本発明はこれらの実施形態に限定されるものではない。例えば、設定処理は、情報処理装置200により実行されるのではなく、検出装置100により実行されてもよい。その場合、第1記憶装置110が、第2記憶装置210が記憶する各情報を記憶し、第1CPU120が、図2に示した各部に加えて、第2CPU220の各部と同様の機能を持つ各部を有する。
 また、パラメータ設定部224は、全ての帳票画像に対して共通の前処理パラメータを設定するのではなく、各帳票画像の画像劣化度に応じて前処理パラメータを異ならせてもよい。その場合、算出部223は、サンプル帳票画像毎に画像劣化度を算出する。例えば、算出部223は、サンプル帳票画像の二値化画像に含まれるノイズ(所定サイズ以下の相互に連結する有効画素のグループ)の個数(ノイズ強度)を画像劣化度として算出する。または、算出部223は、各サンプル帳票画像の二値化画像に含まれる、相互に連結する有効画素のグループの個数(カスレ度)を画像劣化度として算出してもよい。算出部223は、画像劣化度を所定範囲毎のグループに分類し、各グループ毎に各パラメータ候補の正解率を算出する。パラメータ設定部224は、各グループ毎に、正解率が最大であるパラメータ候補を前処理パラメータとして設定する。一方、検出装置100の第1前処理実行部123は、帳票画像から画像劣化度を算出し、算出した画像劣化度に対応する前処理パラメータを用いて前処理を実行する。
 これにより、検出装置100は、帳票画像の画像劣化度に応じて、より良好に前処理を実行することができ、特定項目の項目値をより精度良く検出することが可能となる。
 200  情報処理装置
 210  第2記憶装置
 221  第2前処理実行部
 222  第2後処理実行部
 223  算出部
 224  パラメータ設定部
 225  優先順位設定部
 226  送信部
 227  修正値取得部
 228  変更部

Claims (10)

  1.  複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、前記後処理のために前記帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置であって、
     複数のサンプル帳票画像における前記特定項目の項目値に対応する正解値、及び、前記前処理のための複数のパラメータ候補を記憶する記憶部と、
     前記複数のサンプル帳票画像に対して、前記複数のパラメータ候補のそれぞれを用いて、前記前処理を実行する前処理実行部と、
     前記複数のパラメータ候補毎に、前記前処理が実行された前記複数のサンプル帳票画像を用いて、前記後処理を実行する後処理実行部と、
     前記複数のパラメータ候補毎に、前記後処理によって前記複数のサンプル帳票画像からそれぞれ検出された項目値候補と前記正解値とを比較して、前記複数のパラメータ候補毎の正解率を算出する算出部と、
     前記複数のパラメータ候補の内、前記正解率が最大であるパラメータ候補を、前記前処理のパラメータとして設定する設定部と、
     を有することを特徴とする情報処理装置。
  2.  前記前処理は、二値化処理及び膨張処理であり、
     前記パラメータは、二値化された画素の内の一方の画素を膨張させる回数である、請求項1に記載の情報処理装置。
  3.  前記前処理は、二値化処理及びノイズ除去処理であり、
     前記パラメータは、二値化された画像からノイズとして除去する有効画素のサイズである、請求項1に記載の情報処理装置。
  4.  前記前処理は、エッジ強調処理であり、
     前記パラメータは、エッジ強調の度合いである、請求項1に記載の情報処理装置。
  5.  前記設定したパラメータを用いて前記前処理が実行された前記複数のサンプル帳票画像を用いて、前記後処理によって検出された複数の項目値候補の中から前記特定項目の項目値を検出するための優先順位を設定する優先順位設定部をさらに有する、請求項1~4の何れか一項に記載の情報処理装置。
  6.  前記設定したパラメータ及び優先順位を用いて帳票画像から検出された前記特定項目の項目値に対して、利用者により修正された修正値を取得する修正値取得部と、
     前記修正値が前記複数の項目値候補に含まれない場合、前記パラメータを変更し、前記修正値が前記複数の項目値候補に含まれる場合、前記優先順位を変更する変更部と、をさらに有する、請求項1~5の何れか一項に記載の情報処理装置。
  7.  前記特定項目の項目値は、複数あり、
     前記記憶部は、前記複数の特定項目の項目値にそれぞれ対応する複数の正解値を記憶し、
     前記算出部は、全ての前記サンプル帳票画像からの前記複数の正解値の検出率に基づいて、前記正解率を算出する、請求項1~6の何れか一項に記載の情報処理装置。
  8.  前記特定項目の項目値は、複数あり、
     前記記憶部は、前記複数の特定項目の項目値にそれぞれ対応する複数の正解値を記憶し、
     前記算出部は、前記複数のサンプル帳票画像毎の前記複数の正解値の検出率に基づいて、前記正解率を算出する、請求項1~6の何れか一項に記載の情報処理装置。
  9.  記憶部を有し、複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、前記後処理のために前記帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置の制御方法であって、
     複数のサンプル帳票画像における前記特定項目の項目値に対応する正解値、及び、前記前処理のための複数のパラメータ候補を前記記憶部に記憶し、
     前記複数のサンプル帳票画像に対して、前記複数のパラメータ候補のそれぞれを用いて、前記前処理を実行し、
     前記複数のパラメータ候補毎に、前記前処理が実行された前記複数のサンプル帳票画像を用いて、前記後処理を実行し、
     前記複数のパラメータ候補毎に、前記後処理によって前記複数のサンプル帳票画像からそれぞれ検出された項目値候補と前記正解値とを比較して、前記複数のパラメータ候補毎の正解率を算出し、
     前記複数のパラメータ候補の内、前記正解率が最大であるパラメータ候補を、前記前処理のパラメータとして設定する、
     ことを含むことを特徴とする制御方法。
  10.  記憶部を有し、複数の項目毎に項目値が表された帳票画像から特定項目の項目値候補を検出する後処理の前に、前記後処理のために前記帳票画像の画像処理を行う前処理のためのパラメータを設定する情報処理装置の制御プログラムであって、
     複数のサンプル帳票画像における前記特定項目の項目値に対応する正解値、及び、前記前処理のための複数のパラメータ候補を前記記憶部に記憶し、
     前記複数のサンプル帳票画像に対して、前記複数のパラメータ候補のそれぞれを用いて、前記前処理を実行し、
     前記複数のパラメータ候補毎に、前記前処理が実行された前記複数のサンプル帳票画像を用いて、前記後処理を実行し、
     前記複数のパラメータ候補毎に、前記後処理によって前記複数のサンプル帳票画像からそれぞれ検出された項目値候補と前記正解値とを比較して、前記複数のパラメータ候補毎の正解率を算出し、
     前記複数のパラメータ候補の内、前記正解率が最大であるパラメータ候補を、前記前処理のパラメータとして設定する、
     ことを前記情報処理装置に実行させることを特徴とする制御プログラム。
PCT/JP2017/044739 2017-12-13 2017-12-13 情報処理装置、制御方法及び制御プログラム WO2019116466A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/044739 WO2019116466A1 (ja) 2017-12-13 2017-12-13 情報処理装置、制御方法及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/044739 WO2019116466A1 (ja) 2017-12-13 2017-12-13 情報処理装置、制御方法及び制御プログラム

Publications (1)

Publication Number Publication Date
WO2019116466A1 true WO2019116466A1 (ja) 2019-06-20

Family

ID=66819135

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/044739 WO2019116466A1 (ja) 2017-12-13 2017-12-13 情報処理装置、制御方法及び制御プログラム

Country Status (1)

Country Link
WO (1) WO2019116466A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0592866U (ja) * 1992-05-22 1993-12-17 日立電子エンジニアリング株式会社 光学情報読取り装置
JPH10222602A (ja) * 1997-01-31 1998-08-21 Oki Electric Ind Co Ltd 光学式文字読取装置
JP2007086954A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム
JP2017068508A (ja) * 2015-09-29 2017-04-06 東芝ソリューション株式会社 帳票処理方法、帳票処理装置、システムおよびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0592866U (ja) * 1992-05-22 1993-12-17 日立電子エンジニアリング株式会社 光学情報読取り装置
JPH10222602A (ja) * 1997-01-31 1998-08-21 Oki Electric Ind Co Ltd 光学式文字読取装置
JP2007086954A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム
JP2017068508A (ja) * 2015-09-29 2017-04-06 東芝ソリューション株式会社 帳票処理方法、帳票処理装置、システムおよびプログラム

Similar Documents

Publication Publication Date Title
CN109948590B (zh) 姿态问题检测方法及装置
CN110555372A (zh) 数据录入方法、装置、设备及存储介质
JP6366024B2 (ja) 画像化された文書からテキストを抽出する方法及び装置
CN107977658B (zh) 图像文字区域的识别方法、电视机和可读存储介质
US20150262030A1 (en) Image processing device, image processing method, and image processing program
US11341739B2 (en) Image processing device, image processing method, and program recording medium
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
WO2017161636A1 (zh) 一种基于指纹的终端支付方法及装置
CN114155546A (zh) 一种图像矫正方法、装置、电子设备和存储介质
US11727701B2 (en) Techniques to determine document recognition errors
CN110765740A (zh) 一种基于dom树的全类型文本替换方法、系统、装置及存储介质
CN113592886A (zh) 建筑图纸的审图方法、装置、电子设备及介质
US9710945B2 (en) Method for cutting out character, character recognition apparatus using this method, and program
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
US20180268212A1 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium
CN112036304A (zh) 医疗票据版面识别的方法、装置及计算机设备
CN110991357A (zh) 一种答案匹配方法、装置和电子设备
CN106663212B (zh) 文字识别装置、文字识别方法以及计算机可读存储介质
CN108090728B (zh) 一种基于智能终端的快递信息录入方法及录入系统
CN111435407A (zh) 错别字的纠正方法、装置、设备及存储介质
CN112819799A (zh) 目标缺陷检测方法及装置、系统、电子设备和存储介质
WO2019116466A1 (ja) 情報処理装置、制御方法及び制御プログラム
CN113610809B (zh) 骨折检测方法、装置、电子设备以及存储介质
JP5278093B2 (ja) 記事関連情報提供方法、装置、プログラム、記録媒体
CN111213157A (zh) 一种基于智能终端的快递信息录入方法及录入系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17934669

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17934669

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP