JP7298330B2 - 情報処理装置、及び情報処理プログラム - Google Patents

情報処理装置、及び情報処理プログラム Download PDF

Info

Publication number
JP7298330B2
JP7298330B2 JP2019116595A JP2019116595A JP7298330B2 JP 7298330 B2 JP7298330 B2 JP 7298330B2 JP 2019116595 A JP2019116595 A JP 2019116595A JP 2019116595 A JP2019116595 A JP 2019116595A JP 7298330 B2 JP7298330 B2 JP 7298330B2
Authority
JP
Japan
Prior art keywords
correction
character string
frame
tendency
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019116595A
Other languages
English (en)
Other versions
JP2021002287A (ja
Inventor
真実 岩成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019116595A priority Critical patent/JP7298330B2/ja
Priority to US16/667,952 priority patent/US11183191B2/en
Publication of JP2021002287A publication Critical patent/JP2021002287A/ja
Application granted granted Critical
Publication of JP7298330B2 publication Critical patent/JP7298330B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2445Alphabet recognition, e.g. Latin, Kanji or Katakana
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、及び情報処理プログラムに関する。
読み取った帳票の文字認識結果に対してユーザが訂正した訂正内容を分析するシステムが知られている。
特許文献1には、業務システムにおける業務データの訂正内容を示す訂正データと、ユーザが定義した分析ルールとが記憶されている記憶部と、前記訂正データを前記業務システムより取得し、前記記憶部に記憶させる訂正データ保存手段と、前記記憶部に記憶されている分析ルールに基づいて前記記憶部に記憶されている訂正データを集計し、集計データを作成する集計手段と、を備えることを特徴とする訂正データ分析システムが開示されている。
特開2011-107820号公報
新たに読み取った帳票にこれまで訂正が行われた文字列が含まれていれば、文字列の訂正内容を分析し、当該文字列に対する訂正後の文字列を訂正候補として表示することで、確認訂正作業を行うユーザの支援が可能になる。
しかしながら、帳票の種類が異なると帳票の利用用途も異なり、利用用途の分野で使用頻度の高い文字列が異なる場合、一方の分野で用いられる文字列が、必ずしも他方の分野でも用いられるとは限られない。したがって、帳票の利用用途を特定することなく、単に文字列の形状の類似性や、帳票に対する過去の訂正実績に応じて文字列の訂正候補を表示した場合、確認訂正作業中の帳票に適さない訂正候補が表示され、意図せず誤った文字列で確認訂正対象の文字列を訂正してしまうことがある。
本発明は、帳票が用いられる分野、または帳票の記載者に関する属性を表す帳票特徴に関係なく、帳票の文字列の認識結果に対する訂正候補を提示する場合と比較して、ユーザによる確認訂正の精度を高めることができる情報処理装置、及び情報処理プログラムを提供することを目的とする。
第1態様に係る情報処理装置はプロセッサを備え、前記プロセッサは、帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定し、特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積し、特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う。
第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサは、文字列が記載された帳票の枠毎に前記帳票特徴を特定し、文字列認識結果に対する過去の訂正傾向を帳票の各々の枠と対応付けて蓄積した上で、受け付けた帳票と同じ種類の帳票の各枠にそれぞれ対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、受け付けた帳票の枠毎に前記訂正候補を表示する制御を行う。
第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記プロセッサは、帳票の枠毎に特定した前記帳票特徴を組み合わせることで推定される組み合わせ特徴を特定し、前記組み合わせ特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積した上で、受け付けた帳票に前記組み合わせ特徴が含まれる場合、蓄積した訂正傾向の中から前記組み合わせ特徴と対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、前記組み合わせ特徴の推定に用いられた前記帳票特徴が対応付けられた枠の文字列に対して、前記訂正候補を表示する制御を行う。
第4態様に係る情報処理装置は、第1態様~第3態様の何れかの態様に係る情報処理装置において、前記プロセッサは、前記訂正候補を2文字以上の文字列で表示する制御を行う。
第5態様に係る情報処理装置は、第4態様に係る情報処理装置において、前記プロセッサは、前記訂正候補を単語単位で表示する制御を行う。
第6態様に係る情報処理装置は、第1態様~第5態様の何れかの態様に係る情報処理装置において、前記プロセッサは、前記訂正候補の表示理由を表示する制御を行う。
第7態様に係る情報処理プログラムは、コンピュータに、帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定する処理と、特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積する処理と、特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う処理を実行させるためのプログラムである。
第1態様及び第7態様によれば、帳票が用いられる分野、または帳票の記載者に関する属性を表す帳票特徴に関係なく、帳票の文字列の認識結果に対する訂正候補を提示する場合と比較して、ユーザによる確認訂正の精度を高めることができる、という効果を有する。
第2態様によれば、帳票毎に帳票特徴を特定する場合と比較して、ユーザによる確認訂正の精度を高めることができる、という効果を有する。
第3態様によれば、単独の枠に対応付けられた帳票特徴のみから訂正候補を表示する場合と比較して、ユーザによる確認訂正の精度を高めることができる、という効果を有する。
第4態様によれば、訂正候補を1文字毎に表示する場合と比較して、文字列の訂正回数を減少させることができる、という効果を有する。
第5態様によれば、訂正候補を1文字毎に表示する場合と比較して、ユーザが文脈を考慮しながら確認訂正を行うことができる、という効果を有する。
第6態様によれば、訂正候補の表示理由を表示することなく、単に訂正候補の文字列を表示する場合と比較して、ユーザによる確認訂正の精度を高めることができる、という効果を有する。
情報処理装置の機能構成例を示すブロック図である。 確認訂正画面の一例を示す図である。 帳票特徴テーブルの一例を示す図である。 訂正傾向テーブルの一例を示す図である。 情報処理装置における電気系統の要部構成例を示す図である。 確認訂正処理の一例を示すフローチャートである。 訂正候補の第1の表示例を示す図である。 訂正候補の第2の表示例を示す図である。 訂正候補の第3の表示例を示す図である。 訂正候補の第4の表示例を示す図である。
以下、本実施の形態について図面を参照しながら説明する。なお、機能が同じ構成要素及び処理には全図面を通して同じ符合を付与し、重複する説明を省略する。
図1は、例えばスキャナ装置等により帳票の内容を光学的に読み取ることで生成された帳票の画像を受け付け、帳票の画像から読み取った文字列の認識結果に対する確認訂正を、本実施の形態に係るユーザの一例である帳票の確認者に促す情報処理装置10の機能構成例を示すブロック図である。図1に示すように、情報処理装置10は、OCR(Optical Character Recognition)認識部11、特定部12、制御部13、UI(User Interface)部14、及び訂正情報DB15を含む。
「帳票」とは、予め定められた書式に従って、特定の事柄についての情報が記録される書類のことであり、例えば項目毎に記載者が内容を記載する枠や領域が含まれる。「項目」とは、例えば記載者の住所や名前といった、記載内容を表す文字列のことである。記載者による枠等への文字列の記載方法は、手書きであってもプリンタ等を用いた印字であってもよい。また、情報処理装置10で処理される帳票の種類に制約はなく、例えば申込書、契約書、及び問診表等、記載者が何らかの内容を記載するようなものであればよい。
以降では一例として、帳票には記載者が内容を記載する枠が項目毎に設けられており、記載者が項目と対応付けられた枠に手書きで項目に対応した内容を記載する例について説明する。記載者が内容を記載する各項目の枠のことを「項目に対応した枠」ということがある。
また、ここでいう「文字列」とは、1文字以上の文字の連なりを意味する。特に1文字からなる文字列のことを「文字」ということにする。
なお、帳票には、記載者が記載する文字列の他、例えば項目名や帳票のタイトルのように予め帳票に印刷されている文字列も存在する。
OCR認識部11は、受け付けた帳票の画像に対してOCR処理を実行し、OCR処理による文字列の認識結果、すなわち文字列認識結果を特定部12に通知する。
図2は、情報処理装置10で受け付ける帳票の画像の一例と、受け付けた帳票の画像に対するOCR認識部11での文字列認識結果を表した確認訂正画面2の一例を示す図である。
確認訂正画面2は例えば帳票画像領域4と確認訂正領域6の2つの領域に分割され、帳票画像領域4には受け付けた帳票の画像が表示され、確認訂正領域6には受け付けた帳票の画像に対する文字列認識結果が表示される。図2に示す確認訂正画面2では、何らかの会員に登録するための会員登録申込用紙を受け付けた例が示されている。
OCR認識部11は、帳票の項目毎に記載者が記載した文字列を認識し、OCR認識部11による文字列認識結果が帳票の項目毎に確認訂正領域6に表示される。
確認訂正領域6において、設問名欄は帳票の項目を表し、スキャン画像/認識結果欄8は項目に対応した枠内の文字列の画像と、当該枠内の文字列の画像からOCR認識部11が認識した文字列認識結果が表示される。スキャン画像/認識結果欄8は上下2段に分かれ、図2の確認訂正画面2の例では、項目に対応した枠内の文字列の画像が上段に表示され、下段には上段に表示された帳票の画像からOCR認識部11が認識した文字列認識結果が表示されている。当然のことながら、枠内の文字列の画像の表示位置と文字列認識結果の表示位置に制約はなく、枠内の文字列の画像を下段に表示し、文字列認識結果を上段に表示してもよい。
スキャン画像/認識結果欄8は、枠内の文字列の画像と文字列認識結果を表示するだけでなく、後述するように、文字列認識結果の確認訂正を行う領域としても利用される。
特定部12は、OCR認識部11から帳票の文字列認識結果を受け付けると、公知の自然言語分析手法を用いて帳票の文字列認識結果を分析して、後述する帳票特徴を特定する。
「帳票特徴」とは、帳票の文字列認識結果から得られる帳票の特徴全般のことであり、受け付けた帳票の記載内容に関する特徴、または帳票の記載者に関する特徴の少なくとも一方が含まれる。
帳票の記載内容に関する特徴とは、帳票のフォーマットや記載内容から推定される帳票の特徴のことであり、具体的には帳票が用いられる分野、項目に対応した枠の配置、及び枠に記載される内容の種類等が含まれる。枠に記載される内容の種類とは、例えばアンケートの回答が記載されているのか、それとも部品の種類を表す部品番号が記載されているのかというように、記載された文字列を内容面から分類した分類結果のことである。
また、帳票の記載者に関する特徴とは、帳票に文字列を記載した記載者全般に関する属性のことであり、例えば帳票の記載者名や、記載者の職業、記載者の居住地、記載者の年齢、及び記載者が属するグループ(例えばジョギングの同好会等)等が含まれる。帳票の記載者に関する特徴は、帳票の文字列認識結果から特定される。例えば帳票に記載者の住所を記入する枠が設けられている場合、特定部12は、住所に対応した枠内の文字列認識結果から記載者の居住地を特定する。このように、特定部12は、帳票の記載者に関する特徴が記載されている項目に対応した枠内の文字列認識結果から、帳票の記載者に関する特徴を特定すればよい。
なお、帳票特徴の特定方法はこれに限られない。例えば帳票の確認者が、後述するUI部14から帳票の記載内容に関する特徴や帳票の記載者に関する特徴を入力してもよい。帳票の記載者に関する特徴が記載されている項目が帳票に存在しない場合には、例えば枠内に記載された文字列の筆跡、内容、及び文章の言葉遣い等から帳票の記載者の年齢、性別、職業、及び居住地といった帳票の記載者に関する特徴を特定してもよい。
また、特定部12は後述するUI部14を介して、帳票の確認者から帳票の文字列認識結果に対する訂正指示を受け付け、帳票の文字列認識結果に対する訂正傾向を特定する。
具体的には、特定部12は訂正前の文字列と訂正後の文字列を対応付けた上で、公知のデータ解析手法を用いて帳票の文字列認識結果に対する訂正傾向を特定する。公知のデータ解析手法としては、例えばクラスタ分析や頻度分析の他、人工知能(Artificial Intelligence:AI)を用いた機械学習や深層学習が利用される。
帳票の文字列認識結果に対する訂正傾向(以降、「帳票の訂正傾向」という)とは、他の文字列の訂正と比較して統計的な有意差が認められるような訂正が見られる場合に、訂正に関するどのような有意差が認められるのかを表した情報である。
帳票の訂正傾向には、例えば文字列の訂正候補、訂正候補として挙げた文字列の候補理由、及び候補理由の分類が含まれる。
文字列の訂正候補には、例えば帳票の確認者が訂正した訂正後の文字列や、特定した訂正傾向から推定した、訂正後の文字列として利用されやすい文字列が含まれる。
文字列の候補理由には、訂正候補が例えば特定の分野の専門用語で用いられやすい文字列であるという情報や、他の文字列に比べて訂正頻度が高い文字列であるといった、訂正候補として表示する表示理由が含まれる。
候補理由の分類には、候補理由がどのような内容を表しているのかを示す情報が含まれる。
特定部12は、特定した帳票特徴及び訂正傾向を訂正情報DB15に通知する。なお、特定部12における帳票特徴及び訂正傾向の特定単位に制約はなく、例えば帳票単位で帳票特徴及び訂正傾向を特定しても、複数の枠を1つの単位として帳票特徴及び訂正傾向を特定してもよい。以降では一例として、項目に対応した枠毎に帳票特徴及び訂正傾向を特定するものとして説明する。したがって、OCR認識部11は、帳票に記載されている項目と項目に対応した枠に記載されている文字列認識結果を対応付けた上で、当該対応付けを識別する識別子(例えば帳票内で一意に割り当てた番号)と共に特定部12に通知する。当該識別子は枠毎に割り当てられるため、「枠番号」ともいう。
訂正情報DB15は、特定部12から受け付けた帳票特徴及び訂正傾向を蓄積する蓄積部の一例である。
訂正情報DB15では、帳票特徴及び帳票の確認者が行った文字列の訂正を管理する帳票特徴テーブル16と、帳票特徴毎における帳票の訂正傾向を管理する訂正傾向テーブル17が蓄積される。
図3は帳票特徴テーブル16の一例を示す図であり、図4は訂正傾向テーブル17の一例を示す図である。
図3に示すように、帳票特徴テーブル16では受け付けた各帳票の枠毎に、例えば辞書名、帳票種類、認識枠位置、認識枠種類、訂正の有無、訂正前文字列、及び訂正後文字列が対応付けられて管理される。このうち、辞書名、帳票種類、認識枠位置、及び認識枠種類が帳票特徴を表し、訂正の有無、訂正前文字列、及び訂正後文字列が文字列の訂正記録を表す。
辞書名には、例えば文字列の訂正候補を特定する上で使用する辞書の名前が設定される。情報処理装置10は複数の辞書を備え、各々の辞書には特定の帳票の種類で使われやすい文字列が登録されている。したがって、帳票の種類が特定されれば、帳票の種類に特化した辞書を用いることで、他の帳票の種類に対応した辞書を用いる場合よりも、当該帳票で用いられやすい文字列が訂正候補として提示されることになる。
また、OCR認識部11は特定部12と連携して、例えば予め定めた辞書を用いて仮のOCR処理を行い、文字列認識結果を特定部12に通知した後、特定部12で帳票の種類から用いるべき辞書が特定された場合に、特定された辞書を用いて改めてOCR処理を実行し直すようにしてもよい。この場合、特定部12で特定された辞書以外の辞書を用いてOCR処理を行う場合に比べて、文字列の認識率が向上することがある。
図3の帳票特徴テーブル16の例では辞書名として「一般」、「医療」、及び「英数字」が設定されている。医療辞書は、受け付けた帳票が医療に関する帳票である場合に用いられる辞書であり、英数字辞書は、受け付けた帳票が英数字の文字列で表されているような帳票に用いられる辞書である。医療辞書には、他の辞書に比べて医療で用いられる文字列が多く登録されており、英数字辞書には、英単語や数字が登録されている。
一般辞書は、例えば受け付けた帳票に適した辞書が見当たらない場合に用いられる辞書である。
帳票種類には、文字列認識結果から特定した帳票の種類が設定される。帳票の種類は、例えば帳票のタイトルや項目名により特定される。
図3の帳票特徴テーブル16の例では帳票種類として「四半期報告」、「手術証明書」、「申込書」、及び「部品検査表」が設定されている。例えば帳票のタイトルや項目名に「四半期」や「報告」といった文字列が含まれている場合、公知の自然言語分析手法により、帳票種類が「四半期報告」に特定される。他の帳票についても同様の手法により帳票種類が特定される。
認識枠位置には、帳票に含まれる各項目に対応した枠を一意に特定する情報が設定される。認識枠位置は、特定部12が枠毎に帳票特徴及び訂正傾向を特定するため、内部的に使用する情報であり、例えば枠毎にOCR認識部11が割り当てた枠番号が設定される。
認識枠種類には、認識枠位置で示される枠内に記載される内容の種類が設定される。認識枠種類は、例えば枠内の文字列認識結果から特定される。
図3の帳票特徴テーブル16の例では認識枠種類として「承認条件」、「術式」、「アンケート」、及び「部品番号」が設定されている。例えば枠内の文字列認識結果に「~することを条件に承認する。」といった、何らかの条件を満たすことと引き換えに承認を行うような文字列が含まれる場合、公知の自然言語分析手法により、帳票枠種類が「承認条件」に特定される。認識枠種類の他の例についても、同様の手法により枠内に記載された内容が分析され、帳票枠種類が特定される。
なお、上記では一例として、情報処理装置10が公知の自然言語分析手法を用いて、項目名や、項目に対応した枠内の文字列認識結果から帳票特徴を特定する例を示したが、帳票の確認者が設定してもよい。
訂正の有無には、帳票の確認者によって、認識枠位置で示される枠内の文字列認識結果が訂正されたか否かが設定される。
訂正前文字列には、OCR認識部11で認識された、帳票の確認者が文字列を訂正する前における認識枠位置で示される枠内の文字列認識結果が設定される。なお、訂正前文字列は、帳票の確認者によって文字列の訂正が行われなかった場合であっても設定される。
訂正後文字列には、認識枠位置で示される枠内の文字列認識結果のうち、帳票の確認者によって訂正された訂正後の文字列が、訂正前の文字列と対応付けられて設定される。例えば帳票の確認者が単語単位で文字列を訂正した場合、訂正後文字列では、訂正後の文字列が訂正前の単語と対応付けられて管理される。具体的には「期来」という単語が「期末」に訂正された場合、「期来」と「期末」が対応付けられて管理される。すなわち、訂正後の単語が訂正前文字列の何れか単語を訂正した文字列であるのかわかるように管理される。なお、説明の便宜上、単語と単語に挟まれるような助詞も例えばひらがな2文字以上で構成される場合があることから、本実施の形態では「単語」ということにする。
一方、図4に示すように、訂正傾向テーブル17では受け付けた各帳票の枠毎に、例えば辞書名、帳票種類、認識枠位置、認識枠種類、訂正候補、分類、及び候補理由が対応付けられて管理される。このうち辞書名、帳票種類、認識枠位置、及び認識枠種類については、既に帳票特徴テーブル16で説明した帳票特徴の各項目が設定され、訂正候補、分類、及び候補理由が帳票の訂正傾向として帳票特徴に対応付けられている。
訂正候補には、認識枠位置で示される枠内の訂正前の文字列認識結果に対して表示される訂正候補の文字列が設定される。図3に示した帳票特徴テーブル16の訂正後文字列と同じく、訂正候補の文字列も訂正前の文字列と対応付けられて設定される。訂正候補が単語単位で設定されていれば、訂正候補に対応する訂正前の単語と対応付けられて管理される。なお、訂正候補の文字列の単位に制約はなく、単語単位の他、文字単位、句単位、または節単位であってもよい。訂正候補の文字列の単位にあわせて、訂正候補が訂正前の文字列と対応付けられて管理される。
また、既に説明したように、分類には候補理由の分類が設定され、候補理由には、訂正候補として設定された文字列が訂正前の対応する文字列の訂正候補として挙げられた理由が設定される。
制御部13は、特定部12で特定された、受け付けた帳票の帳票特徴と同じ帳票特徴を有する帳票の訂正傾向が訂正傾向テーブル17に記録されている場合、受け付けた帳票の帳票特徴と対応付けられている訂正傾向を訂正情報DB15から取得し、取得した訂正傾向に従って、訂正前の文字列認識結果に対する訂正候補を表示するようにUI部14を制御する。
UI部14は、帳票の確認者に図2に示した確認訂正画面2を表示すると共に、OCR認識部11での文字列認識結果に対する帳票の確認者からの訂正指示及び確認指示を受け付ける。
したがって、UI部14は帳票の確認者からの指示を受け付ける入力ユニット14Aと、確認訂正画面2を表示する表示ユニット14Bを備える。
なお、確認指示とは、帳票の確認者が、文字列認識結果が正しいことを確認したことを示す指示であり、文字列認識結果に対する訂正が行われなかったことを表す。以降では、確認指示と訂正指示をあわせて「確認訂正指示」という場合がある。確認訂正指示は帳票特徴及び訂正傾向の特定単位毎に行われるため、本実施の形態のように帳票特徴及び訂正傾向が項目に対応した枠毎に特定される場合、項目に対応した枠毎に確認訂正指示が行われる。
入力ユニット14Aに確認訂正指示が入力されると、確認訂正指示は特定部12に通知され、帳票特徴テーブル16の訂正の有無、訂正後文字列が設定される。なお、文字列認識結果の訂正が行われなかった場合には訂正の有無には「無」が設定され、設定後文字列は空欄となる。
次に、情報処理装置10における電気系統の要部構成例について説明する。
図5は、情報処理装置10における電気系統の要部構成例を示す図である。情報処理装置10は例えばコンピュータ20を用いて構成される。
コンピュータ20は、情報処理装置10に係る各機能部を担うプロセッサの一例であるCPU(Central Processing Unit)21、コンピュータ20を図1に示した各機能部として機能させる情報処理プログラムを記憶するROM(Read Only Memory)22、CPU21の一時的な作業領域として使用されるRAM(Random Access Memory)23、不揮発性メモリ24、及び入出力インターフェース(I/O)25を備える。そして、CPU21、ROM22、RAM23、不揮発性メモリ24、及びI/O25がバス26を介して各々接続されている。
不揮発性メモリ24は、不揮発性メモリ24に供給される電力が遮断されても、記憶した情報が維持される記憶装置の一例であり、例えば半導体メモリが用いられるがハードディスクを用いてもよい。不揮発性メモリ24は、必ずしもコンピュータ20に内蔵されている必要はなく、例えばメモリカードのようにコンピュータ20に着脱される可搬型の記憶装置であってもよい。
I/O25には、例えば通信ユニット27、入力ユニット14A、及び表示ユニット14Bが接続される。
通信ユニット27は図示しない通信回線に接続され、図示しない通信回線に接続される外部装置との間でデータ通信を行う通信プロトコルを備える。帳票の内容を光学的に読み取るスキャナ装置とは、例えば通信ユニット27を介して図示しない通信回線で接続され、情報処理装置10は、図示しない通信回線を通じてスキャナ装置から帳票の画像を取得する。
入力ユニット14Aは、帳票の確認者からの指示を受け付けてCPU21に通知する装置であり、例えばボタン、タッチパネル、キーボード、及びマウス等が用いられる。帳票の確認者の指示が音声で行われる場合、入力ユニット14Aとしてマイクが用いられることがある。
表示ユニット14Bは、CPU21によって処理された情報を表示する装置であり、例えば液晶ディスプレイ、及び有機EL(Electro Luminescence)ディスプレイ等が用いられる。
なお、I/O25に接続されるユニットは図5に示した各ユニットに限定されず、例えば用紙等の記録媒体に画像を形成する画像形成ユニットのような他のユニットを接続してもよい。また、図示しない通信回線を通じてスキャナ装置から帳票の画像を取得せず、例えばメモリカードやUSB(Universal Serial Bus)メモリ等の半導体メモリを媒介して帳票の画像を取得する場合、情報処理装置10は必ずしも通信ユニット27を備える必要はない。
次に、OCR処理が行われた帳票の文字列認識結果に対して、帳票の確認者が確認訂正を行う場合の情報処理装置10の動作について説明する。
図6は、確認訂正の対象となる帳票の画像を受け付けた場合に、情報処理装置10のCPU21によって実行される確認訂正処理の一例を示すフローチャートである。確認訂正処理を規定する情報処理プログラムは、例えば情報処理装置10のROM22に予め記憶されている。情報処理装置10のCPU21は、ROM22に記憶される情報処理プログラムを読み込み、確認訂正処理を実行する。
なお、訂正情報DB15が構築される不揮発性メモリ24には、図3及び図4に示したような帳票特徴テーブル16と訂正傾向テーブル17が記憶され、項目に対応した枠毎に各帳票の帳票特徴と訂正傾向が蓄積されているものとする。なお、不揮発性メモリ24には、1つの種類の帳票について1000枚以上の帳票を確認訂正することで学習された帳票の訂正傾向が帳票特徴と対応付けられて蓄積されていることが好ましい。
ステップS10において、CPU21は受け付けた帳票の画像に対してOCR処理を実行し、帳票に含まれる各項目に対応した枠毎の文字列認識結果を取得する。
ステップS20において、CPU21は、各項目に対応した枠毎の文字列認識結果を用いて、帳票特徴を枠毎に特定する。
ステップS30において、CPU21は、受け付けた帳票の中から選択していない何れかの枠を1つ選択する。説明の便宜上、ステップS30で選択した枠を「選択枠」ということにする。
ステップS40において、選択枠の訂正傾向が訂正傾向テーブル17に存在するか否かを判定する。選択枠の訂正傾向が訂正傾向テーブル17に存在するとは、選択枠に対応する帳票特徴と同じ帳票特徴に対して訂正傾向が設定されていることをいう。選択枠の訂正傾向が存在する場合にはステップS50に移行する。
ステップS50において、CPU21は、選択枠の訂正傾向を訂正傾向テーブル17から取得してステップS70に移行する。
一方、ステップS40の判定処理で、選択枠の訂正傾向が存在しないと判定された場合にはステップS60に移行する。
ステップS60において、CPU21は、選択枠に対応する帳票特徴と類似する帳票特徴に対して対応付けられている訂正傾向を訂正傾向テーブル17から取得して、ステップS70に移行する。選択枠に対応する帳票特徴と類似する帳票特徴とは、ステップS20で特定した選択枠の帳票特徴を構成する全ての項目(図4の例で言えば、辞書名、帳票種類、認識枠位置、及び認識枠種類)についてそれぞれ同じ内容が設定された帳票特徴は存在しないが、帳票特徴を構成する少なくとも1つ以上の項目について同じ内容が設定された帳票特徴のことをいう。
なお、選択枠に対応する帳票特徴と類似する帳票特徴が訂正傾向テーブル17に複数含まれる場合、CPU21は、他の帳票特徴よりも選択枠の帳票特徴と同じ特徴を含む項目の数が多い帳票特徴に対応付けられている訂正傾向を訂正傾向テーブル17から取得すればよい。
これにより、例えば初めて受け付けた種類の帳票や、過去に受け付けたことのある種類の帳票であっても選択枠の記載内容の相違から、認識枠種類が前回とは異なる種類に特定されてしまったような場合であっても、訂正傾向テーブル17から訂正傾向が取得されることになる。
ステップS70において、CPU21は表示ユニット14Bを制御して、受け付けた帳票の画像に対する文字列認識結果が正しいかどうかを帳票の確認者に確認させ、文字列認識結果が帳票に記載されている文字列と異なる場合には訂正を行うように促す確認訂正画面2を表示ユニット14Bに表示する。
図7は、例えば図4に示した訂正傾向テーブル17の1行目の帳票特徴に対応付けられている訂正傾向を取得した場合に、選択枠のスキャン画像/認識結果欄8に表示される表示例を示す図である。なお、図7及び以降で説明する図8~図10では説明の便宜上、スキャン画像/認識結果欄8の下段に選択枠内の文字列の画像を表示し、上段には、下段に表示した文字列の画像から認識した文字列認識結果を表示している。
CPU21は、訂正候補の単位にあわせて、訂正候補が設定されている文字列に相当する文字列の画像部分に下線を表示し、表示した各々の下線に対して、下線で表される文字列の訂正候補を表示した吹き出し32を表示する。したがって、本実施の形態のように訂正候補を単語単位で管理している例の場合、訂正候補が単語単位で表示される。
図7の表示例では、「期来」と認識された文字列に対して、「期末」及び「末期」を含む訂正候補を表示した吹き出し32Aと、「してな」と認識された文字列に対して、「には」及び「では」を含む訂正候補を表示した吹き出し32Bが表示されている。
帳票の確認者が例えばマウスのカーソル34のように、確認訂正画面2の選択位置を指し示す指示体を訂正候補に近づけた場合、CPU21は、カーソル34で指し示された訂正候補の候補理由をポップアップ領域36に表示して、文字列認識結果が記載者によって枠内に記載された本来の正しい文字列となるように訂正するための参考情報を帳票の確認者に提供する。なお、CPU21は、帳票の確認者が訂正候補からカーソル34を遠ざけた場合には、候補理由を表示したポップアップ領域36の表示を中止する。
図8は、例えば図4に示した訂正傾向テーブル17の2行目の帳票特徴に対応付けられている訂正傾向を取得した場合に、選択枠のスキャン画像/認識結果欄8に表示される表示例を示す図である。
図7で説明したように、CPU21は、訂正候補が設定されている文字列に相当する文字列の画像部分に下線を表示し、表示した各々の下線に対して、下線で表される文字列の訂正候補を表示した吹き出し32を表示する。
図4に示した訂正傾向テーブル17の2行目の帳票特徴には、「右願」に対して「右顎」、「下線」に対して「下腺」と「下膽」、及び「睡石」に対して「唾石」の文字列が訂正候補として設定されている。したがって、CPU21は枠内の文字列の画像においてそれぞれ「右願」、「下線」、「睡石」と認識された箇所に下線を表示してもよいが、訂正候補に設定されている文字列のうち、認識された文字列と表記の異なる文字列だけに下線を表示してもよい。
図8はこうした訂正候補の表示方法に対応した場合の表示例を示しており、このうち「右願」の文字列について説明すれば、訂正候補の「右顎」と異なる「願」と認識された箇所にのみ下線が表示され、訂正候補を表示する際も、認識結果と異なる訂正候補の文字列、すなわち「顎」だけが訂正候補として表示されている。「下線」及び「睡石」についても同様の表示方法が適用されている。
図8では、カーソル34が「下線」に対する訂正候補を指し示していることから、ポップアップ領域36には「術式では糸偏でなく、月偏の可能性が高い。」といった「下線」に対する訂正候補の候補理由が表示される。
図9は、例えば図4に示した訂正傾向テーブル17の3行目の帳票特徴に対応付けられている訂正傾向を取得した場合に、選択枠のスキャン画像/認識結果欄8に表示される表示例を示す図である。図9の表示例も図8の表示例と同じく、訂正候補として設定されている文字列のうち、認識された文字列と表記の異なる文字列だけの訂正候補を表示する表示方法がとられている。
図9では、カーソル34が「単悟」に対する訂正候補を指し示していることから、ポップアップ領域36には「言偏の略字。」といった、例えば対応する文字列の画像から得られる手書き文字の特徴と共に、「単悟」に対する訂正候補の候補理由が表示されている。この場合、CPU21は単に訂正傾向テーブル17に設定されている候補理由を表示するだけでなく、候補理由を補足する補足情報38をポップアップ領域36に表示してもよい。図9の表示例の場合、候補理由が言偏の略字であるということから、文字列の画像のどの箇所が言偏の略字となっているのか、該当する箇所の画像を補足情報38に表示している。
図10は、例えば図4に示した訂正傾向テーブル17の4行目の帳票特徴に対応付けられている訂正傾向を取得した場合に、選択枠のスキャン画像/認識結果欄8に表示される表示例を示す図である。
図10では、枠内に記載された先頭の2文字が“28”と認識されているが、当該枠には部品番号が記載されるという帳票特徴、及び部品番号は先頭の2文字が英文字で始まるという訂正傾向の学習結果に基づいて、「部品番号では先頭2文字が英文字から始まるのでは?」という候補理由と共に、訂正候補の「ZB」が表示されている。
文字列認識結果の訂正が必要な場合、帳票の確認者は訂正候補をカーソル34で選択することで、訂正前の文字列が、選択された訂正候補に置き換えられて訂正が完了する。文字列の訂正が行われると、選択枠に対応したスキャン画像/認識結果欄8に表示される文字列認識結果が訂正後の文字列で置き換えられる。その上で、帳票の確認者は、選択枠の文字列認識結果の確認が終了したことをCPU21に通知するため、図2の確認訂正画面2における選択枠に対応した確認欄のチェックボックスをカーソル34で選択し、チェックボックスにチェックマークを入力する。
一方、文字列認識結果の訂正が不要な場合、帳票の確認者は、選択枠に対応したスキャン画像/認識結果欄8に表示される文字列認識結果を訂正することなく、確認訂正画面2における選択枠に対応した確認欄のチェックボックスにチェックマークを入力する。
なお、表示された訂正候補の中に、訂正前の文字列に対する正しい訂正候補が存在しない場合、帳票の確認者は、文字列認識結果を正しい文字列に書き換えればよい。
このように、選択枠の文字列認識結果に対して訂正候補を表示した後、ステップS80において、CPU21は、選択枠に対応したスキャン画像/認識結果欄8に表示される文字列認識結果に対して訂正が行われたか否かを判定する。訂正が行われた場合にはステップS90に移行する。
ステップS90において、CPU21は、訂正前の文字列と訂正後の文字列を対応付けた上で、公知のデータ解析手法を用いて、例えば訂正頻度、誤りの傾向、手書きされた文字列の崩し方の特徴と本来の正しい文字列の対比、訂正後の文字列が使われやすい分野といった文字列の訂正傾向を分析する。
ステップS100において、CPU21は、ステップS90で分析した文字列の訂正傾向を訂正傾向テーブル17に反映する。
CPU21は、選択枠に対応する帳票特徴と同じ帳票特徴が訂正傾向テーブル17に存在する場合には、当該帳票特徴と対応付けられた訂正傾向に、ステップS90で分析した文字列の訂正傾向を反映する。一方、選択枠に対応する帳票特徴と類似する帳票特徴しか訂正傾向テーブル17に存在しない場合には、新たな行を訂正傾向テーブル17に追加して、選択枠に対応する帳票特徴とステップS90で分析した文字列の訂正傾向を追加した行に設定する。
また、CPU21は帳票特徴テーブル16に新たな行を追加して、追加した行にステップS20で特定した選択枠の帳票特徴を設定すると共に、追加した行の訂正の有無に「有」を設定した上で、訂正前文字列と訂正後文字列にそれぞれ訂正前の文字列と訂正後の文字列を設定して、ステップS110に移行する。
一方、ステップS80の判定処理で、選択枠に対応したスキャン画像/認識結果欄8に表示される文字列認識結果に対して訂正が行われていないと判定された場合には、CPU21は帳票特徴テーブル16に新たな行を追加して、追加した行にステップS20で特定した選択枠の帳票特徴を設定すると共に、追加した行の訂正の有無に「無」を設定した上で、訂正後文字列を空欄にしたまま訂正前文字列に訂正前の文字列を設定して、ステップS110に移行する。
ステップS110において、CPU21は受け付けた帳票の中に、まだステップS30で選択していない未選択の枠が存在するか否かを判定する。未選択の枠が存在する場合にはステップS30に移行する。すなわち、未選択の枠が存在しなくなるまでステップS30~S110の処理を繰り返し実行することで、帳票の確認者によって、受け付けた帳票に含まれる各項目に対応した枠内の文字列認識結果の確認訂正が行われると共に、訂正結果に基づき、文字列の訂正傾向が分析されることになる。
一方、ステップS30で帳票に含まれる各項目に対応した全ての枠が選択された場合には、図6に示す確認訂正処理を終了する。
図6に示す確認訂正処理では、各項目に対応した枠毎に帳票特徴を特定したが、CPU21は、複数の項目に対応した各々の枠と対応付けられた帳票特徴を組み合わせることで得られる帳票の特徴、すなわち、組み合わせ特徴を特定し、組み合わせ特徴を有する文字列認識結果の訂正傾向を分析してもよい。
例えば項目が「部署名」と記載された枠に「人事部」と記載され、項目が「署名欄」と記載された枠に手書きの署名が記載されている場合、部署名の帳票特徴と署名欄の帳票特徴を組み合わせることで、例えば署名欄には人事部の人物で、かつ、署名権限のある人物、すなわち人事部長が署名を行ったという組み合わせ特徴が特定される。
こうした組み合わせ特徴に対して、人事部長の手書き文字のくせを予め機械学習している辞書等を参照することで文字列の訂正傾向が得られ、人事部長の手書き文字に対応した訂正候補が表示されることになる。
また、例えば手書き文字や文字列の使用頻度に地域独特の特徴が現れる場合がある。例えば新潟では他の地域に比べて「潟」の略字が用いられやすい傾向があり、「隅」の文字は他の地域に比べて九州の地名や人名に使われる頻度が多いといった特徴がある。
したがって、「住所」の項目に記載者の住所が記載されている場合、記載者の居住地を考慮して、各項目に対応した枠の文字列認識結果に対する訂正傾向を分析すればよい。
受け付けた帳票に訂正傾向を分析した組み合わせ特徴が含まれる場合、当該組み合わせ特徴と対応付けられた文字列の訂正傾向を取得して、組み合わせ特徴が適用される枠内の文字列認識結果に対して訂正候補を表示すれば、1つの項目に対応した枠内の文字列認識結果に対する訂正結果を用いて分析された訂正傾向から得られる訂正候補を表示する場合に比べて、本来の文字列に対応する正しい訂正候補が提示されることになる。
このように本実施の形態に係る情報処理装置10によれば、帳票の文字列認識結果から帳票特徴を特定し、特定した帳票特徴と同じ帳票特徴、または類似する帳票特徴と対応付けられている文字列の訂正傾向に従って、文字列に対する訂正候補を表示する。
訂正傾向の特定には、例えば人工知能を用いた機械学習や深層学習といった公知のデータ解析手法が用いられるため、文字の形状の類似性のみから推定される訂正候補を1文字ずつ表示するのではなく、単語単位または句単位といった単位での訂正候補の表示、及び候補理由の提示が可能となる。すなわち、文章の文脈を考慮した上で訂正候補の表示が行われることになる。また、訂正候補の文字列の長さが長くなれば、文字列を1文字ずつ訂正する場合に比べて訂正回数が減少することにもなる。
以上、実施の形態を用いて本発明について説明したが、本発明は実施の形態に記載の範囲には限定されない。本発明の要旨を逸脱しない範囲で実施の形態に多様な変更又は改良を加えることができ、当該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。例えば、本発明の要旨を逸脱しない範囲で処理の順序を変更してもよい。
本実施の形態では、一例として確認訂正処理をソフトウェアで実現する形態について説明したが、図6に示した各フローチャートと同等の処理を、例えばASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはPLD(Programmable Logic Device)に実装し、ハードウェアで処理させるようにしてもよい。この場合、確認訂正処理をそれぞれソフトウェアで実現した場合と比較して、処理の高速化が図られる。
このように、CPU21を、例えばASIC、FPGA、PLD、GPU(Graphics Processing Unit)、及びFPU(Floating Point Unit)といった特定の処理に特化した専用のプロセッサに置き換えてもよい。
実施形態におけるCPU21の動作は、1つのCPU21によって実現される形態の他、複数のCPU21によって実現されてもよい。更に、実施形態におけるCPU21の動作は、物理的に離れた位置に存在する複数のコンピュータ20におけるCPU21の協働によって実現されるものであってもよい。
また、上述した実施の形態では、情報処理プログラムがROMにインストールされている形態を説明したが、これに限定されるものではない。本発明に係る情報処理プログラムは、コンピュータで読み取り可能な記憶媒体に記録された形態で提供することも可能である。例えば、本発明に係る情報処理プログラムを、CD(Compact Disc)-ROM、又はDVD(Digital Versatile Disc)-ROM等の光ディスクに記録した形態で提供してもよい。また、本発明に係る情報処理プログラムを半導体メモリに記録した形態で提供してもよい。
更に、情報処理装置10は図示しない通信回線を通じて、外部装置から本発明に係る情報処理プログラムを取得するようにしてもよい。
2・・・確認訂正画面、4・・・帳票画像領域、6・・・確認訂正領域、8・・・スキャン画像/認識結果欄、10・・・情報処理装置、11・・・OCR認識部、12・・・特定部、13・・・制御部、14・・・UI部、14A・・・入力ユニット、14B・・・表示ユニット、15・・・訂正情報DB、16・・・帳票特徴テーブル、17・・・訂正傾向テーブル、20・・・コンピュータ、21・・・CPU、22・・・ROM、23・・・RAM、24・・・不揮発性メモリ、27・・・通信ユニット、32(32A、32B、32C)・・・吹き出し、34・・・カーソル、36・・・ポップアップ領域、38・・・補足情報

Claims (7)

  1. プロセッサを備え、
    前記プロセッサは、帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定すると共に、帳票に記載されていない記載者に関する属性を帳票に記載された文字列の筆跡、及び帳票に記載された文字列が表す内容の言葉遣いから特定して前記帳票特徴に加え、
    特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積し、
    特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う
    情報処理装置。
  2. 前記プロセッサは、文字列が記載された帳票の枠毎に前記帳票特徴を特定し、文字列認識結果に対する過去の訂正傾向を帳票の各々の枠と対応付けて蓄積した上で、
    受け付けた帳票と同じ種類の帳票の各枠にそれぞれ対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、受け付けた帳票の枠毎に前記訂正候補を表示する制御を行う
    請求項1記載の情報処理装置。
  3. 前記プロセッサは、帳票の枠毎に特定した前記帳票特徴を組み合わせることで推定される組み合わせ特徴を特定し、前記組み合わせ特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積した上で、
    受け付けた帳票に前記組み合わせ特徴が含まれる場合、蓄積した訂正傾向の中から前記組み合わせ特徴と対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、前記組み合わせ特徴の推定に用いられた前記帳票特徴が対応付けられた枠の文字列に対して、前記訂正候補を表示する制御を行う
    請求項2記載の情報処理装置。
  4. 前記プロセッサは、前記訂正候補を2文字以上の文字列で表示する制御を行う
    請求項1~請求項3の何れか1項に記載の情報処理装置。
  5. 前記プロセッサは、前記訂正候補を単語単位で表示する制御を行う
    請求項4記載の情報処理装置。
  6. 前記プロセッサは、前記訂正候補の表示理由を表示する制御を行う
    請求項1~請求項5の何れか1項に記載の情報処理装置。
  7. コンピュータに、
    帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定すると共に、帳票に記載されていない記載者に関する属性を帳票に記載された文字列の筆跡、及び帳票に記載された文字列が表す内容の言葉遣いから特定して前記帳票特徴に加える処理と、
    特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積する処理と、
    特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う処理を実行させるための情報処理プログラム。
JP2019116595A 2019-06-24 2019-06-24 情報処理装置、及び情報処理プログラム Active JP7298330B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019116595A JP7298330B2 (ja) 2019-06-24 2019-06-24 情報処理装置、及び情報処理プログラム
US16/667,952 US11183191B2 (en) 2019-06-24 2019-10-30 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019116595A JP7298330B2 (ja) 2019-06-24 2019-06-24 情報処理装置、及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021002287A JP2021002287A (ja) 2021-01-07
JP7298330B2 true JP7298330B2 (ja) 2023-06-27

Family

ID=73994066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019116595A Active JP7298330B2 (ja) 2019-06-24 2019-06-24 情報処理装置、及び情報処理プログラム

Country Status (2)

Country Link
US (1) US11183191B2 (ja)
JP (1) JP7298330B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022097138A (ja) * 2020-12-18 2022-06-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031328A (ja) 2007-07-24 2009-02-12 Panasonic Corp 音声認識装置
JP2014182477A (ja) 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置
JP2015090623A (ja) 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2019040467A (ja) 2017-08-25 2019-03-14 キヤノン株式会社 画像処理装置およびその制御方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
US5329598A (en) * 1992-07-10 1994-07-12 The United States Of America As Represented By The Secretary Of Commerce Method and apparatus for analyzing character strings
US7106888B1 (en) * 1999-05-25 2006-09-12 Silverbrook Research Pty Ltd Signature capture via interface surface
JP2011107820A (ja) 2009-11-13 2011-06-02 Hitachi Solutions Ltd 訂正データ分析システム
TW201536050A (zh) * 2014-03-13 2015-09-16 Chicony Electronics Co Ltd 可修正偏移視角的影像擷取方法、電腦程式產品暨其影像擷取裝置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031328A (ja) 2007-07-24 2009-02-12 Panasonic Corp 音声認識装置
JP2014182477A (ja) 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置
JP2015090623A (ja) 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2019040467A (ja) 2017-08-25 2019-03-14 キヤノン株式会社 画像処理装置およびその制御方法

Also Published As

Publication number Publication date
US20200402503A1 (en) 2020-12-24
JP2021002287A (ja) 2021-01-07
US11183191B2 (en) 2021-11-23

Similar Documents

Publication Publication Date Title
US10915788B2 (en) Optical character recognition using end-to-end deep learning
US8015203B2 (en) Document recognizing apparatus and method
US9633255B2 (en) Substitution of handwritten text with a custom handwritten font
US8908971B2 (en) Devices, systems and methods for transcription suggestions and completions
US10963717B1 (en) Auto-correction of pattern defined strings
JP2007109118A (ja) 入力指示処理装置および入力指示処理プログラム
JP2001344562A (ja) 文書読取装置および文書読取方法
JP2019040467A (ja) 画像処理装置およびその制御方法
WO2007094078A1 (ja) 文字列検索方法およびその装置
Toselli et al. Transcribing a 17th-century botanical manuscript: Longitudinal evaluation of document layout detection and interactive transcription
KR101607672B1 (ko) 비구조화 임상 문서의 치환 기반 패턴 검색 장치 및 검색 방법
JP7298330B2 (ja) 情報処理装置、及び情報処理プログラム
CN113673294B (zh) 文献关键信息的提取方法、装置、计算机设备和存储介质
CN114494679A (zh) 一种双层pdf生成及校对方法和装置
JP5550959B2 (ja) 文書処理システム、及びプログラム
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2012108893A (ja) 手描き入力方法
JP7463675B2 (ja) 情報処理装置、及び情報処理プログラム
US20240184985A1 (en) Information representation structure analysis device, and information representation structure analysis method
JP6475288B2 (ja) プログラム比較方法、プログラム比較装置およびプログラム比較プログラム
JP5315890B2 (ja) 評価システムおよび評価方法
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
KR20220063380A (ko) 텍스트 전사장치 및 텍스트 전사방법
JP2019086934A (ja) 文書検索装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R150 Certificate of patent or registration of utility model

Ref document number: 7298330

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150