JP2022100066A - 情報処理装置、及び情報処理プログラム - Google Patents

情報処理装置、及び情報処理プログラム Download PDF

Info

Publication number
JP2022100066A
JP2022100066A JP2020214208A JP2020214208A JP2022100066A JP 2022100066 A JP2022100066 A JP 2022100066A JP 2020214208 A JP2020214208 A JP 2020214208A JP 2020214208 A JP2020214208 A JP 2020214208A JP 2022100066 A JP2022100066 A JP 2022100066A
Authority
JP
Japan
Prior art keywords
screen
setting
output
setting information
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020214208A
Other languages
English (en)
Inventor
良恵 松尾
Yoshie Matsuo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020214208A priority Critical patent/JP2022100066A/ja
Priority to US17/337,024 priority patent/US20220201142A1/en
Priority to CN202110762193.4A priority patent/CN114662475A/zh
Publication of JP2022100066A publication Critical patent/JP2022100066A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • H04N1/00774Adjusting or controlling
    • H04N1/00779Adjusting settings, e.g. mode, feeding rate or type of paper
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • H04N1/00774Adjusting or controlling
    • H04N1/00782Initiating operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】本発明は、対象画像の運用工程である文字列の抽出又は出力処理の結果に不備があった場合、運用工程の画面とは別画面で設定工程における画面を表示することなく、設定情報を修正できる情報処理装置、及び情報処理プログラムを提供することを目的とする。【解決手段】第1の態様の情報処理装置は、プロセッサを有し、プロセッサは、画像から文字列を抽出するために設定された情報である設定情報を用いて、書類を読み取った対象画像から文字列を抽出した抽出結果、又は外部へ出力する抽出結果に基づいた出力結果を取得し、抽出結果又は出力結果を表示すると共に、設定情報を修正する指示を受け付ける第1の画面を表示し、指示を受け付けた場合、対象画像に係る設定情報を修正可能とする第2の画面を表示する。【選択図】図3

Description

本発明は、情報処理装置、及び情報処理プログラムに関する。
特許文献1には、帳票の表面に記載された文字の読取り及び認識を行う光学文字読取装置に対しその文字読取りに必要な読取り位置情報を出力し該装置における文字読取り認識結果に基づいて前記読取り位置情報を修正するための読取り位置情報修正システムであって、前記帳票のイメージデータを表示する表示手段と、外部入力に応じて前記読取り位置情報を修正する修正手段と、この修正後の読取り位置情報に従って前記光学文字読取装置が行った文字読取り認識結果を前記表示手段の表示画面に表示する表示制御手段とを含むことを特徴とする技術が開示されている。
特開平10-334182号公報
文字認識処理(OCR:Optical Character Recognition)を用いて、画像から文字列を抽出して外部へ出力する場合において、書類毎に予め設定された情報(以下、「設定情報」という。)を用いて、当該書類を読み取った画像から文字列を抽出して外部へ出力するサービスが提供されている。当該サービスでは、設定を行う設定工程において、書類毎に画像から文字列を抽出して外部へ出力するための設定情報を設定する処理が行われる。また、記入済みの帳票の画像である対象画像から文字列を抽出して外部へ出力する運用工程において、設定情報を用いて、対象画像から文字列を抽出して外部へ出力する処理が行われる。
運用工程において、設定情報の不備により対象画像から文字列を適切に抽出又は出力できなかった場合、運用工程を中断し、運用工程とは別画面で設定工程における画面を表示させて設定情報を修正していた。
本発明は、対象画像の運用工程である文字列の抽出又は出力処理の結果に不備があった場合、運用工程の画面とは別画面で設定工程における画面を表示することなく、設定情報を修正できる情報処理装置、及び情報処理プログラムを提供することを目的とする。
第1の態様の情報処理装置は、プロセッサを有し、プロセッサは、画像から文字列を抽出するために設定された情報である設定情報を用いて、書類を読み取った対象画像から文字列を抽出した抽出結果、又は外部へ出力する抽出結果に基づいた出力結果を取得し、抽出結果又は出力結果を表示すると共に、設定情報を修正する指示を受け付ける第1の画面を表示し、指示を受け付けた場合、対象画像に係る設定情報を修正可能とする第2の画面を表示する。
第2の態様の情報処理装置は、第1の態様に係る情報処理装置において、プロセッサは、第2の画面において、設定情報の修正を受け付けた場合、修正された設定情報を用いて、抽出した結果、又は出力する結果を第1の画面に表示する。
第3の態様の情報処理装置は、第1の態様又は第2の態様に係る情報処理装置において、プロセッサは、第2の画面において、対象画像に係る設定情報を表示すると共に、対象画像を表示して、設定情報の修正を受け付ける。
第4の態様の情報処理装置は、第1の態様から第3の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、第1の画面に表示されている、修正を指示する画像要素が指定された場合、第2の画面を表示する。
第5の態様の情報処理装置は、第4の態様に係る情報処理装置において、第1の画面は、運用に応じた、複数の画面であり、第2の画面は、設定に応じた、複数の画面であり、第1の画面に係る複数の画面は、第2の画面に係る複数の画面にそれぞれ対応付けられており、プロセッサは、第1の画面に表示されている画像要素が指定された場合、対応する第2の画面を表示する。
第6の態様の情報処理装置は、第1の態様から第5の態様の何れか1つの態様に係る情報処理装置において、設定情報は、文字列を抽出する範囲に関する情報を含み、プロセッサは、対象画像に含まれる文字列の範囲が、設定情報における文字列を抽出する範囲より広い場合、設定情報の修正を促す旨を第1の画面に表示する。
第7の態様の情報処理装置は、第1の態様から第6の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、設定情報の修正に関する提案を表示する。
第8の態様の情報処理装置は、第7の態様に係る情報処理装置において、プロセッサは、設定情報における文字列を抽出する範囲を修正する場合、対象画像に含まれる文字列が納まる範囲を第2の画面に表示する。
第9の態様の情報処理装置は、第7の態様に係る情報処理装置において、対象画像は、関連する複数の文字列を含み、設定情報は、文字列を識別するための辞書に関する情報を含み、プロセッサは、関連する複数の文字列のうち、一の文字列を識別できなかった場合、他の文字列を抽出した結果を用いて、一の文字列を識別するための辞書を推定して、辞書を第2の画面に表示する。
第10の態様の情報処理プログラムは、コンピュータに、画像から文字列を抽出するために設定された情報である設定情報を用いて、書類を読み取った対象画像から文字列を抽出した抽出結果、又は外部へ出力する抽出結果に基づいた出力結果を取得し、抽出結果又は出力結果を表示すると共に、設定情報を修正する指示を受け付ける第1の画面を表示し、指示を受け付けた場合、対象画像に係る設定情報を修正可能とする第2の画面を表示することを実行させる。
第1の態様の情報処理装置、及び第10の態様の情報処理プログラムによれば、対象画像の運用工程である文字列の抽出又は出力処理の結果に不備があった場合、運用工程の画面とは別画面で設定工程における画面を表示することなく、設定情報を修正できる。
第2の態様の情報処理装置によれば、修正した設定情報を反映した抽出結果を確認できる。
第3の態様の情報処理装置によれば、現に抽出処理が行われた対象画像を参照して、設定情報を修正できる。
第4の態様の情報処理装置によれば、ユーザが所望する契機に設定情報を修正できる。
第5の態様の情報処理装置によれば、ユーザが所望する設定に設定情報を修正できる。
第6の態様の情報処理装置によれば、設定情報における文字列を抽出する範囲の設定に不備が存在することを認識できる。
第7の態様の情報処理装置によれば、設定情報に不備があることを認識できる。
第8の態様の情報処理装置によれば、対象画像における文字列が抽出できる範囲を認識できる。
第9の態様の情報処理装置によれば、設定情報における文字列を抽出するための辞書の設定に不備が存在することを認識できる。
本実施形態に係る帳票システムの概略構成の一例を示すブロック図である。 本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。 本実施形態に係る情報処理装置の機能構成の一例を示すブロック図である。 本実施形態に係る各々の画面への遷移の一例を示す画面遷移図である。 本実施形態に係る帳票判別画面の一例を示す正面図である。 本実施形態に係る確認訂正画面の一例を示す正面図である。 本実施形態に係る出力確認画面の一例を示す正面図である。 本実施形態に係る設定検証画面の一例を示す正面図である。 本実施形態に係る読取設定画面の一例を示す正面図である。 本実施形態に係る出力設定画面の一例を示す正面図である。 本実施形態に係る画面遷移を制御する処理の流れの一例を示すフローチャートである。 本実施形態に係る運用機能に係る画面を表示する処理の流れの一例を示すフローチャートである。 本実施形態に係る設定機能に係る画面を表示する処理の流れの一例を示すフローチャートである。
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。なお、本実施形態では、同一アプリケーションの一連の処理において、処理を継続しながら任意の画面から他の画面に画面遷移する形態について説明する。しかし、これに限定されない。例えば、画面上に表示されているタブを押下することによって、表示内容を切り替えた画面を表示して処理を継続してもよいし、表示していた画面と共に、小画面を表示して処理を継続してもよい。つまり、任意の画面、及び他の画面は、同一アプリケーションの一連の処理において、依存関係を有する画面である。換言すると、他の画面は、異なるアプリケーションに係る画面、又は一連の処理から独立した任意の契機で表示可能な画面等、一連の処理に係る画面に対して依存関係がなく独立して表示可能な画面を含まない。一方、別画面は、異なるアプリケーションに係る画面、又は一連の処理から独立した任意の契機で表示可能な画面等、一連の処理に係る画面に対して依存関係がなく独立して表示可能な画面を指す。
図1は、本実施の形態に係る帳票システム10の概略構成を示す図である。図1に示すように、帳票システム10は、情報処理装置20と、クライアント端末40と、入力装置60とを含む。これらの装置は、図示しないネットワークに接続されており、ネットワークを介して互いに通信可能である。このネットワークには、一例として、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。
情報処理装置20は、入力装置60を通じて入力された、帳票を含んだ複数枚の書類の画像データに対してOCR(Optical Character Recognition)処理を行い、OCR処理の結果を予め定めた出力先に出力する一連の処理の流れを管理する。ここで、本実施形態に係る画像データは、請求書、申込書、及び領収書等の文字列が含まれている書類に関する画像であれば、如何なる画像データであってもよい。また、情報処理装置20の具体的な構成及び作用については、後述する。
クライアント端末40は、情報処理装置20に対して、OCR処理に関する各種の指示を送信する。この各種の指示には、一例として、画像データの情報の読取りを開始させる指示、及び画像データの情報を読取った結果を表示させる指示等が含まれる。また、クライアント端末40は、受付けた各種の指示に応じて情報処理装置20が行ったOCR処理の結果、及びOCR処理に関する通知等の各種の情報を表示する。クライアント端末40には、一例として、サーバコンピュータ、又はパーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータ装置が適用される。図1では、クライアント端末40を一台だけ図示しているが、これに限らず、クライアント端末40が複数台用意されて、一例として、処理別にクライアント端末40が使い分けられてもよい。
入力装置60は、OCR処理の対象となる画像データを情報処理装置20に入力する。入力装置60には、一例として、サーバコンピュータ、又はPC等の汎用的なコンピュータ装置、並びにスキャン機能、プリンタ機能、及びFAX機能等を有する画像形成装置等が適用される。なお、入力装置60に加えて、クライアント端末40からも情報処理装置20へ画像データが入力可能であってもよい。
次に、帳票システム10の概要について説明する。帳票システム10は、情報処理装置20が、入力装置60を通じて入力された画像データに対してOCR処理を行い、OCR処理の結果を予め定めた出力先に出力するシステムである。
情報処理装置20は、OCR処理において、(1)業務設計及び運用検証、(2)データ入力、(3)データ読取り、(4)帳票判別確認訂正、(5)読取り結果確認訂正、(6)業務チェック、(7)データ出力、及び(8)差し戻し、の各種処理を管理する。本実施の形態においては、単に画像データから文字及び記号等を読取る処理だけでなく、文字の修正等の後処理も含めて、OCR処理と呼ぶ。
各種処理の管理の一例として、(1)業務設計及び運用検証、(2)データ入力、(3)データ読取り、(6)業務チェック、及び(7)データ出力の処理は、それぞれ、情報処理装置20により自動で実行される。また、各種処理の管理の一例として、(4)帳票判別確認訂正、及び(5)読取り結果確認訂正の処理は、それぞれ、クライアント端末40を通じたユーザによる入力により受け付けられる。また、各種処理の管理の一例として、(8)差し戻しの処理は、情報処理装置20により自動で実行される場合と、クライアント端末40を通じたユーザによる入力により受け付けられる場合とがある。
(1)業務設計及び運用検証の処理では、読取り定義設定、出力設定、及び業務チェック設定を含んだジョブルールが作成される。読取り定義設定では、一例として、「(3)データ読取り」の処理において画像データの情報を読取る範囲である読取範囲が設定される。より具体的には、一例として、キーとして抽出される項目の右付近からバリューである項目値を読取るというような定義が設定されうる。出力設定では、一例として、「(7)データ出力」の処理において出力する出力データのファイル形式、及び出力先が設定される。業務チェック設定では、一例として、「(6)業務チェック」の処理において検出対象とする帳票における必須の入力項目、及び入力可能な文字数等の書式等が設定される。ここで、本実施形態に係る読取範囲は、「抽出範囲」の一例である。
(2)データ入力の処理では、入力装置60からの画像データの入力を受付ける。入力を受付けた画像データは、「(3)データ読取り」の処理の実行単位であるジョブとして登録される。
(3)データ読取りの処理では、「(1)業務設計及び運用検証」の処理で作成されたジョブルールの中からユーザにより選択された、実行されるジョブ用のジョブルールを用いて、当該ジョブ内の画像データの情報の読取りが行われる。一例として、この処理では、当該ジョブ内の画像データに含まれる帳票の判別(以下、「帳票判別」とする)及び読取範囲内の文字及び記号の読取りが行われる。
(4)帳票判別確認訂正の処理では、「(3)データ読取り」の処理で行われた帳票判別の結果を基にジョブ内の画像データが、ジョブ内に含まれる帳票を示すレコードに分割される。その後、この処理では、分割されたレコードを表示させ、ユーザによる帳票判別の確認訂正が受付けられる。
(5)読取り結果確認訂正の処理では、「(3)データ読取り」の処理で行われた読取範囲内の文字及び記号の読取り結果を表示させ、ユーザによる読取り結果の確認訂正が受付けられる。
(6)業務チェックの処理では、「(1)業務設計及び運用検証」の処理で作成されたジョブルールの中からユーザにより選択された、当該ジョブ用のジョブルールに含まれる業務チェック設定により、先行する各処理におけるエラーが検出される。検出結果は、ユーザに提示されてもよい。
(7)データ出力の処理では、「(1)業務設計及び運用検証」の処理で作成されたジョブルールの中からユーザにより選択された、当該ジョブ用のジョブルールに含まれる出力設定を用いて出力データを作成し、作成した出力データが予め定めた出力先に出力される。
(8)差し戻しの処理では、OCR処理において実行された処理から、一段階又は複数段階前の処理に差し戻される。差し戻しは、一例として、「(4)帳票判別確認訂正」及び「(5)読取り結果確認訂正」等の各種処理の実行中に、クライアント端末40からユーザにより指示される。また、差し戻しは、一例として、「(6)業務チェック」と「(7)データ出力」との処理の間に行われる管理者によるチェックの結果に応じて、管理者のクライアント端末40から指示される。
上記のOCR処理において、「(1)業務設計及び運用検証」の処理は、「(3)データ読取り」以降の処理が行われる前、すなわち帳票システム10の運用前に実行される。さらに、「(1)業務設計及び運用検証」の処理は、「(3)データ読取り」以降の処理が行われている帳票システム10の運用中に実行されてもよい。一例として、帳票システム10の運用前に「(1)業務設計及び運用検証」の処理において作成したジョブルールを、運用中の帳票システム10の「(5)読取り結果確認訂正」の処理の結果に応じて適宜修正することができる。
次に、図2を参照して、情報処理装置20の構成について説明する。図2は、本実施形態に係る情報処理装置20のハードウェア構成の一例を示すブロック図である。一例として、本実施形態に係る情報処理装置20は、パーソナルコンピュータ等の端末、又はサーバである形態について説明する。しかし、これに限定されない。情報処理装置20は、複合機等の画像形成装置に搭載されていてもよい。
図2に示すように、本実施形態に係る情報処理装置20は、CPU(Central Processing Unit)21、ROM(Read Only Memory)22、RAM(Random Access Memory)23、ストレージ24、入力部25、モニタ26、及び通信インターフェース(通信I/F)27を含んで構成されている。CPU21、ROM22、RAM23、ストレージ24、入力部25、モニタ26、及び通信I/F27の各々は、バス28により相互に接続されている。ここで、CPU21は、プロセッサの一例である。
CPU21は、情報処理装置20の全体を統括し、制御する。ROM22は、本実施形態で用いる情報処理プログラムを含む各種プログラム及びデータ等を記憶している。RAM23は、各種プログラムの実行時のワークエリアとして用いられるメモリである。CPU21は、ROM22に記憶されたプログラムをRAM23に展開して実行することにより、各画像及び文字列を表示する処理を行う。ストレージ24は、一例としてHDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等である。なお、ストレージ24には、情報処理プログラム等を記憶してもよい。入力部25は、文字の入力等を受け付けるマウス、及びキーボード等である。モニタ26は、各画面を表示する。通信I/F27は、データの送受信を行う。
次に、図3を参照して、情報処理装置20の機能構成について説明する。図3は、本実施形態に係る情報処理装置20の機能的な構成の一例を示すブロック図である。
図3に示すように、情報処理装置20は、機能的な構成として、取得部81、読取部82、表示部83、受付部84、記憶部85、及び推定部86を備えている。CPU21が情報処理プログラムを実行することで、取得部81、読取部82、表示部83、受付部84、記憶部85、及び推定部86として機能する。
取得部81は、書類を読み取った画像データを取得する。
読取部82は、取得した画像データに対して、OCR処理を用いて、画像データに含まれている文字列を読み取った結果である読取り結果を取得する。ここで、本実施形態に係る読取り結果とは、画像データに含まれる文字列を読み取り、読み取った文字列を文字コードとして抽出した結果であり、本実施形態に係る読取り結果は、「抽出結果」の一例である。また、本実施形態に係る読取部82は、後述する記憶部85に記憶されている、画像データから文字列を読み取るための設定に関する情報(以下、「設定情報」という。)を用いて、画像データから文字列を読み取って読取り結果を取得する。なお、本実施形態に係る設定情報は、書類に係る項目及び文字列の配置等を設定した帳票レイアウトと、画像データから文字列を読み取る範囲を設定した読取範囲と、画像データから読み取った文字列を文字コードとして識別するための候補を設定した辞書と、を含む読取り設定、及び読取り結果を出力する形式等を設定した出力設定である形態について説明する。
表示部83は、画像データ、及び読取り結果(以下、「読取データ」という。)を画面に表示する。また、表示部83は、設定情報を修正するための画面を表示する。なお、本実施形態に係る読取データは、画像データ、及び読取り結果である形態について説明した。しかし、これに限定されない。読取データは、読取データの名称を示すジョブ名、訂正及び修正等が行われた操作日時、及び情報処理装置20に登録された登録日時等を含んでいてもよい。
受付部84は、各々の画面を表示する指示、及び修正した読取データ及び設定情報を受け付ける。一例として図4に示すように、本実施形態に係る画面は、運用機能として帳票判別画面100、確認訂正画面120、及び出力確認画面140があり、設定機能として設定検証画面160、読取設定画面180、及び出力設定画面200がある。運用機能とは、画像データから読み取った読取データを確認、及び出力するための機能である。運用機能は、図1における「(4)帳票判別確認訂正」、「(5)読取り結果確認訂正」、及び「(6)業務チェック」と「(7)データ出力」との処理の間に行われる管理者によるチェック等に対応する。また、設定機能とは、設定情報の修正を受け付ける機能である。設定機能は、図1における「(1)業務設計及び運用検証」の読取り定義設定、及び出力設定に対応する。
一例として、図4に示すように、運用機能及び設定機能に係る各々の画面は、他の画面に遷移するためのボタンを有しており、他の画面に遷移する指示と、読取データの確認及び訂正と、設定情報の修正と、を受け付ける。ここで、他の画面に遷移するためのボタンは「画像要素」の一例である。
図4に示す運用機能の各々の画面は、設定情報修正ボタンを有しており、設定情報修正ボタンが押下されることによって、設定検証画面160へ遷移する。例えば、帳票判別画面100の設定情報修正ボタンが押下されることによって、設定検証画面160に遷移し、設定検証画面160は、現に読み取りが実行されている読取データ及び読取データに係る設定情報を表示して、設定情報の修正を受け付ける。
また、確認訂正画面120は、読取設定修正ボタンを有しており、出力確認画面140は、出力設定修正ボタンを有しているため、運用機能の各々の画面において表示する内容に応じて、設定機能における各々の設定の修正を受け付ける画面に遷移が可能である。なお、本実施形態では、運用機能に係る画面が、設定機能に係る画面にそれぞれ対応するボタンを有している形態について説明した。しかし、これに限定されない。設定情報修正ボタンが押下された際に、運用機能に係る画面にそれぞれ対応する、設定機能に係る各々の画面に遷移してもよい。
また、図4に示す設定機能の各々の画面において、各々の設定の修正を受け付けた後、運用機能の各々の画面に遷移した場合、修正した設定情報を反映した読取データが表示される。なお、各々の画面については、後述する図5から図10において詳細に説明する。
図3に示す記憶部85は、読取データ、及び設定情報を関連付けて記憶する。なお、本実施形態に係る記憶部85は、設定情報として画像データに係る項目間において関連する情報について記憶している。項目間において関連する情報とは、例えば、項目「請求元名称」及び項目「請求元住所」等の同一の対象に属している情報である。また、本実施形態に係る文字列とは、「東京都XX区」等の項目に対して記載された内容である形態について説明する。
推定部86は、画像データから文字列が読み取れなかった場合、文字列が属する項目及び項目間において関連する情報を用いて、文字コードとして文字列を識別するための辞書を推定する。推定部86は、推定した辞書と、設定情報に設定されている項目に係る辞書と、が異なっている場合、辞書の変更を促して推定した辞書を候補として提示する。例えば、推定部86は、文字列「東京都XX区」が読み取れなかった場合、文字列の項目を示す「請求元住所」、及び当該項目に関連する「請求元名称」等に設定されている設定情報を用いて、辞書を推定する。
また、推定部86は、読取データに係る文字列を用いて、画像データに係る各々の文字列が納まる範囲を推定し、推定した文字列の範囲が、設定情報に設定されている読取範囲より広い場合、推定した文字列の範囲を、修正する文字列の範囲の候補として提示する。
ここで、推定部86は、辞書及び文字列の範囲を推定するための機械学習を行った学習器であってもよい。例えば、推定部86は、入力された項目、及び項目に関連する情報から文字列を識別するための辞書を学習した学習器であり、文字列が読み取れなかった項目、及び当該項目に関連する情報を入力して、当該項目に係る文字列を識別するための辞書を推定してもよい。また、推定部86は、入力された文字列から文字列の範囲を学習した学習器であり、画像データから読み取った文字列を入力して、当該文字列の範囲を推定してもよい。
次に、情報処理装置20の作用について説明する前に、図5から図10を参照して、本実施形態に係る表示する各々の画面について説明する。まず、図5から図7を参照して、運用機能に係る各々の画面について説明する。図5は、本実施形態に係る帳票判別画面の一例を示す正面図である。
図5に示すように、帳票判別画面100は、判別画像表示領域101、確認訂正ボタン102、及び設定情報修正ボタン103を有している。判別画像表示領域101は、設定情報に設定されている帳票レイアウトの設定を用いて読み取った画像データを書類毎に分類して、判別画像表示領域101に表示する。また、確認訂正ボタン102は、確認訂正画面120に遷移する指示を送信するためのボタンであり、設定情報修正ボタン103は、設定検証画面160に遷移する指示を送信するためのボタンである。
例えば、帳票判別画面100は、ユーザが判別画像表示領域101に表示された書類の分類状況を確認し、確認訂正ボタン102が押下されることによって、確認訂正画面120に遷移する。また、ユーザが書類の分類状況を確認し、帳票レイアウトの変更を所望する場合、設定情報修正ボタン103が押下されることによって、帳票レイアウトにおける設定を修正できる設定検証画面160に遷移する。
次に、図6を参照して、確認訂正画面120について説明する。図6は、本実施形態に係る確認訂正画面の一例を示す正面図である。
図6に示すように、確認訂正画面120は、画像表示領域121、読取り結果表示領域122、帳票判別ボタン123、出力確認ボタン124、設定情報修正ボタン125、読取設定修正ボタン126を有している。画像表示領域121は、読取データに係る画像データを表示し、読取り結果表示領域122は、読取データに係る読取り結果を表示する。帳票判別ボタン123は、帳票判別画面100に遷移する指示を送信するボタンであり、出力確認ボタン124は、出力確認画面140に遷移する指示を送信するボタンである。設定情報修正ボタン125は、設定検証画面160に遷移する指示を送信するボタンであり、読取設定修正ボタン126は、読取設定画面180に遷移する指示を送信するボタンである。
例えば、確認訂正画面120は、出力確認ボタン124が押下されることによって、出力確認画面140に遷移し、帳票判別ボタン123が押下されることによって帳票判別画面100に遷移する。また、ユーザが帳票レイアウトにおける設定の変更を所望する場合、設定情報修正ボタン125が押下されることによって、設定検証画面160に遷移する。また、ユーザが画像データから文字列を読み取るための設定の変更を所望する場合、読取設定修正ボタン126が押下されることによって、読取設定画面180に遷移する。
また、確認訂正画面120は、画像データから読み取った文字列から文字列の範囲を推定し、推定した文字列の範囲が設定情報に設定されている読取範囲を超えている場合、設定情報の修正を促す旨のメッセージ127を表示する。言い換えると、確認訂正画面120は、設定情報に設定されている文字列の範囲に不備が存在することを検知した場合、設定情報を修正する旨を通知する。
次に、図7を参照して、出力確認画面140について説明する。図7は、本実施形態に係る出力確認画面140の一例を示す正面図である。
図7に示すように、出力確認画面140は、出力項目表示領域141、確認訂正ボタン142、設定情報修正ボタン143、出力設定修正ボタン144、及び出力ボタン145を有している。出力項目表示領域141は、読取データに係る項目毎の読取り結果を表示し、確認訂正ボタン142は、確認訂正画面120に遷移する指示を送信するボタンである。また、設定情報修正ボタン143は、設定検証画面160に遷移する指示を送信するボタンであり、出力設定修正ボタン144は、出力設定画面200に遷移する指示を送信するボタンである。また、出力ボタン145は、読取り結果を出力し、画面表示処理を終了する指示を送信するボタンである。
例えば、出力確認画面140は、ユーザが出力項目表示領域141を確認し、出力ボタン145が押下されることによって、出力確認画面140に表示されている読取り結果を出力する。また、出力確認画面140は、ユーザが出力項目表示領域141を確認し、出力する項目、及び項目の出力順等における設定の変更を所望する場合、出力設定修正ボタン144が押下されることによって、出力設定画面200に遷移する。
次に、図8から図10を参照して、設定機能に係る各々の画面について説明する。図8は、本実施形態に係る設定検証画面160の一例を示す正面図である。
図8に示すように、設定検証画面160は、画像表示領域161、読取データ表示領域162、帳票レイアウト変更ボタン163、及び読取設定修正ボタン164を有している。また、設定検証画面160は、OCR実行ボタン165、帳票判別ボタン166、確認訂正ボタン167、及び出力確認ボタン168を有している。画像表示領域161は、読取データに係る画像データを表示し、読取データ表示領域162は、読取データに係るジョブ名及び登録日時等を表示する。帳票レイアウト変更ボタン163は、読取りデータに係る画像データを読み取るために設定された帳票レイアウトの変更を受け付けるボタンであり、読取設定修正ボタン164は、読取設定画面180に遷移する指示を送信するボタンである。OCR実行ボタン165は、OCR処理を再実行して、帳票判別画面100に遷移する指示を送信するボタンであり、帳票判別ボタン166は、帳票判別画面100に遷移する指示を送信するボタンである。確認訂正ボタン167は、確認訂正画面120に遷移する指示を送信するボタンであり、出力確認ボタン168は、出力確認画面140に遷移する指示を送信するボタンである。
例えば、帳票判別画面100において書類の分類が正常に実行できなかった場合、図8に示す設定検証画面160に遷移し、設定検証画面160は、画像データに係る書類の分類を行う帳票レイアウトの設定の修正を受け付ける。具体的には、図8に示す帳票レイアウト変更ボタン163を押下され、画像データに係る帳票レイアウトが選択されることによって、修正を受け付ける。
また、設定検証画面160は、OCR実行ボタン165、帳票判別ボタン166、確認訂正ボタン167、又は出力確認ボタン168が押下されることによって、設定情報の修正を反映した読取データを取得して運用機能に係る各々の画面に遷移する。例えば、設定検証画面160は、帳票レイアウトを修正した場合、OCR実行ボタン165が押下されることによって、帳票レイアウトの修正を反映したOCR処理を実行し、帳票判別画面100に遷移する。これにより、画像データから読み取った読取データの確認しながら設定情報を修正し、修正した設定情報を反映した読取データの確認を再開することが可能である。
また、後述する読取範囲の修正等のOCR処理の再実行が必要ない設定を修正した場合、帳票判別ボタン166、確認訂正ボタン167、又は出力確認ボタン168が押下されることによって、修正した設定を反映した読取データを各々の画面に表示可能である。
次に、図9を参照して、読取設定画面180について説明する。図9は、本実施形態に係る読取設定画面180の一例を示す正面図である。
図9に示すように、読取設定画面180は、画像表示領域181、読取り結果表示領域182、設定検証ボタン183を有している。画像表示領域181は、読取データに係る画像データを表示し、読取り結果表示領域182は、読取データに係る読取り結果を項目毎に表示する。また、設定検証ボタン183は、修正した設定を記憶して、設定検証画面160に遷移する指示を送信する指示を送信するボタンである。
例えば、読取設定画面180は、ユーザが画像表示領域181に表示されている修正前の読取範囲184、及び結果表示領域182に表示されている項目毎の読取り結果を確認し、読取範囲の修正を受け付ける。具体的には、ユーザがマウスを用いて、修正前の読取範囲184をドラッグし、所望する箇所にドロップすることで、読取範囲を修正することが可能である。
読取設定画面180は、読取り結果に係る文字列を用いて、文字列の範囲を推定し、推定した文字列の範囲が、設定情報に設定されている読取範囲より広い場合、推定した読取範囲を読取範囲の候補185として、画像表示領域181に表示する。
読取設定画面180は、読取範囲が修正された場合、修正した読取範囲を用いて、読取り結果から文字列を取得し、読取り結果表示領域182に表示する。現に読取りが行われた画像データ及び読取り結果を用いることによって、修正した読取範囲が現に読取りが行われた画像データに対応しているか確認を行いながら、読取範囲の修正が可能である。
また、読取設定画面180は、取得した読取り結果に係る文字列が、文字コードとして識別されず読み取れなかった場合、文字列が読み取れなかった旨を表示する。さらに、読取設定画面180は、読み取れなかった文字列の項目に関連する他の項目の情報を用いて、文字列を読み取るための辞書を推定し、推定した辞書と、設定情報に設定されている項目に係る辞書と、が異なっている場合、推定した辞書を候補として表示する。一例として、読取設定画面180は、文字列の読取りに失敗した旨、及び辞書の候補を通知するメッセージ186を表示する。ここで、読取範囲の候補185及び辞書の候補を通知するメッセージ186は、「設定情報の修正に関する提案」の一例である。
読取設定画面180は、読取り結果表示領域182に表示されている設定辞書が修正された場合、情報処理装置20は、修正された辞書を用いて読取り結果から文字列を取得し、読取り結果表示領域182に表示する。
読取設定画面180は、ユーザが設定の修正が完了した場合、設定検証ボタン183が押下されることによって、設定検証画面160に遷移し、運用機能の各々の画面に遷移するボタンが押下されることによって、修正した設定を反映した読取データが表示される。
なお、本実施形態に係る読取設定画面180は、読取範囲及び辞書の修正を受け付ける形態について説明した。しかし、これに限定されない。他の設定の修正を受け付けてもよい。例えば、読み取った文字列の表示形式の修正を受け付けてもよいし、読取りの基準となる項目(キー)と、対応する読取り結果(バリュー)と、の位置関係の修正を受け付けてもよい。
次に、図10を参照して、出力設定画面200について説明する。図10は、本実施形態に係る出力設定画面200の一例を示す正面図である。
図10に示すように、出力設定画面200は、出力設定表示領域201、出力項目表示領域202、及び出力確認ボタン203を有している。出力設定表示領域201は、読取データに係る出力の設定を表示し、出力項目表示領域202は、出力する項目及び項目毎の読取り結果を表示し、出力確認ボタン203は、出力確認画面140に遷移する指示を送信するボタンである。
出力設定画面200は、出力設定表示領域201に表示されているファイル名、文字コード、ヘッダー有無、及び出力形式の設定の修正を受け付ける。また、出力設定画面200は、出力項目表示領域202に表示されている項目移動アイコン204が押下されることによって、項目の出力順の修正を受け付け、項目追加アイコン205が押下されることによって、出力する項目の追加を受け付ける。
ここで、出力設定画面200は、ユーザによって出力の設定を変更される際に、読取データに係る読取り結果を出力項目表示領域202に表示することによって、項目及び読取り結果に係る文字列の対応関係を確認させ、出力の設定の修正を受け付ける。
ユーザによる設定の修正が完了した場合、出力確認ボタン203が押下されることによって、出力確認画面140に遷移し、出力確認画面140に修正した設定が反映されていることが確認され、読取り結果の出力が可能である。
なお、本実施形態では、出力する前に設定を修正して、反映する形態について説明した。しかし、これに限定されない。出力した後に、出力結果を参照して、各々の設定を修正してもよい。この場合、情報処理装置20は、図7における出力確認画面140の出力ボタン145が押下された後、出力結果、及び設定を修正するか否かを訊ねる旨を表示して、ユーザに修正の有無を要求する。
次に、図11から図13を参照して、本実施形態に係る情報処理装置20の作用について説明する。図11は、本実施形態に係る画面遷移を制御する処理の流れの一例を示すフローチャートである。CPU21がROM22又はストレージ24から情報処理プログラムを読み出し、実行することによって、図11に示す情報処理プログラムが実行される。図11に示す情報処理プログラムは、読取データを表示する指示が入力された場合、実行される。
ステップS101において、CPU21は、選択された読取データを取得する。
ステップS102において、CPU21は、帳票判別画面100を表示する。
ステップS103において、CPU21は、ボタンが押下されたか否かの判定を行う。ボタンが押下された場合(ステップS103:YES)、CPU21は、ステップS104に移行する。一方、ボタンが押下されていない場合(ステップS103:NO)、CPU21は、ボタンが押下されるまで待機する。
ステップS104において、CPU21は、運用機能に係る画面(帳票判別画面100、確認訂正画面120、及び出力確認画面140)に遷移する指示を送信するボタンが押下され、運用機能に係る画面を表示するか否かの判定を行う。運用機能に係る画面を表示する場合(ステップS104:YES)、CPU21は、ステップS105に移行する。一方、運用機能に係る画面を表示しない場合(ステップS104:NO)、CPU21は、ステップS106に移行する。
ステップS105において、CPU21は、運用機能に係る画面を表示する処理を実行する。なお、運用機能に係る画面を表示する処理については、後述する図12において詳細に説明する。
ステップS106において、CPU21は、設定機能に係る画面(設定検証画面160、読取設定画面180、及び出力設定画面200)に遷移する指示を送信するボタンが押下され、設定機能に係る画面を表示するか否かの判定を行う。設定機能に係る画面を表示する場合(ステップS106:YES)、CPU21は、ステップS107に移行する。一方、設定機能に係る画面を表示しない場合(ステップS106:NO)、CPU21は、ステップS108に移行する。
ステップS107において、CPU21は、設定機能に係る画面を表示する処理を実行する。なお、設定機能に係る画面を表示する処理については、後述する図13において詳細に説明する。
ステップS108において、CPU21は、出力ボタンが押下され、画面遷移を制御する処理を終了するか否かの判定を行う。画面遷移を制御する処理を終了する場合(ステップS108:YES)、CPU21は、画面遷移を制御する処理を終了する。一方、画面遷移を制御する処理を終了しない場合(ステップS108:NO)、CPU21は、ステップS103に移行する。
次に、図12を参照して、運用機能に係る画面を表示する処理について説明する。図12は、本実施形態に係る運用機能に係る画面を表示する処理の流れの一例を示すフローチャートである。CPU21がROM22又はストレージ24から運用機能に係る画面表示プログラムを読み出し、実行することによって、図12に示す運用機能に係る画面表示処理プログラムが実行される。図12に示す運用機能に係る画面表示処理プログラムは、帳票判別ボタン、確認訂正ボタン、出力確認ボタン、又はOCR実行ボタンが押下された場合、実行される。
ステップS201において、CPU21は、選択された読取データに係る設定情報を取得する。
ステップS202において、CPU21は、帳票判別ボタンが押下されたか否かの判定を行う。帳票判別ボタンが押下された場合(ステップS202:YES)、CPU21は、ステップS203に移行する。一方、帳票判別ボタンが押下されていない場合(ステップS202:NO)、CPU21は、ステップS204に移行する。
ステップS203において、CPU21は、取得した設定情報を用いて帳票判別画面100を表示する。
ステップS204において、CPU21は、OCR実行ボタンが押下されたか否かの判定を行う。OCR実行ボタンが押下された場合(ステップS204:YES)、CPU21は、ステップS205に移行する。一方、OCR実行ボタンが押下されていない場合(ステップS204:NO)、CPU21は、ステップS206に移行する。
ステップS205において、CPU21は、OCR処理を再実行して読取データを取得する。
ステップS206において、CPU21は、確認訂正ボタンが押下されたか否かの判定を行う。確認訂正ボタンが押下された場合(ステップS206:YES)、CPU21は、ステップS207に移行する。一方、確認訂正ボタンが押下されていない場合(ステップS206:NO)、CPU21は、ステップS211に移行する。
ステップS207において、CPU21は、取得した設定情報を用いて確認訂正画面120を表示する。
ステップS208において、CPU21は、読取データに係る文字列の範囲を推定する。
ステップS209において、CPU21は、推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えているか否かの判定を行う。推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えている場合(ステップS209:YES)、CPU21は、ステップS210に移行する。一方、推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えていない場合(ステップS209:NO)、CPU21は、運用機能に係る画面表示処理を終了する。
ステップS210において、CPU21は、推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えている旨の通知を表示する。
ステップS211において、CPU21は、取得した設定情報を用いて出力確認画面140を表示する。
次に、図13を参照して、設定機能に係る画面を表示する処理について説明する。図13は、本実施形態に係る設定機能に係る画面を表示する処理の流れの一例を示すフローチャートである。CPU21がROM22又はストレージ24から設定機能に係る画面表示プログラムを読み出し、実行することによって、図13に示す設定機能に係る画面表示処理プログラムが実行される。図13に示す設定機能に係る画面表示処理プログラムは、設定情報修正ボタン、読取設定修正ボタン、出力設定修正ボタン、又は設定検証ボタンが押下された場合、実行される。
ステップS301において、CPU21は、選択された読取データに係る設定情報を取得する。
ステップS302において、CPU21は、設定情報修正ボタンが押下されたか否かの判定を行う。設定情報修正ボタンが押下された場合(ステップS302:YES)、CPU21は、ステップS303に移行する。一方、設定情報修正ボタンが押下されていない場合(ステップS302:NO)、CPU21は、ステップS304に移行する。
ステップS303において、CPU21は、設定情報及び読取データを用いて設定検証画面160を表示する。
ステップS304において、CPU21は、設定検証ボタンが押下されたか否かの判定を行う。設定検証ボタンが押下された場合(ステップS304:YES)、CPU21は、ステップS303に移行する。一方、設定検証ボタンが押下されていない場合(ステップS304:NO)、CPU21は、ステップS305に移行する。
ステップS305において、CPU21は、読取設定修正ボタンが押下されたか否かの判定を行う。読取設定修正ボタンが押下された場合(ステップS305:YES)、CPU21は、ステップS306に移行する。一方、読取設定修正ボタンが押下されていない場合(ステップS305:NO)、CPU21は、ステップS314に移行する。
ステップS306において、CPU21は、設定情報及び読取データを用いて読取設定画面180を表示する。
ステップS307において、CPU21は、読取データに係る読み取った文字列の範囲を推定する。
ステップS308において、CPU21は、推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えているか否かの判定を行う。推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えている場合(ステップS308:YES)、CPU21は、ステップS309に移行する。一方、推定した文字列の範囲が設定情報に設定されている文字列の読取範囲を超えていない場合(ステップS308:NO)、CPU21は、ステップS310に移行する。
ステップS309において、CPU21は、読取範囲の候補として、推定した文字列の範囲を表示する。
ステップS310において、CPU21は、画像データから文字列が読み取れなかった項目が存在するか否かの判定を行う。画像データから文字列が読み取れなかった項目が存在する場合(ステップS310:YES)、CPU21は、ステップS311に移行する。一方、画像データから文字列が読み取れなかった項目が存在しない(全ての項目について文字列が読み取れた)場合(ステップS310:NO)、CPU21は、ステップS315に移行する。
ステップS311において、CPU21は、文字列が読み取れなかった項目に関連する情報を用いて、画像データから文字列を識別ための辞書を推定する。
ステップS312において、CPU21は、推定した辞書が設定情報に設定されている辞書と異なっているか否かの判定を行う。推定した辞書が設定情報に設定されている辞書と異なっている場合(ステップS312:YES)、CPU21は、ステップS313に移行する。一方、推定した辞書が設定情報に設定されている辞書と異なっていない(推定した辞書が設定情報に設定されている辞書と同一である)場合(ステップS312:NO)、CPU21は、ステップS315に移行する。
ステップS313において、CPU21は、修正する辞書の候補として、推定した辞書を表示する。
ステップS314において、CPU21は、設定情報及び読取データを用いて出力設定画面200を表示する。
ステップS315において、CPU21は、設定機能に係る各々の画面に入力された設定情報を記憶する。
以上説明したように、本実施形態によれば、運用工程の画面とは別画面で設定工程における画面を表示することなく、設定情報を修正できる。
なお、本実施形態では、他の画面に遷移するためのボタンを表示し、各々のボタンが押下された際に、対応する他の画面に遷移する形態について説明した。しかし、これに限定されない。キーボードにおける予め定められたキーを押下することによって、他の画面に遷移してもよいし、予め定められた操作によって他の画面に遷移してもよい。例えば、運用機能に係る画面において、キーボードの「→」「←」キーの押下によって、運用機能に係る画面を行き来し、キーボードの「↑」「↓」キーの押下によって、運用機能に係る画面と設定機能に係る画面を行き来してもよい。また、例えば、タッチパネルを用いる場合、指3本でタップする、又は指4本で上から下へスライドする等の予め定められたジェスチャーによる操作によって、他の画面に遷移して、設定情報の修正を受け付けてもよい。したがって、設定情報を修正する指示、及び他の画面に遷移する指示を、如何なる操作によって受け付けてもよい。
また、本実施形態では、設定機能に係る読取設定画面180において、辞書を修正する旨を表示する形態について説明した、しかし、これに限定されない。運用機能に係る各々の画面において、表示してもよい。例えば、確認訂正画面120において、表示してもよいし、出力確認画面140において、表示してもよい。
以上、各実施形態を用いて本発明について説明したが、本発明は各実施形態に記載の範囲には限定されない。本発明の要旨を逸脱しない範囲で各実施形態に多様な変更又は改良を加えることができ、当該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。
なお、上記実施形態において、プロセッサとは広義的なプロセッサを指し、例えば汎用的なプロセッサ(例えば、CPU:Central Processing Unit)や、専用のプロセッサ(例えば、GPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
また、本実施形態では、情報処理プログラムがストレージにインストールされている形態を説明したが、これに限定されるものではない。本実施形態に係る情報処理プログラムを、コンピュータ読取可能な記憶媒体に記録した形態で提供してもよい。例えば、本発明に係る情報処理プログラムを、CD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROM等の光ディスクに記録した形態で提供してもよい。本発明に係る情報処理プログラムを、USB(Universal Serial Bus)メモリ及びメモリカード等の半導体メモリに記録した形態で提供してもよい。また、本実施形態に係る情報処理プログラムを、通信I/Fに接続された通信回線を介して外部装置から取得するようにしてもよい。
10 帳票システム
20 情報処理装置
21 CPU
22 ROM
23 RAM
24 ストレージ
25 入力部
26 モニタ
27 通信I/F
28 バス
40 クライアント端末
60 入力装置
81 取得部
82 読取部
83 表示部
84 受付部
85 記憶部
86 推定部
100 帳票判別画面
101 判別画像表示領域
102、142、167 確認訂正ボタン
103、125、143 設定情報修正ボタン
120 確認訂正画面
121 画像表示領域
122 読取り結果表示領域
123、166 帳票判別ボタン
124、203 出力確認ボタン
126、164 読取設定修正ボタン
127 メッセージ
140 出力確認画面
141 出力項目表示領域
144 出力設定修正ボタン
145 出力ボタン
160 設定検証画面
161 画像表示領域
162 読取データ表示領域
163 帳票レイアウト変更ボタン
165 OCR実行ボタン
168 出力確認ボタン
180 読取設定画面
181 画像表示領域
182 読取り結果表示領域
183 設定検証ボタン
184 読取範囲
185 読取範囲の候補
186 メッセージ
200 出力設定画面
201 出力設定表示領域
202 出力項目表示領域
204 項目移動アイコン
205 項目追加アイコン

Claims (10)

  1. プロセッサを有し、前記プロセッサは、
    画像から文字列を抽出するために設定された情報である設定情報を用いて、書類を読み取った対象画像から文字列を抽出した抽出結果、又は外部へ出力する前記抽出結果に基づいた出力結果を取得し、
    前記抽出結果又は前記出力結果を表示すると共に、前記設定情報を修正する指示を受け付ける第1の画面を表示し、
    前記指示を受け付けた場合、前記対象画像に係る設定情報を修正可能とする第2の画面を表示する
    情報処理装置。
  2. 前記プロセッサは、
    前記第2の画面において、前記設定情報の修正を受け付けた場合、修正された前記設定情報を用いて、抽出した結果、又は出力する結果を前記第1の画面に表示する
    請求項1に記載の情報処理装置。
  3. 前記プロセッサは、
    前記第2の画面において、前記対象画像に係る設定情報を表示すると共に、前記対象画像を表示して、前記設定情報の修正を受け付ける
    請求項1又は請求項2に記載の情報処理装置。
  4. 前記プロセッサは、
    前記第1の画面に表示されている、修正を指示する画像要素が指定された場合、前記第2の画面を表示する
    請求項1から請求項3の何れか1項に記載の情報処理装置。
  5. 前記第1の画面は、運用に応じた、複数の画面であり、
    前記第2の画面は、設定に応じた、複数の画面であり、
    前記第1の画面に係る複数の画面は、前記第2の画面に係る複数の画面にそれぞれ対応付けられており、
    前記プロセッサは、
    前記第1の画面に表示されている前記画像要素が指定された場合、対応する前記第2の画面を表示する
    請求項4に記載の情報処理装置。
  6. 前記設定情報は、
    文字列を抽出する範囲に関する情報を含み、
    前記プロセッサは、
    前記対象画像に含まれる文字列の範囲が、前記設定情報における前記文字列を抽出する範囲より広い場合、前記設定情報の修正を促す旨を前記第1の画面に表示する
    請求項1から請求項5の何れか1項に記載の情報処理装置。
  7. 前記プロセッサは、
    前記設定情報の修正に関する提案を表示する
    請求項1から請求項6の何れか1項に記載の情報処理装置。
  8. 前記プロセッサは、
    前記設定情報における前記文字列を抽出する範囲を修正する場合、前記対象画像に含まれる文字列が納まる範囲を前記第2の画面に表示する
    請求項7に記載の情報処理装置。
  9. 前記対象画像は、
    関連する複数の文字列を含み、
    前記設定情報は、
    文字列を識別するための辞書に関する情報を含み、
    前記プロセッサは、
    前記関連する複数の文字列のうち、一の文字列を識別できなかった場合、他の文字列を抽出した結果を用いて、前記一の文字列を識別するための辞書を推定して、前記辞書を前記第2の画面に表示する
    請求項7に記載の情報処理装置。
  10. コンピュータに、
    画像から文字列を抽出するために設定された情報である設定情報を用いて、書類を読み取った対象画像から文字列を抽出した抽出結果、又は外部へ出力する前記抽出結果に基づいた出力結果を取得し、
    前記抽出結果又は前記出力結果を表示すると共に、前記設定情報を修正する指示を受け付ける第1の画面を表示し、
    前記指示を受け付けた場合、前記対象画像に係る設定情報を修正可能とする第2の画面を表示する
    ことを実行させるための情報処理プログラム。
JP2020214208A 2020-12-23 2020-12-23 情報処理装置、及び情報処理プログラム Pending JP2022100066A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020214208A JP2022100066A (ja) 2020-12-23 2020-12-23 情報処理装置、及び情報処理プログラム
US17/337,024 US20220201142A1 (en) 2020-12-23 2021-06-02 Information processing apparatus and non-transitory computer readable medium storing information processing program
CN202110762193.4A CN114662475A (zh) 2020-12-23 2021-07-06 信息处理装置、信息处理方法以及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020214208A JP2022100066A (ja) 2020-12-23 2020-12-23 情報処理装置、及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2022100066A true JP2022100066A (ja) 2022-07-05

Family

ID=82022573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020214208A Pending JP2022100066A (ja) 2020-12-23 2020-12-23 情報処理装置、及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20220201142A1 (ja)
JP (1) JP2022100066A (ja)
CN (1) CN114662475A (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110280481A1 (en) * 2010-05-17 2011-11-17 Microsoft Corporation User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
JP6451356B2 (ja) * 2015-01-30 2019-01-16 ブラザー工業株式会社 画像読取装置、および制御プログラム
US9904672B2 (en) * 2015-06-30 2018-02-27 Facebook, Inc. Machine-translation based corrections
JP6544637B2 (ja) * 2015-08-28 2019-07-17 富士ゼロックス株式会社 情報処理装置、画像読取装置、画像形成装置およびプログラム
US11159689B2 (en) * 2017-09-27 2021-10-26 Fujifilm Business Innovation Corp. Image processing apparatus for generating a preview image and non-transitory computer readable medium for image processing
WO2019170564A1 (en) * 2018-03-06 2019-09-12 Ventana Medical Systems, Inc. Digital pathology scanning interface and workflow
JP2020166699A (ja) * 2019-03-29 2020-10-08 キヤノン株式会社 情報処理方法、情報処理装置、情報処理システムおよびプログラム
JP7337553B2 (ja) * 2019-06-03 2023-09-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
US20220201142A1 (en) 2022-06-23
CN114662475A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
US10528679B2 (en) System and method for real time translation
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US11438467B2 (en) Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US20180174324A1 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
US11620434B2 (en) Information processing apparatus, information processing method, and storage medium that provide a highlighting feature of highlighting a displayed character recognition area
JP2003209643A (ja) 画像処理装置
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US10409390B2 (en) Display device and method for controlling display device
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2022100066A (ja) 情報処理装置、及び情報処理プログラム
JP2020204905A (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
US20220179524A1 (en) Information processing apparatus and non-transitory computer readable medium
US11269680B2 (en) Information processing apparatus, information processing system, and information processing method
JP2015028733A (ja) 操作装置および画像処理装置
JP5831715B2 (ja) 操作装置および画像処理装置
CN110942068B (zh) 信息处理装置、存储介质及信息处理方法
JP6682777B2 (ja) 情報処理装置及び情報処理プログラム
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
JP2021064123A (ja) データ入力支援システム、データ入力支援方法、及びプログラム
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20210191991A1 (en) Information processing apparatus and non-transitory computer readable medium
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
US10725654B2 (en) Method of displaying image selected from multiple images on touch screen

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240821