JP7487520B2 - 情報処理装置、画像読取装置、及びプログラム - Google Patents

情報処理装置、画像読取装置、及びプログラム Download PDF

Info

Publication number
JP7487520B2
JP7487520B2 JP2020058866A JP2020058866A JP7487520B2 JP 7487520 B2 JP7487520 B2 JP 7487520B2 JP 2020058866 A JP2020058866 A JP 2020058866A JP 2020058866 A JP2020058866 A JP 2020058866A JP 7487520 B2 JP7487520 B2 JP 7487520B2
Authority
JP
Japan
Prior art keywords
image
type
processor
information processing
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020058866A
Other languages
English (en)
Other versions
JP2021157645A (ja
Inventor
祐司 米田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2020058866A priority Critical patent/JP7487520B2/ja
Priority to US16/926,768 priority patent/US11495040B2/en
Priority to CN202010906989.8A priority patent/CN113449732A/zh
Publication of JP2021157645A publication Critical patent/JP2021157645A/ja
Application granted granted Critical
Publication of JP7487520B2 publication Critical patent/JP7487520B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • H04N1/00737Optical detectors using the scanning elements as detectors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • H04N1/00809Orientation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、情報処理装置、画像読取装置、及びプログラムに関する。
画像読取装置に帳票を読取らせて得られた画像に光学文字認識処理をして、その記載内容を認識する情報処理装置が実用されている。一般に帳票は、その種別ごとに記入欄等、読取られる領域の配置が異なる。また、帳票に含まれる記入欄等には、記入される文字の種類や順序等に規則が定められているものもある。そこでこれらの情報処理装置には、利用者から帳票の種別の指定を受付けて、その種別に応じた光学文字認識を行うものがある。
例えば、特許文献1は、光学文字認識機能を使用し、入力された文書画像データから、特徴を抽出し、その画像の特徴と、予め登録されている複数の画像情報とを比較して、最も近似する結果から登録フォームを識別し、登録されていない帳票を認識した場合、印刷用紙に特定の文字を記載することで自動的に新規フォームを登録する文書処理システムを開示している。
また、例えば、特許文献2は、複数のイメージデータを1又は複数のグループに分類したデータを取得し、グループに含まれるイメージデータの過不足を判定する条件を定めたグループ定義情報に基づいて、取得したデータにおける1又は複数のグループをそれぞれ検査することで、それぞれについて、イメージデータの過不足を判定し、イメージデータが不足しているグループと、グループに分類されなかった、又は、グループに過剰に含まれていると判定された、所属するグループが未確定なイメージデータと、を示す情報を表示させる情報処理装置を開示している。
特開2008-129791号公報 特開2013-58092号公報
ところで、画像読取装置が読み取った帳票の束の中に、利用者が指定した種別と異なる種別の帳票が紛れ込む場合がある。この場合、利用者は、紛れ込んだその帳票をその束から抜き取り、種別を再指定して、改めてその帳票を画像読取装置に読取らせる作業をしなければならない。この作業は、利用者の負担となっていた。
本願発明は、指定された種別と異なる画像を画像読取装置が読取ったとき等に、該画像から特定した他の種別を提示しない場合に比べて、利用者の該画像に対する種別の再設定の作業負担を軽減させること、を目的とする。
本発明の請求項1に係る情報処理装置は、プロセッサを有し、前記プロセッサは、帳票を読み取った画像を取得し、前記画像の種別の指定をユーザ操作により受付け、前記種別が前記画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示し、前記画像の種別の再指定を受付ける情報処理装置である。
本発明の請求項2に係る情報処理装置は、請求項1に記載の態様において、前記プロセッサは、前記種別の前記画像に対する類似度が閾値以上でない場合に、該種別よりも、前記画像に対する類似度が高い、前記他の種別を提示する情報処理装置である。
本発明の請求項3に係る情報処理装置は、請求項1に記載の態様において、前記プロセッサは、前記画像が、前記種別に対応する基準を満たさない場合に、前記基準を満たす前記他の種別を提示する情報処理装置である。
本発明の請求項4に係る情報処理装置は、請求項2又は3に記載の態様において、前記プロセッサは、前記画像と、前記他の種別に対応する画像とを同一画面に表示するよう制御する情報処理装置である。
本発明の請求項5に係る情報処理装置は、請求項1から3のいずれか1項に記載の態様において、前記プロセッサは、前記画像が、前記種別に対応する基準を満たさない場合に、前記画像の調整を受付ける情報処理装置である。
本発明の請求項6に係る情報処理装置は、請求項5に記載の態様において、前記プロセッサは、前記種別、又は前記他の種別に対応する基準における調整された前記画像の評価を表示するよう制御する情報処理装置である。
本発明の請求項7に係る情報処理装置は、請求項1から6のいずれか1項に記載の態様において、前記プロセッサは、前記画像が、前記種別に対応する基準を満たさない場合に、該基準の修正を受付ける情報処理装置である。
本発明の請求項8に係る情報処理装置は、請求項7に記載の態様において、前記プロセッサは、前記基準の修正を受付けた場合に、修正された該基準における前記画像の評価を示す情報を提示する情報処理装置である。
本発明の請求項9に係る情報処理装置は、請求項1から8のいずれか1項に記載の態様において、前記プロセッサは、前記他の種別が複数ある場合に、該他の種別のそれぞれを、該他の種別の前記画像に対する類似度の高い順に提示する情報処理装置である。
本発明の請求項10に係る情報処理装置は、請求項1から9のいずれか1項に記載の態様において、前記プロセッサは、前記画像が、前記種別に対応する基準を満たさない場合に、前記他の種別の前記画像に対する類似度を示す情報を提示する情報処理装置である。
本発明の請求項11に係る情報処理装置は、請求項1又は2に記載の態様において、前記プロセッサは、前記画像が、前記種別に対応する基準を満たさない場合に、前記他の種別に対応する基準を該画像が満たすか否かを示す情報を提示する情報処理装置である。
本発明の請求項12に係る画像読取装置は、スキャナと、プロセッサとを有し、前記プロセッサは、前記スキャナが帳票を読取った画像を取得し、前記画像の種別の指定をユーザ操作により受付け、前記種別が前画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示し、前記画像の種別の再指定を受付ける画像読取装置である。
本発明の請求項13に係るプログラムは、プロセッサを有するコンピュータに、帳票を読み取った画像を取得するステップと、前記画像の種別の指定をユーザ操作により受付けるステップと、前記種別が前記画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示するステップと、前記画像の種別の再指定を受付けるステップと、を実行させるプログラムである。
請求項1、13に係る発明によれば、ユーザ操作により指定された種別と異なる画像を画像読取装置が読取ったとき等に、該画像の特徴に基づいて特定した他の種別を提示しない場合に比べて、利用者の該画像に対する種別の再設定の作業負担を軽減させることができる。
請求項2に係る発明によれば、利用者は、読取った画像に対する類似度が、指定した種別よりも高い他の種別を知ることができる。
請求項3に係る発明によれば、利用者は、読取った画像が満たす基準に対応付けられた他の種別を知ることができる。
請求項4に係る発明によれば、利用者は、読み取った画像と他の種別に対応する画像とを同一画面に表示しない場合に比べて、読み取った画像に対する他の種別を特定しやすくなる。
請求項5に係る発明によれば、利用者は、読み取った画像が、指定した種別に対応する基準を満たさない場合に、該画像の調整を受付けることができる。
請求項6に係る発明によれば、利用者は、指定した種別、又は提示された他の種別に対応する基準における調整された画像の評価を、知ることができる。
請求項7に係る発明によれば、利用者は、読取った画像が満たさない基準を修正することができる。
請求項8に係る発明によれば、利用者は、修正した基準における、読取った画像の評価を知ることができる。
請求項9に係る発明によれば、利用者は、他の種別を類似度の順に確認することができる。
請求項10に係る発明によれば、利用者は、他の種別を、読取った画像に対する類似度とともに知ることができる。
請求項11に係る発明によれば、利用者は、他の種別を、読取った画像がその種別に対応付けられた基準を満たすか否かとともに知ることができる。
請求項12に係る発明によれば、ユーザ操作により指定された種別と異なる画像を読取ったとき等に、該画像の特徴に基づいて特定した他の種別を提示しない場合に比べて、利用者の該画像に対する種別の再設定の作業負担を軽減させることができる。
情報処理システム9の全体構成の例を示す図。 情報処理装置1の構成の例を示す図。 画像DB121の例を示す図。 帳票定義DB122の例を示す図。 学習DB123の例を示す図。 画像読取装置2の構成の例を示す図。 端末3の構成の例を示す図。 情報処理装置1の機能的構成の例を示す図。 画像が基準を満たすか否かを判断する動作の流れの例を示すフロー図。 取得した画像を種別不明の画像として処理する動作の流れの例を示すフロー図。 利用者に対象画像を選択させる操作画面の例を示す図。 利用者から種別の再指定を受付ける操作画面の例を示す図。 種別の再指定を受付けたときの動作の流れの例を示すフロー図。 再指定種別を示す画像と対象画像とを並べて表示した操作画面の例を示す図。 対象画像の調整を受付ける操作画面の例を示す図。 対象画像を再指定種別の画像として処理する動作の流れの例を示すフロー図。 対象画像が再指定種別に対応する基準を満たさない旨を警告する例を示す図。 帳票定義におけるパッチを修正する操作画面の例を示す図。 帳票定義における罫線を修正する操作画面の例を示す図。 帳票定義の基準に適用される閾値を修正する操作画面の例を示す図。 基準を修正した後の類似度に関する表示の例を示す図。 手入力で記入文字を特定する操作画面の例を示す図。 変形例において画像を種別不明として処理する動作の流れの例を示すフロー図。
<実施形態>
<情報処理システムの構成>
図1は、情報処理システム9の全体構成の例を示す図である。図1に示す情報処理システム9は、帳票を読取った画像に対し、その帳票の種別を指定して光学文字認識処理(OCR:Optical character recognition)を行い、その帳票に記入された文字等をデータ化するシステムである。情報処理システム9は、図1に示す通り情報処理装置1、画像読取装置2、端末3、及び通信回線4を有する。
画像読取装置2は、例えば、帳票を光学的に読取って、その読取り画像を示す画像データを生成する装置である。画像読取装置2は、通信回線4を介して、画像データを外部の装置に供給する。画像読取装置2は、媒体上に画像を形成する機能を有していてもよい。
端末3は、情報処理システム9の利用者がそれぞれ利用する端末装置であり、例えば、デスクトップ型やノート型、タブレット型等のパーソナルコンピュータである。端末3は、利用者の操作を受付けて、画像読取装置2及び情報処理装置1に対してその操作に応じた指示をする。なお、端末3は、複数の利用者が共用する画像読取装置2に対する操作を、各利用者がそれぞれのタイミングで操作するために用いられる。利用者が、直接、画像読取装置2に対して操作する場合に、情報処理システム9は端末3を有しなくてもよい。
情報処理装置1は、例えばコンピュータであり、クライアント装置である画像読取装置2、又は端末3の要求に応答するサーバ装置である。なお、図1に示す情報処理システム9は、複数の情報処理装置1を有する。これら複数の情報処理装置1は、互いに機能を動的に分担することにより、クラウドCを構成する。クラウドCは、画像読取装置2で読取られた画像を示す画像データに、それぞれ固有の文書名を付与して記憶する。クラウドCを構成する場合、複数の情報処理装置1のいずれかは、他の情報処理装置1の処理負荷を監視して処理の割当を行う、いわゆるロードバランサとして機能してもよい。
通信回線4は、情報処理装置1、画像読取装置2、及び端末3を通信可能に接続する回線である。通信回線4は、例えばLAN(Local Area Network)のほか、WAN(Wide Area Network)であってもよいし、インターネットであってもよいし、これらの組合せであってもよい。また、通信回線4は、公衆交換通信網(PSTN:Public Switched Telephone Networks)やサービス統合デジタル網(ISDN:Integrated Services Digital Network)等を含むものでもよい。
なお、情報処理システム9における情報処理装置1、画像読取装置2、端末3、及び通信回線4の、それぞれの数は図1に示したものに限られず、1つであってもよいし、複数であってもよい。
<情報処理装置の構成>
図2は、情報処理装置1の構成の例を示す図である。図2に示す情報処理装置1は、プロセッサ11、メモリ12、及びインタフェース13を有する。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ11は、メモリ12に記憶されているコンピュータプログラム(以下、単にプログラムという)を読出して実行することにより情報処理装置1の各部を制御する。プロセッサ11は、例えばCPU(Central Processing Unit)である。
インタフェース13は、有線又は無線により通信回線4を介して、情報処理装置1を画像読取装置2、及び端末3にそれぞれ通信可能に接続する通信回路である。
メモリ12は、プロセッサ11に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ12は、RAM(Random Access Memory)やROM(Read Only Memory)を有する。なお、メモリ12は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。
また、メモリ12は、画像DB121、及び帳票定義DB122を記憶する。さらに、図2に示すメモリ12は、学習DB123を記憶する。
図3は、画像DB121の例を示す図である。図3に示す画像DB121は、画像読取装置2から供給される画像データをそれぞれ記憶するデータベースである。図3に示す画像IDは、供給される画像データをそれぞれ識別する識別情報である。図3に示す利用者IDは、例えば端末3を操作して画像読取装置2に、上述した画像データを供給させた利用者をそれぞれ識別する識別情報である。図3に示す画像読取装置IDは、上述した画像データを供給した画像読取装置2をそれぞれ識別する識別情報である。図3に示す日時は、上述した画像データが供給された、又は生成された日時を示す情報である。図3に示す端末IDは、利用者が端末3を操作して画像読取装置2に、上述した画像データを情報処理装置1に供給させた場合における、その端末3の識別情報である。なお、利用者は、画像読取装置2を直接操作して、上述した画像データを情報処理装置1に供給させることもある。この場合、図3に示す端末IDには、それが存在しないことを示す「-」が書き込まれる。
図4は、帳票定義DB122の例を示す図である。帳票定義DB122は、帳票の種別ごとに、その帳票の特徴と、その帳票である画像が満たすべき基準と、を対応付けて記憶するデータベースである。図4に示す帳票定義DB122は、帳票の種別ごとに、その帳票で記入者に投げかけて、回答を記入させるための「設問」が定められている。
図4に示す帳票定義DB122は、種別リスト1221、特徴表1222、及び設問表1223を有する。種別リスト1221は、種別IDを列挙したリストである。この種別IDは、帳票の種別を識別する識別情報である。
特徴表1222は、帳票の種別ごとにそれぞれ設けられた表であり、その種別の帳票が備える特徴を記憶する。特徴表1222において、特徴IDは、上述した特徴の識別情報である。特徴表1222は、特徴IDごとに、その特徴IDで識別される特徴の内容そのものを示す特徴データと、画像がその特徴で満たすべき基準と、が対応付けて記憶されている。
ここでいう特徴は、例えば、帳票において記入欄を形成する罫線の数や配置、太さ等により示される。また、この特徴は、その帳票に含まれる固有の画像群で構成される「パッチ」の配置や形状、大きさにより示されてもよい。このパッチは、例えば、タイトルや設問等を示す文字、企業を示すロゴマーク等により構成される画像群である。
また、ここでいう基準は、読取った画像が、種別IDにより示される種別の帳票であるとするならば満たすべき、特徴ごとの基準である。例えば、特徴が1つの数値で構成されるスカラー値で与えられる場合、基準は、閾値や範囲等であり、複数の数値の組で構成されるベクトル値で与えられる場合、基準は、それらの組を用いた条件式等である。
設問表1223は、帳票の種別ごとにそれぞれ設けられた表であり、その種別の帳票が備える設問を記憶する。設問表1223において、設問IDは、設問の識別情報であり、設問名は、設問の名称である。また、配置データは、設問とそれに対応する記入欄のそれぞれの配置を示す情報である。
図5は、学習DB123の例を示す図である。図5に示す学習DB123は、帳票に含まれる設問に対して手書き等で記入された文字を認識する際の認識率を向上させるための学習データを記憶するデータベースである。学習データは、例えば、手書き文字の認識結果とその正解との組を収集して生成される。この学習データは、設問ごとに、使用すべき辞書(図5において図示せず)の識別情報や、それらの辞書を使用する優先順位等を記憶してもよい。この辞書とは、手書き文字の形状と、その形状が示す語句とを対応付けるデータベースであり、その種類には、例えば、住所用、人名用、数字用、アルファベット用等がある。
<画像読取装置の構成>
図6は、画像読取装置2の構成の例を示す図である。図6に示す画像読取装置2は、プロセッサ21、メモリ22、インタフェース23、操作部24、表示部25、及びスキャナ26を有する。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ21は、メモリ22に記憶されているプログラムを読出して実行することにより画像読取装置2の各部を制御する。プロセッサ21は、例えばCPUである。
メモリ22は、プロセッサ21に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ22は、RAMやROMを有する。なお、メモリ22は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。
インタフェース23は、有線又は無線により通信回線4を介して、画像読取装置2を端末3、及び情報処理装置1にそれぞれ通信可能に接続する通信回路である。
操作部24は、各種の指示をするための操作ボタン、操作キー、タッチパネル等の操作子を備えており、操作を受付けてその操作内容に応じた信号をプロセッサ21に送る。
なお、利用者がそれぞれ端末3から画像読取装置2を操作する場合、画像読取装置2は、操作部24を有しなくてもよい。
表示部25は、液晶ディスプレイ等の表示画面を有しており、プロセッサ21の制御の下、画像を表示する。表示画面の上には、操作部24の透明のタッチパネルが重ねて配置されてもよい。
スキャナ26は、プロセッサ21の制御の下、帳票を示す画像を光学的に読取り、その画像を示す画像データを生成する。
<端末の構成>
図7は、端末3の構成の例を示す図である。図7に示す端末3は、プロセッサ31、メモリ32、インタフェース33、操作部34、及び表示部35を有する。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ31は、メモリ32に記憶されているプログラムを読出して実行することにより端末3の各部を制御する。プロセッサ31は、例えばCPUである。
インタフェース33は、有線又は無線により通信回線4を介して、端末3を画像読取装置2、及び情報処理装置1にそれぞれ通信可能に接続する通信回路である。
操作部34は、各種の指示をするための操作ボタン、キーボード、タッチパネル、マウス等の操作子を備えており、操作を受付けてその操作内容に応じた信号をプロセッサ31に送る。
表示部35は、液晶ディスプレイ等の表示画面を有しており、プロセッサ31の制御の下、画像を表示する。表示画面の上には、操作部34の透明のタッチパネルが重ねて配置されてもよい。
メモリ32は、プロセッサ31に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ32は、RAMやROMを有する。なお、メモリ32は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。
<情報処理装置の機能的構成>
図8は、情報処理装置1の機能的構成の例を示す図である。情報処理装置1のプロセッサ11は、メモリ12に記憶されたプログラムを実行することにより、取得部111、受付部112、判断部113、及び提示部114として機能する。また図8に示すプロセッサ11は、認識部115としても機能する。
取得部111は、インタフェース13及び通信回線4を介して画像読取装置2から、その画像読取装置2においてスキャナ26が読取った画像を示す画像データを取得する。取得部111は、取得した画像を示す画像データをメモリ12の画像DB121に記憶する。つまり、この取得部111として機能するプロセッサ11は、スキャナが読取った画像を取得するプロセッサの例である。
受付部112は、読取った画像により示される帳票の種別の、利用者による指定を、端末3からインタフェース13及び通信回線4を介して受付ける。すなわち、この受付部112として機能するプロセッサ11は、画像の種別の指定を受付けるプロセッサの例である。
判断部113は、メモリ12の画像DB121から、取得部111により取得された画像データを読出し、この画像データが示す画像が、受付部112により受付けられた指定が示す種別に対応する基準を満たすか否か判断する。そして、判断部113は、上述した画像が、上述した基準を満たさないと判断する場合、指定された種別と異なる他の種別をその画像から特定し、そのリストを提示部114に渡す。
提示部114は、判断部113が、取得部111により取得された画像データが示す画像が、受付部112により受付けられた指定が示す種別に対応する基準を満たさない、と判断した場合に、判断部113より他の種別のリストを受取り、インタフェース13及び通信回線4を介して、端末3又は画像読取装置2に提示させるように指示する。すなわち、上述した判断部113、及びこの提示部114として機能するプロセッサ11は、画像データが示す画像が、指定が示す種別に対応する基準を満たさない場合に、この画像から特定される他の種別を提示するプロセッサの例である。
受付部112は、提示部114が、他の種別を提示させた場合に、提示内容を見た利用者から、上述した画像の種別の再指定を受付ける。つまり、この受付部112として機能するプロセッサ11は、画像の種別の再指定を受付けるプロセッサの例である。
なお、判断部113は、取得部111により取得された画像データが示す画像が、受付部112により受付けられた指定が示す種別に対応する基準を満たす、と判断した場合に、この画像を、この種別の帳票として処理する。例えば、図8に示す場合、判断部113は、帳票定義DB122から読出した設問表1223を用いて、画像のうち、設問に対する回答が記入された記入欄の配置を特定し、この記入欄に記入された手書き文字等を認識部115により認識させる。
認識部115は、学習DB123を参照して、上述した記入欄の設問に対応する学習データを用いて、この記入欄の画像に対して光学文字認識処理を実行し、記入された手書き文字等を認識する。
<情報処理装置の動作>
<画像が基準を満たすか否かを判断する動作>
図9は、画像が基準を満たすか否かを判断する動作の流れの例を示すフロー図である。情報処理装置1のプロセッサ11は、この動作により、取得した画像データに示される画像が、受付けた指定に示される種別に対応する基準を満たすか否かを判断する。
プロセッサ11は、インタフェース13及び通信回線4を介して画像読取装置2から、スキャナ26で読取った画像を示す画像データを取得する(ステップS101)。また、プロセッサ11は、インタフェース13及び通信回線4を介して端末3から、種別の指定を受付ける(ステップS102)。なお、利用者が、直接、画像読取装置2に対して操作する場合、プロセッサ11は、インタフェース13及び通信回線4を介して画像読取装置2から、種別の指定を受付ける。
プロセッサ11は、取得した画像データが示す画像(以下、取得画像ともいう)と、受付けた指定が示す種別(以下、指定種別ともいう)と、を特定し、取得画像が指定種別に対応する基準を満たすか否か判断する(ステップS103)。例えば、図9に示す動作においてプロセッサ11は、指定種別の、取得画像に対する類似度を算出し、この類似度が指定種別の基準に定める閾値以上であるか否かを判断する。
算出した類似度が指定種別の基準に定める閾値以上である、と判断する場合(ステップS103;YES)、プロセッサ11は、取得画像を指定種別の画像として処理する(ステップS104)。例えば、プロセッサ11は、指定種別の帳票が有する設問に対する記入欄を、取得画像から切り出して、光学文字認識処理を実行し、手書き文字等が示す文字に対応する文字データを特定する。
一方、算出した類似度が指定種別の基準に定める閾値以上でない、と判断する場合(ステップS103;NO)、プロセッサ11は、取得画像を種別不明の画像として処理する(ステップS200)。
<取得した画像を種別不明の画像として処理する動作>
図10は、取得した画像を種別不明の画像として処理する動作の流れの例を示すフロー図である。この図10に示す動作は、図9に示すフロー図におけるステップS200の詳細な動作である。
情報処理装置1のプロセッサ11は、種別不明の画像が複数存在するか否かを判断し(ステップS201)、この種別不明の画像が複数存在すると判断する場合(ステップS201;YES)、端末3又は画像読取装置2から、利用者による画像の選択を受付ける(ステップS202)。選択されるこの画像は、指定種別と異なる「他の種別」を特定する際の対象とする画像(以下、対象画像ともいう)である。
図11は、利用者に対象画像を選択させる操作画面の例を示す図である。図11に示す選択領域R1には、指定種別に対応する基準を満たさない画像が表示される。また、図11に示す種別再指定領域R2には、選択領域R1に示される画像に対して再指定されるべき、指定種別と異なる「他の種別」の候補が表示される。
なお、「他の種別」の候補は、該「他の種別」の候補を示す画像であってもよい。その場合、プロセッサ11が、「他の種別」の候補を示す画像と種別不明の画像とを同一の画面(同一画面ともいう)に表示することにより、種別不明の画像に対応する「他の種別」を、利用者は特定しやすくなる。端末3は、例えば、図11に示す操作画面を表示する指示を情報処理装置1から受信し、これを端末3の表示部35に表示させる。これにより、情報処理装置1は、端末3の表示部35に表示された選択領域R1により、利用者の対象画像の選択を受付ける。なお、利用者が、直接、画像読取装置2に対して操作する場合、プロセッサ11は、図11に示す操作画面を表示する指示を画像読取装置2に送信してもよい。
すなわち、この場合のプロセッサ11は、取得した画像と、その画像から特定される、他の種別に対応する画像と、を同一画面に表示するよう、例えば端末3の表示部35等を制御するプロセッサの例である。
一方、図10に示すフロー図において、種別不明の画像が複数存在しない、すなわち、1つである、と判断する場合(ステップS201;NO)、プロセッサ11は、この1つの種別不明の画像を対象画像として選択する(ステップS203)。
対象画像が決まると、プロセッサ11は、この対象画像から他の種別を特定する(ステップS204)。例えば、図10に示す場合、プロセッサ11は、指定種別よりも対象画像に対する類似度が高い他の種別を特定する。
そして、プロセッサ11は、特定した他の種別が複数存在するか否かを判断し(ステップS205)、特定した他の種別が複数存在すると判断する場合(ステップS205;YES)、それら他の種別を対象画像に対する類似度の高い順に並び替え(ステップS206)、処理をステップS207に進める。一方、特定した他の種別が複数存在しないと判断する場合(ステップS205;NO)、プロセッサ11は、ステップS206を行わずに、処理をステップS207に進める。
プロセッサ11は、特定した他の種別を、類似度を示す情報とともに提示する(ステップS207)。つまり、上述した他の種別を提示するこのプロセッサ11は、受付けた指定が示す種別(すなわち、指定種別)の、取得した画像に対する類似度が閾値以上でない、と判断したことにより、その画像が種別不明の画像であると判断した場合に、その指定種別よりも、その画像に対する類似度が高い、他の種別を提示するプロセッサの例である。
また、類似度を示す情報とともに、他の種別を提示するこのプロセッサ11は、画像データが示す画像が、指定が示す種別に対応する基準を満たさない場合に、他の種別の対象画像に対する類似度を示す情報を提示するプロセッサの例である。
また、特定した他の種別が複数存在する場合、プロセッサ11は、対象画像に対する類似度の高い順にこれら他の種別を並び替えるため、これら複数の他の種別は、類似度の高い順に提示される。つまり、このプロセッサ11は、他の種別が複数ある場合に、これら他の種別のそれぞれを、これら他の種別の対象画像に対する類似度の高い順に提示するプロセッサの例である。
そして、対象画像から特定した他の種別を提示したプロセッサ11は、インタフェース13及び通信回線4を介して、端末3又は画像読取装置2から、利用者による種別の再指定を受付ける(ステップS208)。
図12は、利用者から種別の再指定を受付ける操作画面の例を示す図である。図12において、選択領域R1には、指定種別に対応する基準を満たさない2つの画像が左右に並べて表示されている。これらの画像のうち、利用者が、左の画像を選択すると、この画像が対象画像として選択されたことを示す枠A1が表示される。
そして、枠A1が表示されると、この操作画面の種別再指定領域R2には、この枠A1に囲まれた対象画像に対する類似度が指定種別よりも高い、他の種別が表示される。図12では、3つの種別が再指定の候補となる「他の種別」として表示されており、これら他の種別には、それぞれ評価情報M1、M2、M3が対応付けて表示されている。この評価情報M1、M2、M3は、それぞれ対象画像に対する「他の種別」の類似度を示す情報であり、類似度を示した文字列である。そして、これら3つの「他の種別」は、矢印方向に沿って、左から右に類似度が高い順に並べて表示されている。利用者は、端末3を介して種別再指定領域R2に表示された「他の種別」を確認し、これらのいずれかをマウスやタッチパッドのクリック等によって選択する。情報処理装置1は、利用者の選択に応じた制御信号を受信することによって、利用者による、対象画像に対応する種別の再指定を受付ける。
<種別の再指定を受付けたときの動作>
図13は、種別の再指定を受付けたときの動作の流れの例を示すフロー図である。情報処理装置1のプロセッサ11は、再指定された種別(以下、再指定種別ともいう)を示す画像と対象画像とを並べて提示するように、端末3に指示する(ステップS301)。
図14は、再指定種別を示す画像と対象画像とを並べて表示した操作画面の例を示す図である。図14に示す操作画面を見ることで、利用者は、再指定した種別と、対象画像とを見比べて、対象画像が、再指定した種別に属する画像であるか否か検討する。また、図14に示す操作画面には、再指定種別を示す画像に重ねて、この再指定種別に対応する基準における対象画像の評価を示す評価情報Mが表示される。ここで評価情報Mは、吹き出し枠の中に、再指定された種別の対象画像に対する類似度を示した文字列が書き込まれた画像である。図14の例で、この文字列は「75%」である。
図14に示す操作画面には、「画像調整」という文字列が書かれたボタンB11、「前へ」という文字列が書かれたボタンB12、「次へ」という文字列が書かれたボタンB13、「中止」という文字列が書かれたボタンB14、及び「確定」という文字列が書かれたボタンB15、がそれぞれ含まれている。これらのボタンは、利用者の操作を受付ける。
ボタンB11は、利用者から画像を調整する操作を受付けるためのボタンである。ボタンB12は、図12に示した種別再指定領域R2の並べて表示された他の種別のリストにおいて、再指定した種別から見て「前へ」選択対象を移動させるためのボタンである。ボタンB13は、上述したリストにおいて選択対象を「次へ」移動させるためのボタンである。ボタンB14は、図14に示す操作画面に対する操作を中止して、図12に示す操作画面に処理を戻すためのボタンである。ボタンB15は、対象画像の種別を、再指定種別に確定させるためのボタンである。
プロセッサ11は、端末3から受信する制御信号を監視し、その操作信号の中に、画像を調整する旨の指示があるか否か判断する(ステップS302)。端末3から受信する制御信号の中に、対象画像を調整する旨の指示があると判断する場合(ステップS302;YES)、プロセッサ11は、対象画像の調整を受付ける(ステップS303)。すなわち、このステップS303を実行するプロセッサ11は、取得した画像が、指定された種別に対応する基準を満たさない場合に、この画像の調整を受付けるプロセッサの例である。
図15は、対象画像の調整を受付ける操作画面の例を示す図である。図14の操作画面において、利用者がボタンB11を押下すると、利用者の端末3には、図15に示す操作画面が表示される。画像読取装置2に例えば、いわゆる自動原稿送り装置(ADF:Automatic document feeder)が備えられている場合、スキャナ26で読取られた画像は、この自動原稿送り装置による帳票の搬送方向のずれによって傾くことがある。また、例えば、利用者が帳票を一枚ずつスキャナ26の読取り位置に置いた場合であっても、画像は傾くことがある。図15に示す操作画面は、対象画像を回転して調整するための画面である。
図15に示す操作画面には、「左回転」という文字列が書かれたボタンB21、「右回転」という文字列が書かれたボタンB22、「中止」という文字列が書かれたボタンB23、及び「戻る」という文字列が書かれたボタンB24、がそれぞれ含まれている。
ボタンB21は、対象画像を左回転させるためのボタンである。ボタンB22は、対象画像を右回転させるためのボタンである。ボタンB23は、図15に示す操作画面に対する操作を中止して、図14に示す操作画面に処理を戻すためのボタンである。ボタンB24は、対象画像を右又は左に回転して調整した結果を保存して図14に示す操作画面に処理を戻すためのボタンである。
図15に示す操作画面には、操作によって一時的に回転させられた対象画像とともに、その回転させられた対象画像に対する、再指定種別の類似度を示す情報が、評価情報Mに表示される。利用者は、この評価情報Mに示す類似度の数値を参考に、左右の回転を指示する。
図13に示すフロー図において、対象画像の調整を受付けると、プロセッサ11は、その調整された対象画像に対する再指定種別の類似度を再計算して、表示する類似度に反映させ(ステップS304)、処理をステップS301に戻す。これにより、端末3の表示部35には、図14に示す通り、再指定種別を示す画像と、調整された対象画像とを並べて表示した操作画面が改めて表示される。すなわち、このプロセッサ11は、指定された種別、又は、提示した他の種別に対応する基準における、調整された画像の評価を表示するよう、例えば端末3の表示部35等を制御するプロセッサの例である。
一方、端末3から受信する制御信号の中に、対象画像を調整する旨の指示がないと判断する場合(ステップS302;NO)、プロセッサ11は、対象画像の種別を再指定種別で確定する旨の指示があるか否かを判断する(ステップS305)。対象画像の種別を再指定種別で確定する旨の指示がないと判断する場合(ステップS305;NO)プロセッサ11は、処理をステップS302に戻す。
一方、対象画像の種別を再指定種別で確定する旨の指示があると判断する場合(ステップS305;YES)、プロセッサ11は、対象画像を再指定種別の画像として処理する(ステップS400)。
<対象画像を再指定種別の画像として処理する動作>
図16は、対象画像を再指定種別の画像として処理する動作の流れの例を示すフロー図である。図14の操作画面において、利用者がボタンB15を押下すると、情報処理装置1は、図16に示す動作を開始する。この図16に示す動作は、図13に示すフロー図におけるステップS400の詳細な動作である。
情報処理装置1のプロセッサ11は、対象画像が、再指定種別に対応する基準を満たすか否か判断する(ステップS401)。図16に示す例において、プロセッサ11は、再指定種別の、対象画像に対する類似度が閾値以上であるか否かを判断することによって、この対象画像が上述した基準を満たすか否かを判断する。
再指定種別の、対象画像に対する類似度が閾値以上である、と判断する場合(ステップS401;YES)、プロセッサ11は、対象画像が上述した基準を満たすとして、対象画像に対して光学文字認識処理を実行し、この対象画像に含まれる記入文字の特定を行う(ステップS500)。
一方、再指定種別の、対象画像に対する類似度が閾値以上でない、と判断する場合(ステップS401;NO)、プロセッサ11は、利用者に対し、対象画像が再指定種別に対応する基準を満たさない旨を警告するように、端末3に指示する(ステップS402)。
図17は、対象画像が再指定種別に対応する基準を満たさない旨を警告する例を示す図である。端末3は、情報処理装置1から上述したステップS402の指示を受信すると、図17に示す通り、「選択された画像は、指定された種別に対応する基準を満たしません。基準を修正しますか?」という文字列を表示部35に表示する。そして、端末3は、「修正する」という文字列が書かれたボタンB31と、「修正しない」という文字列が書かれたボタンB32と、をそれぞれ表示し、操作部34を介して利用者の操作を受付ける。
図16に示す動作において、プロセッサ11は、再指定種別の基準を修正する旨の指示があるか否かを判断する(ステップS403)。再指定種別の基準を修正する旨の指示がない、と判断する場合(ステップS403;NO)、プロセッサ11は、処理をステップS500に進める。
一方、再指定種別の基準を修正する旨の指示がある、と判断する場合(ステップS403;YES)、プロセッサ11は、再指定種別の基準の修正を受付ける(ステップS404)。すなわち、このプロセッサ11は、取得した画像データが示す画像が、再指定が示す種別に対応する基準を満たさない場合に、この基準の修正を受付けるプロセッサの例である。
なお、プロセッサ11は、再指定が示す種別に対応する基準を満たさないときだけでなく、初めに利用者が指定した種別に対応する基準を満たさないときにも、基準の修正を受付けてもよい。
図18は、帳票定義におけるパッチを修正する操作画面の例を示す図である。図18に示す操作画面は、再指定種別の帳票定義を示す画像に重ねて、パッチP1、P2を表示する。これらのパッチP1、P2はいずれも、この帳票を定義する特徴であり、帳票定義DB122の特徴表1222に、これらの配置や形状、大きさ等が定義されている。
また、図18に示す操作画面は、再指定種別の帳票定義を示す画像の下に、「追加」という文字列が書かれたボタンB41と、「削除」という文字列が書かれたボタンB42と、「移動」という文字列が書かれたボタンB43と、「変形」という文字列が書かれたボタンB44と、「閾値」という文字列が書かれたボタンB45と、をそれぞれ含む。
ボタンB41は、帳票定義に新たなパッチを追加するためのボタンである。利用者がボタンB41を押下すると、図18に示す操作画面に新たなパッチが追加される。
ボタンB42は、選択したパッチを帳票定義から削除するためのボタンである。利用者がボタンB42を押下すると、利用者に選択されたパッチが図18に示す操作画面から削除される。
ボタンB43は、帳票定義において選択したパッチを移動させるためのボタンである。利用者がボタンB43を押下すると、利用者に選択されたパッチが例えばマウスのドラッグ操作によって移動可能になる。
ボタンB44は、帳票定義において選択したパッチを変形させるためのボタンである。利用者がボタンB44を押下すると、利用者に選択されたパッチの例えば四隅や辺が選択可能になり、パッチの範囲や形状が変形可能になる。
ボタンB45は、帳票定義における基準を定めた閾値を変更する操作画面を表示させるためのボタンである。利用者がボタンB45を押下すると、利用者に選択されたパッチの閾値を変更するための操作画面が表示される。
プロセッサ11は、この操作画面に対する操作に応じて帳票定義DB122を更新する。つまり、図18に示す操作画面を操作したことによりパッチが修正されると、その修正の結果が、帳票定義DB122の特徴表1222における特徴データに反映される。
また、再指定種別の基準の修正を受付ける操作画面は、図18に示すものに限らない。図19は、帳票定義における罫線を修正する操作画面の例を示す図である。図19に示す操作画面は、再指定種別の帳票の特徴として定義されている罫線を、対象画面にも重ねて表示する。図19において対象画面に重ねて表示されている罫線P3を、利用者が操作することにより、帳票を定義する罫線の形や本数、範囲等が変更される。
プロセッサ11は、この操作画面に対する操作に応じて帳票定義DB122を更新する。つまり、図19に示す操作画面を操作したことにより罫線が修正されると、その修正の結果が、帳票定義DB122の特徴表1222における特徴データに反映される。
図20は、帳票定義の基準に適用される閾値を修正する操作画面の例を示す図である。利用者が図18に示すボタンB45を押下すると、図20に示すこの操作画面が端末3の表示部35に表示される。利用者は、スライダー上の仮想操作子L1をマウス等によりクリックして左右にドラッグさせると、この仮想操作子L1の位置に応じた閾値を示す文字がこのスライダーの上に表示される。利用者は、これにより、例えば、今、設定している閾値が「60%」であることを知る。
プロセッサ11は、この操作画面に対する操作に応じて帳票定義DB122を更新する。つまり、図20に示す操作画面を操作したことにより閾値が修正されると、その修正の結果が、帳票定義DB122の特徴表1222における基準に反映される。
図16に示す動作において、プロセッサ11は、再指定種別の基準の修正を受付けると、基準を修正した後の種別の、対象画像に対する類似度を提示する(ステップS405)。この修正後の類似度は、修正された基準における対象画像の評価を示す情報の例である。つまり、このプロセッサ11は、基準の修正を受付けた場合に、修正されたこの基準における対象画像の評価を示す情報を提示するプロセッサの例である。
また、プロセッサ11は、基準を修正した後の種別の、対象画像に対する類似度が閾値以上か否かを提示する(ステップS406)。ここで、基準を修正した後の種別の、対象画像に対する類似度が閾値以上か否か、とは、修正された基準を対象画像が満たすか否かを示す情報の例である。つまり、このプロセッサ11は、基準の修正を受付けた場合に、修正されたこの基準を対象画像が満たすか否かを示す情報を提示するプロセッサの例である。
図21は、基準を修正した後の類似度に関する表示の例を示す図である。端末3には、図21に示すメッセージM11、M12が表示される。メッセージM11には「選択された画像に対する、指定された種別の類似度は65%です」という文字列が記載されている。これにより、利用者は、基準を修正した後の種別の、対象画像に対する類似度が65%であることを知る。
また、図21に示すメッセージM12には「選択された画像は、指定された種別に対応する基準を満たしました」という文字列が記載されている。これにより、利用者は、基準を修正した後の種別の、対象画像に対する類似度が、閾値(例えば、60%)以上であるという基準を満たしたことを知る。
ステップS406を実行した後、プロセッサ11は、処理をステップS401に戻す。プロセッサ11は、ステップS401からステップS406を繰り返し実行することで、利用者が意図する、対象画像の種別の定義を修正し、修正が不要と判断されたときに、記入文字を特定する処理を実行する。
図22は、手入力で記入文字を特定する操作画面の例を示す図である。図22に示す操作画面には、「設問名」、「スキャン画像/認識結果」、「確認必」、「確認」の4つのフィールドを有する表が表示されている。「スキャン画像/認識結果」のフィールドには、対応する「設問名」に対して利用者が回答した手書き文字を示す文字画像G1と、その下に、利用者がその手書き文字に対応付ける文字の入力欄T1と、が表示されている。
なお、「確認必」のフィールドに注意を示すアイコンが示されている場合、対応する「設問名」の設問は、入力が必須の設問であることを示している。また、「確認」のフィールドは、チェックボックスが表示されており、このチェックボックスに対して利用者がチェックする操作をした場合には、対応する「スキャン画像/認識結果」の文字画像G1と入力欄T1との組を、利用者が確認したことを示している。
また、この操作画面には、上述した表の下に、「中止」という文字列が書かれたボタンB51、「決定」という文字列が書かれたボタンB52、「文字認識」という文字列が書かれたボタンB53、がそれぞれ含まれている。
ボタンB51は、図22の操作画面による操作を中止するためのボタンである。ボタンB52は、文字画像G1が示す手書き文字に対応付ける文字として利用者が入力欄T1に入力した文字を決定するためのボタンである。ボタンB53は、文字画像G1が示す手書き文字に対する光学文字認識処理を実行するよう情報処理装置1に指示するためのボタンである。
利用者が、ボタンB53を押下すると、文字画像G1が示す手書き文字に対する光学文字認識処理が情報処理装置1のプロセッサ11において実行され、認識結果である文字列が入力欄T1に入力される。この光学文字認識処理が実行されて入力欄T1が入力されてから、又は、利用者が操作部34を操作して自ら入力欄T1に文字を入力してから、利用者が「確認」のフィールドのチェックボックスにチェックをし、かつ、ボタンB52を押下すると、入力欄T1に入力された文字がこの対象画像における文字画像G1が示す手書き文字の認識結果としてメモリ12に記憶される。
以上、説明した動作をすることにより、情報処理システム9は、指定された種別と異なる画像を画像読取装置2が読取ったとき等に、その画像から特定した他の種別を提示しない場合に比べて、利用者のその画像に対する種別の再設定の作業負担を軽減させる。
<変形例>
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例は、組合されてもよい。
<1>
上述した実施形態において、情報処理システム9は、画像読取装置2と情報処理装置1とを接続した、いわゆるクライアントサーバシステムとして、指定された種別と異なる画像を読取ったときにその画像から他の種別を特定して提示していたが、一台の装置がこれを行ってもよい。この場合、例えば、画像読取装置2は、情報処理装置1及び端末3が実現する機能を実現してもよい。
<2>
上述した実施形態において、情報処理装置1は、CPUで構成されるプロセッサ11を有していたが、情報処理装置1を制御する制御手段は他の構成であってもよい。例えば、情報処理装置1は、CPU以外にも各種のプロセッサ等を有してもよい。
ここでプロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば上述したCPU等)や、専用のプロセッサ(例えばGPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
<3>
上記各実施形態におけるプロセッサ11の動作は、1つのプロセッサ11によって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。
また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
また、上述した実施形態におけるプロセッサ11により実現する機能のうち、一部をプロセッサ21又はプロセッサ31が担ってもよい。
<4>
上述した実施形態において、図10に示す動作を行うプロセッサ11は、指定種別よりも対象画像に対する類似度が高い他の種別を特定していたが、対象画像が基準を満たす他の種別を特定してもよい。
図23は、変形例において画像を種別不明として処理する動作の流れの例を示すフロー図である。この図23に示す動作は、図9に示すフロー図におけるステップS200を変形したステップS200aの詳細な動作である。
図23に示すフローにおいて、プロセッサ11は、ステップS204に代えて、ステップS204aを行う。すなわち、対象画像が決まると、プロセッサ11は、この対象画像に対する類似度が閾値以上である他の種別を特定する(ステップS204a)。ここで特定された「他の種別」は、ステップS207においてプロセッサ11により類似度とともに提示される。つまり、この変形例のプロセッサ11は、取得した画像データが示す画像が、受付けた指定が示す種別に対応する基準を満たさない場合に、この基準を満たす他の種別を提示するプロセッサの例である。
<5>
上述した実施形態において、プロセッサ11は、再指定の候補となる他の種別ごとに、それぞれ、評価情報M1、M2、M3を表示していたが、表示する情報は、これらに限らない。例えば、候補となる他の種別にそれぞれ対応する基準を、対象画像が満たすか否かを示す情報を提示してもよい。この情報は、例えば、「満たす」「満たさない」といった文字により表現されてもよいし、背景色が青であれば基準を満たし、赤であれば基準を満たさない、というように色により表現されてもよい。すなわち、この変形例のプロセッサ11は、取得した画像データが示す画像が、受付けた指定が示す種別に対応する基準を満たさない場合に、他の種別に対応する基準をこの画像が満たすか否かを示す情報を提示するプロセッサの例である。
<6>
上述した情報処理装置1のプロセッサ11によって実行されるプログラムは、プロセッサを有するコンピュータに、画像を取得するステップと、前記画像の種別の指定を受付けるステップと、前記種別が、前記画像に対応する基準を満たさない場合に、前記画像から特定される他の種別を提示するステップと、前記画像の種別の再指定を受付けるステップと、を実行させるプログラムの例である。
これらのプログラムは、磁気テープ及び磁気ディスク等の磁気記録媒体、光ディスク等の光記録媒体、光磁気記録媒体、半導体メモリ等の、コンピュータ装置が読取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムは、インターネット等の通信回線経由でダウンロードされてもよい。
1…情報処理装置、11…プロセッサ、111…取得部、112…受付部、113…判断部、114…提示部、115…認識部、12…メモリ、121…画像DB、122…帳票定義DB、1221…種別リスト、1222…特徴表、1223…設問表、123…学習DB、13…インタフェース、2…画像読取装置、21…プロセッサ、22…メモリ、23…インタフェース、24…操作部、25…表示部、26…スキャナ、3…端末、31…プロセッサ、32…メモリ、33…インタフェース、34…操作部、35…表示部、4…通信回線、9…情報処理システム、A1…枠、B11~B15…ボタン、B21~B24…ボタン、B31~B32…ボタン、B41~B45…ボタン、B51~B53…ボタン、G1…文字画像、L1…仮想操作子、M1…評価情報、M11…メッセージ、M12…メッセージ、P1~P2…パッチ、P3…罫線、R1…選択領域、R2…種別再指定領域、T1…入力欄

Claims (13)

  1. プロセッサを有し、前記プロセッサは、
    帳票を読み取った画像を取得し、
    前記画像の種別の指定をユーザ操作により受付け、
    前記種別が前記画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示し、
    前記画像の種別の再指定を受付ける
    情報処理装置。
  2. 前記プロセッサは、
    前記種別の前記画像に対する類似度が閾値以上でない場合に、該種別よりも、前記画像に対する類似度が高い、前記他の種別を提示する
    請求項1に記載の情報処理装置。
  3. 前記プロセッサは、
    前記画像が、前記種別に対応する基準を満たさない場合に、前記基準を満たす前記他の種別を提示する
    請求項1に記載の情報処理装置。
  4. 前記プロセッサは、
    前記画像と、前記他の種別に対応する画像とを同一画面に表示するよう制御する
    請求項2又は3に記載の情報処理装置。
  5. 前記プロセッサは、
    前記画像が、前記種別に対応する基準を満たさない場合に、前記画像の調整を受付ける
    請求項1から3のいずれか1項に記載の情報処理装置。
  6. 前記プロセッサは、前記種別、又は前記他の種別に対応する基準における調整された前記画像の評価を表示するよう制御する
    請求項5に記載の情報処理装置。
  7. 前記プロセッサは、
    前記画像が、前記種別に対応する基準を満たさない場合に、該基準の修正を受付ける
    請求項1から6のいずれか1項に記載の情報処理装置。
  8. 前記プロセッサは、
    前記基準の修正を受付けた場合に、修正された該基準における前記画像の評価を示す情報を提示する
    請求項7に記載の情報処理装置。
  9. 前記プロセッサは、
    前記他の種別が複数ある場合に、該他の種別のそれぞれを、該他の種別の前記画像に対する類似度の高い順に提示する
    請求項1から8のいずれか1項に記載の情報処理装置。
  10. 前記プロセッサは、
    前記画像が、前記種別に対応する基準を満たさない場合に、前記他の種別の前記画像に対する類似度を示す情報を提示する
    請求項1から9のいずれか1項に記載の情報処理装置。
  11. 前記プロセッサは、
    前記画像が、前記種別に対応する基準を満たさない場合に、前記他の種別に対応する基準を該画像が満たすか否かを示す情報を提示する
    請求項1又は2に記載の情報処理装置。
  12. スキャナと、プロセッサとを有し、前記プロセッサは、
    前記スキャナが帳票を読取った画像を取得し、
    前記画像の種別の指定をユーザ操作により受付け、
    前記種別が前画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示し、
    前記画像の種別の再指定を受付ける
    画像読取装置。
  13. プロセッサを有するコンピュータに、
    帳票を読み取った画像を取得するステップと、
    前記画像の種別の指定をユーザ操作により受付けるステップと、
    前記種別が前記画像に対応する基準を満たさない場合に、前記画像の特徴に基づいて特定される他の種別をユーザ操作によらずに提示するステップと、
    前記画像の種別の再指定を受付けるステップと、
    を実行させるプログラム。
JP2020058866A 2020-03-27 2020-03-27 情報処理装置、画像読取装置、及びプログラム Active JP7487520B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020058866A JP7487520B2 (ja) 2020-03-27 2020-03-27 情報処理装置、画像読取装置、及びプログラム
US16/926,768 US11495040B2 (en) 2020-03-27 2020-07-12 Information processing apparatus for designation of image type, image reading apparatus, and non-transitory computer readable medium storing program
CN202010906989.8A CN113449732A (zh) 2020-03-27 2020-09-01 信息处理装置、图像读取装置、记录介质、信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020058866A JP7487520B2 (ja) 2020-03-27 2020-03-27 情報処理装置、画像読取装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021157645A JP2021157645A (ja) 2021-10-07
JP7487520B2 true JP7487520B2 (ja) 2024-05-21

Family

ID=77808518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020058866A Active JP7487520B2 (ja) 2020-03-27 2020-03-27 情報処理装置、画像読取装置、及びプログラム

Country Status (3)

Country Link
US (1) US11495040B2 (ja)
JP (1) JP7487520B2 (ja)
CN (1) CN113449732A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022047839A (ja) * 2020-09-14 2022-03-25 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
WO2023067658A1 (ja) * 2021-10-18 2023-04-27 株式会社島津製作所 質量分析装置および検波ユニット

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092912A (ja) 1999-09-24 2001-04-06 Toshiba Corp データ入力装置及びデータ入力方法
JP2002358521A (ja) 2001-05-31 2002-12-13 Oki Electric Ind Co Ltd 帳票フォーマット登録・識別装置、方法及びプログラム
JP2004062351A (ja) 2002-07-26 2004-02-26 Fujitsu Ltd レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法
JP2004348706A (ja) 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007034549A (ja) 2005-07-26 2007-02-08 Oki Electric Ind Co Ltd 提案書設計管理システム
JP2007133593A (ja) 2005-11-09 2007-05-31 Hitachi East Japan Solutions Ltd 識別システム及び識別プログラム
JP2008129791A (ja) 2006-11-20 2008-06-05 Canon Inc 文書処理システム
JP2019070933A (ja) 2017-10-06 2019-05-09 ラクラス株式会社 年末調整業務支援システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008129792A (ja) 2006-11-20 2008-06-05 Canon Inc 文書処理システム
JP4193902B2 (ja) * 2007-01-31 2008-12-10 ブラザー工業株式会社 画像記録装置、画像記録方法、画像記録プログラム、及びプリンタドライバ
JP2013058092A (ja) 2011-09-08 2013-03-28 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP5579202B2 (ja) * 2012-01-16 2014-08-27 東芝テック株式会社 情報処理装置、店舗システム及びプログラム
JP5885569B2 (ja) * 2012-04-12 2016-03-15 京セラドキュメントソリューションズ株式会社 画像処理装置および画像処理プログラム
SE538435C2 (en) * 2014-05-14 2016-06-28 Cellavision Ab Method, device and computer program product for determining color transforms between images comprising a plurality of image elements
JP6771897B2 (ja) * 2016-02-02 2020-10-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP2017156986A (ja) * 2016-03-02 2017-09-07 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
US10984041B2 (en) * 2017-05-11 2021-04-20 Commvault Systems, Inc. Natural language processing integrated with database and data storage management

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092912A (ja) 1999-09-24 2001-04-06 Toshiba Corp データ入力装置及びデータ入力方法
JP2002358521A (ja) 2001-05-31 2002-12-13 Oki Electric Ind Co Ltd 帳票フォーマット登録・識別装置、方法及びプログラム
JP2004062351A (ja) 2002-07-26 2004-02-26 Fujitsu Ltd レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法
JP2004348706A (ja) 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007034549A (ja) 2005-07-26 2007-02-08 Oki Electric Ind Co Ltd 提案書設計管理システム
JP2007133593A (ja) 2005-11-09 2007-05-31 Hitachi East Japan Solutions Ltd 識別システム及び識別プログラム
JP2008129791A (ja) 2006-11-20 2008-06-05 Canon Inc 文書処理システム
JP2019070933A (ja) 2017-10-06 2019-05-09 ラクラス株式会社 年末調整業務支援システム

Also Published As

Publication number Publication date
US20210303841A1 (en) 2021-09-30
JP2021157645A (ja) 2021-10-07
CN113449732A (zh) 2021-09-28
US11495040B2 (en) 2022-11-08

Similar Documents

Publication Publication Date Title
CN100414960C (zh) 图像处理设备以及图像处理方法
JP4970714B2 (ja) 指定されたドキュメント・エリアからのメタデータの抽出
JP7487520B2 (ja) 情報処理装置、画像読取装置、及びプログラム
JP2019204399A (ja) 情報処理装置及びプログラム
EP3113050A1 (en) Product search device, product search system, server system, and product search method
JP2019115019A (ja) プログラム
JP2014044620A (ja) 情報処理装置、情報処理方法、およびプログラム
US8136120B2 (en) Methods and systems of reconciling sources of print job processing information in a print processing environment
JP6885449B2 (ja) 情報識別プログラム、情報識別方法、及び画像読取装置
JP2019046225A (ja) 認識装置、認識プログラム、及び認識方法
JP2010003218A (ja) 文書レビュー支援装置及び方法、並びにプログラム及び記憶媒体
JP2008134972A (ja) 機能紹介装置、機能紹介システム、機能紹介装置の制御方法、及びコンピュータのプログラム
JP2022149283A (ja) 情報処理装置、及びプログラム
JP2020071534A (ja) 情報処理システム、情報処理方法及び情報処理プログラム
US20210279408A1 (en) Information processing apparatus, image processing apparatus, and non-transitory computer readable medium storing program
JP2016115022A (ja) 情報処理装置、情報処理方法、およびプログラム
JP7020298B2 (ja) 資料コメント共有装置
JP7558730B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11574260B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2019205061A (ja) 情報処理装置及びプログラム
EP4439331A1 (en) Information processing system, information processing program, and information processing method
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
JP7279986B1 (ja) 情報処理方法、情報処理システム及び情報処理プログラム
US20220311894A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JP7287684B2 (ja) 読取支援システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240422

R150 Certificate of patent or registration of utility model

Ref document number: 7487520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150