JP7483384B2 - 文書を電子化する画像処理システム、その制御方法及びプログラム - Google Patents

文書を電子化する画像処理システム、その制御方法及びプログラム Download PDF

Info

Publication number
JP7483384B2
JP7483384B2 JP2020007532A JP2020007532A JP7483384B2 JP 7483384 B2 JP7483384 B2 JP 7483384B2 JP 2020007532 A JP2020007532 A JP 2020007532A JP 2020007532 A JP2020007532 A JP 2020007532A JP 7483384 B2 JP7483384 B2 JP 7483384B2
Authority
JP
Japan
Prior art keywords
detected
area
text block
setting
operation event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020007532A
Other languages
English (en)
Other versions
JP2021114237A5 (ja
JP2021114237A (ja
Inventor
憲一 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020007532A priority Critical patent/JP7483384B2/ja
Priority to US17/147,168 priority patent/US11303769B2/en
Publication of JP2021114237A publication Critical patent/JP2021114237A/ja
Publication of JP2021114237A5 publication Critical patent/JP2021114237A5/ja
Application granted granted Critical
Publication of JP7483384B2 publication Critical patent/JP7483384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00461Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet marking or otherwise tagging one or more displayed image, e.g. for selective reproduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文書を電子化して利用する際のグラフィカルユーザインタフェース(GUI)に関する。
従来、注文書等の帳票をスキャンして得られたスキャン画像に対し光学文字認識処理(OCR処理)を行って文字列を抽出し、ファイル名等に利用することが行われている。特許文献1には、文書画像内に含まれる文字列の中から特定のキーを含む文字列を抽出してファイル名を自動生成し、文書画像のプレビュー表示と共にユーザに提示する技術が開示されている。この技術によればユーザは、文書画像を確認しながらファイル名を容易に設定することができる。そして、スキャン画像から抽出した文字列をメタデータとして保存・管理し、ファイル名等に利用することも行われている。
特開2019-115011号公報
OCR処理によって得られた認識文字列を用いてファイル名やメタデータを設定する際のアプリケーションのUI画面の構成として、プレビューペインとプロパティペインとからなる2ペイン構成がよく知られている。ここで、プレビューペインは、電子化対象のスキャン画像をプレビュー表示するための領域であり、プロパティペインはファイル名やメタデータといったプロパティの内容を一覧表示するための領域である。注文書や請求書といった文書を電子化する場合、そのスキャン画像には複数の文字領域(テキストブロック)が含まれており、プレビューペインによってユーザは各テキストブロックを視認することができる。また、プロパティペインによってユーザは、「Customer Name」、「Date」、「Address」といった様々な設定項目についての内容を確認することができる。上記2ペイン構成のUI画面にて例えばユーザが、プロパティペイン内の「Customer Name」という設定項目に対し、プレビューペイン内の“XYZ Corporation”のテキストブロックを選択したとする。その結果、スキャン画像内の認識文字列“XYZ Corporation”が、「Customer Name」という設定項目と関連付けて保存されることになる。この場合において、プレビューペイン内に複数のテキストブロックが存在し、かつ、プロパティペイン内にも複数の設定項目が存在すると、どのテキストブロックとどの設定項目とが関連付けられているのかをユーザが即座に把握することが困難であった。
本件は、上記課題に鑑みてなされたものであり、プレビューペインとプロパティペインを有するUI画面において、テキストブロックと設定項目との対応関係をユーザが容易に把握できるようにすることを目的とする。
本開示に係る画像処理システムは、文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面の表示を制御する制御手段を備える画像処理システムであって、前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出された場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対して表示され、前記ラベルには、当該操作イベントが検出されたテキストブロックが既に関連付けられている前記設定項目の項目名が少なくとも含まれる、ことを特徴とする。
本開示の技術によれば、プレビューペインとプロパティペインを有するUI画面において、テキストブロックと設定項目との対応関係をユーザが容易に把握することができる。
画像処理システムの全体構成を示す図 情報処理装置のハードウェア構成を示すブロック図 画像処理システムのソフトウェア構成を示す図 UI画面の状態遷移を説明する図 UI画面の状態遷移を説明する図 UI画面制御処理の流れを示すフローチャート UI画面制御処理の流れを示すフローチャート UI画面の状態遷移を説明する図 (a)~(c)は、設定項目に対応付けた固有の情報を項目名と併せて表示した場合の一例を示す図 UI画面の状態遷移を説明する図 UI画面制御処理の流れを示すフローチャート
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
[実施形態1]
<システム構成>
図1は、本実施形態に係る、文書を電子化する画像処理システムの全体構成を示す図である。画像処理システムは、スキャン文書処理サーバ111、クライアント端末121、業務サーバ131を含む。クライアント端末121は、インターネット・イントラネットなどのネットワーク101を介してスキャン文書処理サーバ111及び業務サーバ131と通信可能に接続されている。クライアント端末121としては、パーソナルコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォンなどの他、スキャナ機能を備えたMFP(Multifunction Peripheral)などでもよい。図1に示す画像処理システムの構成は一例であって、これに限定されない。例えば、スキャン文書管理サーバ111の機能をクライアント端末121が兼ね備えていてもよい。なお、以下の説明では、見積書等の処理対象文書をスキャンして得られたスキャン画像を「スキャン文書」と呼ぶこととする。
<ハードウェア構成>
図2は、情報処理装置としての、スキャン文書処理サーバ111、クライアント端末121、業務サーバ131のハードウェア構成を示すブロック図である。ユーザインタフェース(UI)201は、ディスプレイ、キーボード、マウス、ボタン、タッチパネルなどによって実現され、情報や信号の入出力を行う。これらのハードウェアを備えないコンピュータは、リモートデスクトップやリモートシェルなどにより、他のコンピュータから接続・操作することも可能である。ネットワークインタフェース202は、ネットワーク101に接続して、他の情報処理装置や不図示のネットワーク機器との通信を行う。通信方式としては、有線・無線のいずれでもよい。CPU203は、装置全体の制御を司る演算装置であり、ROM204、RAM205、二次記憶装置206などから読み込んだプログラムを実行する。ROM204は、組込済みプログラムおよび各種データを記録する。RAM205は、各種データの一時記憶を行い、CPU203のワークメモリとしても機能する。二次記憶装置206は、HDDやフラッシュメモリに代表される大容量記憶装置である。上記各部は入出力インタフェース207を介して相互に接続されている。
<ソフトウェア構成>
図3は、本実施形態に係る、画像処理システムのソフトウェア構成を示す図である。各ソフトウェアは上述したスキャン文書処理サーバ111、クライアント端末121、業務サーバ131にそれぞれインストールされ、それぞれのCPU203で実行される。以下、各ソフトウェアについて説明する。
≪スキャン文書処理サーバのソフトウェア≫
スキャン文書処理アプリケーション311は、スキャン文書処理サーバ111にインストールされているWebアプリケーションである。ただし、Webアプリケーション以外のアプリケーション実装形態でもよい。API312は、スキャン文書処理アプリケーション311によって提供されるAPI(Application Programming Interface)である。Web UI313は、スキャン文書処理アプリケーション311によって提供されるWebユーザインタフェースである。
データストア321は、スキャン文書処理アプリケーション311または後述するバックエンドアプリケーション331が使用するデータを保存・格納する記憶領域である。データストア321には、スキャン文書格納部322、スキャン文書ジョブキュー323、プロパティ管理部324、スキャン文書処理結果格納部325が存在する。スキャン文書格納部322は、スキャン文書自体のデータをファイル化し、JPEG等の画像ファイルあるいはPDF(Portable Document Format)等の文書ファイルとして保存する。スキャン文書ジョブキュー323は、後述するプロパティ入力処理待ちのジョブを管理するキューを保持する。プロパティ管理部324は、スキャン文書ごとに付加が必要なファイル名、フォルダパス、メタデータといったプロパティに関する情報を格納する。具体的には、設定項目の一覧・設定項目毎の名前や値のフォーマット(文字列・数字など)、後述する設定項目毎に保持する各種情報などを管理する。スキャン文書処理結果格納部325は、OCR処理結果、帳票判別結果を格納する。また、スキャン文書処理結果格納部325は、設定項目に関連付けられた文字領域情報(テキストブロック情報)や、設定された値などを、スキャン文書毎に格納する。
バックエンドアプリケーション331は、バックグラウンド処理を実行するためのアプリケーションである。バックエンドアプリケーション331は、バックグラウンドで順次実行すればよい各種の処理、具体的には、OCR処理、帳票処理、通信処理を担当するアプリケーションである。OCR処理部332は、スキャン文書格納部322から処理対象となるスキャン文書を取得し、取得したスキャン文書に対してOCR処理を実行する。OCR処理では、各テキストブロックを特定する情報(具体的には、矩形領域の始点座標・幅・高さの情報)、およびテキストブロック毎の認識文字列の情報が抽出される。帳票処理部333は、処理対象のスキャン文書、OCR処理によって得られたテキストブロックの配置パターンや認識文字列などの情報を用いて、スキャンの対象となった文書(帳票)の種別を判別する。この判別処理は、パターン認識、機械学習などいずれの手法でもよい。通信処理部334は、外部装置である業務サーバ131にスキャン文書およびその解析処理結果の送信処理を実行する。スキャン文書およびその解析処理結果を送信する必要がない場合は、通信処理部334は省略可能である。
≪クライアント端末のソフトウェア≫
クライアントアプリケーション351は、上述のスキャン文書処理アプリケーション311のWebアプリケーションを実行する。例えば、WebブラウザでWeb UI313を表示して、必要なデータをAPI312と送受信することでWebアプリケーションを実行する。
≪業務サーバのソフトウェア≫
業務アプリケーション361は、ファイル管理・文書管理・受注・会計といった企業における各種業務を支援するためのアプリケーションである。業務データストレージ362は、業務アプリケーション361が使用する各種データを保存する。業務アプリケーション361は、スキャン文書処理サーバ111で処理した結果を受信し、それに対して必要な処理を行って保管する。
<クライアントアプリケーションのUI画面>
続いて、クライアント端末121のユーザインタフェース201に表示されるユーザインタフェース画面(以下、「UI画面」と表記。)について説明する。図4(a)は、本実施形態に係る、クライアントアプリケーション351によってユーザインタフェース201に表示されるUI画面の一例を示している。
図4(a)に示すUI画面は、プレビューペイン401とプロパティペイン411の2ペイン構成となっている。いま、プレビューペイン401内には「PURCHASE ORDER(購入注文書)」のスキャン文書のページ画像402がプレビュー表示されている。プレビューペイン401では、ページ画像402をスクロール・ズームして、ページ画像402における任意の位置を表示させることができる。プロパティペイン411は、処理対象のスキャン文書に対して付与すべきプロパティを表示・編集するためのペインである。プロパティとして設定される項目には、「ファイル名」、「フォルダパス」、「メタデータ」といった親項目、及び、親項目を構成する要素である「会社名」、「日付」、「住所」といった子項目がある。
図4(a)のUI画面は、帳票判別処理において処理対象のスキャン文書の帳票種別が「購入注文書」であると判別された場合の例である。いま、プロパティペイン411内には、当該スキャン文書に付与すべき設定項目(大項目)として、[FileName(ファイル名)]と[Metadata(メタデータ)]の2つが表示されている。そして、[FileName]については、「Customer Name(顧客名)」・「Date(日付)」の2つの設定項目(子項目)が表示されている。また、[Metadata]ついては、「Company Name(会社名)」と「Address(住所)」2つの設定項目が表示されている。なお、以下の説明では、ファイル名の子項目を「ファイル名項目」と呼び、メタデータの子項目を「メタデータ項目」と呼ぶこととする。
図4(b)は、ページ画像402と各テキストブロックとの関係を示す直交座標系を説明する図である。図4(b)には、4つのテキストブロック421、422、423、424が存在している。ページ画像402には、さらに多くのテキストブロックがあるが、ここでは説明を省略している。OCR処理によって検出されたテキストブロックは、それぞれ網掛けの矩形で示すように、始点座標・幅・高さでそれぞれ識別される。例えば、“XYZ Corporation”の文字列に対応するテキストブロック423の場合、単位をピクセルとして、「始点座標(1200, 700)」、「幅:720」、「高さ:120」といった具合に表現される。
図5は、図4(a)のUI画面において、2つの大項目[FileName]と[Metadata]のそれぞれについて、各小項目に対しページ画像402内のテキストブロックが関連付けられる様子を説明する図である。いま、ページ画像402内の“XYZ Corporation”の文字列に対応するテキストブロック423とファイル名項目「Customer Name」とが関連付けられている状態である。そして、ユーザが識別しやすいようにテキストブロック423は、例えば色付けした矩形が透過重畳表示される。なお、透過重畳表示に代えて色の付いた枠線の重畳表示などを行ってもよい。プロパティペイン411内の横長の矩形510a、510b、520a、520bは、ファイル名やメタデータといった大項目毎に、各子項目の設定値等を表示・編集する表示フィールドである。そして、各表示フィールド内の横長の矩形511a、511b、521a、522bは、ユーザが選択したテキストブロックに対応する部分の画像(ページ画像402から切り取った画像)が表示される領域(切り取り画像エリア)である。図5の例では、ファイル名項目「Customer Name」に対してテキストブロック423が関連付けられているので、切り取り画像エリア511aには、テキストブロック423の部分画像が表示されている。どのテキストブロックとも関連付けがなされていない段階では、切り取り画像エリア511b、521a、521bのように「+」ボタンが表示される。各切り取り画像エリアの下にある横長の矩形512a、512b、522a、522bは、ユーザ選択に係るテキストブロックに含まれる認識文字列が入力される編集エリアであり、ユーザは不図示のソフトキーボード等によって編集することができる。
<UI画面制御処理>
次に、クライアント端末121のクライアントアプリケーション351によってなされる、上述したUI画面上の各メタデータ項目にテキストブロックを関連付ける制御処理について、図6のフローチャートを用いて説明する。図6に示すフローの実行開始に先立って、まず、スキャン文書処理サーバ111のスキャン文書処理アプリケーション311によって、処理待ちのキューがクライアントアプリケーション351に提供される。ユーザが、クライアントアプリケーション351を用いて、処理を開始したいスキャン文書のジョブを選択すると、スキャン文書処理アプリケーション311は、当該選択されたスキャン文書に対応する必要な情報をデータストア321から取得する。具体的には、スキャン文書格納部322から対応する画像ファイルを、スキャン文書処理結果格納部325から対応するOCR処理結果と帳票判別処理結果を取得する。さらに、帳票種別毎の設定項目一覧および、小項目単位で予め割り当てられた所定の項目色を識別する割当色情報を、プロパティ管理部324から取得する。スキャン文書処理アプリケーション311から、これら取得したデータがクライアントアプリケーション351に提供されて、図6に示すフローが開始する。なお、以下の説明において記号「S」はステップを表すものとする。
S601では、プレビューペイン401内に表示するためのページ画像とOCR処理結果(認識文字列)のデータがロードされる。続くS602では、設定項目一覧とその小項目単位で割り当てられた色情報がロードされる。次のS603では、S601とS602にてロードされたデータの内容がUI画面に反映される。具体的にはページ画像がプレビューペイン401内に表示され、設定項目一覧に含まれる各設定項目の内容(大項目及び小項目)がプロパティペイン411内に表示される。ここまでのS601~S603の処理によって、図4に示すUI画面の状態になる。
そして、S604では、プロパティペイン411内のいずれかの小項目における切り取り画像エリア511b、521a、521bの「+」ボタンの選択操作の操作イベントが検出される。この選択操作は、例えばユーザが指やタッチペンでタッチする操作やマウスによるクリック操作である。こうして、プロパティペイン411に表示された小項目の中からユーザ選択に係る小項目(ここでは、ファイル名項目或いはメタデータ項目)が1つ決定される。以下、ユーザが選択した小項目を「選択小項目(選択ファイル名項目或いは選択メタデータ項目)」と呼ぶ。続くS605では、S604にて決定された選択小項目の表示フィールドに対し、例えば背景色を変える、枠を太くする等の強調処理が行われる。これにより、選択に係る小項目をユーザが識別しやすくなるようにする。
そして、S606では、プレビューペイン401内のページ画像402に存在するいずれかのテキストブロックへの選択操作の操作イベントが検出される。こうして、ページ画像に含まれる1又は複数のテキストブロックの中から任意のテキストブロックが1つ選択される。以下、ユーザが選択したテキストブロックを「選択テキストブロック」と呼ぶ。続くS607では、S606にて決定された選択テキストブロックに対し、例えば色付けする枠を付与する等の強調処理が行われる。これにより、選択テキストブロックをユーザが識別しやすくなるようにする。そして、S608では、選択テキストブロックに対応する切り取り画像が、選択メタデータ項目内の切り取り画像エリアに表示され、選択テキストブロックに含まれる認識文字列が選択メタデータ項目の編集エリア内に表示される。ここまでのS604~S608の処理によって、例えば、小項目「Customer Name」についてテキストブロックを選択すると、図5に示すようなUI画面の状態になる。すなわち、ユーザが選択した設定項目とテキストブロックとが関連付けられ、選択した設定項目に用いる文字列をどのテキストブロックを使って入力するかが決定される。
以上の処理が設定項目一覧内のすべての設定項目について完了し、ユーザによって「Register(登録)」ボタン524が選択操作されると、S609にて、ファイル名等のプロパティの登録要求がスキャン文書処理サーバ111に対して送信される。このプロパティ登録要求には、すべての設定項目における編集済みの値とテキストブロックとを関連付けた情報が含まれる。スキャン文書処理サーバ111では、スキャン文書処理アプリケーション311が、クライアント端末121から受信したプロパティ登録要求に含まれる上述の情報をスキャン文書処理結果格納部325に保存する。この際、プロパティの登録を外部の業務サーバ131にて行う場合は、通信処理部334を介して業務サーバ131にプロパティ登録要求が転送される。スキャン文書処理アプリケーション311は、すべての必要な処理を終了後、スキャン文書ジョブキュー323からキューをデキューする。こうして、本処理が終了する。
以上が、本実施形態に係る、クライアントアプリケーション351におけるUI画面制御処理の大まかな流れである。
≪関連付け済みテキストブロックが選択された場合のUI制御≫
続いて、上述のS609の登録処理がなされる前に、ユーザがプレビューペイン内のテキストブロックに対して選択操作を行った際のUI制御処理について、図7のフローチャートを用いて説明する。いま、上述の図6のフローに従って、大項目「FileName」の小項目「Customer Name」に対してテキストブロック423との関連付けがなされ、前述の図5に示すUI画面の状態にあるものとする。
UI画面が図5に示す状態下、プレビューペイン401内のいずれかのテキストブロックに対する選択操作がなされたとする。ここでの選択操作には、指等でのタッチ操作やマウスでのクリック操作の他、テキストブロックの直上で指やタッチペンをホバーする操作やマウスオーバーする操作であってもよい。ホバー操作とは、タッチパネルから指を離した状態において、指の直下にあるボタン等をタッチしていると見做される操作である。また、マウスオーバー操作とは、カーソルをボタン等の上に重ねる操作を指す。
S701では、ユーザによる上述した選択操作の操作イベントが検出される。ここでは、“XYZ Corporation”のテキストブロック423に対する操作イベントが検出されたものとする。続くS702では、ユーザによって選択されたテキストブロックと既に関連付けられている設定項目が存在するか否かが判定される。判定結果が“No”の場合は本処理を終える。一方、判定結果が“Yes”の場合はS703へ進む。いま、ユーザが選択した“XYZ Corporation”のテキストブロック423に対し、設定項目(大項目「FileName」、小項目「Customer Name」)が既に関連付けられている。よって、この場合の判定結果は“Yes”となり、S703に進むことになる。
S703では、選択テキストブロックに関する情報が取得される。具体的には、その位置を特定可能な座標情報(例えばブロックの始点位置の座標情報)、その大きさを特定可能なサイズ情報(例えば幅及び高さの情報)、およびOCR処理によって得られた認識文字列の情報が含まれる。ここでは、テキストブロック423の情報として、「始点座標(1200, 700)」、「幅:720」、「高さ:120」、「認識文字列:XYZ Corporation」が取得されることになる。
続くS704では、プロパティペイン411内の各設定項目について、既に関連付けられているテキストブロックの始点座標・幅・高さの情報、および認識文字列の情報が、設定項目単位で取得される。いま、図5に示すUI画面では、既にテキストブロックとの関連付けが完了して編集エリア内に文字列が表示されているのは、設定項目「Customer Name」のみである。よって、当該設定項目と関連付けられているテキストブロック423の情報(つまり、S703で取得した情報と同じ情報)が取得されることになる。
次のS705では、プロパティペイン411内の設定項目のうち、選択テキストブロックと同一のテキストブロックが既に関連付けられている設定項目が特定される。この特定の際には、S703で取得した情報と、S704で取得した情報との比較がなされる。そして、S703で取得した情報と一致する情報のテキストブロックと関連付けられている設定項目が特定される。ここでは、テキストブロック423と既に関連付けられている設定項目「Customer Name」が特定されることになる。
そして、S706では、選択テキストブロックに対し、S705にて特定された設定項目を示すラベルが表示される。この際、S701にて検出された選択操作がホバー操作やマウスオーバー操作であった場合には、いわゆるツールチップの形式にて、指やカーソルがテキストブロック上に留まっている間のみラベルが表示される。図8に示すUI画面は、選択テキストブロックであるテキストブロック423から一定距離離れた上部に吹き出し形状にてラベル表示がなされた状態を示している。いま、テキストブロック423は、大項目「FileName」の小項目「Customer Name」と既に関連付けられているので、その事実を示すラベルとして、文字列“Customer Name”を含むラベル801が表示されている。なお、ラベルの表示位置や形状は任意であり、選択テキストブロックに対してなされていることをユーザが認識できればよい。また、図8の例では、ラベル表示の内容として小項目の名称のみとしているが、大項目の内容を併せて(或いは小項目に代えて)表示してもよい。
さらには、各表示フィールド510a、510b、520a、520b内に、図10のように、項目色エリア1010a、1010b、1020a、1020bを設け、各項目に対して割り当てられている項目色を表示するようにしてもよい。その場合、図8のラベル801として、図9(a)のように、選択テキストブロックに対応付けられている設定項目とその項目色とを表示するようにしてもよい。また、各表示フィールド510a、510b、520a、520bに対して、項目色エリアの代わりに、各項目を識別するための識別子(番号を示す数字や、任意の文字列(ID))を表示するようにしてもよい。その場合、図8のラベル801として、図9(b)~(c)に示すように、各設定項目に対応付けた固有の識別子を項目名と併せて表示してもよい。図9(b)は設定項目に順番に割り当てた数字を追加したラベル、図9(c)は設定項目を識別する文字列(ID)を追加したラベルをそれぞれ示している。
図10に示すUI画面は、1つのテキストブロックが複数の異なる設定項目に関連付けられた状況下において、ユーザが当該テキストブロックを選択操作した時のラベル表示の一例を示している。図10の例では、文字列“XYZ Corporation”を含むテキストブロック1001が、「Customer Name」と「Company」の2つの小項目と関連付けられている。そこで、これら2つの設定項目と関連付けられていることを示すラベル1002が表示されている。そして、このラベル1002には、2つの設定項目それぞれの項目名に加え、各設定項目に割り当てられた固有の項目色を示すパッチ1003も存在している。このようなラベル表示を行うことで、1対Nの関連付けにおいても、テキストブロックと設定項目との対応関係をユーザは容易に把握することができる。
また、図10に示すUI画面では、各表示フィールド510a、510b、520a、520b内に、各設定項目に割り当てられた色(項目色)をユーザが識別できるように表示する項目色エリア1010a、1010b、1020a、1020bが存在する。図10の例では、テキストブロック1001、1004、1005が、関連付けられている設定項目に割り当てられている色によって、それぞれ色付けされている。なお、テキストブロック1001は、2つの設定項目(「Customer Name」、「Company Name」)に対応づけられているので、2つの設定項目のうちの1つの項目色で色付けされている。図10の例では、プロパティペイン411に表示されている複数の設定項目の一覧のうちの上位に表示されている設定項目(Customer Name)の項目色で、テキストブロック1001が色付けされている例を示しているが、これに限るものではない。例えば、一覧のうちの下位に表示されている設定項目の項目色で色付けしてもよい。また、対応付けられている複数の設定項目の項目色を表示するようにしてもよい。例えば、テキストブロック1001をストライプ状に分割し、対応付けられている複数の設定項目の項目色で色付けする(例えば、テキストブロック1001の上半分をCustomer Nameの項目色で色付けし、下半分をCompany Nameの項目色で色付けする)ようにしてもよい。
≪関連付け済み設定項目が選択された場合のUI制御≫
続いて、上述のS609の登録処理がなされる前に、ユーザがプロパティペイン内の設定項目に対して選択操作を行った際のUI制御処理について、図11のフローチャートを用いて説明する。ここでも、上述の図6のフローに従って、大項目「FileName」の小項目「Customer Name」に対してテキストブロック423との関連付けがなされ、前述の図5に示すUI画面の状態にあるものとする。
UI画面が図5に示す状態下、プロパティペイン411内のいずれかの設定項目に対する選択操作がなされたとする。ここでの選択操作も、指等でのタッチ操作やマウスでのクリック操作の他、設定項目の直上で指やタッチペンをホバーする操作やマウスオーバーする操作であってもよい。
S1101では、ユーザによる上述した選択操作の操作イベントが検出される。ここでは、設定項目「Customer Name」の切り取り画像エリア511aに対する操作イベントが検出されたものとする。続くS1102では、選択された設定項目の表示フィールドが強調表示される。ここでは、選択設定項目である小項目「Customer Name」の表示フィールド501aが強調表示される。
S1103では、ユーザによって選択された設定項目と既に関連付けられているテキストブロックが存在するか否かが判定される。判定結果が“No”の場合は本処理を終える。一方、判定結果が“Yes”の場合はS1104へ進む。いま、ユーザが選択した設定項目「Customer Name」に対し、文字列“XYZ Corporation”を含むテキストブロック423が既に関連付けられている。よって、この場合の判定結果は“Yes”となり、S1104に進むことになる。
S1104では、選択設定項目と関連付けられているテキストブロックに関する情報、具体的には、始点座標・幅・高さの情報、および認識文字列の情報が取得される。ここでは、テキストブロック423の情報として、「始点座標(1200, 700)」、「幅:720」、「高さ:120」、「認識文字列:XYZ Corporation」が取得されることになる。
続くS1105では、前述のS706と同様、S1104で取得された情報に基づいて選択設定項目と関連付けられているテキストブロックに対して選択設定項目を示すラベルが表示される。このとき、選択設定項目と関連付けられているテキストブロックに対して、複数の設定項目が関連付けられている状況下にある場合は、図10のラベル1002と同様に、当該テキストブロックに関連付けられている複数の設定項目を表示する。
以上が、本実施形態に係る、クライアントアプリケーション351におけるUI画面制御処理の詳細である。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (15)

  1. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面の表示を制御する制御手段を備える画像処理システムであって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出された場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対して表示され
    前記ラベルには、当該操作イベントが検出されたテキストブロックが既に関連付けられている前記設定項目の項目名が少なくとも含まれる、
    ことを特徴とする画像処理システム。
  2. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面の表示を制御する制御手段を備える画像処理システムであって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する領域である第1の領域と、前記プロパティの設定項目毎の設定値を入力する領域である第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出されたときに、当該操作イベントが検出されたテキストブロックが複数の設定項目と既に関連付けられている場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている前記複数の設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対して表示される、
    ことを特徴とする画像処理システム。
  3. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面の表示を制御する制御手段を備える画像処理システムであって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出された場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対してツールチップの形式にて表示される、
    ことを特徴とする画像処理システム。
  4. 前記ユーザインタフェース画面では、ユーザにより、前記第2の領域において所望の設定項目が選択され、かつ、前記第1の領域において当該所望の設定項目に関連付けるテキストブロックが選択された場合、当該選択されたテキストブロックに対応するOCR処理結果の認識文字列が前記第2の領域内の前記所望の設定項目の値として表示される、ことを特徴とする請求項1乃至3のいずれか1項に記載の画像処理システム。
  5. 前記ラベルには、前記操作イベントが検出された前記テキストブロックと関連付けられている前記設定項目に対応する識別子が含まれることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理システム。
  6. 前記識別子は、設定項目毎に割り当てた色、数字、IDのいずれかであることを特徴と
    する請求項5に記載の画像処理システム。
  7. 前記選択操作はホバー操作またはマウスオーバー操作であることを特徴とする請求項1乃至6のいずれか1項に記載の画像処理システム。
  8. 前記ユーザインタフェース画面では、前記第2の領域において表示されているいずれかの設定項目に対する選択操作の操作イベントが検出された場合、前記第1の領域においてプレビュー表示されている前記スキャン画像内のテキストブロックのうち、前記操作イベントが検出された設定項目に既に関連付けられているテキストブロックに対し、当該設定項目を示すラベルが表示される、ことを特徴とする1乃至のいずれか1項に記載の画像処理システム。
  9. 前記ユーザインタフェース画面では、前記第2の領域において表示されているいずれかの設定項目に対する選択操作の操作イベントが検出された場合、さらに、当該操作イベントが検出された設定項目が強調表示されることを特徴とする請求項に記載の画像処理システム。
  10. 前記第2の領域において表示されている設定項目には、前記スキャン画像をファイル化する際に付与されるファイル名に関する設定項目が含まれる、ことを特徴とする請求項1乃至のいずれか1項に記載の画像処理システム。
  11. 前記第2の領域において表示されている設定項目には、前記スキャン画像のメタデータに関する1乃至複数の設定項目が含まれる、ことを特徴とする請求項1乃至10のいずれか1項に記載の画像処理システム。
  12. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面を表示する装置を制御する制御方法であって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出された場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対して表示され
    前記ラベルには、当該操作イベントが検出されたテキストブロックが既に関連付けられている前記設定項目の項目名が少なくとも含まれる、
    ことを特徴とする制御方法。
  13. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面を表示する装置を制御する制御方法であって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出されたときに、当該操作イベントが検出されたテキストブロックが複数の設定項目と既に関連付けられている場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている前記複数の設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対して表示される、
    ことを特徴とする制御方法。
  14. 文書をスキャンして得られたスキャン画像にプロパティを設定するためのユーザインタフェース画面を表示する装置を制御する制御方法であって、
    前記ユーザインタフェース画面には、前記スキャン画像をプレビュー表示する第1の領域と、前記プロパティの設定項目毎の設定値を入力する第2の領域とが少なくとも存在し、
    前記ユーザインタフェース画面では、前記第1の領域においてプレビュー表示された前記スキャン画像内のいずれかのテキストブロックに対する選択操作の操作イベントが検出された場合、当該操作イベントが検出されたテキストブロックが既に関連付けられている設定項目を示すラベルが、当該操作イベントが検出されたテキストブロックに対してツールチップの形式にて表示される、
    ことを特徴とする制御方法。
  15. コンピュータを、請求項1乃至11のいずれか1項に記載の画像処理システムの制御手段として機能させるためのプログラム。
JP2020007532A 2020-01-21 2020-01-21 文書を電子化する画像処理システム、その制御方法及びプログラム Active JP7483384B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020007532A JP7483384B2 (ja) 2020-01-21 2020-01-21 文書を電子化する画像処理システム、その制御方法及びプログラム
US17/147,168 US11303769B2 (en) 2020-01-21 2021-01-12 Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020007532A JP7483384B2 (ja) 2020-01-21 2020-01-21 文書を電子化する画像処理システム、その制御方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2021114237A JP2021114237A (ja) 2021-08-05
JP2021114237A5 JP2021114237A5 (ja) 2023-01-27
JP7483384B2 true JP7483384B2 (ja) 2024-05-15

Family

ID=76858359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020007532A Active JP7483384B2 (ja) 2020-01-21 2020-01-21 文書を電子化する画像処理システム、その制御方法及びプログラム

Country Status (2)

Country Link
US (1) US11303769B2 (ja)
JP (1) JP7483384B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022011034A (ja) * 2020-06-29 2022-01-17 キヤノン株式会社 データ入力支援装置、データ入力支援方法及びプログラム
WO2023032802A1 (ja) * 2021-09-01 2023-03-09 株式会社KPMG Ignition Tokyo アノテーション支援装置、アノテーション支援方法、アノテーション支援プログラム
US20240020136A1 (en) * 2022-07-18 2024-01-18 Vmware, Inc. Method to realize scanner redirection between a client and an agent
US20240020137A1 (en) * 2022-07-18 2024-01-18 Vmware, Inc. Method to realize scanner redirection between a client and an agent using different scanning protocols

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012142002A (ja) 2005-09-09 2012-07-26 Microsoft Corp 表計算データサマリー表を作成するためのユーザインターフェース
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2017126225A (ja) 2016-01-14 2017-07-20 キヤノン株式会社 画像処理装置、方法およびプログラム
JP2019115011A (ja) 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP7317561B2 (ja) 2019-04-19 2023-07-31 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012142002A (ja) 2005-09-09 2012-07-26 Microsoft Corp 表計算データサマリー表を作成するためのユーザインターフェース
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2017126225A (ja) 2016-01-14 2017-07-20 キヤノン株式会社 画像処理装置、方法およびプログラム
JP2019115011A (ja) 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
US20210227083A1 (en) 2021-07-22
JP2021114237A (ja) 2021-08-05
US11303769B2 (en) 2022-04-12

Similar Documents

Publication Publication Date Title
JP7483384B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
US7610274B2 (en) Method, apparatus, and program for retrieving data
US8456662B2 (en) Control for display of multiple versions of a printable document for locked print
CN105635507A (zh) 图像扫描装置和用于控制其的方法
US20090049375A1 (en) Selective processing of information from a digital copy of a document for data entry
JP7434001B2 (ja) 情報処理装置、プログラム、情報処理方法
CN107545534B (zh) 图像处理装置及其控制方法以及存储介质
CN102694940B (zh) 信息处理装置及其控制方法
EP2884425B1 (en) Method and system of extracting structured data from a document
EP2437184A1 (en) Host apparatus and method of displaying content by the same
EP1914674A2 (en) Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP2015028750A (ja) 画像形成装置、画像形成装置の制御方法、およびプログラム
US11620434B2 (en) Information processing apparatus, information processing method, and storage medium that provide a highlighting feature of highlighting a displayed character recognition area
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP2012221396A (ja) プリントキュー名管理プログラム
EP3933678A1 (en) Information processing system, data output system, image processing method, and carrier means
JP7487394B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
US20090128847A1 (en) Printing system, printing method, printing apparatus, and host apparatus
JP7401344B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
JP6190549B1 (ja) 文書処理システム
JP2021135938A (ja) 情報処理装置、プログラム、情報処理方法
US20230368555A1 (en) Information processing apparatus, information processing method, and storage medium
JP7494086B2 (ja) 情報処理装置、およびその制御方法とプログラム
JP2022011985A (ja) 画像処理システム、情報処理システム、画像処理方法、プログラム
JP2022013603A (ja) データ出力システム、情報処理システム、データ出力方法、プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240501

R150 Certificate of patent or registration of utility model

Ref document number: 7483384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150