JP7487394B2 - 文書を電子化する画像処理システム、その制御方法及びプログラム - Google Patents

文書を電子化する画像処理システム、その制御方法及びプログラム Download PDF

Info

Publication number
JP7487394B2
JP7487394B2 JP2023182048A JP2023182048A JP7487394B2 JP 7487394 B2 JP7487394 B2 JP 7487394B2 JP 2023182048 A JP2023182048 A JP 2023182048A JP 2023182048 A JP2023182048 A JP 2023182048A JP 7487394 B2 JP7487394 B2 JP 7487394B2
Authority
JP
Japan
Prior art keywords
field
color
fields
area
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023182048A
Other languages
English (en)
Other versions
JP2024016075A (ja
Inventor
浩太郎 松田
広次 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2020031689A external-priority patent/JP7401344B2/ja
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2024016075A publication Critical patent/JP2024016075A/ja
Priority to JP2024026490A priority Critical patent/JP2024063072A/ja
Application granted granted Critical
Publication of JP7487394B2 publication Critical patent/JP7487394B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/62Retouching, i.e. modification of isolated colours only or in isolated picture areas only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00482Output means outputting a plurality of job set-up options, e.g. number of copies, paper size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/0049Output means providing a visual indication to the user, e.g. using a lamp
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3256Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document colour related metadata, e.g. colour, ICC profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、文書を電子化して利用する際のグラフィカルユーザインタフェース(GUI)に関する。
従来、注文書等の帳票をスキャンして得られたスキャン画像に対し光学文字認識処理(OCR処理)を行って文字列を抽出し、ファイル名等に利用することが行われている。特許文献1には、文書画像内に含まれる文字列の中から特定のキーを含む文字列を抽出してファイル名を自動生成し、文書画像のプレビュー表示と共にユーザに提示する技術が開示されている。この技術によればユーザは、文書画像を確認しながらファイル名を容易に設定することができる。そして、スキャン画像から抽出した文字列をメタデータとして保存・管理し、ファイル名等に利用することも行われている。
特開2019―115011号公報
OCR処理によって得られた認識文字列を用いてファイル名やメタデータを設定する際のアプリケーションのUI画面の構成として、プレビューペインとプロパティペインとからなる2ペイン構成がよく知られている。ここで、プレビューペインは、電子化対象のスキャン画像をプレビュー表示するための領域であり、プロパティペインはファイル名やメタデータといったプロパティの内容を一覧表示するための領域である。注文書や請求書といった文書を電子化する場合、そのスキャン画像には複数の文字領域(テキストブロック)が含まれており、プレビューペインによってユーザは各テキストブロックを視認することができる。また、プロパティペインによってユーザは、「Customer Name」、「Date」、「Address」といった様々な設定項目についての内容を確認することができる。上記2ペイン構成のUI画面にて例えばユーザが、プロパティペイン内の「Customer Name」という設定項目に対し、プレビューペイン内の“XYZ Corporation”のテキストブロックを選択したとする。その結果、スキャン画像内の認識文字列“XYZ Corporation”が、「Customer Name」という設定項目と関連付けて保存されることになる。この場合において、プレビューペイン内に複数のテキストブロックが存在し、かつ、プロパティペイン内にも複数の設定項目が存在すると、どのテキストブロックとどの設定項目とが関連付けられているのかをユーザが即座に把握することが困難であった。
本件は、上記課題に鑑みてなされたものであり、プレビューペインとプロパティペインを有するUI画面において、テキストブロックと設定項目との対応関係をユーザが容易に把握できるようにすることを目的とする。
本開示に係る情報処理装置は、文書画像のプレビュー表示と、複数の設定項目それぞれに対応する値を入力するための複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段を備える情報処理装置であって、前記制御手段は、前記プレビュー表示された文書画像上においてユーザの操作により選択された複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御し、らに、前記複数のフィールドの中から前記ユーザにより選択された第1のフィールドと、当該選択された第1のフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された第1の領域との対応付けが識別されるように、当該対応する前記第1のフィールドと前記第1の領域とを同様の色で色付けして表示するとともに、当該選択された第1の領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を表示するように制御し、さらに、前記ユーザにより選択された前記第1のフィールドと前記第1の領域とに対して同様の色で色付けして表示する際の色が、前記複数のフィールドのうちの前記第1のフィールドと異なる他のフィールド、および、前記複数の領域のうちの前記第1の領域と異なる他の領域、のいずれとも区別可能な色となるように、当該色付けに用いる色を制御する、ものであって、前記制御手段の制御により表示される前記切り取り画像には、前記色付けがされない、ことを特徴とする。
本開示の技術によれば、プレビューペインとプロパティペインを有するUI画面において、テキストブロックと設定項目との対応関係をユーザが容易に把握することができる。
画像処理システムの全体構成を示す図 情報処理装置のハードウェア構成を示すブロック図 画像処理システムのソフトウェア構成を示す図 UI画面の状態遷移を説明する図 UI画面の状態遷移を説明する図 実施形態1に係る、UI画面制御処理の流れを示すフローチャート 変形例2の課題を説明する図 変形例2の効果を説明する図 変形例2に係る、色付け制御処理の詳細を示すフローチャート (a)は色の類否判定を説明する図、(b)は項目色の変更を説明する図 変形例3に係る、色付け制御処理の詳細を示すフローチャート 変形例3の効果を説明する図 実施形態2に係る、UI画面制御処理の流れを示すフローチャート UI画面の状態遷移を説明する図 UI画面の状態遷移を説明する図
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
[実施形態1]
<システム構成>
図1は、本実施形態に係る、文書を電子化する画像処理システムの全体構成を示す図である。画像処理システムは、スキャン文書処理サーバ111、クライアント端末121、業務サーバ131を含む。クライアント端末121は、インターネット・イントラネットなどのネットワーク101を介してスキャン文書処理サーバ111及び業務サーバ131と通信可能に接続されている。クライアント端末121としては、パーソナルコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォンなどの他、スキャナ機能を備えたMFP(Multifunction Peripheral)などでもよい。図1に示す画像処理システムの構成は一例であって、これに限定されない。例えば、スキャン文書処理サーバ111の機能をクライアント端末121が兼ね備えていてもよい。なお、以下の説明では、見積書等の処理対象文書をスキャンして得られたスキャン画像を「スキャン文書」と呼ぶこととする。
<ハードウェア構成>
図2は、情報処理装置としての、スキャン文書処理サーバ111、クライアント端末121、業務サーバ131のハードウェア構成を示すブロック図である。ユーザインタフェース(UI)201は、ディスプレイ、キーボード、マウス、ボタン、タッチパネルなどによって実現され、情報や信号の入出力を行う。これらのハードウェアを備えないコンピュータは、リモートデスクトップやリモートシェルなどにより、他のコンピュータから接続・操作することも可能である。ネットワークインタフェース202は、ネットワーク101に接続して、他の情報処理装置や不図示のネットワーク機器との通信を行う。通信方式としては、有線・無線のいずれでもよい。CPU203は、装置全体の制御を司る演算装置であり、ROM204、RAM205、二次記憶装置206などから読み込んだプログラムを実行する。ROM204は、組込済みプログラムおよび各種データを記録する。RAM205は、各種データの一時記憶を行い、CPU203のワークメモリとしても機能する。二次記憶装置206は、HDDやフラッシュメモリに代表される大容量記憶装置である。上記各部は入出力インタフェース207を介して相互に接続されている。
<ソフトウェア構成>
図3は、本実施形態に係る、画像処理システムのソフトウェア構成を示す図である。各ソフトウェアは上述したスキャン文書処理サーバ111、クライアント端末121、業務サーバ131にそれぞれインストールされ、それぞれのCPU203で実行される。以下、各ソフトウェアについて説明する。
≪スキャン文書処理サーバのソフトウェア≫
スキャン文書処理アプリケーション311は、スキャン文書処理サーバ111にインストールされているWebアプリケーションである。ただし、Webアプリケーション以外のアプリケーション実装形態でもよい。API312は、スキャン文書処理アプリケーション311によって提供されるAPI(Application Programming Interface)である。Web UI313は、スキャン文書処理アプリケーション311によって提供されるWebユーザインタフェースである。
データストア321は、スキャン文書処理アプリケーション311または後述するバックエンドアプリケーション331が使用するデータを保存・格納する記憶領域である。データストア321には、スキャン文書格納部322、スキャン文書ジョブキュー323、プロパティ管理部324、スキャン文書処理結果格納部325が存在する。スキャン文書格納部322は、スキャン文書自体のデータをファイル化し、JPEG等の画像ファイルあるいはPDF(Portable Document Format)等の文書ファイルとして保存する。スキャン文書ジョブキュー323は、後述するプロパティ入力処理待ちのジョブを管理するキューを保持する。プロパティ管理部324は、スキャン文書ごとに付加が必要なファイル名、フォルダパス、メタデータといったプロパティに関する、設定項目の一覧・設定項目毎の名前や値のフォーマット(文字列・数字など)、後述する項目色情報などを管理する。スキャン文書処理結果格納部325は、OCR処理結果、帳票判別結果を格納する。また、スキャン文書処理結果格納部325は、設定項目に関連付けられた文字領域情報(テキストブロック情報)や、設定された値などを、スキャン文書毎に格納する。
バックエンドアプリケーション331は、バックグラウンド処理を実行するためのアプリケーションである。バックエンドアプリケーション331は、バックグラウンドで順次実行すればよい各種の処理、具体的には、OCR処理、帳票処理、通信処理を担当するアプリケーションである。OCR処理部332は、スキャン文書格納部322から処理対象となるスキャン文書を取得し、取得したスキャン文書に対してOCR処理を実行する。OCR処理では、各テキストブロックを特定する情報(具体的には、矩形領域の始点座標・幅・高さの情報)、およびテキストブロック毎の認識文字列の情報が抽出される。帳票処理部333は、処理対象のスキャン文書、OCR処理によって得られたテキストブロックの配置パターンや認識文字列などの情報を用いて、スキャンの対象となった文書(帳票)の種別を判別する。この判別処理は、パターン認識、機械学習などいずれの手法でもよい。通信処理部334は、外部装置である業務サーバ131にスキャン文書およびその解析処理結果の送信処理を行う。スキャン文書およびその解析処理結果を送信する必要がない場合は、通信処理部334は省略可能である。
≪クライアント端末のソフトウェア≫
クライアントアプリケーション351は、上述のスキャン文書処理アプリケーション311のWebアプリケーションを実行する。例えば、WebブラウザでWeb UI313を表示して、必要なデータをAPI312と送受信することでWebアプリケーションを実行する。
≪業務サーバのソフトウェア≫
業務アプリケーション361は、ファイル管理・文書管理・受注・会計といった企業における各種業務を支援するためのアプリケーションである。業務データストレージ362は、業務アプリケーション361が使用する各種データを保存する。業務アプリケーション361は、スキャン文書処理サーバ111で処理した結果を受信し、それに対して必要な処理を行って保管する。
<クライアントアプリケーションのUI画面>
続いて、クライアント端末121のユーザインタフェース201に表示されるユーザインタフェース画面(以下、「UI画面」と表記。)について説明する。図4(a)は、本実施形態に係る、クライアントアプリケーション351によってユーザインタフェース201に表示されるUI画面の一例を示している。
図4(a)に示すUI画面は、プレビューペイン401とプロパティペイン411の2ペイン構成となっている。いま、プレビューペイン401内には「PURCHASE ORDER(購入注文書)」のスキャン文書のページ画像402がプレビュー表示されている。プレビューペイン401では、ページ画像402をスクロール・ズームして、ページ画像402における任意の位置を表示させることができる。プロパティペイン411は、処理対象のスキャン文書に対して付与すべきプロパティを表示・編集するためのペインである。プロパティとして設定される項目には、「ファイル名」、「フォルダパス」、「メタデータ」といった親項目、及び、親項目を構成する要素である「会社名」、「日付」、「住所」といった子項目がある。以下の説明においては、親項目として「メタデータ」を設定登録する場合を例に説明を行うものとする。
図4(a)のUI画面は、帳票判別処理において処理対象のスキャン文書の帳票種別が「購入注文書」であると判別された場合の例である。そして、スキャン文書に付与すべき親項目「メタデータ」の内容として3つの子項目「Customer Name」、「Address」、「Billing Name」が表示されている状態である。なお、以下の説明では、メタデータの子項目を「メタデータ項目」と呼ぶこととする。
図4(b)は、ページ画像402と各テキストブロックとの関係を示す直交座標系を説明する図である。図4(b)には、3つのテキストブロック421、422、423が存在している。ページ画像402には、さらに多くのテキストブロックがあるが、ここでは省略している。OCR処理によって検出されたテキストブロックは、それぞれ網掛けの矩形で示すように、始点座標・幅・高さでそれぞれ識別される。例えば、“XYZ Corporation”の文字列に対応するテキストブロック423の場合、単位をピクセルとして、「始点座標(1200, 700)」、「幅:720」、「高さ:120」といった具合に表現される。
図5は、図4(a)のUI画面において、メタデータ項目に対しページ画像402内のテキストブロックが関連付けられる様子を説明する図である。いま、ページ画像402内の“XYZ Corporation”の文字列に対応するテキストブロック501とメタデータ項目「Customer Name」(510aの項目)とが関連付けられている状態である。そして、ユーザが識別しやすいように、テキストブロック501には、メタデータ項目ごとに項目色情報に基づき割り当てられた色(図5の例では、メタデータ項目「Customer Name」に割り当てられた「赤色」)で色付けした矩形が、透過重畳表示されている。なお、色付けの手法は透過重畳表示に限定されるものではなく色の付いた枠線の重畳表示などでもよい。プロパティペイン411内の横長の矩形510a~510cは、大項目であるメタデータについて、子項目であるメタデータ項目の設定値等を表示・編集する表示フィールドである。また、縦長の矩形511a~511cは、表示フィールド内の一部に設けられた、メタデータ項目毎に割り当てられた色(項目色)をユーザが識別できるように表示する項目色エリアである。そして、横長の矩形512a~512cは、ユーザが選択したテキストブロックに対応する部分の画像(ページ画像402から切り取った画像)が表示される領域(切り取り画像エリア)である。どのテキストブロックとも関連付けがなされていない段階では、切り取り画像エリア512b及び512cのように「+」ボタンが表示され、さらに、項目色エリア511b及び511cの項目色は表示されていない状態となる。各切り取り画像エリア512a~512cの下にある横長の矩形513a~513cは、ユーザ選択に係るテキストブロックに含まれる認識文字列が表示される編集エリアであり、ユーザは不図示のソフトキーボード等によって表示内容を編集することができる。
<UI画面制御処理>
次に、クライアント端末121のクライアントアプリケーション351によってなされる、上述したUI画面上の各メタデータ項目にテキストブロックを関連付ける制御処理について、図6のフローチャートを用いて説明する。図6に示すフローの実行開始に先立って、まず、スキャン文書処理サーバ111のスキャン文書処理アプリケーション311によって、処理待ちのキューがクライアントアプリケーション351に提供される。ユーザが、クライアントアプリケーション351を用いて、処理を開始したいスキャン文書のジョブを選択すると、スキャン文書処理アプリケーション311は、当該選択されたスキャン文書に対応する必要な情報をデータストア321から取得する。具体的には、スキャン文書格納部322から対応する画像ファイルを、スキャン文書処理結果格納部325から対応するOCR処理結果と帳票判別処理結果を取得する。さらに、帳票種別毎のメタデータ項目一覧および、メタデータ項目毎に予め割り当てられた所定の色を識別する項目色情報を、プロパティ管理部324から取得する。スキャン文書処理アプリケーション311から、これら取得したデータがクライアントアプリケーション351に提供されて、図6に示すフローが開始する。なお、以下の説明において記号「S」はステップを表すものとする。
S601では、プレビューペイン401内に表示するためのページ画像とOCR処理結果(認識文字列)のデータがロードされる。続くS602では、帳票種別に対応するメタデータ項目一覧と項目色情報がロードされる。次のS603では、S601とS602にてロードされたデータの内容がUI画面に反映される。具体的にはページ画像がプレビューペイン401内に表示され、メタデータ項目一覧に含まれる各メタデータ項目がプロパティペイン411内に表示される。ここまでのS601~S603の処理によって、図4に示すUI画面の状態になる。この時点ではプロパティペイン411内の各メタデータ項目の項目色エリア511a~511cへの色付けは保留されており、デフォルト(例えば灰色)の状態である。これは、前述した切り取り画像エリア512の「+」ボタン表示と共に、色付けが未定状態であることを視覚的に表現することにより、メタデータが未設定であることをユーザに分かりやすく提示して、メタデータの設定を行うように促すためである。
そして、S604では、プロパティペイン411内のいずれかのメタデータ項目における切り取り画像エリア512a~512cの「+」ボタンの選択操作の操作イベントが検出される。この選択操作は、タッチパネル上の「+」ボタンを、ユーザが指やタッチペンでタッチする等の操作やマウスでのクリック操作である。こうして、メタデータ項目一覧に含まれる1又は複数のメタデータ項目の中からユーザ選択に係るメタデータ項目が1つ決定される。以下、ユーザが選択したメタデータ項目を「選択メタデータ項目」と呼ぶ。続くS605では、S604にて決定された選択メタデータ項目の項目色エリアが、S602にてロードされた項目色情報に従って、色付けされる。ここで、項目色情報には、親項目内に存在する各子項目の順序に対して特定の色がそれぞれ対応付けられているものとする。例えば、予め青、緑、黄、赤の4色を使用可能な色として定義しておき、1番目の設定項目には“青”、2番目の設定項目には“緑”、3番目の設定項目には“黄”、4番目の設定項目には“赤”といった具合に項目順と色とを対応付けておく。この場合、親項目「メタデータ」の3つの子項目は「Customer Name」、「Address」、「Billing Name」の順序なので、それぞれに“青”、“緑”、“黄”が項目色として割り当てられることになる。このように、複数の設定項目における順序に対して特定の色を対応付けておくことで、様々な種類の設定項目において項目色情報を共通化できる。なお、項目色情報において、個々の具体的な設定項目に対し特定の色を予め割り当てておいてもよい。また、ユーザにより選択操作が為された選択メタデータ項目の表示フィールドについて、例えば、当該表示フィールド内の項目色エリア以外のエリアの色を変える等の強調表示を行って、現在選択中のメタデータ項目をユーザが識別しやすくなるようにする。なお、現在選択中のメタデータ項目を識別できるようにする方法としては、色を変えるものに限るものではなく、例えば、当該メタデータ項目の表示フィールドを太線枠で囲んで強調表示するようにしても構わない。
そして、S606では、プレビューペイン401内のページ画像402に存在するいずれかのテキストブロックへのタッチ操作等の操作イベントが検出される。こうして、ページ画像に含まれる1又は複数のテキストブロックの中から任意のテキストブロックが1つ選択される。以下、ユーザが選択したテキストブロックを「選択テキストブロック」と呼ぶ。続くS607では、S606にて決定された選択テキストブロックが、S605にて色付けされた選択メタデータ項目内の項目色エリアに色付けされた色と同じ色に色付けされる。そして、S608では、S607にて色付けされた選択テキストブロックに対応する切り取り画像が、選択メタデータ項目内の切り取り画像エリアに表示される。さらに、S607にて色づけされた選択テキストブロックに含まれる認識文字列が、S604にて決定された選択メタデータ項目の編集エリア内に表示される。ここまでのS604~S608の処理によって、図5に示すようなUI画面の状態になる。すなわち、ユーザが選択したメタデータ項目とテキストブロックとが関連付けられ、選択したメタデータ項目に用いる文字列をどのテキストブロックを使って入力するかが決定される。
以上の処理がメタデータ項目一覧内のすべてのメタデータ項目について完了し、ユーザによって「Register(登録)」ボタン514がタッチ操作されると、S609にて、メタデータの登録要求がスキャン文書処理サーバ111に対して送信される。このメタデータ登録要求には、すべてのメタデータ項目における編集済みの値とテキストブロックとを関連付けた情報が含まれる。スキャン文書処理サーバ111では、スキャン文書処理アプリケーション311が、クライアント端末121から受信したメタデータ登録要求に含まれる上述の情報をスキャン文書処理結果格納部325に保存する。この際、メタデータの登録を外部の業務サーバ131にて行う場合は、通信処理部334を介して業務サーバ131にメタデータ登録要求が転送される。スキャン文書処理アプリケーション311は、すべての必要な処理を終了後、スキャン文書ジョブキュー323からキューをデキューする。こうして、本処理が終了する。
以上が、本実施形態に係る、クライアントアプリケーション351におけるUI画面制御処理の内容である。なお、本実施形態では、設定項目毎に割り当てられた色を示す項目色エリアを、各設定項目の表示フィールドにそれぞれ設けているが、個別の項目色エリアを設けることは必須ではない。つまり、設定項目がユーザによって選択されたことを示す強調表示のためのエリア(各表示フィールドにおいて切り取り画像エリアと編集エリアとを除くエリア)も項目色を示すようにしてもよい。なお、各表示フィールド内の切り取り画像エリアと編集エリアとを除くエリアで項目色を示すように構成した場合、ユーザが設定項目を選択したことを示す強調表示として、例えば、当該選択された表示フィールドを囲む太線枠を付加したり、色の濃度を変化させたりすることで強調表示すればよい。
<変形例1>
なお、上述の図6のフローでは、ユーザによる注目するメタデータ項目の選択(切り取り画像エリア内の「+」ボタンへのタッチ操作検知)に伴う強調表示のタイミング(S605)で、項目色エリアの色付けを行っていた。しかし、項目色エリアへの色付けのタイミングはこれに限定されない。例えば、S607での選択テキストブロックへの色付けと同じタイミングで、選択メタデータ項目内の項目色エリアへの色付けを行うようにしてもよい。
<変形例2>
上述の図6のフローでは、プレビューペイン内の選択テキストブロックを、選択メタデータ項目の項目色エリアと同じ色に色付けすることで、メタデータ項目とテキストブロックとの対応関係をユーザが把握できるようにしていた。この際、色付けに使用される色と、選択テキストブロック内の文字色あるいは背景色とが、互いに類似してしまう可能性がある。そうなると、選択テキストブロックに色付けされた色の視認性が悪化してしまう。そこで、色付けに使用する色を必要に応じて変更する態様を変形例2として説明する。
図7は、前述の図5に相当する、本変形例の課題を説明する図である。図7におけるページ画像402’では、文字色が黒の3つの文字列“XYZ Corporation”、“1 Pumpkin Road, New York, NY”、“(123)456-7980”が罫線で囲まれ、その内側に水色の背景色が付いている。いま、ページ画像402’内の“XYZ Corporation”の文字列に対応するテキストブロック701と、メタデータ項目「Customer Name」とが関連付けられている状態である。そして、3つあるメタデータ項目のうち「Customer Name」は1番目の設定項目なので、その表示フィールド510a内の項目色エリア511aには青色が表示されている。その結果、“XYZ Corporation”の文字列を囲む罫線内の背景色である水色と、テキストブロック701への色付けに使用される青色とが相互に類似(同系色)する結果となってしまっている。これでは、テキストブロック701とメタデータ項目「Customer Name」とが関連付けられていることをユーザが把握することは困難である。
図8は、本変形例を適用した場合の効果を説明する図である。図7と同様、ページ画像402’内の“XYZ Corporation”の文字列に対応するテキストブロック701とメタデータ項目「Customer Name」とが関連付けられている状態である。ただし、図8では、メタデータ項目「Customer Name」の項目色エリア511aには、本来の青色ではなく、赤色が表示されている。その結果、“XYZ Corporation”の文字列を囲む罫線内の背景色である水色と、テキストブロック701に色付けされた赤色とで色のコントラストが生まれ、ユーザが関連付けを容易に把握できるようになっている。
ここで、本変形例に係る、設定項目とテキストブロックへの色付けを制御する処理の詳細について、図9のフローチャートを参照して説明する。なお、図9のフローで示す色付け制御処理は、前述の図6のフローにおいて、S607の代わりに実行されるものである。
S901では、S606にて操作イベントが検出された選択テキストブロックに含まれる文字列の文字色及び当該テキストブロックの背景色の情報が、スキャン文書処理アプリケーション311を介してスキャン文書処理結果格納部325から取得される。ここでは、文字色として黒を示す値(R,G,B=0,5,5)、背景色として水色を示す値(R,G,B=188,213,254)の情報が取得されたものとして説明を続ける。
S902では、S605にて項目色情報に基づき色付けされた色(すなわち、選択メタデータ項目の項目色として割り当てられ、その項目色エリアに色付けされた色)の情報が取得される。本変形例において項目色情報には、デフォルトの内容として、1番目の設定項目に“青”、2番目の設定項目に“緑”、3番目の設定項目に“黄”、4番目の設定項目に“赤”を割り当てることが定義されていたものとする。ここで、メタデータペイン411内の3つのメタデータ項目のうち1番目の「Customer Name」が選択されていた場合には“青”で項目色エリアが色付けされていることになるので、この場合“青”を示す情報(例えばRGB値)が取得されることになる。
次のS903では、選択メタデータ項目の項目色として割り当てられた色と、選択テキストブロック内の文字色及び背景色とが比較され、相互に類似しているかどうかが判定される。例えば、図10(a)に示すように、選択メタデータ項目の項目色として割り当てられている色のRGB値とS901で取得した文字色及び背景色のRGB値とをそれぞれ比較して、その差分が所定の閾値内にあるかどうかを判定する。この際、例えば青色に対しては、色相が近い水色や紫色を“類似”と判定するような閾値を設定することが望ましい。ここでは、選択メタデータ項目「Customer Name」の項目色として割り当てられた青色が、選択テキストブロックの背景色である水色と類似していると判定されたものとする。こうして、選択メタデータ項目について項目色として割り当てられた色が、選択テキストブロック内の文字色又は背景色と類似すると判定された場合はS904に進む。一方、類似しないと判定された場合はS905に進む。
S904では、選択メタデータ項目の項目色として現在割り当てられている色を、項目色情報で定義されている他の異なる色に変更する処理がなされる。具体的には、候補色情報における項目順と各色との対応付けを変更し、選択メタデータ項目に対して異なる色を割り当てる。上述の例の場合、選択メタデータ項目「Customer Name」の順序は1番目である。そこで、図10(b)に示すように、順序が最後尾であり上述の例では使用されることのない4番目と対応付けられている色(この場合は“赤”)に変更し、それと同時に、4番目に“青”を対応付ける処理を行う。このように1番目と4番目との間で色の対応付けを入れ替えることで、2番目と3番目については色の対応付けを維持でき、変更の影響を最小限に留めることができる。こうして、選択メタデータ項目の項目色となる色を変更し、それに伴い項目色情報を更新した後はS903に戻って、再度の類否判定を行う。この処理を、非類似との判定結果が出るまで繰り返す。
そして、S905では、選択メタデータ項目の項目色エリアの色の表示が必要に応じて更新される。すなわち、S904にて選択メタデータ項目の項目色として割り当てられていた色が別の色に変更された場合には、変更後の色で新たに色付けされることになる。
S906では、選択メタデータ項目の項目色エリアに表示中の色と同じ色を用いて選択テキストブロックが色付けされる。これにより、前述の図8に示すようなUI画面の状態になる。色付けが終わると、図6のフローに戻り、S608の表示処理が実行される。
以上が、変形例2に係る色付け制御処理の内容である。なお、実施形態1で述べたとおり、選択メタデータ項目内の項目色エリアへの色付けを、選択テキストブロックへの色付けを行うときまで留保しておき、双方を同じタイミングで色付けするように制御してもよい。
<変形例3>
設定項目の数が多くなると、文字色や背景色と非類似の色を、項目色情報の中で定義されている色の中から選び出して割り当てることが困難なケースが生じ得る。そこで、項目色情報に基づかずに設定項目毎の項目色となる色を決定して割り当てる態様を、変形例3として説明する。
本変形例に係る、設定項目とテキストブロックへの色付けを制御する処理の詳細について、図11のフローチャートを参照して説明する。なお、図11のフローで示す色付け制御処理は、前述の図6のフローにおいて、S602に代わって実行されるものとする。そして、本変形例を適用する場合の図6のフローのS605では、項目色情報に基づき決定された色ではなく、後述の処理によって決定された色を用いて、項目色エリアの色付けがなされることになる。
S1101では、メタデータ項目一覧がロードされる。すなわち、本変形例の場合、項目色情報はロードされない。続くS1102では、S601でロードされたOCR処理結果から、ページ画像内の全てのテキストブロックに含まれる文字列の文字色及び当該テキストブロックの背景色の情報が取得される。
S1103では、S1102にて取得された文字色及び背景色において、出現頻度の高い有彩色が特定される。例えば、ページ画像内に100個のテキストブロックが存在し、文字色としてすべて黒色が使用されていたとする。一方、背景色に関しては、白色が使用されたテキストブロックが80個、水色が使用されたテキストブロックが18個、黄緑色が使用されたテキストブロックが2個であったとする。この場合、有彩色は水色と黄緑色なので、より使用回数の多い水色が、出現頻度の高い有彩色として特定されることになる。なお、無彩色である黒と白を除外しているのは、一般的に帳票等で多く用いられるため、識別を目的とした項目色として使用するには馴染まないためである。
S1104では、S1103にて特定された頻出する有彩色に基づき、各メタデータ項目についての項目色が決定される。具体的な決定方法の一例を挙げると以下のとおりである。
第1の方法は、色相環を利用する方法である。この場合、頻出する有彩色を基準として、色相環において遠い位置にある色を各メタデータ項目に対する項目色として決定する。例えば、頻出する有彩色が水色でこれを基準とする場合には、色相環において最も離れた位置にあるのは橙色であるので、橙色を中心とした所定範囲(例えば黄色~紫色の範囲)の中から項目色として割り当てる色を決定する。この際、項目色を割り当てるべき設定項目が複数存在し、複数の色を決定する必要がある場合には、当該複数の色同士が区別できるよう、例えば色相環における間隔が略等しくなるように選べばよい。
第2の方法は、予め決めておいた複数の候補色の中から、頻出する有彩色とは非類似の色を項目色として決定する方法である。例えば、候補色として、赤、緑、黄、青、紫の5色を予め決めておく。そして、頻出する有彩色が例えば水色であれば、水色に類似する青色を除いた残りの4色(赤、緑、黄、紫)の中から順次、項目色として割り当てるといった具合である。なお、この際の候補色の数は、処理対象として想定される帳票のフォーマット等に応じて決定すればよい。また、除外する色を決める際には、変形例2のS903で説明したのと同様の類否判定を行えばよい。
以上説明した2つの方法は一例であり、頻出する有彩色を基準として、ユーザが区別しやすい色を項目色として割り当てることができればよい。
図12は、本変形例を適用した場合の効果を説明する図である。この例では、“XYZ Corporation”の文字列を囲む罫線内の背景色が水色であるため、水色とは非類似の3色が項目色として決定され、割り当てられている。すなわち、3つのメタデータ項目「Customer Name」、「Address」、「Total Price」に対して、赤色、橙色、黄色がそれぞれ項目色として割り当てられている。これにより、3つのテキストブロック1201~1203への色付けに使用される色が際立ち、各選択メタデータ項目にそれぞれ対応する選択テキストブロックとの関連付けをユーザが容易に把握できるようになっている。
以上が、変形例3に係る色付け制御処理の内容である。なお、頻出する有彩色として特定する色は複数であってもよい。また、ページ画像内に存在す全てのテキストブロックからではなく、例えばページ画像の上部など一部の領域に存在するテキストブロックのみを対象として頻出する有彩色を特定してもよい。なお、変形例2と同様、選択メタデータ項目内の項目色エリアへの色付けを、選択テキストブロックへの色付けを行うときまで留保しておき、双方を同じタイミングで色付けするように制御してもよい。
以上のとおり本実施形態に依れば、プレビューペインとプロパティペインを有するUI画面において、ページ画像内に複数のテキストブロックが存在し、プロパティペイン内に複数の設定項目(子項目)が存在しても、両者の対応関係をユーザが容易に把握することができる。
[実施形態2]
実施形態1では、1つのメタデータ項目に対し1つのテキストブロックを関連付ける、1対1の関連付けがなされる場合を想定したUI画面制御について説明した。次に複数のメタデータ項目に対し同一のテキストブロックを関連付ける、1対Nの関連付けがなされた場合にも対応可能なUI画面制御について、実施形態2として説明する。なお、システム構成など実施形態1と共通する内容については説明を省略し、以下では差異点を中心に説明することとする。
<UI画面制御処理>
クライアント端末121のクライアントアプリケーション351によってなされる、本実施形態に係るUI画面制御処理について、図13のフローチャートを用いて説明する。ここでは、実施形態1の図6のフローに従って、3つのメタデータ項目「Customer Name」、「Address」、「Billing Name」それぞれに対するテキストブロックとの関連付けがなされ、図14に示すUI画面の状態にあるものとして説明を行う。
図14のUI画面において、ページ画像402内のテキストブロック501の左上には、当該テキストブロックが関連付けられているメタデータ項目数(ここでは“2”)を示すラベル1401が付されている。このラベルは、複数のメタデータ項目に対して同一のテキストブロックが関連付けられたタイミング(すなわち、項目数が2以上となった時点)で表示するものとするが、これに限るものではなく、いずれかのメタデータ項目と関連付けられたタイミングで表示するようにしてもよい。そして、いま、テキストブロック501は、複数のメタデータ項目との関連付けがなされた場合のデフォルト色(ここでは灰色)で色付けがされた状態となっている。これに対し、1つのメタデータ項目「Address」とのみ関連付けられているテキストブロック1402については、対応する項目色エリア511bが示す青色に色付けされている。
UI画面が図14に示す状態下、プロパティペイン411内の各メタデータ項目の表示フィールド510a~510cのうち、いずれかの表示フィールドがユーザによって選択(指によるタッチ操作等)されたとする。S1301では、ユーザによるタッチ操作等の操作イベントが検出される。ここでは、「Billing Name」の表示フィールド510cに対する操作イベントが検出されたものとする。続くS1302では、ユーザによって選択されたメタデータ項目と関連付けられているテキストブロックが、他のメタデータ項目とも関連付けされているかが判定される。判定結果が“No”の場合は本処理を終了する。一方、判定結果が“Yes”の場合はS1303へ進む。いま、ユーザが選択したメタデータ項目「Billing Name」に対してテキストブロック501が関連付けられており、さらに、メタデータ項目「Customer Name」に対してもテキストブロック501が関連付けられている。よって、この場合の判定結果は“Yes”となり、S1303に進むことになる。
S1303では、選択メタデータ項目に関連付けされているテキストブロックの色が、当該選択メタデータ項目の項目色エリアの色と同じ色に色付けされる。ここでは、テキストブロック501の色が、デフォルト色である灰色から、メタデータ項目「Billing Name」の表示フィールド内の項目色エリア511cが示す黄色に変化することになる。図15に示すUI画面は、メタデータ項目「Billing Name」が選択されたことに伴い、テキストブロック501の色が灰色から黄色に変化した状態を示している。
次のS1304では、選択メタデータ項目とテキストブロックとの関連付けを解除するためのボタンが表示される。図15のUI画面において、テキストブロック501の右上に現れた「×」印のボタン1501が、解除ボタンを示している。続くS1305では、解除ボタンがタッチ操作等されたか否かが判定される。解除ボタンへのタッチ操作等の操作イベントが検出された場合はS1306に進み、検出されなかった場合は本処理を抜ける。
S1306では、選択メタデータ項目とテキストブロックとの関連付けが解除され、現在関連付けられているメタデータ項目の数を示すラベルが更新される。具体的には、選択メタデータ項目との関連付けが解除される結果、ラベルが示すメタデータ項目数が“1”減算される。図15の例では、ラベル1401の数値が現在の“2”から“1”に変化することになる。また、これに伴い、選択メタデータ項目に対応する表示フィールドが初期化され、ブランク状態となる。いま、選択メタデータ項目が「Billing Name」なので、対応する表示フィールド510cが初期化されることになる。
以上が、本実施形態に係る、クライアントアプリケーション351におけるUI画面制御処理の内容である。
以上のとおり本実施形態によれば、複数の設定項目(子項目)に対し同一のテキストブロックが関連付けられた場合においても、ユーザは、子項目とテキストブロックとの対応関係を正確かつ容易に把握することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (32)

  1. 文書画像のプレビュー表示と、複数の設定項目それぞれに対応する値を入力するための複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段を備える情報処理装置であって、
    前記制御手段は
    記プレビュー表示された文書画像上においてユーザの操作により選択された複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御し、
    らに、前記複数のフィールドの中から前記ユーザにより選択された第1のフィールドと、当該選択された第1のフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された第1の領域との対応付けが識別されるように、当該対応する前記第1のフィールドと前記第1の領域とを同様の色で色付けして表示するとともに、当該選択された第1の領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を表示するように制御し、
    さらに、前記ユーザにより選択された前記第1のフィールドと前記第1の領域とに対して同様の色で色付けして表示する際の色が、前記複数のフィールドのうちの前記第1のフィールドと異なる他のフィールド、および、前記複数の領域のうちの前記第1の領域と異なる他の領域、のいずれとも区別可能な色となるように、当該色付けに用いる色を制御する、ものであって、
    前記制御手段の制御により表示される前記切り取り画像には、前記色付けがされない、
    ことを特徴とする情報処理装置。
  2. 前記制御手段は、
    前記ユーザインタフェース画面において前記第1のフィールドが前記ユーザにより選択されている状態において、前記プレビュー表示されている前記文書画像内の前記第1の領域が前記ユーザにより選択されると、当該選択された前記第1のフィールドと前記第1の領域とを、前記第1のフィールドに対応する第1の設定項目に割り当てられた色と同様の色で色付けして表示するように制御する、
    ことを特徴とする請求項に記載の情報処理装置。
  3. 前記制御手段は、前記第1の設定項目に関する前記第1のフィールドを色付けして表示する処理を、前記第1の設定項目に関する前記第1のフィールドを選択するための操作イベントが検出されたタイミングで行うことを特徴とする請求項に記載の情報処理装置。
  4. 前記制御手段は、前記第1の設定項目に関する前記第1のフィールドを色付けして表示する処理を、前記第1の領域が前記ユーザにより選択されて当該選択された前記第1の領域を色付けして表示する処理と同じタイミングで行うことを特徴とする請求項に記載の情報処理装置。
  5. 前記第1のフィールドの色付けは、当該第1のフィールド内に設けられた、項目色を表示するための項目色エリアで行われることを特徴とする請求項乃至のいずれか1項に記載の情報処理装置。
  6. 前記制御手段は、前記第1の領域内の文字の文字色又は背景色とは類似しない色を、前記第1のフィールドと前記第1の領域とを色付けして表示する際に用いる、ことを特徴とする請求項1乃のいずれか1項に記載の情報処理装置。
  7. 前記制御手段は、前記第1のフィールドを色付けして表示する際に、割り当て可能な複数の色を定義した項目色情報を参照して特定される特定の色を割り当てて表示するように制御する、ことを特徴とする請求項乃至のいずれか1項に記載の情報処理装置。
  8. 前記項目色情報においては、複数の設定項目における順序に応じた色がそれぞれ対応付けられて定義されており、
    前記制御手段は、前記ユーザが選択した設定項目に対し、前記項目色情報を参照して、当該設定項目の順序に対応する色を割り当てて表示するように制御する、
    ことを特徴とする請求項に記載の情報処理装置。
  9. 前記制御手段は、前記項目色情報を参照して割り当てた色が、前記ユーザの操作により選択された領域内の文字色又は背景色と類似する場合、類似しない色に変更して表示するように制御することを特徴とする請求項に記載の情報処理装置。
  10. 前記制御手段は、前記複数の領域内の文字の文字色又は背景色のうち頻出する有彩色を特定し、当該有彩色とは類似しない色を、前記第1のフィールドと前記第1の領域とを色付けして表示する際に用いる、ことを特徴とする請求項乃至のいずれか1項に記載の情報処理装置。
  11. 前記制御手段は、前記有彩色を基準として色相環において離れた位置にある色を、前記第1のフィールドと前記第1の領域とを色付けして表示する際に用いることを特徴とする請求項10に記載の情報処理装置。
  12. 前記制御手段は、予め決めておいた複数の候補色の中から、前記有彩色とは類似しない色を、前記第1のフィールドと前記第1の領域とを色付けして表示する際に用いることを特徴とする請求項10に記載の情報処理装置。
  13. 前記制御手段は、前記プレビュー表示されている前記文書画像内の前記複数の領域のうちの1つの領域から得られた文字認識結果が、前記複数のフィールドのうちの2つ以上に入力された場合、当該文字認識結果が入力された2つ以上のフィールドの数を示すラベルを、当該1つの領域に対して表示するように制御する、ことを特徴とする請求項1に記載の情報処理装置。
  14. 前記制御手段は、前記プレビュー表示されている前記文書画像内の前記1つの領域が、前記複数のフィールドのうちの2つ以上と関連付けられた後に前記ラベルを表示することを特徴とする請求項13に記載の情報処理装置。
  15. 前記制御手段は、
    前記ユーザの操作により選択されたフィールドに入力された文字認識結果が、前記複数のフィールドのうちの他のフィールドのいずれかにも入力されている場合、当該選択されたフィールドと、当該フィールドに入力された文字認識結果が得られた領域との間の対応付けを解除するための解除ボタンを表示し、
    前記解除ボタンに対する選択操作の操作イベントが検出されると、当該選択されたフィールドと当該フィールドに入力された文字認識結果が得られた領域との関連付けを解除し、前記ラベルが示す設定項目の数を減算する、
    ことを特徴とする請求項13に記載の情報処理装置。
  16. 文書画像のプレビュー表示と、複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段を備える情報処理装置であって、
    前記制御手段は、
    前記プレビュー表示された文書画像上における複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御するものであり
    らに、前記複数のフィールドの中からユーザにより選択された1つのフィールドと、当該選択された1つのフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された1つの領域とが、前記複数のフィールドのうちの当該選択された1つのフィールドと異なる他のフィールド、および、前記プレビュー表示された文書画像上の前記複数の領域のうちの、当該他のフィールドに入力された文字認識結果が得られた他の領域、のいずれとも区別可能となるように、当該選択された1つのフィールドと当該選択された1つの領域とに対して、当該他のフィールドおよび当該他の領域のいずれとも異なる色で、色付けして表示するとともに、当該選択された1つの領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を前記色付けがされていない状態で表示するように制御する、
    ことを特徴とする情報処理装置。
  17. 前記1つのフィールドに対する色付けは、当該1つのフィールドの少なくとも一部に色付けすることにより行われることを特徴とする請求項16に記載の情報処理装置。
  18. 前記複数のフィールドは、複数の設定項目それぞれに対応する値を入力するためのフィールドであることを特徴とする請求項16に記載の情報処理装置。
  19. 前記ユーザインタフェース画面は、前記文書画像のプレビュー表示を行うペインと、前記複数のフィールドを表示するためのペインとを含む画面であることを特徴とする請求項1乃至18のいずれか1項に記載の情報処理装置。
  20. 前記文書画像は、文書をスキャンすることにより得られた文書画像であることを特徴とする請求項1乃至19のいずれか1項に記載の情報処理装置。
  21. 文書画像のプレビュー表示と、複数の設定項目それぞれに対応する値を入力するための複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段を備える画像処理システムであって、
    前記制御手段は
    記プレビュー表示された文書画像上においてユーザの操作により選択された複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御し、
    らに、前記複数のフィールドの中から前記ユーザにより選択された第1のフィールドと、当該選択された第1のフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された第1の領域との対応付けが識別されるように、当該対応する前記第1のフィールドと前記第1の領域とを同様の色で色付けして表示するとともに、当該選択された第1の領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を表示するように制御し、
    さらに、前記ユーザにより選択された前記第1のフィールドと前記第1の領域とに対して同様の色で色付けして表示する際の色が、前記複数のフィールドのうちの前記第1のフィールドと異なる他のフィールド、および、前記複数の領域のうちの前記第1の領域と異なる他の領域、のいずれとも区別可能な色となるように、当該色付けに用いる色を制御する、
    ものであって、
    前記制御手段の制御により表示される前記切り取り画像には、前記色付けがされない、
    ことを特徴とする画像処理システム。
  22. 文書画像のプレビュー表示と、複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段を備える画像処理システムであって、
    前記制御手段は、
    前記プレビュー表示された文書画像上における複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御するものであり
    らに、前記複数のフィールドの中からユーザにより選択された1つのフィールドと、当該選択された1つのフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された1つの領域とが、前記複数のフィールドのうちの当該選択された1つのフィールドと異なる他のフィールド、および、前記プレビュー表示された文書画像上の前記複数の領域のうちの、当該他のフィールドに入力された文字認識結果が得られた他の領域、のいずれとも区別可能となるように、当該選択された1つのフィールドと当該選択された1つの領域とに対して、当該他のフィールドおよび当該他の領域のいずれとも異なる色で、色付けして表示するとともに、当該選択された1つの領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を前記色付けがされていない状態で表示するように制御する、
    ことを特徴とする画像処理システム。
  23. 前記1つのフィールドに対する色付けは、当該1つのフィールドの少なくとも一部に色付けすることにより行われることを特徴とする請求項22に記載の画像処理システム。
  24. 前記複数のフィールドは、複数の設定項目それぞれに対応する値を入力するためのフィールドであることを特徴とする請求項22に記載の画像処理システム。
  25. 前記ユーザインタフェース画面は、前記文書画像のプレビュー表示を行うペインと、前記複数のフィールドを表示するためのペインとを含む画面であることを特徴とする請求項21乃至24のいずれか1項に記載の画像処理システム。
  26. 前記文書画像は、文書をスキャンすることにより得られた文書画像であることを特徴とする請求項21乃至25のいずれか1項に記載の画像処理システム。
  27. 情報処理装置の制御手段が、文書画像のプレビュー表示と、複数の設定項目それぞれに対応する値を入力するための複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御方法であって、
    前記情報処理装置の前記制御手段は
    記プレビュー表示された文書画像上においてユーザの操作により選択された複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御し、
    らに、前記複数のフィールドの中から前記ユーザにより選択された第1のフィールドと、当該選択された第1のフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された第1の領域との対応付けが識別されるように、当該対応する前記第1のフィールドと前記第1の領域とを同様の色で色付けして表示するとともに、当該選択された第1の領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を表示するように制御し、
    さらに、前記ユーザにより選択された前記第1のフィールドと前記第1の領域とに対して同様の色で色付けして表示する際の色が、前記複数のフィールドのうちの前記第1のフィールドと異なる他のフィールド、および、前記複数の領域のうちの前記第1の領域と異なる他の領域、のいずれとも区別可能な色となるように、当該色付けに用いる色を制御する、
    ものであって、
    前記制御手段の制御により表示される前記切り取り画像には、前記色付けがされない、
    ことを特徴とする制御方法。
  28. 情報処理装置の制御手段が、文書画像のプレビュー表示と、複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御方法であって、
    前記情報処理装置の前記制御手段は、
    前記プレビュー表示された文書画像上における複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御するものであり
    らに、前記複数のフィールドの中からユーザにより選択された1つのフィールドと、当該選択された1つのフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された1つの領域とが、前記複数のフィールドのうちの当該選択された1つのフィールドと異なる他のフィールド、および、前記プレビュー表示された文書画像上の前記複数の領域のうちの、当該他のフィールドに入力された文字認識結果が得られた他の領域、のいずれとも区別可能となるように、当該選択された1つのフィールドと当該選択された1つの領域とに対して、当該他のフィールドおよび当該他の領域のいずれとも異なる色で、色付けして表示するとともに、当該選択された1つの領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を前記色付けがされていない状態で表示するように制御する、
    ことを特徴とする制御方法。
  29. コンピュータを、請求項1乃至20のいずれか1項に記載の情報処理装置の制御手段として機能させるためのプログラム。
  30. 文書画像のプレビュー表示と、複数のフィールドと、を含むユーザインタフェース画面を表示するように制御する制御手段として、コンピュータを機能させるためのプログラムであって、
    前記制御手段は、
    前記プレビュー表示された文書画像上における複数の領域それぞれから得られた文字認識結果を、前記複数のフィールドのうちの対応するフィールドに入力して表示するように制御するものであり
    らに、前記複数のフィールドの中からユーザにより選択された1つのフィールドと、当該選択された1つのフィールドに入力される文字認識結果を得るための領域として前記文書画像上において前記ユーザにより選択された1つの領域とが、前記複数のフィールドのうちの当該選択された1つのフィールドと異なる他のフィールド、および、前記プレビュー表示された文書画像上の前記複数の領域のうちの、当該他のフィールドに入力された文字認識結果が得られた他の領域、のいずれとも区別可能となるように、当該選択された1つのフィールドと当該選択された1つの領域とに対して、当該他のフィールドおよび当該他の領域のいずれとも異なる色で、色付けして表示するとともに、当該選択された1つの領域に関する部分を前記文書画像から切り取ることによって得られる切り取り画像を前記色付けがされていない状態で表示するように制御する、
    ことを特徴とするプログラム。
  31. 前記1つのフィールドに対する色付けは、当該1つのフィールドの少なくとも一部に色付けすることにより行われることを特徴とする請求項30に記載のプログラム。
  32. 前記複数のフィールドは、複数の設定項目それぞれに対応する値を入力するためのフィールドであることを特徴とする請求項30に記載のプログラム。
JP2023182048A 2020-01-21 2023-10-23 文書を電子化する画像処理システム、その制御方法及びプログラム Active JP7487394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024026490A JP2024063072A (ja) 2020-01-21 2024-02-26 文書を電子化する画像処理システム、その制御方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020007518 2020-01-21
JP2020007518 2020-01-21
JP2020031689A JP7401344B2 (ja) 2020-01-21 2020-02-27 文書を電子化する画像処理システム、その制御方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020031689A Division JP7401344B2 (ja) 2020-01-21 2020-02-27 文書を電子化する画像処理システム、その制御方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024026490A Division JP2024063072A (ja) 2020-01-21 2024-02-26 文書を電子化する画像処理システム、その制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2024016075A JP2024016075A (ja) 2024-02-06
JP7487394B2 true JP7487394B2 (ja) 2024-05-20

Family

ID=76857578

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023182048A Active JP7487394B2 (ja) 2020-01-21 2023-10-23 文書を電子化する画像処理システム、その制御方法及びプログラム
JP2024026490A Pending JP2024063072A (ja) 2020-01-21 2024-02-26 文書を電子化する画像処理システム、その制御方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024026490A Pending JP2024063072A (ja) 2020-01-21 2024-02-26 文書を電子化する画像処理システム、その制御方法及びプログラム

Country Status (4)

Country Link
US (2) US11228687B2 (ja)
JP (2) JP7487394B2 (ja)
KR (1) KR20210094483A (ja)
CN (1) CN113220191A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108919A (ja) 2001-10-01 2003-04-11 Matsushita Electric Ind Co Ltd 文字認識装置
JP2011022766A (ja) 2009-07-15 2011-02-03 Fuji Xerox Co Ltd 画像処理装置、画像処理システム及びプログラム
JP2013037399A (ja) 2011-08-03 2013-02-21 Bank Of Tokyo-Mitsubishi Ufj Ltd 入力支援装置、入力支援方法及びプログラム
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2017037457A (ja) 2015-08-10 2017-02-16 富士ゼロックス株式会社 部品管理システムおよびプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100382096C (zh) * 2003-08-20 2008-04-16 奥西-技术有限公司 文档扫描设备及方法
JP4942142B2 (ja) * 2005-12-06 2012-05-30 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7685529B2 (en) * 2006-03-17 2010-03-23 Microsoft Corporation Visual guides for word processing application styles
JP5677370B2 (ja) * 2012-05-31 2015-02-25 京セラドキュメントソリューションズ株式会社 操作装置及び操作方法
JP2014078168A (ja) * 2012-10-11 2014-05-01 Fuji Xerox Co Ltd 文字認識装置及びプログラム
CN108268438B (zh) * 2016-12-30 2021-10-22 腾讯科技(深圳)有限公司 一种页面内容提取方法、装置以及客户端
JP6881990B2 (ja) * 2017-01-30 2021-06-02 キヤノン株式会社 画像処理装置とその制御方法、及びプログラム
JP7059624B2 (ja) * 2017-12-26 2022-04-26 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP7077812B2 (ja) * 2018-06-19 2022-05-31 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP2020031316A (ja) * 2018-08-22 2020-02-27 シャープ株式会社 画像形成装置、画像色変更方法及び画像色変更プログラム
CN109344831B (zh) * 2018-08-22 2024-04-05 中国平安人寿保险股份有限公司 一种数据表识别方法、装置及终端设备
JP7224821B2 (ja) 2018-09-11 2023-02-20 キヤノン株式会社 デバイス診断ウェブシステムおよびデバイス診断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108919A (ja) 2001-10-01 2003-04-11 Matsushita Electric Ind Co Ltd 文字認識装置
JP2011022766A (ja) 2009-07-15 2011-02-03 Fuji Xerox Co Ltd 画像処理装置、画像処理システム及びプログラム
JP2013037399A (ja) 2011-08-03 2013-02-21 Bank Of Tokyo-Mitsubishi Ufj Ltd 入力支援装置、入力支援方法及びプログラム
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP2017037457A (ja) 2015-08-10 2017-02-16 富士ゼロックス株式会社 部品管理システムおよびプログラム

Also Published As

Publication number Publication date
US11606469B2 (en) 2023-03-14
JP2024063072A (ja) 2024-05-10
US20220103696A1 (en) 2022-03-31
CN113220191A (zh) 2021-08-06
JP2024016075A (ja) 2024-02-06
US11228687B2 (en) 2022-01-18
US20210227079A1 (en) 2021-07-22
KR20210094483A (ko) 2021-07-29

Similar Documents

Publication Publication Date Title
CN1716253B (zh) 检索数据的方法和装置
US8201072B2 (en) Image forming apparatus, electronic mail delivery server, and information processing apparatus
JP7483384B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
JP4895347B2 (ja) 文書管理システム及びその制御方法
US10180849B2 (en) Apparatus, information processing system, information processing method, and computer program product
JP7434001B2 (ja) 情報処理装置、プログラム、情報処理方法
CN107545534B (zh) 图像处理装置及其控制方法以及存储介质
CN107219966A (zh) 信息处理设备和信息处理方法
JP2016066258A (ja) 画像形成装置、及びボタンカスタマイズ方法
JP2023165818A (ja) 情報処理装置、及び情報処理プログラム
JP2017135561A (ja) 受信した画像データを扱う画像処理装置、画像処理方法、及びプログラム
JP7487394B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
JP7401344B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
US11620434B2 (en) Information processing apparatus, information processing method, and storage medium that provide a highlighting feature of highlighting a displayed character recognition area
US20210409550A1 (en) Data input support apparatus, data input support method, and storage medium
JPH11134088A (ja) データ送信装置及びその方法
US11245802B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6459470B2 (ja) 文書管理プログラム、方法及び文書管理装置
JP7494086B2 (ja) 情報処理装置、およびその制御方法とプログラム
JP7424460B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20230368555A1 (en) Information processing apparatus, information processing method, and storage medium
JP2023035045A (ja) 情報処理装置およびプログラム
JP2013058008A (ja) 画像処理装置及び画像処理方法。
JP2024079019A (ja) 画像処理装置、画像処理方法及びプログラム
JP2023022712A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231023

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231023

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240508

R150 Certificate of patent or registration of utility model

Ref document number: 7487394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150