JP5326859B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP5326859B2
JP5326859B2 JP2009150139A JP2009150139A JP5326859B2 JP 5326859 B2 JP5326859 B2 JP 5326859B2 JP 2009150139 A JP2009150139 A JP 2009150139A JP 2009150139 A JP2009150139 A JP 2009150139A JP 5326859 B2 JP5326859 B2 JP 5326859B2
Authority
JP
Japan
Prior art keywords
format
image
information
document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009150139A
Other languages
English (en)
Other versions
JP2011009959A (ja
Inventor
翼 北井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009150139A priority Critical patent/JP5326859B2/ja
Priority to US12/610,634 priority patent/US8422796B2/en
Priority to CN200910225478.3A priority patent/CN101931721B/zh
Publication of JP2011009959A publication Critical patent/JP2011009959A/ja
Application granted granted Critical
Publication of JP5326859B2 publication Critical patent/JP5326859B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Description

本発明は、画像処理装置に関する。
利用者が画像群を一覧する際、縮小した画像(以下、サムネイル画像という)から、各画像を識別するための情報を適切に得ることができるようにする技術がある。特許文献1には、サムネイル画像を生成すべき領域を指定することで、画像ファイル群から適切なサムネイル画像を生成することが開示されている。特許文献2には、データファイルのサムネイル画像の表示サイズを、データファイルのフォーマット種別毎に切り替えることが開示されている。特許文献3には、フォームにおける画像の特徴的な部分を利用者に選択させ、その領域をプレビュー画像とすることが開示されている。特許文献4には、取得した画像のサイズが大きい場合に、所定の範囲の部分領域を分割してサムネイル画像として表示する領域とすることが開示されている。
特開2002−278994号公報 特開2004−194146号公報 特開2007−148505号公報 特開2007−259060号公報
本発明は、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分からなる画像を作成することを目的とする。
上述した課題を解決するため、本発明の請求項1に係る画像処理装置は、複数種類の文書の書式を表す書式情報を記憶する書式情報記憶手段と、文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分を特定する抽出部分特定情報を前記書式毎に記憶する抽出部分特定情報記憶手段と、文書から抽出された前記構成部分を配置する位置を表す配置情報を取得する配置情報取得手段と、文書を表す画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データを解析して当該画像データが表す文書の書式を表す書式情報を求め、前記書式情報記憶手段が記憶する書式情報と比較して、当該文書の書式を特定する書式特定手段と、前記書式特定手段が特定した書式に対応する前記抽出部分特定情報を前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される前記構成部分を前記画像データから抽出する抽出手段と、前記抽出手段により抽出された構成部分を、前記配置情報取得手段が取得した配置情報が表す位置に配置した画像である代替画像を生成する代替画像生成手段と、前記代替画像生成手段により生成された代替画像を記憶手段に書き込む書込手段とを具備することを特徴とする。
また、本発明の請求項2に係る画像処理装置は、上述の態様において、前記配置情報取得手段は、複数の前記配置情報を取得し、前記代替画像生成手段は、前記配置情報取得手段により取得された複数の配置情報のそれぞれに基づいて前記構成部分を配置して、複数の前記代替画像をそれぞれ生成し、前記書込手段は、前記代替画像生成手段により生成された複数の代替画像のうち選択された代替画像を前記記憶手段に書き込むことを特徴とする。
また、本発明に請求項3に係る画像処理装置は、複数種類の文書の書式を表す書式情報を記憶する書式情報記憶手段と、文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分を特定する抽出部分特定情報を前記書式毎に記憶する抽出部分特定情報記憶手段と、文書を表す画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データを解析して当該画像データが表す文書の書式を表す書式情報を求め、前記書式情報記憶手段が記憶する書式情報と比較して、当該文書の書式を特定する書式特定手段と、前記書式特定手段が特定した書式に対応する前記抽出部分特定情報を前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される前記構成部分を前記画像データから抽出する抽出手段と、利用者の操作に応じて、前記抽出手段により抽出された構成部分を配置する位置を表す配置情報を生成する配置情報生成手段と、前記抽出手段により抽出された構成部分を、前記配置情報生成手段が生成した配置情報が表す位置に配置した画像である代替画像を生成する代替画像生成手段と、前記代替画像生成手段により生成された代替画像を記憶手段に書き込む書込手段とを具備することを特徴とする。
また、本発明の請求項4に係る画像処理装置は、上述の態様において、前記代替画像生成手段は、前記抽出手段により抽出された構成部分を予め定められた大きさになるように変形して前記代替画像を生成することを特徴とする。
また、本発明の請求項5に係る画像処理装置は、上述の態様において、前記代替画像生成手段は、前記抽出手段により抽出された構成部分に含まれる文字を認識して、当該文字の大きさが予め定められた大きさになるように当該構成部分を変形して前記代替画像を生成することを特徴とする。
また、本発明の請求項6に係る画像処理装置は、上述の態様において、前記抽出部分特定情報によって特定される構成部分を配置する位置を表す配置情報を、利用者の操作に応じて指定する配置情報指定手段を具備し、前記配置情報取得手段は、前記配置情報取指定手段により指定された配置情報を取得することを特徴とする。
また、本発明の請求項7に係る画像処理装置は、上述の態様において、前記書式特定手段が、前記画像データが表す文書の書式を特定できなかった場合に、前記書式情報記憶手段が記憶する書式情報のうち、前記文書の書式を表す書式情報との差が閾値内にある複数の書式情報を求め、当該複数の書式情報によってそれぞれ表される書式を抽出する書式抽出手段を具備し、前記書込手段は、前記書式抽出手段が抽出した複数の書式のそれぞれに応じて、前記代替画像生成手段が生成する各代替画像を提示し、当該各代替画像から利用者の操作に応じて1つの代替画像を選択して前記記憶手段に書き込むことを特徴とする。
また、本発明の請求項8に係る画像処理装置は、上述の態様において、前記書式特定手段は、前記画像データが表す文書の書式を特定できなかった場合に、前記書式情報記憶手段が記憶する書式情報のうち、前記文書の書式を表す書式情報との差が閾値内にある複数の書式情報を求め、当該複数の書式情報によってそれぞれ表される書式を抽出する書式抽出手段を具備し、前記書込手段は、前記書式抽出手段が抽出した複数の書式毎にそれぞれ記憶された抽出部分特定情報を、前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される各構成部分を表す画像を代替画像として生成して提示し、当該各代替画像から利用者の操作に応じて1つの代替画像を選択して前記記憶手段に書き込むことを特徴とする。
請求項1に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分からなる画像を作成することができる。
請求項2に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分を、複数の配置情報のそれぞれに基づいて配置して画像を作成することができる。
請求項3に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分を、指定された配置情報に基づいて配置して画像を作成することができる。
請求項4に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分を、変形して画像を作成することができる。
請求項5に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分を、その構成部分の画像に含まれる文字の大きさに応じて変形して画像を作成することができる。
請求項6に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分からなる画像を作成することができる。
請求項7に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分からなる複数の画像を作成して、利用者に選択させることができる。
請求項8に係る画像処理装置によれば、文書を構成する構成部分のうちその文書の書式に応じて抽出された構成部分からなる複数の画像を作成して、利用者に選択させることができる。
画像処理装置の全体構成を示すブロック図である。 画像処理装置のフォーム登録に関する機能的構成を示すブロック図である。 サムネイル書き込みに関する機能的構成を示すブロック図である。 フォーム登録の動作の流れを表すフロー図である。 フォーム登録画面の一例を示す図である。 対象領域指定方式選択画面の一例を示す図である。 フリー指定用のレイアウト画面の一例を示す図である。 レイアウトの編集処理を行う動作の流れを説明するためのフロー図である。 フリー指定用のレイアウト画面の一例を示す図である。 サムネイル書き込みの動作の流れを表すフロー図である。 複数のレイアウトを登録する場合のレイアウト画面の一例を示した図である。 変形例におけるサムネイル一覧表示の一例を示す図である。 変形例におけるサムネイル一覧表示の一例を示す図である。 変形例におけるレイアウト編集画面の一例を示す図である。 変形例におけるレイアウト編集画面の一例を示す図である。 サムネイル対象領域の拡大・縮小率設定画面の一例を示す図である。 変形例におけるフォームの選択画面の一例を示す図である。
1.定義
以下に用語の定義を説明する。
代替画像とは、基の画像よりも小さい画像であり、基の画像の代替となる画像をいう。以下、代替画像をサムネイルともいう。
書式とは、予め定められた文書の構成であって、文書に描かれる罫線や囲み線などにより形成される欄の配置を示すものをいう。この書式に沿った文書であって、その構成を読み取ることを目的とする雛形をフォームと呼ぶ。また、欄とはペン等の筆記用具で文字を記入する記入欄であり、囲み線で囲まれた欄をセルと呼ぶ。
サムネイル対象領域とは、文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分であり、組み合わせたり、配置したりしてサムネイルを生成するのに用いられる領域をいう。
レイアウトとは、サムネイルにおいて、サムネイル対象領域を配置する位置を表す配置情報、および、それぞれのサムネイル対象領域が示す画像の縮小率を表す情報を含む情報をいう。
フォームの書式情報とは、フォームの画像全体に対する罫線等の位置を表したデータであり、文書の書式を表す情報である。例えば、スキャナなどによってフォームの画像が読み取られる際の主走査方向をx軸とし、副走査方向をy軸とすると、最初に読み取られる位置等を基準点としてフォームの画像上の点の位置は(x,y)という2つの数値データによって表される。そして、線は2つの点により表され、矩形は4つの点によって表される。さらに線および矩形にそれぞれ線の太さを表す数値データを追加することで、罫線および囲み線がそれぞれ表される。フォームの書式情報はこれらの数値データによって構成される。なお、基準点は、最初に読み取られる位置、すなわちフォーム画像のうち、最も端にある点ではなく、最初に罫線等が読み取られる位置でもよい。
2つの書式情報の差とは、各書式情報をそれぞれ構成する数値データの差を積算したものである。これは、具体的には、各書式情報における各点の相対的な配置に基づいて、一方の書式情報に含まれる各点を他方の書式情報に含まれる各点にそれぞれ対応付け、対応付けられた点のx座標およびy座標の数値データのそれぞれの差を積算することで算出される。これにより、或るフォームに沿って記入された文書が基準となるフォームに対して拡大・縮小されていても、その拡大率や縮小率が或る閾値内に収まっていれば、その文書の書式情報と基準となるフォームの書式情報との差と予め定められた閾値とを比較することでその文書のフォームは特定され、罫線等により形成される欄が特定される。
マウスのポインタとは、マウスの移動に応じて画面上を移動する画面上の位置を示す画像である。
マウスのクリックとは、マウスのボタンを押下し、続いてボタンを離すことである。この動作により、ボタンを押下したときのポインタの位置に表示されていたアイコン等が特定される。
マウスのドラッグ・アンド・ドロップとは、ボタンを押下したままマウスを移動させて、移動先でボタンを離す動作をいう。この動作により、ボタンを押下したときのポインタの位置に表示されていたアイコン等は、ボタンを離したときのポインタの位置に関連付けられる。
2.構成
以下、本発明の実施形態である画像処理装置1の構成を説明する。
2−1.全体構成
図1は、画像処理装置1の全体構成を示すブロック図である。CPU11は、ROM12に記憶されているブートローダや記憶部14に記憶されているコンピュータプログラムを読み出して実行することにより画像処理装置1の各部を制御する。ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、記憶部14に記憶されている基本OS(Operating System)をRAM(Random Access Memory)13にロードするためのブートローダやBIOS(Basic Input/Output System)などが記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。記憶部14はハードディスクドライブやEEPROM(Electrically Erasable Programmable Read Only Memory)などの大容量の不揮発性記憶装置であり、CPU11に読み込まれるプログラムを記憶する。操作部15は各種の指示を入力するためのマウスやキーボードを備えており、利用者(以下、ユーザともいう)による操作を受け付けてその操作内容に応じた信号をCPU11に供給する。表示部16は、例えば、液晶表示面を有しており、CPU11からの指示に応じて画像を表示する。画像取得部17は、文書を表す画像データを取得する装置であり、例えば、用紙上に描かれた画像を光学的に読み取って、その画像に応じた画像データを生成するスキャナなどである。通信部18は、例えば各種のモデムや無線通信回路、シリアルインタフェースや、無線インタフェースなどであり、外部機器との間でデータの遣り取りを行う。
2−2.機能構成
2−2−1.フォーム登録に関する機能構成
図2は、画像処理装置1のフォーム登録に関する機能的構成を示すブロック図である。画像取得部17は、文書が描かれた用紙等からその文書を表す画像データを取得する画像データ取得手段171として機能する。画像データ取得手段171が取得した画像データ131は、RAM13に記憶される。CPU11は、RAM13から画像データ131を読み出して解析し、この画像データ131に示される罫線や囲み線などの位置や長さ・太さ等を算出して、書式情報132を求める書式情報算出手段111として機能する。書式情報算出手段111が算出した書式情報132は、RAM13に記憶される。操作部15は、ユーザの操作を受け付け、フォームに関する情報を取得するフォーム情報指定手段151として機能する。ここで、フォームに関する情報とは、フォーム名等のフォームを識別するためのフォーム識別情報と、記憶部14においてフォームの書式情報を記憶する場所を指定する「振り分け先」の識別情報と、これらを記憶部14に記憶させる画像処理装置1のユーザを識別するためのユーザ識別情報と、そのユーザ識別情報が示すユーザが正規のユーザであるか否かを判断するためのパスワードである。
記憶部14は、正規のユーザのユーザ識別情報とそのユーザのパスワードとが予め対応付けて記述されたパスワードテーブル145を記憶している。CPU11は、画像データ取得手段171が取得した画像データ131をフォームとして登録するフォーム登録手段112として機能する。このフォーム登録手段112は、フォーム情報指定手段151からフォームに関する情報を受け取り、記憶部14に記憶されているパスワードテーブル145を参照して、受け取った情報に含まれるユーザ識別情報が示すユーザが正規のユーザであるか否かを判断する。そして、フォーム登録手段112は、そのユーザが正規のユーザであると判断すると、フォームの登録を行う。具体的には、フォーム登録手段112は、フォーム識別情報と振り分け先の識別情報とを対応付けて、記憶部14のフォームデータベース(以下、図において「データベース」をDBと略記する)141に記憶させるとともに、そのフォームの書式情報132を、記憶部14のファイルシステム142において、その振り分け先の識別情報で示されるファイルに記憶させる。すなわち、フォームデータベース141を有する記憶部14は、複数種類の文書の書式を表す書式情報を記憶する書式情報記憶手段として機能する。
記憶部14の対象領域データベース143は、文書から抽出する構成部分、すなわちサムネイル対象領域の位置やサイズ等、そのサムネイル対象領域を特定する抽出部分特定情報をフォーム毎に記憶するデータベースである。すなわち、対象領域データベース143を有する記憶部14は、文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分を特定する抽出部分特定情報を書式毎に記憶する抽出部分特定情報記憶手段として機能する。操作部15は、ユーザの操作に応じてフォーム毎のサムネイル対象領域を特定する抽出部分特定情報を指定する対象領域指定手段152として機能する。CPU11は、対象領域指定手段152からサムネイル対象領域の抽出部分特定情報を受け取り、そのフォームの識別情報と関連付けて対象領域データベース143に記憶させる対象領域登録手段113として機能する。
記憶部14のレイアウトデータベース144は、フォーム毎に1つのレイアウトを登録するデータベースである。操作部15は、ユーザの操作に応じて、対象領域データベース143に登録されたサムネイル対象領域のレイアウトを指定するレイアウト指定手段153として機能する。すなわち、レイアウト指定手段153は、抽出部分特定情報によって特定されるサムネイル対象領域を配置する位置を表す配置情報を、利用者の操作に応じて指定する配置情報指定手段の一例である。そして、CPU11は、レイアウト指定手段153からレイアウトを受け取り、そのフォームの識別情報と関連付けてレイアウトデータベース144に記憶させるレイアウト登録手段114として機能する。
2−2−2.サムネイル書き込みに関する機能構成
図3は、画像処理装置1のサムネイル書き込みに関する機能的構成を示すブロック図である。画像データ取得手段171、画像データ131、書式情報132、書式情報算出手段111は、上述したため、ここでの説明を省略する。また、記憶部14のフォームデータベース141、対象領域データベース143、レイアウトデータベース144についても、上述したため、ここでの説明を省略する。
書式情報算出手段111は、画像データ取得手段171により取得された画像データ131を解析して当該画像データ131が表す文書の書式を表す書式情報132を算出してRAM13に記憶する。CPU11は、フォームデータベース141を介してファイルシステム142に記憶されている書式情報を参照し、RAM13に記憶された書式情報132と一致する書式情報を見つけることで、この画像データ131に対応するフォームを特定するフォーム特定手段115として機能する。つまり、書式情報算出手段111とフォーム特定手段115は、画像データ取得手段により取得された画像データを解析して当該画像データが表す文書の書式を表す書式情報を求め、書式情報記憶手段が記憶する書式情報と比較して、当該文書の書式を特定する書式特定手段の一例である。
ここで、2つの書式情報が一致するとは、2つの書式情報の差が予め定めた閾値内にあることをいう。また、CPU11は、このフォーム特定手段115が特定したフォームの識別情報と関連付けて記憶されたサムネイル対象領域の位置やサイズを対象領域データベース143から読み出し、画像データ131からサムネイル対象領域の画像を示す対象領域データ133を抽出して、RAM13に記憶する対象領域抽出手段116として機能する。すなわち、対象領域抽出手段116は、書式特定手段が特定した書式に対応する抽出部分特定情報を抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定されるサムネイル対象領域を画像データ131から抽出する抽出手段の一例である。そして、CPU11は、レイアウトデータベース144からこのフォームに対応するレイアウトを読み出す。すなわち、CPU11は、文書から抽出されたサムネイル対象領域を配置する位置を表す配置情報を取得する配置情報取得手段として機能する。そして、CPU11は、抽出された対象領域データ133が示す画像を、取得したレイアウトが表す位置に配置した画像であるサムネイルを表すサムネイルデータ134を生成し、RAM13に記憶するサムネイル生成手段117(代替画像生成手段)として機能する。
また、CPU11は、サムネイル生成手段117がRAM13に記憶したサムネイルデータ134を、その基となった画像データ131に付加してファイルシステム142に書き込む書込手段118として機能する。ここで、JPEG(Joint Photographic Experts Group)やTIFF(Tagged Image File Format)などEXIF(Exchangeable image file format)のような規格に準拠した画像フォーマットで画像データを記憶する場合には、その画像データ内にサムネイルを含ませることができるため、書込手段118は、このような画像フォーマットの特徴を利用して、画像データ131の中にサムネイルデータ134を付加したデータをファイルシステム142に書き込む。
3.動作
次に、画像処理装置1の動作を説明する。
3−1.フォーム登録の動作
図4は、画像処理装置1におけるフォーム登録の動作の流れを表すフロー図である。まず、ユーザが、画像取得部17の図示しないプラテンガラスの上に原稿として登録対象のフォームを置き、操作部15を操作してフォーム登録の指示をすると、画像データ取得手段171である画像取得部17は、CPU11の制御の下、上記のフォームをスキャンし、CPU11にスキャンした内容に応じた画像データ131を送る(ステップS101)。CPU11は、受け取った画像データ131をRAM13に記憶させ、書式情報算出手段111として、この画像データ131から書式情報132を算出してRAM13に記憶する(ステップS102)。具体的には、書式情報算出手段111は、画像データ131に対してラベリング処理を行い、画像データ131から線や矩形を抽出し、線の端点や矩形の頂点、及び、これらの太さを数値化して書式情報132を生成する。次に、CPU11は、スキャンしたこのフォームに関する情報を入力するようにユーザに促すためのフォーム登録画面を表示部16により表示させ、フォーム登録画面の処理を行う(ステップS103)。
図5は、フォーム登録画面の一例を示す図である。同図に示すように、フォーム登録画面の上部には、「登録するフォームの情報を入力してください」という文字列が表示される。そして、その左下には、スキャンしたこのフォームの画像(以下、フォーム画像という)を表示するプレビュー領域Rsが設けられている。このプレビュー領域Rsには、フォーム画像の全てを表示できない場合に、表示できる部分を上下左右に移動させるためのスクロールバーが表示される。プレビュー領域Rsの右側には、フォーム画像の表示を拡大・縮小させるためのボタンB1,B2がある。このボタンB1の内側に操作部15のマウスのポインタを移動させて、マウスをクリックすると、プレビュー領域Rsにおいてフォーム画像が拡大して表示される。ボタンB2にポインタを移してマウスをクリックすると、フォーム画像は縮小して表示される。
ボタンB1,B2の下には、フォーム名の入力を受け付けるテキストボックスT1、算出した書式情報132を記憶部14のファイルシステム142に記憶させる振り分け先の入力を受け付けるテキストボックスT2、ユーザ名の入力を受け付けるテキストボックスT3、そのユーザのパスワードの入力を受け付けるテキストボックスT4が並べられている。操作部15のキーボードによって、これらのテキストボックスT1,T2,T3,T4に文字列を入力すると、入力された文字列はそれぞれ、フォーム名、振り分け先、ユーザ名、及びパスワードとしてRAM13に記憶される。
また、これらのテキストボックスの下には、サムネイルの作成方式を全体縮小方式にするボタンB3と、領域指定方式にするボタンB4が設けられている。ボタンB3、B4のいずれかにポインタを移してマウスをクリックすると、そのボタンの周りが太い枠線で縁取りされる。同図は、ボタンB4にポインタを移した状態でマウスをクリックした画面である。そしてこのクリックにより、サムネイルの作成方式として、縁取りされた側の方式がRAM13に記憶される。
そして、画面の右下には、このフォーム登録画面における全ての入力を許可するOKボタンB5と、却下するキャンセルボタンB6が表示されている。ポインタをOKボタンB5に移してマウスをクリックすると、RAM13に記憶されたフォーム名、振り分け先、ユーザ名、パスワード、及びサムネイルの作成方式が次のステップS104で用いられる。一方、ポインタをキャンセルボタンB6に移してマウスをクリックするとCPU11は、処理を中断し、ステップS101へ処理を戻す。
フォーム登録画面で種々の設定をした後、OKボタンB5がクリックされると、CPU11は、RAM13に記憶されたユーザ名とパスワードの組み合わせを、記憶部14に予め記憶されているパスワードテーブル145の内容と照合し、その入力を行ったユーザが正規のユーザであるか否かを判断する。そして、その判断結果によりそのユーザが正規のユーザであると判断すると、CPU11は、RAM13に記憶されたフォーム名に関連付けて、ファイルシステム142における上記の振り分け先に、ステップS102で算出したフォームの書式情報132を記憶する(ステップS104)。なお、この入力において何らかのエラーが発生した場合には、CPU11は、表示部16を制御してユーザにそのエラーを告知する画面を表示させ、再度の入力を促す。
次に、CPU11は、RAM13に記憶されたサムネイルの作成方式が領域指定方式であるか否かを判断する(ステップS105)。ここで、サムネイルの作成方式が領域指定方式でないと判断した場合には(ステップS105;NO)、CPU11は、記憶部14のレイアウトデータベース144に、このフォームに対応するサムネイルの作成方式が全体縮小方式であることを記憶して(ステップS109)、処理を終了する。一方、サムネイルの作成方式が領域指定方式であると判断した場合には(ステップS105;YES)、CPU11は、サムネイル対象領域を指定する方式を選択するための対象領域指定方式選択画面を表示部16により表示させ、この対象領域指定方式選択画面の処理を行う(ステップS106)。
図6は、対象領域指定方式選択画面の一例を示す図である。同図に示すように、画面の右側には、対象領域の指定方式としてセル単位指定方式を選択するためのボタンB7と、フリー指定方式を選択するためのボタンB8とが表示されている。上述したサムネイルの作成方式と同様に、クリックされた側のボタンは太枠で縁取りされる。そして、ボタンB7がクリックされると、対象領域の指定方式としてセル単位指定方式が選択されてRAM13に記憶され、ボタンB8がクリックされると、対象領域の指定方式としてフリー指定方式が選択されてRAM13に記憶される。その後、OKボタンB5がクリックされると、CPU11は、処理をステップS107に進める。
CPU11は、ステップS107において、RAM13に記憶された対象領域の指定方式がフリー指定方式であるか否かを判断する(ステップS107)。上記の指定方式がフリー指定方式であると判断した場合には(ステップS107;YES)、CPU11は、表示部16にフリー指定用のレイアウト画面を表示し(ステップS200)、フリー指定方式ではないと判断した場合には(ステップS107;NO)、表示部16にセル単位指定用のレイアウト画面を表示して(ステップS300)それぞれの処理を行う。その後、CPU11は、各レイアウト画面で編集されたレイアウトをフォームに関係付けてレイアウトデータベース144に記憶することで、レイアウトを登録する(ステップS108)。
図7は、フリー指定用のレイアウト画面の一例を示す図である。同図に示すように、フリー指定用のレイアウト画面の左側には、プレビュー領域Rsが表示されている。ユーザが、このプレビュー領域Rs内にポインタを移動させ、マウスによりドラッグ・アンド・ドロップを行うと、CPU11は、例えばポインタにより指定された画素単位の座標でサムネイル対象領域を示す矩形を取得する。これがフリー指定方式である。なお、セル単位指定方式において、CPU11は、フォームにおいて指定されたセルを、1つのサムネイル対象領域として取得する。この場合には、ユーザが、プレビュー領域Rs内においてフォームのいずれかのセルにポインタを移動させ、マウスによりそのセルの内側をクリックすると、CPU11は、そのセルをサムネイル対象領域として取得する。
プレビュー領域Rsの右側上段には、複数のボタンB9〜B12とテキストボックスT5,T6が配置されている。レイアウト画面の右側中断には、サムネイル対象領域の詳細設定用リストLdが表示されている。レイアウト画面の右側下段には、サムネイル対象領域を配置するレイアウトボックスRLが表示されている。
サムネイルサイズ方式とは、サムネイルのサイズを設定する方式であり、固定方式と自動方式とがある。右側上段のサムネイルサイズ方式を選択するボタンは、固定方式に設定するためのボタンB9と、自動方式に設定するためのボタンB10である。図7においては、ボタンB9が選択され、サムネイルサイズ方式として固定方式が設定された状態を示している。サムネイルサイズ方式が固定方式に設定されていると、次の行に表示されているサムネイルサイズのテキストボックスT5,T6は数字の入力を受け付け、サムネイルのサイズは入力された数字に応じて設定される。図7においては、テキストボックスT5,T6ともに「50」が入力されているため、サムネイルのサイズは縦50mm、横50mmに設定され、右側下段のレイアウトボックスRLには、縦50mm、横50mmのサイズのサムネイルが表示される。一方、サムネイルサイズ方式が自動方式に設定されていると、レイアウトボックスRLに表示されているサムネイルのサイズに応じて、サムネイルのサイズが自動的に設定される。
レイアウト方式とは、サムネイルのレイアウトを設定する方式であり、ユーザ指定方式と自動指定方式とがある。レイアウト方式を選択するボタンは、ユーザ指定方式に設定するためのボタンB11と、自動指定方式に設定するためのボタンB12である。図7においては、ボタンB12が設定され、レイアウト方式として自動指定方式が設定された状態を示している。レイアウト方式が自動指定方式に設定されていると、レイアウトボックスRLの中のサムネイル対象領域は予め定めたアルゴリズムに従って自動的に配置される。ここで、この予め定めたアルゴリズムとは様々なものを用いることができる。例えば、レイアウトボックスRL内の配置には、左から右へ行を進み、右端へ突き当たると下の行へ移動する走査線に沿って優先順位が定められており、CPU11は、サムネイル対象領域を、選択された順に、この優先順位に沿ってレイアウトボックスRL内に配置するといったアルゴリズムを用いることができる。また、選択したサムネイル対象領域の縦横のサイズを組み合わせて、サムネイルがなるべく正方形に近づくように配置するといったアルゴリズムを用いてもよい。
一方、レイアウト方式がユーザ指定方式に設定されていると、サムネイル対象領域はユーザによるレイアウトボックスRLに対するレイアウト編集操作に応じて配置される。このレイアウト編集操作とは、具体的には、ユーザがマウスのボタンを押下して選択したサムネイル対象領域を、プレビュー領域RsからレイアウトボックスRLにドラッグ・アンド・ドロップして追加したり、レイアウトボックスRL内でサムネイル対象領域をドラッグ・アンド・ドロップして移動させたりする操作である。
図8は、画像処理装置1が、フリー指定用のレイアウト画面を表示させてレイアウトの編集処理を行う動作の流れを説明するためのフロー図である。図8に示すように、CPU11は、フリー指定用のレイアウト画面を表示してレイアウト編集操作を受け付ける(ステップS201)。そして、CPU11は、プレビュー領域Rsの内側でマウスによる矩形指定が行われたか否かを判断する(ステップS202)。ここで矩形指定は、ユーザがプレビュー領域Rsの内側にポインタがある状態でマウスをドラッグ・アンド・ドロップし、プレビュー領域Rsの2つの位置を指定することにより行われる。なお、この指定された2つの位置は、矩形の左上と右下の点の組、または矩形の右上と左下の点の組、のいずれかに解釈される。
プレビュー領域Rsの内側でマウスによる矩形指定が行われたと判断した場合には(ステップS202;YES)、CPU11は、その指定された矩形を新たなサムネイル対象領域として追加し(ステップS203)、処理をステップS210へ進める。そして、新たなサムネイル対象領域が追加されたことにより、詳細設定用リストLdにはそのサムネイル対象領域に対応する行が追加される。一方、プレビュー領域Rsの内側でマウスによる矩形指定が行われていないと判断した場合には(ステップS202;NO)、CPU11は、サムネイルサイズ方式が固定方式に設定されているか否かを判断する(ステップS204)。サムネイルサイズ方式が固定方式に設定されていると判断した場合には(ステップS204;YES)、CPU11は、テキストボックスT5,T6に入力されている数字を読み取り、サムネイルのサイズを読み取ったこれらの数字に応じたサイズに設定する(ステップS205)。一方、サムネイルサイズ方式が固定方式に設定されていないと判断した場合には(ステップS204;NO)、CPU11は、レイアウトボックスRLに表示されているサムネイルのサイズに応じて、サムネイルのサイズを自動的に設定する(ステップS206)。
次に、CPU11は、レイアウト方式がユーザ指定方式に設定されているか否かを判断する(ステップS207)。レイアウト方式がユーザ指定方式に設定されていると判断した場合には(ステップS207;YES)、CPU11は、ユーザによるレイアウト編集操作に応じてサムネイル対象領域を配置してサムネイルのレイアウトを設定し(ステップS208)、処理をステップS210へ進める。一方、レイアウト方式がユーザ指定方式に設定されていないと判断した場合には(ステップS207;NO)、CPU11は、サムネイル対象領域を予め定めたアルゴリズムに従って自動的に配置してサムネイルのレイアウトを設定し(ステップS209)、処理をステップS210へ進める。
そして、ステップS210において、CPU11は、OKボタンB5がクリックされたことにより操作が終了したか否かを判断し、操作が終了していないと判断した場合には(ステップS210;NO)、処理をステップS201に戻す。一方、操作が終了したと判断した場合には(ステップS210;YES)、CPU11は、レイアウトの編集処理を終了する。
図9は、サムネイルサイズ方式として自動指定方式が設定されているときにおけるフリー指定用のレイアウト画面の一例を示す図である。ここでは、レイアウト方式も自動指定方式に設定されているため、ユーザがサムネイル対象領域を追加するたびに、自動的にサムネイルのレイアウトが設定される。すなわち、レイアウトボックスRLにおいて、選択され追加されたサムネイル対象領域が予め定めたアルゴリズムに従って自動的に配置される。そして、サムネイルサイズ方式として自動指定方式が設定されているため、サムネイルのサイズはレイアウトボックスRLの中で自動的に配置されたサムネイルのサイズになる。したがって、テキストボックスT5,T6は、ユーザからの入力を受け付けず、レイアウトボックスRLの中で自動的に配置されたサムネイルのサイズである「100」「30」が表示される。
3−2.サムネイル書き込みの動作
図10は、画像処理装置1におけるサムネイル書き込みの動作の流れを表すフロー図である。ユーザが、画像取得部17の図示しないプラテンガラスの上に原稿として文書を置き、操作部15を操作してサムネイル書き込みの指示をすると、画像データ取得手段171である画像取得部17は、CPU11の制御の下、上記の文書をスキャンし、CPU11に読み取った内容に応じた画像データ131を送る(ステップS401)。CPU11は、受け取った画像データ131をRAM13に記憶させ、書式情報算出手段111として、この画像データ131から書式情報132を算出してRAM13に記憶する(ステップS402)。
次に、CPU11は、フォームデータベース141を介してファイルシステム142に記憶されている書式情報を参照し、算出した書式情報132と一致する書式情報を見つけることで、この画像データ131に対応するフォームを特定する(ステップS403)。具体的には、CPU11は、ファイルシステム142に記憶されている書式情報の各々について、算出した書式情報132との差を計算し、その差と予め定めた閾値とを比較する。そして、その差が閾値内にある場合に、CPU11は、上記の書式情報に対応してフォームデータベース141に記憶されているフォーム識別情報により、画像データ131に対応するフォームを特定する。そして、特定したフォームに関連付けられたサムネイル対象領域の位置やサイズを対象領域データベース143から読み出し、画像データ131からサムネイル対象領域の画像を示す対象領域データ133を抽出し(ステップS404)、レイアウトデータベース144から読み出したレイアウトに沿って対象領域データ133が示す画像を配置することにより、サムネイルを示すサムネイルデータを生成する(ステップS405)。サムネイルデータが生成されると、CPU11は、スキャンして得た上述の画像データ131にサムネイルデータを埋め込んで、ファイルシステム142に書き込む(ステップS406)。
以上により、画像処理装置1は、フォームと、そのフォームにおける1つまたは複数のサムネイル対象領域と、それらのサムネイル対象領域のレイアウトとを登録することができ、また、スキャンした文書のフォームを自動的に判別して、判別したフォームに応じたサムネイルを生成し、その文書の画像データに埋め込んで記憶することができる。したがって、文書をスキャンする度に、ユーザがサムネイル対象領域やレイアウトを設定する必要がなく、フォームが共通する文書において特徴的な部分を用いて組み合わせることで、その文書の特徴を、その文書の画像よりも小さい画像で簡潔に示すことができる。
4.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)上述の実施形態において、レイアウトデータベース144は、フォーム毎に1つのレイアウトを登録するデータベースであったが、フォーム毎に複数のレイアウトを登録するようにしてもよい。この場合、サムネイル対象領域を配置するレイアウトボックスRLには複数のレイアウトのそれぞれを選択するためのタブ領域Rtが設けられていてもよい。
図11は、複数のレイアウトを登録する場合のレイアウト画面の一例を示した図である。同図に示すように、右側下段のレイアウトボックスRLの直ぐ上には複数のレイアウトのそれぞれを選択するためのタブ領域Rtが設けられている。このタブ領域Rtには、「レイアウト1」「レイアウト2」等の各レイアウトを識別するためのレイアウト名が表示されており、レイアウト名をそれぞれ囲む線の角度によって、どのレイアウトが選択されているかを表示している。同図の場合、レイアウト名を囲む線が、上辺よりも下辺の長さが長い台形となっている「レイアウト2」が選択されている。そして、選択されているレイアウトの内容がレイアウトボックスRLに表示される。なお、タブ領域Rtの最も右側には「レイアウト追加」という文字列が書かれた領域があり、ここがクリックされると、レイアウトボックスRLに新しいレイアウトが追加される。このようにしてフォーム毎に複数のレイアウトが登録されている場合には、登録されたレイアウトのそれぞれに使用されるサムネイル対象領域は異なっていてもよい。例えば、或るフォームに対して、3つのサムネイル対象領域r1、r2、r3が選択されており、かつ、2つのレイアウトL1、L2が登録されているとする。この場合、レイアウトL1にはサムネイル対象領域r1、r2のみが用いられ、レイアウトL2には、サムネイル対象領域r2、r3のみが用いられるとしてもよい。
(2)また、フォーム毎に登録されている複数のレイアウトのうち、1つのレイアウトを他のレイアウトと区別するようにしてもよい。図11のレイアウトボックスRLの内、右下に表示されたボタンB14には「代表にする」という文字が描かれており、これをクリックすると、CPU11は、クリックした時点において選択されているレイアウトを代表としてレイアウトデータベース144に記憶する。これにより、代表として記憶されたレイアウトは他のレイアウトと区別される。
(3)また、このようにフォーム毎に複数のレイアウトを登録した場合には、サムネイル書き込みの段階において、文書をスキャンしてその文書に対応するフォームが特定されたとしても、そのフォームに対応するサムネイルのレイアウトは複数あるため、その文書の画像データに埋め込むサムネイルは確定しないが、複数のレイアウトのうちいずれかを仮に選択して、スキャンした文書についてサムネイルを生成し、生成したサムネイルを一覧表示させて、ユーザに仮に選択されたレイアウトで良いか否かの判断を促すようにしても良い。図12は、この変形例におけるサムネイル一覧表示の一例を示す図である。画面の左側には、フォームについて登録された複数のレイアウトが並べられて表示されるサムネイルレイアウト選択領域Rcが設けられている。サムネイルレイアウト選択領域Rcの右側には、スキャンした文書に対して、サムネイルレイアウト選択領域Rcで仮に選択されているレイアウトを適用して生成したサムネイルが一覧表示される一覧表示領域Rvが設けられている。同図において、仮に選択されているレイアウトは、3つのレイアウトのうち中央に並べられている「レイアウト2」である。そして、サムネイルレイアウト選択領域Rcにおいて選択中のレイアウトの周りには、破線で示す枠が表示される。ユーザは、この画面を見て、サムネイルレイアウト選択領域Rcに並べられているレイアウトから、「レイアウト1」をクリックして、この「レイアウト1」を選択したとする。図13は、ユーザがレイアウトを選択した場合のサムネイル一覧表示の一例を示す図である。ユーザが「レイアウト1」を選択すると、サムネイルレイアウト選択領域Rcにおいて「レイアウト1」が選択中になっていることを示すため、「レイアウト1」の周りに破線で示す枠が表示される。これに伴って、一覧表示領域Rvには、各文書に対して「レイアウト1」を適用して生成したサムネイルが一覧表示される。この状態で、ユーザが画面右上のOKボタンB5をクリックすると、書込手段118により、選択中の「レイアウト1」のサムネイルが、それぞれ画像データと関連付けられて記憶部14に書き込まれる。
(4)上述の実施形態において、フォーム毎に1つのレイアウトが登録されていたが、レイアウトは、フォーム毎に登録されていなくても良い。この場合、レイアウトデータベース144は記憶部14に設けられていなくても良い。そして、サムネイル書き込みの段階において、ユーザによるレイアウトの編集操作を受け付けて、その編集操作に応じてサムネイルを書き込めばよい。図14は、この変形例におけるレイアウト編集画面の一例を示す図である。ユーザが画像処理装置1により文書をスキャンさせ、サムネイルの一覧表示を指示する操作を行うと、CPU11は、同図に示したような画面を表示する。この画面において、左側上段には各種の操作ボタンが、左側中段には予め定められたレイアウトであるデフォルトレイアウト領域R1が、左側下段には、レイアウトを編集する領域である指定レイアウト領域R2が、中央から右側には一覧表示領域R3が設けられている。デフォルトレイアウト領域R1には、フォーム画像の全体を縮小してサムネイルのサイズにしたレイアウトが表示されており、その中にはフォーム登録の段階で登録されたサムネイル対象領域が表示されている。また、同図において、指定レイアウト領域R2には、サムネイル対象領域が配置されておらず、レイアウトが設定されていないことを示す「未指定」の文字が表示されている。一覧表示領域R3には、デフォルトレイアウト領域R1に表示された全体縮小のレイアウトを適用して生成したサムネイルが一覧表示されている。
ユーザがデフォルトレイアウト領域R1に表示されているサムネイル対象領域のいくつかを、指定レイアウト領域R2にドラッグ・アンド・ドロップすると、CPU11は、このユーザの操作に応じて、配置情報を生成し、この配置情報に従ってサムネイル対象領域を配置するため、未指定だった指定レイアウト領域R2にドラッグ・アンド・ドロップされたサムネイル対象領域が配置される。すなわち、この変形例においてCPU11は、利用者の操作に応じて、抽出手段により抽出された構成部分を配置する位置を表す配置情報を生成する配置情報生成手段として機能する。図15は、指定レイアウト領域R2にサムネイル対象領域が配置されたときのレイアウト編集画面の一例を示す図である。この操作に伴って、一覧表示領域R3には、指定レイアウト領域R2に表示されたレイアウトを適用して生成したサムネイルが一覧表示される。以上により、フォーム毎にレイアウトを登録しなくても、フォーム毎に登録されたサムネイル対象領域を、サムネイル書き込みの段階で、その都度、配置してレイアウトを決定することにより、各画像データにユーザが編集したレイアウトのサムネイルを関連付けて記憶させることができる。
(5)上述の実施形態において、レイアウトにおけるサムネイル対象領域の拡大率及び縮小率については、述べなかったが、サムネイル対象領域はレイアウトの際に拡大または縮小されてもよい。この拡大及び縮小を設定する画面を、図7に示したボタンB13をクリックすることにより表示させても良い。この場合、CPU11は、サムネイル対象領域を予め決定された拡大・縮小率で拡大・縮小し、サムネイルの生成に用いる。すなわち、CPU11は、抽出された構成部分を予め定められた大きさになるように変形して代替画像を生成する代替画像生成手段として機能する。図16は、サムネイル対象領域の拡大率及び縮小率を設定するための画面の一例を示す図である。図7の画面において、ユーザがボタンB13のいずれかをクリックすると、表示部16には、同図に示すポップアップウィンドウWが表示される。ポップアップウィンドウWにおいて、テキストボックスT7には、クリックしたボタンB13に対応するサムネイル対象領域の名称を示す文字列が表示されており、この文字列は操作部15のキーボードにより編集可能となっている。テキストボックスT7の下には、そのサムネイル対象領域のサイズが表示されている。同図において、このサイズは「7.6×0.8cm」である。このサイズの表示の下には、レイアウトにおけるサムネイル対象領域の拡大率又は縮小率を決定する方式(以下、拡縮方式という)を選択するボタンB15,B16,B17が表示されている。これらのボタン群の下には、拡縮方式に応じた詳細設定を編集するための領域R4が設けられている。ボタンB15は、拡縮方式として固定倍率方式を選択するボタンである。ボタンB15をクリックすると、領域R4には元のサムネイル対象領域のサイズに対する拡大率または縮小率を百分率で入力するテキストボックスが表示される。このテキストボックスにより例えば13%という数値が入力されると、縮小率として13%が設定され、150%という数値が入力されると、拡大率として150%が設定される。
ボタンB16は、拡縮方式として固定サイズ方式を選択するボタンである。ボタンB16をクリックすると、領域R4には拡大または縮小後のサムネイル対象領域のサイズを、縦方向及び横方向のそれぞれについてmm単位で入力するテキストボックスが表示される。このテキストボックスのそれぞれにサイズを入力することで、拡大または縮小後のサムネイル対象領域のサイズが設定される。なお、縦方向及び横方向のいずれか一方のみを入力することも可能なように構成されていてもよい。この場合、入力されていない方向の拡大・縮小率は、入力された方向と同じ拡大・縮小率に設定されるため、拡大・縮小前後のサムネイル対象領域は相似形となる。
ボタンB17は、拡縮方式として文字サイズ指定方式を選択するボタンである。ボタンB17をクリックすると、領域R4には最小の文字サイズ(以下、最小文字サイズという)を入力するテキストボックスT8が表示される。この文字サイズ指定方式において、実際の拡大・縮小率は、サムネイル書き込み段階でスキャンされた文書毎に決定される。具体的には、文書がスキャンされ、その文書に対応するサムネイル対象領域の画像データが抽出されると、CPU11はその画像データに対して文字認識処理を行う。そして、この文字認識処理により認識された文字のうち最小の文字を特定し、そのサイズが最小文字サイズに一致するようにサムネイル対象領域の拡大・縮小率を決定する。すなわち、拡縮方式として文字サイズ指定方式を選択した場合には、CPU11は、抽出手段により抽出された構成部分に含まれる文字を認識して、当該文字の大きさが予め定められた大きさになるように当該構成部分を変形して前記代替画像を生成する代替画像生成手段として機能する。
例えば、図16には、ユーザがボタンB17をクリックし、拡縮方式として文字サイズ指定方式を選択した状態が示されている。そしてこのテキストボックスT8には、12が入力されており、この数値はpt単位で表記するところの最小文字サイズとして設定される。なお、ここで「pt」とはJIS Z 8305-19621で定められた活字の基準寸法を示す単位である。すなわち、図16では、最小文字サイズとして12ptが設定されている。これにより、例えば、CPU11が或る文書の或るサムネイル対象領域についてその画像データを抽出し、その画像データから認識した文字が24ptだったとすると、12/24=0.5であるため、サムネイル対象領域の縮小率として50%が設定される。このように、文字が潰れない最小の文字サイズを最小文字サイズとして入力すれば、サムネイルにおいて文字が潰れることが防止される。
なお、領域R4の下には、「余白カット」という文字列の横にボタンB18,B19が配置されている。ボタンB18は、テキストボックスT7に示した文字列を名称とするサムネイル対象領域に対して、余白を削除する処理を行う指示を画像処理装置1へ与えるボタンである。この余白を削除する処理とは、サムネイル対象領域に対して、画素毎にその画素値と予め定めた閾値とを比較するラベリング処理を行い、そのサムネイル対象領域の中から閾値を超える画素値を有する画素群に外接する矩形を特定して、その矩形の内側のみをサムネイル対象領域として残し、他を削除する処理である。これにより、元のサムネイル対象領域において、外縁近傍にあって、かつ、予め定めた閾値を超えない画素値を有する画素は、余白として削除される。ボタンB19は、この余白を削除する処理を行わない指示を画像処理装置1へ与えるボタンである。
(6)上述の実施形態において、フォーム特定手段115として機能するCPU11は、フォームデータベース141を介してファイルシステム142に記憶されている書式情報から、スキャンした文書から算出した書式情報132と一致する書式情報を見つけることで、スキャンした文書のフォームを特定していたが、文書のフォームそのものを特定するのではなく、文書のフォームの候補を複数抽出してもよい。上述した通り、2つの書式情報が一致するとは、その差が閾値内にあるという一定の幅を持った条件であるため、複数のフォームの各書式情報が比較的近い場合には、フォーム特定手段115が文書のフォームを特定することができない場合がある。この場合には、CPU11はスキャンした文書から算出した書式情報132との差が閾値内にある複数のフォームを抽出し、それぞれのフォームに登録されているサムネイルのレイアウトを参照して、文書のサムネイルを各フォームに対応付けて表示する。そして、表示した複数のフォームのいずれかをユーザに選択させればよい。
図17は、この変形例におけるフォームの選択画面の一例を示す図である。スキャンした文書のフォームを特定できなかったときに、CPU11は、同図に示すフォームの選択画面を表示する。この選択画面には、「フォーム認識エラー」というタイトル文字とともに、「読み込まれた原稿がいずれのフォームか自動判別できませんでした。フォームを選択してください」というメッセージが表示される。このメッセージの下には原稿画像を示すプレビュー領域Rsと、文書のフォームの候補として抽出された複数のフォームを列挙し、ユーザにいずれかを選択させる類似フォーム選択領域Raが表示される。そして、CPU11は、このように文書のフォームを特定できなかった場合に、記憶部14のフォームデータベース141を参照し、スキャンした文書の書式情報132との差が閾値内にある複数の書式情報を求め、この複数の書式情報によってそれぞれ表されるフォームを抽出し、そのフォームの識別情報を表示部16に表示する。また、そのフォーム登録されたレイアウトを適用してサムネイル対象領域を配置しサムネイルを生成してフォームの識別情報に対応付けて表示部16に表示する。その結果、類似フォーム選択領域Raには、各フォームの識別情報(図においては「フォーム名」)と、各フォームに登録されたレイアウトを適用して、スキャンした文書の画像から生成したサムネイルである「サムネイル例」とが対応付けられて表示される。すなわち、CPU11は、書式特定手段が、画像データ131が表す文書の書式を特定できなかった場合に、書式情報記憶手段が記憶する書式情報のうち、その文書の書式を表す書式情報との差が閾値内にある複数の書式情報を求め、当該複数の書式情報によってそれぞれ表される書式を抽出する書式抽出手段として機能する。ユーザは類似フォーム選択領域Raに列挙された「フォーム名」又は「サムネイル例」の表示領域をクリックすることにより、いずれかのフォームを選択し、選択された表示領域は図示のように太枠で縁取りされる。このようにユーザがフォームを選択して、画面右下にあるOKボタンB5をクリックすると、選択されたフォームが文書のフォームとして確定され、そのフォームに対応するサムネイル例のサムネイルデータ134が画像データ131と関連付けられて記憶部14に記憶される。すなわち、CPU11は、書式抽出手段が抽出した複数の書式のそれぞれに応じて、代替画像生成手段が生成する各代替画像を提示し、この各代替画像から利用者の操作に応じて1つの代替画像を選択して記憶手段に書き込む書込手段として機能する。
なお、変形例4において、レイアウトはフォーム毎に登録されていないから、スキャンした文書のフォームを特定できなかったときに、CPU11は、各フォームに対応するレイアウトを適用してサムネイルを生成することはできない。この場合には、CPU11は、各フォームに登録されたサムネイル対象領域の1つを上述したサムネイル例として表示すればよい。ユーザは提示されたサムネイル例を参照して上述と同様のクリック操作を行う。そして、CPU11は、この操作に応じて1つのサムネイルを選択して記憶部14に書き込めばよい。すなわち、この場合には、CPU11は、書式抽出手段が抽出した複数の書式毎にそれぞれ記憶された抽出部分特定情報を、抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される各構成部分を表す画像を代替画像として生成して提示し、この各代替画像から利用者の操作に応じて1つの代替画像を選択して前記記憶手段に書き込む書込手段として機能する。
(7)上述の実施形態において、書込手段118は、画像フォーマットの特徴を利用して、画像データ131の中にサムネイルデータ134を付加したデータをファイルシステム142に書き込んでいたが、書込手段118は、画像データ131とサムネイルデータ134を関連付けて記憶部14に記憶してもよい。これにより、例えば、画像データ131を記憶する画像フォーマットが、サムネイルデータ134を含ませることのできないフォーマットである場合であっても、画像データ131とサムネイルデータ134とは、相互に関連付けられる。なお、書込手段118は、サムネイルデータ134を、画像データ131と関連付けて記憶しなくてもよい。要するに、書込手段118は、サムネイルデータ134を記憶部14に書き込む書込手段であればよい。
(8)上述の実施形態において、フォーム登録手段112は、パスワードテーブル145を参照して、ユーザが正規のユーザであるか否かを判断していたが、そのユーザが、RAM13に記憶された振り分け先にデータを書き込むことが許可されているユーザであるか否かを判断するようにしてもよい。この場合、ファイルシステム142は、記憶領域の識別情報毎に、その記憶領域にデータを書き込むことが許可されているユーザのユーザ識別情報を関連付けて記憶していればよく、CPU11は、ファイルシステム142のこの記憶を参照して、上述した判断をすればよい。
(9)画像処理装置1のCPU11によって実行される各プログラムは、磁気テープや磁気ディスクなどの磁気記録媒体、光ディスクなどの光記録媒体、光磁気記録媒体、半導体メモリなどの、コンピュータ装置が読み取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムを、インターネットのようなネットワーク経由でダウンロードさせることも可能である。なお、このような制御を行う制御手段としてはCPU以外にも種々の装置を適用することができ、例えば、専用のプロセッサなどを用いてもよい。
また、記憶部14、操作部15、表示部16、及び画像取得部17はそれぞれ、通信部18を介して接続する外部機器を用いてもよい。この場合に、CPU11は、各外部機器を通信部18を介して制御すればよい。
(10)上述の実施形態において、CPU11は、2つの書式情報の差を求める際に、書式情報に含まれる各点のx座標およびy座標の数値データのそれぞれの差を積算していたが、この差は絶対値に変換したものを積算することが望ましい。また、CPU11は、2つの書式情報の差を求める際に、上記の差の二乗を積算するようにしてもよい。
1…画像処理装置、11…CPU、111…書式情報算出手段、112…フォーム登録手段、113…対象領域登録手段、114…レイアウト登録手段、115…フォーム特定手段、116…対象領域抽出手段、117…サムネイル生成手段、118…書込手段、12…ROM、13…RAM、131…画像データ、132…書式情報、133…対象領域データ、134…サムネイルデータ、14…記憶部、141…フォームデータベース、142…ファイルシステム、143…対象領域データベース、144…レイアウトデータベース、145…パスワードテーブル、15…操作部、151…フォーム情報指定手段、152…対象領域指定手段、153…レイアウト指定手段、16…表示部、17…画像取得部、171…画像データ取得手段、18…通信部。

Claims (8)

  1. 複数種類の文書の書式を表す書式情報を記憶する書式情報記憶手段と、
    文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分を特定する抽出部分特定情報を前記書式毎に記憶する抽出部分特定情報記憶手段と、
    文書から抽出された前記構成部分を配置する位置を表す配置情報を取得する配置情報取得手段と、
    文書を表す画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データを解析して当該画像データが表す文書の書式を表す書式情報を求め、前記書式情報記憶手段が記憶する書式情報と比較して、当該文書の書式を特定する書式特定手段と、
    前記書式特定手段が特定した書式に対応する前記抽出部分特定情報を前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される前記構成部分を前記画像データから抽出する抽出手段と、
    前記抽出手段により抽出された構成部分を、前記配置情報取得手段が取得した配置情報が表す位置に配置した画像である代替画像を生成する代替画像生成手段と、
    前記代替画像生成手段により生成された代替画像を記憶手段に書き込む書込手段と
    を具備することを特徴とする画像処理装置。
  2. 前記配置情報取得手段は、複数の前記配置情報を取得し、
    前記代替画像生成手段は、前記配置情報取得手段により取得された複数の配置情報のそれぞれに基づいて前記構成部分を配置して、複数の前記代替画像をそれぞれ生成し、
    前記書込手段は、前記代替画像生成手段により生成された複数の代替画像のうち選択された代替画像を前記記憶手段に書き込む
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 複数種類の文書の書式を表す書式情報を記憶する書式情報記憶手段と、
    文書を構成する複数の構成部分のうち、当該文書から抽出する構成部分を特定する抽出部分特定情報を前記書式毎に記憶する抽出部分特定情報記憶手段と、
    文書を表す画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データを解析して当該画像データが表す文書の書式を表す書式情報を求め、前記書式情報記憶手段が記憶する書式情報と比較して、当該文書の書式を特定する書式特定手段と、
    前記書式特定手段が特定した書式に対応する前記抽出部分特定情報を前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される前記構成部分を前記画像データから抽出する抽出手段と、
    利用者の操作に応じて、前記抽出手段により抽出された構成部分を配置する位置を表す配置情報を生成する配置情報生成手段と、
    前記抽出手段により抽出された構成部分を、前記配置情報生成手段が生成した配置情報が表す位置に配置した画像である代替画像を生成する代替画像生成手段と、
    前記代替画像生成手段により生成された代替画像を記憶手段に書き込む書込手段と
    を具備することを特徴とする画像処理装置。
  4. 前記代替画像生成手段は、前記抽出手段により抽出された構成部分を予め定められた大きさになるように変形して前記代替画像を生成する
    ことを特徴とする請求項1から請求項3のいずれか1に記載の画像処理装置。
  5. 前記代替画像生成手段は、前記抽出手段により抽出された構成部分に含まれる文字を認識して、当該文字の大きさが予め定められた大きさになるように当該構成部分を変形して前記代替画像を生成する
    ことを特徴とする請求項1から請求項3のいずれか1に記載の画像処理装置。
  6. 前記抽出部分特定情報によって特定される構成部分を配置する位置を表す配置情報を、利用者の操作に応じて指定する配置情報指定手段を具備し、
    前記配置情報取得手段は、前記配置情報取指定手段により指定された配置情報を取得する
    ことを特徴とする請求項1に記載の画像処理装置。
  7. 前記書式特定手段が、前記画像データが表す文書の書式を特定できなかった場合に、前記書式情報記憶手段が記憶する書式情報のうち、前記文書の書式を表す書式情報との差が閾値内にある複数の書式情報を求め、当該複数の書式情報によってそれぞれ表される書式を抽出する書式抽出手段を具備し、
    前記書込手段は、前記書式抽出手段が抽出した複数の書式のそれぞれに応じて、前記代替画像生成手段が生成する各代替画像を提示し、当該各代替画像から利用者の操作に応じて1つの代替画像を選択して前記記憶手段に書き込む
    ことを特徴とする請求項1に記載の画像処理装置。
  8. 前記書式特定手段が、前記画像データが表す文書の書式を特定できなかった場合に、前記書式情報記憶手段が記憶する書式情報のうち、前記文書の書式を表す書式情報との差が閾値内にある複数の書式情報を求め、当該複数の書式情報によってそれぞれ表される書式を抽出する書式抽出手段を具備し、
    前記書込手段は、前記書式抽出手段が抽出した複数の書式毎にそれぞれ記憶された抽出部分特定情報を、前記抽出部分特定情報記憶手段から読み出して、当該抽出部分特定情報によって特定される各構成部分を表す画像を代替画像として生成して提示し、当該各代替画像から利用者の操作に応じて1つの代替画像を選択して前記記憶手段に書き込む
    ことを特徴とする請求項3に記載の画像処理装置。
JP2009150139A 2009-06-24 2009-06-24 画像処理装置 Expired - Fee Related JP5326859B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009150139A JP5326859B2 (ja) 2009-06-24 2009-06-24 画像処理装置
US12/610,634 US8422796B2 (en) 2009-06-24 2009-11-02 Image processing device
CN200910225478.3A CN101931721B (zh) 2009-06-24 2009-12-16 图像处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009150139A JP5326859B2 (ja) 2009-06-24 2009-06-24 画像処理装置

Publications (2)

Publication Number Publication Date
JP2011009959A JP2011009959A (ja) 2011-01-13
JP5326859B2 true JP5326859B2 (ja) 2013-10-30

Family

ID=43370637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009150139A Expired - Fee Related JP5326859B2 (ja) 2009-06-24 2009-06-24 画像処理装置

Country Status (3)

Country Link
US (1) US8422796B2 (ja)
JP (1) JP5326859B2 (ja)
CN (1) CN101931721B (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5477640B2 (ja) * 2010-03-12 2014-04-23 富士ゼロックス株式会社 電子文書処理装置及びプログラム
CN102200966A (zh) * 2011-06-01 2011-09-28 潍坊北大青鸟华光照排有限公司 一种版面信息提取和加工的方法
US9195999B2 (en) * 2012-10-24 2015-11-24 Mastercard International Incorporated Methods and systems for routing e-invoices
US9495586B1 (en) 2013-09-18 2016-11-15 IDChecker, Inc. Identity verification using biometric data
US8995774B1 (en) 2013-09-19 2015-03-31 IDChecker, Inc. Automated document recognition, identification, and data extraction
US11461567B2 (en) 2014-05-28 2022-10-04 Mitek Systems, Inc. Systems and methods of identification verification using hybrid near-field communication and optical authentication
US11640582B2 (en) 2014-05-28 2023-05-02 Mitek Systems, Inc. Alignment of antennas on near field communication devices for communication
US9665754B2 (en) 2014-05-28 2017-05-30 IDChecker, Inc. Identification verification using a device with embedded radio-frequency identification functionality
JP6308143B2 (ja) * 2015-02-17 2018-04-11 京セラドキュメントソリューションズ株式会社 情報処理装置、処理実行方法
JP6609955B2 (ja) * 2015-03-27 2019-11-27 日本電気株式会社 画像処理装置、画像処理方法、プログラム
US9946441B2 (en) * 2015-05-05 2018-04-17 Kai Austin Computerized system and method for creative facilitation and organization
JP6287992B2 (ja) * 2015-07-30 2018-03-07 京セラドキュメントソリューションズ株式会社 画像形成装置
IL262773B (en) 2018-11-04 2021-12-01 Au10Tix Ltd A system, method and computer program product for differentiating images comprising original scans of documents, from images of documents that are not original scans
JP7327041B2 (ja) * 2019-09-25 2023-08-16 株式会社リコー プログラム、情報処理装置、画像形成装置、印刷システム
CN113468447A (zh) * 2020-03-30 2021-10-01 阿里巴巴集团控股有限公司 文档显示处理方法、装置及电子设备
CN111563366A (zh) * 2020-04-29 2020-08-21 维沃移动通信有限公司 文档处理方法、装置及电子设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765176A (en) * 1996-09-06 1998-06-09 Xerox Corporation Performing document image management tasks using an iconic image having embedded encoded information
US20080028292A1 (en) * 1997-12-22 2008-01-31 Ricoh Company, Ltd. Techniques to facilitate reading of a document
US6453078B2 (en) * 1998-08-28 2002-09-17 Eastman Kodak Company Selecting, arranging, and printing digital images from thumbnail images
US6442555B1 (en) * 1999-10-26 2002-08-27 Hewlett-Packard Company Automatic categorization of documents using document signatures
JP2002278994A (ja) 2001-03-19 2002-09-27 Kimoto & Co Ltd ファイリングシステム、サムネイル画像生成方法および画像ファイリング方法
JP4111268B2 (ja) 2002-12-13 2008-07-02 株式会社リコー サムネイル画像の表示方法、サーバコンピュータ、クライアントコンピュータ及びプログラム
JP4779595B2 (ja) 2005-11-24 2011-09-28 富士ゼロックス株式会社 画像形成装置
JP4612571B2 (ja) * 2006-03-23 2011-01-12 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
US20080008391A1 (en) * 2006-07-10 2008-01-10 Amir Geva Method and System for Document Form Recognition
JP2008298903A (ja) * 2007-05-30 2008-12-11 Konica Minolta Business Technologies Inc 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
US9753908B2 (en) * 2007-11-05 2017-09-05 The Neat Company, Inc. Method and system for transferring data from a scanned document into a spreadsheet
JP5272394B2 (ja) * 2007-12-12 2013-08-28 富士ゼロックス株式会社 電子ペーパシステム
US20090199131A1 (en) * 2008-02-06 2009-08-06 Kagan Linda Interactive database for creation and customization of forms

Also Published As

Publication number Publication date
CN101931721B (zh) 2015-04-29
US20100329577A1 (en) 2010-12-30
JP2011009959A (ja) 2011-01-13
US8422796B2 (en) 2013-04-16
CN101931721A (zh) 2010-12-29

Similar Documents

Publication Publication Date Title
JP5326859B2 (ja) 画像処理装置
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP3734852B2 (ja) 画像編集方法及び編集システム
JP4612902B2 (ja) ファイル表示装置及びその制御方法、並びにプログラム
JP2005276161A (ja) レイアウトシステム、レイアウト装置、レイアウトプログラム、テンプレート選択プログラム、レイアウトプログラムを記憶した記憶媒体およびテンプレート選択プログラムを記憶した記憶媒体、並びにレイアウト方法
US20210227083A1 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP4730775B2 (ja) 画像処理装置
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
KR101903617B1 (ko) 복수 개의 객체 이미지를 포함한 정적인 디지털 결합 이미지의 편집 방법
JP6322086B2 (ja) 表示制御装置、表示装置、プログラム、記録媒体
JP4756650B2 (ja) 画像処理装置、読み順設定方法及びプログラム
JP3741587B2 (ja) 文書画像表示装置および方法ならびに文書画像表示プログラムを記録したコンピュータで読取可能な記録媒体
JPH09146948A (ja) 文書作成支援装置
JP7031465B2 (ja) 情報処理装置及びプログラム
JP2008176764A (ja) 画像処理システム、画像処理方法、画像処理プログラム
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
JP7459635B2 (ja) 情報処理装置及びプログラム
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP4167386B2 (ja) 地図記号認識結果の確認支援方法及び装置並びに記録媒体
JP2001273509A (ja) 文書画像編集装置及び文書画像編集方法
JP4365965B2 (ja) 情報処理装置および情報処理方法および記憶媒体
JP7458816B2 (ja) データ入力支援装置、データ入力支援方法、表示装置、及びプログラム
JP2001195432A (ja) Cadシステム
JP5402417B2 (ja) 画像処理装置
JP2005196563A (ja) 傾き補正装置、傾き補正方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130708

R150 Certificate of patent or registration of utility model

Ref document number: 5326859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees