JP2002334333A - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法Info
- Publication number
- JP2002334333A JP2002334333A JP2001136554A JP2001136554A JP2002334333A JP 2002334333 A JP2002334333 A JP 2002334333A JP 2001136554 A JP2001136554 A JP 2001136554A JP 2001136554 A JP2001136554 A JP 2001136554A JP 2002334333 A JP2002334333 A JP 2002334333A
- Authority
- JP
- Japan
- Prior art keywords
- document image
- format
- information processing
- determination
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 読み込まれた文書画像について、文書書式自
動判別にて仕分け処理を行った結果に対して、効率的な
確認処理を行うための装置を提供する。 【解決手段】 読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置であって、書式判別し
たい文書画像と、文書書式が既知の登録文書画像との類
似度に基づいて、該書式判別したい文書画像の書式を判
別する判別手段と、前記判別手段による判別の結果に対
してユーザによる確認が必要か否かを判定するための判
定情報を、前記書式判別した文書画像に対応付けて保持
する保持手段と、前記保持手段に保持された判定情報に
基づいてユーザによる確認が必要であると判定された文
書画像を提示して、仕分けの確認、修正を促すユーザイ
ンターフェース手段とを備える。
動判別にて仕分け処理を行った結果に対して、効率的な
確認処理を行うための装置を提供する。 【解決手段】 読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置であって、書式判別し
たい文書画像と、文書書式が既知の登録文書画像との類
似度に基づいて、該書式判別したい文書画像の書式を判
別する判別手段と、前記判別手段による判別の結果に対
してユーザによる確認が必要か否かを判定するための判
定情報を、前記書式判別した文書画像に対応付けて保持
する保持手段と、前記保持手段に保持された判定情報に
基づいてユーザによる確認が必要であると判定された文
書画像を提示して、仕分けの確認、修正を促すユーザイ
ンターフェース手段とを備える。
Description
【0001】
【発明の属する技術分野】本発明は、パーソナルコンピ
ュータ、ワークステーション等の情報処理装置と該情報
処理装置に接続し、使用する周辺機器から構成されるコ
ンピュータシステム及びその制御方法に関するものであ
る。
ュータ、ワークステーション等の情報処理装置と該情報
処理装置に接続し、使用する周辺機器から構成されるコ
ンピュータシステム及びその制御方法に関するものであ
る。
【0002】
【従来の技術】周辺機器やスキャナなどのOA機器を用
いたオフィス業務などでは、コンピュータによる自動処
理を行うために、ドキュメントを電子化することで、ペ
ーパーレス化を推進している。そのため高速に文書を読
みとるスキャナ装置とその読みとった電子画像を処理す
るためのシステム構築が重要となってきている。
いたオフィス業務などでは、コンピュータによる自動処
理を行うために、ドキュメントを電子化することで、ペ
ーパーレス化を推進している。そのため高速に文書を読
みとるスキャナ装置とその読みとった電子画像を処理す
るためのシステム構築が重要となってきている。
【0003】
【発明が解決しようとする課題】電子ドキュメント化す
べき文書は複数種類の書式からなっているため、従来の
電子ドキュメント化作業は、文書書式ごとに文書画像を
分類する作業に多大な時間を要していた。これに対し、
近年、かかる分類作業を短縮化するための機能として、
画像認識技術を利用した文書書式自動判別機能が注目を
浴びている。
べき文書は複数種類の書式からなっているため、従来の
電子ドキュメント化作業は、文書書式ごとに文書画像を
分類する作業に多大な時間を要していた。これに対し、
近年、かかる分類作業を短縮化するための機能として、
画像認識技術を利用した文書書式自動判別機能が注目を
浴びている。
【0004】しかし、かかる画像認識技術を利用した文
書書式自動判別機能を用いても、判別結果は必ずしも完
全ではないため、文書書式自動判別機能を用いて判別し
た結果を、ユーザが目視にて再確認する必要がある。そ
して、かかる再確認作業に時間がかかり、電子ドキュメ
ント化作業における作業時間短縮化の実効が図れないと
いう課題があった。
書書式自動判別機能を用いても、判別結果は必ずしも完
全ではないため、文書書式自動判別機能を用いて判別し
た結果を、ユーザが目視にて再確認する必要がある。そ
して、かかる再確認作業に時間がかかり、電子ドキュメ
ント化作業における作業時間短縮化の実効が図れないと
いう課題があった。
【0005】本発明は上記課題に鑑みてなされたもの
で、読み込まれた文書画像について、文書書式自動判別
にて仕分け処理を行った結果に対して、効率的な確認処
理を行うための装置を提供することを目的とする。
で、読み込まれた文書画像について、文書書式自動判別
にて仕分け処理を行った結果に対して、効率的な確認処
理を行うための装置を提供することを目的とする。
【0006】
【課題を解決するための手段】かかる課題を解決するた
め、例えば本発明の情報処理装置は以下の構成を備え
る。すなわち、読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置であって、書式判別し
たい文書画像と、文書書式が既知の登録文書画像との類
似度に基づいて、該書式判別したい文書画像の書式を判
別する判別手段と、前記判別手段による判別の結果に対
してユーザによる確認が必要か否かを判定するための判
定情報を、前記書式判別した文書画像に対応付けて保持
する保持手段と、前記保持手段に保持された判定情報に
基づいてユーザによる確認が必要であると判定された文
書画像を提示して、仕分けの確認、修正を促すユーザイ
ンターフェース手段とを備える。
め、例えば本発明の情報処理装置は以下の構成を備え
る。すなわち、読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置であって、書式判別し
たい文書画像と、文書書式が既知の登録文書画像との類
似度に基づいて、該書式判別したい文書画像の書式を判
別する判別手段と、前記判別手段による判別の結果に対
してユーザによる確認が必要か否かを判定するための判
定情報を、前記書式判別した文書画像に対応付けて保持
する保持手段と、前記保持手段に保持された判定情報に
基づいてユーザによる確認が必要であると判定された文
書画像を提示して、仕分けの確認、修正を促すユーザイ
ンターフェース手段とを備える。
【0007】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。 [第1実施形態]図1は、本実施形態の情報処理装置で
あるホストコンピュータ100と入力機器200の概略
構成及び接続を示すブロック図である。
適な実施形態を詳細に説明する。 [第1実施形態]図1は、本実施形態の情報処理装置で
あるホストコンピュータ100と入力機器200の概略
構成及び接続を示すブロック図である。
【0008】図1において、100はホストコンピュー
タで、入力機器200との間でデータを送受信してい
る。109はネットワークへ接続するネットワークイン
ターフェース部である。110、205は入出力インタ
ーフェース部で、本実施形態の入力機器200とホスト
コンピュータ100との間のデータ転送を制御してい
る。CPU104はROM105に記憶されている制御
プログラム及びデータに従って各種制御を行い、ホスト
コンピュータ全体の動作を制御する。同様に、CPU2
02はROM204に記憶されている制御プログラム及
びデータに従って各種制御を行い入力機器全体の動作を
制御する。103、203はそれぞれホストコンピュー
タ100及び入力機器200のRAM、106はキーボ
ードである。また、111、201はそれぞれホストコ
ンピュータ100及び入力機器200のメインバスであ
る。208は入力エンジン機構部206の設定値に基づ
いて画像データを読み込むスキャン部である。
タで、入力機器200との間でデータを送受信してい
る。109はネットワークへ接続するネットワークイン
ターフェース部である。110、205は入出力インタ
ーフェース部で、本実施形態の入力機器200とホスト
コンピュータ100との間のデータ転送を制御してい
る。CPU104はROM105に記憶されている制御
プログラム及びデータに従って各種制御を行い、ホスト
コンピュータ全体の動作を制御する。同様に、CPU2
02はROM204に記憶されている制御プログラム及
びデータに従って各種制御を行い入力機器全体の動作を
制御する。103、203はそれぞれホストコンピュー
タ100及び入力機器200のRAM、106はキーボ
ードである。また、111、201はそれぞれホストコ
ンピュータ100及び入力機器200のメインバスであ
る。208は入力エンジン機構部206の設定値に基づ
いて画像データを読み込むスキャン部である。
【0009】図2はホストコンピュータ100内のRA
M103にロードされている仕分けシステムソフトウェ
アの、文書書式仕分け作業時に類似度算出結果とともに
仕分け保存する処理のメインフローチャートである。
M103にロードされている仕分けシステムソフトウェ
アの、文書書式仕分け作業時に類似度算出結果とともに
仕分け保存する処理のメインフローチャートである。
【0010】ステップS201で、判別したい文書の読
み込みを行う。なお、判別したい文書の読み込みは、入
力装置200でスキャンした文書画像でも、ネットワー
クインターフェース部109を介して、ネットワーク上
にある他のコンピュータに保存されている文書画像で
も、あるいはホストコンピュータ100内に保存されて
いる文書画像でもよい。
み込みを行う。なお、判別したい文書の読み込みは、入
力装置200でスキャンした文書画像でも、ネットワー
クインターフェース部109を介して、ネットワーク上
にある他のコンピュータに保存されている文書画像で
も、あるいはホストコンピュータ100内に保存されて
いる文書画像でもよい。
【0011】ステップS202で、ホストコンピュータ
100内にあらかじめ登録された登録文書を呼び出し、
ステップS203で、判別したい文書画像と、登録文書
画像とを比較する。比較は、判別したい文書画像と登録
文書画像のそれぞれの特徴量を抽出し、特徴量の類似度
を算出することで行う。
100内にあらかじめ登録された登録文書を呼び出し、
ステップS203で、判別したい文書画像と、登録文書
画像とを比較する。比較は、判別したい文書画像と登録
文書画像のそれぞれの特徴量を抽出し、特徴量の類似度
を算出することで行う。
【0012】ステップS204では、ステップS203
で算出された類似度を、ステップS202で呼び出した
登録文書の文書名とともに、ステップS201で読み込
んだ判別したい文書画像のヘッダ情報に記載する。
で算出された類似度を、ステップS202で呼び出した
登録文書の文書名とともに、ステップS201で読み込
んだ判別したい文書画像のヘッダ情報に記載する。
【0013】ステップS205では、ホストコンピュー
タ100内に登録されたすべての登録文書に対して、ス
テップS202からステップS204までの処理を行っ
たか否かを確認し、行っていなければステップS202
に戻り、次の登録文書画像を呼び出し、同様の処理を繰
り返す。
タ100内に登録されたすべての登録文書に対して、ス
テップS202からステップS204までの処理を行っ
たか否かを確認し、行っていなければステップS202
に戻り、次の登録文書画像を呼び出し、同様の処理を繰
り返す。
【0014】一方、ステップS205で、すべての登録
文書に対して類似度の算出が完了したと判断された場合
には、ステップS206にてヘッダ情報の記載を類似度
により降順にソートする。これにより、最大類似度とそ
の登録文書の文書名がヘッダ情報の最上位に記載される
ことになる。
文書に対して類似度の算出が完了したと判断された場合
には、ステップS206にてヘッダ情報の記載を類似度
により降順にソートする。これにより、最大類似度とそ
の登録文書の文書名がヘッダ情報の最上位に記載される
ことになる。
【0015】ステップS207では、ヘッダ情報の最上
位に記載された類似度が所定値以上か否かを判断する。
本実施形態の一例としては、閾値を70%に設定し、ヘ
ッダ情報の最上位に記載された登録文書の類似度が70
%以上の場合には、当該登録文書と同一であると判別
し、かかるグループに仕分け・保存する(ステップS2
09)。
位に記載された類似度が所定値以上か否かを判断する。
本実施形態の一例としては、閾値を70%に設定し、ヘ
ッダ情報の最上位に記載された登録文書の類似度が70
%以上の場合には、当該登録文書と同一であると判別
し、かかるグループに仕分け・保存する(ステップS2
09)。
【0016】一方、ヘッダ情報の最上位に記載された登
録文書の類似度が70%未満の場合には、かかる文書画
像を区別するため、文書画像の背景色を赤色に変更する
とともに、ヘッダ情報に「X」マークを記載する(ステ
ップS208)。そして、仕分け・保存はヘッダ情報の
最上位に記載された登録文書のグループにされる(ステ
ップS209)。なお、ステップS207では、ヘッダ
情報の最上位に記載された類似度が所定値以上か否かを
判断したが、さらに、最上位に記載された類似度と上か
ら2番目に記載された類似度との差が所定値以上あるか
否かの判断を追加してもよい。これにより、類似度の差
が所定値以下の場合に、同様に文書画像の背景色を赤色
に変更するとともに、ヘッダ情報に「X」マークを記載
することで、類似度は高いが誤判別の可能性のある文書
画像を区別することができる。
録文書の類似度が70%未満の場合には、かかる文書画
像を区別するため、文書画像の背景色を赤色に変更する
とともに、ヘッダ情報に「X」マークを記載する(ステ
ップS208)。そして、仕分け・保存はヘッダ情報の
最上位に記載された登録文書のグループにされる(ステ
ップS209)。なお、ステップS207では、ヘッダ
情報の最上位に記載された類似度が所定値以上か否かを
判断したが、さらに、最上位に記載された類似度と上か
ら2番目に記載された類似度との差が所定値以上あるか
否かの判断を追加してもよい。これにより、類似度の差
が所定値以下の場合に、同様に文書画像の背景色を赤色
に変更するとともに、ヘッダ情報に「X」マークを記載
することで、類似度は高いが誤判別の可能性のある文書
画像を区別することができる。
【0017】図3は、図2のフローチャートに基づいて
仕分け処理を行った文書画像について、ユーザによる確
認作業を示したフローチャートである。
仕分け処理を行った文書画像について、ユーザによる確
認作業を示したフローチャートである。
【0018】ステップS301では、仕分け処理を行っ
た文書画像をロードし、ステップS302ではロードさ
れた文書画像のヘッダ情報にXマークがついているか否
かを確認し、Xマークがついていなければすでに仕分け
された判別結果に仕分けされる(ステップS310)。
一方、Xマークがついている場合には、ホストコンピュ
ータ100に、文書画像、ヘッダ情報、最大類似度に該
当する登録文書画像を表示する(ステップS303)。
なお、図4は、表示の一例である。
た文書画像をロードし、ステップS302ではロードさ
れた文書画像のヘッダ情報にXマークがついているか否
かを確認し、Xマークがついていなければすでに仕分け
された判別結果に仕分けされる(ステップS310)。
一方、Xマークがついている場合には、ホストコンピュ
ータ100に、文書画像、ヘッダ情報、最大類似度に該
当する登録文書画像を表示する(ステップS303)。
なお、図4は、表示の一例である。
【0019】ステップS304では、表示された文書画
像と、最大類似度に該当する登録文書画像とをユーザが
目視で比較する。両者が同一の場合には、判別結果が正
しい旨の確認結果の入力を行い、この入力を受けて当該
文書画像は判別結果に基づいて仕分けされる。(ステッ
プS305、ステップS310)。
像と、最大類似度に該当する登録文書画像とをユーザが
目視で比較する。両者が同一の場合には、判別結果が正
しい旨の確認結果の入力を行い、この入力を受けて当該
文書画像は判別結果に基づいて仕分けされる。(ステッ
プS305、ステップS310)。
【0020】また、両者が異なる場合には(判別結果が
正しくない旨の確認結果の入力があった場合には)、ス
テップS303において表示されたヘッダ情報のうち、
上から2番目に記載されている登録文書名に該当する登
録文書画像を自動的に呼び出し表示するとともに、判別
結果を類似度が2番目の登録文書に変更する(ステップ
S305、ステップS306)。
正しくない旨の確認結果の入力があった場合には)、ス
テップS303において表示されたヘッダ情報のうち、
上から2番目に記載されている登録文書名に該当する登
録文書画像を自動的に呼び出し表示するとともに、判別
結果を類似度が2番目の登録文書に変更する(ステップ
S305、ステップS306)。
【0021】ステップS307では、ステップS306
にて呼び出された登録文書画像と、判別したい文書画像
について、ユーザが目視で確認し、同一の場合には、変
更した判別結果が正しい旨の確認結果の入力を行い、こ
の入力を受けて、当該文書画像は変更後の判別結果に基
づいて仕分けされる(ステップS308、ステップS3
10)。
にて呼び出された登録文書画像と、判別したい文書画像
について、ユーザが目視で確認し、同一の場合には、変
更した判別結果が正しい旨の確認結果の入力を行い、こ
の入力を受けて、当該文書画像は変更後の判別結果に基
づいて仕分けされる(ステップS308、ステップS3
10)。
【0022】一方、ステップS307で、ユーザが目視
で確認した結果、同一でない場合には、変更した判別結
果が正しくない旨の確認結果の入力を行い、この入力を
受けて、当該文書画像は該当なしに仕分けされる(ステ
ップS308、ステップS309)。
で確認した結果、同一でない場合には、変更した判別結
果が正しくない旨の確認結果の入力を行い、この入力を
受けて、当該文書画像は該当なしに仕分けされる(ステ
ップS308、ステップS309)。
【0023】以上のような確認装置を用いて確認作業を
することにより、文書ファイル仕分け処理における類似
度の低い文書画像に対して、最適な再仕分けを効率的に
行うことが可能となる。
することにより、文書ファイル仕分け処理における類似
度の低い文書画像に対して、最適な再仕分けを効率的に
行うことが可能となる。
【0024】なお、上記実施形態においては、仕分け処
理を行った全ての文書画像のうち、類似度が所定値以下
のものについてのみ所定数ずつ表示を行い仕分け処理の
正否を確認したが、類似度が所定値以下のものに限ら
ず、全ての文書画像を所定数ずつ表示し仕分け処理の正
否を確認してもよい。すなわち、図5に示すように、ス
テップS301で仕分け処理を行った文書画像を、ステ
ップS303において所定数ずつヘッダ情報および最大
類似度に該当する登録文書画像とともに表示する。この
とき、類似度が所定値以下のものは背景色が赤色になっ
ているため、複数表示のうちユーザが注意して確認すべ
き文書画像がどれであるかが容易に判断でき、全ての文
書画像を目視確認する作業を効率化することができる
(ステップS502)。なお、図6はすべての文書画像
を所定数(2つ)ずつ表示した一例である。
理を行った全ての文書画像のうち、類似度が所定値以下
のものについてのみ所定数ずつ表示を行い仕分け処理の
正否を確認したが、類似度が所定値以下のものに限ら
ず、全ての文書画像を所定数ずつ表示し仕分け処理の正
否を確認してもよい。すなわち、図5に示すように、ス
テップS301で仕分け処理を行った文書画像を、ステ
ップS303において所定数ずつヘッダ情報および最大
類似度に該当する登録文書画像とともに表示する。この
とき、類似度が所定値以下のものは背景色が赤色になっ
ているため、複数表示のうちユーザが注意して確認すべ
き文書画像がどれであるかが容易に判断でき、全ての文
書画像を目視確認する作業を効率化することができる
(ステップS502)。なお、図6はすべての文書画像
を所定数(2つ)ずつ表示した一例である。
【0025】また、上記実施形態においては、類似度が
最大のものと、2番目に大きいものについてのみユーザ
が目視確認することとしたが、類似度が3番目以降のも
のについて目視確認してもよい。その場合、表示された
ヘッダ情報上の類似度一覧のうち、所定の登録文書名を
選択することで該当する登録文書画像が自動的に表示さ
れるようにすることで、効率的な確認作業が実現でき
る。
最大のものと、2番目に大きいものについてのみユーザ
が目視確認することとしたが、類似度が3番目以降のも
のについて目視確認してもよい。その場合、表示された
ヘッダ情報上の類似度一覧のうち、所定の登録文書名を
選択することで該当する登録文書画像が自動的に表示さ
れるようにすることで、効率的な確認作業が実現でき
る。
【0026】
【他の実施形態】なお、本発明は、複数の機器(例えば
ホストコンピュータ、インタフェイス機器、リーダ、プ
リンタなど)から構成されるシステムに適用しても、一
つの機器からなる装置(例えば、複写機、ファクシミリ
装置など)に適用してもよい。
ホストコンピュータ、インタフェイス機器、リーダ、プ
リンタなど)から構成されるシステムに適用しても、一
つの機器からなる装置(例えば、複写機、ファクシミリ
装置など)に適用してもよい。
【0027】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0028】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0029】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した(図2および/または図
3に示す)フローチャートに対応するプログラムコード
が格納されることになる。
の記憶媒体には、先に説明した(図2および/または図
3に示す)フローチャートに対応するプログラムコード
が格納されることになる。
【0030】
【発明の効果】読み込まれた文書画像について、文書書
式自動判別にて仕分け処理を行った結果に対して、効率
的な確認処理を行うことが可能となる。
式自動判別にて仕分け処理を行った結果に対して、効率
的な確認処理を行うことが可能となる。
【図1】本発明にかかる第1実施形態のシステムの概略
構成を示すブロック図である。
構成を示すブロック図である。
【図2】本発明にかかる第1実施形態の情報処理装置の
類似度算出結果とともに仕分け保存する処理を示すフロ
ーチャートである。
類似度算出結果とともに仕分け保存する処理を示すフロ
ーチャートである。
【図3】本発明にかかる第1実施形態のユーザによる仕
分け確認時の再仕分け処理を示すフローチャートであ
る。
分け確認時の再仕分け処理を示すフローチャートであ
る。
【図4】本発明にかかる第1実施形態の表示の一例を示
す図である。
す図である。
【図5】本発明にかかる第1実施形態のユーザによる仕
分け確認時の再仕分け処理を示すフローチャートであ
る。
分け確認時の再仕分け処理を示すフローチャートであ
る。
【図6】本発明にかかる第1実施形態の表示の一例を示
す図である。 100 ホストコンピュータ 106 キーボード 105 ROM(プログラムROM、データROM) 110 入出力インターフェース部 111 メインバス 200 入力機器 201 メインバス 204 ROM(プログラムROM、データROM) 205 入出力インターフェース部 206 入力エンジン機構部
す図である。 100 ホストコンピュータ 106 キーボード 105 ROM(プログラムROM、データROM) 110 入出力インターフェース部 111 メインバス 200 入力機器 201 メインバス 204 ROM(プログラムROM、データROM) 205 入出力インターフェース部 206 入力エンジン機構部
Claims (16)
- 【請求項1】 読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置であって、 書式判別したい文書画像と、文書書式が既知の登録文書
画像との類似度に基づいて、該書式判別したい文書画像
の書式を判別する判別手段と、 前記判別手段による判別の結果に対してユーザによる確
認が必要か否かを判定するための判定情報を、前記書式
判別した文書画像に対応付けて保持する保持手段と、 前記保持手段に保持された判定情報に基づいてユーザに
よる確認が必要であると判定された文書画像を提示し
て、仕分けの確認、修正を促すユーザインターフェース
手段とを備えることを特徴とする情報処理装置。 - 【請求項2】 前記保持手段は、前記判別手段によって
得られた最大類似度が所定値以下であった場合に、ユー
ザによる確認が必要な旨を示す判定情報を当該文書画像
のヘッダ情報として保持することを特徴とする請求項1
に記載の情報処理装置。 - 【請求項3】 前記保持手段は、前記判別手段によって
得られた第1位の類似度と第2位の類似度との差が所定
値以下であった場合に、ユーザによる確認が必要な旨を
示す判定情報を当該文書画像のヘッダ情報として保持す
ることを特徴とする請求項2に記載の情報処理装置。 - 【請求項4】 前記ユーザインターフェース手段は、ユ
ーザによる確認が必要であることを示すヘッダ情報を有
する文書画像と、前記判別手段による第1位の類似度の
登録文書画像とを選択的に提示することを特徴とする請
求項1に記載の情報処理装置。 - 【請求項5】 前記判別手段によって得られた最大類似
度が所定値以下であった場合に、前記文書画像の背景色
を所定の色に変更する変更手段を更に備えることを特徴
とする請求項1に記載の情報処理装置。 - 【請求項6】 前記変更手段は、前記判別手段によって
得られた第1位の類似度と第2位の類似度との差が所定
値以下であった場合に、前記文書画像の背景色を所定の
色に変更することを特徴とする請求項5に記載の情報処
理装置。 - 【請求項7】 前記ユーザインターフェース手段は、前
記判別手段による判別結果が不当であると入力された場
合、前記判別手段による第2位の判別結果を提示するこ
とを特徴とする請求項1に記載の情報処理装置。 - 【請求項8】 読み込まれた文書画像の書式判別をし、
文書書式ごとに仕分けをする装置における情報処理方法
であって、 書式判別したい文書画像と、文書書式が既知の登録文書
画像との類似度に基づいて、該書式判別したい文書画像
の書式を判別する判別工程と、 前記判別工程による判別の結果に対してユーザによる確
認が必要か否かを判定するための判定情報を、前記書式
判別した文書画像に対応付けて保持する保持工程と、 前記保持工程によって保持された判定情報に基づいてユ
ーザによる確認が必要であると判定された文書画像を提
示して、仕分けの確認、修正を促すユーザインターフェ
ース処理工程とを備えることを特徴とする情報処理方
法。 - 【請求項9】 前記保持工程は、前記判別工程によって
得られた最大類似度が所定値以下であった場合に、ユー
ザによる確認が必要な旨を示す判定情報を当該文書画像
のヘッダ情報として保持することを特徴とする請求項8
に記載の情報処理方法。 - 【請求項10】 前記保持工程は、前記判別工程によっ
て得られた第1位の類似度と第2位の類似度との差が所
定値以下であった場合に、ユーザによる確認が必要な旨
を示す判定情報を当該文書画像のヘッダ情報として保持
することを特徴とする請求項9に記載の情報処理方法。 - 【請求項11】 前記ユーザインターフェース処理工程
は、ユーザによる確認が必要であることを示すヘッダ情
報を有する文書画像と、前記判別工程による第1位の類
似度の登録文書画像とを選択的に提示することを特徴と
する請求項8に記載の情報処理方法。 - 【請求項12】 前記判別工程によって得られた最大類
似度が所定値以下であった場合に、前記文書画像の背景
色を所定の色に変更する変更工程を更に備えることを特
徴とする請求項8に記載の情報処理方法。 - 【請求項13】 前記変更工程は、前記判別工程によっ
て得られた第1位の類似度と第2位の類似度との差が所
定値以下であった場合に、前記文書画像の背景色を所定
の色に変更することを特徴とする請求項12に記載の情
報処理方法。 - 【請求項14】 前記ユーザインターフェース処理工程
は、前記判別工程による判別結果が不当であると入力さ
れた場合、前記判別工程による第2位の判別結果を提示
することを特徴とする請求項8に記載の情報処理方法。 - 【請求項15】 請求項8乃至14のいずれか1つに記
載の情報処理方法をコンピュータによって実現させるた
めの制御プログラムを格納した記憶媒体。 - 【請求項16】 請求項8乃至14のいずれか1つに記
載の情報処理方法をコンピュータによって実現させるた
めの制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136554A JP2002334333A (ja) | 2001-05-07 | 2001-05-07 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136554A JP2002334333A (ja) | 2001-05-07 | 2001-05-07 | 情報処理装置および情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002334333A true JP2002334333A (ja) | 2002-11-22 |
Family
ID=18983811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001136554A Withdrawn JP2002334333A (ja) | 2001-05-07 | 2001-05-07 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002334333A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4231171A1 (en) | 2022-02-22 | 2023-08-23 | Fujifilm Business Innovation Corp. | Information processing apparatus and method and program |
-
2001
- 2001-05-07 JP JP2001136554A patent/JP2002334333A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4231171A1 (en) | 2022-02-22 | 2023-08-23 | Fujifilm Business Innovation Corp. | Information processing apparatus and method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8131081B2 (en) | Image processing apparatus, and computer program product | |
US8619278B2 (en) | Printed matter examination apparatus, printed matter examination method, and printed matter examination system | |
US8391607B2 (en) | Image processor and computer readable medium | |
US7317835B2 (en) | Image processing method and apparatus | |
JP2017090974A (ja) | 画像処理装置及びプログラム | |
CN108881665B (zh) | 信息处理设备和信息处理方法 | |
US20070057152A1 (en) | Image forming apparatus, image processing apparatus, image output apparatus, portable terminal, image processing system, image forming method, image processing method, image output method, image forming program, image processing program, and image output program | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP2002334333A (ja) | 情報処理装置および情報処理方法 | |
US20210297551A1 (en) | Image forming apparatus, information processing method, and non-transitory recording medium | |
US11657632B2 (en) | Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data | |
US8031352B2 (en) | Apparatus and method for processing received data | |
US20100134849A1 (en) | Image processing apparatus, image processing method and computer readable medium | |
JP2015177265A (ja) | 画像処理装置、画像処理システム、情報記憶方法およびプログラム | |
JPH07146875A (ja) | 情報検索装置 | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7497620B2 (ja) | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム | |
JP2008181383A (ja) | 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム | |
JP2007323415A (ja) | 情報検索装置、情報検索システム、情報検索装置の制御方法、及び制御プログラムを提供する媒体 | |
JPS5949671A (ja) | 光学的文字読取装置 | |
JP2002334087A (ja) | 情報処理システムおよび情報処理装置ならびにそれらの方法 | |
JP3354676B2 (ja) | 電子ファイル装置 | |
JP3412998B2 (ja) | 画像処理装置及びその方法 | |
JPH11224307A (ja) | 文書認識装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080805 |