JP2004013813A - 情報管理システムおよび情報管理方法 - Google Patents
情報管理システムおよび情報管理方法 Download PDFInfo
- Publication number
- JP2004013813A JP2004013813A JP2002170210A JP2002170210A JP2004013813A JP 2004013813 A JP2004013813 A JP 2004013813A JP 2002170210 A JP2002170210 A JP 2002170210A JP 2002170210 A JP2002170210 A JP 2002170210A JP 2004013813 A JP2004013813 A JP 2004013813A
- Authority
- JP
- Japan
- Prior art keywords
- information
- management
- image
- image information
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】文字認識処理(OCR処理)の認識率が完全でないことに起因する作業効率の低下という問題に関する。
【解決手段】管理コンピュータ100は、会社データベース400に登録されているのは項目「会社名、部署名、住所」の部分の各イメージデータと、スキャンされた名刺のイメージデータ(カレントイメージデータ)との照合処理を行う。合致と判断すると、項目「会社名、部署名、住所」以外の部分において、名刺データベース300に登録されている各イメージデータとカレントイメージデータとの照合処理を行う。合致と判断すると、名刺データベース300から合致したイメージデータに関連するテキストデータを抽出して、ユーザに提示する。上記照合処理において合致しない場合、OCR処理により登録処理を実行する。
【選択図】 図7
【解決手段】管理コンピュータ100は、会社データベース400に登録されているのは項目「会社名、部署名、住所」の部分の各イメージデータと、スキャンされた名刺のイメージデータ(カレントイメージデータ)との照合処理を行う。合致と判断すると、項目「会社名、部署名、住所」以外の部分において、名刺データベース300に登録されている各イメージデータとカレントイメージデータとの照合処理を行う。合致と判断すると、名刺データベース300から合致したイメージデータに関連するテキストデータを抽出して、ユーザに提示する。上記照合処理において合致しない場合、OCR処理により登録処理を実行する。
【選択図】 図7
Description
【0001】
【発明の属する技術分野】
名刺や帳票、運転免許証、会員カード等に記録された情報を管理するシステムに関するものであり、特に、イメージデータの照合処理により管理の効率化、情報の信頼性の確保を図るものである。
【0002】
【従来の技術および発明が解決しようとする課題】
従来の名刺データを登録管理する方法として、手作業により各名刺に記録されている情報をコンピュータに入力して、管理データベースに大量の名刺データを蓄積する方法がある。また、別の登録管理方法として、画像入力装置(スキャナ)にて読み込まれた名刺のイメージデータに、文字認識処理(OCR処理)(OCR:Optical Character Reader)を施して文字コードからなるテキストデータに変換し、管理データベースに名刺データを蓄積する方法がある。
【0003】
しかしながら、前者の登録管理方法では、手作業により情報を入力するため、入力ミスが生じ、管理データベースに蓄積されるデータの信頼性は低い。また、同一の名刺が複数存在する場合に、入力作業が重複してしまい作業効率の低下を招く。また、後者の登録管理方法では、OCR処理により得られるテキストデーの信頼性が低く、登録者はそのデータの正当性を確認する必要があり、これも作業効率の低下という問題が生じる。なお、この問題は、OCR処理では、認識対象となる文字パターンをあらかじめ記憶しておき、入力されたイメージデータと文字パターンを比較して、最も近似する文字パターンを選択することによりテキストデータに変換おり(パターン・マッチング法)、その認識率が完全でないことに起因するものである。
【0004】
この発明は、OCR処理の認識率が完全でないことに起因する作業効率の低下の問題を解決し、信頼性の高い名刺等に記録された情報を利用者に提供することができる情報管理システムおよび情報管理方法を提供することを目的とする。
【0005】
【課題を解決するための手段および発明の効果】
(1)(2)(3)(18) この発明の情報管理システム等は、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するためのシステムであって、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段とを備えたことを特徴としている。
【0006】
したがって、処理対象イメージ情報と管理イメージ情報との類似度によれば、テキスト変換処理を実行せずに、処理対象イメージ情報に類似する管理イメージ情報に関連付けられたイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として得ることができる。つまり、信頼性の低いテキスト変換処理により得られたテキスト情報ではなく、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を利用することにより、テキスト変換処理が完全でないことに起因する作業効率の低下の問題を解決することができる。
【0007】
(4) この発明の情報管理システム等にて、前記情報抽出手段は、前記管理テーブルから抽出した前記イメージ対応テキスト情報をユーザに対して提示することを特徴としている。これにより、ユーザは、処理対象イメージ情報についてのテキスト情報として、提示されたイメージ対応テキスト情報を得ることができる。
【0008】
(5) この発明の情報管理システムにて、前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在する場合に、当該管理イメージ情報に関連付けられた前記イメージ対応テキスト情報をユーザに対して提示し、前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示することを特徴としている。
【0009】
これにより、処理対象イメージ情報に類似する管理イメージ情報が管理テーブルに存在する場合、つまり、処理対象イメージ情報についてのテキスト情報として適当なものが存在する場合、あらかじめ記憶する所定のイメージ対応テキスト情報を得ることができる。また、処理対象イメージ情報に類似する管理イメージ情報が管理テーブルに存在しない場合、つまり、処理対象イメージ情報についてのテキスト情報として適当なものが存在しない場合、処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を得ることができる。
【0010】
(6) この発明の情報管理システム等にて、前記処理対象イメージ情報は、複数の項目についての複数の項目処理対象イメージ情報を含み、前記管理テーブルは、複数の項目についての複数の項目管理イメージ情報を前記管理イメージ情報として記憶し、複数の項目管理イメージ情報に対するテキスト変換処理に基づいて得られた複数の項目イメージ対応テキスト情報を前記イメージ対応テキスト情報として記憶し、前記情報抽出手段は、項目処理対象イメージ情報に類似する項目管理イメージ情報が前記管理テーブルに存在する場合に、当該項目管理イメージ情報に関連付けられた項目イメージ対応テキスト情報をユーザに対して提示することを特徴としている。
【0011】
これにより、項目処理対象イメージ情報に類似する項目管理イメージ情報が管理テーブルに存在する場合、つまり、項目処理対象イメージ情報についてのテキスト情報として適当なものが存在する場合、あらかじめ記憶する所定の項目イメージ対応テキスト情報を得ることができる。
【0012】
(7) この発明の情報管理システム等にて、前記情報抽出手段は、前記項目処理対象イメージ情報に類似する前記項目管理イメージ情報が前記管理テーブルに存在しない場合に、当該項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示して、必要な確認または修正を促すことを特徴としている。これにより、項目処理対象イメージ情報に類似する項目管理イメージ情報が管理テーブルに存在しない場合、つまり、項目処理対象イメージ情報についてのテキスト情報として適当なものが存在しない場合、項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を得ることができる。
【0013】
(8) この発明の情報管理システム等にて、前記情報抽出手段は、前記イメージ対応テキスト情報および前記処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を、いずれの情報であるかを識別可能なようにユーザに提示することを特徴としている。これにより、ユーザは、提示された情報が、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報か、確認または修正が必要なテキスト変換処理により得られたテキスト情報か、を一見して見分けることができる。
【0014】
(9) この発明の情報管理システム等にて、前記情報抽出手段は、前記管理対象物における前記項目管理イメージ情報の記録位置情報を用いて特定される前記項目処理対象イメージ情報と、当該項目管理イメージ情報との比較処理により、その類似度を判断することを特徴としている。これにより、同一の名刺は、同一の項目ならば各項目管理イメージ情報が同じ位置に記録されていることに鑑みて、記録位置情報に基づき各項目管理イメージ情報の記録位置を判断し、各項目ごとにイメージ情報の比較を行うことができる。
【0015】
(10) この発明の情報管理システム等にて、前記情報抽出手段は、前記項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報から項目を判断し、同種の項目における前記項目処理対象イメージ情報と前記項目管理イメージ情報との比較処理により、その類似度を判断することを特徴としている。これにより、同一の名刺について、同一の項目の各項目イメージ情報が同じ位置に記録されていない場合でも、イメージ情報の比較を行うことができる。
【0016】
(11)(12) この発明の情報管理システム等にて、複数の前記管理イメージ情報についての前記項目管理イメージ情報から、所定の項目について同一の前記項目管理イメージ情報を統合した統合管理イメージ情報を、統合テーブルに記憶する情報統合手段を備え、前記情報統合手段は、複数の前記イメージ対応テキスト情報についての前記項目イメージ対応テキスト情報から、所定の項目について同一の前記項目イメージ対応テキスト情報を統合した統合イメージ対応テキスト情報を、前記統合テーブルに記憶することを特徴としている。
【0017】
これにより、統合管理イメージ情報を利用して、類似度の判断処理の効率化を図ることができる。また、統合イメージ対応テキスト情報をユーザに提示することも可能となる。また、好適な統合管理イメージ情報を生成すれば、管理対象物の種類、特性、用途等に応じた情報管理処理を実行することができる。
【0018】
(13) この発明の情報管理システム等にて、前記情報抽出手段は、所定の項目において前記項目処理対象イメージ情報に類似する前記統合管理イメージ情報が前記統合テーブルに存在する場合に、当該統合管理イメージ情報に関連する前記項目管理イメージ情報と前記項目処理対象イメージ情報との類似度を判断することを特徴としている。これにより、所定の項目において項目処理対象イメージ情報に類似する統合管理イメージ情報が存在しなければ、項目管理イメージ情報との類似度の判断処理を省略することができ、一連の処理の効率化を図ることができる。
【0019】
(14) この発明の情報管理システム等にて、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、前記処理対象イメージ情報、および当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された当該処理対象イメージ情報に関するテキスト情報の少なくとも一部を、前記管理テーブルに記憶することを特徴としている。
【0020】
これにより、処理対象イメージ情報等を管理テーブルに記憶することで、以後、当該処理対象イメージ情報が新たに入力された場合に、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報等を抽出して、ユーザに提示することが可能となる。また、1人の利用者が、処理対象イメージ情報等を管理テーブルに記憶させれば、以後、他の利用者は、このシステムにおいて、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報等を利用することができる。
【0021】
(15)(16) この発明の情報管理システム等は、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するための情報管理装置と、前記情報管理装置と通信可能な1または複数の端末装置とを備えたシステムであって、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、前記端末装置から送信されて新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段と、当該抽出したイメージ対応テキスト情報を前記端末装置に送信する情報送信手段とを備えたことを特徴としている。
【0022】
これにより、端末装置から処理対象イメージ情報を情報管理装置に送信することにより、端末装置の利用者は、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として得ることができる。
【0023】
(17) この発明の情報管理システム等にて、前記端末装置は、前記イメージ対応テキスト情報または前記管理イメージ情報の変更情報を前記情報管理装置に送信し、前記情報管理装置は、当該変更情報に基づいて、前記情報記憶手段に記憶されている前記イメージ対応テキスト情報または前記管理イメージ情報を変更することを特徴としている。これにより、1人の利用者が、管理イメージ情報等を変更させれば、以後、他の利用者は、このシステムにおいて、最新の管理イメージ情報等を利用することができる。例えば、名刺に記録された情報が一部変更された場合に(例えば、部署の異動、電話番号の変更など)、他の利用者は、早期に最新の情報を知ることができる。また、端末装置の利用者自身の管理対象物に関する管理イメージ情報等を情報管理装置が管理している場合には、各利用者は、自分自身の管理イメージ情報等に変更が生じた場合に、情報管理装置が記憶管理するその管理イメージ情報等を更新することにより、他の複数の利用者に対して個別に通知しなくても、他の利用者は、早期に更新された管理イメージ情報等をを利用することができる。
【0024】
(19) この発明の情報管理方法は、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報と、管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報を統合した統合管理イメージ情報とを記憶するコンピュータを用いて、新たに与えられた処理対象イメージ情報と統合管理イメージ情報とを照合する第一照合処理と、前記第一照合処理において合致した場合には、管理イメージ情報のうち前記統合管理イメージ情報以外の情報を少なくとも含む情報と処理対象イメージ情報とを照合する第二照合処理と、前記第二照合処理において合致した場合には、イメージ対応テキスト情報を抽出する処理とを実行することを特徴としている。
【0025】
これにより、信頼性の低いテキスト処理により得られたテキスト情報ではなく、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として利用することができる。また、第一照合処理において合致しなければ、第二照合処理を省略することができ、一連の処理の効率化を図ることができる。
【0026】
(20) この発明の情報管理データは、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報を記憶するためのイメージ情報記憶領域と、前記管理イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された前記管理対象物に関するテキスト情報の少なくとも一部であるイメージ対応テキスト情報であって、前記管理イメージ情報に関連付けられたイメージ対応テキスト情報を記憶するためのテキスト情報記憶領域とを備えたことを特徴としている。これは、処理対象イメージ情報と管理イメージ情報との類似度に基づいてイメージ対応テキスト情報を抽出するシステム、方法において用いるデータとして有用である。
【0027】
(21)(22) この発明の情報管理データは、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報が統合された統合管理イメージ情報を記憶するための統合管理イメージ情報記憶領域と、前記管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報に含まれる複数の項目についての複数の項目イメージ対応テキスト情報であって、複数のイメージ対応テキスト情報についての項目イメージ対応テキスト情報から、所定の項目について同一の項目イメージ対応テキスト情報が統合された統合イメージ対応テキスト情報を記憶するための統合イメージ対応テキスト情報記憶領域とを備えたことを特徴としている。これは、処理対象イメージ情報と統合管理イメージ情報との類似度を判断するシステム、方法において用いるデータとして有用である。
【0028】
なお、この発明において、「管理対象物」とは、情報管理対象となる物であり、例えば、名刺や帳票、運転免許証、会員カード等である。下記の実施形態では、名刺に該当する。
【0029】
「情報記憶手段」とは、管理イメージ情報とイメージ対応テキスト情報とを関連付けて記憶する管理テーブルを記憶するものであり、下記の実施形態では、外部記憶装置110に該当する。「管理テーブル」とは、管理イメージ情報とイメージ対応テキスト情報とを関連付けて記憶するものであり、下記の実施形態では、図2aに示す名刺データベース300および図3に示す会社データベース400に該当する。
【0030】
「情報抽出手段」とは、処理対象イメージ情報と管理イメージ情報との類似度に基づいてイメージ対応テキスト情報を抽出するものであり、下記の実施形態では、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS64の処理に該当する。「テキスト変換処理」とは、イメージ情報をそれに対応するテキスト情報に変換する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する文字認識処理(OCR処理)に該当する。
【0031】
「管理イメージ情報」とは、管理対象物の少なくとも一部のイメージ情報であり、下記の実施形態では、名刺データベース300に記憶されるイメージデータA1、A2、A3、B1、B2、C1、会社データベース400に記憶されるイメージデータX、Y、Zに該当する。
【0032】
「イメージ対応テキスト情報」とは、管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部の情報であり、下記の実施形態では、名刺データベース300に記憶される項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のテキストデータ、会社データベース400に記憶される項目「会社名、部署名、住所」のテキストデータに該当する。
【0033】
「処理対象イメージ情報」とは、新たに与えられたイメージ情報であり、下記の実施形態では、図10A、図10Bに示す名刺のイメージデータ(カレントイメージデータ)に該当する。
【0034】
「統合管理イメージ情報」とは、複数の管理イメージ情報についての項目管理イメージ情報から所定の項目について同一のものを統合した情報であり、下記の実施形態では、会社データベース400に記憶されるイメージデータX、Y、Zに該当する。「統合イメージ対応テキスト情報」とは、複数のイメージ対応テキスト情報についての項目イメージ対応テキスト情報から所定の項目について同一のものを統合した情報であり、下記の実施形態では、会社データベース400に記憶されるテキストデータに該当する。
【0035】
「統合テーブル」とは、統合管理イメージ情報を記憶するものであり、下記の実施形態では、図3に示す会社データベース400に該当する。「情報統合手段」とは、統合管理イメージ情報を生成するものであり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図6ステップS30の処理に該当する。
【0036】
「項目管理イメージ情報」とは、管理イメージ情報に含まれる複数の項目についてのイメージ情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶されるイメージデータA1、A2、A3、B1、B2、C1、X、Y、Zに含まれる各項目のイメージデータに該当する。「項目イメージ対応テキスト情報」とは、イメージ対応テキスト情報に含まれる複数の項目についてのテキスト情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶される各項目のテキストデータに該当する。「項目処理対象イメージ情報」とは、処理対象イメージ情報に含まれる複数の項目についてのイメージ情報であり、下記の実施形態では、図10A、図10Bに示すカレントイメージデータに含まれる各項目のイメージデータに該当する。
【0037】
「記憶位置情報」とは、管理対象物における項目管理イメージ情報が記録される位置情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶される位置情報に該当する。
【0038】
「ユーザにより設定された処理対象イメージ情報に関するテキスト情報」には、処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報に対してユーザが訂正を加えたものだけでなく、ユーザが入力した処理対象イメージ情報に関するテキスト情報を含む概念である。
【0039】
「テキスト変換処理に基づいて得られたテキスト情報」には、テキスト変換処理により直接的に得られたテキスト情報だけでなく、間接的に何らかの処理が施されたテキスト情報も含む概念である。例えば、文字認識処理(OCR処理)により得られたテキスト情報に対して、人間が訂正を加えたテキスト情報も含む概念である。
【0040】
「第一照合処理」とは、処理対象イメージ情報と統合管理イメージ情報とを照合する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS54の照合処理に該当する。「第二照合処理」とは、管理イメージ情報のうち統合管理イメージ情報以外の情報を少なくとも含む情報と処理対象イメージ情報とを照合する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS60の照合処理に該当する。「第一、第二照合処理において合致」とは、完全一致の場合に限らず、所定の割合以上合致した場合も含む概念である。
【0041】
「統合管理イメージ情報記憶領域」とは、統合管理イメージ情報を記憶するための領域であり、下記の実施形態では、会社データベース400のイメージデータを記憶するための領域に該当する。「統合イメージ対応テキスト情報記憶領域」とは、統合イメージ対応テキスト情報を記憶するための領域であり、下記の実施形態では、会社データベース400のテキストデータを記憶するための領域に該当する。
【0042】
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、CD−ROM、ハードディスク、メモリカード、ROM、パンチカード、テープ等を含む概念である。また、コンピュータによって直接実行可能なプログラムを記録した記録媒体だけでなく、一旦他の記録媒体(ハードディスク等)にインストールすることによって実行可能となるようなプログラムを記録した記録媒体や、暗号化されたり、圧縮されたりしたプログラムを記録した記録媒体を含む概念である。「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
【0043】
【発明の実施の形態】
1. システムの構成
図1に、情報管理システムの一例として、名刺データを管理するシステムの構成例を示す。このシステムは、管理コンピュータ100と画像入力装置(スキャナ)200を備え、管理コンピュータ100の外部記憶装置110に、名刺データベース300と会社データベース400を格納している。スキャナ200は、名刺500に記録された情報を読み込んで、イメージデータに変換して管理コンピュータ100に出力する。名刺データベース300は、図2aに示すように、名刺500に記録される情報について、所定項目のテキストデータと、スキャナ200から入力されたイメージデータを記憶管理するものである。図2bAに、名刺データベース300に登録されたイメージデータA1を示す。ここで、図2aにおいては、イメージデータを名刺データベース300内に記述しているが、実際にはイメージデータを記憶するファイル名を登録する。
【0044】
会社データベース400は、図3に示すように、名刺データベース300に登録されたデータのうち、所定項目のテキストデータと、その項目に対応する部分のイメージデータを記憶管理するものである。図2bBに、会社データベース400に登録されたイメージデータXを示す。ここで、図3においては、イメージデータを会社データベース400内に記述しているが、実際にはイメージデータを記憶するファイル名を登録する。なお、この実施形態では、名刺データベース300には項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」が、会社データベース400には項目「会社名、部署名、住所」が登録される。
【0045】
管理コンピュータ100のハードウエア構成は、バスラインを介して接続された外部記憶装置110、CPU120、インターフェイス122、マウス・キーボード124、ディスプレイ126、メモリ128、フレキシブルディスク・ドライブ130、CD−ROMドライブ132などを備えている。インターフェイス122は、スキャナ200に接続されている。外部記憶装置110には、名刺データベース300等の他に、OCRソフト、名刺データ管理プログラム、会社データ管理プログラム、イメージ照合プログラム、オペレーティングシステム(OS)などが記憶されている。
【0046】
OCRソフトは、スキャナ200から入力されるイメージデータに文字認識処理(OCR処理)を施して、テキストデータに変換するためのものである。名刺データ管理プログラムは、名刺データベース300に名刺のイメージデータ、テキストデータの登録処理等を行うためのものである。会社データ管理プログラムは、名刺データベース300に登録されたデータから、会社データベース400に登録されるデータの作成処理等を行うためのものである。イメージ照合プログラムは、スキャナ200から入力されるイメージデータと、会社データベース400または名刺データベース300に登録されているイメージデータとの照合処理を行うためのものである。
【0047】
外部記憶装置110に記憶されている名刺データ管理プログラム等は、CD−ROMドライブ132を介してCD−ROM134等からインストールされたもの、または通信回線を介してダウンロードされたものである。なお、名刺データ管理プログラム等は、それぞれオペレーティングシステムと共同して、上記処理を実行する。
【0048】
2. 処理の内容
以下に、上記システムが実行する「名刺データの登録処理、会社データベース400の作成処理(2.1)」、「マッチング処理による名刺データの登録管理処理(2.2)」について説明する。
【0049】
2.1 名刺データの登録処理、会社データベース400の作成処理
図4に、名刺データベース300に名刺のイメージデータ、テキストデータを登録するときのフローチャートを示す。まず、管理コンピュータ100のCPU120は、図5Aに示す初期画面を表示して、名刺をスキャナ200にセットするようユーザに促す(図4ステップS10)。ユーザにより名刺が設定されると、スキャナ200はその名刺を読み込み、イメージデータを管理コンピュータ100に与える(図4ステップS12)。
【0050】
CPU120は、イメージデータを受け取ると、これに文字認識処理(OCR処理)を施してテキストデータに変換するとともに、各データの項目を判断する(図4ステップS14)。つまり、OCR処理により得られたテキストデータが、会社名であるか、氏名であるか等の項目を判断する。
【0051】
これは、名刺に記述されている各文字列を、あらかじめ記憶している文字パターンと比較して、最も近似する文字パターンを選択することによりテキストデータに変換する(パターン・マッチング法)。そして、各テキストデータが、所定のキーワード情報を含むか否かを判断することにより、各データの項目を判断する。例えば、キーワード「株式会社」を含むテキストデータは項目「会社名」と判断し、「番地」を含むテキストデータは「住所」と判断し、「TEL」を含むテキストデータは「電話番号」と判断する。例えば、図2a、図2bAに示すイメージデータA1ならば、「ABC株式会社」を会社名と、「東京都○○」を住所と、「03−×××」を電話番号と判断する。
【0052】
また、各データの項目の判断は、キーワード情報だけではなく、名刺に記述されている各文字列の位置情報や文字サイズ情報なども加味して行われる。各文字列の位置情報とは、例えば、横書きの名刺の場合に、会社名は左上、住所や電話番号は左下といった情報のことであり、また、文字サイズ情報とは、会社名と氏名は他の文字に比べて大きいといった情報のことである。
【0053】
次に、CPU120は、図5Bに示す登録画面を表示して、OCR処理により得られたテキストデータの正当性をユーザに問う(図4ステップS16)。この登録画面において、OCR処理により得られたテキストデータとともに、名刺のイメージデータも表示される。
【0054】
ユーザにより正当であると判断されると、図2aに示す名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図4ステップS18、S20)。なお、この実施形態では、各テキストデータに関連付けて、各テキストデータに対応する各イメージデータが記述されている位置についての情報についても登録される。
【0055】
また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図4ステップS22、S24)。この修正データは、図5Bの登録画面における表600の所定欄に直接書き込むことにより入力される。
【0056】
以上の名刺データの登録処理は、複数の名刺についてなされ、複数のイメージデータおよびテキストデータが名刺データベース300に蓄積される。なお、この実施形態では、OCRソフトにより項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」について文字認識され、そのテキストデータが名刺データベース300に登録される。
【0057】
次に、会社データベース400を作成するときの管理コンピュータ100の処理について、図6に示すフローチャートを用いて説明する。CPU120は、名刺データベース300にイメージデータおよびテキストデータが登録されると(図4ステップS20、S24)、名刺データベース300において、項目「会社名、部署名、住所」のテキストデータを抽出する(図6ステップS30)。なお、この抽出処理では、項目「会社名、部署名、住所」が同一の複数のレコードについては1つのテキストデータを抽出する。
【0058】
図2aに示す名刺データベース300では、レコード11、13、15から「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」を、レコード12、14から「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」を、レコード16から「会社名:DEF株式会社、部署名:開発部、住所:東京都○○」を抽出する。
【0059】
次に、CPU120は、これらの各抽出データが、すでに会社データベース400に登録されているか否かを判断し、未だ登録されていない抽出データを図3に示す会社データベース400に登録する(図6ステップS32、S34、S36)。このとき、抽出データに関連するイメージデータであって、項目「会社名、部署名、住所」の部分のイメージデータを、抽出データに関連付けて図3に示す会社データベース400に登録する。例えば、「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」の抽出データについて、これに関連するイメージデータA1(またはA2、A3)の項目「会社名、部署名、住所」の部分のイメージデータXが、会社データベース400に登録される。また、会社データベース400と名刺データベース300の各レコード間の対応関係を示す情報を、図3に示す会社データベース400に記録する。
【0060】
なお、新たな名刺データが名刺データベース300に登録された場合には、管理コンピュータ100は、その新規データについて上記と同様の処理を実行する。この場合、図6ステップS32において、すでに会社データベース400に登録されていると判断された場合には、新規データは会社データベース400に登録されない。
【0061】
2.2 マッチング処理による名刺データの登録管理処理
図7に、マッチング処理により名刺データの登録を管理するときのフローチャートを示す。まず、管理コンピュータ100のCPU120は、図8Aに示す初期画面を表示して、名刺をスキャナ200にセットするようユーザに促す(図7ステップS50)。ユーザにより図10Aに示す名刺が設定されると、スキャナ200はその名刺を読み込み、イメージデータ(以下、これをカレントイメージデータとする)を管理コンピュータ100に与える(図7ステップS52)。
【0062】
CPU120は、カレントイメージデータを受け取ると、会社データベース400に登録されている各イメージデータX、Y、Zと、カレントイメージデータとの照合処理を行う(図7ステップS54)。なお、会社データベース400に登録されているのは項目「会社名、部署名、住所」の部分のイメージデータであるため、この部分のイメージデータについて合致するか否かが判断される。
【0063】
この照合処理では、会社データベース400に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行う。このイメージデータの比較は、例えば、「パタン分析と機械知能に関するIEE会報(IEEE Transaction on Pattern Analysis and Machine Intelligence):Vol.15 No.9(9月1993)の855〜863頁」に記載の「ハウスドルフディスタンスを用いたイメージの比較(Comparing Images Using the Hausdorff Distance)」方式に基づいて行われる。なお、この照合処理中に、ディスプレイ126において、図8Bに示すように、カレントイメージデータ620とともに、会社データベース400に登録されているイメージデータを次々に検索欄640に表示する。
【0064】
ここで、図10Aのカレントイメージデータは、図3、図2bBに示すイメージデータXと項目「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」の部分において同一であるため、イメージデータXと合致すると判断される(図7ステップS56)。
【0065】
次に、CPU120は、イメージデータXに対応する名刺データベース300に登録されている各イメージデータA1、A2、A3を抽出し、各イメージデータA1、A2、A3(図2a)とカレントイメージデータ(図10A)との照合処理を行う(図7ステップS58、S60)。この場合も、名刺データベース300に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行う。
【0066】
この照合処理では、名刺全体のうち、図7ステップS54にて照合された項目以外の部分のイメージデータについて合致するか否かが判断される。つまり、図7ステップS54の照合処理では、項目「会社名、部署名、住所」の部分について判断され、図7ステップS60の照合処理では、その他の項目「氏名、役職、電話番号、メールアドレス」の部分について判断されることとなる。なお、この照合処理中に、ディスプレイ126において、図9Aに示すように、カレントイメージデータ660とともに、名刺データベース300に登録されているイメージデータを次々に検索欄680に表示する。
【0067】
ここで、図10Aのカレントイメージデータは、イメージデータA2と項目「氏名:伊藤○○、役職:課長、電話番号:03−○×○、メールアドレス:bbb@eee」の部分においても同一であるため、イメージデータA2と合致すると判断される(図7ステップS62)。
【0068】
次に、CPU120は、イメージデータA2に関連するテキストデータ「氏名:伊藤○○、会社名:ABC株式会社、部署名:企画部、住所:東京都○○、役職:課長、電話番号:03−○×○、メールアドレス:bbb@eee」を抽出して、図9Bに示す抽出結果画面を表示する(図7ステップS64、S66)。この抽出結果画面において、スキャンされた名刺データは、すでに名刺データベース300に登録されている旨を伝える。
【0069】
なお、図7ステップS54の照合処理において、スキャンされた名刺のイメージデータに合致するものが会社データベース400に存在しない場合には、図11に示すOCRによる登録処理(1)を実行する(図7ステップS68)。この処理では、スキャンされた名刺のイメージデータにOCR処理を施してテキストデータに変換し、図13Aに示す登録画面を表示する(図11ステップS70、S72)。この画面において、スキャンされた名刺データが名刺データベース300に未登録である旨を伝えるとともに、OCR処理により得られたテキストデータの正当性をユーザに問う。
【0070】
ユーザにより正当であると判断されると、名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図11ステップS74、S76)。また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図11ステップS78、S80)。
【0071】
また、図7ステップS60の照合処理において、スキャンされた名刺のイメージデータに合致するものが名刺データベース300に存在しない場合には、図12に示すOCRによる登録処理(2)を実行する(図7ステップS69)。この処理では、少なくとも、項目「会社名、部署名、住所」の部分のイメージデータに合致するものが会社データベース400に存在しているので、会社データベース400の項目「会社名、部署名、住所」のテキストデータを利用し、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行する。
【0072】
例えば、図10Bに示す名刺がスキャンされた場合に、会社データベース400のイメージデータYと項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」の部分において合致するが(図7ステップS54、S56)、名刺データベース300のイメージデータB1、B2とは、項目「氏名、役職、電話番号、メールアドレス」の部分において異なるため、イメージデータB1、B2のいずれにも合致しないと判断される(図7ステップS58、S60、S62)。この場合、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行するとともに(図12ステップS90)、イメージデータYに関連する項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」のテキストデータを会社データベース400から抽出して、図13Bに示す登録画面を表示する(図12ステップS92、S94)。
【0073】
この登録画面において、スキャンされた名刺データが名刺データベース300に未登録である旨を伝えるとともに、OCR処理により得られたテキストデータの正当性をユーザに問う(図12ステップS94)。なお、図13Bに示す登録画面では、OCR処理により得られたテキストデータと、会社データベース400から抽出したテキストデータが区別できるように表示する(例えば、太枠で囲んだり、太字で表示する)。
【0074】
ユーザにより正当であると判断されると、名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図12ステップS96、S98)。また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図12ステップS100、S102)。
【0075】
以上のように、スキャンされた名刺のイメージデータに合致したイメージデータに関連付けられたテキストデータを、名刺データベース300(または会社データベース400)から抽出することにより、OCR処理を実行せずに、当該名刺のテキストデータを得ることができる。つまり、信頼性の低いOCR処理により得られたテキストデータではなく、あらかじめ記憶する信頼性の高いテキストデータを利用することができる。
【0076】
3. 他の実施例
なお、上述の実施形態では、図7ステップS54、S60の照合処理において、会社データベース400(または名刺データベース300)に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行っている。これは、同一の名刺は、氏名、会社名等の各項目の情報が、同一の項目ならば同じ位置に記述されていることを前提としている。しかしながら、同一の項目が同じ位置に記述されていない場合でも、イメージデータを比較することは可能である。例えば、図14に示すカレントイメージデータに対してOCR処理を施し、得られたテキストデータから上述のキーワード情報により各項目「会社名、部署名、住所」を判断する。そして、カレントイメージデータにおける各項目のイメージデータと、会社データベース400に登録されている各項目のイメージデータとの比較を行う。
【0077】
また、上述の実施形態では、図7ステップS60の照合処理において、項目「氏名、役職、電話番号、メールアドレス」の部分のイメージデータについて合致するか否かを判断している。しかしながら、名刺全体(すべての項目)のイメージデータについて合致するか否かを判断してもよい。
【0078】
また、上述の実施形態では、図12に示すOCRによる登録処理(2)において、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行している(図12ステップS90)。これは、図7ステップS54の照合処理において、項目「会社名、部署名、住所」の部分は合致すると判断されたためである。しかしながら、図7ステップS60の照合処理において合致しないと判断された項目についてのみOCR処理を実行してもよい。例えば、氏名のみ異なる名刺がスキャンされた場合には、図7ステップS60の照合処理において、項目「氏名」のみ合致しないと判断され、図12に示すOCRによる登録処理(2)において、項目「氏名」の部分についてOCR処理を実行する(図12ステップS90)。この場合、その他の項目のテキストデータを名刺データベース300から抽出して、これをOCR処理により得られた「氏名」のテキストデータとともに登録画面(図示せず)に表示する(図12ステップS92、S94)。これにより、名刺に記録された情報が一部だけ異なる場合や、一部変更された場合に(例えば、部署の異動、電話番号の変更など)、簡単に名刺データベース300の登録内容を更新することができる。
【0079】
また、上述の実施形態では、図7ステップS60の照合処理において合致しないと判断した場合に、図12に示すOCRによる登録処理(2)を実行している。しかしながら、この処理の代わりに、またはこの処理の前に、名刺データベース300から項目「会社名、部署名、住所」が一致するテキストデータを抽出して、一覧表示してもよい。例えば、図10Bに示す名刺がスキャンされた場合に、名刺データベース300から、項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」が一致するテキストデータ抽出して一覧表示700、720する(図15参照)。これにより、本質的でない部分において照合処理に失敗した場合に、ユーザは、図15に示す一覧表示から、スキャンした名刺のデータがすでに登録されていることを確認することができる場合がある。
【0080】
また、上述の実施形態では、名刺データベース300と会社データベース400の両者を備えているが、会社データベース400を備えていなくてもよい。この場合、図7ステップS54の照合処理は実行しないで、スキャンされた名刺のイメージデータと、名刺データベース300に登録されているイメージデータを照合してもよい(図7ステップS60)。つまり、項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のすべての部分において照合する。また、名刺データベース300に登録されているイメージデータを用いて、図7ステップS54の照合処理を実行してもよい。つまり、項目「会社名、部署名、住所」のの部分について照合する。
【0081】
また、上述の実施形態では、名刺データベース300と会社データベース400の両者を備えているが、名刺データベース300を備えていなくてもよい。この場合、図7ステップS58、S60、S62、S64の処理を実行せず、会社データベース400に登録されているイメージデータと合致した場合に(項目「会社名、部署名、住所」の部分にて合致した場合)、会社データベース400に登録されているテキストデータをユーザに提示してもよい。
【0082】
また、上述の実施形態において、図9Bに示す抽出結果画面をユーザに提示して(図7ステップS66)、スキャンされた名刺データは、すでに名刺データベース300に登録されている旨を伝えている。この際に、抽出結果が正当であるか否かをユーザに問い、修正データを入力可能にしてもよい。
【0083】
また、上述の実施形態では、管理コンピュータ100に接続されているスキャナ200にて読み込まれた名刺のイメージデータを、管理コンピュータ100が受け取る場合を一例として説明している。しかしながら、管理コンピュータ100と通信回線(インターネット、イントラネット)を介して接続された端末コンピュータから、管理コンピュータ100がイメージデータを受け取る場合にもこの発明を適用することができる。例えば、図16に示すように、管理コンピュータ100とインターネットを介して接続された複数の端末コンピュータ800、820、840に、それぞれスキャナ810、830、850を備え、各スキャナ810、830、850で読み込まれた名刺のイメージデータが、管理コンピュータ100に送信される。名刺データベース300、会社データベース400を備えた管理コンピュータ100は、上記2.2に示すマッチング処理を実行することにより、名刺データの登録管理処理を実行する。
【0084】
また、図16に示すように、管理コンピュータ100が、名刺データベース300等にて複数の利用者の名刺データを一括管理することにより、1人の利用者が修正を加えれば、名刺データベース300の登録内容が更新されるため、他の利用者は、早期に最新のデータを利用することができる。また、1人の利用者が名刺データの登録処理を行えば、他の利用者はその登録データを利用することができ、OCR処理を実行することなく、名刺データの管理を行うことができる。なお、図16に示すインターネットを利用する場合に限らず、イントラネットを利用する場合や図1に示すスタンドアロンでも、複数の利用者の名刺データを管理することができる。また、図16に示すシステムにおいて、端末コンピュータから管理コンピュータ100に対して名刺のテキストデータを送信することにより、名刺データベース300に登録されている当該名刺のテキストデータを更新してもよい。
【0085】
また、図16に示すシステムにおいて、名刺データベース300等にて利用者自身の名刺データを記憶して、管理コンピュータ100が一括管理している場合には、次のように利用することもできる。各利用者は、自分自身の名刺データに変更が生じた場合に、最新の自己の名刺のイメージデータを、各自の端末コンピュータから管理コンピュータ100に送信し、名刺データベース300等における自己の名刺データの登録内容を更新する。これにより、他の複数の利用者に対して個別に通知しなくても、他の利用者は、名刺データベース300等にて更新された名刺データを閲覧することにより、それを利用することができる。
【0086】
また、上記の場合において、管理コンピュータ100は、名刺データの変更が生じたときに、他の利用者の端末コンピュータに変更した旨を通知してもよい。これにより、他の利用者は、端末コンピュータから管理コンピュータ100に対して更新された名刺データを要求することにより、それを早期に取得することができる。
【0087】
また、上述の実施形態では、名刺データベース300に、名刺に記録された情報をテキストデータとして登録しているが、名刺に記録された情報以外の情報(例えば、年齢や性別等)を登録しておいてもよい。また、会社データベース400に、名刺に記録された情報以外の情報(例えば、資本金、売上高等)を登録しておいてもよい。
【0088】
また、上述の実施形態において、名刺のテキストデータ等が名刺データベース300に登録される度に(図4ステップS20、S24)、管理コンピュータ100が、自動的に、名刺データベース300において項目「会社名、部署名、住所」が同一のテキストデータを抽出し、会社データベース400を更新している(図6ステップS30〜S36)。しかしながら、管理コンピュータ100は、ユーザから会社データベース400の更新指令を受けて、図6ステップS30〜S36の処理を実行してもよい。
【0089】
また、上述の実施形態における名刺データの登録処理(図4)において、OCR処理を実行して得られたテキストデータを、名刺データベース300に登録している。しかしながら、ユーザが、手作業により名刺に記録された情報をコンピュータに入力して、名刺データベース300に登録してもよい。
【0090】
また、上述の実施形態では、名刺データベース300のレコード16のように、他に項目「会社名、部署名、住所」が同一のレコードが存在しない場合でも、会社データベース400に登録している。しかしながら、所定項目が同一の2以上のレコードが存在しない場合には、会社データベース400に登録しなくてもよい。
【0091】
また、上述の実施形態における会社データベース400の作成処理における項目「会社名、部署名、住所」のテキストデータの抽出処理では、項目「会社名、部署名、住所」が同一の複数のレコードについては1つのテキストデータを抽出して、会社データベース400に登録している(図6ステップS30、S32、S34)。このように、会社データベース400における1つのレコードが、名刺データベース300の複数のレコードに対応する場合には、その数を会社データベース400の当該レコードに記録しておくとよい。例えば、上述の実施形態における会社データベース400のレコード21「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」は、名刺データベース300のレコード11、13、15に対応するため、その数「3」を会社データベース400のレコード21に記録する。これにより、利用者が会社データベース400の登録情報を閲覧することにより、各会社の各部署について、どれだけ名刺データが登録されているか知ることができる。
【0092】
また、上述の実施形態では、会社データベース400には、項目「会社名、部署名、住所」のテキストデータが登録されているが、これらの項目に限られるものではない。また、名刺データベースには、項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のテキストデータが登録されているが、これらの項目に限られるものではない。
【0093】
また、上述の実施形態では、名刺データベース300および会社データベース400において、テキストデータおよびイメージデータを同一のテーブルにて相互に関連付けて登録管理する場合を一例として説明している。しかしながら、テキストデータを記憶するテーブルとイメージデータを記憶するテーブルを別個に設けて、登録管理してもよい。この場合、テキストデータとイメージデータを関連付ける情報を記録する。
【0094】
また、上述の実施形態では、管理コンピュータ100にOCRソフトを格納して、管理コンピュータ100が文字認識処理を実行しているが(図4ステップS14)、光学文字読み取り装置(OCR装置)を別個に設けて、その装置が文字認識処理を実行してもよい。また、上述の実施形態では、管理コンピュータ100が、上述の会社データベース400の作成処理(図6)およびマッチング処理による登録管理処理(図7)を実行しているが、別個のコンピュータによって、それぞれの処理を実行してもよい。
【0095】
また、上述の実施形態では、名刺データを管理するシステムを一例として説明しているが、これに限られるものではなく、帳票や運転免許証、会員カード等に記録された情報を管理する場合にもこの発明を適用することができる。
【図面の簡単な説明】
【図1】一実施形態における名刺データ管理システムの構成を示す図である。
【図2a】名刺データベース300を示す図である。
【図2b】名刺データベース300、会社データベース400におけるイメージデータを示す図である。
【図3】会社データベース400を示す図である。
【図4】名刺データの登録処理を示すフローチャートである。
【図5】名刺データの登録処理におけるディスプレイ画面を示す図である。
【図6】会社データベース400の作成処理を示すフローチャートである。
【図7】マッチング処理による名刺データの登録管理処理を示すフローチャートである。
【図8】名刺データの登録管理処理におけるディスプレイ画面を示す図である。
【図9】名刺データの登録管理処理におけるディスプレイ画面を示す図である。
【図10】スキャンされる名刺(そのイメージデータ)を示す図である。
【図11】名刺データの登録管理処理におけるOCRによる登録処理(1)を示すフローチャートである。
【図12】名刺データの登録管理処理におけるOCRによる登録処理(2)を示すフローチャートである。
【図13】OCRによる登録処理における登録画面を示す図である。
【図14】他の実施例におけるイメージデータの比較方法を説明するための図である。
【図15】他の実施例における登録画面を示す図である。
【図16】他の実施例において、インターネットを利用した名刺データ管理システムの構成を示す図である。
【符号の説明】
100・・・・管理コンピュータ
110・・・・外部記憶装置
200・・・・スキャナ
300・・・・名刺データベース
400・・・・会社データベース
800、820、840・・・・端末コンピュータ
810、830、850・・・・スキャナ
【発明の属する技術分野】
名刺や帳票、運転免許証、会員カード等に記録された情報を管理するシステムに関するものであり、特に、イメージデータの照合処理により管理の効率化、情報の信頼性の確保を図るものである。
【0002】
【従来の技術および発明が解決しようとする課題】
従来の名刺データを登録管理する方法として、手作業により各名刺に記録されている情報をコンピュータに入力して、管理データベースに大量の名刺データを蓄積する方法がある。また、別の登録管理方法として、画像入力装置(スキャナ)にて読み込まれた名刺のイメージデータに、文字認識処理(OCR処理)(OCR:Optical Character Reader)を施して文字コードからなるテキストデータに変換し、管理データベースに名刺データを蓄積する方法がある。
【0003】
しかしながら、前者の登録管理方法では、手作業により情報を入力するため、入力ミスが生じ、管理データベースに蓄積されるデータの信頼性は低い。また、同一の名刺が複数存在する場合に、入力作業が重複してしまい作業効率の低下を招く。また、後者の登録管理方法では、OCR処理により得られるテキストデーの信頼性が低く、登録者はそのデータの正当性を確認する必要があり、これも作業効率の低下という問題が生じる。なお、この問題は、OCR処理では、認識対象となる文字パターンをあらかじめ記憶しておき、入力されたイメージデータと文字パターンを比較して、最も近似する文字パターンを選択することによりテキストデータに変換おり(パターン・マッチング法)、その認識率が完全でないことに起因するものである。
【0004】
この発明は、OCR処理の認識率が完全でないことに起因する作業効率の低下の問題を解決し、信頼性の高い名刺等に記録された情報を利用者に提供することができる情報管理システムおよび情報管理方法を提供することを目的とする。
【0005】
【課題を解決するための手段および発明の効果】
(1)(2)(3)(18) この発明の情報管理システム等は、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するためのシステムであって、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段とを備えたことを特徴としている。
【0006】
したがって、処理対象イメージ情報と管理イメージ情報との類似度によれば、テキスト変換処理を実行せずに、処理対象イメージ情報に類似する管理イメージ情報に関連付けられたイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として得ることができる。つまり、信頼性の低いテキスト変換処理により得られたテキスト情報ではなく、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を利用することにより、テキスト変換処理が完全でないことに起因する作業効率の低下の問題を解決することができる。
【0007】
(4) この発明の情報管理システム等にて、前記情報抽出手段は、前記管理テーブルから抽出した前記イメージ対応テキスト情報をユーザに対して提示することを特徴としている。これにより、ユーザは、処理対象イメージ情報についてのテキスト情報として、提示されたイメージ対応テキスト情報を得ることができる。
【0008】
(5) この発明の情報管理システムにて、前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在する場合に、当該管理イメージ情報に関連付けられた前記イメージ対応テキスト情報をユーザに対して提示し、前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示することを特徴としている。
【0009】
これにより、処理対象イメージ情報に類似する管理イメージ情報が管理テーブルに存在する場合、つまり、処理対象イメージ情報についてのテキスト情報として適当なものが存在する場合、あらかじめ記憶する所定のイメージ対応テキスト情報を得ることができる。また、処理対象イメージ情報に類似する管理イメージ情報が管理テーブルに存在しない場合、つまり、処理対象イメージ情報についてのテキスト情報として適当なものが存在しない場合、処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を得ることができる。
【0010】
(6) この発明の情報管理システム等にて、前記処理対象イメージ情報は、複数の項目についての複数の項目処理対象イメージ情報を含み、前記管理テーブルは、複数の項目についての複数の項目管理イメージ情報を前記管理イメージ情報として記憶し、複数の項目管理イメージ情報に対するテキスト変換処理に基づいて得られた複数の項目イメージ対応テキスト情報を前記イメージ対応テキスト情報として記憶し、前記情報抽出手段は、項目処理対象イメージ情報に類似する項目管理イメージ情報が前記管理テーブルに存在する場合に、当該項目管理イメージ情報に関連付けられた項目イメージ対応テキスト情報をユーザに対して提示することを特徴としている。
【0011】
これにより、項目処理対象イメージ情報に類似する項目管理イメージ情報が管理テーブルに存在する場合、つまり、項目処理対象イメージ情報についてのテキスト情報として適当なものが存在する場合、あらかじめ記憶する所定の項目イメージ対応テキスト情報を得ることができる。
【0012】
(7) この発明の情報管理システム等にて、前記情報抽出手段は、前記項目処理対象イメージ情報に類似する前記項目管理イメージ情報が前記管理テーブルに存在しない場合に、当該項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示して、必要な確認または修正を促すことを特徴としている。これにより、項目処理対象イメージ情報に類似する項目管理イメージ情報が管理テーブルに存在しない場合、つまり、項目処理対象イメージ情報についてのテキスト情報として適当なものが存在しない場合、項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を得ることができる。
【0013】
(8) この発明の情報管理システム等にて、前記情報抽出手段は、前記イメージ対応テキスト情報および前記処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を、いずれの情報であるかを識別可能なようにユーザに提示することを特徴としている。これにより、ユーザは、提示された情報が、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報か、確認または修正が必要なテキスト変換処理により得られたテキスト情報か、を一見して見分けることができる。
【0014】
(9) この発明の情報管理システム等にて、前記情報抽出手段は、前記管理対象物における前記項目管理イメージ情報の記録位置情報を用いて特定される前記項目処理対象イメージ情報と、当該項目管理イメージ情報との比較処理により、その類似度を判断することを特徴としている。これにより、同一の名刺は、同一の項目ならば各項目管理イメージ情報が同じ位置に記録されていることに鑑みて、記録位置情報に基づき各項目管理イメージ情報の記録位置を判断し、各項目ごとにイメージ情報の比較を行うことができる。
【0015】
(10) この発明の情報管理システム等にて、前記情報抽出手段は、前記項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報から項目を判断し、同種の項目における前記項目処理対象イメージ情報と前記項目管理イメージ情報との比較処理により、その類似度を判断することを特徴としている。これにより、同一の名刺について、同一の項目の各項目イメージ情報が同じ位置に記録されていない場合でも、イメージ情報の比較を行うことができる。
【0016】
(11)(12) この発明の情報管理システム等にて、複数の前記管理イメージ情報についての前記項目管理イメージ情報から、所定の項目について同一の前記項目管理イメージ情報を統合した統合管理イメージ情報を、統合テーブルに記憶する情報統合手段を備え、前記情報統合手段は、複数の前記イメージ対応テキスト情報についての前記項目イメージ対応テキスト情報から、所定の項目について同一の前記項目イメージ対応テキスト情報を統合した統合イメージ対応テキスト情報を、前記統合テーブルに記憶することを特徴としている。
【0017】
これにより、統合管理イメージ情報を利用して、類似度の判断処理の効率化を図ることができる。また、統合イメージ対応テキスト情報をユーザに提示することも可能となる。また、好適な統合管理イメージ情報を生成すれば、管理対象物の種類、特性、用途等に応じた情報管理処理を実行することができる。
【0018】
(13) この発明の情報管理システム等にて、前記情報抽出手段は、所定の項目において前記項目処理対象イメージ情報に類似する前記統合管理イメージ情報が前記統合テーブルに存在する場合に、当該統合管理イメージ情報に関連する前記項目管理イメージ情報と前記項目処理対象イメージ情報との類似度を判断することを特徴としている。これにより、所定の項目において項目処理対象イメージ情報に類似する統合管理イメージ情報が存在しなければ、項目管理イメージ情報との類似度の判断処理を省略することができ、一連の処理の効率化を図ることができる。
【0019】
(14) この発明の情報管理システム等にて、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、前記処理対象イメージ情報、および当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された当該処理対象イメージ情報に関するテキスト情報の少なくとも一部を、前記管理テーブルに記憶することを特徴としている。
【0020】
これにより、処理対象イメージ情報等を管理テーブルに記憶することで、以後、当該処理対象イメージ情報が新たに入力された場合に、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報等を抽出して、ユーザに提示することが可能となる。また、1人の利用者が、処理対象イメージ情報等を管理テーブルに記憶させれば、以後、他の利用者は、このシステムにおいて、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報等を利用することができる。
【0021】
(15)(16) この発明の情報管理システム等は、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するための情報管理装置と、前記情報管理装置と通信可能な1または複数の端末装置とを備えたシステムであって、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、前記端末装置から送信されて新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段と、当該抽出したイメージ対応テキスト情報を前記端末装置に送信する情報送信手段とを備えたことを特徴としている。
【0022】
これにより、端末装置から処理対象イメージ情報を情報管理装置に送信することにより、端末装置の利用者は、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として得ることができる。
【0023】
(17) この発明の情報管理システム等にて、前記端末装置は、前記イメージ対応テキスト情報または前記管理イメージ情報の変更情報を前記情報管理装置に送信し、前記情報管理装置は、当該変更情報に基づいて、前記情報記憶手段に記憶されている前記イメージ対応テキスト情報または前記管理イメージ情報を変更することを特徴としている。これにより、1人の利用者が、管理イメージ情報等を変更させれば、以後、他の利用者は、このシステムにおいて、最新の管理イメージ情報等を利用することができる。例えば、名刺に記録された情報が一部変更された場合に(例えば、部署の異動、電話番号の変更など)、他の利用者は、早期に最新の情報を知ることができる。また、端末装置の利用者自身の管理対象物に関する管理イメージ情報等を情報管理装置が管理している場合には、各利用者は、自分自身の管理イメージ情報等に変更が生じた場合に、情報管理装置が記憶管理するその管理イメージ情報等を更新することにより、他の複数の利用者に対して個別に通知しなくても、他の利用者は、早期に更新された管理イメージ情報等をを利用することができる。
【0024】
(19) この発明の情報管理方法は、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報と、管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報を統合した統合管理イメージ情報とを記憶するコンピュータを用いて、新たに与えられた処理対象イメージ情報と統合管理イメージ情報とを照合する第一照合処理と、前記第一照合処理において合致した場合には、管理イメージ情報のうち前記統合管理イメージ情報以外の情報を少なくとも含む情報と処理対象イメージ情報とを照合する第二照合処理と、前記第二照合処理において合致した場合には、イメージ対応テキスト情報を抽出する処理とを実行することを特徴としている。
【0025】
これにより、信頼性の低いテキスト処理により得られたテキスト情報ではなく、あらかじめ記憶する信頼性の高いイメージ対応テキスト情報を、処理対象イメージ情報についてのテキスト情報として利用することができる。また、第一照合処理において合致しなければ、第二照合処理を省略することができ、一連の処理の効率化を図ることができる。
【0026】
(20) この発明の情報管理データは、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報を記憶するためのイメージ情報記憶領域と、前記管理イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された前記管理対象物に関するテキスト情報の少なくとも一部であるイメージ対応テキスト情報であって、前記管理イメージ情報に関連付けられたイメージ対応テキスト情報を記憶するためのテキスト情報記憶領域とを備えたことを特徴としている。これは、処理対象イメージ情報と管理イメージ情報との類似度に基づいてイメージ対応テキスト情報を抽出するシステム、方法において用いるデータとして有用である。
【0027】
(21)(22) この発明の情報管理データは、管理対象物の少なくとも一部のイメージ情報である管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報が統合された統合管理イメージ情報を記憶するための統合管理イメージ情報記憶領域と、前記管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報に含まれる複数の項目についての複数の項目イメージ対応テキスト情報であって、複数のイメージ対応テキスト情報についての項目イメージ対応テキスト情報から、所定の項目について同一の項目イメージ対応テキスト情報が統合された統合イメージ対応テキスト情報を記憶するための統合イメージ対応テキスト情報記憶領域とを備えたことを特徴としている。これは、処理対象イメージ情報と統合管理イメージ情報との類似度を判断するシステム、方法において用いるデータとして有用である。
【0028】
なお、この発明において、「管理対象物」とは、情報管理対象となる物であり、例えば、名刺や帳票、運転免許証、会員カード等である。下記の実施形態では、名刺に該当する。
【0029】
「情報記憶手段」とは、管理イメージ情報とイメージ対応テキスト情報とを関連付けて記憶する管理テーブルを記憶するものであり、下記の実施形態では、外部記憶装置110に該当する。「管理テーブル」とは、管理イメージ情報とイメージ対応テキスト情報とを関連付けて記憶するものであり、下記の実施形態では、図2aに示す名刺データベース300および図3に示す会社データベース400に該当する。
【0030】
「情報抽出手段」とは、処理対象イメージ情報と管理イメージ情報との類似度に基づいてイメージ対応テキスト情報を抽出するものであり、下記の実施形態では、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS64の処理に該当する。「テキスト変換処理」とは、イメージ情報をそれに対応するテキスト情報に変換する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する文字認識処理(OCR処理)に該当する。
【0031】
「管理イメージ情報」とは、管理対象物の少なくとも一部のイメージ情報であり、下記の実施形態では、名刺データベース300に記憶されるイメージデータA1、A2、A3、B1、B2、C1、会社データベース400に記憶されるイメージデータX、Y、Zに該当する。
【0032】
「イメージ対応テキスト情報」とは、管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部の情報であり、下記の実施形態では、名刺データベース300に記憶される項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のテキストデータ、会社データベース400に記憶される項目「会社名、部署名、住所」のテキストデータに該当する。
【0033】
「処理対象イメージ情報」とは、新たに与えられたイメージ情報であり、下記の実施形態では、図10A、図10Bに示す名刺のイメージデータ(カレントイメージデータ)に該当する。
【0034】
「統合管理イメージ情報」とは、複数の管理イメージ情報についての項目管理イメージ情報から所定の項目について同一のものを統合した情報であり、下記の実施形態では、会社データベース400に記憶されるイメージデータX、Y、Zに該当する。「統合イメージ対応テキスト情報」とは、複数のイメージ対応テキスト情報についての項目イメージ対応テキスト情報から所定の項目について同一のものを統合した情報であり、下記の実施形態では、会社データベース400に記憶されるテキストデータに該当する。
【0035】
「統合テーブル」とは、統合管理イメージ情報を記憶するものであり、下記の実施形態では、図3に示す会社データベース400に該当する。「情報統合手段」とは、統合管理イメージ情報を生成するものであり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図6ステップS30の処理に該当する。
【0036】
「項目管理イメージ情報」とは、管理イメージ情報に含まれる複数の項目についてのイメージ情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶されるイメージデータA1、A2、A3、B1、B2、C1、X、Y、Zに含まれる各項目のイメージデータに該当する。「項目イメージ対応テキスト情報」とは、イメージ対応テキスト情報に含まれる複数の項目についてのテキスト情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶される各項目のテキストデータに該当する。「項目処理対象イメージ情報」とは、処理対象イメージ情報に含まれる複数の項目についてのイメージ情報であり、下記の実施形態では、図10A、図10Bに示すカレントイメージデータに含まれる各項目のイメージデータに該当する。
【0037】
「記憶位置情報」とは、管理対象物における項目管理イメージ情報が記録される位置情報であり、下記の実施形態では、名刺データベース300、会社データベース400に記憶される位置情報に該当する。
【0038】
「ユーザにより設定された処理対象イメージ情報に関するテキスト情報」には、処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報に対してユーザが訂正を加えたものだけでなく、ユーザが入力した処理対象イメージ情報に関するテキスト情報を含む概念である。
【0039】
「テキスト変換処理に基づいて得られたテキスト情報」には、テキスト変換処理により直接的に得られたテキスト情報だけでなく、間接的に何らかの処理が施されたテキスト情報も含む概念である。例えば、文字認識処理(OCR処理)により得られたテキスト情報に対して、人間が訂正を加えたテキスト情報も含む概念である。
【0040】
「第一照合処理」とは、処理対象イメージ情報と統合管理イメージ情報とを照合する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS54の照合処理に該当する。「第二照合処理」とは、管理イメージ情報のうち統合管理イメージ情報以外の情報を少なくとも含む情報と処理対象イメージ情報とを照合する処理であり、下記の実施形態では、管理コンピュータ100のCPU120が実行する図7ステップS60の照合処理に該当する。「第一、第二照合処理において合致」とは、完全一致の場合に限らず、所定の割合以上合致した場合も含む概念である。
【0041】
「統合管理イメージ情報記憶領域」とは、統合管理イメージ情報を記憶するための領域であり、下記の実施形態では、会社データベース400のイメージデータを記憶するための領域に該当する。「統合イメージ対応テキスト情報記憶領域」とは、統合イメージ対応テキスト情報を記憶するための領域であり、下記の実施形態では、会社データベース400のテキストデータを記憶するための領域に該当する。
【0042】
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、CD−ROM、ハードディスク、メモリカード、ROM、パンチカード、テープ等を含む概念である。また、コンピュータによって直接実行可能なプログラムを記録した記録媒体だけでなく、一旦他の記録媒体(ハードディスク等)にインストールすることによって実行可能となるようなプログラムを記録した記録媒体や、暗号化されたり、圧縮されたりしたプログラムを記録した記録媒体を含む概念である。「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
【0043】
【発明の実施の形態】
1. システムの構成
図1に、情報管理システムの一例として、名刺データを管理するシステムの構成例を示す。このシステムは、管理コンピュータ100と画像入力装置(スキャナ)200を備え、管理コンピュータ100の外部記憶装置110に、名刺データベース300と会社データベース400を格納している。スキャナ200は、名刺500に記録された情報を読み込んで、イメージデータに変換して管理コンピュータ100に出力する。名刺データベース300は、図2aに示すように、名刺500に記録される情報について、所定項目のテキストデータと、スキャナ200から入力されたイメージデータを記憶管理するものである。図2bAに、名刺データベース300に登録されたイメージデータA1を示す。ここで、図2aにおいては、イメージデータを名刺データベース300内に記述しているが、実際にはイメージデータを記憶するファイル名を登録する。
【0044】
会社データベース400は、図3に示すように、名刺データベース300に登録されたデータのうち、所定項目のテキストデータと、その項目に対応する部分のイメージデータを記憶管理するものである。図2bBに、会社データベース400に登録されたイメージデータXを示す。ここで、図3においては、イメージデータを会社データベース400内に記述しているが、実際にはイメージデータを記憶するファイル名を登録する。なお、この実施形態では、名刺データベース300には項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」が、会社データベース400には項目「会社名、部署名、住所」が登録される。
【0045】
管理コンピュータ100のハードウエア構成は、バスラインを介して接続された外部記憶装置110、CPU120、インターフェイス122、マウス・キーボード124、ディスプレイ126、メモリ128、フレキシブルディスク・ドライブ130、CD−ROMドライブ132などを備えている。インターフェイス122は、スキャナ200に接続されている。外部記憶装置110には、名刺データベース300等の他に、OCRソフト、名刺データ管理プログラム、会社データ管理プログラム、イメージ照合プログラム、オペレーティングシステム(OS)などが記憶されている。
【0046】
OCRソフトは、スキャナ200から入力されるイメージデータに文字認識処理(OCR処理)を施して、テキストデータに変換するためのものである。名刺データ管理プログラムは、名刺データベース300に名刺のイメージデータ、テキストデータの登録処理等を行うためのものである。会社データ管理プログラムは、名刺データベース300に登録されたデータから、会社データベース400に登録されるデータの作成処理等を行うためのものである。イメージ照合プログラムは、スキャナ200から入力されるイメージデータと、会社データベース400または名刺データベース300に登録されているイメージデータとの照合処理を行うためのものである。
【0047】
外部記憶装置110に記憶されている名刺データ管理プログラム等は、CD−ROMドライブ132を介してCD−ROM134等からインストールされたもの、または通信回線を介してダウンロードされたものである。なお、名刺データ管理プログラム等は、それぞれオペレーティングシステムと共同して、上記処理を実行する。
【0048】
2. 処理の内容
以下に、上記システムが実行する「名刺データの登録処理、会社データベース400の作成処理(2.1)」、「マッチング処理による名刺データの登録管理処理(2.2)」について説明する。
【0049】
2.1 名刺データの登録処理、会社データベース400の作成処理
図4に、名刺データベース300に名刺のイメージデータ、テキストデータを登録するときのフローチャートを示す。まず、管理コンピュータ100のCPU120は、図5Aに示す初期画面を表示して、名刺をスキャナ200にセットするようユーザに促す(図4ステップS10)。ユーザにより名刺が設定されると、スキャナ200はその名刺を読み込み、イメージデータを管理コンピュータ100に与える(図4ステップS12)。
【0050】
CPU120は、イメージデータを受け取ると、これに文字認識処理(OCR処理)を施してテキストデータに変換するとともに、各データの項目を判断する(図4ステップS14)。つまり、OCR処理により得られたテキストデータが、会社名であるか、氏名であるか等の項目を判断する。
【0051】
これは、名刺に記述されている各文字列を、あらかじめ記憶している文字パターンと比較して、最も近似する文字パターンを選択することによりテキストデータに変換する(パターン・マッチング法)。そして、各テキストデータが、所定のキーワード情報を含むか否かを判断することにより、各データの項目を判断する。例えば、キーワード「株式会社」を含むテキストデータは項目「会社名」と判断し、「番地」を含むテキストデータは「住所」と判断し、「TEL」を含むテキストデータは「電話番号」と判断する。例えば、図2a、図2bAに示すイメージデータA1ならば、「ABC株式会社」を会社名と、「東京都○○」を住所と、「03−×××」を電話番号と判断する。
【0052】
また、各データの項目の判断は、キーワード情報だけではなく、名刺に記述されている各文字列の位置情報や文字サイズ情報なども加味して行われる。各文字列の位置情報とは、例えば、横書きの名刺の場合に、会社名は左上、住所や電話番号は左下といった情報のことであり、また、文字サイズ情報とは、会社名と氏名は他の文字に比べて大きいといった情報のことである。
【0053】
次に、CPU120は、図5Bに示す登録画面を表示して、OCR処理により得られたテキストデータの正当性をユーザに問う(図4ステップS16)。この登録画面において、OCR処理により得られたテキストデータとともに、名刺のイメージデータも表示される。
【0054】
ユーザにより正当であると判断されると、図2aに示す名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図4ステップS18、S20)。なお、この実施形態では、各テキストデータに関連付けて、各テキストデータに対応する各イメージデータが記述されている位置についての情報についても登録される。
【0055】
また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図4ステップS22、S24)。この修正データは、図5Bの登録画面における表600の所定欄に直接書き込むことにより入力される。
【0056】
以上の名刺データの登録処理は、複数の名刺についてなされ、複数のイメージデータおよびテキストデータが名刺データベース300に蓄積される。なお、この実施形態では、OCRソフトにより項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」について文字認識され、そのテキストデータが名刺データベース300に登録される。
【0057】
次に、会社データベース400を作成するときの管理コンピュータ100の処理について、図6に示すフローチャートを用いて説明する。CPU120は、名刺データベース300にイメージデータおよびテキストデータが登録されると(図4ステップS20、S24)、名刺データベース300において、項目「会社名、部署名、住所」のテキストデータを抽出する(図6ステップS30)。なお、この抽出処理では、項目「会社名、部署名、住所」が同一の複数のレコードについては1つのテキストデータを抽出する。
【0058】
図2aに示す名刺データベース300では、レコード11、13、15から「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」を、レコード12、14から「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」を、レコード16から「会社名:DEF株式会社、部署名:開発部、住所:東京都○○」を抽出する。
【0059】
次に、CPU120は、これらの各抽出データが、すでに会社データベース400に登録されているか否かを判断し、未だ登録されていない抽出データを図3に示す会社データベース400に登録する(図6ステップS32、S34、S36)。このとき、抽出データに関連するイメージデータであって、項目「会社名、部署名、住所」の部分のイメージデータを、抽出データに関連付けて図3に示す会社データベース400に登録する。例えば、「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」の抽出データについて、これに関連するイメージデータA1(またはA2、A3)の項目「会社名、部署名、住所」の部分のイメージデータXが、会社データベース400に登録される。また、会社データベース400と名刺データベース300の各レコード間の対応関係を示す情報を、図3に示す会社データベース400に記録する。
【0060】
なお、新たな名刺データが名刺データベース300に登録された場合には、管理コンピュータ100は、その新規データについて上記と同様の処理を実行する。この場合、図6ステップS32において、すでに会社データベース400に登録されていると判断された場合には、新規データは会社データベース400に登録されない。
【0061】
2.2 マッチング処理による名刺データの登録管理処理
図7に、マッチング処理により名刺データの登録を管理するときのフローチャートを示す。まず、管理コンピュータ100のCPU120は、図8Aに示す初期画面を表示して、名刺をスキャナ200にセットするようユーザに促す(図7ステップS50)。ユーザにより図10Aに示す名刺が設定されると、スキャナ200はその名刺を読み込み、イメージデータ(以下、これをカレントイメージデータとする)を管理コンピュータ100に与える(図7ステップS52)。
【0062】
CPU120は、カレントイメージデータを受け取ると、会社データベース400に登録されている各イメージデータX、Y、Zと、カレントイメージデータとの照合処理を行う(図7ステップS54)。なお、会社データベース400に登録されているのは項目「会社名、部署名、住所」の部分のイメージデータであるため、この部分のイメージデータについて合致するか否かが判断される。
【0063】
この照合処理では、会社データベース400に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行う。このイメージデータの比較は、例えば、「パタン分析と機械知能に関するIEE会報(IEEE Transaction on Pattern Analysis and Machine Intelligence):Vol.15 No.9(9月1993)の855〜863頁」に記載の「ハウスドルフディスタンスを用いたイメージの比較(Comparing Images Using the Hausdorff Distance)」方式に基づいて行われる。なお、この照合処理中に、ディスプレイ126において、図8Bに示すように、カレントイメージデータ620とともに、会社データベース400に登録されているイメージデータを次々に検索欄640に表示する。
【0064】
ここで、図10Aのカレントイメージデータは、図3、図2bBに示すイメージデータXと項目「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」の部分において同一であるため、イメージデータXと合致すると判断される(図7ステップS56)。
【0065】
次に、CPU120は、イメージデータXに対応する名刺データベース300に登録されている各イメージデータA1、A2、A3を抽出し、各イメージデータA1、A2、A3(図2a)とカレントイメージデータ(図10A)との照合処理を行う(図7ステップS58、S60)。この場合も、名刺データベース300に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行う。
【0066】
この照合処理では、名刺全体のうち、図7ステップS54にて照合された項目以外の部分のイメージデータについて合致するか否かが判断される。つまり、図7ステップS54の照合処理では、項目「会社名、部署名、住所」の部分について判断され、図7ステップS60の照合処理では、その他の項目「氏名、役職、電話番号、メールアドレス」の部分について判断されることとなる。なお、この照合処理中に、ディスプレイ126において、図9Aに示すように、カレントイメージデータ660とともに、名刺データベース300に登録されているイメージデータを次々に検索欄680に表示する。
【0067】
ここで、図10Aのカレントイメージデータは、イメージデータA2と項目「氏名:伊藤○○、役職:課長、電話番号:03−○×○、メールアドレス:bbb@eee」の部分においても同一であるため、イメージデータA2と合致すると判断される(図7ステップS62)。
【0068】
次に、CPU120は、イメージデータA2に関連するテキストデータ「氏名:伊藤○○、会社名:ABC株式会社、部署名:企画部、住所:東京都○○、役職:課長、電話番号:03−○×○、メールアドレス:bbb@eee」を抽出して、図9Bに示す抽出結果画面を表示する(図7ステップS64、S66)。この抽出結果画面において、スキャンされた名刺データは、すでに名刺データベース300に登録されている旨を伝える。
【0069】
なお、図7ステップS54の照合処理において、スキャンされた名刺のイメージデータに合致するものが会社データベース400に存在しない場合には、図11に示すOCRによる登録処理(1)を実行する(図7ステップS68)。この処理では、スキャンされた名刺のイメージデータにOCR処理を施してテキストデータに変換し、図13Aに示す登録画面を表示する(図11ステップS70、S72)。この画面において、スキャンされた名刺データが名刺データベース300に未登録である旨を伝えるとともに、OCR処理により得られたテキストデータの正当性をユーザに問う。
【0070】
ユーザにより正当であると判断されると、名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図11ステップS74、S76)。また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図11ステップS78、S80)。
【0071】
また、図7ステップS60の照合処理において、スキャンされた名刺のイメージデータに合致するものが名刺データベース300に存在しない場合には、図12に示すOCRによる登録処理(2)を実行する(図7ステップS69)。この処理では、少なくとも、項目「会社名、部署名、住所」の部分のイメージデータに合致するものが会社データベース400に存在しているので、会社データベース400の項目「会社名、部署名、住所」のテキストデータを利用し、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行する。
【0072】
例えば、図10Bに示す名刺がスキャンされた場合に、会社データベース400のイメージデータYと項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」の部分において合致するが(図7ステップS54、S56)、名刺データベース300のイメージデータB1、B2とは、項目「氏名、役職、電話番号、メールアドレス」の部分において異なるため、イメージデータB1、B2のいずれにも合致しないと判断される(図7ステップS58、S60、S62)。この場合、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行するとともに(図12ステップS90)、イメージデータYに関連する項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」のテキストデータを会社データベース400から抽出して、図13Bに示す登録画面を表示する(図12ステップS92、S94)。
【0073】
この登録画面において、スキャンされた名刺データが名刺データベース300に未登録である旨を伝えるとともに、OCR処理により得られたテキストデータの正当性をユーザに問う(図12ステップS94)。なお、図13Bに示す登録画面では、OCR処理により得られたテキストデータと、会社データベース400から抽出したテキストデータが区別できるように表示する(例えば、太枠で囲んだり、太字で表示する)。
【0074】
ユーザにより正当であると判断されると、名刺データベース300に、テキストデータおよびイメージデータを相互に関連付けて登録する(図12ステップS96、S98)。また、ユーザにより正当でないと判断されると、OCR処理により得られたテキストデータに代えて、ユーザにより入力された修正データをイメージデータに関連付けて登録する(図12ステップS100、S102)。
【0075】
以上のように、スキャンされた名刺のイメージデータに合致したイメージデータに関連付けられたテキストデータを、名刺データベース300(または会社データベース400)から抽出することにより、OCR処理を実行せずに、当該名刺のテキストデータを得ることができる。つまり、信頼性の低いOCR処理により得られたテキストデータではなく、あらかじめ記憶する信頼性の高いテキストデータを利用することができる。
【0076】
3. 他の実施例
なお、上述の実施形態では、図7ステップS54、S60の照合処理において、会社データベース400(または名刺データベース300)に登録されている位置情報に基づき各項目のイメージデータが記述されている位置を判断し、各項目ごとにイメージデータの比較を行っている。これは、同一の名刺は、氏名、会社名等の各項目の情報が、同一の項目ならば同じ位置に記述されていることを前提としている。しかしながら、同一の項目が同じ位置に記述されていない場合でも、イメージデータを比較することは可能である。例えば、図14に示すカレントイメージデータに対してOCR処理を施し、得られたテキストデータから上述のキーワード情報により各項目「会社名、部署名、住所」を判断する。そして、カレントイメージデータにおける各項目のイメージデータと、会社データベース400に登録されている各項目のイメージデータとの比較を行う。
【0077】
また、上述の実施形態では、図7ステップS60の照合処理において、項目「氏名、役職、電話番号、メールアドレス」の部分のイメージデータについて合致するか否かを判断している。しかしながら、名刺全体(すべての項目)のイメージデータについて合致するか否かを判断してもよい。
【0078】
また、上述の実施形態では、図12に示すOCRによる登録処理(2)において、項目「氏名、役職、電話番号、メールアドレス」の部分についてOCR処理を実行している(図12ステップS90)。これは、図7ステップS54の照合処理において、項目「会社名、部署名、住所」の部分は合致すると判断されたためである。しかしながら、図7ステップS60の照合処理において合致しないと判断された項目についてのみOCR処理を実行してもよい。例えば、氏名のみ異なる名刺がスキャンされた場合には、図7ステップS60の照合処理において、項目「氏名」のみ合致しないと判断され、図12に示すOCRによる登録処理(2)において、項目「氏名」の部分についてOCR処理を実行する(図12ステップS90)。この場合、その他の項目のテキストデータを名刺データベース300から抽出して、これをOCR処理により得られた「氏名」のテキストデータとともに登録画面(図示せず)に表示する(図12ステップS92、S94)。これにより、名刺に記録された情報が一部だけ異なる場合や、一部変更された場合に(例えば、部署の異動、電話番号の変更など)、簡単に名刺データベース300の登録内容を更新することができる。
【0079】
また、上述の実施形態では、図7ステップS60の照合処理において合致しないと判断した場合に、図12に示すOCRによる登録処理(2)を実行している。しかしながら、この処理の代わりに、またはこの処理の前に、名刺データベース300から項目「会社名、部署名、住所」が一致するテキストデータを抽出して、一覧表示してもよい。例えば、図10Bに示す名刺がスキャンされた場合に、名刺データベース300から、項目「会社名:ABC株式会社、部署名:営業部、住所:大阪府○○」が一致するテキストデータ抽出して一覧表示700、720する(図15参照)。これにより、本質的でない部分において照合処理に失敗した場合に、ユーザは、図15に示す一覧表示から、スキャンした名刺のデータがすでに登録されていることを確認することができる場合がある。
【0080】
また、上述の実施形態では、名刺データベース300と会社データベース400の両者を備えているが、会社データベース400を備えていなくてもよい。この場合、図7ステップS54の照合処理は実行しないで、スキャンされた名刺のイメージデータと、名刺データベース300に登録されているイメージデータを照合してもよい(図7ステップS60)。つまり、項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のすべての部分において照合する。また、名刺データベース300に登録されているイメージデータを用いて、図7ステップS54の照合処理を実行してもよい。つまり、項目「会社名、部署名、住所」のの部分について照合する。
【0081】
また、上述の実施形態では、名刺データベース300と会社データベース400の両者を備えているが、名刺データベース300を備えていなくてもよい。この場合、図7ステップS58、S60、S62、S64の処理を実行せず、会社データベース400に登録されているイメージデータと合致した場合に(項目「会社名、部署名、住所」の部分にて合致した場合)、会社データベース400に登録されているテキストデータをユーザに提示してもよい。
【0082】
また、上述の実施形態において、図9Bに示す抽出結果画面をユーザに提示して(図7ステップS66)、スキャンされた名刺データは、すでに名刺データベース300に登録されている旨を伝えている。この際に、抽出結果が正当であるか否かをユーザに問い、修正データを入力可能にしてもよい。
【0083】
また、上述の実施形態では、管理コンピュータ100に接続されているスキャナ200にて読み込まれた名刺のイメージデータを、管理コンピュータ100が受け取る場合を一例として説明している。しかしながら、管理コンピュータ100と通信回線(インターネット、イントラネット)を介して接続された端末コンピュータから、管理コンピュータ100がイメージデータを受け取る場合にもこの発明を適用することができる。例えば、図16に示すように、管理コンピュータ100とインターネットを介して接続された複数の端末コンピュータ800、820、840に、それぞれスキャナ810、830、850を備え、各スキャナ810、830、850で読み込まれた名刺のイメージデータが、管理コンピュータ100に送信される。名刺データベース300、会社データベース400を備えた管理コンピュータ100は、上記2.2に示すマッチング処理を実行することにより、名刺データの登録管理処理を実行する。
【0084】
また、図16に示すように、管理コンピュータ100が、名刺データベース300等にて複数の利用者の名刺データを一括管理することにより、1人の利用者が修正を加えれば、名刺データベース300の登録内容が更新されるため、他の利用者は、早期に最新のデータを利用することができる。また、1人の利用者が名刺データの登録処理を行えば、他の利用者はその登録データを利用することができ、OCR処理を実行することなく、名刺データの管理を行うことができる。なお、図16に示すインターネットを利用する場合に限らず、イントラネットを利用する場合や図1に示すスタンドアロンでも、複数の利用者の名刺データを管理することができる。また、図16に示すシステムにおいて、端末コンピュータから管理コンピュータ100に対して名刺のテキストデータを送信することにより、名刺データベース300に登録されている当該名刺のテキストデータを更新してもよい。
【0085】
また、図16に示すシステムにおいて、名刺データベース300等にて利用者自身の名刺データを記憶して、管理コンピュータ100が一括管理している場合には、次のように利用することもできる。各利用者は、自分自身の名刺データに変更が生じた場合に、最新の自己の名刺のイメージデータを、各自の端末コンピュータから管理コンピュータ100に送信し、名刺データベース300等における自己の名刺データの登録内容を更新する。これにより、他の複数の利用者に対して個別に通知しなくても、他の利用者は、名刺データベース300等にて更新された名刺データを閲覧することにより、それを利用することができる。
【0086】
また、上記の場合において、管理コンピュータ100は、名刺データの変更が生じたときに、他の利用者の端末コンピュータに変更した旨を通知してもよい。これにより、他の利用者は、端末コンピュータから管理コンピュータ100に対して更新された名刺データを要求することにより、それを早期に取得することができる。
【0087】
また、上述の実施形態では、名刺データベース300に、名刺に記録された情報をテキストデータとして登録しているが、名刺に記録された情報以外の情報(例えば、年齢や性別等)を登録しておいてもよい。また、会社データベース400に、名刺に記録された情報以外の情報(例えば、資本金、売上高等)を登録しておいてもよい。
【0088】
また、上述の実施形態において、名刺のテキストデータ等が名刺データベース300に登録される度に(図4ステップS20、S24)、管理コンピュータ100が、自動的に、名刺データベース300において項目「会社名、部署名、住所」が同一のテキストデータを抽出し、会社データベース400を更新している(図6ステップS30〜S36)。しかしながら、管理コンピュータ100は、ユーザから会社データベース400の更新指令を受けて、図6ステップS30〜S36の処理を実行してもよい。
【0089】
また、上述の実施形態における名刺データの登録処理(図4)において、OCR処理を実行して得られたテキストデータを、名刺データベース300に登録している。しかしながら、ユーザが、手作業により名刺に記録された情報をコンピュータに入力して、名刺データベース300に登録してもよい。
【0090】
また、上述の実施形態では、名刺データベース300のレコード16のように、他に項目「会社名、部署名、住所」が同一のレコードが存在しない場合でも、会社データベース400に登録している。しかしながら、所定項目が同一の2以上のレコードが存在しない場合には、会社データベース400に登録しなくてもよい。
【0091】
また、上述の実施形態における会社データベース400の作成処理における項目「会社名、部署名、住所」のテキストデータの抽出処理では、項目「会社名、部署名、住所」が同一の複数のレコードについては1つのテキストデータを抽出して、会社データベース400に登録している(図6ステップS30、S32、S34)。このように、会社データベース400における1つのレコードが、名刺データベース300の複数のレコードに対応する場合には、その数を会社データベース400の当該レコードに記録しておくとよい。例えば、上述の実施形態における会社データベース400のレコード21「会社名:ABC株式会社、部署名:企画部、住所:東京都○○」は、名刺データベース300のレコード11、13、15に対応するため、その数「3」を会社データベース400のレコード21に記録する。これにより、利用者が会社データベース400の登録情報を閲覧することにより、各会社の各部署について、どれだけ名刺データが登録されているか知ることができる。
【0092】
また、上述の実施形態では、会社データベース400には、項目「会社名、部署名、住所」のテキストデータが登録されているが、これらの項目に限られるものではない。また、名刺データベースには、項目「氏名、会社名、部署名、住所、役職、電話番号、メールアドレス」のテキストデータが登録されているが、これらの項目に限られるものではない。
【0093】
また、上述の実施形態では、名刺データベース300および会社データベース400において、テキストデータおよびイメージデータを同一のテーブルにて相互に関連付けて登録管理する場合を一例として説明している。しかしながら、テキストデータを記憶するテーブルとイメージデータを記憶するテーブルを別個に設けて、登録管理してもよい。この場合、テキストデータとイメージデータを関連付ける情報を記録する。
【0094】
また、上述の実施形態では、管理コンピュータ100にOCRソフトを格納して、管理コンピュータ100が文字認識処理を実行しているが(図4ステップS14)、光学文字読み取り装置(OCR装置)を別個に設けて、その装置が文字認識処理を実行してもよい。また、上述の実施形態では、管理コンピュータ100が、上述の会社データベース400の作成処理(図6)およびマッチング処理による登録管理処理(図7)を実行しているが、別個のコンピュータによって、それぞれの処理を実行してもよい。
【0095】
また、上述の実施形態では、名刺データを管理するシステムを一例として説明しているが、これに限られるものではなく、帳票や運転免許証、会員カード等に記録された情報を管理する場合にもこの発明を適用することができる。
【図面の簡単な説明】
【図1】一実施形態における名刺データ管理システムの構成を示す図である。
【図2a】名刺データベース300を示す図である。
【図2b】名刺データベース300、会社データベース400におけるイメージデータを示す図である。
【図3】会社データベース400を示す図である。
【図4】名刺データの登録処理を示すフローチャートである。
【図5】名刺データの登録処理におけるディスプレイ画面を示す図である。
【図6】会社データベース400の作成処理を示すフローチャートである。
【図7】マッチング処理による名刺データの登録管理処理を示すフローチャートである。
【図8】名刺データの登録管理処理におけるディスプレイ画面を示す図である。
【図9】名刺データの登録管理処理におけるディスプレイ画面を示す図である。
【図10】スキャンされる名刺(そのイメージデータ)を示す図である。
【図11】名刺データの登録管理処理におけるOCRによる登録処理(1)を示すフローチャートである。
【図12】名刺データの登録管理処理におけるOCRによる登録処理(2)を示すフローチャートである。
【図13】OCRによる登録処理における登録画面を示す図である。
【図14】他の実施例におけるイメージデータの比較方法を説明するための図である。
【図15】他の実施例における登録画面を示す図である。
【図16】他の実施例において、インターネットを利用した名刺データ管理システムの構成を示す図である。
【符号の説明】
100・・・・管理コンピュータ
110・・・・外部記憶装置
200・・・・スキャナ
300・・・・名刺データベース
400・・・・会社データベース
800、820、840・・・・端末コンピュータ
810、830、850・・・・スキャナ
Claims (22)
- 与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するための情報管理システムであって、
管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、
新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段と、
を備えたことを特徴とする情報管理システム。 - 管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを備えたコンピュータに、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得させるためのプログラムであって、
コンピュータを、新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段、
として機能させるためのプログラム。 - 請求項2のプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項1ないし請求項3のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記管理テーブルから抽出した前記イメージ対応テキスト情報をユーザに対して提示することを特徴とするもの。 - 請求項1ないし請求項4のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在する場合に、当該管理イメージ情報に関連付けられた前記イメージ対応テキスト情報をユーザに対して提示し、
前記情報抽出手段は、前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示することを特徴とするもの。 - 請求項1ないし請求項5のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記処理対象イメージ情報は、複数の項目についての複数の項目処理対象イメージ情報を含み、
前記管理テーブルは、複数の項目についての複数の項目管理イメージ情報を前記管理イメージ情報として記憶し、複数の項目管理イメージ情報に対するテキスト変換処理に基づいて得られた複数の項目イメージ対応テキスト情報を前記イメージ対応テキスト情報として記憶し、
前記情報抽出手段は、項目処理対象イメージ情報に類似する項目管理イメージ情報が前記管理テーブルに存在する場合に、当該項目管理イメージ情報に関連付けられた項目イメージ対応テキスト情報をユーザに対して提示することを特徴とするもの。 - 請求項6の情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記項目処理対象イメージ情報に類似する前記項目管理イメージ情報が前記管理テーブルに存在しない場合に、当該項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報をユーザに対して提示して、必要な確認または修正を促すことを特徴とするもの。 - 請求項5ないし請求項7のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記イメージ対応テキスト情報および前記処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報を、いずれの情報であるかを識別可能なようにユーザに提示することを特徴とするもの。 - 請求項6ないし請求項8のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記管理対象物における前記項目管理イメージ情報の記録位置情報を用いて特定される前記項目処理対象イメージ情報と、当該項目管理イメージ情報との比較処理により、その類似度を判断することを特徴とするもの。 - 請求項6ないし請求項8のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、前記項目処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報から項目を判断し、同種の項目における前記項目処理対象イメージ情報と前記項目管理イメージ情報との比較処理により、その類似度を判断することを特徴とするもの。 - 請求項6ないし請求項10のいずれかの情報管理システム、プログラムまたは記録媒体において、
複数の前記管理イメージ情報についての前記項目管理イメージ情報から、所定の項目について同一の前記項目管理イメージ情報を統合した統合管理イメージ情報を、統合テーブルに記憶する情報統合手段を備えることを特徴とするもの。 - 請求項11の情報管理システム、プログラムまたは記録媒体において、
前記情報統合手段は、複数の前記イメージ対応テキスト情報についての前記項目イメージ対応テキスト情報から、所定の項目について同一の前記項目イメージ対応テキスト情報を統合した統合イメージ対応テキスト情報を、前記統合テーブルに記憶することを特徴とするもの。 - 請求項12の情報管理システム、プログラムまたは記録媒体において、
前記情報抽出手段は、所定の項目において前記項目処理対象イメージ情報に類似する前記統合管理イメージ情報が前記統合テーブルに存在する場合に、当該統合管理イメージ情報に関連する前記項目管理イメージ情報と前記項目処理対象イメージ情報との類似度を判断することを特徴とするもの。 - 請求項1ないし請求項13のいずれかの情報管理システム、プログラムまたは記録媒体において、
前記処理対象イメージ情報に類似する前記管理イメージ情報が前記管理テーブルに存在しない場合に、
前記処理対象イメージ情報、および当該処理対象イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された当該処理対象イメージ情報に関するテキスト情報の少なくとも一部を、前記管理テーブルに記憶することを特徴とするもの。 - 与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するための情報管理装置と、
前記情報管理装置と通信可能な1または複数の端末装置と、
を備えた情報管理システムであって、
管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、
前記端末装置から送信されて新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段と、
当該抽出したイメージ対応テキスト情報を前記端末装置に送信する情報送信手段と、
を備えたことを特徴とする情報管理システム。 - 1または複数の端末装置と通信可能であり、与えられたイメージ情報にテキスト変換処理を施して、当該イメージ情報に対応するテキスト情報を取得するための情報管理装置であって、
管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶する管理テーブルを記憶する情報記憶手段と、
前記端末装置から送信されて新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、前記管理テーブルからイメージ対応テキスト情報を抽出する情報抽出手段と、
当該抽出したイメージ対応テキスト情報を前記端末装置に送信する情報送信手段と、
を備えたことを特徴とする情報管理装置。 - 請求項15または請求項16の情報管理システムまたは情報管理装置において、
前記端末装置は、前記イメージ対応テキスト情報または前記管理イメージ情報の変更情報を前記情報管理装置に送信し、
前記情報管理装置は、当該変更情報に基づいて、前記情報記憶手段に記憶されている前記イメージ対応テキスト情報または前記管理イメージ情報を変更することを特徴とするもの。 - 管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報とを、関連付けて記憶するコンピュータを用いて、
新たに与えられた処理対象イメージ情報と管理イメージ情報との類似度に基づいて、イメージ対応テキスト情報を抽出すること、
を特徴とする情報管理方法。 - 管理対象物の少なくとも一部のイメージ情報である管理イメージ情報と、
当該管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報と、
管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報を統合した統合管理イメージ情報と、
を記憶するコンピュータを用いて、
新たに与えられた処理対象イメージ情報と統合管理イメージ情報とを照合する第一照合処理と、
前記第一照合処理において合致した場合には、管理イメージ情報のうち前記統合管理イメージ情報以外の情報を少なくとも含む情報と処理対象イメージ情報とを照合する第二照合処理と、
前記第二照合処理において合致した場合には、イメージ対応テキスト情報を抽出する処理と、
を実行することを特徴とする情報管理方法。 - 管理対象物の少なくとも一部のイメージ情報である管理イメージ情報を記憶するためのイメージ情報記憶領域と、
前記管理イメージ情報に対するテキスト変換処理により得られたテキスト情報またはユーザにより設定された前記管理対象物に関するテキスト情報の少なくとも一部であるイメージ対応テキスト情報であって、前記管理イメージ情報に関連付けられたイメージ対応テキスト情報を記憶するためのテキスト情報記憶領域と、
を備えたことを特徴とする情報管理データ。 - 管理対象物の少なくとも一部のイメージ情報である管理イメージ情報に含まれる複数の項目についての複数の項目管理イメージ情報であって、複数の管理イメージ情報についての項目管理イメージ情報から、所定の項目について同一の項目管理イメージ情報が統合された統合管理イメージ情報を記憶するための統合管理イメージ情報記憶領域と、
前記管理イメージ情報に対するテキスト変換処理に基づいて得られたテキスト情報の少なくとも一部であるイメージ対応テキスト情報に含まれる複数の項目についての複数の項目イメージ対応テキスト情報であって、複数のイメージ対応テキスト情報についての項目イメージ対応テキスト情報から、所定の項目について同一の項目イメージ対応テキスト情報が統合された統合イメージ対応テキスト情報を記憶するための統合イメージ対応テキスト情報記憶領域と、
を備えたことを特徴とする情報管理データ。 - 請求項20または請求項21の情報管理データを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002170210A JP2004013813A (ja) | 2002-06-11 | 2002-06-11 | 情報管理システムおよび情報管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002170210A JP2004013813A (ja) | 2002-06-11 | 2002-06-11 | 情報管理システムおよび情報管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004013813A true JP2004013813A (ja) | 2004-01-15 |
Family
ID=30436547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002170210A Pending JP2004013813A (ja) | 2002-06-11 | 2002-06-11 | 情報管理システムおよび情報管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004013813A (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006099591A (ja) * | 2004-09-30 | 2006-04-13 | Asahi Kasei Homes Kk | 住宅ローン債権の証券化情報提供システム |
JP2006201885A (ja) * | 2005-01-18 | 2006-08-03 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP2006209353A (ja) * | 2005-01-26 | 2006-08-10 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP2008135927A (ja) * | 2006-11-28 | 2008-06-12 | Konica Minolta Business Technologies Inc | 文書データ作成装置及び文書データ作成方法並びに制御プログラム |
JP2010205305A (ja) * | 2010-06-21 | 2010-09-16 | Asahi Kasei Homes Co | 住宅ローン債権の情報提供方法及びそれを備えた住宅ローン債権の情報提供システム |
JP2014521134A (ja) * | 2011-07-05 | 2014-08-25 | 上海合合信息科技発展有限公司 | 追加を希望する名刺が連絡先リストに存在しているか否かを判断する方法 |
JP2016099830A (ja) * | 2014-11-21 | 2016-05-30 | 三菱電機ビルテクノサービス株式会社 | 文字情報読取装置及びプログラム |
JP2017117214A (ja) * | 2015-12-24 | 2017-06-29 | 京セラドキュメントソリューションズ株式会社 | データ管理システム |
JPWO2019111962A1 (ja) * | 2017-12-07 | 2019-12-12 | 株式会社オリィ研究所 | 名刺管理システム及び名刺入れ |
JP2022097587A (ja) * | 2017-11-02 | 2022-06-30 | キヤノン株式会社 | プログラム、記憶媒体、制御方法、及び画像処理装置 |
JP7367139B2 (ja) | 2021-08-02 | 2023-10-23 | ネイバー コーポレーション | データ検索方法及びシステム |
-
2002
- 2002-06-11 JP JP2002170210A patent/JP2004013813A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006099591A (ja) * | 2004-09-30 | 2006-04-13 | Asahi Kasei Homes Kk | 住宅ローン債権の証券化情報提供システム |
JP2006201885A (ja) * | 2005-01-18 | 2006-08-03 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP2006209353A (ja) * | 2005-01-26 | 2006-08-10 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP4609773B2 (ja) * | 2006-11-28 | 2011-01-12 | コニカミノルタビジネステクノロジーズ株式会社 | 文書データ作成装置及び文書データ作成方法並びに制御プログラム |
US7865490B2 (en) | 2006-11-28 | 2011-01-04 | Konica Minolta Business Technologies, Inc. | Document data creating apparatus, document data creating method and control program of the same |
JP2008135927A (ja) * | 2006-11-28 | 2008-06-12 | Konica Minolta Business Technologies Inc | 文書データ作成装置及び文書データ作成方法並びに制御プログラム |
JP2010205305A (ja) * | 2010-06-21 | 2010-09-16 | Asahi Kasei Homes Co | 住宅ローン債権の情報提供方法及びそれを備えた住宅ローン債権の情報提供システム |
JP2014521134A (ja) * | 2011-07-05 | 2014-08-25 | 上海合合信息科技発展有限公司 | 追加を希望する名刺が連絡先リストに存在しているか否かを判断する方法 |
JP2016099830A (ja) * | 2014-11-21 | 2016-05-30 | 三菱電機ビルテクノサービス株式会社 | 文字情報読取装置及びプログラム |
JP2017117214A (ja) * | 2015-12-24 | 2017-06-29 | 京セラドキュメントソリューションズ株式会社 | データ管理システム |
JP2022097587A (ja) * | 2017-11-02 | 2022-06-30 | キヤノン株式会社 | プログラム、記憶媒体、制御方法、及び画像処理装置 |
JPWO2019111962A1 (ja) * | 2017-12-07 | 2019-12-12 | 株式会社オリィ研究所 | 名刺管理システム及び名刺入れ |
JP7367139B2 (ja) | 2021-08-02 | 2023-10-23 | ネイバー コーポレーション | データ検索方法及びシステム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2957375B2 (ja) | 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法 | |
US8520889B2 (en) | Automated generation of form definitions from hard-copy forms | |
JP5338063B2 (ja) | 画像認識プログラム、画像認識装置および画像認識方法 | |
US7817825B2 (en) | Apparatus, system and method for person verification | |
US20070237427A1 (en) | Method and system for simplified recordkeeping including transcription and voting based verification | |
US8718367B1 (en) | Displaying automatically recognized text in proximity to a source image to assist comparibility | |
JP6743445B2 (ja) | 携帯型情報装置およびプログラム | |
JP2004013813A (ja) | 情報管理システムおよび情報管理方法 | |
WO2004068407A1 (ja) | アプリケーション間のデータ連携支援方法 | |
JP5243054B2 (ja) | データ管理システムおよび方法並びにプログラム | |
JP6870159B1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP5253788B2 (ja) | 画像認識装置、画像認識プログラムおよび画像認識方法 | |
JP5657401B2 (ja) | 文書処理装置、及び文書処理プログラム | |
JPH09282328A (ja) | 文書画像処理装置及びその方法 | |
JP2001320571A (ja) | 帳票筆跡データの処理システム及び処理方法 | |
JPH0934984A (ja) | 文字認識装置 | |
JP2002236677A (ja) | データ提示方法、情報処理システム、コンピュータ読み取り可能な記録媒体、及びプログラム | |
WO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム | |
JP4409408B2 (ja) | 電子申請支援サーバ、電子申請支援方法、および電子申請支援プログラム | |
EP2713285A1 (en) | Information processing apparatus, information processing method, and program | |
JP2932667B2 (ja) | 情報の検索方法および情報蓄積装置 | |
JP2004062351A (ja) | レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法 | |
US12014561B2 (en) | Image reading systems, methods and storage medium for performing geometric extraction | |
JP3421630B2 (ja) | 手書き文字管理装置、手書き文字管理方法、手書き文字照会システムおよび手書き文字照会方法 | |
JPH06208563A (ja) | 情報表示装置及びそれにおける銘柄選択方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060501 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061010 |