JP2005020256A - Image reader and data management device - Google Patents

Image reader and data management device Download PDF

Info

Publication number
JP2005020256A
JP2005020256A JP2003180921A JP2003180921A JP2005020256A JP 2005020256 A JP2005020256 A JP 2005020256A JP 2003180921 A JP2003180921 A JP 2003180921A JP 2003180921 A JP2003180921 A JP 2003180921A JP 2005020256 A JP2005020256 A JP 2005020256A
Authority
JP
Japan
Prior art keywords
keyword
image
image data
data management
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003180921A
Other languages
Japanese (ja)
Other versions
JP2005020256A5 (en
JP4289038B2 (en
Inventor
Takatoshi Mochizuki
孝俊 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2003180921A priority Critical patent/JP4289038B2/en
Publication of JP2005020256A publication Critical patent/JP2005020256A/en
Publication of JP2005020256A5 publication Critical patent/JP2005020256A5/ja
Application granted granted Critical
Publication of JP4289038B2 publication Critical patent/JP4289038B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To unitarily impart a keyword to image data in a step of reading an original. <P>SOLUTION: An MFP (Multi Function Peripheral) that can be connected to the data management device which associates image data with the keyword used for retrieval of the image data to store them is provided with an image read means (S02) reading the original and acquiring image data, a reduced image transmission means (S06) reducing the acquired image data, creating a thumb nail image, and transmitting the thumb nail image to the data management device, a keyword candidate receiving means (S07) receiving a keyword candidate from the data management device, a designation receiving means (S08) displaying the received keyword candidate and receiving designation of the keyword corresponding to image data, and an image data transmitting means (S09) transmitting the designated keyword and acquired image data to the data management device. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
この発明は画像読取装置およびデータ管理装置に関し、特に、原稿を読取って得られる画像データにキーワードを付与してデータ管理装置に送信する画像読取装置および画像データとその画像データの検索に用いられるキーワードとを関連付けて記憶するデータ管理装置に関する。
【0002】
【従来の技術】
従来、複数のデータを一元的に管理するデータ管理装置が知られている。このようなデータ管理装置においては、所望のデータを抽出するために、検索のキーとなる特徴的なキーワードをそのデータに関連付けて記憶することがなされている。このようなキーワードは、データを登録する際または登録した後にユーザが登録するものである。
【0003】
このキーワードの登録を自動で行なう技術が、特開2002−183165号公報(特許文献1)に記載されている。この特許文献1では、複写機能、ファクシミリ機能、画像データ読取機能の少なくとも1つの機能と、文書を格納するファイルシステムと物理的に接続され、読取った文書をファイルシステムに送信する機能とを備えたデジタル複写機において、文書の複写実行時、ファクシミリ送信のための画像読取実行時、または画像読取実行時のいずれかの場合に、読取られた各頁の画像から文字を抽出する文字抽出機能と、抽出された文字を解析し、キーワードを抽出するキーワード抽出機能と、抽出されたキーワードを表示するキーワード表示機能と、表示されたキーワードからユーザがキーワードを選択できるキーワード選択機能とを備え、選択されたキーワードを読取られた文書の付加情報として文書を通信機能によってファイルシステムに送信するデジタル複合機が記載されている。
【0004】
【特許文献1】
特開2002−183165号公報
【0005】
【発明が解決しようとする課題】
しかしながら、特許文献1の記載のデジタル複合機では、デジタル複合機自体がキーワードを抽出して付与するため、文書を記憶するファイルシステムに複数のデジタル複合機が接続される場合などは、それら複数のデジタル複合機で同じアルゴリズムでキーワードが付与されるようにしなければならない。また、キーワード付与のアルゴリズムに変更があった場合などは、すべてのデジタル複合機に変更を加えなければならない。そのようにしなければ、付与されるキーワードに整合性がとれないために、キーワードを用いて所望の文書を検索することができなくなってしまう。
【0006】
この発明は上述の問題点を解決するためになされたもので、この発明の目的の1つは、原稿を読取る段階でキーワードを一元的に付与することが可能な画像読取装置を提供することである。
【0007】
この発明の他の目的は、画像読取装置で原稿を読取る段階でキーワードを一元的に付与することが可能なデータ管理装置を提供することである。
【0008】
【課題を解決するための手段】
上述した目的を達成するためにこの発明のある局面によれば、画像読取装置は、画像データとその画像データの検索に用いられるキーワードとを関連付けて記憶するデータ管理装置に接続可能な画像読取装置であって、原稿を読取って画像データを取得する画像読取手段と、取得された画像データを縮小する縮小画像生成手段と、縮小された画像データをデータ管理装置に送信する縮小画像送信手段と、データ管理装置からキーワード候補を受信するキーワード候補受信手段と、受信したキーワード候補を表示して画像データに対応するキーワードの指定を受付ける指定受付手段と、指定されたキーワードと画像読取手段により取得された画像データとをデータ管理装置に送信する画像データ送信手段とを備える。
【0009】
この発明に従えば、原稿を読取って画像データが取得されて、取得された画像データが縮小されてデータ管理装置に送信されると、データ管理装置からキーワード候補が受信される。そして、受信されたキーワード候補が表示されて画像データに対応するキーワードの指定が受付けられると、指定されたキーワードと画像データとがデータ管理装置に送信される。このため、データ管理装置からキーワード候補が受信されるので、キーワード候補が一元的に抽出される。また、読取った画像データとキーワードとを関連付けてデータ管理装置に送信するので、原稿を読取る段階でキーワードが付与される。その結果、原稿を読取る段階でキーワードを一元的に付与することが可能な画像読取装置を提供することができる。
【0010】
好ましくは、縮小された画像データの所定の領域をユーザに指定させるための指定領域受付手段をさらに含み、縮小画像送信手段は、指定された領域の情報をさらに送信する。
【0011】
この発明に従えば、縮小された画像データの所定の領域がユーザにより指定され、指定された領域の情報がさらに送信される。このため、キーワード候補を抽出するための領域が指定されるので、より適切なキーワード候補が受信されるようになる。
【0012】
好ましくは、データ管理装置から受信されるキーワード候補の上限数をユーザに指定させるための上限数入力手段をさらに含み、縮小画像送信手段は、指定された上限数をさらに送信する。
【0013】
この発明に従えば、キーワード候補の上限数がユーザにより指定されると、指定された上限数がさらに送信される。このため、受信されるキーワード候補の数が制限されるので、キーワードを容易に指定することが可能となる。
【0014】
好ましくは、キーワード候補受信手段は、キーワード候補に対応する関連度をさらに受信し、指定受付手段は、キーワード候補に関連付けて関連度を表示する。
【0015】
この発明に従えば、キーワード候補に対応する関連度がさらに受信され、キーワード候補に関連付けて関連度が表示される。このため、キーワードを容易に指定することが可能となる。
【0016】
この発明の他の局面によれば、データ管理装置は、原稿を読取って画像データを取得する画像読取装置と通信可能なデータ管理装置であって、画像読取装置から第1の画像データを受信すると、受信された第1の画像データから画像特徴量を抽出する抽出手段と、抽出された画像特徴量に基づき、第1の画像データに対応するキーワード候補を抽出するキーワード候補抽出手段と、抽出されたキーワード候補を画像読取装置へ送信するキーワード候補送信手段と、第2の画像データとキーワード候補の中から画像読取装置のユーザにより指定されたキーワードとを画像読取装置から受信すると、受信された第2の画像データとキーワードとを関連付けて記憶する記憶手段とを備える。
【0017】
この発明に従えば、画像読取装置から第1の画像データが受信されると、第1の画像データから画像特徴量が抽出され、抽出された画像特徴量に基づき、第1の画像データに対応するキーワード候補が抽出され、キーワード候補が画像読取装置に送信される。そして、第2の画像データとキーワード候補の中から画像読取装置のユーザにより指定されたキーワードとが受信されると、第2の画像データと指定されたキーワードとが関連付けて記憶される。このため、キーワード候補がデータ管理装置で一元的に抽出される。また、第1の画像データを縮小された画像データとすれば、受信するデータ量が少なくなる。さらに、第2の画像データに一元的に抽出されたキーワード候補の中からユーザにより指定されたキーワードが関連付けて記憶されるので、画像読取装置で原稿を読取る段階で一元的にキーワードを付与することが可能なデータ管理装置を提供することができる。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。以下の説明では同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
【0019】
図1は、本発明の実施の形態の1つにおける文書管理システムの全体概要を示す図である。図1を参照して、文書管理システム100は、ネットワーク3にそれぞれ接続された複合機1(以下、「MFP1」という)と、データ管理装置2とを含む。
【0020】
MFP(Multi Function Peripheral)1は、原稿を読取るためのスキャナ、画像データに基づいて紙などの記録媒体に画像を形成するための画像形成装置、ファクシミリを含み、画像読取機能、複写機能、ファクシミリ送受信機能を備えている。なお、本実施の形態においてはMFP1を例に説明するが、MFPに代えて、少なくとも画像を読取る機能を有するスキャナであればよい。
【0021】
MFP1には、着脱可能な読出専用メモリ(ROM)4が装着される。このROM4には、後述するようにMFP1の中央演算装置で実行されるプログラムが記憶されており、このROM4を交換することにより、プログラムを変更することができる。またデータ管理装置2には、CD−ROM(Compact Disc Read Only Memory)5が装着される。
【0022】
ネットワーク3としては、ローカルエリアネットワーク(LAN)、インターネットまたは一般公衆回線等を用いることができ、有線または無線を問わない。
【0023】
図2は、本実施の形態におけるデータ管理装置2のハード構成を示すブロック図である。図2を参照して、データ管理装置2は、それぞれバス150に接続されたCPU(Central Processing Unit)131と、オペレーティングシステムのブートアッププログラムなどを記録したROM(Read Only Memory)132と、実行されるプログラムをロードするための、およびプログラム実行中のデータを記憶するためのRAM(Random Access Memory)133と、文書データベースを不揮発的に記憶するためのハードディスク134と、データ管理装置2をネットワーク3に接続するための通信インターフェース(I/F)129と、マウス137、キーボード138、表示部127と、CD−ROMドライブ135とを含む。CD−ROMドライブ135には、CD−ROM5が装着される。
【0024】
このように、データ管理装置2は、一般的なパーソナルコンピュータで構成される。パーソナルコンピュータ自体の動作は周知であるので、ここではその詳細な説明は繰返さない。
【0025】
文書管理プログラムがCPU131で実行されると、ハードディスク134に記録された文書データベースを管理する処理が実行される。一般的にこうした文書管理プログラムは、CD−ROM5などの記録媒体に格納されて流通し、CD−ROMドライブ135などにより記録媒体から読取られてハードディスク134に一旦格納される。さらにハードディスク134からRAM133に読出されてCPU131により実行される。
【0026】
なお、記録媒体としては、CD−ROM5、ハードディスク134に限られず、フレキシブルディスク、カセットテープ、光ディスク(MO(Magnetic Optical Disc/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード(メモリカードを含む)、光カード、マスクROM、EPROM、EEPROM、フラッシュROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。
【0027】
ここでいうプログラムは、CPU131により直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む概念である。
【0028】
図3は、本実施の形態における文書管理システムの機能の概略を示す機能ブロック図である。図3を参照して、MFP1は、MFP1の全体を制御するための制御部208と、原稿を読取るためのスキャナ201と、後述するキーワードを指定するための入力部204と、操作画面等を表示するための表示部203と、スキャナ201で原稿を読取って得られる画像データを縮小した画像(サムネイル画像)を生成するための画像生成部202と、スキャナ201で原稿を読取って得られる画像データを処理して紙などの記録媒体に画像を形成する画像形成部209と、MFP1をデータ管理装置2と接続するための通信インターフェイス(I/F)206とを含む。
【0029】
制御部208は、中央演算装置(CPU)であり、読出専用メモリ(ROM4)およびランダムアクセスメモリ(RAM)を含む。制御部208は、ROM4に記憶されたプログラムをCPUで実行する。またこのROM4は、着脱自在にMFP1に装着されている。なお、制御部208で実行するプログラムは、ROM4に記憶されたプログラムに限られず、制御部208に別に接続されたEEPROM(electrically erasable/programable read only memory)に記憶されたプログラムを読出して実行するようにしてもよい。EEPROMを用いれば、プログラムを書き換えるまたは追加して書き込みすることが可能となる。このため、MFP1をネットワークに接続して、そのネットワークに接続された他のコンピュータが、MPP1のEEPROMに記憶されたプログラムを書き換えたり、新たなプログラムを追加して書き込みをするようにしてもよい。さらに、MFP1が、ネットワークに接続された他のコンピュータからプログラムをダウンロードして、そのプログラムをEEPROMに記憶するようにしてもよい。また、メモリカードなどをMFP1に装着して、メモリカードに記憶されたプログラムを読み込みできるようにしてもよい。
【0030】
スキャナ201は、CCD(Charge Coupled Device)等の光電変換素子を含み、原稿を光学的に読取って画像データとしての電子データを出力する。
【0031】
入力部204は、MFP1のユーザによる操作の入力を受付けるためのタッチパネルまたはキーボード等の入力装置である。表示部203は、液晶表示装置または有機EL(electro−luminescence)ディスプレイパネルである。入力部204に透明な部材からなるタッチパネルを用いる場合には、表示部203上に入力部204を重ねて設置することで、表示部203に表示されたボタンの指示を検出することができる。これにより、種々の操作の入力が可能となる。入力部204と表示部203とを組合せて用いることにより、後述するキーワードの指定情報の入力が容易となる。
【0032】
画像生成部202は、スキャナ201で読取られた画像データからサムネイル画像を生成する。
【0033】
通信I/F206は、MFP1をデータ管理装置2と接続するための通信インターフェイスである。MFP1とデータ管理装置2とは、ネットワーク3を介して接続されるが、シリアルインターフェイスまたはパラレルインターフェイスを用いて直接接続されてもよい。通信I/F206は、MFP1とデータ管理装置2との接続形態に応じたインターフェイスが用いられる。
【0034】
データ管理装置2は、データ管理装置2の全体を制御するためのデータ管理装置制御部211と、データ管理装置2をMFP1と接続するための通信I/F129と、通信I/F129で受信された画像データの特徴量を抽出する画像特徴量抽出部210と、受信された画像データに対応するキーワード候補を生成するためのキーワード候補生成部212と、受信された画像データとキーワードとを関連付けて記憶する記憶部213とを含む。
【0035】
通信I/F129は、データ管理装置2をMFP1とネットワーク3を介して接続するためのインターフェイスであり、通信I/F206と同様の機能を有する。
【0036】
記憶部213は、ハードディスクドライブ等の不揮発性メモリであり、通信I/F129で受信された画像データおよびそれに対応するキーワードを関連付けて記憶するための文書データベース、および、キーワード辞書を記憶する。
【0037】
キーワード辞書は、類似度を用いて2つのキーワードを関連付けたものである。2つのキーワードを類似度で関連付けることにより、あるキーワードに類似するキーワードを抽出することができる。キーワード辞書は、ユーザにより予め登録されている。
【0038】
画像特徴量抽出部210は、画像中に含まれる文字を認識する。そして、認識された文字から、画像中に含まれる単語とその単語の出現回数をカウントする。画像の特徴量は、画像中に含まれる単語と、その単語の出現回数とを含む。
【0039】
キーワード候補生成部212は、画像特徴量抽出部210で算出された特徴量および記憶部213に記憶されているキーワード辞書を用いてキーワード候補を生成する。キーワード候補生成部212は、画像特徴量抽出部210で算出された特徴量を用いて、出現回数が多い順から所定数の単語をキーワードとして設定する。なお、以下の説明では、説明を簡単にするため特徴量から抽出されたキーワードを「抽出キーワード」という。
【0040】
キーワード候補生成部212は、また、記憶部213に記憶されているキーワード辞書を用いて、抽出キーワードに類似するキーワードを抽出する。ここでは説明のため、抽出キーワードに類似するキーワードを類似キーワードと呼び、さらに、抽出キーワードと類似キーワードとを総称してキーワード候補と呼ぶ。キーワード候補生成部212が生成するキーワード候補には、類似キーワードが含まれるが、この類似キーワードは、画像に含まれている必要はない。
【0041】
データ管理装置制御部211は、記憶部213が備える文書データベースを管理する。また、入力されるユーザの操作に基づいて、文書データベースへアクセスして、データの検索、追加、変更、削除等の一般的なデータベースに対する操作を実行する。
【0042】
本実施の形態における文書管理システム100においては、ユーザがMFP1を操作して原稿をスキャナ201で読取る。スキャナ201で原稿を読取って得られた画像データを縮小したサムネイル画像が生成され、データ管理装置2に送信される。データ管理装置2では、受信した画像データに基づきキーワード候補を抽出し、抽出したキーワード候補をMFP1に送信する。MFP1では、キーワード候補を受信して、ユーザからのキーワードの指定が受付けられると、指定されたキーワードを画像データと共にデータ管理装置2に送信する。データ管理装置2では、送信されてきた画像データとキーワードとを関連付けて記憶部213の文書データベースに記憶する。
【0043】
以下、これらの処理について具体的に説明する。図4は、本実施の形態における文書管理システムで実行される処理の流れを示すフローチャートである。図4では、説明のため、MFP1で実行される処理と、データ管理装置2で実行される処理とを別々に示している。図4を参照して、まず、MFP1で画像をスキャンする機能が選択されると、まず、ステップS01において、以下の各処理で必要なフラグ等のイニシャライズを行なう初期設定処理が行なわれる。そして、次のステップS02において、MFP1においてユーザが紙原稿を原稿台や自動原稿送り装置(ADF:Automatic Document Feeder)へ置き、スタートボタンをクリックしたか否かが判断され、スタートボタンのクリックに基づいて、原稿台に載置された原稿をスキャンする(ステップS02)。このスキャン処理においては、スキャナ201において、原稿台に載置された原稿が読取られ、画像データが生成される。そして、生成された画像データからサムネイル画像が生成される。このスキャン処理については後で詳しく説明する。
【0044】
次のステップS03では、ユーザにより登録指示が入力されたか否かが判断される。登録指示とは、スキャンした画像データを、データ管理装置2に送信し、データ管理装置2の記憶部213に記憶されている文書データベースに登録するための指示をいう。この登録指示の入力は、MFP1の入力部204をユーザが操作することにより入力される。より具体的には、MFP1の表示部203に「登録する」の文字が表されたボタンが表示され、ユーザが入力部204を用いてこのボタンを指示すると登録指示があったことが検出される。登録指示があった場合にはステップS04に進み、そうでない場合には読取った画像データを画像形成部209で画像形成する等の処理が実行される。
【0045】
ステップS04では、キーワードの上限数の入力が受付けられる。このキーワードの上限数の入力は、ユーザが入力部204を操作することにより受付けられる。より具体的には、MFP1の表示部203にキーワードの上限数を入力する欄が表示され、ユーザが入力部204を用いてこの欄を選択し、テンキーにより希望の数を入力することにより、上限数が入力される。なお、このキーワード上限数の入力は、任意に選択することができ、ユーザが入力部204を操作して、上限数を入力しないように指示することも可能である。
【0046】
次のステップS05では、範囲指定が受付けられる。範囲指定とは、スキャナ201で読取った画像データのうち、ユーザが所望する領域を指定するものである。この範囲指定の入力は、ユーザが入力部204を操作することにより受付けられる。範囲指定の入力方法は、たとえば、予め定められた複数の領域に分割した図を表示し、所望の領域を指定する。または、対象の画像を表示部230に表示し、矩形の対角となる2点をユーザが指で指示するようにしてもよい。さらに、対角の2点の座標を数字で入力するようにしてもよい。範囲は、矩形以外の形状でもよい。また、ここで指定される範囲指定とは、ユーザがキーワードを抽出するために、必要な領域を指定するものであり、その指定された領域には、たとえば主要な用語等のキーワードとなりうる情報が含まれる。後述するように、データ管理装置においてキーワード候補を抽出する場合に、この指定された範囲の画像データを用いてキーワード候補の抽出が実行されることになる。
【0047】
そして、次のステップS06において、スキャナ201で読取られた画像データを所定のサイズに縮小してサムネイル画像が生成され、その生成されたサムネイル画像がデータ管理装置2へ送信される(ステップS06)。このサムネイル画像の送信時には、ステップS04でキーワード上限数が入力されている場合には、そのキーワード上限数もサムネイルと共に送信される。また、ステップS05において、範囲指定がされている場合には、その指定された範囲がサムネイル画像と共に送信されることになる。
【0048】
一方、データ管理装置2では、サムネイル画像を受信するまで待機状態となる(ステップS11)。サムネイル画像を受信した場合には、ステップS12へ進む。なお、ステップS11では、サムネイル画像と共に、キーワード上限数が送信されてくる場合には、そのキーワード上限数も受信される。また、サムネイル画像と共に、範囲が指定された範囲の情報が受信される場合には、その範囲の情報も共に受信される。
【0049】
ステップS12では、キーワード候補の生成処理が実行される。このキーワード候補の生成処理については後で詳しく説明する。
【0050】
そして次のステップS13においては、ステップS12で生成されたキーワード候補をMFP1に送信する処理が実行される。
【0051】
MFP1では、データ管理装置からキーワード候補を受信するまで待機状態となる(ステップS07)。そしてキーワード候補を受信した場合には、受信したキーワード候補を表示部203に表示するとともに、表示したキーワード候補の中からユーザの指定が受付けられる(ステップS08)。このステップS08の処理については後で詳しく説明する。
【0052】
そして、指定されたキーワードと、ステップS02でスキャンして得られた画像データとをデータ管理装置2へ送信する(ステップS09)。
【0053】
データ管理装置2では、MFP1から送信されてくるキーワードと画像データとを受信するまで待機状態となっており(ステップS14)、キーワードおよび画像データが受信された場合には、次のステップS15において、受信したキーワードと画像データとを記憶部213の文書データベースに登録する(ステップS15)。
【0054】
図5は、図4のステップS02で実行されるスキャン処理の流れを示すフローチャートである。図5を参照して、ステップS21では、スキャン設定が行なわれる。スキャン設定とは、スキャナ201で画像を読取るための各種条件の設定をいう。各種条件の設定には、読取解像度や、原稿種別、フォーマットなどが含まれる。そして、ステップS22において、スキャンボタンがクリックされたことが検出されると、ステップS23において、画像の読取が行なわれる。
【0055】
図6は、図4のステップS06で実行されるサムネイル画像送信処理の流れを示すフローチャートである。図6を参照して、画像生成部202において、スキャナ201で読取られた画像データに基づき、サムネイル画像が生成される(ステップS31)。サムネイル画像は、元の画像データを縮小した画像(縮小画像)および元の画像データの一部分の画像(部分画像)を含む。また、これらを組合わせて、サムネイル画像を、元の画像データの一部分を縮小した画像としてもよい。サムネイル画像を、縮小画像とする場合には、生成されるサムネイル画像のサイズに応じた縮小率で縮小する、または、予め定められた縮小率で縮小するようにすればよい。サムネイル画像を、部分画像とする場合には、サムネイル画像のサイズに併せて元の画像データの一部分のサイズを定めればよい。
【0056】
また、サムネイル画像を生成するのに代えて、元の画像データをたとえばJPEG(Joint Photographic Experts Group)、PNG(Portable Network Graphics)またはGIF(Graphic Interchange Format)等の圧縮方法で圧縮した画像データを生成するようにしてもよい。また、元の画像データの階調数を減少させた画像データを生成するようにしてもよい。さらに、サムネイル画像を圧縮した画像データ、または、階調数を減少させた画像データとしてもよい。以下の説明では、サムネイル画像を生成する場合について説明するが、圧縮した画像データまたは階調数を減少した画像データをサムネイル画像に代えて用いることができる。
【0057】
このように、元の画像データから、サムネイル画像、圧縮した画像データまたは階調数を減少した画像データを生成するのは、後述するようにMFP1からデータ管理装置2へ送信するデータ量を少なくするためである。
【0058】
そして、キーワードの上限数が設定されているか否かが判断される(ステップS32)。キーワードの上限数が設定されている場合にはステップS33へ進み、そうでない場合にはステップS33をスキップしてステップS34へ進む。このキーワード上限数は、図4のステップS04で設定される情報である。また、この設定は任意であるためにキーワードの上限数が設定されない場合もあり得る。ステップS33では、キーワードの上限数を送信するために、例えば上限数送信フラグなどの設定が行なわれる。
【0059】
ステップS34では、範囲指定がされているか否かが判断される。範囲指定がされている場合にはステップS35へ進み、そうでない場合にはステップS35をスキップしてステップS36へ進む。この範囲指定は、上述した図4のステップS05で指定されたものである。また、この範囲指定は、任意に指定されるものであり、範囲指定がされない場合もあり得る。ステップS35では、指定された範囲を送信するために、例えば範囲送信フラグなどの設定が行なわれる。
【0060】
ステップS36では、ステップS31で生成されたサムネイル画像がデータ管理装置2へ送信される。このとき、ステップS33でキーワード上限数を送信するように設定されている場合には、そのキーワード上限数も併せて送信される。なお、キーワード上限数が設定されていない場合には、事前に設定されているデフォルト値を送信するようにしてもよい。また、ステップS35で指定範囲を送信するように設定されている場合には、その指定範囲も併せて送信される。
【0061】
図7は、図4のステップS12で実行されるキーワード候補生成処理の流れを示すフローチャートである。図4において説明したように、データ管理装置2では、MFP1からサムネイル画像を受信している。また、キーワード上限数が設定されている場合には、そのキーワード上限数も併せて受信する。さらに、指定範囲が設定されている場合には、その指定範囲も併せて受信する。
【0062】
キーワード候補生成処理では、まず、指定範囲が設定されているか否かが判断される(ステップS51)。この指定範囲が設定されているか否かの判断は、指定範囲を受信したか否かにより判断される。指定範囲の設定がされている場合には、ステップS53に進み、そうでない場合にはステップS52に進む。ステップS53では、受信したサムネイル画像のうちから指定範囲の画像の特徴量を抽出する(ステップS53)。一方、ステップS52では、指定範囲の設定がされていないので、受信したサムネイル画像全体の特徴量を抽出する。ステップS52では処理対象となる画像が画像全体であり、ステップS53では指定範囲の画像であり、処理対象となる画像の範囲が異なるのみである。
【0063】
次に、ステップS54では、ステップS52またはステップS53で抽出された特徴量および記憶部213に記憶されているキーワード辞書を用いてキーワード候補を抽出する。まず、特徴量を用いて、出現回数が多い順から所定数の単語を抽出キーワードとして設定する。そして、記憶部213に記憶されているキーワード辞書を用いて、抽出キーワードに類似するキーワードを抽出する。
【0064】
なお、類似キーワードの抽出は選択的に実行するようにしてもよいし、キーワード候補を抽出キーワードだけとして類似キーワードを用いないようにしてもよい。類似キーワードを用いない場合には、キーワード辞書は、データ管理装置2に設ける必要はない。
【0065】
そして、ステップS55では、キーワード候補それぞれの関連度が算出される。関連度の算出は、まず、ステップS52またはステップS53で抽出された特徴量から抽出キーワードの関連度が算出される。この抽出キーワードの関連度は、次のようにして算出される。ステップS52で抽出された特徴量を用いて、出現回数が最も多い抽出キーワードに対して、画像との関連度を関連度のとり得る最大値である「1」に設定する。そして出現回数が最も多い抽出キーワード以外の抽出キーワードと画像との関連度は次式で求められる。
【0066】
抽出キーワードと画像との間の関連度=(その抽出キーワードの出現回数)/(出現回数が最も多い抽出キーワードの出現回数) … (1)
なお、抽出キーワードと画像との関連度は、次式により求めてもよい。
【0067】
抽出キーワードと画像との間の関連度=(その抽出キーワードの出現回数)/(画像中の全抽出キーワード数)×α … (2)
なお、αは定数である。
【0068】
また、ステップS54で抽出された類似キーワードの関連度は、ステップS55で算出された抽出キーワードの関連度と、ステップS54で求められた類似度との積とされる。なお、キーワード辞書に設定される類似度は「1」以下の値である。すなわち、類似キーワードの関連度は、次式(3)を用いて算出される。
【0069】
類似キーワードの関連度=(抽出キーワードと画像との関連度)×(抽出キーワードと類似キーワードとの類似度) … (3)
このようにしてキーワード候補すべてについて画像との関連度が算出される。そして、次のステップS56では、キーワード候補が関連度の大きい順に並べ替えられる。
【0070】
次のステップS57では、キーワード上限数が制限されているか否かが判断される。キーワード上限数が制限されているか否かは、キーワード上限数が受信されたか否かにより判断される。キーワード上限数が制限されている場合には、ステップS58に進み、そうでない場合にはステップS58をスキップして処理を終了する。
【0071】
ステップS58では、キーワード候補の数が、キーワード上限数に制限される。この制限は、関連度の大きいキーワード候補が優先される。すなわち、キーワード候補のうちから、関連度が大きい順にキーワード上限数の数だけのキーワード候補が抽出されることになる。抽出されなかったキーワード候補は、キーワード候補から削除される。
【0072】
図8は、図4のステップS08で実行されるキーワード候補表示と選択処理の流れを示すフローチャートである。MFP1では、データ管理装置2から、キーワード候補とそれらの関連度を受信している。MFP1は、受信したキーワード候補を、表示部203に関連度の高い順に表示する(ステップS61)。そして、表示されたキーワード候補のうちから所望のキーワード候補を選択する指示があったか否かが判断される(ステップS62)。この選択指示は、ユーザによる入力部204の操作により入力され、選択されるキーワード候補は、単数であっても複数であってもよい。より具体的には、表示部203に表示されたキーワード候補を、ユーザが指で触れることにより指で触れた位置に表示されているキーワード候補が選択される。また、キーワード候補に連番を付して表示し、ユーザがテンキーから入力した番号に対応するキーワード候補を選択するようにしてもよい。そして、選択指示があったキーワード候補を、キーワードに設定する(ステップS63)。すなわち、キーワードに設定されるキーワード候補が、ユーザが入力部204を用いて選択指示したキーワード候補に制限される。これにより、データ管理装置2で自動的かつ一元的にに抽出したキーワード候補のうちから、ユーザが選択指定するキーワード候補だけをキーワードに設定するようにしたので、ユーザが必要とするキーワードだけを登録することが可能となる。
【0073】
以上説明したように本実施の形態におけるMFP1は、スキャナ201により、原稿を読取って画像データが取得される。そして、取得された画像データが縮小されたサムネイル画像がデータ管理装置2に送信されると、データ管理装置2からキーワード候補が受信される。さらに、受信されたキーワード候補が表示部203に表示されて画像データに対応するキーワードの指定がユーザにより入力部204から受付けられると、指定されたキーワードと画像データとがデータ管理装置2に送信される。このため、MFP1では、データ管理装置2からキーワード候補が受信されるので、キーワード候補はデータ管理装置2で一元的に抽出される。また、MFP1は、読取った画像データとキーワードとを関連付けてデータ管理装置2に送信するので、MFP1で原稿を読取る段階でキーワードが付与される。その結果、原稿を読取る段階でキーワードを一元的に付与することが可能となる。
【0074】
また、ユーザが入力部204から読取った画像データの所定の領域を指定することにより、MFP1は、サムネイル画像とその指定された領域の情報とをデータ管理装置2に送信する。このため、データ管理装置2では、指定された領域の情報が受信されると、受信したサムネイル画像のうちその指定された領域からキーワード候補を抽出するため、ユーザが所望するキーワードが抽出される確率が高くなり、より適切なキーワード候補が表示部203に表示されるようになる。
【0075】
さらに、MFP1は、ユーザにより入力部204からキーワード候補の上限数が指定されると、その指定された上限数をデータ管理装置2へ送信する。データ管理装置2では、キーワード候補の上限数が受信されると、受信したサムネイル画像から抽出したキーワード候補のうち、キーワードの上限数の数だけのキーワード候補をMFP1に送信する。このため、MFP1では、表示部203に表示されるキーワード候補の数が制限されるので、ユーザは表示されたキーワード候補の中から容易に適切なキーワードを指定することが可能となる。さらに、表示部203には、キーワード候補が表示される際に、データ管理装置2がキーワード候補を抽出する際に算出した画像データとの関連度が表示されるため、ユーザは画像データとの関連度を参照してキーワードを指定することができ、キーワードの選択がより容易になる。
【0076】
さらに、MFP1からデータ管理装置2へサムネイル画像を送信することにより、送信するデータ量を少なくすることができる。このため、ネットワーク資源を有効に利用することが可能となる。また、キーワード候補は、データ管理装置2の1箇所で抽出されるため、キーワード候補が一元的に抽出される。このため、キーワード候補を抽出するアルゴリズムに変更が生じた場合であっても、データ管理装置2で実行されるデータ管理プログラムに修正を加えるだけでよく、MFP1に修正を加える必要はない。さらに、キーワード候補の抽出がデータ管理装置2だけで行なわれるため、データ管理装置2に複数のMFP1が接続された場合であっても、統一した基準でキーワード候補を抽出することができるため、キーワードを用いた検索が有効なものとなる。
【0077】
(1) 請求項5に記載のデータ管理装置は、前記キーワード候補抽出手段は、前記キーワード候補に対応する関連度を算出する関連度算出手段を含み、
前記キーワード候補送信手段は、前記算出された関連度の高い順に前記キーワード候補を並び替えて送信する。
【0078】
(2) 請求項5に記載のデータ管理装置は、前記キーワード候補送信手段は、前記データ管理装置からキーワード候補の上限数を受信した場合には、前記算出された関連度の高い順に前記受信された上限数のキーワード候補を送信する。
【0079】
(3) 請求項5に記載のデータ管理装置において、前記第1の画像データは、前記第2の画像データよりもサイズが小さい。
【0080】
(4) 画像データとその画像データの検索に用いられるキーワードとを関連付けて記憶するデータ管理装置に接続可能な画像読取装置で実行されるキーワード付加プログラムであって、
原稿を読取って画像データを取得するステップと、
前記取得された画像データを縮小するステップと、
前記縮小された画像データを前記データ管理装置に送信するステップと、
前記データ管理装置からキーワード候補を受信するステップと、
前記受信したキーワード候補を表示して前記画像データに対応するキーワードの指定を受付けるステップと、
前記指定されたキーワードと前記取得された画像データとを前記データ管理装置に送信するステップとを実行させる、キーワード付加プログラム。
【0081】
(5) 原稿を読取って画像データが取得する画像読取装置と通信可能なデータ管理装置で実行されるデータ管理プログラムであって、
前記画像読取装置から第1の画像データを受信するステップと、
前記受信された第1の画像データから画像特徴量を抽出するステップと、
前記抽出された画像特徴量に基づき、前記第1の画像データに対応するキーワード候補を抽出するステップと、
前記抽出されたとキーワード候補を前記画像読取装置へ送信するステップと、
第2の画像データと前記キーワード候補の中から前記画像読取装置のユーザにより指定されたキーワードとを前記画像読取装置から受信するステップと、
前記受信された第2の画像データとキーワードとを関連付けて記憶するステップとを実行させる、データ管理プログラム。
【0082】
(6) 画像データを入力する画像データ入力装置と通信可能なコンピュータにおいて実行されるデータ管理プログラムであって、
画像データ入力装置において元の画像データのデータ量を減少させた画像データパケットを受取るステップと、
前記受取った画像データに対応するキーワードを1つまたは複数個抽出するステップと、
前記抽出されたキーワードを前記画像データ入力装置へ送信するステップとを実行させるデータ管理プログラム。
【0083】
(7) (6)に記載のデータ管理プログラムは、さらに、画像データ入力装置において選択されたキーワードと、キーワードが対応付けされた前記元の画像データとを、画像データ入力装置から受取り、画像データとキーワードを関連付けて記憶するステップを含む。
【0084】
(8) (6)に記載のデータ管理プログラムは、さらに、キーワードのデータベースを参照してキーワードを抽出する。
【0085】
(9) (6)に記載のデータ管理プログラムは、キーワードの抽出は、受取った画像データのうち指定された領域の画像データに基づいてキーワードの抽出を行う。
【0086】
(10) (6)に記載のデータ管理プログラムは、抽出されたキーワードを、キーワードと画像の関連度の順に従って、画像入力装置へ送信する。
【0087】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【図1】本発明の実施の形態の1つにおける文書管理システムの全体概要を示す図である。
【図2】本実施の形態におけるデータ管理装置のハード構成を示すブロック図である。
【図3】本実施の形態における文書管理システムの機能の概略を示す機能ブロック図である。
【図4】本実施の形態における文書管理システムで実行される処理の流れを示すフローチャートである。
【図5】図4のステップS02で実行されるスキャン処理の流れを示すフローチャートである。
【図6】図4のステップS06で実行されるサムネイル画像送信処理の流れを示すフローチャートである。
【図7】図4のステップS12で実行されるキーワード候補生成処理の流れを示すフローチャートである。
【図8】図4のステップS08で実行されるキーワード表示と選択処理の流れを示すフローチャートである。
【符号の説明】
1 MFP、2 データ管理装置、3 ネットワーク、4 ROM、5 CD−ROM、100 文書管理システム、127 表示部、129,206 通信I/F、134 ハードディスク、135 CD−ROMドライブ、137 マウス、138 キーボード、150 バス、201 スキャナ、202 画像生成部、203 表示部、204 入力部、208 制御部、209 画像形成部、210 画像特徴量抽出部、211 データ管理装置制御部、212 キーワード候補生成部、213 記憶部。
[0001]
BACKGROUND OF THE INVENTION
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image reading apparatus and a data management apparatus, and more particularly to an image reading apparatus that assigns a keyword to image data obtained by reading a document and transmits the image data to the data management apparatus, and a keyword used for searching the image data and the image data Is associated with the data management device.
[0002]
[Prior art]
Conventionally, a data management apparatus that manages a plurality of data in a centralized manner is known. In such a data management apparatus, in order to extract desired data, a characteristic keyword serving as a search key is stored in association with the data. Such keywords are registered by the user when registering or after registering data.
[0003]
A technique for automatically registering the keyword is described in Japanese Patent Laid-Open No. 2002-183165 (Patent Document 1). This Patent Document 1 has at least one of a copying function, a facsimile function, and an image data reading function, and a function that is physically connected to a file system that stores a document and that transmits the read document to the file system. In a digital copying machine, a character extraction function for extracting characters from an image of each page read when copying a document, executing image reading for facsimile transmission, or executing image reading; A keyword extraction function that analyzes the extracted characters and extracts keywords, a keyword display function that displays the extracted keywords, and a keyword selection function that allows the user to select a keyword from the displayed keywords are selected. The document is sent to the file system by the communication function as additional information of the document whose keyword is read Digital MFP is described.
[0004]
[Patent Document 1]
JP 2002-183165 A
[0005]
[Problems to be solved by the invention]
However, in the digital multi-function peripheral described in Patent Document 1, since the digital multi-function peripheral itself extracts and assigns keywords, when a plurality of digital multi-function peripherals are connected to a file system for storing documents, the plurality of digital multi-function peripherals are used. Keywords must be assigned with the same algorithm in the digital multi-function peripheral. Also, if there is a change in the keyword assignment algorithm, all digital multifunction peripherals must be changed. Otherwise, the assigned keywords cannot be matched, and the desired document cannot be searched using the keywords.
[0006]
The present invention has been made to solve the above-described problems, and one of the objects of the present invention is to provide an image reading apparatus capable of assigning keywords in a unified manner at the stage of reading a document. is there.
[0007]
Another object of the present invention is to provide a data management apparatus capable of assigning keywords in a unified manner at the stage of reading an original with an image reading apparatus.
[0008]
[Means for Solving the Problems]
In order to achieve the above-described object, according to an aspect of the present invention, an image reading apparatus is connectable to a data management apparatus that stores image data and a keyword used for searching the image data in association with each other. An image reading unit that reads a document to acquire image data, a reduced image generation unit that reduces the acquired image data, a reduced image transmission unit that transmits the reduced image data to the data management device, Keyword candidate receiving means for receiving keyword candidates from the data management device, designation receiving means for displaying the received keyword candidates and accepting designation of keywords corresponding to the image data, designated keywords and image reading means Image data transmitting means for transmitting the image data to the data management device.
[0009]
According to the present invention, when a document is read to acquire image data, and the acquired image data is reduced and transmitted to the data management apparatus, keyword candidates are received from the data management apparatus. Then, when the received keyword candidates are displayed and the specification of the keyword corresponding to the image data is accepted, the specified keyword and the image data are transmitted to the data management device. For this reason, since the keyword candidate is received from the data management apparatus, the keyword candidate is extracted in an integrated manner. Further, since the read image data and the keyword are associated with each other and transmitted to the data management apparatus, the keyword is given at the stage of reading the document. As a result, it is possible to provide an image reading apparatus capable of assigning keywords in a unified manner at the stage of reading a document.
[0010]
Preferably, the apparatus further includes a designated area receiving unit for allowing the user to designate a predetermined area of the reduced image data, and the reduced image transmission unit further transmits information on the designated area.
[0011]
According to the present invention, a predetermined area of the reduced image data is designated by the user, and information on the designated area is further transmitted. For this reason, since the area | region for extracting a keyword candidate is designated, a more suitable keyword candidate comes to be received.
[0012]
Preferably, it further includes an upper limit number input means for causing the user to specify an upper limit number of keyword candidates received from the data management device, and the reduced image transmission means further transmits the specified upper limit number.
[0013]
According to this invention, when the upper limit number of keyword candidates is designated by the user, the designated upper limit number is further transmitted. For this reason, since the number of keyword candidates to be received is limited, it is possible to easily specify keywords.
[0014]
Preferably, the keyword candidate receiving unit further receives a degree of association corresponding to the keyword candidate, and the designation receiving unit displays the degree of association in association with the keyword candidate.
[0015]
According to this invention, the degree of association corresponding to the keyword candidate is further received, and the degree of association is displayed in association with the keyword candidate. For this reason, it becomes possible to specify a keyword easily.
[0016]
According to another aspect of the present invention, the data management device is a data management device capable of communicating with an image reading device that reads a document and obtains image data, and receives the first image data from the image reading device. Extraction means for extracting an image feature amount from the received first image data; keyword candidate extraction means for extracting a keyword candidate corresponding to the first image data based on the extracted image feature amount; When the keyword candidate transmitting means for transmitting the keyword candidate to the image reading device and the second image data and the keyword designated by the user of the image reading device from the keyword candidates are received from the image reading device, the received first Storage means for storing the second image data and the keyword in association with each other.
[0017]
According to the present invention, when the first image data is received from the image reading device, the image feature amount is extracted from the first image data, and the first image data is handled based on the extracted image feature amount. Keyword candidates to be extracted are extracted, and the keyword candidates are transmitted to the image reading apparatus. When the second image data and the keyword designated by the user of the image reading device are received from the keyword candidates, the second image data and the designated keyword are stored in association with each other. For this reason, keyword candidates are centrally extracted by the data management apparatus. Also, if the first image data is reduced image data, the amount of data to be received is reduced. Further, since the keyword designated by the user is stored in association with the second image data from the keyword candidates extracted centrally, the keyword is assigned centrally at the stage of reading the document with the image reading device. It is possible to provide a data management apparatus capable of performing
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following description, the same parts are denoted by the same reference numerals. Their names and functions are also the same. Therefore, detailed description thereof will not be repeated.
[0019]
FIG. 1 is a diagram showing an overall outline of a document management system according to one embodiment of the present invention. Referring to FIG. 1, document management system 100 includes a multifunction device 1 (hereinafter referred to as “MFP 1”) and a data management device 2 connected to network 3.
[0020]
An MFP (Multi Function Peripheral) 1 includes a scanner for reading an original, an image forming apparatus for forming an image on a recording medium such as paper based on image data, and a facsimile, and includes an image reading function, a copying function, and facsimile transmission / reception. It has a function. Although the MFP 1 is described as an example in the present embodiment, any scanner that has at least an image reading function may be used instead of the MFP.
[0021]
A detachable read-only memory (ROM) 4 is attached to the MFP 1. The ROM 4 stores a program executed by the central processing unit of the MFP 1 as will be described later, and the program can be changed by exchanging the ROM 4. Further, a CD-ROM (Compact Disc Read Only Memory) 5 is attached to the data management device 2.
[0022]
As the network 3, a local area network (LAN), the Internet, a general public line, or the like can be used, regardless of whether it is wired or wireless.
[0023]
FIG. 2 is a block diagram showing a hardware configuration of the data management device 2 in the present embodiment. Referring to FIG. 2, the data management device 2 is executed with a CPU (Central Processing Unit) 131 connected to the bus 150 and a ROM (Read Only Memory) 132 recording a boot-up program of the operating system. A RAM (Random Access Memory) 133 for storing a program to be loaded and data during program execution, a hard disk 134 for storing a document database in a nonvolatile manner, and the data management device 2 in the network 3 A communication interface (I / F) 129 for connection, a mouse 137, a keyboard 138, a display unit 127, and a CD-ROM drive 135 are included. The CD-ROM 5 is mounted on the CD-ROM drive 135.
[0024]
As described above, the data management device 2 is configured by a general personal computer. Since the operation of the personal computer itself is well known, detailed description thereof will not be repeated here.
[0025]
When the document management program is executed by the CPU 131, processing for managing the document database recorded on the hard disk 134 is executed. Generally, such a document management program is stored and distributed in a recording medium such as a CD-ROM 5, read from the recording medium by a CD-ROM drive 135, and temporarily stored in the hard disk 134. Further, it is read from the hard disk 134 to the RAM 133 and executed by the CPU 131.
[0026]
The recording media are not limited to the CD-ROM 5 and the hard disk 134, but are flexible disks, cassette tapes, optical disks (MO (Magnetic Optical Disc / MD (Mini Disc) / DVD (Digital Versatile Disc)), IC cards (memory cards). A medium carrying a fixed program such as a semiconductor memory such as an optical card, a mask ROM, an EPROM, an EEPROM, or a flash ROM.
[0027]
The program here is a concept including not only a program that can be directly executed by the CPU 131 but also a program in a source program format, a compressed program, an encrypted program, and the like.
[0028]
FIG. 3 is a functional block diagram showing an outline of functions of the document management system according to the present embodiment. Referring to FIG. 3, MFP 1 displays a control unit 208 for controlling the entire MFP 1, a scanner 201 for reading a document, an input unit 204 for designating a keyword to be described later, an operation screen, and the like. A display unit 203 for generating the image, an image generation unit 202 for generating a reduced image (thumbnail image) of the image data obtained by reading the document with the scanner 201, and image data obtained by reading the document with the scanner 201. An image forming unit 209 that processes and forms an image on a recording medium such as paper, and a communication interface (I / F) 206 for connecting the MFP 1 to the data management apparatus 2 are included.
[0029]
The control unit 208 is a central processing unit (CPU), and includes a read only memory (ROM 4) and a random access memory (RAM). The control unit 208 executes the program stored in the ROM 4 by the CPU. The ROM 4 is detachably attached to the MFP 1. Note that the program executed by the control unit 208 is not limited to the program stored in the ROM 4, and the program stored in an EEPROM (electrically erasable / programmable read only memory) separately connected to the control unit 208 is read and executed. It may be. If the EEPROM is used, the program can be rewritten or additionally written. For this reason, the MFP 1 may be connected to a network, and another computer connected to the network may rewrite the program stored in the EEPROM of the MPP 1 or add a new program for writing. Further, the MFP 1 may download a program from another computer connected to the network and store the program in the EEPROM. Further, a memory card or the like may be attached to the MFP 1 so that a program stored in the memory card can be read.
[0030]
The scanner 201 includes a photoelectric conversion element such as a CCD (Charge Coupled Device), optically reads a document, and outputs electronic data as image data.
[0031]
The input unit 204 is an input device such as a touch panel or a keyboard for receiving an operation input by the user of the MFP 1. The display unit 203 is a liquid crystal display device or an organic EL (electro-luminescence) display panel. In the case where a touch panel made of a transparent member is used for the input unit 204, the instruction of the button displayed on the display unit 203 can be detected by placing the input unit 204 on the display unit 203. Thereby, various operations can be input. By using the input unit 204 and the display unit 203 in combination, it becomes easy to input keyword designation information, which will be described later.
[0032]
The image generation unit 202 generates a thumbnail image from the image data read by the scanner 201.
[0033]
A communication I / F 206 is a communication interface for connecting the MFP 1 to the data management apparatus 2. The MFP 1 and the data management apparatus 2 are connected via the network 3, but may be directly connected using a serial interface or a parallel interface. The communication I / F 206 uses an interface corresponding to the connection form between the MFP 1 and the data management apparatus 2.
[0034]
The data management device 2 is received by the data management device control unit 211 for controlling the entire data management device 2, the communication I / F 129 for connecting the data management device 2 to the MFP 1, and the communication I / F 129. An image feature amount extraction unit 210 that extracts a feature amount of image data, a keyword candidate generation unit 212 that generates keyword candidates corresponding to the received image data, and the received image data and keywords are stored in association with each other. Storage unit 213.
[0035]
The communication I / F 129 is an interface for connecting the data management apparatus 2 to the MFP 1 via the network 3 and has the same function as the communication I / F 206.
[0036]
The storage unit 213 is a non-volatile memory such as a hard disk drive, and stores a document database and a keyword dictionary for storing the image data received by the communication I / F 129 and the corresponding keyword in association with each other.
[0037]
The keyword dictionary associates two keywords using similarity. By associating two keywords with similarity, a keyword similar to a certain keyword can be extracted. The keyword dictionary is registered in advance by the user.
[0038]
The image feature amount extraction unit 210 recognizes characters included in the image. Then, the words included in the image and the number of appearances of the words are counted from the recognized characters. The feature amount of the image includes a word included in the image and the number of appearances of the word.
[0039]
The keyword candidate generation unit 212 generates keyword candidates using the feature amounts calculated by the image feature amount extraction unit 210 and the keyword dictionary stored in the storage unit 213. The keyword candidate generation unit 212 uses the feature amount calculated by the image feature amount extraction unit 210 to set a predetermined number of words as a keyword in descending order of appearance. In the following description, a keyword extracted from a feature amount is referred to as an “extracted keyword” to simplify the description.
[0040]
The keyword candidate generating unit 212 also extracts a keyword similar to the extracted keyword using the keyword dictionary stored in the storage unit 213. Here, for the sake of explanation, keywords similar to the extracted keyword are referred to as similar keywords, and the extracted keyword and similar keywords are collectively referred to as keyword candidates. The keyword candidates generated by the keyword candidate generation unit 212 include similar keywords, but the similar keywords do not need to be included in the image.
[0041]
The data management device control unit 211 manages a document database provided in the storage unit 213. Further, based on the input user operation, the document database is accessed, and general database operations such as data search, addition, change, and deletion are executed.
[0042]
In document management system 100 according to the present embodiment, a user operates MFP 1 to read a document with scanner 201. A thumbnail image obtained by reducing the image data obtained by reading the document with the scanner 201 is generated and transmitted to the data management apparatus 2. The data management apparatus 2 extracts keyword candidates based on the received image data, and transmits the extracted keyword candidates to the MFP 1. When the MFP 1 receives the keyword candidate and receives the keyword specification from the user, the MFP 1 transmits the specified keyword together with the image data to the data management apparatus 2. In the data management device 2, the transmitted image data and the keyword are associated with each other and stored in the document database of the storage unit 213.
[0043]
Hereinafter, these processes will be specifically described. FIG. 4 is a flowchart showing the flow of processing executed by the document management system in this embodiment. In FIG. 4, for the sake of explanation, the process executed by the MFP 1 and the process executed by the data management apparatus 2 are shown separately. Referring to FIG. 4, when an image scanning function is selected in MFP 1, first, in step S01, an initial setting process for initializing flags and the like necessary for the following processes is performed. In the next step S02, the MFP 1 determines whether or not the user places a paper document on a document table or an automatic document feeder (ADF) and clicks the start button. Then, the document placed on the document table is scanned (step S02). In this scanning process, the scanner 201 reads a document placed on a document table and generates image data. Then, a thumbnail image is generated from the generated image data. This scanning process will be described in detail later.
[0044]
In the next step S03, it is determined whether or not a registration instruction has been input by the user. The registration instruction refers to an instruction for transmitting scanned image data to the data management apparatus 2 and registering it in a document database stored in the storage unit 213 of the data management apparatus 2. This registration instruction is input by the user operating the input unit 204 of the MFP 1. More specifically, a button displaying the characters “Register” is displayed on the display unit 203 of the MFP 1, and when the user designates this button using the input unit 204, it is detected that there is a registration instruction. . If there is a registration instruction, the process proceeds to step S04. If not, processing such as image formation of the read image data by the image forming unit 209 is executed.
[0045]
In step S04, an input of the upper limit number of keywords is accepted. The input of the upper limit number of keywords is accepted when the user operates the input unit 204. More specifically, a field for inputting the upper limit number of keywords is displayed on the display unit 203 of the MFP 1, and the user selects this field using the input unit 204 and inputs a desired number using the numeric keypad. A number is entered. The input of the keyword upper limit number can be arbitrarily selected, and the user can operate the input unit 204 to instruct not to input the upper limit number.
[0046]
In the next step S05, the range designation is accepted. The range designation is for designating a region desired by the user in the image data read by the scanner 201. This range designation input is accepted by the user operating the input unit 204. As a range designation input method, for example, a figure divided into a plurality of predetermined areas is displayed, and a desired area is designated. Alternatively, the target image may be displayed on the display unit 230, and the user may designate two points that are diagonal to the rectangle with a finger. Further, the coordinates of the two diagonal points may be input numerically. The range may be a shape other than a rectangle. In addition, the range specification specified here specifies a necessary area for the user to extract a keyword. In the specified area, for example, information that can be a keyword such as a main term is included. included. As will be described later, when a keyword candidate is extracted in the data management apparatus, the keyword candidate is extracted using the image data in the specified range.
[0047]
In the next step S06, the thumbnail image is generated by reducing the image data read by the scanner 201 to a predetermined size, and the generated thumbnail image is transmitted to the data management device 2 (step S06). When transmitting the thumbnail image, if the keyword upper limit number is input in step S04, the keyword upper limit number is also transmitted together with the thumbnail. If the range is specified in step S05, the specified range is transmitted together with the thumbnail image.
[0048]
On the other hand, the data management device 2 is in a standby state until a thumbnail image is received (step S11). If a thumbnail image has been received, the process proceeds to step S12. In step S11, when the keyword upper limit number is transmitted together with the thumbnail image, the keyword upper limit number is also received. In addition, when information on a range in which a range is designated is received together with the thumbnail image, the information on the range is also received together.
[0049]
In step S12, keyword candidate generation processing is executed. The keyword candidate generation process will be described in detail later.
[0050]
In the next step S13, a process of transmitting the keyword candidates generated in step S12 to the MFP 1 is executed.
[0051]
The MFP 1 is in a standby state until a keyword candidate is received from the data management device (step S07). When a keyword candidate is received, the received keyword candidate is displayed on the display unit 203, and a user designation is accepted from the displayed keyword candidates (step S08). The processing in step S08 will be described in detail later.
[0052]
Then, the designated keyword and the image data obtained by scanning in step S02 are transmitted to the data management apparatus 2 (step S09).
[0053]
The data management device 2 is in a standby state until the keyword and image data transmitted from the MFP 1 are received (step S14). When the keyword and image data are received, in the next step S15, The received keyword and image data are registered in the document database of the storage unit 213 (step S15).
[0054]
FIG. 5 is a flowchart showing the flow of scan processing executed in step S02 of FIG. Referring to FIG. 5, in step S21, scan setting is performed. The scan setting refers to setting of various conditions for reading an image with the scanner 201. The setting of various conditions includes reading resolution, document type, format, and the like. If it is detected in step S22 that the scan button has been clicked, an image is read in step S23.
[0055]
FIG. 6 is a flowchart showing the flow of the thumbnail image transmission process executed in step S06 of FIG. Referring to FIG. 6, the image generation unit 202 generates a thumbnail image based on the image data read by the scanner 201 (step S31). The thumbnail image includes an image obtained by reducing the original image data (reduced image) and a partial image (partial image) of the original image data. Further, by combining these, the thumbnail image may be an image obtained by reducing a part of the original image data. When the thumbnail image is a reduced image, the thumbnail image may be reduced at a reduction rate corresponding to the size of the generated thumbnail image, or may be reduced at a predetermined reduction rate. When the thumbnail image is a partial image, the size of a part of the original image data may be determined in accordance with the size of the thumbnail image.
[0056]
Further, instead of generating thumbnail images, the original image data is compressed by using a compression method such as JPEG (Joint Photographic Experts Group), PNG (Portable Network Graphics) or GIF (Graphic Interchange Format). You may make it do. Further, image data in which the number of gradations of the original image data is reduced may be generated. Further, it may be image data obtained by compressing a thumbnail image or image data having a reduced number of gradations. In the following description, a case where a thumbnail image is generated will be described. However, compressed image data or image data with a reduced number of gradations can be used in place of a thumbnail image.
[0057]
As described above, generating the thumbnail image, the compressed image data, or the image data with the reduced number of gradations from the original image data reduces the amount of data transmitted from the MFP 1 to the data management apparatus 2 as will be described later. Because.
[0058]
Then, it is determined whether the upper limit number of keywords is set (step S32). If the upper limit number of keywords is set, the process proceeds to step S33, and if not, the process skips step S33 and proceeds to step S34. This keyword upper limit number is information set in step S04 of FIG. Moreover, since this setting is arbitrary, the upper limit number of keywords may not be set. In step S33, for example, an upper limit number transmission flag is set in order to transmit the upper limit number of keywords.
[0059]
In step S34, it is determined whether a range has been designated. If the range is designated, the process proceeds to step S35, and if not, step S35 is skipped and the process proceeds to step S36. This range designation is designated in step S05 of FIG. 4 described above. Further, the range designation is arbitrarily designated, and there is a case where the range designation is not performed. In step S35, in order to transmit the designated range, for example, a range transmission flag or the like is set.
[0060]
In step S36, the thumbnail image generated in step S31 is transmitted to the data management apparatus 2. At this time, if the keyword upper limit number is set to be transmitted in step S33, the keyword upper limit number is also transmitted. In addition, when the keyword upper limit number is not set, a preset default value may be transmitted. If it is set in step S35 to transmit the specified range, the specified range is also transmitted.
[0061]
FIG. 7 is a flowchart showing the flow of keyword candidate generation processing executed in step S12 of FIG. As described with reference to FIG. 4, the data management apparatus 2 receives the thumbnail image from the MFP 1. When the keyword upper limit number is set, the keyword upper limit number is also received. Furthermore, when the designated range is set, the designated range is also received.
[0062]
In the keyword candidate generation process, first, it is determined whether or not a designated range is set (step S51). Whether or not the specified range is set is determined based on whether or not the specified range is received. If the designated range is set, the process proceeds to step S53, and if not, the process proceeds to step S52. In step S53, the feature amount of the image in the specified range is extracted from the received thumbnail images (step S53). On the other hand, in step S52, since the designated range is not set, the feature amount of the entire received thumbnail image is extracted. In step S52, the image to be processed is the entire image. In step S53, the image is in the designated range, and only the range of the image to be processed is different.
[0063]
Next, in step S54, keyword candidates are extracted using the feature amount extracted in step S52 or step S53 and the keyword dictionary stored in the storage unit 213. First, using a feature amount, a predetermined number of words are set as extraction keywords in order of appearance frequency. Then, using the keyword dictionary stored in the storage unit 213, keywords similar to the extracted keyword are extracted.
[0064]
It should be noted that the extraction of similar keywords may be performed selectively, or the keyword candidates may be extracted keywords only and no similar keywords may be used. When a similar keyword is not used, the keyword dictionary does not need to be provided in the data management device 2.
[0065]
In step S55, the relevance of each keyword candidate is calculated. In calculating the degree of association, first, the degree of association of the extracted keyword is calculated from the feature amount extracted in step S52 or step S53. The relevance of the extracted keyword is calculated as follows. Using the feature amount extracted in step S52, the degree of association with the image is set to “1”, which is the maximum value that the degree of association can take, for the extracted keyword having the largest number of appearances. Then, the degree of association between an extracted keyword other than the extracted keyword with the highest number of appearances and the image is obtained by the following equation.
[0066]
Relevance between the extracted keyword and the image = (number of appearances of the extracted keyword) / (number of appearances of the extracted keyword having the highest number of appearances) (1)
Note that the degree of association between the extracted keyword and the image may be obtained by the following equation.
[0067]
Relevance between extracted keyword and image = (number of appearances of the extracted keyword) / (total number of extracted keywords in the image) × α (2)
Α is a constant.
[0068]
The relevance level of the similar keyword extracted in step S54 is the product of the relevance level of the extracted keyword calculated in step S55 and the similarity calculated in step S54. The similarity set in the keyword dictionary is a value of “1” or less. That is, the relevance level of similar keywords is calculated using the following equation (3).
[0069]
Similarity of similar keyword = (Relationship between extracted keyword and image) × (Similarity between extracted keyword and similar keyword) (3)
In this way, the degree of association with the image is calculated for all keyword candidates. In the next step S56, the keyword candidates are rearranged in descending order of relevance.
[0070]
In the next step S57, it is determined whether or not the keyword upper limit number is limited. Whether or not the keyword upper limit number is limited is determined by whether or not the keyword upper limit number is received. If the keyword upper limit number is limited, the process proceeds to step S58, and if not, step S58 is skipped and the process ends.
[0071]
In step S58, the number of keyword candidates is limited to the keyword upper limit number. This restriction is given priority to keyword candidates having a high degree of relevance. That is, from the keyword candidates, as many keyword candidates as the number of keyword upper limit numbers are extracted in descending order of relevance. The keyword candidates that are not extracted are deleted from the keyword candidates.
[0072]
FIG. 8 is a flowchart showing the flow of keyword candidate display and selection processing executed in step S08 of FIG. In MFP 1, keyword candidates and their relevance are received from data management device 2. The MFP 1 displays the received keyword candidates on the display unit 203 in descending order of relevance (step S61). Then, it is determined whether or not there is an instruction to select a desired keyword candidate from the displayed keyword candidates (step S62). This selection instruction is input by the operation of the input unit 204 by the user, and the keyword candidate to be selected may be singular or plural. More specifically, the keyword candidate displayed at the position where the user touches the keyword candidate displayed on the display unit 203 with the finger is selected. Alternatively, the keyword candidates may be displayed with serial numbers, and the keyword candidates corresponding to the numbers input by the user from the numeric keypad may be selected. Then, the keyword candidate that has been selected is set as a keyword (step S63). That is, the keyword candidates set as keywords are limited to the keyword candidates selected and designated by the user using the input unit 204. As a result, only the keyword candidates selected and specified by the user from the keyword candidates automatically and centrally extracted by the data management apparatus 2 are set as keywords, so only the keywords required by the user are registered. It becomes possible to do.
[0073]
As described above, in the MFP 1 according to the present embodiment, the scanner 201 reads a document and acquires image data. When a thumbnail image obtained by reducing the acquired image data is transmitted to the data management device 2, keyword candidates are received from the data management device 2. Further, when the received keyword candidate is displayed on the display unit 203 and the specification of the keyword corresponding to the image data is received from the input unit 204 by the user, the specified keyword and the image data are transmitted to the data management device 2. The For this reason, in MFP 1, keyword candidates are received from data management device 2, and thus keyword candidates are extracted in a unified manner by data management device 2. In addition, since the MFP 1 associates the read image data with the keyword and transmits it to the data management apparatus 2, the keyword is assigned when the MFP 1 reads the document. As a result, keywords can be assigned in a unified manner at the stage of reading a document.
[0074]
In addition, when the user designates a predetermined area of the image data read from the input unit 204, the MFP 1 transmits the thumbnail image and information on the designated area to the data management apparatus 2. For this reason, when the data management device 2 receives the information of the designated area, the keyword candidate is extracted from the designated area in the received thumbnail image, and thus the probability that the keyword desired by the user is extracted. Becomes higher, and more appropriate keyword candidates are displayed on the display unit 203.
[0075]
Furthermore, when the upper limit number of keyword candidates is designated from the input unit 204 by the user, the MFP 1 transmits the designated upper limit number to the data management apparatus 2. When the upper limit number of keyword candidates is received, the data management device 2 transmits to the MFP 1 as many keyword candidates as the maximum number of keywords among the keyword candidates extracted from the received thumbnail images. For this reason, since the number of keyword candidates displayed on the display unit 203 is limited in the MFP 1, the user can easily specify an appropriate keyword from the displayed keyword candidates. Further, when the keyword candidate is displayed, the display unit 203 displays the degree of association with the image data calculated when the data management apparatus 2 extracts the keyword candidate. The keyword can be specified with reference to the degree, and the selection of the keyword becomes easier.
[0076]
Furthermore, by transmitting thumbnail images from the MFP 1 to the data management apparatus 2, the amount of data to be transmitted can be reduced. For this reason, network resources can be used effectively. Further, since the keyword candidates are extracted at one place in the data management device 2, the keyword candidates are extracted in a unified manner. For this reason, even if a change occurs in the algorithm for extracting keyword candidates, it is only necessary to modify the data management program executed by the data management apparatus 2, and it is not necessary to modify the MFP 1. Further, since the keyword candidates are extracted only by the data management apparatus 2, even if a plurality of MFPs 1 are connected to the data management apparatus 2, the keyword candidates can be extracted based on a unified standard. Search using is effective.
[0077]
(1) In the data management device according to claim 5, the keyword candidate extraction unit includes a relevance level calculating unit that calculates a relevance level corresponding to the keyword candidate,
The keyword candidate transmitting means rearranges and transmits the keyword candidates in descending order of the calculated relevance.
[0078]
(2) In the data management device according to claim 5, when the keyword candidate transmission unit receives the upper limit number of keyword candidates from the data management device, the keyword candidate transmission unit receives the keyword candidate in descending order of the calculated relevance. Send as many keyword candidates as possible.
[0079]
(3) In the data management device according to claim 5, the first image data is smaller in size than the second image data.
[0080]
(4) A keyword addition program executed by an image reading device connectable to a data management device that stores image data and a keyword used for searching the image data in association with each other,
Reading a document to obtain image data;
Reducing the acquired image data;
Transmitting the reduced image data to the data management device;
Receiving keyword candidates from the data management device;
Displaying the received keyword candidates and accepting designation of keywords corresponding to the image data;
A keyword addition program for executing the step of transmitting the designated keyword and the acquired image data to the data management device.
[0081]
(5) A data management program executed by a data management device capable of communicating with an image reading device that reads a document and obtains image data,
Receiving first image data from the image reading device;
Extracting an image feature amount from the received first image data;
Extracting keyword candidates corresponding to the first image data based on the extracted image feature amount;
Transmitting the extracted keyword candidates to the image reading device;
Receiving second image data and a keyword designated by the user of the image reading device from the keyword candidates from the image reading device;
A data management program causing the received second image data and a keyword to be stored in association with each other.
[0082]
(6) A data management program executed in a computer capable of communicating with an image data input device for inputting image data,
Receiving an image data packet in which the data amount of the original image data is reduced in the image data input device;
Extracting one or more keywords corresponding to the received image data;
A data management program for executing the step of transmitting the extracted keyword to the image data input device.
[0083]
(7) The data management program according to (6) further receives a keyword selected in the image data input device and the original image data associated with the keyword from the image data input device, and receives the image data And storing the keywords in association with each other.
[0084]
(8) The data management program according to (6) further extracts a keyword by referring to a keyword database.
[0085]
(9) In the data management program described in (6), the keyword is extracted based on the image data of the designated area in the received image data.
[0086]
(10) The data management program according to (6) transmits the extracted keyword to the image input device in the order of the degree of association between the keyword and the image.
[0087]
The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall outline of a document management system according to one embodiment of the present invention.
FIG. 2 is a block diagram showing a hardware configuration of a data management apparatus according to the present embodiment.
FIG. 3 is a functional block diagram showing an outline of functions of a document management system according to the present embodiment.
FIG. 4 is a flowchart showing a flow of processing executed by the document management system in the present embodiment.
FIG. 5 is a flowchart showing a flow of scan processing executed in step S02 of FIG.
6 is a flowchart showing a flow of thumbnail image transmission processing executed in step S06 of FIG.
FIG. 7 is a flowchart showing a flow of keyword candidate generation processing executed in step S12 of FIG.
FIG. 8 is a flowchart showing the flow of keyword display and selection processing executed in step S08 of FIG.
[Explanation of symbols]
1 MFP, 2 data management device, 3 network, 4 ROM, 5 CD-ROM, 100 document management system, 127 display unit, 129, 206 communication I / F, 134 hard disk, 135 CD-ROM drive, 137 mouse, 138 keyboard , 150 bus, 201 scanner, 202 image generation unit, 203 display unit, 204 input unit, 208 control unit, 209 image formation unit, 210 image feature amount extraction unit, 211 data management device control unit, 212 keyword candidate generation unit, 213 Memory part.

Claims (5)

画像データとその画像データの検索に用いられるキーワードとを関連付けて記憶するデータ管理装置に接続可能な画像読取装置であって、
原稿を読取って画像データを取得する画像読取手段と、
前記取得された画像データを縮小する縮小画像生成手段と、
前記縮小された画像データを前記データ管理装置に送信する縮小画像送信手段と、
前記データ管理装置からキーワード候補を受信するキーワード候補受信手段と、
前記受信したキーワード候補を表示して前記画像データに対応するキーワードの指定を受付ける指定受付手段と、
前記指定されたキーワードと前記画像読取手段により取得された画像データとを前記データ管理装置に送信する画像データ送信手段とを備えた、画像読取装置。
An image reading device connectable to a data management device that stores image data and a keyword used for searching the image data in association with each other,
Image reading means for reading a document and acquiring image data;
Reduced image generation means for reducing the acquired image data;
Reduced image transmission means for transmitting the reduced image data to the data management device;
Keyword candidate receiving means for receiving keyword candidates from the data management device;
Designation accepting means for displaying the received keyword candidates and accepting designation of a keyword corresponding to the image data;
An image reading apparatus comprising: an image data transmitting unit configured to transmit the designated keyword and the image data acquired by the image reading unit to the data management apparatus.
前記縮小された画像データの所定の領域をユーザに指定させるための指定領域受付手段をさらに含み、
前記縮小画像送信手段は、前記指定された領域の情報をさらに送信する、請求項1に記載の画像読取装置。
A designated area receiving means for allowing a user to designate a predetermined area of the reduced image data;
The image reading apparatus according to claim 1, wherein the reduced image transmission unit further transmits information on the designated area.
前記データ管理装置から受信されるキーワード候補の上限数をユーザに指定させるための上限数入力手段をさらに含み、
前記縮小画像送信手段は、前記指定された上限数をさらに送信する、請求項1に記載の画像読取装置。
Further comprising an upper limit number input means for allowing a user to specify an upper limit number of keyword candidates received from the data management device;
The image reading apparatus according to claim 1, wherein the reduced image transmission unit further transmits the designated upper limit number.
前記キーワード候補受信手段は、前記キーワード候補に対応する関連度をさらに受信し、
前記指定受付手段は、前記キーワード候補に関連付けて前記関連度を表示する、請求項1に記載の画像読取装置。
The keyword candidate receiving means further receives a degree of relevance corresponding to the keyword candidate,
The image reading apparatus according to claim 1, wherein the designation receiving unit displays the degree of association in association with the keyword candidate.
原稿を読取って画像データを取得する画像読取装置と通信可能なデータ管理装置であって、
前記画像読取装置から第1の画像データを受信すると、前記受信された第1の画像データから画像特徴量を抽出する抽出手段と、
前記抽出された画像特徴量に基づき、前記第1の画像データに対応するキーワード候補を抽出するキーワード候補抽出手段と、
前記抽出されたキーワード候補を前記画像読取装置へ送信するキーワード候補送信手段と、
第2の画像データと前記キーワード候補の中から前記画像読取装置のユーザにより指定されたキーワードとを前記画像読取装置から受信すると、前記受信された第2の画像データとキーワードとを関連付けて記憶する記憶手段とを備えた、データ管理装置。
A data management device capable of communicating with an image reading device that reads a document and obtains image data,
Extracting means for extracting an image feature amount from the received first image data when receiving the first image data from the image reading device;
Keyword candidate extraction means for extracting keyword candidates corresponding to the first image data based on the extracted image feature amount;
Keyword candidate transmission means for transmitting the extracted keyword candidates to the image reading device;
When the second image data and the keyword specified by the user of the image reading device from the keyword candidates are received from the image reading device, the received second image data and the keyword are stored in association with each other. A data management device comprising storage means.
JP2003180921A 2003-06-25 2003-06-25 Image reading apparatus, data management apparatus, keyword addition program, and data management program Expired - Fee Related JP4289038B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003180921A JP4289038B2 (en) 2003-06-25 2003-06-25 Image reading apparatus, data management apparatus, keyword addition program, and data management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003180921A JP4289038B2 (en) 2003-06-25 2003-06-25 Image reading apparatus, data management apparatus, keyword addition program, and data management program

Publications (3)

Publication Number Publication Date
JP2005020256A true JP2005020256A (en) 2005-01-20
JP2005020256A5 JP2005020256A5 (en) 2006-05-25
JP4289038B2 JP4289038B2 (en) 2009-07-01

Family

ID=34181769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003180921A Expired - Fee Related JP4289038B2 (en) 2003-06-25 2003-06-25 Image reading apparatus, data management apparatus, keyword addition program, and data management program

Country Status (1)

Country Link
JP (1) JP4289038B2 (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008263557A (en) * 2007-04-13 2008-10-30 Pfu Ltd Image information management system, network scanner device, and image information management method
JP2009134730A (en) * 2008-12-25 2009-06-18 Sony Corp Content management device and content information management method
EP2105855A2 (en) 2008-03-27 2009-09-30 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
JP2009225227A (en) * 2008-03-18 2009-10-01 Seiko Epson Corp File generating apparatus, file generating method and file generating program
EP2109051A2 (en) 2008-03-27 2009-10-14 Brother Kogyo Kabushiki Kaisha Content management system, and content management method
JP2009246619A (en) * 2008-03-31 2009-10-22 Brother Ind Ltd Information processing device and computer program
JP2012022714A (en) * 2011-10-20 2012-02-02 Brother Ind Ltd Content management system and content management method
JP2012053892A (en) * 2011-10-20 2012-03-15 Brother Ind Ltd Content management system and content management method
US8185577B2 (en) 2006-09-26 2012-05-22 Sony Corporation Content management apparatus, web server, network system, content management method, content information management method, and program
US8538962B2 (en) 2008-03-14 2013-09-17 Brother Kogyo Kabushiki Kaisha Information processing device, content management system, method, and computer readable medium for managing contents
JP2015005811A (en) * 2013-06-19 2015-01-08 富士ゼロックス株式会社 Image forming apparatus and image formation program
JP2016219967A (en) * 2015-05-18 2016-12-22 株式会社リコー Image forming system, image forming apparatus, sever apparatus, and program
JP2020170413A (en) * 2019-04-05 2020-10-15 富士ゼロックス株式会社 Document processing device and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE447449T1 (en) 2007-10-20 2009-11-15 Trumpf Sachsen Gmbh MACHINE ARRANGEMENT FOR SHEET METAL PROCESSING WITH A SHEET METAL PROCESSING DEVICE AND WITH A TRANSPORT DEVICE

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185577B2 (en) 2006-09-26 2012-05-22 Sony Corporation Content management apparatus, web server, network system, content management method, content information management method, and program
US10650090B2 (en) 2006-09-26 2020-05-12 Sony Corporation Content management apparatus, web server, network system, content management method, content information management method, and program
US9172585B2 (en) 2006-09-26 2015-10-27 Sony Corporation Content management apparatus, web server, network system, content management method, content information management method, and program
US8635301B2 (en) 2006-09-26 2014-01-21 Sony Corporation Content management apparatus, web server, network system, content management method, content information management method, and program
JP2008263557A (en) * 2007-04-13 2008-10-30 Pfu Ltd Image information management system, network scanner device, and image information management method
US8538962B2 (en) 2008-03-14 2013-09-17 Brother Kogyo Kabushiki Kaisha Information processing device, content management system, method, and computer readable medium for managing contents
JP2009225227A (en) * 2008-03-18 2009-10-01 Seiko Epson Corp File generating apparatus, file generating method and file generating program
US8694484B2 (en) 2008-03-27 2014-04-08 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
JP2009237890A (en) * 2008-03-27 2009-10-15 Brother Ind Ltd Content management system and content management method
EP2105855A2 (en) 2008-03-27 2009-09-30 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8032524B2 (en) 2008-03-27 2011-10-04 Brother Kogyo Kabushiki Kaisha Content management system and content management method
EP2109051A2 (en) 2008-03-27 2009-10-14 Brother Kogyo Kabushiki Kaisha Content management system, and content management method
JP2009239617A (en) * 2008-03-27 2009-10-15 Brother Ind Ltd Content management device, content management system, and content management method
EP2105855A3 (en) * 2008-03-27 2010-07-21 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8239360B2 (en) 2008-03-27 2012-08-07 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8560538B2 (en) 2008-03-31 2013-10-15 Brother Kogyo Kabushiki Kaisha Information processing device, content management system, method, and computer readable medium for managing contents
JP2009246619A (en) * 2008-03-31 2009-10-22 Brother Ind Ltd Information processing device and computer program
JP4525785B2 (en) * 2008-03-31 2010-08-18 ブラザー工業株式会社 Information processing apparatus and computer program
JP2009134730A (en) * 2008-12-25 2009-06-18 Sony Corp Content management device and content information management method
JP2012053892A (en) * 2011-10-20 2012-03-15 Brother Ind Ltd Content management system and content management method
JP2012022714A (en) * 2011-10-20 2012-02-02 Brother Ind Ltd Content management system and content management method
JP2015005811A (en) * 2013-06-19 2015-01-08 富士ゼロックス株式会社 Image forming apparatus and image formation program
JP2016219967A (en) * 2015-05-18 2016-12-22 株式会社リコー Image forming system, image forming apparatus, sever apparatus, and program
JP2020170413A (en) * 2019-04-05 2020-10-15 富士ゼロックス株式会社 Document processing device and program
JP7298248B2 (en) 2019-04-05 2023-06-27 富士フイルムビジネスイノベーション株式会社 Document processing device and program

Also Published As

Publication number Publication date
JP4289038B2 (en) 2009-07-01

Similar Documents

Publication Publication Date Title
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP4350414B2 (en) Information processing apparatus, information processing method, storage medium, and program
US6335746B1 (en) Information processing method and apparatus for displaying a list of a plurality of image data files and a list of search results
JP4370286B2 (en) Data processing system, data processing method, and data processing program
JP4289038B2 (en) Image reading apparatus, data management apparatus, keyword addition program, and data management program
WO2007013399A1 (en) Search device and search method
JP2002132547A (en) Server for electronics information control, client therefor, method therefor and readable record medium recording program therefor
JP5660100B2 (en) Document management server, document management server control method and program thereof, document management system, document management system control method and program thereof
JP7375586B2 (en) Document search device, image processing device, document search method, and document search program
JP2006018630A (en) Method, device, program and computer-readable memory for data retrieval
JP2010114840A (en) Image forming apparatus and confirmation system for stored image
CN111580758B (en) Image forming apparatus having a plurality of image forming units
JP4715181B2 (en) Image processing apparatus and password reception program
JP4645731B2 (en) Image processing apparatus, image data management method, and computer program
JP5747344B2 (en) Document management system, document management server, control method therefor, and program
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JP2004348467A (en) Image retrieval apparatus and its control method, program
JP5668363B2 (en) Electronic document processing apparatus and program
JP2007336008A (en) Image searching apparatus and method
JP2007048061A (en) Character processing device, character processing method, and recording medium
JP4823049B2 (en) Document image retrieval apparatus and program
JP6287632B2 (en) Image processing apparatus, operation screen display method, and operation screen display program
JP2004295561A (en) Data management program for managing data, apparatus and method therefor
JP5573998B2 (en) Management system, management apparatus, control method thereof, and program
JP2001101213A (en) Information processor, document managing device, information processing sysetm, information managing method and storage medium

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090310

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090323

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120410

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees