JP2004215067A - デジタル機器 - Google Patents

デジタル機器 Download PDF

Info

Publication number
JP2004215067A
JP2004215067A JP2003001080A JP2003001080A JP2004215067A JP 2004215067 A JP2004215067 A JP 2004215067A JP 2003001080 A JP2003001080 A JP 2003001080A JP 2003001080 A JP2003001080 A JP 2003001080A JP 2004215067 A JP2004215067 A JP 2004215067A
Authority
JP
Japan
Prior art keywords
image
search
character recognition
storage means
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003001080A
Other languages
English (en)
Inventor
Nobuaki Matsui
信明 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003001080A priority Critical patent/JP2004215067A/ja
Publication of JP2004215067A publication Critical patent/JP2004215067A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • Storing Facsimile Image Data (AREA)

Abstract

【目的】メールボックスに格納された画像データを、ユーザが任意の時間に、任意のキーワードで検索することを可能とすることデジタル機器の提供。
【構成】 デジタル画像から文字を抽出する文字認識手段と、認識された前記文字を前記デジタル画像に関連付けて記憶する前記記憶手段と、ユーザが検索を希望するキーワードを入力するキーワード入力手段と、前記入力キーワードを用いて前記記憶手段に記憶された前記文字を検索する検索手段と、検索手段によって得られた検索結果から、前記関連付けに従って該当する画像のメールボックス情報を表示する表示手段と、検索結果の一覧の中からユーザが特定のデータを選択する選択手段を含んでデジタル機器を構成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、デジタル機器のメールボックスに関する技術であり、特にページ記述言語データ(PDL)プリントやスキャナによる入力画像、FAX受信等によってメールボックスに蓄積された画像をユーザが一意にキーワード検索することを可能にする技術である。更に、この技術は、ネットワーク上に分散したデジタル機器群の複数のメールボックスに分散して格納された画像の中から、任意のキーワードを含む画像を1台のクライアントコンピュータから一意に検索することをも可能とする。
【0002】
【従来の技術】
近年のデジタル複写機や、プリンタ、ファックス又は複合機は、HDD等の大容量記憶装置を搭載することが可能となり、大量の画像データをデジタル機器内に格納することが可能となった。これらのデジタル機器は、又、Ethernetや TokenRing等を介してネットワークに接続されるようになり、大量の画像データを蓄積、プリント、送信、ネットワーク配信等を行うイメージサーバとしての機能を備えつつある。
【0003】
蓄積可能な画像データ量が少ない場合には、メールボックスを使用者の名前等で切り分け、更に利用者のボックス内では有意な名前付けを画像データに行うことで、データの仕分け等が可能であった。しかし、膨大な量の画像データが蓄積されるようになると、画像データの仕分けが非常に複雑になる。画像データの検索手段を設ければ、ユーザが所望のデータに辿り着くことが容易になり、ユーザビリティが向上する。
【0004】
データ検索を行うためには、蓄積された画像データに含まれる文字情報も必要となる。
【0005】
画像データから、文字情報を取得する手段としては、光学式文字認識(OCR)が知られている。OCRを用いて画像情報から文字情報を取得し、デジタル機器に活用する手段としては、特開平7−203161号のようにファクシミリ画像の宛名欄を認識してメールボックスの振り分けに用いることや、特開平10−294818号のように取得した文字情報を予め登録したキーワードで検索し、検索にヒットした画像のみを蓄積する等の応用が提案されている。
【0006】
【発明が解決しようとする課題】
本発明が解決しようとする第1の課題は、メールボックスに格納された画像データを、ユーザが任意の時間に、任意のキーワードで検索することを可能とすることである。これは膨大な量を蓄積されたイメージサーバ上から、目的の画像を探すことを容易にし、デジタル機器のユーザビリティを向上できる。
【0007】
本発明が解決しようとする第2の課題は、PDLプリント画像、スキャン画像、FAX受信画像等の複数の異なった入力手段により入力された画像を、一意に検索することを可能とすることである。
【0008】
本発明の解決しようとする第3の課題は、デジタル機器のスループットを低下させることなく、検索精度を向上させることである。OCR処理は処理時間が長く、時間を掛けるほど文字認識の精度が上がるが、時間を掛けるとデジタル機器のスループットが低下する問題を回避することが必要である。
【0009】
本発明が解決しようとする第4の課題は、複数の機器に分散した画像データを、ユーザが一度の検索することを可能にすることである。
【0010】
【課題を解決するための手段】
第1の課題を解決するために、メールボックスに画像を記憶する際に、当該画像に含まれる文字情報を、画像データに関連付けて記憶し、検索手段を設けて、ユーザの指定するキーワードを、当該文字情報に対して検索することにより、検索機能を実現する。
【0011】
第2の課題を解決するために、スキャン画像やFAX受信画像は、OCR処理によって文字情報を抽出し、画像情報に関連付けて保存する。PDLプリント画像は、PDLデータを処理して画像データを生成すると同時に、文字印字命令から含まれる文字を別途保持し、PDLプリントによって生成された画像と関連付けてメールボックスに保存する。これにより、PDLプリントと、スキャン画像等を同じに扱え、且つ、PDLプリント画像の検索精度を高くすることができる。
【0012】
第3の課題を解決するために、画像入力時には、機械的に律速されたスキャナ入力時間内の許容される時間内で実行し得たOCR処理結果の文字情報を、画像情報と関連付けてメールボックスに記憶し、デジタル機器が処理を行っていない時間に、メールボックスに格納された画像情報に対して、更に精度の高いOCR処理を実行し、より高い精度で認識された文字情報を、画像データと関連付けてメールボックスに格納する。このことによって、OCR処理によりデジタル機器のスループットを低下させることなく、精度の高い文字認識によって確度の高い検索結果を得ることが可能となる。更に、画像入力と同時にもOCR処理を行うことによって、スキャン後即座に当該スキャン画像が検索可能になる。又、PDLプリントの画像についても、デジタル機器が他の処理を行っていない時間にOCR処理を行うことにより、PDLデータに埋め込まれたイメージ画像に含まれる文字に関しても、検索を可能とする。
【0013】
第4の課題を解決するために、デジタル機器に、ネットワークからの検索要求を受け付ける機能と、検索結果を送り返す機能を設けることにより、他の機器からの検索を可能とする。又、ネットワークに接続された複数のデジタル機器に対し、検索要求を発行する機能と、検索結果を複数の機器から受け取る機能と、受け取った検索結果を統合して表示する機能を設けることにより、ネットワークに分散した複数のデジタル機器のメールボックスへの検索を一括して行うことを実現する。
【0014】
【発明の実施の形態】
以下に本発明の形態を添付図面に基づいて説明する。
【0015】
<実施の形態1>
図1は本実施の形態に係るデジタル機器の構成を示すブロック図である。
【0016】
本実施の形態に係るデジタル機器は、スキャナ106とプリンタ108とコントローラ114から成り、ネットワークに接続される。スキャナ106でスキャンされた画像は、コントローラ114のスキャナインターフェース107、クロスバースイッチ104を介してメインメモリ103へと格納される。全体を制御するCPU102は、スキャンされた画像をデータ圧縮するためにCODEC111を起動し、続いてCPU101にOCR処理開始の要求を送信する。
【0017】
CODEC111は、スキャンされた画像をメインメモリ103から取得し、データ圧縮した後、圧縮結果を再度メインメモリ103の別の領域へと格納する。CODEC111は、圧縮処理が終了したときに、CPU102に対して終了割り込みを発生させる。CPU101は、CPU102からのOCR処理開始要求に従い、メインメモリ103に格納されたスキャン画像に対してOCR処理を開始する。
【0018】
CPU101は、初めにスキャン画像から文字らしき画像が存在する領域を選択する領域選択処理を行う。続いて、選択された領域について、輪郭抽出を行い、文字とのパターンマッチングを行う。パターンマッチングの結果、確度の高い文字を、認識文字として、HDD112に形成されたメールボックスの、文字情報格納領域に格納していく。CODEC111からの終了割り込みを受けたCPU102は、圧縮されたスキャン画像を、HDD112に形成されたメールボックスに格納する。
【0019】
CPU102は、続いてCPU101によりOCR処理の終了か、若しくは規定時間に達したかを判断し、規定時間内にCPU101のOCR処理がすべて終了すれば、メインメモリ103に確保した画像データ領域を開放してスキャン画像をメールボックスに格納する処理を終了する。もし規定時間内にCPU101にOCR処理が終了していなければ、CPU102は、CPU101に対してOCR処理中途終了要求を発行し、CPU101のOCR処理を強制的に終了させ、メインメモリ103に確保した画像データ領域を開放してスキャン画像をメールボックスに格納する処理を終了する。
【0020】
こうしてスキャン画像がメールボックスへと格納される。規定時間は、スキャナ106の機会性能によって予め設定される。規定時間内でOCR処理を終了若しくは強制終了させることで、1ページ当たりの処理時間を一定にでき、スキャナ106の機械的に制限されるスループットを低下させることなく、OCR処理とスキャン動作を両立させる。
【0021】
ホスト115がPDLデータを生成し、ネットワーク経由でコントローラ114に転送すると、PDLデータはネットワークインターフェース105、クロスバースイッチ104を介してメインメモリ103に一旦格納される。CPU102は、メインメモリ103に格納されたPDLデータの解釈を開始し、ディスプレイリストをメインメモリ103へ生成する。PDLデータを解釈する際に、PDLデータ内に文字を印字する命令を認識すると、CPU102は文字情報を同時に取り出し、HDD112内のメールボックスの文字情報領域へ格納する。CPU102は、続いてディスプレイリストに従って描画処理を行い、メインメモリ103の画像領域に、ページイメージ画像を生成する。
【0022】
CPU102は、次に生成したCODEC111を起動し、ページイメージ画像のデータ圧縮を行う。CODEC111は、メインメモリ103内に格納されたページイメージ画像を取得し、メインメモリ103の別の領域に圧縮画像を格納する。CODEC111は、圧縮処理を終了すると、CPU102に対して終了割り込みを発生する。CODEC111からの終了割り込みを受けたCPU102は、圧縮画像をHDD112内のメールボックスの画像格納領域に圧縮されたページイメージ画像を格納する。こうしてPDLプリントデータがメールボックスに格納される。
【0023】
CPU102が、現在スキャンやプリント、PDLデータ処理等のユーザの認識し得る表のデータ処理が発生していないと判断すると、メールボックスに格納された画像の再OCR処理を開始する。再OCR処理は、スキャン画像をメールボックスに格納する際のOCR処理が中途終了された場合に、文字認識精度を高めるためと、PDLプリント画像をメールボックスに格納した場合に、PDLデータ形式として文字ではなくベクタデータやイメージデータとして埋め込まれた中に文字がある場合に、これらも検索結果に反映させるために行われる。
【0024】
再OCR処理が開始されると、先ず、CPU102はHDD112内のメールボックスで再OCR処理が必要なデータがあるかを調べる。再OCR処理が必要な画像が見つかった場合には、CPU102は当該画像をHDD112からメインメモリ103へと転送する。続いてCPU102は、CODEC111を起動し、メインメモリ103に転送された圧縮画像の伸張を指示する。起動されたCODEC111は、メインメモリ103から圧縮画像を取得し、データ伸張を行い、伸張された画像をメインメモリ103の別の領域に展開する。
【0025】
伸張処理が終了すると、CODEC111はCPU102に対して終了割り込みを発生させる。終了割り込みを受けたCPU102は、次にCPU101に対してOCR処理の開始を要求する。OCR処理開始要求を受けたCPU101は、初めに展開画像から文字らしき画像が存在する領域を選択する領域選択処理を行う。続いて、選択された領域について、輪郭抽出を行い、文字とのパターンマッチングを行う。パターンマッチングの結果、確度の高い文字を、認識文字として、HDD112に形成されたメールボックスの、文字情報格納領域に追加していく。
【0026】
CPU102は、CPU101からのOCR処理終了を待つ間、スキャンやプリント、PDLデータ処理等のユーザの認識し得る表のデータ処理が発生したかを判断し、もしこれらの処理が発生したようであれば、CPU102に対してOCR処理の中途終了要求を発行し、これら表の処理に移行する。中途終了要求を受けたCPU101は、OCR処理を途中で終了する。もし表の処理が発生しなければ、CPU101はOCR処理の終了をCPU102に対して知らせる。OCR処理終了通知を受けたCPU102は、他に再OCR処理が必要なデータがメールボックス内に無いかを検索し、もし存在すれば、上記シーケンスを繰り返し、もし存在しなければ、再OCR処理を終了する。
【0027】
ユーザが操作部113を操作してメールボックスの表示を指定すると、CPU102はHDD122のメールボックスから格納情報を取得し、操作部113へ格納情報を表示する。ユーザが操作部113を操作して検索キーワードを入力し、メールボックスの検索を指定すると、CPU102は検索キーワードを用いてHDD112内のメールボックスの文字情報を検索し、検索にヒットしたデータの検索結果一覧を作成し、検索結果一覧を操作部113へ表示する。
【0028】
ユーザが検索結果一覧から所望のデータを選択し、ネットワーク転送を指示すると、CPU102はHDD112のメールボックスから指定された圧縮画像をメインメモリ103へ転送し、ネットワークインターフェース105を介してホスト115へと転送する。ユーザが検索結果一覧から所望のデータを選択し、プリントを指示すると、CPU102はHDD112のメールボックスから指定された圧縮画像をメインメモリ103へ転送し、続いてCODEC111を起動して圧縮画像を伸張し、次にCPU102はイメージ処理回路110とプリンタインターフェース109を起動して、メインメモリ103内に伸張された伸張画像を、クロスバースイッチ104、イメージ処理回路110、プリンタインターフェース109を介してプリンタ108へ転送し、メールボックス内の画像を紙にプリントする。
【0029】
図2は本実施の形態のスキャン動作のシーケンスを示したフローチャートである。
【0030】
初めにスキャナ106に対してスキャンの開始を指示し(201) 、続いてスキャンデータがメインメモリ103へ格納されるのを待ち(202)、スキャン画像がメインメモリ103へ格納されたならば、圧縮処理タスクに対して圧縮処理の開始要求を発行し(203)、続いてOCR処理タスクに対してOCR処理の開始を発行して(204)、圧縮処理終了を待つ(205)。圧縮処理要求を受けた圧縮タスクでは、CODEC111を起動して圧縮処理を開始し(211)、圧縮終了待ちを行う(212)。
【0031】
CODEC111から圧縮終了割り込みが発生したならば、圧縮終了通知を発行し(213)、圧縮処理タスクは処理を終了する。圧縮終了通知を受け取ったスキャン処理タスクは、圧縮画像をHDD112のメールボックスに格納し(206)、規定時間判断(207)とOCR処理終了判断(208)を組み合わせた待機状態に入る。もしOCR処理終了以前に規定時間に達した場合は、OCR処理中途終了要求をOCR処理タスクに発行し(209)、文字情報をHDD112の文字格納領域へ格納し(210)、処理を終了する。
【0032】
OCR処理開始要求を受けたOCR処理タスクは、OCR処理を開始し(214)、初めに文字が存在しそうな領域を選択する領域選択処理を行い(215)、続いて選択された領域に対してパターンマッチングを行う(216)。もしスキャン処理タスクから中途終了要求が届いたならば、OCR処理の中途終了処理を行い(218)、OCR処理タスクは処理を終了する。もしスキャン処理タスクから中途終了要求が届かず、OCR処理全てが終了したならば、OCR処理終了通知をスキャン処理タスクに発行し(217)、OCR処理タスクは処理を終了する。OCR処理終了処理を受け取ったスキャン処理タスクは、文字情報をHDD112の文字格納領域へ格納し(210)、処理を終了する。
【0033】
図3は本実施の形態におけるPDL処理時の処理フローを示したフローチャートである。
【0034】
初めにPDLデータを受信すると(301)、PDL処理タスクは先ずPDLデータの解釈を行い(302)、PDLデータの中に文字印字命令が含まれるかは判断し(303)、もし含まれていれば文字データをHDD112のメールボックス文字格納領域に追加し(304)、次にPDLデータが終了かを判断する(305)。字命令が含まれていないならば、HDD122への文字格納は行わず、PDLデータが終了かの判断を行う(305)。PDLデータが終了でなければ、続くPDLデータの受信を行い(301)、PDLデータが終了であれば、解釈したPDLデータに従ってディスプレイリストを生成する(306)。
【0035】
次に、ディスプレイリストに従って描画を行い、ページイメージ画像を生成する(307)。次に、生成したページイメージ画像を圧縮するために、圧縮処理タスクに対して圧縮処理開始要求を発行し(308)、圧縮処理タスクからの終了通知を待つ(309)。圧縮処理開始要求を受けた圧縮処理タスクは、CODEC111を起動し(311)圧縮処理を開始する。続いて圧縮終了を待ち(312)、CODEC111からの終了割り込みを受け取ったならば、PDLタスクに対して圧縮処理終了通知を発行し(313)、圧縮タスクは処理を終了する。圧縮処理終了通知を受け取ったPDLタスクは、圧縮画像をHDDのメールボックスに格納し(310)、処理を終了する。
【0036】
図4は本実施の形態のメールボックスの構成を示した模式図である。
【0037】
メールボックスは、HDD112内のファイルシステムを用いて、本図の構成を実現している。メールボックス内は複数のボックスに分けられており、番号と名前が付されている。メールボックスの1 番(401)は“Bob”と名前が割り当てており、ボックス内に4のドキュメントを格納する領域が確保されている。ドキュメント1 番(402)はPDLプリントの“ir5000ad_2”と名前のついたドキュメントで、このドキュメント内に圧縮されたページイメージ404と文字情報405が関連付けて格納されている。
【0038】
ドキュメント2番(403)は、スキャンデータで、ドキュメント名がスキャン時に自動的に割り振られる“scan001”となっている。このドキュメント内でも、圧縮されたページイメージ406と、OCR処理にて認識された文字情報407が関連付けられて格納される。キーワード検索時には、文字情報405,407等から文字列を検索し、該当ドキュメントを知ることができる。
【0039】
図5は本実施の形態における再OCR処理の処理フローを示したフローチャートである。
【0040】
初めに現在スキャンやプリント、PDLデータ処理等のユーザの認識し得る表のデータ処理が発生していないと判断(501)し、続いてメールボックス内に再OCRが必要なドキュメントを探して該当するドキュメントの圧縮画像をHDD112から取得し(502)、データ伸張タスクへ伸張開始要求を発行し(503)、データ伸張タスクからの伸張終了通知を待つ(504)。伸張終了要求を受けたデータ伸張タスクは、CODEC111を起動し、伸張処理を開始する。続いてCODEC111からの終了割り込みを待ち(511)、CODEC111からの終了割り込みが発生したならばメールボックス制御タスクへ伸張終了通知を発行する(512)。
【0041】
伸張終了通知を受けたメールボックス制御タスクは、次にOCR処理タスクへOCR処理開始要求を発行し(505)、表処理の発生判断と(506)とOCR終了判断(507)を組み合わせた待機状態に入る。もしOCR処理終了以前に表の処理が発生した場合には、OCR処理中途終了要求をOCR処理タスクに発行し(508)、文字情報をHDD112の文字格納領域へ格納し(509)、処理を終了する。
【0042】
OCR処理開始要求を受けたOCR処理タスクは、OCR処理を開始し(513)、初めに文字が存在しそうな領域を選択する領域選択処理を行い(514)、続いて選択された領域に対してパターンマッチングを行う(515)。もしメールボックス制御タスクから中途終了要求が届いたならば、OCR処理の中途終了処理を行い(517)、OCR処理タスクは処理を終了する。もしメールボックス制御タスクから中途終了要求が届かず、OCR処理全てが終了したならば、OCR処理終了通知をメールボックス処理タスクに発行し(516)、OCR処理タスクは処理を終了する。OCR処理終了処理を受け取ったスキャン処理タスクは、文字情報をHDD112の文字格納領域へ格納し(509)、処理を終了する。
【0043】
図6は本実施の形態の操作部における表示画面を示した模式図である。
【0044】
図6(a)はメールボックス操作画面の初期画面である。メールボックスの番号選択ボタン(601)と、メールボックスに付けられた名前(602)が表示される。この画面には検索開始ボタン(603)と検索キーワード入力枠(603)も存在する。メールボックス選択ボタン(601)が押されると、メールボックスの1番(401)が選択されたことを意味し、画面が図6(b)へ切り替わる。メールボックスの1番(401)には3つのドキュメントが格納されているので、これらのドキュメント名(606)の一覧が表示される。ドキュメント名(606)の左には、それぞれのドキュメントをユーザが選択する選択チェックボタンが(605)が存在し、ユーザがドキュメント一覧の中から任意のドキュメントを選択できる。
【0045】
図6(b)画面にはプリントボタン(607)とスキャンボタン(608)が配置されており、プリントボタン(607)が押されると、プリント処理が開始され、選択チェックボタン(605)で選択されたドキュメントがプリンタ108から出力される。スキャンボタン(608)が押されると、スキャン処理が開始され、スキャナ106から入力された画像が、新規のドキュメントとして、現在のメールボックスに格納される。
【0046】
図6(a)にて検索キーワード入力枠(603)に検索キーワード“Out”が入力され、検索開始ボタン(603)が押されると、メールボックス内の検索処理が開始され、図6(c)の画面で検索結果一覧が表示される。検索結果一覧には検索結果のドキュメント名610と、ドキュメント選択チェックボタン(609)が表示される。この画面にはプリントボタン(607)が配置されており、プリントボタン(607)が押されると、プリント処理が開始され、選択チェックボタン(609)で選択されたドキュメントがプリンタ108から出力される。
【0047】
<実施の形態2>
次に、本発明の実施の形態2について説明する。
【0048】
図7は本実施の形態に係るデジタル機器の構成を示したブロック図である。実施の形態1のコントローラ114、プリンタエンジン108、スキャナエンジン106で構成されるデジタル複合機701,702,703,704がネットワークに接続されている。ユーザがデジタル複合機701の操作部113からメールボックスのキーワード検索を指定すると、デジタル複合機701は先ずネットワークに接続され、ユーザに指定された他のデジタル複合機702,703,704へ、それぞれの機器内のメールボックス検索を依頼し、続いて自機器内のメールボックスの検索を開始する。
【0049】
デジタル複合機701は、自機器内のメールボックス検索を行うとともに、他機器702,703,704からの検索結果通知の受信を行う。自機器内の検索が終了し、検索依頼を発行した他機器からの検索結果が全て得られたならば、デジタル複合機701は検索結果を結合し、検索結果一覧を操作部113へ表示する。
【0050】
又、メールボックス検索依頼は、ホスト115からも発行される。ユーザがホスト115に対してネットワーク上のデジタル複合機群から所望のキーワードを含むドキュメントの検索を依頼すると、ホスト115は、先ず、ネットワークに対してメールボックス検索依頼をブロードキャストする。メールボックス検索依頼を受けたデジタル複合機701,702,704は、自機器内のメールボックスに対して検索を行い、検索結果をホスト115へ通知する。ホスト115はメールボックス検索依頼のブロードキャストの後、予め規定された時間だけ待ち、その時間内に応答のあった検索結果を統合し、検索結果一覧としてホスト115のユーザへ表示する。
【0051】
本実施の形態では、デジタル複合機701からの検索依頼は、ユーザの指定したデジタル複合機群への検索とし、ホスト115からの検索依頼は、ブロードキャストを用いた検索としているが、デジタル複合機701がブロードキャストにて検索依頼を発行することや、ホスト115がユーザ指定のデジタル複合機群への検索を行うことも可能である。
【0052】
図8は本実施の形態のデジタル複合機701から他機器への検索依頼処理シーケンスを示したフローチャートである。
【0053】
デジタル複合機701がユーザからの検索依頼を受け取ると(801)、先ず、ユーザに指定された他の機器への検索依頼を発行する(802)。続いて自機器内のメールボックスに対して検索を開始し(803)、検索処理を実行する(804)。メールボックス検索依頼を受けた(809,814,819)デジタル機器702,703,704は、それぞれの機器内の検索を開始し(810,815,820)検索処理を行う(811,816,821)。それぞれの検索機器内で検索処理が終了すると(812,817,822)、検索依頼元であるデジタル機器701に対して検索結果を通知する(813,818,823)。デジタル機器701は、自機器内のメールボックスを検索が終了すると(805)、次に検索を依頼した他機器からの検索結果を待つ(806)。検索を依頼した全ての機器から検索結果が通知されると、次にそれぞれの検索結果を統合して検索結果一覧を作成し(807)、検索結果一覧を操作部113へ表示する(808)。
【0054】
こうしてネットワークを介して接続された複数のデジタル機器に対して、一括してメールボックス検索を行うことが可能となる。
【0055】
【発明の効果】
以上の説明で明らかなように、本発明によれば、デジタル機器のスループットを低下させることなく、PDLプリント画像、スキャン画像等の複数の異なった入力手段により入力された画像を、一意に、高い確度で検索することが可能となるとともに、ネットワークに分散した機器内のドキュメントをも一括して検索することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係るデジタル機器の構成を示すブロック図である。
【図2】本発明の実施の形態1に係るデジタル機器のスキャン時の処理手順を示すフローチャートである。
【図3】本発明の実施の形態1に係るデジタル機器のPDL処理時の処理手順を示すフローチャートである。
【図4】本発明の実施の形態1に係るデジタル機器のメールボックスの構造を示す模式図である。
【図5】本発明の実施の形態1に係るデジタル機器の再OCR処理の処理手順を示すフローチャートである。
【図6】本発明の実施の形態1に係るデジタル機器の操作部における表示画面を示す模式図である。
【図7】本発明の実施の形態2に係るデジタル機器の構成を示すブロック図である。
【図8】本発明の実施の形態2に係るデジタル機器の処理手順を示すフローチャートである。
【符号の説明】
101 CPU
102 CPU
103 メモリ
104 クロスバースイッチ
105 ネットワークインターフェース
106 スキャナ
107 スキャナインターフェース
108 プリンタ
109 プリンタインターフェース
110 イメージ処理回路
111 CODEC
112 HDD
113 操作部
114 コントローラ
115 ホスト
601 ボックス番号選択ボタン
602 ボックス名表示部
603 検索開始ボタン
604 検索キーワード入力枠
605 ドキュメント選択ボックス
606 ドキュメント名表示部
607 プリント開始ボタン
608 スキャン開始ボタン
609 ドキュメント選択ボックス
610 ドキュメント名表示部
701〜704 デジタル複合機

Claims (18)

  1. デジタル画像を入力する手段と、デジタル画像を保持してメールボックスを形成する記憶手段と、ユーザの選択に従って記憶手段から画像データを取り出す手段と、取り出した画像データを出力する手段を有するメールボックス機能を持つデジタル機器であって、
    デジタル画像から文字を抽出する文字認識手段と、認識された前記文字を前記デジタル画像に関連付けて記憶する前記記憶手段と、ユーザが検索を希望するキーワードを入力するキーワード入力手段と、前記入力キーワードを用いて前記記憶手段に記憶された前記文字を検索する検索手段と、検索手段によって得られた検索結果から、前記関連付けに従って該当する画像のメールボックス情報を表示する表示手段と、検索結果の一覧の中からユーザが特定のデータを選択する選択手段を有することを特徴とするデジタル機器。
  2. ページの構成が記述されたデータを入力する手段と、ページ構成記述データからを解釈する解釈手段と、ページ構成記述データからラスタ形式のデジタル画像を生成する描画手段と、デジタル画像を保持してメールボックスを形成する記憶手段と、ユーザの選択に従って記憶手段から画像データを取り出す手段と、取り出した画像データを出力する手段を有するメールボックス機能を持つデジタル機器であって、
    ページ記述データの文字描画情報から文字情報を取得する文字取得手段と、取得された文字を描画後のデジタル画像に関連付けて記憶する前記記憶手段と、ユーザが検索を希望するキーワードを入力するキーワード入力手段と、前記入力キーワードを用いて前記記憶手段に記憶された前記文字を検索する検索手段と、検索手段によって得られた検索結果から、前記関連付けに従って該当する画像のメールボックス情報を表示する表示手段と、検索結果の一覧の中からユーザが特定のデータを選択する選択手段を有することを特徴とするデジタル機器。
  3. デジタル画像を入力する手段と、ページの構成が記述されたデータを入力する手段と、ページ構成記述データからを解釈する解釈手段と、ページ構成記述データからラスタ形式のデジタル画像を生成する描画手段と、デジタル画像を保持してメールボックスを形成する記憶手段と、ユーザの選択に従って記憶手段から画像データを取り出す手段と、取り出した画像データを出力する手段を有するメールボックス機能を持つデジタル機器であって、
    デジタル画像から文字を抽出する文字認識手段と、認識された前記文字を前記デジタル画像に関連付けて記憶する前記記憶手段と、ページ記述データの文字描画情報から文字情報を取得する文字取得手段と、取得された文字を描画後のデジタル画像に関連付けて記憶する前記記憶手段と、ユーザが検索を希望するキーワードを入力するキーワード入力手段と、前記入力キーワードを用いて前記記憶手段に記憶された前記文字を検索する検索手段と、検索手段によって得られた検索結果から、前記関連付けに従って該当する画像のメールボックス情報を表示する表示手段と、検索結果の一覧の中からユーザが特定のデータを選択する選択手段を有することを特徴とするデジタル機器。
  4. 文字認識手段の最大処理時間を規定する設定手段と、文字認識手段の処理時間を監視する監視手段と、監視手段に文字認識処理が最大処理時間に達したことを認識したならば文字認識処理を途中終了させる中途終了手段とを併せ持つことを特徴とする請求項1記載のデジタル機器。
  5. 文字認識手段の最大処理時間を規定する設定手段と、文字認識手段の処理時間を監視する監視手段と、監視手段に文字認識処理が最大処理時間に達したことを認識したならば文字認識処理を途中終了させる中途終了手段とを併せ持つことを特徴とする請求項3記載のデジタル機器。
  6. 文字認識処理が中途終了した場合に、途中までに認識し得た文字を、デジタル画像に関連付けて記憶する記憶手段を併せ持つことを特徴とする請求項4記載のデジタル機器。
  7. 文字認識処理が中途終了した場合に、途中までに認識し得た文字を、デジタル画像に関連付けて記憶する記憶手段を併せ持つことを特徴とする請求項5記載のデジタル機器。
  8. 機器の処理状況を検知する負荷検知手段と、記憶手段から文字認識処理が十分でない画像を調べる手段と、文字認識処理が十分でない画像を記憶手段から取得する取得手段と、記憶手段から取得した画像に対して文字認識処理を行う文字認識手段と、負荷検知手段によって機器の負荷が大きくなったことを検知して文字認識処理を途中終了させる中途終了手段と、文字認識によって認識された文字をデジタル画像に関連付けて記憶する記憶手段とを併せ持つことを特徴とする請求項4記載のデジタル機器。
  9. 機器の処理状況を検知する負荷検知手段と、記憶手段から文字認識処理が十分でない画像を調べる手段と、文字認識処理が十分でない画像を記憶手段から取得する取得手段と、記憶手段から取得した画像に対して文字認識処理を行う文字認識手段と、負荷検知手段によって機器の負荷が大きくなったことを検知して文字認識処理を途中終了させる中途終了手段と、文字認識によって認識された文字をデジタル画像に関連付けて記憶する記憶手段とを併せ持つことを特徴とする請求項5記載のデジタル機器。
  10. 機器の処理状況を検知する負荷検知手段と、記憶手段から文字認識処理が十分でない画像を調べる手段と、文字認識処理が十分でない画像を記憶手段から取得する取得手段と、記憶手段から取得した画像に対して文字認識処理を行う文字認識手段と、負荷検知手段によって機器の負荷が大きくなったことを検知して文字認識処理を途中終了させる中途終了手段と、文字認識によって認識された文字をデジタル画像に関連付けて記憶する記憶手段とを併せ持つことを特徴とする請求項6記載のデジタル機器。
  11. 機器の処理状況を検知する負荷検知手段と、記憶手段から文字認識処理が十分でない画像を調べる手段と、文字認識処理が十分でない画像を記憶手段から取得する取得手段と、記憶手段から取得した画像に対して文字認識処理を行う文字認識手段と、負荷検知手段によって機器の負荷が大きくなったことを検知して文字認識処理を途中終了させる中途終了手段と、文字認識によって認識された文字をデジタル画像に関連付けて記憶する記憶手段とを併せ持つことを特徴とする請求項7記載のデジタル機器。
  12. 機器の処理状況を検知する負荷検知手段と、記憶手段から文字認識処理が十分でない画像を調べる手段と、文字認識処理が十分でない画像を記憶手段から取得する取得手段と、記憶手段から取得した画像に対して文字認識処理を行う文字認識手段と、負荷検知手段によって機器の負荷が大きくなったことを検知して文字認識処理を途中終了させる中途終了手段と、文字認識によって認識された文字をデジタル画像に関連付けて記憶する記憶手段とを併せ持つことを特徴とする請求項2記載のデジタル機器。
  13. ネットワーク接続手段と、ユーザに検索を指定されたならば他の機器に検索開始要求を発行する検索開始要求発行手段と、他の機器から回答される検索結果通知を受け取る受信手段と、複数の検索結果を結合させる統合手段を併せ持つことを特徴とする請求項1記載のデジタル機器。
  14. ネットワーク接続手段と、ユーザに検索を指定されたならば他の機器に検索開始要求を発行する検索開始要求発行手段と、他の機器から回答される検索結果通知を受け取る受信手段と、複数の検索結果を結合させる統合手段を併せ持つことを特徴とする請求項2記載のデジタル機器。
  15. ネットワーク接続手段と、ユーザに検索を指定されたならば他の機器に検索開始要求を発行する検索開始要求発行手段と、他の機器から回答される検索結果通知を受け取る受信手段と、自機器の検索結果を含めた複数の検索結果を結合させる統合手段を併せ持つことを特徴とする請求項3記載のデジタル機器。
  16. ネットワーク接続手段と、検索開始要求を受け取る受信手段と、検索開始要求に従って記憶手段内を検索する検索手段と、検索結果を検索要求元に対して送信する検索結果送信手段を併せ持つことを特徴とする請求項1記載のデジタル機器。
  17. ネットワーク接続手段と、検索開始要求を受け取る受信手段と、検索開始要求に従って記憶手段内を検索する検索手段と、検索結果を検索要求元に対して送信する検索結果送信手段を併せ持つことを特徴とする請求項2記載のデジタル機器。
  18. ネットワーク接続手段と、検索開始要求を受け取る受信手段と、検索開始要求に従って記憶手段内を検索する検索手段と、検索結果を検索要求元に対して送信する検索結果送信手段を併せ持つことを特徴とする請求項3記載のデジタル機器。
JP2003001080A 2003-01-07 2003-01-07 デジタル機器 Pending JP2004215067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003001080A JP2004215067A (ja) 2003-01-07 2003-01-07 デジタル機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003001080A JP2004215067A (ja) 2003-01-07 2003-01-07 デジタル機器

Publications (1)

Publication Number Publication Date
JP2004215067A true JP2004215067A (ja) 2004-07-29

Family

ID=32819197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003001080A Pending JP2004215067A (ja) 2003-01-07 2003-01-07 デジタル機器

Country Status (1)

Country Link
JP (1) JP2004215067A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190114A (ja) * 2005-01-06 2006-07-20 Sony Ericsson Mobilecommunications Japan Inc 無線通信端末装置及びプログラム
JP2009169942A (ja) * 2007-12-19 2009-07-30 Canon Inc メタデータ決定方法及び画像形成装置
JP2009271729A (ja) * 2008-05-07 2009-11-19 Canon Inc 画像処理装置及びその制御方法、プログラム。
US8270717B2 (en) 2007-12-19 2012-09-18 Canon Kabushiki Kaisha Metadata determination method and image forming apparatus
US8564796B2 (en) 2008-05-15 2013-10-22 Canon Kabushiki Kaisha Image processing method and apparatus for performing notification of the presence of a file whose metadata is not generated when performing retrieval processing
US10863038B1 (en) 2019-09-19 2020-12-08 Toshiba Tec Kabushiki Kaisha Apparatus, method, and storage medium for character recognition processing

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190114A (ja) * 2005-01-06 2006-07-20 Sony Ericsson Mobilecommunications Japan Inc 無線通信端末装置及びプログラム
JP4674090B2 (ja) * 2005-01-06 2011-04-20 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 無線通信端末装置及びプログラム
JP2009169942A (ja) * 2007-12-19 2009-07-30 Canon Inc メタデータ決定方法及び画像形成装置
US8270717B2 (en) 2007-12-19 2012-09-18 Canon Kabushiki Kaisha Metadata determination method and image forming apparatus
JP2009271729A (ja) * 2008-05-07 2009-11-19 Canon Inc 画像処理装置及びその制御方法、プログラム。
US8224091B2 (en) 2008-05-07 2012-07-17 Canon Kabushiki Kaisha Image processing apparatus, method of controlling the same, and program for extracting information usable for a search
US8564796B2 (en) 2008-05-15 2013-10-22 Canon Kabushiki Kaisha Image processing method and apparatus for performing notification of the presence of a file whose metadata is not generated when performing retrieval processing
US10863038B1 (en) 2019-09-19 2020-12-08 Toshiba Tec Kabushiki Kaisha Apparatus, method, and storage medium for character recognition processing

Similar Documents

Publication Publication Date Title
US8467080B2 (en) Printing control system, printing control server, image forming apparatus, program, and printing control method
JP6799268B2 (ja) 印刷システム、画像形成装置とその処理方法及びプログラムに関する。
JP5383087B2 (ja) 画像処理システム、画像処理方法、画像処理装置およびその制御方法、ならびにプログラム
US7031982B2 (en) Publication confirming method, publication information acquisition apparatus, publication information providing apparatus and database
US7756884B2 (en) Information processing apparatus, information processing method, and program
US20160014296A1 (en) Electronic Document Generation System, Electronic Document Generation Apparatus, and Recording Medium
US10423825B2 (en) Retrieval device, retrieval method, and computer-readable storage medium for computer program
JP2005332403A (ja) 複数の装置による画像仕上げ機能の選択を単一の位置において組み合わせるシステムおよび方法
JPH1083263A (ja) 画像形成装置及び画像処理方法
US20060132820A1 (en) Image processing apparatus configured to obtain electronic data stored in storage by reading image document and method for the same
JP4960796B2 (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
JP2004215067A (ja) デジタル機器
JP2000354129A (ja) 走査システム
JP2004013210A (ja) データ処理装置
JP2006229305A (ja) ネットワーク文書管理システム
JP2012049668A (ja) 原稿読取装置、情報処理装置及び情報処理装置用のプログラム
JP3872963B2 (ja) 画像入力装置
CN102257802B (zh) 图像形成设备和图像形成设备的控制方法
US20220070306A1 (en) Information processing apparatus, system, and display method
JP5998686B2 (ja) 情報処理装置及びプログラム
US10956109B2 (en) Image forming system including plural image forming apparatuses connected via network
US20120229849A1 (en) Client apparatus and control method thereof
JP3735955B2 (ja) 画像読み取り装置および画像読み取り方法
US20110279855A1 (en) Retrieval system, image forming apparatus, and recording medium
JP2001209645A (ja) ファイリングシステム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060201

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A072

Effective date: 20060606