JP3841318B2 - アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー - Google Patents

アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー Download PDF

Info

Publication number
JP3841318B2
JP3841318B2 JP07207597A JP7207597A JP3841318B2 JP 3841318 B2 JP3841318 B2 JP 3841318B2 JP 07207597 A JP07207597 A JP 07207597A JP 7207597 A JP7207597 A JP 7207597A JP 3841318 B2 JP3841318 B2 JP 3841318B2
Authority
JP
Japan
Prior art keywords
document
icon
page
input
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07207597A
Other languages
English (en)
Other versions
JPH1021043A (ja
Inventor
ピアース マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/626,620 external-priority patent/US5903904A/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH1021043A publication Critical patent/JPH1021043A/ja
Application granted granted Critical
Publication of JP3841318B2 publication Critical patent/JP3841318B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Digital Computer Display Output (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般的にはドキュメントの記憶検索技術に係り、特に、見本ページの内容を利用するドキュメント検索及び関連したアイコンの生成技術に関する。
【0002】
なお、本発明は、本願の譲受人共有の下記米国特許出願に開示された主題を基礎としており、これら特許出願の内容はそれぞれ参照により全面的に本明細書に組み入れられる。
(1) 出願番号:08/222,281 出願日:1994年4月1日
発明者:Jonathan Hullほか
発明の名称:IMAGE MATCHING AND RETRIEVAL BY MULTI-ACCESS REDUNDANT HASHING
特許番号:5,465,353 発行日:1995年11月7日
(以下、”Hull”と呼ぶ)
(2) 出願番号:08/431,059 出願日:1995年4月28日
発明者:Mark Peairs
発明の名称:ICONIC PAPER
(3) 出願番号:08/523,731 出願日:1995年9月5日
発明者:M.Peairsほか
発明の名称:HIGH-SPEED RETRIEVAL BY EXAMPLE
(以下、”Peairs”と呼ぶ)
【0003】
【従来の技術】
ドキュメントを電子的に保管すると、紙のドキュメントを保管する場合に比べ多くの利点がある。まず、1枚の紙より安いコストで、1ページのイメージのビットマップ全体をスキャンして磁気ディスクに格納できる。また、電子的ドキュメントに対しては、テキスト及び図形のカット・アンド・ペーストといった編集操作がやりやすい。光学的文字認識(OCR)その他により情報が電子的に抽出されるか否かにかかわらず、これらの利点はある。ただし、抽出は、テキスト編集、キーワード検索といった別の利点をもたらす。”抽出された”とは、ドキュメントのイメージの単なるビットマップでない形式で格納されたドキュメントを述べるために用いられる用語である。ワード・プロセシング・ドキュメントは、抽出されたドキュメントの一形態である。
【0004】
しかし、紙媒体は依然として電子的媒体にまさるいくつかの長所を持っている。紙は、持ち運びができ、また、読み取り装置も電源も必要としないで見ることができる。標準サイズの紙は、封筒からリング・バインダーまで、多様な入れ物の間でやりとりできる。特に、紙の持つ二つの特徴、すなわち、ページ揃えした紙を高速にめくることが可能であることと、コンピュータ・モニターの解像度に比べ印刷した紙では非常に高い解像度を得られることから、閲覧が容易になる。
【0005】
ほかに、あまり顧みられない紙の特性に、触れて感知できるということ、社交上の慣用物だということがある。HarperとSellenは、”Collaborative Tools and Practicalities of Professinal Work at the Inernational Momentary Fund,”Conference Proceedings of CHI '95,Denver,pp.122−129において、紙が人間相互のコミュニケーションの重要な要素となり得ることを指摘し、「紙のドキュメントは、差し向かいの会議の中心となることができ、関係者全員に見えるように机上に置くことができる...そして紙のドキュメントは、その解釈につき合意がなされたなら儀式的に交換することができる」と述べている。
【0006】
WittakerとSchwarzは、”Back to the Future:Pen and Paper Technology Supports Complex Group Coordination,”Conference Preceedings of CHI '95,Denver,pp.495−502で、コンピュータ・コーディネーション・ソフトウエアの1グループを壁板に付けた紙に置き換えることについ述べており、それを紙の大きさ、公開性、視覚的及び材質的特性のためとする。二人はまた、紙の取り扱いに関係した単純な手の動きや筆記動作が身近な作業に対する思考力を増加させると言う。
【0007】
オフィス環境に紙が存続するならば、電子システムと紙ドキュメントを相互作用させるツールの作成を考えることは有益である。このような方法論を具体化した例に、Protofoil(登録商標)(Protofoil:Storing and Finding the Information Worker's Paper Documents in an Electronic File Cabinet”,Conference Proceedings of CHI '94,Boston,pp.180−185)があり、これはオフィス・ファイリング・システムに電子ペーパー相互作用の一形態を利用する。このシステムでは、ユーザーは、ジョブ制御及びドキュメント属性情報を与えるため、ドキュメントより前に紙のカバーシートを自動ドキュメント・フィーダーに入れる。
【0008】
電子ドキュメント・デーベース・システムにおいて、データベースよりターゲット・ドキュメントを検索するという課題に対する一般的アプローチは、各ドキュメントのキーワードのセットを、ドキュメントと物理的に一緒にして格納する方法か、あるいはむしろ、キーが索引付けされるとともにエントリーがデータベース中のドキュメントを指し示すようなルックアップテーブルに格納する方法である。ドキュメントの”抽出された”バージョンが手に入るならば、ドキュメントからキーを容易に生成できる。ドキュメントの紙のバージョンしか手に入らないときには、その紙バージョンをスキャンしてドキュメントのページのデジタルイメージを生成し、そのデジタルイメージをOCRにより処理してドキュメントのテキストを抽出し、そしてキーを抽出することができる。より労働集約的な方法で、キーを手入力することもできる。
【0009】
かかるシステムにおいては、あるドキュメントを検索するために、キーが検索エンジンに与えられる。ユーザがデータベースに格納されたすべての文書のキーを覚えられそうもない場合、ユーザは、各ドキュメントが格納される時にその見本ページをとっておき、その見本ページをページ・アナライザーに与えてキー抽出をさせることができる。
【0010】
このような一般的アプローチの欠点は、ドキュメント・データベース内のドキュメント及び見本ページを作成し抽出された形式で保存しなければならないか、あるいは、キーを決定するため見本ページに対し光学的文字認識を行わなければならないことである。かように、見本ページは、電子的なものであるか、ビットマップからキーを抽出するために必要な文字認識プロセスのスキャンニング・プロセスでエラーが起きない十分な品質のものでなければならない。
【0011】
従来技術のドキュメント・プレゼンテーション・システムの一例が、G.Story,”The RightPages Image−Based Electronic Library for Alerting and Browsing”,COMPUTER,Sept.1992に記載されているRightPagesドキュメント・プレゼンテーション・システムである。このシステムにおいては、ユーザは一連のジャーナル・カバーを提示されるので、ユーザは、そのジャーナル・カバーを閲覧して望みのジャーナルを見つけ、次にその目次を閲覧し、そのジャーナルより一つの記事を選択する。あるジャーナル記事の見本ページが選択されたならば、システムはターゲット記事をドキュメント・データベースより検索する。このRightPagesシステムの欠点は、アイコンがコンピュータ・モニタに表示されるため印刷より解像度が低いことと、ジャーナル・カバーとページとの間のリンクが予め存在しなければならないことである。このように、ユーザは見本ページを閲覧するにはコンピュータ・モニタのところにいなければならない。
【0012】
Hullの教示するドキュメント記憶検索システムは、保有しているターゲット・ドキュメントの紙の見本ページを検索エンジンに与えることによってターゲット・ドキュメントをデータベースより検索するためのシステムである。検索エンジンは、見本ページを解析し、データベース内のドキュメント中で整合していそうなものを決定する。しかし、非常に多くのドキュメントが格納されることになる場合には、見本ページの保管及び編成が、ドキュメント・データベース記憶によって緩和に努めているのと同じいくつかの問題点、例えば、紙のページのために保管スペースを割り当てて、それらページを系統だてて整理しておかなければならないといった問題を生じさせる。
【0013】
したがって、必要とされるのは、ドキュメントの検索及び管理に利用するための見本ページを効率的に記憶するシステムである。
【0014】
【発明が解決しようとする課題】
本発明は前述の考察に鑑みてなされたもので、その主たる目的は、ドキュメント検索のための改良されたアイコンの生成方法、改良されたドキュメント検索方法、及び、改良されたドキュメント・サーバーを提供することにある。
【0015】
【課題を解決するための手段】
請求項1の発明は、ドキュメント記憶システムにおいて、所定の言語タイプのテキストを含むドキュメントを象徴する視覚的手がかりであるアイコンを生成する方法であって、
該ドキュメントより見本ページを特定するステップ、各領域のイメージ種類に基づいて該見本ページを複数領域に分割するステップ、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小するステップ、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成するステップからなり、
該縮小のステップは、単語間にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出するステップ、単語間スペースを検出するステップ、及び、単語を、その単語中の文字数によって決まる長さを持つ実線で置き換えるステップを含むことを特徴とする
【0016】
請求項2の発明は、ドキュメント記憶システムにおいて、所定の言語タイプのテキストを含むドキュメントを象徴する視覚的手がかりであるアイコンを生成する方法であって、
該ドキュメントより見本ページを特定するステップ、各領域のイメージ種類に基づいて該見本ページを複数領域に分割するステップ、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小するステップ、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成するステップからなり、
該縮小のステップは、均一にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出するステップ、検出された文字の範囲の文字密度を検出するステップ、及び、該文字を、検出された文字密度をもとに区別可能な文字密度を持つ文字ブロックで置き換えるステップを含むことを特徴とする。
【0017】
請求項3の発明は、請求項1又は2記載のアイコン生成方法において、アイコンを紙に印刷するステップをさらに含むことを特徴とする。
【0018】
請求項4の発明は、請求項1又は2記載のアイコン生成方法複数のアイコンを蓄積し、1枚につき複数のアイコンを含む少なくとも1枚の案内ページを印刷するステップをさらに含むことを特徴とする。
【0019】
請求項5の発明は、請求項1又は2記載のアイコン生成方法において、該領域分割のステップは、テキスト、線画、写真及び機械読み取り可能な印刷データ構造の中より選択されたイメージ種類を持つ領域に分割するステップであることを特徴とする。
【0020】
請求項6の発明は、請求項1又は2記載のアイコン生成方法において、該領域分割のステップはテキストをフォント・サイズに基づいて別々の領域に分離することを特徴とする。
【0021】
請求項7の発明は、請求項1又は2記載のアイコン生成方法により作成された、複数のドキュメント中のドキュメントに関連した複数のアイコンを含む案内ページを用いて該複数のドキュメントよりターゲット・ドキュメントを選ぶドキュメント検索方法であって、
案内ページ上の、該ターゲット・ドキュメントに関連したアイコンに付けられた選択指示のマークによりアイコンを選択するステップ、
該選択されたアイコンをスキャンして該アイコンの電子的表現を生成するステップ、
該アイコンの電子的表現から、該見本ページの特徴を抽出するステップ、
該特徴を利用し、該特徴と整合する、該ターゲット・ドキュメントを含む少なくとも1つのドキュメントを特定するステップ、及び、
該ドキュメント・サーバーを利用し該ターゲット・ドキュメントを選ばれた形態で提供するステップ、
からなることを特徴とする。
【0022】
請求項8のドキュメント・サーバーは、電子的表現のドキュメントを格納するドキュメント・データベースと、
入力ドキュメントを該ドキュメント・データベースに格納するのに適した電子的表現に変換するドキュメント入力用入力手段と、
該入力ドキュメントの見本ページの可視的縮小表現であるアイコンを生成する、該入力手段と接続されたページ・プロセッサと、
該入力ドキュメントの電子的表現を解析し、該入力ドキュメントのテキストの識別特徴を抽出して、該入力ドキュメントに係わるテキストのハッシュされた冗長記述子であるキーを生成する、該入力手段と接続されたキー・ジェネレータ、
該キーを記憶しかつ該ドキュメント・データベース中のドキュメントに関連付けるための、該キー・ジェネレータと接続されたインデックス手段、
ターゲット・ドキュメントのアイコンを入力するためのアイコン入力手段、
該アイコンからアイコン特徴を抽出するための、該アイコン入力手段と接続されたアイコン解析手段、
該アイコン特徴を問い合わせに変換し、該問い合わせを使って該ターゲット・ドキュメントを含む少なくとも1つの整合ドキュメントへの参照を取得する、該アイコン解析手段及び該インデックス手段と接続された検索エンジン、
及び
該ターゲット・ドキュメントをユーザの指定した形態で提示するためのプレゼンテーション・エンジンからなり、
該ページ・プロセッサは、該入力ドキュメントより見本ページを特定し、各領域のイメージ種類に基づいて該見本ページを複数領域に分割する手段、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小する手段、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成する手段を備え、
該縮小する手段は、単語間のスペースをあける言語タイプのテキスト内容を示すイメー ジ種類を持つ領域に対し、文字の範囲を検出し、単語間スペースを検出して、単語を、その単語中の文字数によって決まる長さを持つ実線で置き換えることを特徴とする。
【0023】
請求項9のドキュメント・サーバーは、電子的表現のドキュメントを格納するドキュメント・データベースと、
入力ドキュメントを該ドキュメント・データベースに格納するのに適した電子的表現に変換するドキュメント入力用入力手段と、
該入力ドキュメントの見本ページの可視的縮小表現であるアイコンを生成する、該入力手段と接続されたページ・プロセッサと、
該入力ドキュメントの電子的表現を解析し、該入力ドキュメントのテキストの識別特徴を抽出して、該入力ドキュメントに係わるテキストのハッシュされた冗長記述子であるキーを生成する、該入力手段と接続されたキー・ジェネレータ、
該キーを記憶しかつ該ドキュメント・データベース中のドキュメントに関連付けるための、該キー・ジェネレータと接続されたインデックス手段、
ターゲット・ドキュメントのアイコンを入力するためのアイコン入力手段、
該アイコンからアイコン特徴を抽出するための、該アイコン入力手段と接続されたアイコン解析手段、
該アイコン特徴を問い合わせに変換し、該問い合わせを使って該ターゲット・ドキュメントを含む少なくとも1つの整合ドキュメントへの参照を取得する、該アイコン解析手段及び該インデックス手段と接続された検索エンジン、
及び
該ターゲット・ドキュメントをユーザの指定した形態で提示するためのプレゼンテーション・エンジンからなり、
該ページ・プロセッサは、該入力ドキュメントより見本ページを特定し、各領域のイメージ種類に基づいて該見本ページを複数領域に分割する手段、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小する手段、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成する手段を備え、該縮小する手段は、均一にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出し、検出された文字の範囲の文字密度を検出し、該文字を、検出された文字密度をもとに区別可能な文字密度を持つ文字ブロックで置き換えることを特徴とする。
【0024】
【発明の実施の形態】
改良されたドキュメント・サーバーが本発明により提供される。ドキュメント・サーバーとは、ドキュメントのデータベースを、抽出され構造化された形で、ドキュメントの紙のページのデジタル化イメージとして、又はその両方の組合せの形で維持するコンピュータ・システムである。ターゲット・ドキュメントは、ドキュメント・データベース中の検索したいドキュメントである。ターゲット・ドキュメントを検索するには、ターゲット・ドキュメントの1つ以上の特徴、例えばキー、固有ラベル又は見本ページを表す入力がドキュメント・サーバーに与えられる。典型的には、一つのドキュメントがドキュメント・サーバーに与えられ、その1つのページだけ保有される。そして、この保有されたページを、そのドキュメント全体が欲しい時に与えられる見本ページとして利用できる。見本ページは、ドキュメントの最初のページとしてよいが、ターゲット・ドキュメントをドキュメント・データベース内の他のドキュメントから識別できる限り、最初のページである必要はないしドキュメントの1ページ全体である必要さえもない。見本ページは、ターゲット・ドキュメントを完璧に識別する必要はない。ターゲット・ドキュメントとよく整合する候補整合ドキュメントの小集合を特定することでも、それらをユーザに提示して、その中からターゲット・ドキュメントを選択させることができれば、それで十分であるからである。
【0025】
本発明の一つの利点は、アイコンに、人間と機械の両方が判読できるデータを用いることである。
【0026】
本発明によるドキュメント・サーバーの一実施例においては、ドキュメント・データベース内の各ドキュメントの見本ページがページ・プロセッサにより処理されて、その見本ページのアイコンが生成される。典型的には、この処理は、ドキュメントが初めてドキュメント・データベースに格納される時に実行される。ページ・プロセッサは、単語間にスペースをあけるタイプの言語のテキスト、均一にスペースをあけるタイプの言語のテキスト、線画、写真、その他グラフィックス、縁飾り、着色領域、グリフ(glyph)、バーコードといったイメージ種類
に応じたセグメント領域に、見本ページを領域分割する。勿論、すべての見本ページですべてのイメージ種類を見つける必要はなく、また、イメージ種類はここに述べたものに限定されない。領域分割の後、各領域は、そのイメージ種類に適する方法で、特徴付けされて縮小される。例えば、テキスト領域内のテキストは、ブロックフォント(後述)で置き換えられてから縮小され、一方、グラフィックス領域は解像度が下げられる(画素の精密さ及び/又は単位面積あたりの画素数を減らすことによる)。そして、縮小された見本ページの領域は再組立されて見本ページのアイコンとなる。
【0027】
本発明の一具体例では、多くのアイコンを単一のページ(本明細書では”案内”ページと呼ぶ)に印刷することができる。これらのアイコンは、人間により認識可能であり(つまり元のページ・イメージとの類似点を保持している)、かつ、機械により判読可能である(つまり、ドキュメント・データベース内のあるドキュメントの電子的バージョンのロケーションを示す固有のアドレスをアイコンのイメージから抽出できる)。これは、”見本による問い合わせ”のより単純なケースというよりも、むしろ”見本による検索”であって、その見本はアイコン代役表現である。
【0028】
この案内ページが、又はアイコン数によっては複数の案内ページが、ユーザに提供される。あるドキュメントを検索するためには、ユーザは案内ページをざっと見て、ターゲット・ドキュメントと関係しているように見えるアイコンを見つけ、その選んだアイコンの指定をドキュメント・サーバーに与える。
【0029】
アイコンがスキャンされると、ドキュメント・サーバーはアイコンの内容を解析し、そのアイコンにより代表される見本ページの識別特徴を検出し、それら特徴を検索エンジンに与える。そうすると、検索エンジンはドキュメント・データベース内の候補整合ドキュメントを見つける。ドキュメント・サーバーは、2つ以上の候補整合ドキュメントが返ってきたときには、ユーザが候補整合ドキュメントよりターゲット・ドキュメントを手作業で選択できるように、各候補整合ドキュメントについての情報、例えば候補整合ドキュメントの一部分の簡略イメージを提供する。
【0030】
あるいはまた、各アイコンに固有の英数字コード又は機械判読可能なバーコードのような識別ラベルを割り当てることもでき、ユーザはその識別ラベルをターゲット・ドキュメントの検索のためにドキュメント・サーバーに与える。この場合、ドキュメント・サーバーはドキュメント検索のためにアイコン・イメージの内容を利用する必要はないが、それでもなおユーザにとって、ターゲット・ドキュメントのコンパクトな視覚的手がかりを与えるのにアイコンは有益である。案内ページを用いれば、ユーザは多くのアイコンに素早く目を通すことができる。前記のようなページ縮小プロセスであるため、見本ページの識別特徴はアイコン化プロセスの間中保存され、識別情報をユーザに識別できるようにしたままアイコンを小さくすることができる。一つ一つのアイコンに固有の識別子を持たせるかわりに、アイコンを、それが見つかる案内ページの固有の識別子と、その案内ページ上の位置(例えば行/列)とにより指定してもよい。
【0031】
前記具体例の変形を考察する。例えば、ユーザがあるアイコンを丸で囲んだ案内ページを与えることによって、デジタルコピアにある完全なドキュメントを出力させるように、ドキュメント・サーバーをデジタルコピアと合体させてもよい。このデジタルコピアは、与えられた案内ページをスキャンし、そのアイコンの内容より情報を抽出するか、あるいは、案内ページ識別子を抽出しかつ案内ページ上のそのアイコンの位置を測定することになろう。分散したドキュメント・サーバーが利用され、そして同じドキュメントに対し異なったユーザによって異なった案内ページが用いられる場合、アイコンの内容だけからアイコンを識別するという前者の選択肢のほうが好ましいやり方である。アイコンのスキャン及びドキュメントの印刷のためのインターフェイスは、普通のファクシミリ装置にすることができるから、広域遠隔ドキュメント検索が可能になる。
【0032】
実施例によっては、一つのドキュメントに対し、そのドキュメントの見覚えのある部分をユーザが見つける確率を高めるため複数のアイコンが用意されるかもしれない。これは、案内ページ又はアイコンの数がそれほど制約を受けない場合に適する。また、必要ならば、ドキュメント・サーバーは、ターゲット・ドキュメントを印刷したいけれども、長いドキュメントの数ページだけしかユーザが必要としない時などに、ターゲット・ドキュメントの一部分だけの検索を選択する機能がユーザに与えられるかもしれない。
【0033】
ページ・プロセッサのある具体例において、文字はブロック化され、単語間スペースが検出され、単語の文字はその単語長に比例した長さの1本の線に置き換えられる。これは、アイコンから単語長を抽出する際の誤り率を減らす一方法である。誤り率を減らすことの一つの利点は、その分だけ小さなアイコンが使用可能になることである。
【0034】
ドキュメントの識別のためにアイコンを用いるのではなく、電話番号や電子メール・アドレス等のデータ要素を検索するためリストから一つの選択を入力するといった、別種のデータの入力の必要をなくすための紙インターフェイスとしてアイコンを利用することもできる。
【0035】
本発明の性質及び利点は、明細書の以下の部分及び添付図面を参照することにより、一層よく理解されよう。以下、本発明の好適実施例について図面を用いて説明する。
【0036】
図1は本発明の一実施例によるドキュメント・サーバー10を示している。ドキュメント・サーバー10は、入力ドキュメント(例えば12)を受け取って格納し、またドキュメントを得るためのユーザ・リクエストに応答する。図1には、3つのユーザ・リクエストがアイコン14、ラベル16及び案内ページ18によってそれぞれ示されているが、ここに示されたリクエストの組合せを含め別の形式のリクエストも可能である。ユーザ・リクエストは、ドキュメント・サーバー10に格納されている特定のドキュメント、例えば図1に示したターゲット・ドキュメント20に対する要求である。ドキュメント・サーバー10は、入力されたリクエストだけを根拠にして、あるいは必要ならば、ほぼ整合するドキュメント(候補整合ドキュメント)の集合からの選択をユーザにさらに促すことによって、ターゲット・ドキュメント20を与える。入力ドキュメント12が紙のドキュメントのときには、それらはスキャナ30によってスキャンされデジタル・イメージにされてからドキュメント記憶ユニット32に与えられる。そうでなくて、入力ドキュメント12が電子的形態で与えられるときには、それらは直接的にドキュメント記憶ユニット32へ与えられ、スキャンされる必要はない。ドキュメント記憶ユニット32は、入力ドキュメント12を処理して入力ドキュメント12のアイコン34を生成し、入力ドキュメント12のデジタル表現をドキュメント・データベース36に格納すると同時に、ドキュメント索引データを生成してドキュメント・インデックス・テーブル38に格納する。
【0037】
ドキュメント記憶ユニット32は、アイコン42のようなアイコンを生成するページ・プロセッサ40、キー・ジェネレータ44、及びオプションのアイコン・シリアライザー(serializer)46からなる。ページ・プロセッサ40は、ドキュメント・サーバー10に入力中のドキュメント12より得られた見本ページを処理してアイコンを生成する。このプロセスは後により詳しく説明する。キー・ジェネレータ44は、入力ドキュメント12より情報を抽出して、格納後にドキュメント12のロケーションを突き止めるために用いられるキーを生成する。場合によっては、キー・ジェネレータ44は、ドキュメント12が構造化ドキュメントであれば、ドキュメント12のテキストをスキャンするが(又は初めに文字認識を行うが)、やはりHullの教えるところの記述子に基づいてキーを生成する。これら生成されたキーは、ドキュメント・データベース36内のドキュメント12のロケーションを指すポインタと一緒にドキュメント・インデックス・テーブル38に格納される。
【0038】
アイコン識別子が用いられる場合、アイコン・シリアライザー46によってアイコン識別子が生成されてアイコン42に付加され、アイコン42はドキュメント要求者が利用可能な形でアイコン34として出力される。アイコン・シリアライザー46は通常、個々のアイコンの識別に用いられる番号又はコードをインクリメントし、この番号又はコードはドキュメント・インデックス・テーブル38へも送られてドキュメント12のためのキーとして利用される。アイコン・シリアライザー46は、順序を変更するため必要に応じて初期化することができる。順序変更の一つの使い道は、各ユーザが自分のドキュメントの案内ページを保有し、自分のアイコンのために連続番号を欲する場合である。この場合、例えば、案内ページはスキャン・ジョブの最初のページとして与えられ、そして、ページ・プロセッサ40又はキー・ジェネレータ44が最初のページを案内ページと認識し、既存のアイコンの連続性を抽出してその情報をアイコン・シリアライザー46に渡すことにより次のアイコンを順に連続化できるようにする。勿論、案内ページ全体をアイコン・シリアライザー46に与えてもよく、そうすればアイコン42を案内ページに追加し、アイコン42及び当該案内ページより得られた前のアイコンを全て含んだ新たな案内ページをユーザに対し印刷することができるようになる。
【0039】
ドキュメント・サーバー10のドキュメント検索ユニット50によってドキュメント・データベース36からドキュメントが検索されるが、このドキュメント検索ユニット50は、ユーザ・リクエストを受け取ってターゲット・ドキュメント20をもって応答する。ユーザ・リクエストはドキュメント検索ユニット50に直接的に与えられるように図1には示されているが、ユーザ・リクエストは遠隔地より、例えばネットワークを通じて又はファクシミリ装置を介して与えられてもよい。ここに示されたドキュメント検索ユニット50は、解析エンジン52、検索エンジン54及びプレゼンテーション・エンジン56を備える。解析エンジン52は、ユーザ・リクエストを受け取るように接続されており、また、後に詳述するようにリクエストの特徴を検索エンジン54に与えるため検索エンジン54と接続されている。検索エンジン54はさらにドキュメント・インデックス・テーブル38に対し、キーを送って整合ドキュメントへのポインタを受け取るように接続されている。検索エンジン54はプレゼンテーション・エンジン56とも、候補ドキュメントのリスト(キーがターゲット・ドキュメントを固有的に特定するに足る場合には唯一つのドキュメントだけからなるリストもある)を送るため接続されている。プレゼンテーション・エンジン56は、ドキュメント・データベース36からドキュメントを取り出すためにドキュメント・データベース36とも接続され、また、デジタル・コピア、コンピュータ・ディスプレイ、プリンタ、ファクシミリ装置、電子メール・サーバー等の様々な出力装置(不図示)と接続されている。
【0040】
動作であるが、フラットベッド・スキャナ、ハンドヘルド・スキャナのような一般的な入力装置又はあまり一般的でないコンピュータ・インターフェイス付デジタル・コピアのような入力装置を利用して、ユーザ・リクエストが解析エンジン52に与えられる。ユーザ・リクエストがアイコンの形式のときには、解析エンジン52は、そのアイコンの内容より情報を抽出する。ユーザ・リクエストがアイコン識別子(アイコンID、又は案内ページとアイコン位置)の形式のときには、その識別子が利用される特徴そのものである。解析エンジン52は抽出した特徴を検索エンジン54に与える。好適な実施態様においては、一般的でない特徴ほど、一般的な特徴より大きなウエートが与えられる。非常に一般的な特徴は無視されることさえあり得る。
【0041】
検索エンジン54は、抽出された特徴を用い、ターゲット・ドキュメントを検索するためのキーを生成する。Hullは、ドキュメントのハッシュされた冗長記述子(当該ケースではキーの役割をすることになろう)を格納することを教示する。アイコンの内容ではなくアイコン識別子が利用される場合には、その識別子がキーとして利用される。このキーは、1つ以上の整合したもの、つまり候補整合ドキュメントのリストを検索するようにドキュメント・インデックス・テーブル38に索引付けされる。アイコン識別子が利用される場合には、普通、候補整合ドキュメントは唯一つだけ存在する。ただし、一つのアイコンがあるドキュメントの複数のバージョンを選択することがあるシステムでは、候補整合ドキュメントが2つ以上あるかもしれない。
【0042】
検索エンジン54は、整合したもののリストをプレゼンテーション・エンジン56に与える。そうすると、プレゼンテーション・エンジン56は、ドキュメント・データベース36より候補整合ドキュメントを取り出し、それらをユーザ・リクエストで与えられたプレゼンテーション命令に従って提示する。例えば、ユーザは、そのドキュメントをコンピュータ・モニター上で見ることを要求してもよいし、あるいは印刷させることを要求してもよい。デジタル・コピアが利用される場合には、ドキュメントの印刷の要求であることは自明である、すなわち、ユーザがドキュメントを要求すると、デジタル・コピアはそのドキュメントを印刷すべきものとみなす。プレゼンテーション・エンジン56は、ユーザが候補整合ドキュメント又はそれらの簡略イメージを閲覧できるようにし、そのどれが求めているドキュメントであるか指定する選択をキーボード又はマウスより受け取るための対話型インターフェイスを含んでもよい。
【0043】
図2はページ・プロセッサ40をより詳しく示す。ページ・プロセッサ40は、その入力としてページ100のデジタル表現を受け取り、ページ100のアイコン表現としてアイコン102を出力する。図2において、ページ100はテキスト領域104とグラフィックス領域106を持っているとして表されており、ページ・プロセッサ40はセグメンテーション・アナライザー108、テキスト・リデューサー(reducer)110、グラフィックス・リデューサー112及びページ・リアッセンブラー(reassembler)114を備えているものとして表されている。セグメンテーション・アナライザー108は、入力したページ100からページ100の様々な領域のマップ116を作成する。本例では、マップ116は、一つのテキスト領域と一つのグラフィックス領域だけからなる。勿論、一般的なドキュメントは、より変化に富んだ領域を持つ、より複雑なページを含むかもしれない。
【0044】
ページ100及びページ領域分割結果(マップ)116は、テキスト・リデューサー110及びグラフィックス・リデューサー112に与えられる。あるいは、転送時間及び記憶スペースを節約するため、ページ100を判明した領域の種類毎に前もってサブページに分割してもよい。いずれにしても、特定のリデューサーは、その領域種類のみ処理する。2つのリデューサーしか示されていないが、別のリデューサーも利用されるかもしれない。例えば、セグメンテーション・アナライザー108がグリフ(機械読み取り可能なマーク)又はバーコードの領域を検出した場合、グリフ又はバーコードのリデューサーが利用されることになろう。当該リデューサーは、ただグリフ又はバーコードにエンコードされた情報を読み取り、その情報をより小さな面積にエンコードした機械読み取り可能なマークを生成するにすぎないであろう。
【0045】
領域それぞれが縮小されると、それらはページ・リアッセンブラー114によって再組み立てされてアイコン102となる。ページ領域分割の一般的な方法は、Cullen,J.F.,and Ejiri,K.1“Weak Model-Dependent Page Segmentation and Skew Correction for Processing Document Images”,Preceedings of 2nd International Conference on Document Analysis and Recogniton 757-60(1993)に示されている。
【0046】
今問題にしている圧縮方法は、小さなアイコンが人間に認識可能である(ただし必ずしも判読可能でない)とともに、それがドキュメントの要求に用いられた時に解析エンジン52によって識別できるというようなものである。
【0047】
例えば、テキスト・リデューサー110はただ単にテキスト領域を縮小するたげではない。ドキュメントを解析エンジン52が識別しやすくするために、テキスト領域内の各文字はブロックフォント文字に置き換えられる。図3はアイコン化されるページ300の一例を示す。図4はページ300から作られたアイコン400を示す(アイコン400(a)は原寸大で表されたアイコンであり、アイコン400(b)は典型的な案内ページに見られるサイズで表されたアイコンである)。図4においては、各文字は一つのブロック文字に置き換えられている。これによってテキストは判読不可能になるが、ユーザにとって判読し理解することができるものである必要はない。また、実際の文字が特徴として用いられなければ、解析エンジン52にとって判読可能である必要もない。例えばHullにあ400のように文字をブロックに置き換えることにより、アイコン400を複写又はファクシミリ伝送しても単語長の保存が確実になる。ブロックはいくつかの方法で生成できる。その一つはブロックのフォントを用いる方法であり、文字の表示毎にフォント文字を表示することによってイメージが生成されるワード・プロセシング・ファイルのような構造化ドキュメントに用いるのに適する。例えば、ある構造化ドキュメントにASCIIコード'65'が格納されているとする。ディスプレイ・ドライバーは、そのコードをフォント・テーブルへのインデックスとして使って、文字イメージ”A”を取り出し表示するであろう。ブロックを生成するためには、そのフォント・テーブルをすべてブロックの文字イメージに置き換えればよい。もっとも、スペース文字(それに恐らく他の句読点類)は別であることは当然である。ページ100が構造化ドキュメントとして表現されておらず、ページの単なるイメージ(例えばビットマップ)である場合、各文字を外接枠で囲み、その内部を埋めることができる。この方法によれば、中間的な文字認識ステップの必要性も、それに伴う誤りもなくなる。
【0048】
さらに高い再現性を得るために、単語を線に置き換えることができる。これを行うには、文字の外接枠と単語間スペースが測定される。次に、外接枠は均一の間隔で並べられ、そして一本の線分に置き換えられる。かくして、テキストの各行は共線的な線分に置き換えられ、各線分の長さは置き換えられる単語の文字数に比例する。
【0049】
縮小プロセスを高精度化する方法として、セグメント・アナライザー108は大きなフォントのテキストと小さなフォントのテキストを別々に分類してもよい。そうした場合、大きなフォントのテキストは、縮小されてもユーザーが内容を判読できように、文字認識とともに又は文字認識なしに、テキストを比例的に縮小するリデューサーによって処理されることになろう。小さなフォントのテキストは、前述のように文字をブロック又は線に置き換えるリデューサーによって処理されることになろう。
【0050】
多色ドキュメントの場合、見本ページからアイコンへの縮小において色を保存してもよい。
【0051】
もう一つの高精度化の方法は、各ブロック文字をテキスト・ベースラインに沿って配置し、各単語中の各ブロック間に一定のスペースをあけることである。これによって、文字ブロックパターンのイメージ処理特徴検出を助成できる。
【0052】
一実施例では、グラフィックス領域106等において線画が検出された場合、グラフィックス・リデューサー112は、その線画を写真とは違ったやり方で処理する。線画は、輪郭が比較的はっきりしていてグレーのシャドーを用いないグラフィックスである。線画は、それらの識別性をさらに高めるよう、細線化のような構造保存操作によって縮小される。
【0053】
図5はアイコンの相対的な大きさを説明する図である。図5は、アイコン102と同様なアイコン及び49アイコン/枚(7行×7アイコン;両面なら98アイコン)のスペースを含む案内ページを示す。ただし、アイコンをさらに小さくしてもよい。このような両面の案内ページを10枚用いれば、ユーザはドキュメント・サーバー10に格納された約1000ドキュメント(その総ページ数は数万ページになるかもしれない)分の見本ページのアイコンをざっと見ることができる。ドキュメント・サーバーが要求に応じ案内ページをプリントアウトすることができれば、ユーザは案内ページを保有する必要もない。アイコンを、ドキュメント・データベース36内のドキュメントと一緒に格納したり、あるいはドキュメント・インデックス・テーブル38内のキーデータと一緒に格納したりすることさえも可能である。
【0054】
アイコン102のもとになったページ100を含むドキュメントの写しを検索するには、ユーザは案内ページ500上のアイコン102を丸で囲み、その案内ページをドキュメント・サーバー10に与えれるだけでよい。案内ページ500はドキュメントの管理のためにも利用し得る。例えば、ドキュメント・サーバー10は、アイコンに”X”印が付けられた案内ページを、対応したドキュメントをドキュメント・データベース36より削除することを指示すると受け取るようにプログラムされてもよい。ドキュメント・サーバー10は、アイコンのように見えるものからドキュメントの試し検索を行うことによって、案内ページと他のページとの自動識別を試みてもよい。そのようにしてドキュメントが検索されたならば、そのページは案内ページであると推定される。
【0055】
図6は、本発明に従ってドキュメント・データベースにドキュメントを格納するプロセスのフローチャートである。このプロセスは、ユーザがドキュメントをドキュメント・サーバーに与えた時に開始する。ステップS1において、一つのドキュメントが(それがまだ電子的形態でなければ)スキャンされる。ステップS2において、該ドキュメントがドキュメント・データベースに格納され、また、キーが使用されるときには、該ドキュメントよりキーが抽出される。前述の如く、キーとして利用するための冗長特徴を抽出する一方法がHullによって教えられる。次に、アイコンの生成に用いられる見本ページが該ドキュメントより選択される(S3)。見本ページの選択が自動選択の場合、ドキュメント・サーバーは、常にドキュメントの第1ページを選択してもよいし、ドキュメントの各ページを調べて見つかることの希な特徴を突き止め、例えば、大部分がテキストのドキュメント中のグラフのページ、大部分がグラフィックのドキュメント中のテキスト・ページを選択し、あるいは全ページを選択するように決めてもよい。自動選択でない場合には、覚えやすい見本ページをユーザが選択すればよい。
【0056】
見本ページが選択されたならば、見本ページは領域分割されて、見本ページの領域のマップすなわちレイアウトが作成される(S4)。これら領域のそれぞれは、その領域のイメージ種類に特有の縮小方法によって縮小され(S5)、縮小された領域はアイコンの電子的表現に再組立される(S6)。アイコンIDが使用されるなら、その電子的表現にアイコンIDが付加される(S7)。
【0057】
この電子的アイコンは同じ案内ページに関係した他の電子的アイコンに追加され(S8)、このアイコンを持つ案内ページは必要に応じて印刷される(S9)。案内ページは、普通、各アイコンの後では印刷されず、ドキュメント格納プロセスの終了時又は一つの案内ページが一杯になった時に印刷される。
【0058】
アイコンが印刷されるか、後で印刷するため他のアイコンと一緒に格納されたならば、ドキュメント・サーバーはまだほかにドキュメントがあるかチェックする(S10)。ほかのドキュメントを処理しなければならないときには、当該プロセスはステップS1に戻って継続するが、そうでなければ当該ドキュメント格納プロセスは終了する。
【0059】
図7は図6に示したプロセスに従って格納されたドキュメントの検索のためのプロセスのフローチャートである。この検索プロセスは、検索しようとするターゲット・ドキュメントの見本ページを表すアイコンをユーザがドキュメント・サーバーに与えた時に開始し、そのアイコンがスキャンされる(ステップR1)。次にステップR2において、ドキュメント・サーバーはアイコンのスキャン・イメージよりアイコン識別子(アイコンの特有の識別子、あるいは案内ページ識別子と案内ページ上のアイコン位置)を入手できるか否か判定する。当該アプリケーションが異なったシステムで異なった案内ページが使用されることを考慮しているならば、ドキュメント・サーバーは、アイコン識別子が、それが使用されるシステムにとって妥当であるかのチェックも行うかもしれない。ドキュメント・サーバーはまた、アイコン識別子が正しいことを確かめるための相互参照としてアイコンの内容そのものを利用するかもしれない。
【0060】
アイコン識別子が与えられない、すなわち使用されないときには、ドキュメント・サーバーは前述のようにアイコンの内容を解析して、検索エンジンにより整合ドキュメントの検索のために利用される特徴を抽出する(R3)。アイコン識別子が使用されるときには、そのアイコン識別子が抽出されて検索エンジンに与えられる(R4)。いずれの場合も、検索エンジンはターゲット・ドキュメントを探索し(R5)、そして、2つ以上の整合ドキュメントが見つかったか調べる(R6)。2つ以上のドキュメントが見つかったときには、ユーザはそれらの整合ドキュメントを提示され、その中からターゲット・ドキュメントを選択するよう求められる(R7)。唯一つのドキュメントが選択されたときには、それがターゲット・ドキュメントとして返される(R8)。
【0061】
このように、ユーザは、簡単にドキュメントを格納して、わずか数枚のアイコン案内ページを使ってドキュメント・サーバーよりドキュメントを取り出すことができる。ドキュメント・サーバーに関する以上の説明から、いくつかの応用、利用が思い浮かぶ。例えば、ユーザが、ドキュメント・サーバーの一部をなすデジタル・コピア/スキャナにドキュメントを与える。このドキュメントはスキャンされ、そしてドキュメントの原ページは消去されてリサイクルされ、ユーザには、そのドキュメントのアイコンを含んだ案内ページ(必ずしも1対1の関係ではない)が提供される。
【0062】
必ずしも好適な実施態様ではないけれども、アイコンがドキュメント・サーバーに電子的に格納され、その後、要求された時に案内ページが印刷出力されるようにしてもよい。アイコンが電子的に格納されるときには、新しいアイコンが追加された時に更新された案内ページを印刷出力するのは簡単なことである。しかしながら、持ち運びできる案内ページを持つ利点は失われ、ユーザはドキュメントを検索しようとする都度、ドキュメント・サーバーに案内ページを印刷出力させなければならない。ドキュメント・サーバーが案内ページ更新機能を備えてもよく、この場合、ユーザが案内ページを与えると、その案内ページはスキャンされてからリサイクルされ、新しい案内ページが印刷される。
【0063】
ユーザは、あるドキュメントの検索又は削除をしたい時には、できれば機械検出可能インクのペンを使って、案内ページ上の適切なアイコンを丸で囲み(検索の場合)又はX印で抹消する(削除の場合)。あるいは、小型のハンドヘルド・スキャナを使って個々の項目をスキャンしてもよい。次に、ドキュメント・サーバが関連ドキュメントを突き止めて適切な処置をとり、それらドキュメントを削除し又はユーザに提示する。勿論、ユーザは、ドキュメントの全体を検索するのでなく、希望する特定のページを指定してもよい。
【0064】
案内ページ上のアイコン・セットが変動しなければ、ユーザはアイコンのレイアウト及び位置により精通するであろうから、ユーザは案内ページ上のアイコンの位置を思いだして直ちに確認することによって、ドキュメントを素早く突き止めることができるようになる。
【0065】
アイコンは、他の種類のデータ入力を省くための紙インターフェイスとして利用することもできる。例えば、アイコン案内ページに、人のリストのための、それぞれが各人の名前と写真を表すアイコンを含めてもよい。この案内ページを利用するには、ユーザはイメージの一つを丸で囲み、ドキュメント・サーバー10は、そのアイコンに関連した情報のセットを返すことになろう。一具体例では、案内ページは作業グループの全員を表し、ドキュメントの送り先を指示するため一つのアイコンを丸で囲んだ案内ページがドキュメント・サーバー10に与えられる。そうすると、ドキュメント・サーバーはアイコン識別子又はアイコンの内容を使ってユーザのリストより宛先ユーザを見つけ、そのネットワークアドレス又は電子メールアドレスを調べてドキュメントを送ることになろう。
【0066】
英語テキストのドキュメントに利用する場合について好適実施例を説明したが、それは単語の区切りを明瞭に表す任意の言語(”単語間にスペースをあける”タイプの言語)にそのまま拡大解釈してよい。日本語(”均一にスペースをあける”タイプの言語)のテキストのような、文字間隔が均一なテキストを持つドキュメントのためのアイコン・ペーパーは、処理が難しいけれども、本発明により取り扱うことができる。
【0067】
日本語は、はっきりした単語間スペースがないので、単語長という基本的な特徴に相当するはっきりしたものがない。日本語テキストには、利用できる特有の特徴、例えば図8のヒストグラムに示すような文字密度や図9及び図10に示すようなイメージ断片がある。日本語テキストは、2つの種類(class)、すなわち、漢字(中国語に由来する)と、音節文字を構成するカナに分かれる。漢字は多数のストロークを用いて書かれ、したがって、密度が高いのに対し、カナはわずかな単純なストロークからなる。
【0068】
ページ上の各文字を2つの種類のいずれかに分類すことにより、特徴記述子が生成される。特徴記述子生成の最初のステップは、ページイメージ上で個々の文字のサイズに近い大きさの要素ストロークを見つけ、Peairsの教えるように、元々1つの文字を構成している要素を、それらの外接矩形がオーバーラップする場合に統合することである。文字をその出現行位置によりソートし、白スペースで分離した文字グループの位置を検出することによって、ページは文字行に分割される。そして、各文字行中の文字がそれらの列位置によりソートされ、標準的読み順を得る。この順序は文字が読まれる順序である必要はなく、首尾一貫しているだけでよい。次に、各文字の黒画素数が測定され、黒画素数のヒストグラムが得られる。そして、このヒストグラム中のデータを大雑把に2つのクラスに分ける閾値が計算され、原イメージ中の各文字の種類が決定される。文字種類値のシーケンスより特徴記述子が計算される。なお、文字の種類分けは正確でなくともよく、ただ首尾一貫していればよい。したがって、あるカナ文字がいつも漢字文字に間違われても、あるいはそれと逆であっても、それも正確である。
【0069】
図8は、あるページ(不図示)についての文字矩形内黒画素数のヒストグラムの一例である。カナ文字は平均150個の黒画素を使って印刷されるが、一方、漢字文字に関する分布は、漢字文字が平均350個の黒画素を使って印刷されることを示している。これらの値を2つの階級にクラスタリングすると、ほぼ255画素の閾値が存在し、ここにヒストグラムの各階級あたりの文字数の急峻な谷がある。
【0070】
図9は、いくつかの日本語文字からなるイメージ断片を表し、また、カナ文字(例えば左端の文字)と漢字文字(例えば右端の文字)との間の文字密度の違いを説明する。図10は、図9のテキスト断片に文字種類のラベル(0=カナ、1=漢字)を付けて示す。特徴記述子を生成するために、まず種類ラベルが種類ラベルのランレングスにまとめられる。この例の連続した種類ラベルは、
3−1−2−1−1−1
のランレングスを持つ。すなわち、カナのラベルを持つ3文字があり、その後に1つの漢字、2つのカナ、1つの漢字、1つのカナ、1つの漢字と続く。次に、これらのランレングスは、ドキュメント全体について5のグループ、例えば、3−1−2−1−1、1−2−1−1−1等々にブロック化される。それぞれの5−グループのハッシュ値が、ページの特徴記述子となる。なお、情報検索の目的には、各文字の漢字/カナのラベル付けの正確さは重要ではない。むしろ、同じページの異なった読み取りイメージが与えられたときに、文字分類が再現されることが目標である。
【0071】
このような日本語テキストの特徴付けは特徴記述子を生成する一方法を提供するもので、この特徴記述子は次に前述のようにドキュメントを識別するために用いることができる。
【0072】
好ましくは、文字分類(カナ−漢字)の再現性を高めるため、英語テキストに対して行われたように、アイコンが生成される時に日本語文字はブロック・フォントに置き換えられる。図11は、各文字をブロック・フォントに置換した後の図9のテキストを表している。
【0073】
図11(a)は図9に示したものと同じイメージ断片であり、図11(b)はブロック・フォントに置換された、そのイメージ断片のテキストであり、また、図11(c)は図11(b)の印刷イメージをスキャンした結果である。この例では、画素数のヒストグラムにクラスタリングが一層明確に現れるように、漢字文字は正方形ブロックに置き換えられ、カナ文字はそれより小さな長方形ブロックに置き換えられる。カナ文字に置き換わる長方形の向きは概ねストロークの主要軸の向きに合わせられる。図11(b)において、正方形ブロックはほぼ6×6画素であり、長方形ブロックは4×2画素である(図では元の日本語テキストより拡大されている)。しかし、これと違うサイズの場合にもブロック間の唯一の相違がブロック中の画素の個数ならば(たとえ全ブロックが同一形状であったとしても)クラスタリングが生じることは明らかである。したがって、文字は文字密度に関する必須情報(これが特徴記述子を生成するために必要とされる全てである)を保存している。
【0074】
図12は、英文テキストに関しブロック・フォントを用いると有益な結果がもたらされることを説明する。図12(a)は、あるドキュメントのテキスト部分を表しており、図12(b)は文字をブロック・フォントで置換された同テキストを表している。明らかなように、文字間隔は保存されている。実際、図12(a)より図12(b)のほうが、文字間隔はずっとはっきりしている。図12(c)は図12(b)のイメージのスキャン結果を表している。なお、スキャン・エラーがあっても必須情報つまり文字間隔は依然としてはっきりしている。
【0075】
以上述べたことは説明のためのものであって、限定を意図するものではない。ここに開示されたことを吟味すれば、当業者にとって本発明の多くの変形が明らかになろう。
【0076】
【発明の効果】
以上の説明から明らかなように、本発明のアイコン生成方法によれば、ドキュメント検索に利用するのに好適なアイコンを生成することができ、様々なイメージ種類の領域を持つドキュメントの検索に利用できるアイコンを生成することができ、さらに、多数のドキュメントのアイコンを一覧でき、多くのドキュメントを対象とするドキュメント検索のアイコン選択及び指定が容易で、検索の効率向上に寄与する案内ページを作成することができる。本発明のドキュメント検索方法によれば、ユーザは案内ページ上のアイコンを一覧してターゲット・ドキュメントに関するアイコンを素早く見つけ、それにマークを付けることによってターゲット・ドキュメントを簡単に指定し、その検索を行わせることができる。本発明のドキュメント・サーバーによれば、そのようなアイコンの自動生成と、アイコンを利用した簡単かつ効率的なドキュメント検索が可能である、等々の多くの効果を得られる。
【図面の簡単な説明】
【図1】 ページ・プロセッサを含む本発明によるドキュメント・サーバーのブロック図である。
【図2】 ページ・プロセッサの詳細ブロック図である。
【図3】 見本ページの一例を示す図である。
【図4】 図3に示した見本ページに対応するアイコンを1/1スケール及び縮小スケールで示す図である。
【図5】 図4に示したアイコンを含む案内ページを示す図である。
【図6】 紙の案内ページの作成を含む、ドキュメント・データベースへのドキュメント格納のプロセスのフローチャートである。
【図7】 案内ページを使ってドキュメント・データベースよりドキュメントを検索するプロセスのフローチャートである。
【図8】 日本語ドキュメントにおける文字密度のヒストグラムである。
【図9】 日本語テキストの短いセグメントを示す図である。
【図10】 図9のセグメントに文字の分類を付した図である。
【図11】 図9に示した文字に対するブロックフォント置換の説明図である。
【図12】 英語テキストの短いセグメントに対するブロック置換の説明図である。
【符号の説明】
10 ドキュメント・サーバー
12 入力ドキュメント
14 アイコン
16 アイコン識別子
18 案内ページ
20 ターゲット・ドキュメント
30 スキャナ
32 ドキュメント記憶ユニット
34 アイコン
36 ドキュメント・データベース
38 ドキュメント・インデックス・テーブル
40 ページ・プロセッサ
42 アイコン
44 キー・ジェネレータ
46 アイコン・シリアライザー
50 ドキュメント検索ユニット
52 解析エンジン
54 検索エンジン
56 プレゼンテーション・エンジン
100 ページ
102 アイコン
104 テキスト領域
106 グラフィックス領域
108 セグメンテーション・アナライザー
110 テキスト・リデューサー
112 グラフィックス・リデューサー
114 ページ・リアッセンブラー
116 マップ(領域分割結果)
300 見本ページ
400 アイコン
500 案内ページ

Claims (9)

  1. ドキュメント記憶システムにおいて、所定の言語タイプのテキストを含むドキュメントを象徴する視覚的手がかりであるアイコンを生成する方法であって、
    該ドキュメントより見本ページを特定するステップ、各領域のイメージ種類に基づいて該見本ページを複数領域に分割するステップ、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小するステップ、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成するステップからなり、
    該縮小のステップは、単語間にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出するステップ、単語間スペースを検出するステップ、及び、単語を、その単語中の文字数によって決まる長さを持つ実線で置き換えるステップを含むことを特徴とするアイコン生成方法。
  2. ドキュメント記憶システムにおいて、所定の言語タイプのテキストを含むドキュメントを象徴する視覚的手がかりであるアイコンを生成する方法であって、
    該ドキュメントより見本ページを特定するステップ、各領域のイメージ種類に基づいて該見本ページを複数領域に分割するステップ、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小するステップ、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成するステップからなり、
    該縮小のステップは、均一にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出するステップ、検出された文字の範囲の文字密度を検出するステップ、及び、該文字を、検出された文字密度をもとに区別可能な文字密度を持つ文字ブロックで置き換えるステップを含むことを特徴とするアイコン生成方法。
  3. アイコンを紙に印刷するステップをさらに含むことを特徴とする請求項1又は2記載のアイコン生成方法。
  4. 複数のアイコンを蓄積し、1枚につき複数のアイコンを含む少なくとも1枚の案内ページを印刷するステップをさらに含むことを特徴とする請求項1又は2記載のアイコン生成方法。
  5. 請求項1又は2記載のアイコン生成方法において、該領域分割のステップは、テキスト、線画、写真及び機械読み取り可能な印刷データ構造の中より選択されたイメージ種類を持つ領域に分割するステップであることを特徴とするアイコン生成方法。
  6. 請求項1又は2記載のアイコン生成方法において、該領域分割のステップはテキストをフォント・サイズに基づいて別々の領域に分離することを特徴とするアイコン生成方法。
  7. 請求項1又は2記載のアイコン生成方法により作成された、複数のドキュメント中のドキュメントに関連した複数のアイコンを含む案内ページを用いて該複数のドキュメントよりターゲット・ドキュメントを選ぶ方法であって、
    案内ページ上の、該ターゲット・ドキュメントに関連したアイコンに付けられた選択指示のマークによりアイコンを選択するステップ、
    該選択されたアイコンをスキャンして該アイコンの電子的表現を生成するステップ、
    該アイコンの電子的表現から、該見本ページの特徴を抽出するステップ、
    該特徴を利用し、該特徴と整合する、該ターゲット・ドキュメントを含む少なくとも1つのドキュメントを特定するステップ、及び、
    該ドキュメント・サーバーを利用し該ターゲット・ドキュメントを選ばれた形態で提供するステップ、
    からなるドキュメント検索方法。
  8. 電子的表現のドキュメントを格納するドキュメント・データベースと
    入力ドキュメントを該ドキュメント・データベースに格納するのに適した電子的表現に変換するドキュメント入力用入力手段と、
    該入力ドキュメントの見本ページの可視的縮小表現であるアイコンを生成する、該入力手段と接続されたページ・プロセッサと、
    該入力ドキュメントの電子的表現を解析し、該入力ドキュメントのテキストの識別特徴を抽出して、該入力ドキュメントに係わるテキストのハッシュされた冗長記述子であるキーを生成する、該入力手段と接続されたキー・ジェネレータ、
    該キーを記憶しかつ該ドキュメント・データベース中のドキュメントに関連付けるための、該キー・ジェネレータと接続されたインデックス手段、
    ターゲット・ドキュメントのアイコンを入力するためのアイコン入力手段、
    該アイコンからアイコン特徴を抽出するための、該アイコン入力手段と接続されたアイコン解析手段、
    該アイコン特徴を問い合わせに変換し、該問い合わせを使って該ターゲット・ドキュメントを含む少なくとも1つの整合ドキュメントへの参照を取得する、該アイコン解析手段及び該インデックス手段と接続された検索エンジン、
    及び
    該ターゲット・ドキュメントをユーザの指定した形態で提示するためのプレゼンテーション・エンジンからなり、
    該ページ・プロセッサは、
    該入力ドキュメントより見本ページを特定し、各領域のイメージ種類に基づいて該見本ページを複数領域に分割する手段、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小する手段、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成する手段を備え、
    該縮小する手段は、単語間のスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出し、単語間スペースを検出して、単語を、その単語中の文字数によって決まる長さを持つ実線で置き換える、
    ことを特徴とするドキュメント・サーバー。
  9. 電子的表現のドキュメントを格納するドキュメント・データベースと、
    入力ドキュメントを該ドキュメント・データベースに格納するのに適した電子的表現に変換するドキュメント入力用入力手段と、
    該入力ドキュメントの見本ページの可視的縮小表現であるアイコンを生成する、該入力手段と接続されたページ・プロセッサと、
    該入力ドキュメントの電子的表現を解析し、該入力ドキュメントのテキストの識別特徴を抽出して、該入力ドキュメントに係わるテキストのハッシュされた冗長記述子であるキーを生成する、該入力手段と接続されたキー・ジェネレータ、
    該キーを記憶しかつ該ドキュメント・データベース中のドキュメントに関連付けるための、該キー・ジェネレータと接続されたインデックス手段、
    ターゲット・ドキュメントのアイコンを入力するためのアイコン入力手段、
    該アイコンからアイコン特徴を抽出するための、該アイコン入力手段と接続されたアイコン解析手段、
    該アイコン特徴を問い合わせに変換し、該問い合わせを使って該ターゲット・ドキュメントを含む少なくとも1つの整合ドキュメントへの参照を取得する、該アイコン解析手段及び該インデックス手段と接続された検索エンジン、
    及び
    該ターゲット・ドキュメントをユーザの指定した形態で提示するためのプレゼンテーション・エンジンからなり、
    該ページ・プロセッサは、
    該入力ドキュメントより見本ページを特定し、各領域のイメージ種類に基づいて該見本 ページを複数領域に分割する手段、各領域について、領域のイメージをそのイメージ種類に特有の縮小ルールに従って縮小する手段、及び、該領域を該見本ページを縮小したものに再組立して該アイコンを生成する手段を備え、
    該縮小する手段は、均一にスペースをあける言語タイプのテキスト内容を示すイメージ種類を持つ領域に対し、文字の範囲を検出し、検出された文字の範囲の文字密度を検出し、該文字を、検出された文字密度をもとに区別可能な文字密度を持つ文字ブロックで置き換えることを特徴とするドキュメント・サーバー。
JP07207597A 1996-04-01 1997-03-25 アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー Expired - Fee Related JP3841318B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/626,620 US5903904A (en) 1995-04-28 1996-04-01 Iconic paper for alphabetic, japanese and graphic documents
US08/626620 1996-04-01

Publications (2)

Publication Number Publication Date
JPH1021043A JPH1021043A (ja) 1998-01-23
JP3841318B2 true JP3841318B2 (ja) 2006-11-01

Family

ID=24511146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07207597A Expired - Fee Related JP3841318B2 (ja) 1996-04-01 1997-03-25 アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー

Country Status (1)

Country Link
JP (1) JP3841318B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11242542A (ja) * 1998-02-25 1999-09-07 Mitsubishi Electric Corp 要約作成表示装置
AUPQ439299A0 (en) * 1999-12-01 1999-12-23 Silverbrook Research Pty Ltd Interface system
JP4491777B2 (ja) * 2004-06-04 2010-06-30 富士ゼロックス株式会社 画像表示装置、画像表示方法及びそのプログラム
US8566705B2 (en) * 2004-12-21 2013-10-22 Ricoh Co., Ltd. Dynamic document icons
CN112036159B (zh) * 2020-09-01 2023-11-03 北京金堤征信服务有限公司 一种词云数据生成方法以及装置

Also Published As

Publication number Publication date
JPH1021043A (ja) 1998-01-23

Similar Documents

Publication Publication Date Title
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
EP0539106B1 (en) Electronic information delivery system
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
JP3289968B2 (ja) 電子的文書処理のための装置および方法
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
US5926565A (en) Computer method for processing records with images and multiple fonts
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8532384B2 (en) Method of retrieving information from a digital image
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
US6023528A (en) Non-edit multiple image font processing of records
US20030042319A1 (en) Automatic and semi-automatic index generation for raster documents
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH07210577A (ja) 情報アクセス装置
JP3958722B2 (ja) イメージデータ文書検索システム
JP7086424B1 (ja) 特許用文章生成装置、特許用文章生成方法、および特許用文章生成プログラム
JP2023086023A (ja) 画像処理装置とその方法およびプログラム
JPH0589279A (ja) 文字認識装置
JPH11120201A (ja) 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JPH0375888A (ja) 文書画像認識管理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060804

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090818

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100818

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100818

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110818

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110818

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120818

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120818

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130818

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees