JP4118349B2 - 文書選択等の方法及び文書サーバ - Google Patents

文書選択等の方法及び文書サーバ Download PDF

Info

Publication number
JP4118349B2
JP4118349B2 JP10801796A JP10801796A JP4118349B2 JP 4118349 B2 JP4118349 B2 JP 4118349B2 JP 10801796 A JP10801796 A JP 10801796A JP 10801796 A JP10801796 A JP 10801796A JP 4118349 B2 JP4118349 B2 JP 4118349B2
Authority
JP
Japan
Prior art keywords
document
icon
page
character
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10801796A
Other languages
English (en)
Other versions
JPH08305731A (ja
Inventor
ピアース マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH08305731A publication Critical patent/JPH08305731A/ja
Application granted granted Critical
Publication of JP4118349B2 publication Critical patent/JP4118349B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Description

【0001】
【発明の属する技術分野】
本発明は、文書の格納と取出しの分野に関し、より詳しくは、文書取出しを当該文書から取った例示ページからの内容を用いて文書データベースから行なうようにした文書格納等の方法及び文書サーバに関する。
【0002】
【従来の技術】
文書データベースから目的とする文書を取出す問題の一般的な方法は、1組のキーワードを物理的に文書とともに格納するか、又は、キーワードを見出しとしてテ−ブルエントリがデータベース内の文書を示すようにした参照テーブル内にキーワードを格納することである。キーワードは電子化した文書が利用可能であれば簡単に文書から生成することができる。紙面上の文書だけしか利用できない場合、これを走査して文書ページのデジタル画像を作成し、デジタル画像を文字認識により処理して文書内のテキストとキーワードを取出す。もっと労力を用いる方式としては、キーを用いて手入力することができる。
【0003】
文書を取出すには、キーワードを検索エンジンに供給する
【0004】
【発明が解決しようとする課題】
この一般的な方法の欠点は、文書データベース内の文書と例示ページが電子化した形状のものか又は電子化されている必要があるか、又は、例示ページに対して文字認識を行なってキーワードを決定する必要がある。つまり、例示ページは電子化されているか、又は、走査と文字認識処理でエラーが発生しないだけの充分な品質になっている必要がある。
【0005】
文書プレゼンテーションのための従来技術のシステムの一例は、G.Storyの「検索・閲覧のための画像を用いたRight Pages 電子化ライブラリ」、COMPUTER誌、1992年9月号に説明されているRightPages文書プレゼンテーションシステムである。このシステムでは、ユーザに一連の雑誌の表紙が提示され、ユーザは雑誌の表紙を閲覧して所望の雑誌を見つけ出し、今度は目次を参照してその雑誌から記事を選択する。雑誌記事の例示ページが選択されると、システムが目的の記事を文書データベースから取出す。RightPagesシステムの欠点は、コンピュータ用モニタにアイコンが表示され、これが印刷するより低い解像度であり、また、雑誌の表紙とページの間のリンクが必ず存在しなければならないことである。つまり、ユーザはコンピュータ用モニタに向かって例示ページを検索しなければならない。
【0006】
ハルらの「多重アクセス冗長ハッシングによる画像の照合と取出し」と題する米国特許出願第08/222281号(本明細書の参照に含めてあり、以下“ハル”と称する)で教示される文書格納及び取出しのシステムは、目的とする文書から取出した紙面の例示ページを検索エンジンに送信して文書データベースから目的とする文書を取出すためのシステムである。検索エンジンは例示ページを分析してデータベース内の文書間で起こり得る照合を判定する。ただし、非常に大量の文書を格納しようとする場合、例示ページの格納と組み合せにおいて、紙面ページに格納する空間を割当てる必要があり、これを組み合せておく等の文書データベース格納が解消しようとする同じ問題の幾つかが発生してしまうことになる。
【0007】
従って、文書取出しと文書管理に使用するための例示ページを効率的に格納するためのシステムが必要とされる。
【0008】
【課題を解決するための手段】
A.1つ目の発明に関して
本発明の文書選択方法は、文書データベースに格納されている複数の文書から、前記複数の文書内の文書に関連した複数のアイコンを含む案内ページを用いて目的文書を選択する、ページプロセッサと文書サーバフロントエンドとアイコン分析手段と検索エンジンと表示エンジンと文書インデックスデータテーブルとを有する文書サーバにおいて実行される文書選択方法であって、前記文書インデックステーブルには、前記文書データベースに格納されている複数の文書のそれぞれの文書について、その電子的表現の特徴として、文字領域内に含まれる 1 又は複数の文字からなる単語の長さに基づいて決定される特徴を記述したキーワードが当該文書と対応付けられて格納されており、前記文書サーバの文書サーバフロントエンドが、前記案内ページ上のアイコンがユーザによって指示されたときに、前記案内ページを走査し、該指示がなされたアイコンの電子的表現を形成する段階と、前記文書サーバのアイコン分析手段が、形成された前記アイコンの電子的表現から該アイコンの電子的表現の特徴を分析エンジンで抽出する段階と、前記文書サーバの検索エンジンが、抽出された前記アイコンの電子的表現の特徴を記述したキーワードを生成し、当該キーワードと、前記文書インデックステーブルに前記文書と関連付けられて格納されたキーワードとを比較し、一致するキーワードが前記インデックステーブルに関連付けられている少なくとも1つの文書を前記文書データベース内の文書から識別し、前記少なくとも1つの文書が前記目的文書を含む段階と、前記文書サーバの表示エンジンが、前記文書サーバを用いて前記目的文書を提供する段階とを含み、前記アイコンは、前記文書サーバのページプロセッサが、前記文書からの例示ページを識別する段階と、各々の領域の画像形式に基づいて前記例示ページを領域に分割する段階と、前記各々の領域についてその領域の画像の形式に特定の縮小規則により領域の画像を縮小する段階と、前記領域を前記例示ページの縮小に組み立て直して前記アイコンの電子的表現を形成する段階を実行して形成された前記例示ページの縮小であり、 前記縮小規則は、前記領域の画像の形式が文字画像形式である場合は、当該文字領域の各文字をブロック化又はライン化することを少なくとも示すことを特徴とする。
【0009】
この場合、アイコンを紙面上に印刷する段階をさらに含んでいてもよい(A−1)。また、複数のアイコンを累積する段階と1枚の案内ページ上に前記複数アイコンを印刷する段階をさらに含んでいてもよい(A−2)。また、分割の段階は文字列画像形式、線画形式、写真画像形式、機械で読取可能な印刷データ構造形式のうちから選択した画像形式により複数領域に分割する段階であってもよい(A−3)。さらに、分割段階はフォントの大きさに基づいて文字列を別々の領域に分離する段階としてさらに特徴付けられていてもよい(A−4)。このA−4に関して、縮小段階は縮小する前記領域の画像形式が閾値の大きさより小さなフォントの大きさの文字列からなる領域の場合に文字をブロックで置き換え、縮小する前記領域の画像形式が閾値の大きさより大きい又は等しいフォントの大きさの文字列からなる領域の場合に文字をブロックに置き換えない段階を含んでいてもよい(A−5)。
【0010】
1つ目の発明において、縮小段階は文字列内容を示す画像形式の領域について、文字の境界を識別する段階と、前記領域内の文字を実線の境界ボックスで置き換える段階と、を含んでいてもよい(A−6)。或いは、縮小段階は文字列内容を含む画像形式の領域について、文字の境界を識別する段階と、単語間の空白を識別する段階と、単語内の文字を、前記単語内の文字数の関数である長さを有する実線で置き換える段階と、を含んでいてもよい(A−7)。さらには、縮小段階は文字列内容を含む画像形式の領域について、文字の境界を識別する段階と、単語の境界を識別する段階と、単語内の文字を、前記単語の第1の文字の位置で始まる多数の等間隔の文字ブロックで置き換える段階と、を含んでいてもよい(A−8)。
【0012】
この場合、好適な形状は電子メール配送、ファクシミリ配送、印刷コピー、又は画面表示のうちの1つとしてもよい(B−1)。また、案内ページからアイコン識別子を抽出する段階と、アイコン識別子を用いて前記複数文書のうちの前記目的文書を特定する段階と、をさらに含んていてもよい(B−2)。
【0013】
つ目の発明に関して
本発明の文書サーバは、文書データベースと、入力文書を、前記文書データベース内に格納するのに好適な文書の電子的表現に変換する、文書入力のための入力手段と、この入力手段に接続され、前記入力文書のアイコンを生成するページプロセッサと、前記入力手段に接続され、前記文書の電子的表現を分析して前記入力文書に関連したキーワードを形成するために前記入力文書を識別するための特徴として、文字領域内に含まれる 1 又は複数の文字からなる単語の長さに基づいて決定される特徴を抽出するキーワードジェネレータと、このキーワードジェネレータに接続され、前記文書データベース内の文書に、前記特徴を記述したキーワードを関連させ格納するためのインデックス手段と、目的文書のアイコンを入力するためのアイコン入力手段と、このアイコン入力手段に接続され、前記アイコンからアイコンの特徴を抽出するためのアイコン分析手段と、このアイコン分析手段と前記インデックス手段に接続され、前記アイコンの特徴を問合せに変換してこの問合せを用いて前記インデックス手段から少なくとも1つの適合文書への参照を取得し、少なくとも1つの適合文書が前記目的文書に含むようにするための検索エンジンと、前記目的文書をユーザが指定した形状で表示するための表示エンジンと、を含み、前記ページプロセッサは、前記文書からの例示ページを識別する識別手段と、各々の領域の画像形式に基づいて前記例示ページを領域に分割する分割手段と、前記各々の領域についてその領域の画像の形式に特定の縮小規則により領域の画像を縮小する縮小手段と、前記領域を前記例示ページの縮小に組み立て直して前記アイコンを生成する生成手段とを有し、前記縮小規則は、前記領域の画像の形式が文字画像形式である場合は、当該文字領域の各文字をブロック化又はライン化することを少なくとも示すことを特徴とする。
【0014】
ここの場合、表示エンジンは、ファクシミリサーバ、電子メールサーバ、印刷装置、及び表示モニタを含んでいてもよい(C−1)。また、アイコンにアイコン識別子を付与し、前記アイコン分析手段はアイコン識別子を用いた場合にアイコン識別子を抽出するように設定されるアイコンシリアライザをさらに含んでいてもよい(C−2)。また、アイコン印刷装置をさらに含んでいてもよい(C−3)。さらには、ページプロセッサが、例示ページを各々の領域の画像形式に基づいて複数領域に分割するための分割手段と、前記例示ページの領域を縮小領域へ縮小するための複数の縮小手段であって、各々の縮小手段は前記分割手段に接続され独自の画像形式に関連し、特定の画像形式に関連する前記縮小手段がその特定の縮小手段に特有の縮小規則に従って特定の画像形式を縮小する手段と、前記縮小領域を前記例示ページの縮小に組み立て直して前記アイコンを形成するための手段と、を含んでいてもよい(C−4)。
【0015】
さらには、複数の縮小手段は、各々の文字を黒ブロックに置き換えることにより小さいフォントの文字列画像形式領域を縮小し前記小さいフォントの文字列画像形式領域を比例的に縮小するための小フォント文字列縮小器と、大きなフォントの文字列画像形式領域の領域を比例的に縮小して前記大きなフォントの文字列画像形式を縮小する大フォント文字列縮小器と、線画の縮小を前記線画の構造を保持した縮小を用いて行なう線画縮小器と、少なくとも1つの画素濃度と画素解像度を縮小することで写真画像形式領域を縮小する写真画像縮小器と、機械で読取可能な印刷データ構造画像形式領域からデータ構造を抽出して、前記機械で読取可能な印刷データ構造画像形式領域より小さな縮小した機械で読取可能な印刷データ構造画像形式領域画像を生成することにより前記機械で読取可能な印刷データ構造画像形式領域を縮小するデータマーク縮小器と、を含んでいてもよい(C−5)。
【0017】
E.これらのの発明の概要
本発明により文書サーバの改良が提供される。文書サーバは、構造化した形状、例えば、編集可能なコンピュータファイルや文書からの紙面ページのデジタル化画像等又はこれらの組み合せによる文書のデータベースを維持するコンピュータ・システムである。目的文書は取出しが所望の文書データベース内の文書である。文書を取出すには、目的文書の1つ又はそれ以上の特徴を表わす入力、例えば、キー、独自のラベル、又は例示ページを文書サーバに提供する。典型的な例としては、文書が文書サーバに提供されて1ページだけが保持される。保持されたページは、例示ページとして供用でき、文書全体が所望の時に提供される。例示ページは文書の第1ページでよいが、第1ページである必要はなく、また、文書の完全なページでなくともよいが、例示ページ(又は、ページの一部)を用いて文書データベース内の他の文書から目的文書を識別できるか、又は、少なくとも目的文書とよく一致し、その中から目的の文書をユーザが選択するように提示できるような1組の文書照合候補を識別できる必要がある。
【0018】
本発明による文書サーバの1つの実施の形態において、文書データベース内の各々の文書の例示ページはページプロセッサで処理して、文書の例示ページのアイコンを生成する、即ち、アイコン化した表現を生成する。典型的には、文書が最初に文書データベース内に格納される時点でこれを行なう。ページプロセッサは例示ページを分析して、画像の形式、例えば、文字、線画、写真、その他の図形、辺縁、有色領域、グリフ、バーコード等によって例示ページの領域を断片化する。当然のことながら、全ての画像形式が全ての例示ページで見つかるものでもなく、画像の形式は前述したものに制限されることはない。断片化が終わると、各々の領域をその領域の画像の形式に適当な方法で特性化し縮小する。例えば、文字領域の文字はブロックフォント(後述する)に置き換えて縮小し、グラフィックス領域は解像度を減少する(画素精度及び/又は単位領域当たりの画素数を小さくする)。縮小した例示ページの領域は例示ページのアイコンに再組み立てする。
【0019】
本発明の特定の応用において、本明細書で「案内」ページと称する1ページに多くのアイコンを印刷する。この案内ページ、又はアイコンの個数によっては複数の案内ページがユーザに提供される。文書の取出しには、ユーザは案内ページを見て目的文書と視覚的に関連しているアイコンを見つけ出し、選択したアイコンの指示を文書サーバに供給する。文書サーバはアイコンの内容を分析してアイコンで表現された例示ページの識別する特徴を検出し、これらの特徴を検索エンジンに提供する。検索エンジンは文書データベース内の文書適合候補を識別する。1つ以上の文書適合候補が返された場合、文書サーバは各々の候補についての情報、例えば、候補文書の一部の縮小画像等を提供して、ユーザが文書適合候補から目的文書を手動で選択できるようにする。
【0020】
これ以外に、各々のアイコンに識別ラベル、例えば、独自の英数字符号又は機械で読取可能なバーコードを割当て、目的文書の参照のためにこれをユーザが文書サーバに提供するようにしてもよい。文書サーバは文書取出しのためにアイコン画像の内容を使用する必要はないものの、アイコンの内容は目的文書への小型の視覚的キューを提供する上でユーザに有用である。案内ページで、ユーザは多くのアイコンを迅速に調べることができる
【0021】
上記実施の形態の変形も考えられる。例えば、文書サーバはデジタル複写機と統合して、ユーザが印を付けた案内ページを提出することに応じてデジタル複写機が文書全体を出力させることができる。デジタル複写機は提出された案内ページを走査して、アイコンの内容から情報を抽出するか、又は、案内ページの識別子を抽出して、案内ページ上のアイコンの位置を決定する。分散型文書サーバを使用しており、同じ文書に対して別々のユーザが別々の案内ページを使用するような場合、アイコンの内容だけからアイコンを識別する前者の選択肢が好適な方法である。アイコンを走査し文書を印刷するためのインタフェースは通常のファクシミリ装置でもよく、世界中で遠隔的に文書検索ができる。
【0022】
幾つかの実施の形態では、1つの文書に複数のアイコンを提供してユーザがその文書の認識可能な部分を見つけ出せる可能性を増加することができる。これは、案内ページ又はアイコンの個数が非常に制限されるのでない場合には好適である。また、所望であれば、例えば、目的文書を印刷するつもりだがユーザが必要なのは長い文書のうちの数ページだけと言った場合に、文書サーバは目的文書の全部より少ない文書を取出す選択肢をユーザに与えることができる。
【0023】
ページプロセッサの特定の実施の形態では、文字がブロック化され、単語間の間隔が識別され、単語内の文字はその単語の長さに比例する長さの線に置き換えられる。これは、アイコンから単語の長さを抽出する際のエラー発生率を減少させる1つの方法である。エラー発生率を減少させることの1つの利点はこれに対応した小さいアイコンが使用できるようになることである。
【0024】
また、アイコンを使って文書を認識する代わりに紙面上のインタフェースとして他の種類のデータエントリ、例えば、リストからエントリを選択して電話番号又は電子メールアドレス等のデータ要素を取出すといった必要をなくすこともできる。
【0025】
【発明の実施の形態】
本発明の実施の一形態を図面に基づいて説明する。図1は本発明の1つの実施の形態による文書サーバ10を示す。文書サーバ10は入力文書12等の格納する入力文書を受け入れ、文書に対するユーザ要求に応答する。図1には3つのユーザ要求が図示してあり、これらは各々アイコン14、ラベル16、案内ページ18であるが、図示した要求の組み合せを含む他の形状の要求も可能である。ユーザ要求は図1に図示した目的文書20等の、文書サーバ10が格納した特定の文書に対する要求である。文書サーバ10は入力要求にのみ基づいて、又は、必要であればユーザに1組のよく似た文書(文書一致候補)から選択するように指示して、目的文書20を供給する。入力文書12が紙面の文書であれば、これをスキャナ30でデジタル画像に走査してから文書格納ユニット32に供給する。これ以外の場合、入力文書12が電子的な形状で供給される場合、文書は走査する必要がなく文書格納ユニット32に直接提供される。文書格納ユニット32は入力文書12を処理して入力文書12のアイコン34を生成し、入力文書12のデジタル表現を文書データベース36に配置しつつ文書インデックスデータを生成して文書インデックステーブル38に格納する。
【0026】
文書格納ユニット32はアイコン42等のアイコンを生成するページプロセッサ40と、キージェネレータ44と、任意のアイコンシリアライザ46を含む。ページプロセッサ40は文書サーバ10へ入力された文書12から取出した例示ページ(example page)を処理してアイコン42を作成する。この処理についてはさらに詳しく後述する。キージェネレータ44は入力文書12から情報を抽出して格納した後で文書12を検索するのに使用するキーワードを生成する。場合によって、キージェネレータ44は文書12が構造化文書であればこれの文字列を走査する(又は、第1に文字認識を行なう)が、ハルが教示したような記述子に基づくキーワードも生成する。このように生成されたキーは文書データベース36内の文書12の位置へのポインタと一緒に文書インデックステーブル38に格納する。
【0027】
アイコン識別子を使用する場合、アイコン識別子はアイコンシリアライザ46が生成してアイコン42に添付し、これがアイコン34として文書要求者が利用できる形状で出力される。アイコンシリアライザ46はシーケンス内の変化を考慮するのに必要とされるように初期化することができる。シーケンス変化の1つの使用法は、各々のユーザがそのユーザの文書の案内ページを保持し、そのユーザのアイコンの一連番号を所望することができる点である。この場合、案内ページは走査ジョブの第1ページとして提供され、ページプロセッサ40又はキージェネレータ44のどちらかがこれを案内ページとして認識し、既存のアイコンの一連番号を抽出してこの情報をアイコンシリアライザ46へ渡し、次のアイコンに順番に一連番号を割当てられるようにする。当然のことながら、案内ページ全体をアイコンシリアライザ46へ提供してアイコン42が案内ページに追加され、アイコン42とその案内ページのそれまでの全てのアイコンを含む新しい案内ページをユーザに印刷することができる。
【0028】
文書サーバ10の文書取出ユニット50はユーザ要求を受け入れて目的文書20で応答し、文書データベース36から文書を取出す。ユーザ要求は図1において文書取出ユニット50へ直接提供されるように図示してあるが、ユーザ要求は遠隔的に、例えば、ネットワーク上で又はファクシミリ装置を経由して提供することも有り得る。文書取出ユニット50は分析エンジン52、検索エンジン54、表示エンジン56を含めて図示してある。分析エンジン52は後述するようにユーザ要求を受け入れるように接続され、また、検索エンジンへの要求の特徴を提供するように検索エンジン54へ接続される。検索エンジン54は文書インデックステーブル38へ接続されてキーワードと適合文書へのポインタを送信する。検索エンジン54は表示エンジン56へも接続されて候補文書のリストを送信する(目的文書を独自に識別するのに充分なキーがあればリストに1つの文書しか含まないことがある)。表示エンジン56は文書データベース36へも接続されてここから文書を取出し、また、各種出力装置(図示せず)、例えば、デジタル複写機、コンピュータ表示装置、印刷装置、ファクシミリ装置、又は電子メールサーバ等へ接続される。
【0029】
動作において、ユーザ要求は分析エンジン52へ供給される。ユーザ要求がアイコンの形状にある場合、分析エンジン52はアイコン14の内容から情報を抽出する。ユーザ要求がアイコン識別子(アイコンID又は案内ページIDとアイコン位置)の場合、識別子が使用される特徴になる。分析エンジン52は抽出した特徴を検索エンジン54に提供する。
【0030】
検索エンジン54は抽出した特徴を用いて目的文書20を検索するためのキーワードを生成する。ハルはハッシングした文書の冗長記述子の格納を教示しているが、この場合、これはキーワードの役割を果す。アイコン識別子がアイコン内容の代わりに使用されるのであれば、識別子がキーワードとして用いられる。キーワードは文書インデックステーブル38でインデックスを取り、文書適合候補に対応する1つ又はそれ以上の適合のリストを取出す。アイコン識別子を用いる場合、文書適合候補は普通は1つだけだが、ある文書の複数の版に対して1つのアイコンを選択できるようなシステムでは1つ以上の文書適合候補が存在し得る。
【0031】
検索エンジン54は表示エンジン56に適合リストを提供する。表示エンジン56は文書データベース36から文書適合候補を取出し、ユーザ要求で提供された表示指示に従ってこれを表示する。例えば、ユーザはコンピュータモニタで文書をみるように、又は、これを印刷するように要求することがある。デジタル複写機を使用する場合、文書を印刷する要求は明白で有り得る、即ち、ユーザが文書を要求するとデジタル複写機はこれを印刷するものと見做す。表示エンジン56は対話型インタフェースを含んで、ユーザが文書適合候補を閲覧したり、候補の縮小画像を閲覧し、キーボード又はマウスからどれが所望の文書かを表わす選択を受け入れられるようにもできる。
【0032】
図2はページプロセッサ40をさらに詳細に示す。ページプロセッサ40は入力としてページ100のデジタル表現を受け入れて、ページ100のアイコン表現としてアイコン102を出力する。図面において、ページ100は文字領域104とグラフィックス領域106を含み、ページプロセッサ40は断片分析器108と文字縮小器110、グラフィックス縮小器112とページ再組立器114を含めて図示してある。断片分析器108は入力ページ100からページ100の別の部分のマップ116を作成し、この例では1つの文字領域と1つのグラフィックス領域だけがここに含まれている。当然のことながら、典型的な文書はもっと複雑なページ構成でさらに多様な領域を含んでいる。
【0033】
ページ100とマップ116は文字縮小器110とグラフィックス縮小器112へ提供される。他にも、送信時間又は格納空間を節約するため、ページ100を予め見つかった各々の種類の領域でページ部分に分割してもよい。何れにせよ、特定の縮小器は1つの種類の領域に対して動作する。2つの縮小器しか図示していないが、その他の縮小器も使用できる。例えば、断片分析器108がグリフ領域(機械で読取可能なマーク)又はバーコード領域を検出した場合、グリフ又はバーコード縮小器を用いることになる。その縮小器はグリフ又はバーコードとして符号化された情報を単に読取り、より少ない面積でその情報を符号化する機械で読取可能なマークを生成する。
【0034】
各々の領域が縮小されたら、これらをページ再組立器114で組み立ててアイコン102を形成する。ページ断片化の1つの一般的な方法は、カレン(J.F.Cullen)とエジリ(K.Ejiri)による「文書画像処理における弱いモデルに依存したページ断片化とゆがみ補正」、第2回文書分析認識に関する国際会議抄録、757〜60(1993年)("Weak Model-Dependent Page Segmentation and Skew Correction for Processing Document Images",Proc. of the2nd Int'l.conf.on Doc.Anal.and Recog.,757-60(1993))に示されている。
【0035】
縮小の特定の方法は、小さいアイコンをユーザが認識できるようにするものだが、必ずしも読取可能でなくともよく、そのアイコンを用いて文書を要求する場合に分析エンジン52が識別できればよい。
【0036】
例えば、文字縮小器110は単純に文字領域を縮小するのではない。文書を分析エンジン52でさらに区別できるようにするため、文字領域内の各々の文字はブロックフォント文字に置き換える。図3はアイコン化したページ300の例を示したものである。図4はページ300から形成したアイコン400を示す(アイコン400(A)は完全な大きさのアイコンを示し、アイコン400(B)は典型的な案内ページにみられる大きさのアイコンを示す)。図4において、各々の文字はブロック文字で置き換えてある。これにより文字は判読不能になるが、ユーザが認識できるようにするためには判読できる必要がない。また、実際の文字が特徴として用いられないのであれば、分析エンジン52で読取可能である必要もない。ハルは、例えば、文字を用いず、文字領域内の単語の長さのパターンを用いている。文字をアイコン400のようにブロックに置き換えることで、単語の長さは後でアイコン400を複写又はファクシミリ伝送する際にもよく保存されるようになる。ブロックは幾つかの方法で生成できる。
【0037】
さらに再現性をよくするには、単語を線で置き換えることもできる。これには、文字の境界ボックスと単語間の空白を判別する。境界ボックスは等間隔に配置して線分に置き換える。つまり、文字列の各々の線が等しい線分に置き換えられ、各々の線分が置き換える単語の文字数に等しい長さになる。
【0038】
縮小処理の最後に、断片分析器108は大きいフォントの文字と小さいフォントの文字を別々に分類する。これを行なった場合、大きいフォントの文字は文字列を比例して縮小する縮小器で処理し、文字認識は行なわず、ユーザは縮小した場合にも大きいフォントの文字列を読むことができるようになる。小さいフォントの文字列は前述したような縮小器で処理して文字をブロック又は線に置き換える。
【0039】
多色文書では、例示ページをアイコンへ縮小する際に色が保存される。
【0040】
別の工夫として、文字列の基線に沿って各々のブロック文字を配列し、各々の単語内の各々のブロックに一定間隔を提供することがある。これによって、文字ブロックパターンの画像処理特徴検出を支援することができる。
【0041】
1つの実施の形態において、グラフィックス領域106にあるような線画が検出された場合、グラフィックス縮小器112が写真とは別に線画を処理する。線画は比較的よく限定されグレー中間階調を使用しないようなグラフィックスである。線画はさらに識別能力を拡張するように線の細さ等の構造を保存する操作に従って縮小する。
【0042】
図5はアイコンの相対的な大きさを示す。図5ではアイコン102と同様のアイコン及び案内ページ1ページ当たり49のアイコン用空間(7行7列、両面の場合には98個)を含む案内ページ500を示すが、アイコンはさらに小さくできる。このような両面10毎の案内ページを用いると、ユーザはほぼ1000もの文書の例示ページについてのアイコンを走査することができ、文書サーバ10に格納された数万ページを越える文書に相当する。文書サーバが必要に応じて案内ページを印刷できるのであれば案内ページをユーザが保持している必要もない。アイコンは文書データベース36内の文書とともに格納するか又は文書インデックステーブル38内のキーワードデータとともに格納しておくことができる。
【0043】
アイコン102が由来するページ100を含む文書のコピーを取出すには、ユーザは案内ページ500のアイコン102に丸印を付け、案内ページを文書サーバ10に送る。案内ページ500を文書管理に用いることもできる。例えば、文書サーバ10は×印を付けたアイコンのあるページを受け入れて、これに対応する文書を文書データベース36から削除するように信号を送るようにプログラムすることができる。文書サーバ10はアイコンと思われるものから文書を試験的に取出してみることにより、その案内ページを他のページから自動的に識別しようとする。文書がこのような方法で取出される場合、そのページは案内ページであると仮定される。
【0044】
図6は本発明による文書データベース内に文書を格納する処理の流れ図である。ユーザが文書サーバに文書を提示した時点で処理が開始する。ステップS1において、文書がまだ電子的な形状になければ走査する。ステップS2では、文書が文書データベース内に格納され、キーワードを使用するなら文書からこれを抽出する。前述のように、キーワードとして用いる冗長な特徴を抽出する1つの方法はハルが教示している。次に、例示ページを文書から選択してアイコンの生成に使用する(S3)。例示ページの選択が自動的に行なわれる場合、文書サーバは必ず文書の第1ページを選択し、まれにみられる特徴、例えば、殆どが文字からなる文書のデータベース内のグラフ等を特定するか又は全てのページが選択されるように文書のページを調べる。これ以外にも、記憶できる例示ページの選択をユーザが行なっても良い。
【0045】
例示ページを選択したら、例示ページを断片化して例示ページのマップ又はレイアウトを形成する(S4)。これらの断片の各々を領域の画像形式に特定の縮小処理に従って縮小し(S5)、縮小した領域を再組み立てしてアイコンの電子的表現とする(S6)。アイコンIDを用いるなら電子的表現に付与する(S7)。電子化したアイコンをアイコン用案内ページに関連する他の電子化アイコンに追加し(S8)、アイコンのある案内ページを必要に応じて印刷する(S9)。案内ページは典型的には各々のアイコン作成後に印刷しないが、文書エントリー処理が完了した又は案内ページが一杯になった時点で印刷する。
【0046】
アイコンが印刷されるか他のアイコンと一緒に将来印刷するように格納されたら、文書サーバはさらに文書を調べる(S10)。さらに処理しなければならない文書がある場合、処理はステップS1に戻り、それ以外の場合文書格納処理は終了する。
【0047】
図7は図6に図示した処理に従って格納した文書の取出処理の流れ図である。取出処理は取出そうとする目的文書の例示ページを表わすアイコンをユーザが文書サーバに提示した時に始まり、アイコンが走査される(ステップR1)。次に、ステップR2で、文書サーバは走査したアイコンの画像からアイコン識別子が利用できるか(アイコン特有の識別子又は案内ページの識別子とアイコンの案内ページ上の位置)を判定する。アプリケーションが別の案内ページを別のシステムで使用できるなら、文書サーバは使用するシステムでアイコン識別子が有効かどうかも調べる。文書サーバはアイコンそれ自体の内容を相互参照に用いてアイコン識別子が正しいか確認する。
【0048】
アイコン識別子が提示されないか使用されない場合、文書サーバは前述のようにアイコンの内容を分析して検索エンジンで使用する特徴を抽出し、文書の適合を検索する(R3)。アイコン識別子を使用する場合、アイコン識別子を抽出して検索エンジンに提供する(R4)。何れの場合にも、検索エンジンは目的文書を検索し(R5)、1つ以上の適合する文書が見つかったかを調べる(R6)。1つ以上の文書が見つかった場合、ユーザには適合文書の表示が出されてこれらの中から目的とする文書を選択するように求められる(R7)。1つだけ文書を選択すると、これが目的文書として返される(R8)。
【0049】
このように、ユーザは文書サーバに簡単に文書を格納し、アイコンの案内ページ数分のページだけを用いて取出すことができる。文書サーバの前述の説明に関して、幾つかの応用と使用法が示唆されている。例えば、ユーザは文書サーバ・システムの一部であるデジタル複写機/スキャナに文書を提供してもよい。文書は走査されて文書の元のページは消去回収され、ユーザには文書のアイコンを含む案内ページが供給される(必ずしも一対一の対応ではない)。
【0050】
また、必ずしも好適な実施の形態ではないが、アイコンを文書サーバ内で電子的に記憶し、要求に応じて案内ページを印刷することができる。アイコンが電子的に格納されている場合、新しいアイコンを付加して更新した案内ページを印刷するのは簡単なことである。しかし、文書を取出す度に案内ページの印刷をユーザが文書サーバに依頼していたのでは持ち運び自在な案内ページを有する利点が失われる。ユーザが案内ページを提示したら文書サーバは案内ページ更新機能を提供して、案内ページを走査回収し新しい案内ページを印刷するのでもよい。
【0051】
ユーザが文書の取出し又は消去を所望する場合、ユーザは機械で検出可能なインクを有するペンを使って丸印(取出しの場合)又は×印(消去の場合)を適当な案内ページ上のアイコンにつける。これ以外にも、小型の手持ちスキャナを用いて1つの項目を走査してもよい。文書サーバは関連する文書を検索して適当な動作を行なう。つまり、文書を消去するかユーザに提示する。当然、文書全体の取出しのかわりに、所望する特定のページをユーザが示すことも可能である。
【0052】
案内ページ上の固定したアイコンの組を用いると、ユーザはアイコンのレイアウトと位置に快適に馴染めるようになる、つまりユーザは案内ページ上のアイコンの位置を思い出しこれをすぐ識別することで文書を迅速に特定できるようになる。
【0053】
アイコンを紙面上のインタフェースとして使用して他の種類のデータエントリーの必要性を排除することもできる。例えば、アイコン化した案内ページには各々の名前と写真を示して人のリストのアイコンを含むことがある。案内ページを使用すると、ユーザは画像の1つに丸を付け、文書サーバ10はそのアイコンに関連した1組の情報を返す。特定の用途において、案内ページは作業グループ内の全員を表示し、アイコンに丸印を付けた案内ページを文書サーバ10に提供して文書をだれに配送すべきかを示すことができる。つまり、文書サーバはユーザのリストから、アイコン識別子又はアイコンの内容を用いてユーザを識別し、ネットワーク又は電子メールアドレスを参照して宛先ユーザを特定し文書をその宛先に送付する。
【0054】
前述の説明は図示のためのものであって制限するものではない。本発明の多様な変化が本開示を参照すれば当業者には明らかであろう。従って、本発明の請求の範囲は、前述の説明によって限定されるのではなく、特許請求の範囲の記載を参照しこれの同等の全範囲に沿って決定されるべきものである。
【図面の簡単な説明】
【図1】本発明の実施の一形態を示すページプロセッサを含む文書格納及び取出しのシステムのブロック図である。
【図2】図1に図示したページプロセッサのさらに詳細なブロック図である。
【図3】例示ページの略図である。
【図4】図3に図示して例示ページを表わすアイコンを示す。
【図5】図4に図示したアイコンを含むような案内ページの略図である。
【図6】紙面の案内ページの作成を含む文書データベース内に文書を格納するための処理の流れ図である。
【図7】案内ページを使用して文書データベースから文書を取出すための処理の流れ図である。
【符号の説明】
10 文書サーバ
14 アイコン入力手段
20 目的文書
30 入力手段
36 文書データ
38 インデックス手段
40 ページプロセッサ
42 アイコン
44 キージェネレータ
52 アイコン分析手段
54 検索エンジン
56 表示エンジン
108 分割手段
110,112 縮小する手段
114 再組立手段

Claims (2)

  1. 文書データベースに格納されている複数の文書から、前記複数の文書内の文書に関連した複数のアイコンを含む案内ページを用いて目的文書を選択する、ページプロセッサと文書サーバフロントエンドとアイコン分析手段と検索エンジンと表示エンジンと文書インデックスデータテーブルとを有する文書サーバにおいて実行される文書選択方法であって、
    前記文書インデックステーブルには、前記文書データベースに格納されている複数の文書のそれぞれの文書について、その電子的表現の特徴として、文字領域内に含まれる 1 又は複数の文字からなる単語の長さに基づいて決定される特徴を記述したキーワードが当該文書と対応付けられて格納されており、
    前記文書サーバの文書サーバフロントエンドが、前記案内ページ上のアイコンがユーザによって指示されたときに、前記案内ページを走査し、該指示がなされたアイコンの電子的表現を形成する段階と、
    前記文書サーバのアイコン分析手段が、形成された前記アイコンの電子的表現から該アイコンの電子的表現の特徴を分析エンジンで抽出する段階と、
    前記文書サーバの検索エンジンが、抽出された前記アイコンの電子的表現の特徴を記述したキーワードを生成し、当該キーワードと、前記文書インデックステーブルに前記文書と関連付けられて格納されたキーワードとを比較し、一致するキーワードが前記インデックステーブルに関連付けられている少なくとも1つの文書を前記文書データベース内の文書から識別し、前記少なくとも1つの文書が前記目的文書を含む段階と、
    前記文書サーバの表示エンジンが、前記文書サーバを用いて前記目的文書を提供する段階とを含み、
    前記アイコンは、前記文書サーバのページプロセッサが、
    前記文書からの例示ページを識別する段階と、
    各々の領域の画像形式に基づいて前記例示ページを領域に分割する段階と、
    前記各々の領域についてその領域の画像の形式に特定の縮小規則により領域の画像を縮小する段階と、
    前記領域を前記例示ページの縮小に組み立て直して前記アイコンの電子的表現を形成する段階を実行して形成された前記例示ページの縮小であり、
    前記縮小規則は、前記領域の画像の形式が文字画像形式である場合は、当該文字領域の各文字をブロック化又はライン化することを少なくとも示す
    ことを特徴とする文書選択方法。
  2. 文書データベースと、
    入力文書を、前記文書データベース内に格納するのに好適な文書の電子的表現に変換する、文書入力のための入力手段と、
    この入力手段に接続され、前記入力文書のアイコンを生成するページプロセッサと、
    前記入力手段に接続され、前記文書の電子的表現を分析して前記入力文書に関連したキーワードを形成するために前記入力文書を識別するための特徴として、文字領域内に含まれる 1 又は複数の文字からなる単語の長さに基づいて決定される特徴を抽出するキーワードジェネレータと、
    このキーワードジェネレータに接続され、前記文書データベース内の文書に、前記特徴を記述したキーワードを関連させ格納するためのインデックス手段と、
    目的文書のアイコンを入力するためのアイコン入力手段と、
    このアイコン入力手段に接続され、前記アイコンからアイコンの特徴を抽出するためのアイコン分析手段と、
    このアイコン分析手段と前記インデックス手段に接続され、前記アイコンの特徴を問合せに変換してこの問合せを用いて前記インデックス手段から少なくとも1つの適合文書への参照を取得し、少なくとも1つの適合文書が前記目的文書に含むようにするための検索エンジンと、
    前記目的文書をユーザが指定した形状で表示するための表示エンジンと、を含み、
    前記ページプロセッサは、
    前記文書からの例示ページを識別する識別手段と、各々の領域の画像形式に基づいて前記例示ページを領域に分割する分割手段と、前記各々の領域についてその領域の画像の形式に特定の縮小規則により領域の画像を縮小する縮小手段と、前記領域を前記例示ページの縮小に組み立て直して前記アイコンを生成する生成手段とを有し、
    前記縮小規則は、前記領域の画像の形式が文字画像形式である場合は、当該文字領域の各文字をブロック化又はライン化することを少なくとも示す
    ことを特徴とする文書サーバ。
JP10801796A 1995-04-28 1996-04-26 文書選択等の方法及び文書サーバ Expired - Fee Related JP4118349B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/431,059 US5717940A (en) 1995-04-28 1995-04-28 Method of selecting a target document using features of an example page
US08/431,059 1995-04-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004320962A Division JP2005108254A (ja) 1995-04-28 2004-11-04 アイコン生成方法、アイコン選択方法及び文書検索方法

Publications (2)

Publication Number Publication Date
JPH08305731A JPH08305731A (ja) 1996-11-22
JP4118349B2 true JP4118349B2 (ja) 2008-07-16

Family

ID=23710270

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10801796A Expired - Fee Related JP4118349B2 (ja) 1995-04-28 1996-04-26 文書選択等の方法及び文書サーバ
JP2004320962A Pending JP2005108254A (ja) 1995-04-28 2004-11-04 アイコン生成方法、アイコン選択方法及び文書検索方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2004320962A Pending JP2005108254A (ja) 1995-04-28 2004-11-04 アイコン生成方法、アイコン選択方法及び文書検索方法

Country Status (2)

Country Link
US (2) US5717940A (ja)
JP (2) JP4118349B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06298272A (ja) * 1993-03-25 1994-10-25 Pohl Gmbh & Co Kg 環状のシール

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6869023B2 (en) * 2002-02-12 2005-03-22 Digimarc Corporation Linking documents through digital watermarking
US6522770B1 (en) 1999-05-19 2003-02-18 Digimarc Corporation Management of documents and other objects using optical devices
US8094949B1 (en) 1994-10-21 2012-01-10 Digimarc Corporation Music methods and systems
US7986806B2 (en) * 1994-11-16 2011-07-26 Digimarc Corporation Paper products and physical objects as means to access and control a computer or to navigate over or act as a portal on a network
US5717940A (en) * 1995-04-28 1998-02-10 Ricoh Company, Ltd. Method of selecting a target document using features of an example page
US6965682B1 (en) 1999-05-19 2005-11-15 Digimarc Corp Data transmission by watermark proxy
US7051086B2 (en) 1995-07-27 2006-05-23 Digimarc Corporation Method of linking on-line data to printed documents
US6577746B1 (en) * 1999-12-28 2003-06-10 Digimarc Corporation Watermark-based object linking and embedding
US7171018B2 (en) 1995-07-27 2007-01-30 Digimarc Corporation Portable devices and methods employing digital watermarking
GB2305525B (en) * 1995-09-21 1997-08-20 Ricoh Kk Document data administrating system and method of administrating document data
JP3635765B2 (ja) * 1996-02-23 2005-04-06 ブラザー工業株式会社 印刷特性表示装置
US5963964A (en) * 1996-04-05 1999-10-05 Sun Microsystems, Inc. Method, apparatus and program product for updating visual bookmarks
US7505605B2 (en) * 1996-04-25 2009-03-17 Digimarc Corporation Portable devices and methods employing digital watermarking
US7024016B2 (en) * 1996-05-16 2006-04-04 Digimarc Corporation Digital watermarking apparatus and methods
US7170629B2 (en) * 1998-11-13 2007-01-30 Ricoh Company, Ltd. Automatic and transparent document archiving
US7602518B2 (en) * 1996-11-21 2009-10-13 Ricoh Company, Ltd. Automatic and transparent document archiving
US5978477A (en) 1996-11-21 1999-11-02 Ricoh Company Limited Automatic and transparent document archiving
US6704118B1 (en) 1996-11-21 2004-03-09 Ricoh Company, Ltd. Method and system for automatically and transparently archiving documents and document meta data
US6256785B1 (en) * 1996-12-23 2001-07-03 Corporate Media Patners Method and system for providing interactive look-and-feel in a digital broadcast via an X-Y protocol
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
JP3384299B2 (ja) * 1997-10-15 2003-03-10 富士ゼロックス株式会社 画像処理装置および画像処理方法
US7263659B2 (en) 1998-09-09 2007-08-28 Ricoh Company, Ltd. Paper-based interface for multimedia information
JP4183311B2 (ja) * 1997-12-22 2008-11-19 株式会社リコー 文書の注釈方法、注釈装置および記録媒体
US7954056B2 (en) 1997-12-22 2011-05-31 Ricoh Company, Ltd. Television-based visualization and navigation interface
US20080028292A1 (en) * 1997-12-22 2008-01-31 Ricoh Company, Ltd. Techniques to facilitate reading of a document
US7257589B1 (en) 1997-12-22 2007-08-14 Ricoh Company, Ltd. Techniques for targeting information to users
US7124093B1 (en) 1997-12-22 2006-10-17 Ricoh Company, Ltd. Method, system and computer code for content based web advertising
US7596755B2 (en) * 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
JPH11195128A (ja) * 1997-12-27 1999-07-21 Canon Inc 画像形成装置および電子文書作成装置
US6178417B1 (en) 1998-06-29 2001-01-23 Xerox Corporation Method and means of matching documents based on text genre
US6456738B1 (en) * 1998-07-16 2002-09-24 Ricoh Company, Ltd. Method of and system for extracting predetermined elements from input document based upon model which is adaptively modified according to variable amount in the input document
CN100392634C (zh) * 1998-07-21 2008-06-04 三星电子株式会社 显示万维网文档的系统和方法
JP3836261B2 (ja) * 1998-08-10 2006-10-25 株式会社リコー ファイルシステム
US6582475B2 (en) * 1998-09-09 2003-06-24 Ricoh Company Limited Automatic adaptive document printing help system
US6456307B1 (en) * 1998-09-09 2002-09-24 International Business Machines Corporation Automatic icon generation
US7215436B2 (en) * 1998-09-09 2007-05-08 Ricoh Company, Ltd. Device for generating a multimedia paper document
US7266782B2 (en) * 1998-09-09 2007-09-04 Ricoh Company, Ltd. Techniques for generating a coversheet for a paper-based interface for multimedia information
US7263671B2 (en) * 1998-09-09 2007-08-28 Ricoh Company, Ltd. Techniques for annotating multimedia information
US6369811B1 (en) 1998-09-09 2002-04-09 Ricoh Company Limited Automatic adaptive document help for paper documents
US7039856B2 (en) * 1998-09-30 2006-05-02 Ricoh Co., Ltd. Automatic document classification using text and images
US8332478B2 (en) 1998-10-01 2012-12-11 Digimarc Corporation Context sensitive connected content
US6684368B1 (en) 1998-11-13 2004-01-27 Ricoh Company, Ltd. Method for specifying delivery information for electronic documents
US6310633B1 (en) * 1999-03-23 2001-10-30 Ricoh Company Limited Method and system for organizing document information
US6816272B2 (en) * 1999-05-13 2004-11-09 Hewlett-Packard Development Company, L.P. System and method for selectively downloading data files from an optical scanner
US20020032734A1 (en) 2000-07-26 2002-03-14 Rhoads Geoffrey B. Collateral data combined with user characteristics to select web site
AUPQ439299A0 (en) * 1999-12-01 1999-12-23 Silverbrook Research Pty Ltd Interface system
JP4310023B2 (ja) * 1999-06-17 2009-08-05 キヤノン株式会社 縮小画像作成方法及び装置、記憶媒体
US6647534B1 (en) 1999-06-30 2003-11-11 Ricoh Company Limited Method and system for organizing document information in a non-directed arrangement of documents
US7228492B1 (en) * 1999-07-06 2007-06-05 Ricoh Company, Ltd. 2D graph displaying document locations of user-specified concept of interest
US6356908B1 (en) * 1999-07-30 2002-03-12 International Business Machines Corporation Automatic web page thumbnail generation
US6760884B1 (en) * 1999-08-09 2004-07-06 Internal Research Corporation Interactive memory archive
JP3609307B2 (ja) * 1999-12-07 2005-01-12 シャープ株式会社 文書管理装置
AU2929301A (en) * 2000-01-07 2001-07-24 Winlook Corporation Method and apparatus for displaying, retrieving, filing and organizing various kinds of data and images
US7248693B1 (en) * 2000-01-13 2007-07-24 Hewlett-Packard Development Company, L.P. Secure network-based system for the distributed printing of documents
JP2001236287A (ja) * 2000-02-24 2001-08-31 Matsushita Electric Ind Co Ltd 画像表示方法及び該方法により画像を表示する携帯端末
US20020059265A1 (en) * 2000-04-07 2002-05-16 Valorose Joseph James Method and apparatus for rendering electronic documents
US6643641B1 (en) 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
US6668069B1 (en) * 2000-05-04 2003-12-23 Microsoft Corporation Method and system for processing digital objects
US7657064B1 (en) 2000-09-26 2010-02-02 Digimarc Corporation Methods of processing text found in images
WO2002056139A2 (en) 2000-10-26 2002-07-18 Digimarc Corporation Method and system for internet access
KR100516289B1 (ko) * 2000-11-02 2005-09-21 주식회사 케이티 퍼지 적분을 이용하여 사용자 의견을 반영한 내용기반영상 검색 장치 및 그 방법
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US8218873B2 (en) * 2000-11-06 2012-07-10 Nant Holdings Ip, Llc Object information derived from object images
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US6904171B2 (en) * 2000-12-15 2005-06-07 Hewlett-Packard Development Company, L.P. Technique to identify interesting print articles for later retrieval and use of the electronic version of the articles
US8103877B2 (en) * 2000-12-21 2012-01-24 Digimarc Corporation Content identification and electronic tickets, coupons and credits
US6965683B2 (en) 2000-12-21 2005-11-15 Digimarc Corporation Routing networks for use with watermark systems
US7003736B2 (en) * 2001-01-26 2006-02-21 International Business Machines Corporation Iconic representation of content
US7392287B2 (en) * 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US20020176628A1 (en) 2001-05-22 2002-11-28 Starkweather Gary K. Document imaging and indexing system
US7283672B1 (en) * 2001-06-29 2007-10-16 Harris Scott C Image compression by object segregation
US7016901B2 (en) * 2001-07-31 2006-03-21 Ideal Scanners & Systems, Inc. System and method for distributed database management of graphic information in electronic form
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US7149957B2 (en) 2001-11-19 2006-12-12 Ricoh Company, Ltd. Techniques for retrieving multimedia information using a paper-based interface
US7788080B2 (en) * 2001-11-19 2010-08-31 Ricoh Company, Ltd. Paper interface for simulation environments
US7495795B2 (en) * 2002-02-21 2009-02-24 Ricoh Company, Ltd. Interface for printing multimedia information
US7747655B2 (en) * 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US8539344B2 (en) 2001-11-19 2013-09-17 Ricoh Company, Ltd. Paper-based interface for multimedia information stored by multiple multimedia documents
US8635531B2 (en) * 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents
US7703044B2 (en) * 2001-11-19 2010-04-20 Ricoh Company, Ltd. Techniques for generating a static representation for time-based media information
US7743347B2 (en) * 2001-11-19 2010-06-22 Ricoh Company, Ltd. Paper-based interface for specifying ranges
ATE509326T1 (de) * 2001-12-18 2011-05-15 L 1 Secure Credentialing Inc Mehrfachbildsicherheitsmerkmale zur identifikation von dokumenten und verfahren zu ihrer herstellung
JP2003196270A (ja) * 2001-12-27 2003-07-11 Sharp Corp 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
US7824029B2 (en) 2002-05-10 2010-11-02 L-1 Secure Credentialing, Inc. Identification card printer-assembler for over the counter card issuing
US20040012601A1 (en) * 2002-07-18 2004-01-22 Sang Henry W. Method and system for displaying a first image as a second image
US7536638B2 (en) * 2003-03-31 2009-05-19 Ricoh Co., Ltd. Action stickers for identifying and processing stored documents
US7757162B2 (en) * 2003-03-31 2010-07-13 Ricoh Co. Ltd. Document collection manipulation
US7552381B2 (en) * 2003-03-31 2009-06-23 Ricoh Co., Ltd. Check boxes for identifying and processing stored documents
US7509569B2 (en) 2003-03-31 2009-03-24 Ricoh Co., Ltd. Action stickers for nested collections
US7703002B2 (en) 2003-03-31 2010-04-20 Ricoh Company, Ltd. Method and apparatus for composing multimedia documents
US20070050696A1 (en) * 2003-03-31 2007-03-01 Piersol Kurt W Physical key for accessing a securely stored digital document
US7739583B2 (en) * 2003-03-31 2010-06-15 Ricoh Company, Ltd. Multimedia document sharing method and apparatus
US7194106B2 (en) * 2003-04-03 2007-03-20 Digimarc Corporation Creating electronic forms through digital watermarking
US7275159B2 (en) * 2003-08-11 2007-09-25 Ricoh Company, Ltd. Multimedia output device having embedded encryption functionality
US20050192920A1 (en) * 2004-02-17 2005-09-01 Hodge Philip C. Real time data management apparatus, system and mehtod
US7779355B1 (en) 2004-03-30 2010-08-17 Ricoh Company, Ltd. Techniques for using paper documents as media templates
JP4491777B2 (ja) * 2004-06-04 2010-06-30 富士ゼロックス株式会社 画像表示装置、画像表示方法及びそのプログラム
US20060075327A1 (en) 2004-09-29 2006-04-06 Joe Sriver User interface for presentation of a document
JP4666996B2 (ja) * 2004-10-21 2011-04-06 キヤノン株式会社 電子ファイリングシステム、電子ファイリング方法
US20070143660A1 (en) * 2005-12-19 2007-06-21 Huey John M System and method for indexing image-based information
US20070192181A1 (en) * 2006-02-10 2007-08-16 Microsoft Corporation Automatically modifying web pages to integrate advertising without changing UI
EP1835418A1 (en) * 2006-03-14 2007-09-19 Hewlett-Packard Development Company, L.P. Improvements in or relating to document retrieval
US8103547B2 (en) * 2006-09-18 2012-01-24 Microsoft Corporation Logocons: AD product for brand advertisers
TWI320554B (en) * 2006-10-20 2010-02-11 Primax Electronics Ltd Method for calculating and adjusting photo and text separation performance
US7739622B2 (en) * 2006-10-27 2010-06-15 Microsoft Corporation Dynamic thumbnails for document navigation
US8234277B2 (en) 2006-12-29 2012-07-31 Intel Corporation Image-based retrieval for high quality visual or acoustic rendering
JP2008204378A (ja) * 2007-02-22 2008-09-04 Fujifilm Corp 診療データ共有サーバ、診療データ共有方法、及び診療データファイリング装置
US20090323134A1 (en) * 2008-06-30 2009-12-31 Kabushiki Kaisha Toshiba Apparatus and method for generating segmentation data of a scanned image
EP2166512B1 (en) * 2008-09-15 2015-08-19 Neopost Technologies Setting and controlling an apparatus for preparing mail pieces
US8239389B2 (en) * 2008-09-29 2012-08-07 International Business Machines Corporation Persisting external index data in a database
US20110099468A1 (en) * 2009-10-22 2011-04-28 Braddock Gaskill Document display system
JP5614191B2 (ja) * 2010-09-13 2014-10-29 株式会社リコー サムネイル画像生成装置及びプログラム
JP5335751B2 (ja) * 2010-09-30 2013-11-06 京セラドキュメントソリューションズ株式会社 画像形成装置
US20120166953A1 (en) * 2010-12-23 2012-06-28 Microsoft Corporation Techniques for electronic aggregation of information
US9679404B2 (en) 2010-12-23 2017-06-13 Microsoft Technology Licensing, Llc Techniques for dynamic layout of presentation tiles on a grid
US9436685B2 (en) 2010-12-23 2016-09-06 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US9715485B2 (en) 2011-03-28 2017-07-25 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US9529900B2 (en) * 2011-12-06 2016-12-27 At&T Intellectual Property I, L.P. Visual interface browser
US9069781B2 (en) * 2012-05-24 2015-06-30 Microsoft Technology Licensing, Llc Techniques to automatically manage file descriptors

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4273440A (en) * 1977-08-30 1981-06-16 Horst Froessl Method and apparatus for data collection and preparation
JPS59128661A (ja) * 1983-01-14 1984-07-24 Fuji Xerox Co Ltd 画像フアイル装置
JPS59183458A (ja) * 1983-04-01 1984-10-18 Hitachi Ltd 画像検索方式
JPS60134357A (ja) * 1983-12-21 1985-07-17 Hitachi Ltd 画像フアイル登録・検索方式
USRE33216E (en) * 1984-07-06 1990-05-15 Blind assembly
US4829453A (en) * 1987-03-05 1989-05-09 Sharp Kabushiki Kaisha Apparatus for cataloging and retrieving image data
USRE33316E (en) 1986-03-18 1990-08-28 Sharp Kabushiki Kaisha Apparatus for cataloging and retrieving image data
US4965558A (en) * 1987-07-15 1990-10-23 Interand Corporation Method and apparatus for image retrieval
WO1989011694A1 (en) 1988-05-27 1989-11-30 Wang Laboratories, Inc. Document folder icon for display in a data processing system
JPH02195480A (ja) * 1989-01-25 1990-08-02 Hitachi Ltd 画像データの検索方式
DE69028573T2 (de) * 1989-05-31 1997-03-27 Toshiba Kawasaki Kk Hochgeschwindigkeitssuchsystem zur Bilddatenspeicherung
US5179652A (en) * 1989-12-13 1993-01-12 Anthony I. Rozmanith Method and apparatus for storing, transmitting and retrieving graphical and tabular data
JPH03223966A (ja) * 1989-12-26 1991-10-02 Fuji Xerox Co Ltd ファイリング装置およびそれを用いたファイル検索方法
US5465327A (en) * 1990-03-15 1995-11-07 International Business Machines Corporation Method and system for document administration utilizing iconic representations within a data processing system
US5083214A (en) * 1990-05-02 1992-01-21 Eastman Kodak Company Apparatus and methods for extracting data from a scanned bit-mapped data strip
US5140678A (en) 1990-05-04 1992-08-18 International Business Machines Corporation Computer user interface with window title bar icons
CA2039652C (en) * 1990-05-30 1996-12-24 Frank Zdybel, Jr. Hardcopy lossless data storage and communications for electronic document processing systems
GB9100733D0 (en) 1991-01-14 1991-02-27 Xerox Corp Indexing of data sets
JPH0644320A (ja) * 1991-05-14 1994-02-18 Sony Corp 情報検索システム
US5202828A (en) * 1991-05-15 1993-04-13 Apple Computer, Inc. User interface system having programmable user interface elements
JP3586472B2 (ja) * 1991-06-25 2004-11-10 富士ゼロックス株式会社 情報表示方法および情報表示装置
JP3017851B2 (ja) * 1991-07-31 2000-03-13 キヤノン株式会社 画像記憶装置
JP3303926B2 (ja) * 1991-09-27 2002-07-22 富士ゼロックス株式会社 構造化文書分類装置及び方法
US5495581A (en) * 1992-02-25 1996-02-27 Tsai; Irving Method and apparatus for linking a document with associated reference information using pattern matching
US5448375A (en) * 1992-03-20 1995-09-05 Xerox Corporation Method and system for labeling a document for storage, manipulation, and retrieval
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5490217A (en) * 1993-03-05 1996-02-06 Metanetics Corporation Automatic document handling system
US5436639A (en) * 1993-03-16 1995-07-25 Hitachi, Ltd. Information processing system
JP3689127B2 (ja) * 1993-04-22 2005-08-31 ゼロックス コーポレイション 文書処理システムと文書処理方法
JPH0756956A (ja) * 1993-07-22 1995-03-03 Xerox Corp 人間の作成したイメージに基づくデータアクセス方法
US5517605A (en) 1993-08-11 1996-05-14 Ast Research Inc. Method and apparatus for managing browsing, and selecting graphic images
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US5717940A (en) * 1995-04-28 1998-02-10 Ricoh Company, Ltd. Method of selecting a target document using features of an example page

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06298272A (ja) * 1993-03-25 1994-10-25 Pohl Gmbh & Co Kg 環状のシール

Also Published As

Publication number Publication date
US6182090B1 (en) 2001-01-30
JPH08305731A (ja) 1996-11-22
JP2005108254A (ja) 2005-04-21
US5717940A (en) 1998-02-10

Similar Documents

Publication Publication Date Title
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
EP0539106B1 (en) Electronic information delivery system
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
EP0609996B1 (en) Method and apparatus for creating, indexing and viewing abstracted documents
US7081975B2 (en) Information input device
JP3289968B2 (ja) 電子的文書処理のための装置および方法
JP4181892B2 (ja) 画像処理方法
US20030042319A1 (en) Automatic and semi-automatic index generation for raster documents
US20060045340A1 (en) Character recognition apparatus and character recognition method
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JPH07210577A (ja) 情報アクセス装置
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH0934903A (ja) ファイル検索装置
JP3958722B2 (ja) イメージデータ文書検索システム
US20090031203A1 (en) Hyperlinks
JP4788205B2 (ja) 文書検索装置及び文書検索プログラム
JP2006165783A (ja) 画像処理システム
JP2008084127A (ja) 画像形成装置
JPH11120201A (ja) 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JPH0375888A (ja) 文書画像認識管理システム
JPH10275153A (ja) 文書情報管理システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040805

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041104

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041109

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080423

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110502

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120502

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120502

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130502

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees