JP2008234658A - テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション - Google Patents
テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション Download PDFInfo
- Publication number
- JP2008234658A JP2008234658A JP2008072464A JP2008072464A JP2008234658A JP 2008234658 A JP2008234658 A JP 2008234658A JP 2008072464 A JP2008072464 A JP 2008072464A JP 2008072464 A JP2008072464 A JP 2008072464A JP 2008234658 A JP2008234658 A JP 2008234658A
- Authority
- JP
- Japan
- Prior art keywords
- document
- structural element
- results
- query word
- predetermined relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 テキスト検索エンジンからの検索結果を可視化するための方法及び装置を提供する。
【解決手段】 最初に、質問語が受け取られる。各々が少なくとも1つの構造要素を有する文書と、文書のインデックスとを格納したデータベースを用い、質問語に基づいて第1の結果の組が生成される。第1の結果の組に関連する構造要素が検索される。構造要素と質問語との間の所定の関係に基づいて第2の結果の組が生成される。可視化された第2の結果の組が表示される。
【選択図】図1
【解決手段】 最初に、質問語が受け取られる。各々が少なくとも1つの構造要素を有する文書と、文書のインデックスとを格納したデータベースを用い、質問語に基づいて第1の結果の組が生成される。第1の結果の組に関連する構造要素が検索される。構造要素と質問語との間の所定の関係に基づいて第2の結果の組が生成される。可視化された第2の結果の組が表示される。
【選択図】図1
Description
本発明はテキスト検索分野に関し、より具体的には、テキスト検索結果の可視化に関する。
デスクトップ検索技術は、近年、大きな関心を集めている。デスクトップ検索エンジンの背後にある標準的な技術はテキスト検索エンジンである。つまり、テキストがファイル群から抽出され、このテキストにインデックスが付けられ、そしてインデックス付きテキストに対して質問語の検索が実行される。テキストは一般的にページ情報なしで抽出される(これは、歴史的にウェブ検索技術がデスクトップファイルに適応されてきたことに起因する)。典型的な検索の筋書きにおいては、整合した結果の一覧が返され、それは検索エンジンによって定められたスコア順、ファイル名によるアルファベット順、又はアプリケーションによってソートされる。個人のデスクトップコンピュータのファイル量が増大するにつれ、返される結果の一覧はあまり参考にならなくなり得る。ユーザが“何故、この文書が受け取られたのか”という質問をすることが頻繁にあるが、検索結果の表示を介してこの質問への回答を得ることはない。
1つの重要な文書の種類に、例えば“pdf”又は“doc”等のフォーマットにより表される、ページ付き文書(すなわち、フォーマット化された文書)がある。これらの文書は電子的に作成されたものであり得るし、あるいはスキャナによってデスクトップ又はローカルファイル記憶システムに送信されたものでもあり得る。この場合、検索可能なインデックスを作成することができるように、光学式文字認識(OCR)処理が実行されなければならない。
さらに、検索クエリー(query)の結果として一覧内に表示される複数ページの文書全体を通してのナビゲーションは、文書を選択し、該文書が書かれた或いはフォーマットされたアプリケーションを立ち上げ、且つ該アプリケーションの制御を用いてページ全体をナビゲートし、更には場合により該アプリケーション内で同一の用語に関して二度目の検索を実行することなしでは、現時点で不可能である。最新技術と言える多機能周辺機器(MFP)に内蔵された検索エンジンの場合、検索エンジンに加えて文書処理アプリケーションが実装される必要がある。
米国特許出願公開第2004/0146199号明細書
米国特許出願公開第2004/0145593号明細書
米国特許出願公開第2006/0136491号明細書
本発明は、テキスト検索エンジンによって検索されたページ付き文書全体を通してのコースツーファイン・ナビゲーションを実現する方法及び装置を提供することを目的とする。
本発明の一実施形態に従った方法は:質問語を受け取る段階;各々が少なくとも1つの構造要素を有する複数の文書と該複数の文書のインデックスとを格納したデータベースを用いて、質問語に基づく第1の結果の組を生成する段階;第1の結果の組に関連する複数の構造要素を検索する段階;上記の複数の構造要素と質問語との間の所定の関係に基づく第2の結果の組を生成する段階;及び第2の結果の組を表示する段階を有する。
本発明は添付の図面に記載された図を参照して、限定ではなく例示として説明される。
テキスト検索エンジンによって検索されたページ付き文書の検索結果のコースツーファイン(coarse-to-fine)ナビゲーションのための方法及び装置を説明する。一実施形態において、電子文書の検索システムは、1つのテキスト検索エンジンと、文書のページ及びページの部分(構造要素としても知られている)のビットマップ若しくは画像のデータベースとにより動作する。検索システムは、質問語のヒットが何処で発生したかを一層良好に把握できるように、文書を“覗き込む”能力をユーザに提供する。
以下の記載にて、本発明の幾つもの実施形態の良好な理解を提供するために、例えば具体的なシステム、構成要素及び方法などの数多くの具体的詳細事項を説明する。しかしながら、当業者に明らかなように、本発明の少なくとも一部の実施形態はこれらの具体的詳細事項を用いずに実施されてもよい。また、本発明をいたずらに不明瞭にしないよう、周知の構成要素及び方法は簡易的なブロック図の形態で表し、詳細には説明しないこととする。従って、ここで説明される具体的詳細事項は単なる例示である。具体的な実施はこれら例示的な詳細事項とは異なるものとなり得るが、依然として本発明の概念及び範囲に含まれるものである。
本発明の実施形態は、後述されるような様々な操作を含んでいる。これらの操作はハードウェア部品、ソフトウェア、ファームウェア、又はこれらの組み合わせによって実行され得る。ここでは、用語“結合される”は、直接的に、あるいは1つ又は複数の介在部品を介して間接的に、の何れで結合されることをも意味する。ここで説明される様々なバス上で供給される信号は、その他の信号と時分割多重されて1つ以上の共通バス上で供給されてもよい。また、回路部品群又はブロック群の間の相互接続は、バス群として、あるいは単一の信号線として示され得る。バスの各々は代替的に1つ又は複数の信号線であってもよく、単一の信号線の各々は代替的にバスであってもよい。
一定の実施形態は、機械可読媒体に格納された命令を含むコンピュータプログラムとして実施されてもよい。これらの命令は上述の操作を実行するように汎用又は専用のプロセッサをプログラムするために使用され得る。機械可読媒体には、機械(例えば、コンピュータ)によって読み取り可能な形態(例えば、ソフトウェア、処理用アプリケーション)で情報を記憶あるいは伝送する如何なる機構も含まれる。機械可読媒体には、これらに限定されないが、磁気記憶媒体(例えば、フロッピー(登録商標)ディスク);光学記憶媒体(例えば、CD−ROM);磁気光学記憶媒体;読み出し専用メモリ(ROM);ランダムアクセスメモリ(RAM);消去可能プログラマブルメモリ(例えば、EPROM及びEEPROM);フラッシュメモリ;電気的、光学的、音響的若しくはその他の形態の伝搬信号(例えば、搬送波、赤外線信号、デジタル信号など);又は電子的な命令を格納することに適したその他の種類の媒体が含まれ得る。
また、一部の実施形態は、機械可読媒体が2つ以上のコンピュータシステムに格納される、且つ/或いは機械可読媒体が2つ以上のコンピュータシステムによって実行される、分散型コンピュータ環境にて実施されてもよい。さらに、コンピュータシステム間で伝送される情報は、コンピュータシステムを接続する通信媒体から引き出されてもよいし、あるいはそれに押し込まれてもよい。
図1は、ページ付けられた文書の検索システムの一実施形態を例示するブロック図である。ページ付き文書104はOCR処理106によって、また、構造要素分類器108によってスキャンされる。OCR処理106は検索可能な電子フォーマットのテキストを提供する。構造要素分類器108は、スキャンされたページ付き文書104に含まれる構造要素の分類を規定する。例えば、ページ付き文書は表題、本文、図、及び図の見出しを含み得る。一実施形態において、OCR処理106は表題のテキスト、本文のテキスト、及び見出しのテキストを抽出する。一実施形態において、構造要素分類器108は図を描画構造要素として分類し、本文をテキスト構造要素として分類する。構造要素分類器108は、「Reformatting Documents Using Document Analysis Information」という発明名称で2003年1月29日に出願された米国特許出願第10/354811号(公開番号2004/0146199;公開日2004年7月29日)、「Resolution Sensitive Layout of Document Regions」という発明名称で2003年5月9日に出願された米国特許出願第10/435300号(公開番号2004/0145593;公開日2004年7月29日)、「Semantic Document Smartnails」という発明名称で2004年12月22日に出願された米国特許出願第11/023142号(公開番号2006/0136491;公開日2006年6月22日)、「Creating Visualizations of Documents」という発明名称で2004年12月20日に出願された米国特許出願第11/018231号、及び「Methods for Computing a Navigation Path」という発明名称で2006年1月13日に出願された米国特許出願第11/332533号に記載された構造要素分類器の何れであってもよい。なお、これらの米国特許明細書は参照することによりここに組み込まれる。
その他の構造要素の例には、これらに限られないが、本文段落要素、グラフィック要素、写真要素、及び図要素がある。各構造要素は更に、付加的分類を含んでいてもよい。例えば、本文段落要素は表題部、著者部、発行元名称部、参考文献部、及び脚注部を含んでいてもよい。また、グラフィック要素はブロック図、棒グラフ、組織図、及びロゴを含んでいてもよい。
OCR処理106からのテキスト及び構造要素分類器108からの構造要素はデータベース114に記憶される。一実施形態において、各構造要素は画像ビットマップとしてデータベース114に記憶される。各画像ビットマップには、対応するメタデータが添付されてもよい。一実施形態において、メタデータは構造要素の種類(例えば、テキスト、グラフィック、写真など)とともに、元のページ画像における切り取り座標を記述する。一実施形態において、データベース114はそのコンテンツのインデックスを含んでいてもよい。メタデータもインデックスを有しており、故に検索可能である。
ユーザ102がテキスト検索エンジン110に検索語すなわちテキストの質問語を与える。他の一実施形態に従って、検索範囲を限定して狭くするための検索フィールドがテキスト検索エンジン110に与えられる。テキスト検索エンジン110はデータベース114内のインデックスにアクセスし得る。上述のように、一実施形態において、データベース114はページ群に含まれる画像及び構造要素を格納している。
検索語及び検索フィールドが与えられると、テキスト検索エンジン110は指定されたフィールド内のインデックスに該検索語を含む全ての文書ファイルを検索する。このファイルの集合の伝統的な出力は“ヒットセット”と呼ばれ得る。
豊富化ヒットセットプロセッサ112は、テキスト検索エンジン110からのヒットセットを使用して、ヒットセット内の構造要素のデータベース114に問い合わせを行う。豊富化ヒットセットプロセッサ112は、検索語及びヒットセットと予め指定された(あるいは所定の)関係を有する構造要素を検索する。この関係はユーザ、又は例えばITサービス者などの別の関係者によって規定されていてもよいし、あるいは構造要素分類器の使用中に作り出されたデータベース114内のメタデータを介して規定されていてもよい。検索語と構造要素との間の関係は、検索語がグラフィック要素によって覆われた領域内に存在するか、検索語が図の見出し要素、表題要素若しくは参考文献要素内に存在するか、又は検索語が写真要素若しくはグラフィック要素の近傍に存在するか、等といった関係を含み得る。
検索語と検索された構造要素との対は、豊富化されたヒットセットを形成するものであり、豊富化ヒットセットプロセッサ112へと返される。一実施形態において、豊富化ヒットセットプロセッサ112は、例えば文書当たりの用語ヒット数、構造要素分類ごとの文書当たりの用語ヒット数など、豊富化ヒットセットの更なるパラメータを計算する。一実施形態において、豊富化ヒットセットは:
文書に関する:ページ数、質問語ヒット総数;ファイル名、テキストの概要;
ページに関する:ページのビットマップ;ヒット数、ヒット位置、ヒットの書体特性;
構造要素分類に関する:テキスト、グラフィック、写真;
ページ上の個々の構造要素に関する:テキスト、グラフィック、写真領域のビットマップ;構造要素付近でのヒット数、ヒットの位置及び書体特性;
の何れか又は全てを含んでいてもよい。
文書に関する:ページ数、質問語ヒット総数;ファイル名、テキストの概要;
ページに関する:ページのビットマップ;ヒット数、ヒット位置、ヒットの書体特性;
構造要素分類に関する:テキスト、グラフィック、写真;
ページ上の個々の構造要素に関する:テキスト、グラフィック、写真領域のビットマップ;構造要素付近でのヒット数、ヒットの位置及び書体特性;
の何れか又は全てを含んでいてもよい。
一実施形態において、豊富化ヒットセットプロセッサ112の結果は、様々な可視化モジュールであるヒットリスト可視化モジュール116、構造要素分類可視化モジュール118、及び構造要素可視化モジュール120に送られる。これら可視化モジュールについては更に後述する。
一実施形態において、可視化モジュール116、118、120の出力は、ユーザ102が視認可能な検索インターフェースを形成するGUI表示122へと送られる。一実施形態において、ユーザ102が例えばクリック、ドラッグ・アンド・ドロップ又はマウスの重ね合わせなどのGUIアクションを実行することを可能にするユーザ入力検出器が含まれていてもよい。
一実施形態において、可視化モジュールは部分モジュール116、118及び120を含んでいる。各可視化モジュールは構造的なヒットセット階層の、例えば文書レベル、ページレベル、構造要素分類レベル又は個々の構造要素レベルといった、特定のレベル上で機能する。
ヒットリスト可視化モジュール116は文書レベルでの表示を生成し得る。図6は、このような文書レベルでの表示608の一例を示している。この表示はファイル名606、文書内で発見された特定の検索語(この例においては用語“スマートネイル(smartnail)”)のヒット数604、検索語を含むテキストの概要、及びアプリケーションのアイコンを含み得る。また、文書内で発見されたヒットの数は数字又はスコアの棒グラフの何れで示されてもよい。一実施形態において、絶対的な関連性スコアが検索エンジンによって計算され、表示される。一実施形態において、構造要素分類602が選択可能なフィールドとして表示される。図6においては、ユーザは検索エンジンに、用語“スマートネイル(smartnail)”を検索し、全体でのヒット数に従って表示するように要求している。“テキストコンテンツ”、“図”、“グラフィック”又は“ページ数”のボックスがチェックされる場合、そのカテゴリーに現れる検索語のヒット数604が示される。例えば、“図”ボックスがチェックされると、ヒット数604は図の中に用語(この例では“スマートネイル(smartnail)”)が現れる回数を示すことになる。
構造要素分類可視化モジュール118は構造要素分類レベルでの表示を生成し得る。図7は、このような構造要素分類レベルでの表示712の一例を示している。ユーザは使用可能な構造分類702の1つ又は複数を選択することができる。この選択に応じて、選択された分類702を含むサムネイルページ706が示され得る。使用可能な構造要素分類の選択肢は、図7に例示されているようにチェックボックスの一覧によって指し示されてもよい。図7はまた、ファイル名に加え、図の見出し内で最初に質問語(この例では“スマートネイル(smartnail)”)が存在しているページをサムネイル706として表示している。一実施形態において、質問語のヒットを含むページはまた、サムネイルウィンドウ内でスライドショーを形成することも可能である。
他の一実施形態においては、使用可能な構造要素分類の選択は、図4に例示されるように、文書の最初のページのサムネイルに付加された視覚的なタグとして指し示されてもよい。
図4は、一実施形態に従ったタグ付けされたサムネイル表示の一例を示している。この可視化は構造要素分類レベルでのものである。質問語“スマートネイル”が発見された文書内のページ位置は色付きのタグによって指し示されてもよい。一実施形態において、異なる色又はパターンは、異なる構造要素分類を指し示す。このようなナビゲーション用サムネイルは文書レベルのヒットリスト内でファイル名に加えて示されてもよい。
可視化は、静止したもの(例えば、単一の画像のみ)、ユーザ入力を介して相互作用されるもの(例えば、タグ付けされたサムネイル)、又は自動的に動くもの(例えば、質問語のヒットを含むページ又は構造要素を含んだスライドショー又はビデオクリップ)とし得る。動画の場合、ユーザは、画面上に表示された再生ボタンを押すことによってスライドショー又はビデオクリップの再生を開始させてもよい。
図5は、一実施形態に従った表示の一例を示している。この可視化はページレベル又は構造要素分類レベルでのものである。質問語“スマートネイル”が発見された文書内のページ位置が、ページサムネイル502によって指し示されている。このようなサムネイル502から成る一連のページは、文書レベルのヒットリスト内でファイル名に加えて示されてもよい。故に、サムネイル502から成る“一連のページ”は、示されたページが選択された要素分類のヒット504を含んでいる位置を反映するように作り出されてもよい。一実施形態において、サムネイル502は、先述の米国特許出願第10/354811号(公開番号2004/0146199)、米国特許出願第10/435300号(公開番号2004/0145593)、及び米国特許出願第11/023142号(公開番号2006/0136491)にて説明されているようなスマートサムネイル(スマートネイル)である。
一実施形態において、構造要素可視化モジュール120は構造要素レベルでの表示を生成する。図8は、個々の構造要素レベルでの表示の一例を示している。個々の構造要素レベル上で、その構造要素と質問語を含む要素とを含んだ画像802が作り出される。例えば、質問語がグラフィック内で発見された場合、そのグラフィックのビットマップ画像が質問語を強調するようにして示される。構造要素を示す画像802の大きさは、質問語に一致した付随のテキストのフォント特性に依存する。一実施形態において、その要素内の質問語に対して読み取り可能なフォントサイズが確保されるように、ビットマップ画像の縮尺パラメータが計算される。例えば、元のビットマップ画像サイズが1000×500画素であり、質問語のフォントサイズが画素にして20であり、且つ最小フォントサイズが8画素に設定される場合、このビットマップ画像に適用される倍率は8/20=2/5となる。すなわち、ユーザに提示される縮小画像は400×200画素の寸法を有することになる。この画像は、文書レベル表示702上でこの構造要素を含むページを示すページサムネイル上でのマウス重ね合わせ動作に応答して表示されることができる。この縮尺合わせは、やはり、先述の米国特許出願第10/354811号(公開番号2004/0146199)、米国特許出願第10/435300号(公開番号2004/0145593)、及び米国特許出願第11/023142号(公開番号2006/0136491)に記載されている。
他の一実施形態に従って、テキスト以外(例えば、写真や表など)をも含んでいる要素の付近に検索語が存在している場合には、倍率は先ず、前段落で説明されたようにしてヒットした質問語に対して計算される。そして、テキストのみではない要素(例えば、写真や表など)の縮尺合わせのために同一の倍率が使用される。例えば、質問語ヒットは図の見出し内で生じ得る。この図はテキストの見出しと写真とで構成されている。このとき、倍率は見出し内でヒットした質問語に対して計算され、その後、図の写真要素にも適用される。同様の例は、質問語がヒットした見出しを有する表である。倍率は見出し内でヒットした質問語に対して計算され、その後、同一の倍率によって表全体の縮尺が変えられる。このとき、写真要素も同一量だけ縮尺を変えられる。双方の要素が切り取り、拡大縮小、及び貼り付け操作を用いて最終画像へと合成される。
図9は、一実施形態に従った関連性メモリウィンドウの一例を示している。検索結果の一覧702の隣に、関連性メモリウィンドウ902、すなわち、コンピュータによって検索に関連性があると見なされた情報(machine-relevant search information)を含むウィンドウ902が付加され得る。ウィンドウ902は、例えば検索フィールド、検索クエリー、どのような可視化が選択されたか等を含む、ユーザによって入力された関連情報であるとコンピュータが見なしたものを表示する。
図2は、検索を実行し、検索結果を表示する処理の一実施形態を示すフロー図である。この処理は、ハードウェア(例えば、回路、専用ロジック等)、ソフトウェア(例えば、汎用コンピュータシステム又は専用機械上で実行されるもの)、又はこれら双方の組み合わせを有する処理ロジックによって実行され得る。
図2を参照するに、処理ブロック202にて、処理ロジックは質問語を受け取る。処理ブロック204にて、処理ロジックは文書を格納しているデータベースを用い、質問語に基づく第1の結果の組を生成し、且つ文書のインデックスを生成する。各文書は少なくとも1つの上述のような構造要素を有している。処理ブロック206にて、処理ロジックは第1の結果の組に関連する構造要素を検索する。処理ブロック208にて、処理ロジックは構造要素と質問語との間の所定の関係に基づく第2の結果の組を生成する。処理ブロック210にて、処理ロジックは第2の結果の組を表示・可視化する。これは上述のモジュール116、118及び120を用いて行われ得る。
一実施形態によれば、第2の結果の組を表示することは更に、ファイル名と、該ファイル名を有する文書内での質問語のヒット数とを表示することを有する。
他の一実施形態によれば、第2の結果の組を表示することは更に、ファイル名と、該ファイル名を有する文書の構造要素内での質問語のヒット数と、所定の関係に基づく文書の構造要素の一部の画像を表示することを有する。
他の一実施形態によれば、第2の結果の組を表示することは更に、所定の関係に基づく文書の構造要素の一部の画像の拡大画像を表示し、拡大画像内で質問語が読み取れるようにすることを有する。
図3は、検索を実行し、検索結果を表示する処理の他の一実施形態を示すフロー図である。この処理は、ハードウェア(例えば、回路、専用ロジック等)、ソフトウェア(例えば、汎用コンピュータシステム又は専用機械上で実行されるもの)、又はこれら双方の組み合わせを有する処理ロジックによって実行される。
図3を参照するに、処理ブロック302にて、図1に関連して説明されたようなヒットセットを生成する。処理ブロック304にて、処理ロジックは図1に関連して説明されたような豊富化ヒットセットを生成する。そして、処理ロジックは豊富化ヒットセットの結果を生成し(処理ブロック306)、結果を表示する(処理ブロック308)。
次に多機能周辺機器(MFP)の実施例について説明する。
一実施形態において、上述の検索技術はMFPに実装される。図11は、本発明の一実施形態に従ったMFPのブロック図である。このMFPは好ましくは、制御ユニット1150、表示装置1110、キーボード1112、カーソル制御装置1114、ネットワークコントローラ1116、及び1つ以上の入力/出力(I/O)装置1118を有している。
制御ユニット1150は、表示装置1110に電子的な表示信号を供給するように備えられた、算術ロジックユニット、マイクロプロセッサ、汎用コンピュータ、携帯情報端末(PDA)又はその他の情報機器を含み得る。一実施形態において、制御ユニット1150は、グラフィカル・ユーザ・インターフェースを備えた汎用コンピュータを有している。このグラフィカル・ユーザ・インターフェースは、例えば、WINDOWS(登録商標).RTM又はUNIX(登録商標).RTMに基づくオペレーティングシステムのようなオペレーティングシステムの最上層で実行されるJava(登録商標)で記述されたプログラムによって生成され得る。一実施形態において、例えば文書処理アプリケーション、電子メールアプリケーション、金融アプリケーション及びウェブ・ブラウザ・アプリケーション等を含む1つ以上のアプリケーション・プログラムが制御ユニット1150によって実行される。
なおも図11を参照するに、図示された制御ユニット1150は、プロセッサ1102、主メモリ1104、及びデータ記憶装置1106を含んでおり、これらは何れもシステムバス1108に通信可能に結合されている。
プロセッサ1102はデータ信号を処理し、また、複数命令セットコンピュータ(CISC)アーキテクチャ、縮小命令セットコンピュータ(RISC)アーキテクチャ、又は命令セットの組み合わせを実行するアーキテクチャを含む様々な計算アーキテクチャを含み得る。図11には単一のプロセッサのみが示されているが、複数のプロセッサが含まれていてもよい。
主メモリ1104は、プロセッサ1102によって実行され得る命令及び/又はデータを格納している。この命令及び/又はデータは、ここで説明される技術の何れか及び/又は全てを実行するためのコードを有している。主メモリ1104は、ダイナミック・ランダムアクセスメモリ(DRAM)装置、スタティック・ランダムアクセスメモリ(SRAM)装置、又は技術的に知られたその他の記憶装置を有し得る。
データ記憶装置1106は、データ(例えば、画像データ)及びプロセッサ1102用の命令を格納するものであり、ハードディスクドライブ、フロッピーディスクドライブ、CD−ROM装置、DVD−ROM装置、DVD−RAM装置、DVD−RW装置、フラッシュメモリ装置、又は技術的に知られたその他の大容量記憶装置を含む1つ以上の装置を有している。
システムバス1108は、制御ユニット1150の全体で情報及びデータを伝達する共用バスを表している。システムバス1108は業界標準アーキテクチャ(ISA)バス、周辺部品相互接続(PCI)バス、ユニバーサル・シリアル・バス(USB)、又は同様の機能を提供する技術的に知られたその他のバス、を含む1つ以上のバスであってもよい。システムバス1108を介して制御ユニット1150に結合される更なる部品には、表示装置1110、キーボード1112、カーソル制御装置1114、ネットワークコントローラ1116、及びI/O装置1118が含まれる。
表示装置1110は、ここで説明されるような電子的な画像及びデータを表示するために備えられた如何なる装置をも表している。表示装置1110は、例えば、陰極線管(CRT)、液晶ディスプレー(LCD)、又は同様に備えられたその他の何らかの表示装置、スクリーン若しくはモニターであり得る。一実施形態において、表示装置1110は、タッチ検知式の透明パネルが表示装置1110の画面を覆っているタッチスクリーンを備えている。
キーボード1112は、情報及びコマンドの選択をプロセッサ1102に伝達するために制御ユニット1150に結合された文字・数字入力装置を表している。キーボード1112はクワーティ(QWERTY)配列キーボード、キーパッド、又はタッチスクリーン上に作り出されたこれらの表示とし得る。
カーソル制御装置1114は、位置データ及びコマンド選択をプロセッサ1102に伝達するために備えられたユーザ入力装置を表している。カーソル制御装置1114は、マウス、トラックボール、スタイラス、ペン、タッチスクリーン、カーソル方向キー、又はカーソルを動かすためのその他の機構を含んでいる。
ネットワークコントローラ1116は、複数の処理システムを含み得るネットワークに制御ユニット1150を接続する。処理システムのネットワークは、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)(例えば、インターネット)、及び/又は複数の装置が通信するためのその他の何らかの相互接続されたデータパスを含み得る。制御ユニット1150はまた、当業者に理解されるように、例えばTCP/IP、http、https及びSMTP等の標準的なネットワークプロトコルを用いてファイル(メディア・オブジェクト)を配布するネットワークのようなその他のシステムとの、標準的な接続を有している。
1つ以上のI/O装置1118はシステムバス1108に結合されている。例えば、I/O装置1118は、文書の画像を捕捉するための画像スキャナ及び原稿送り装置を含んでいる。I/O装置1118はまた文書を生成するプリンタを含んでいる。I/O装置1118はまた、マイクを介して音声入力を受信し、スピーカを介して音声出力を送信するように備えられた音声入力/出力装置を含んでいてもよい。一実施形態において、音声装置は、汎用コンピュータシステムで使用されるように設計された音声アドイン/拡張カードといった汎用品である。音声I/O装置は、必要に応じて、音声処理を容易にする1つ又は複数のアナログ・デジタル変換器若しくはデジタル・アナログ変換器、及び/又は1つ又は複数のデジタル信号プロセッサを含み得る。
当業者に明らかであるように、多機能プリンタ102は進化を続けており、本発明の概念及び範囲を逸脱することなく、図11に示されたより多くの、あるいは少ない構成要素を含んでいてもよい。例えば、進化した多機能プリンタ102は、例えば一次キャッシュや二次キャッシュ等の更なるメモリ、又は1つ以上の特定用途向け集積回路(ASIC)を含んでいてもよい。同様に、例えば、電子データを捕捉し、且つ/或いは電子データを制御ユニット1150にダウンロードするように備えられてもよい、RFIDタグ読取器、デジタルカメラ、デジタルビデオカメラ、又はその他の装置を含む更なる入力/出力装置1118が制御ユニット1150に結合されていてもよい。例えばカーソル制御装置1114等の1つ以上の部品が排除されることも可能である。
続いて、コンピュータシステムの実施例について説明する。
図10は、ここで説明された操作の1つ以上を実行し得る典型的なコンピュータシステムを示すブロック図である。図10を参照するに、コンピュータシステム1000は、典型的なクライアント又はサーバコンピュータシステムを有している。コンピュータシステム1000は、情報を伝達する通信機構又はバス1011、及びバス1011と結合された情報を処理するためのプロセッサ1012を有している。プロセッサ1012は、これらに限られないが、例えばペンティアム(登録商標)、パワーPC(登録商標)、アルファ(登録商標)等のマイクロプロセッサを含む。
システム1000は更に、情報とプロセッサ1012によって実行される命令とを記憶するための、バス1011に結合されたランダムアクセスメモリ(RAM)又はその他のダイナミック型記憶装置1004(主メモリと称される)を有している。主メモリ1004はまた、プロセッサ1012による命令の実行時に、一時的な変数又はその他の中間情報を記憶するために用いられてもよい。
コンピュータシステム1000はまた、プロセッサ1012用の静的な情報及び命令を記憶するための、バス1011に結合された読み出し専用メモリ(ROM)及び/又はその他のスタティック型記憶装置1006と、例えば磁気ディスク若しくは光ディスク及びその対応するディスクドライブ等のデータ記憶装置1007とを有している。データ記憶装置1007は情報及び命令を格納するためにバス1011に結合されている。
コンピュータシステム1000は更に、コンピュータユーザに情報を表示するための、バス1011に結合された、例えば陰極線管(CRT)又は液晶ディスプレー(LCD)等の表示装置1021に結合されていてもよい。また、情報及びコマンド選択をプロセッサ1012に伝達するために、英数字及びその他のキーを含む文字・数字入力装置1022がバス1011に結合されていてもよい。更なるユーザ入力装置は、方向情報及びコマンド選択をプロセッサ1012に伝達し、カーソル動作をディスプレー1021上で制御するためにバス1011に結合された、例えばマウス、トラックボール、トラックパッド、スタイラス・ペン、又はカーソル方向キー等のカーソル制御装置1023である。
バス1011に結合され得る他の装置は、例えば紙若しくはフィルム等の媒体、又は同様の種類の媒体に情報を印すために使用され得るハードコピー装置1024である。バス1011に結合され得る他の装置は、電話又は掌サイズのパーム装置と通信する有線/無線通信手段1025である。
なお、システム1000及び付随するハードウェアの構成要素の何れか又は全てが本発明において用いられてもよい。しかしながら、認識され得るように、この他のコンピュータシステムの構成がこれらの装置の一部又は全てを含んでいてもよい。
ここで説明された可視化システムは、検索テキストクエリーに応答して検索エンジンから返されたファイルセット全体をユーザがナビゲートすることを支援するものである。複数ページの文書ファイルのナビゲーションは、個々のページ及びページ内の構造要素へのアクセスを含んでいる。結果として、ユーザは、検索エンジンによって文書内の何処で検索語が発見されたかを把握することができる。
本発明に係る方法の操作は特定の順序で示され且つ説明されているが、各々の方法の操作の順序は、一定の操作群が逆の順序で実行されるように、あるいは一定の操作が少なくとも部分的にその他の操作と同時に実行されるように変更されてもよい。他の一実施形態においては、相異なる操作群の命令群又は部分的な操作群は断続的に、且つ/或いは交互に実行されてもよい。
以上の記載において、本発明はその具体的で例示的な実施形態を参照して説明されてきた。しかしながら、明らかであるように、添付の請求項にて説明される本発明の一層広い概念及び範囲を逸脱することなく、これらの実施形態には様々な改良及び変更が為され得る。この明細書及び図面は、従って、限定的な意味でとらえられるものではなく、例示的な意味でとらえられるべきものである。
102 … ユーザ
104 … 文書
108 … 構造要素分類器
110 … テキスト検索エンジン
112 … 豊富化ヒットセットプロセッサ
116 … ヒットリスト可視化モジュール
118 … 構造要素分類可視化モジュール
120 … 構造要素可視化モジュール
122 … グラフィカル・ユーザ・インターフェース
402、502、706 … ページサムネイル
404、406 … タグ
602 … 構造要素分類
604、704 … ヒット数
606、708 … ファイル名
608、712 … 表示
902 … 関連性メモリウィンドウ
1000 … コンピュータシステム
1004、1104 … 主メモリ
1006 … スタティックメモリ
1007、1106 … 記憶装置
1011 … バス
1012、1102 … プロセッサ
1020 … 外部ネットワークインターフェース
1021、1110 … 表示装置
1022、1112 … キーボード
1023、1114 … カーソル制御装置
1024 … ハードコピー装置
1116 … ネットワークコントローラ
1118 … I/O装置
1150 … 制御ユニット
104 … 文書
108 … 構造要素分類器
110 … テキスト検索エンジン
112 … 豊富化ヒットセットプロセッサ
116 … ヒットリスト可視化モジュール
118 … 構造要素分類可視化モジュール
120 … 構造要素可視化モジュール
122 … グラフィカル・ユーザ・インターフェース
402、502、706 … ページサムネイル
404、406 … タグ
602 … 構造要素分類
604、704 … ヒット数
606、708 … ファイル名
608、712 … 表示
902 … 関連性メモリウィンドウ
1000 … コンピュータシステム
1004、1104 … 主メモリ
1006 … スタティックメモリ
1007、1106 … 記憶装置
1011 … バス
1012、1102 … プロセッサ
1020 … 外部ネットワークインターフェース
1021、1110 … 表示装置
1022、1112 … キーボード
1023、1114 … カーソル制御装置
1024 … ハードコピー装置
1116 … ネットワークコントローラ
1118 … I/O装置
1150 … 制御ユニット
Claims (23)
- 質問語を受け取る段階;
各々が少なくとも1つの構造要素を有する複数の文書と該複数の文書のインデックスとを格納したデータベースを用いて、前記質問語に基づく第1の結果の組を生成する段階;
前記第1の結果の組に関連する複数の構造要素を検索する段階;
前記複数の構造要素と前記質問語との間の所定の関係に基づく第2の結果の組を生成する段階;及び
前記第2の結果の組に含まれる各結果に対して、前記質問語が文書内に現れている例を示す画像を添えて、前記第2の結果の組を表示する段階;
を有する方法。 - 前記第2の結果の組を表示する段階は更に:
テキスト表現、及び該テキスト表現を有する文書内での前記質問語のヒット数を表示すること、
を有する、請求項1に記載の方法。 - 前記テキスト表現は、文書のファイル名、及び文書内の文章の何れかである、請求項2に記載の方法。
- 前記第2の結果の組を表示する段階は更に:
テキスト表現、該テキスト表現を有する文書の構造要素内での前記質問語のヒット数、及び前記所定の関係に基づく該文書の構造要素の一部の画像を表示すること、
を有する、請求項1に記載の方法。 - 前記テキスト表現は、文書のファイル名、及び文書内の文章の何れかである、請求項4に記載の方法。
- 前記第2の結果の組を表示する段階は更に:
前記所定の関係に基づく文書の構造要素の一部の画像の拡大画像を表示し、該拡大画像内で前記質問語が読み取れるようにすること、
を有する、請求項1に記載の方法。 - 機械により関連性があるとされた検索情報を示す関連性メモリウィンドウを表示する段階、
を更に有する請求項1に記載の方法。 - 各構造要素は本文部分、グラフィック部分、又は写真部分を有する、請求項1に記載の方法。
- 各構造要素は、対応するメタデータに関連付けられた画像ビットマップとして前記データベースに格納されており、該対応するメタデータは更に、構造要素の種類、及び対応する文書のページ画像内での座標を有する、請求項1に記載の方法。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書のグラフィック部分に含まれているか、ということを有する、請求項1に記載の方法。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書の表題部分、図の部分、見出し部分、又は参考文献部分に含まれているか、ということを有する、請求項1に記載の方法。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書の写真要素又はグラフィック要素に含まれているか、ということを有する、請求項1に記載の方法。
- プロセッサによって実行されるときに、請求項1乃至12の何れか一項に記載の方法を実行させるプログラム。
- 各々が少なくとも1つの構造要素を有する複数の文書と該複数の文書のインデックスとを格納したデータベースを用いて、質問語に基づく第1の結果の組を生成し、前記第1の結果の組に関連する複数の構造要素を検索し、且つ前記複数の構造要素と前記質問語との間の所定の関係に基づく第2の結果の組を生成する検索エンジン;及び
前記第2の結果の組に含まれる各結果に対して、前記質問語が文書内に現れている例を示す画像を添えて、前記第2の結果の組を表示する可視化モジュール;
を有する装置。 - 前記可視化モジュールは更にヒットリスト可視化モジュールを有し、該ヒットリスト可視化モジュールは、テキスト表現及び該テキスト表現を有する文書内での前記質問語のヒット数の表示を生成する、請求項14に記載の装置。
- 前記可視化モジュールは更に構造要素分類可視化モジュールを有し、該構造要素分類可視化モジュールは、テキスト表現、該テキスト表現を有する文書の構造要素内での前記質問語のヒット数、及び前記所定の関係に基づく該文書の構造要素の一部の画像の表示を生成する、請求項14に記載の装置。
- 前記可視化モジュールは更に構造要素可視化モジュールを有し、該構造要素可視化モジュールは、前記所定の関係に基づく文書の構造要素の一部の画像の拡大画像の表示を、該拡大画像内で前記質問語が読み取れるように生成する、請求項14に記載の装置。
- 前記可視化モジュールは更に、機械により関連性があるとされた検索情報を示す関連性メモリウィンドウを表示する、請求項14に記載の装置。
- 各構造要素は本文部分、グラフィック部分、又は写真部分を有する、請求項14に記載の装置。
- 各構造要素は、対応するメタデータに関連付けられた画像ビットマップとして前記データベースに格納されており、該対応するメタデータは更に、構造要素の種類、及び対応する文書のページ画像内での座標を有する、請求項14に記載の装置。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書のグラフィック部分に含まれているか、ということを有する、請求項14に記載の装置。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書の表題部分、図の部分、見出し部分、又は参考文献部分に含まれているか、ということを有する、請求項14に記載の装置。
- 前記所定の関係は、前記質問語が前記第1の結果の組内の文書の写真要素又はグラフィック要素に含まれているか、ということを有する、請求項14に記載の装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/689,373 US8583637B2 (en) | 2007-03-21 | 2007-03-21 | Coarse-to-fine navigation through paginated documents retrieved by a text search engine |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008234658A true JP2008234658A (ja) | 2008-10-02 |
Family
ID=39775754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008072464A Pending JP2008234658A (ja) | 2007-03-21 | 2008-03-19 | テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション |
Country Status (2)
Country | Link |
---|---|
US (1) | US8583637B2 (ja) |
JP (1) | JP2008234658A (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
US7761789B2 (en) | 2006-01-13 | 2010-07-20 | Ricoh Company, Ltd. | Methods for computing a navigation path |
US7788579B2 (en) * | 2006-03-06 | 2010-08-31 | Ricoh Co., Ltd. | Automated document layout design |
US8812969B2 (en) * | 2007-03-21 | 2014-08-19 | Ricoh Co., Ltd. | Methods for authoring and interacting with multimedia representations of documents |
US8584042B2 (en) | 2007-03-21 | 2013-11-12 | Ricoh Co., Ltd. | Methods for scanning, printing, and copying multimedia thumbnails |
US8787698B2 (en) | 2009-09-04 | 2014-07-22 | Adobe Systems Incorporated | Methods and apparatus for directional texture generation using image warping |
US8599219B2 (en) * | 2009-09-18 | 2013-12-03 | Adobe Systems Incorporated | Methods and apparatuses for generating thumbnail summaries for image collections |
US8619098B2 (en) | 2009-09-18 | 2013-12-31 | Adobe Systems Incorporated | Methods and apparatuses for generating co-salient thumbnails for digital images |
WO2011039848A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | 関心領域抽出装置及びプログラム |
US20120150862A1 (en) * | 2010-12-13 | 2012-06-14 | Xerox Corporation | System and method for augmenting an index entry with related words in a document and searching an index for related keywords |
US9418385B1 (en) * | 2011-01-24 | 2016-08-16 | Intuit Inc. | Assembling a tax-information data structure |
JP5518112B2 (ja) * | 2011-03-31 | 2014-06-11 | 株式会社デジタルマックス | デジタルブック提供システム |
US8861868B2 (en) | 2011-08-29 | 2014-10-14 | Adobe-Systems Incorporated | Patch-based synthesis techniques |
US9639518B1 (en) | 2011-09-23 | 2017-05-02 | Amazon Technologies, Inc. | Identifying entities in a digital work |
US9471547B1 (en) | 2011-09-23 | 2016-10-18 | Amazon Technologies, Inc. | Navigating supplemental information for a digital work |
US9449526B1 (en) | 2011-09-23 | 2016-09-20 | Amazon Technologies, Inc. | Generating a game related to a digital work |
US9613003B1 (en) | 2011-09-23 | 2017-04-04 | Amazon Technologies, Inc. | Identifying topics in a digital work |
US9772999B2 (en) * | 2011-10-24 | 2017-09-26 | Imagescan, Inc. | Apparatus and method for displaying multiple display panels with a progressive relationship using cognitive pattern recognition |
US9373155B2 (en) | 2012-08-17 | 2016-06-21 | Google Inc. | Search results with structured image sizes |
KR20140100784A (ko) * | 2013-02-07 | 2014-08-18 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 방법 |
US20140330808A1 (en) * | 2013-05-03 | 2014-11-06 | International Business Machines Corporation | Retrieving information using a graphical query |
KR102016545B1 (ko) * | 2013-10-25 | 2019-10-21 | 한화테크윈 주식회사 | 검색 시스템 및 그의 동작 방법 |
WO2016076831A1 (en) * | 2014-11-10 | 2016-05-19 | Aravind Musuluri | System and method for augmenting a search query |
BR112020000138A2 (pt) | 2017-07-06 | 2020-07-07 | Basf Se | composição, artigo moldado, métodos para preparar o artigo moldado e para estabilizar uma poliolefina contra os efeitos prejudiciais do calor, luz e oxigênio, e, composição aditiva. |
US20200135189A1 (en) * | 2018-10-25 | 2020-04-30 | Toshiba Tec Kabushiki Kaisha | System and method for integrated printing of voice assistant search results |
CN113641800B (zh) * | 2021-10-18 | 2022-04-08 | 中国铁道科学研究院集团有限公司科学技术信息研究所 | 一种文本查重方法、装置、设备及可读存储介质 |
AU2022241473B1 (en) * | 2022-09-27 | 2024-04-18 | Canva Pty Ltd | Document searching systems and methods |
Family Cites Families (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434953A (en) * | 1992-03-20 | 1995-07-18 | Xerox Corporation | Use of fast textured reduction for discrimination of document image components |
US5335290A (en) * | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
US5353401A (en) * | 1992-11-06 | 1994-10-04 | Ricoh Company, Ltd. | Automatic interface layout generator for database systems |
EP0677811A1 (en) * | 1994-04-15 | 1995-10-18 | Canon Kabushiki Kaisha | Image processing system with on-the-fly JPEG compression |
DE69525401T2 (de) * | 1994-09-12 | 2002-11-21 | Adobe Systems, Inc. | Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind |
US5625767A (en) * | 1995-03-13 | 1997-04-29 | Bartell; Brian | Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents |
AU5442796A (en) * | 1995-04-06 | 1996-10-23 | Avid Technology, Inc. | Graphical multimedia authoring system |
US5903904A (en) * | 1995-04-28 | 1999-05-11 | Ricoh Company | Iconic paper for alphabetic, japanese and graphic documents |
WO1996036003A1 (en) * | 1995-05-10 | 1996-11-14 | Minnesota Mining And Manufacturing Company | Method for transforming and storing data for search and display and a searching system utilized therewith |
US5963966A (en) * | 1995-11-08 | 1999-10-05 | Cybernet Systems Corporation | Automated capture of technical documents for electronic review and distribution |
US5761485A (en) * | 1995-12-01 | 1998-06-02 | Munyan; Daniel E. | Personal electronic book system |
US5910805A (en) * | 1996-01-11 | 1999-06-08 | Oclc Online Computer Library Center | Method for displaying bitmap derived text at a display having limited pixel-to-pixel spacing resolution |
US5781879A (en) * | 1996-01-26 | 1998-07-14 | Qpl Llc | Semantic analysis and modification methodology |
US6173286B1 (en) * | 1996-02-29 | 2001-01-09 | Nth Degree Software, Inc. | Computer-implemented optimization of publication layouts |
US6141452A (en) * | 1996-05-13 | 2000-10-31 | Fujitsu Limited | Apparatus for compressing and restoring image data using wavelet transform |
US5960126A (en) * | 1996-05-22 | 1999-09-28 | Sun Microsystems, Inc. | Method and system for providing relevance-enhanced image reduction in computer systems |
US5978519A (en) | 1996-08-06 | 1999-11-02 | Xerox Corporation | Automatic image cropping |
JP2942736B2 (ja) * | 1996-09-03 | 1999-08-30 | オリンパス光学工業株式会社 | コード記録装置 |
US5897644A (en) * | 1996-09-25 | 1999-04-27 | Sun Microsystems, Inc. | Methods and apparatus for fixed canvas presentations detecting canvas specifications including aspect ratio specifications within HTML data streams |
US5893127A (en) | 1996-11-18 | 1999-04-06 | Canon Information Systems, Inc. | Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document |
US6144974A (en) * | 1996-12-13 | 2000-11-07 | Adobe Systems Incorporated | Automated layout of content in a page framework |
US6018710A (en) * | 1996-12-13 | 2000-01-25 | Siemens Corporate Research, Inc. | Web-based interactive radio environment: WIRE |
US6043802A (en) * | 1996-12-17 | 2000-03-28 | Ricoh Company, Ltd. | Resolution reduction technique for displaying documents on a monitor |
US6788347B1 (en) * | 1997-03-12 | 2004-09-07 | Matsushita Electric Industrial Co., Ltd. | HDTV downconversion system |
US6665841B1 (en) | 1997-11-14 | 2003-12-16 | Xerox Corporation | Transmission of subsets of layout objects at different resolutions |
US6562077B2 (en) * | 1997-11-14 | 2003-05-13 | Xerox Corporation | Sorting image segments into clusters based on a distance measurement |
US7263659B2 (en) * | 1998-09-09 | 2007-08-28 | Ricoh Company, Ltd. | Paper-based interface for multimedia information |
US6236987B1 (en) * | 1998-04-03 | 2001-05-22 | Damon Horowitz | Dynamic content organization in information retrieval systems |
US6377704B1 (en) * | 1998-04-30 | 2002-04-23 | Xerox Corporation | Method for inset detection in document layout analysis |
US6778970B2 (en) * | 1998-05-28 | 2004-08-17 | Lawrence Au | Topological methods to organize semantic network data flows for conversational applications |
WO2000016221A1 (en) * | 1998-09-15 | 2000-03-23 | Microsoft Corporation | Interactive playlist generation using annotations |
US6970602B1 (en) | 1998-10-06 | 2005-11-29 | International Business Machines Corporation | Method and apparatus for transcoding multimedia using content analysis |
US6249808B1 (en) * | 1998-12-15 | 2001-06-19 | At&T Corp | Wireless delivery of message using combination of text and voice |
US6598054B2 (en) * | 1999-01-26 | 2003-07-22 | Xerox Corporation | System and method for clustering data objects in a collection |
US6317164B1 (en) * | 1999-01-28 | 2001-11-13 | International Business Machines Corporation | System for creating multiple scaled videos from encoded video sources |
US6178272B1 (en) * | 1999-02-02 | 2001-01-23 | Oplus Technologies Ltd. | Non-linear and linear method of scale-up or scale-down image resolution conversion |
JP3460964B2 (ja) | 1999-02-10 | 2003-10-27 | 日本電信電話株式会社 | マルチメディア情報閲覧システムにおける音声読み上げ方法および記録媒体 |
JP2000306103A (ja) | 1999-04-26 | 2000-11-02 | Canon Inc | 情報処理装置及び方法 |
JP4438129B2 (ja) * | 1999-07-02 | 2010-03-24 | ソニー株式会社 | コンテンツ受信システム及びコンテンツ受信方法 |
JP2001056811A (ja) | 1999-08-18 | 2001-02-27 | Dainippon Screen Mfg Co Ltd | 自動レイアウト生成装置、自動レイアウト生成方法、および記録媒体 |
US6862713B1 (en) * | 1999-08-31 | 2005-03-01 | International Business Machines Corporation | Interactive process for recognition and evaluation of a partial search query and display of interactive results |
JP2001101164A (ja) | 1999-09-29 | 2001-04-13 | Toshiba Corp | 文書画像処理装置及び文書画像処理方法 |
US6349132B1 (en) * | 1999-12-16 | 2002-02-19 | Talk2 Technology, Inc. | Voice interface for electronic documents |
US6928087B2 (en) * | 2000-02-10 | 2005-08-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for automatic cross-media selection and scaling |
US6873343B2 (en) * | 2000-05-11 | 2005-03-29 | Zoran Corporation | Scalable graphics image drawings on multiresolution image with/without image data re-usage |
US8060389B2 (en) * | 2000-06-07 | 2011-11-15 | Apple Inc. | System and method for anonymous location based services |
FR2811782B1 (fr) * | 2000-07-12 | 2003-09-26 | Jaxo Europ | Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure |
US6704024B2 (en) * | 2000-08-07 | 2004-03-09 | Zframe, Inc. | Visual content browsing using rasterized representations |
US6804418B1 (en) * | 2000-11-03 | 2004-10-12 | Eastman Kodak Company | Petite size image processing engine |
DE60134943D1 (de) * | 2000-11-08 | 2008-09-04 | Matsushita Electric Ind Co Ltd | Rundfunksystem zum Senden und Empfangen von Programmen |
US7299202B2 (en) | 2001-02-07 | 2007-11-20 | Exalt Solutions, Inc. | Intelligent multimedia e-catalog |
US6924904B2 (en) * | 2001-02-20 | 2005-08-02 | Sharp Laboratories Of America, Inc. | Methods and systems for electronically gathering and organizing printable information |
US7340505B2 (en) | 2001-04-02 | 2008-03-04 | Akamai Technologies, Inc. | Content storage and replication in a managed internet content storage environment |
EP1381977A1 (en) | 2001-04-26 | 2004-01-21 | Creekpath Systems, Inc. | A system for global and local data resource management for service guarantees |
JP4834919B2 (ja) | 2001-05-28 | 2011-12-14 | 大日本印刷株式会社 | 自動組版システム |
US20030014445A1 (en) * | 2001-07-13 | 2003-01-16 | Dave Formanek | Document reflowing technique |
JP4037070B2 (ja) * | 2001-08-01 | 2008-01-23 | 矢崎総業株式会社 | ランプユニットの取付構造 |
US7069506B2 (en) * | 2001-08-08 | 2006-06-27 | Xerox Corporation | Methods and systems for generating enhanced thumbnails |
EP1309181A1 (en) * | 2001-11-06 | 2003-05-07 | Thomson Licensing S.A. | Device, method and system for multimedia content adaption |
US7861169B2 (en) * | 2001-11-19 | 2010-12-28 | Ricoh Co. Ltd. | Multimedia print driver dialog interfaces |
US7095907B1 (en) * | 2002-01-10 | 2006-08-22 | Ricoh Co., Ltd. | Content and display device dependent creation of smaller representation of images |
US7428338B2 (en) * | 2002-01-10 | 2008-09-23 | Ricoh Co., Ltd. | Header-based processing of images compressed using multi-scale transforms |
US6747648B2 (en) * | 2002-01-18 | 2004-06-08 | Eastman Kodak Company | Website on the internet for automated interactive display of images |
US7576756B1 (en) * | 2002-02-21 | 2009-08-18 | Xerox Corporation | System and method for interaction of graphical objects on a computer controlled system |
GB0225789D0 (en) * | 2002-03-25 | 2002-12-11 | Makemyphone Ltd | Method and apparatus for creating image production file for a custom imprinted article |
US7640164B2 (en) | 2002-07-04 | 2009-12-29 | Denso Corporation | System for performing interactive dialog |
US7487445B2 (en) * | 2002-07-23 | 2009-02-03 | Xerox Corporation | Constraint-optimization system and method for document component layout generation |
US7107525B2 (en) * | 2002-07-23 | 2006-09-12 | Xerox Corporation | Method for constraint-based document generation |
US7171617B2 (en) * | 2002-07-30 | 2007-01-30 | Xerox Corporation | System and method for fitness evaluation for optimization in document assembly |
US20040070631A1 (en) * | 2002-09-30 | 2004-04-15 | Brown Mark L. | Apparatus and method for viewing thumbnail images corresponding to print pages of a view on a display |
US7284200B2 (en) * | 2002-11-10 | 2007-10-16 | Microsoft Corporation | Organization of handwritten notes using handwritten titles |
US20040120589A1 (en) * | 2002-12-18 | 2004-06-24 | Lopresti Daniel Philip | Method and apparatus for providing resource-optimized delivery of web images to resource-constrained devices |
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
JP4583003B2 (ja) | 2003-03-20 | 2010-11-17 | 富士通株式会社 | 検索処理方法及びプログラム |
US8392834B2 (en) * | 2003-04-09 | 2013-03-05 | Hewlett-Packard Development Company, L.P. | Systems and methods of authoring a multimedia file |
GB2404270A (en) * | 2003-07-24 | 2005-01-26 | Hewlett Packard Development Co | Document composition |
US7035439B2 (en) * | 2003-07-30 | 2006-04-25 | Xerox Corporation | System and method for measuring and quantizing document quality |
US7864352B2 (en) * | 2003-09-25 | 2011-01-04 | Ricoh Co. Ltd. | Printer with multimedia server |
US20050071763A1 (en) * | 2003-09-25 | 2005-03-31 | Hart Peter E. | Stand alone multimedia printer capable of sharing media processing tasks |
JP2005108230A (ja) * | 2003-09-25 | 2005-04-21 | Ricoh Co Ltd | オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム |
US8065627B2 (en) | 2003-09-30 | 2011-11-22 | Hewlett-Packard Development Company, L.P. | Single pass automatic photo album page layout |
US7471827B2 (en) * | 2003-10-16 | 2008-12-30 | Microsoft Corporation | Automatic browsing path generation to present image areas with high attention value as a function of space and time |
JP4165888B2 (ja) | 2004-01-30 | 2008-10-15 | キヤノン株式会社 | レイアウト制御方法、レイアウト制御装置及びレイアウト制御プログラム |
JP2005293239A (ja) * | 2004-03-31 | 2005-10-20 | Fujitsu Ltd | 情報共有装置及び情報共有方法 |
US7664734B2 (en) * | 2004-03-31 | 2010-02-16 | Google Inc. | Systems and methods for generating multiple implicit search queries |
US9009153B2 (en) * | 2004-03-31 | 2015-04-14 | Google Inc. | Systems and methods for identifying a named entity |
US7912904B2 (en) * | 2004-03-31 | 2011-03-22 | Google Inc. | Email system with conversation-centric user interface |
US7574655B2 (en) | 2004-05-03 | 2009-08-11 | Microsoft Corporation | System and method for encapsulation of representative sample of media object |
US20050289127A1 (en) * | 2004-06-25 | 2005-12-29 | Dominic Giampaolo | Methods and systems for managing data |
TR201904404T4 (tr) * | 2004-09-10 | 2019-04-22 | Koninklijke Philips Nv | En azından bir medya veri işleme cihazını kontrol etmeyi sağlamak için cihaz ve yöntem. |
US7345688B2 (en) * | 2004-10-18 | 2008-03-18 | Microsoft Corporation | Semantic thumbnails |
US7151547B2 (en) | 2004-11-23 | 2006-12-19 | Hewlett-Packard Development Company, L.P. | Non-rectangular image cropping methods and systems |
US7603620B2 (en) * | 2004-12-20 | 2009-10-13 | Ricoh Co., Ltd. | Creating visualizations of documents |
US8566705B2 (en) * | 2004-12-21 | 2013-10-22 | Ricoh Co., Ltd. | Dynamic document icons |
US7330608B2 (en) * | 2004-12-22 | 2008-02-12 | Ricoh Co., Ltd. | Semantic document smartnails |
US8229905B2 (en) * | 2005-01-14 | 2012-07-24 | Ricoh Co., Ltd. | Adaptive document management system using a physical representation of a document |
US7434159B1 (en) * | 2005-05-11 | 2008-10-07 | Hewlett-Packard Development Company, L.P. | Automatically layout of document objects using an approximate convex function model |
US20070043706A1 (en) * | 2005-08-18 | 2007-02-22 | Yahoo! Inc. | Search history visual representation |
US20070118399A1 (en) * | 2005-11-22 | 2007-05-24 | Avinash Gopal B | System and method for integrated learning and understanding of healthcare informatics |
US7761789B2 (en) * | 2006-01-13 | 2010-07-20 | Ricoh Company, Ltd. | Methods for computing a navigation path |
US8683314B2 (en) * | 2006-01-13 | 2014-03-25 | Ricoh Co., Ltd. | Tree pruning of icon trees via subtree selection using tree functionals |
JP2009526327A (ja) * | 2006-02-10 | 2009-07-16 | メタカータ・インコーポレーテッド | メディアオブジェクトについての空間サムネイルおよびコンパニオンマップのためのシステムおよび方法 |
US8081827B2 (en) * | 2006-02-28 | 2011-12-20 | Ricoh Co., Ltd. | Compressed data image object feature extraction, ordering, and delivery |
US7788579B2 (en) * | 2006-03-06 | 2010-08-31 | Ricoh Co., Ltd. | Automated document layout design |
US8554868B2 (en) * | 2007-01-05 | 2013-10-08 | Yahoo! Inc. | Simultaneous sharing communication interface |
US8812969B2 (en) * | 2007-03-21 | 2014-08-19 | Ricoh Co., Ltd. | Methods for authoring and interacting with multimedia representations of documents |
US8584042B2 (en) * | 2007-03-21 | 2013-11-12 | Ricoh Co., Ltd. | Methods for scanning, printing, and copying multimedia thumbnails |
US20080235564A1 (en) * | 2007-03-21 | 2008-09-25 | Ricoh Co., Ltd. | Methods for converting electronic content descriptions |
-
2007
- 2007-03-21 US US11/689,373 patent/US8583637B2/en active Active
-
2008
- 2008-03-19 JP JP2008072464A patent/JP2008234658A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20080235207A1 (en) | 2008-09-25 |
US8583637B2 (en) | 2013-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8583637B2 (en) | Coarse-to-fine navigation through paginated documents retrieved by a text search engine | |
JP4746136B2 (ja) | ランク・グラフ | |
US7908284B1 (en) | Content reference page | |
Strobelt et al. | Document cards: A top trumps visualization for documents | |
US9514216B2 (en) | Automatic classification of segmented portions of web pages | |
JP4890851B2 (ja) | 意味論的文書スマートネール | |
US7428701B1 (en) | Method, system and computer program for redaction of material from documents | |
US7979785B1 (en) | Recognizing table of contents in an image sequence | |
CN101178725B (zh) | 用于信息检索的设备和方法 | |
US8482808B2 (en) | Image processing apparatus and method for displaying a preview of scanned document data | |
EP2053522A2 (en) | Conversion of a Collection of Data to a Structured, Printable and Navigable Format | |
US9529438B2 (en) | Printing structured documents | |
US20080239365A1 (en) | Masking of text in document reproduction | |
US20080235563A1 (en) | Document displaying apparatus, document displaying method, and computer program product | |
US20130124515A1 (en) | Method for document search and analysis | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JPH07200786A (ja) | ファイリング装置 | |
US11243670B2 (en) | Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium | |
US20130339002A1 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
US20120143842A1 (en) | Image element searching | |
US8782551B1 (en) | Adjusting margins in book page images | |
US20070133907A1 (en) | Image processing apparatus | |
JP2006189924A (ja) | 画像表示プログラム及び画像表示装置 | |
JP4278134B2 (ja) | 情報検索装置及びプログラム並びに記録媒体 | |
JP2000020549A (ja) | 文書データベースシステムへの入力支援装置 |