JP2005122690A - 情報処理 - Google Patents

情報処理 Download PDF

Info

Publication number
JP2005122690A
JP2005122690A JP2004197180A JP2004197180A JP2005122690A JP 2005122690 A JP2005122690 A JP 2005122690A JP 2004197180 A JP2004197180 A JP 2004197180A JP 2004197180 A JP2004197180 A JP 2004197180A JP 2005122690 A JP2005122690 A JP 2005122690A
Authority
JP
Japan
Prior art keywords
information
information item
image
pseudo
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004197180A
Other languages
English (en)
Other versions
JP4711385B2 (ja
Inventor
David William Trepess
トレペス、デヴィッド ウィリアム
Jonathan Richard Thorpe
ソープ、ジョナサン リチャード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Original Assignee
Sony United Kingdom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd filed Critical Sony United Kingdom Ltd
Publication of JP2005122690A publication Critical patent/JP2005122690A/ja
Application granted granted Critical
Publication of JP4711385B2 publication Critical patent/JP4711385B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/914Video

Abstract

【課題】検索結果の関係を明示的に表示する。
【解決手段】 情報アイテムのテキスト情報を分析して、情報アイテムに関連する情報構成要素の集合を検出するステップと、情報構成要素のそれぞれについて、情報アイテムに関する情報構成要素の出現の頻度及び性質の少なくとも一方に基づいて、相対的な重要度の程度を検出するステップと、少なくとも2つの情報構成要素の部分集合を選択するステップと、情報構成要素の選択された部分集合を含み、情報アイテムを代表する擬似画像であって、部分集合の最も重要な情報構成要素が代表擬似画像内の第1の所定の領域において最も目立つように表示され、部分集合の1つ以上の他の情報構成要素がそれぞれの相対的な重要度の程度に応じて、代表擬似画像の他の所定の領域に表示される所定のレイアウトに構成された、擬似画像を生成するステップとを有する。
【選択図】図13

Description

本発明は、情報処理に関する。
なお、本発明は、情報検索システム(information search system)に限定されるものではないが、本発明を明瞭に説明するために、この分野における問題点について述べる。
キーワードに基づいて情報(例えば文書、画像、電子メール、特許情報、例えばオーディオ/ビデオコンテンツ等のインターネットコンテンツやメディアコンテンツ等)を検索するための多くの方式が確立されている。この検索の具体例としては、「グーグル(Google:商標)」、「ヤフー(Yahoo:商標)」等から提供されるインターネット検索「エンジン」も含まれ、これらにおいては、キーワードに基づく検索が実行され、検索エンジンによって適合度の順にランク付けされた検索結果のリストが得られる。
しかしながら、多くの場合大量のコンテンツコレクション(massive content collection)と呼ばれる大量のコンテンツを含むシステムにおいては、比較的短い「ヒット」した結果のリストが得られる有効な検索クエリを定式化することは困難となることがある。例えば、本出願を準備している時点では、グーグルにおいて、キーワード「massive document collection」を用いた検索を行うと、ヒット数は、243000件となる。インターネット全体に蓄積されているコンテンツの量は、通常、時間と共に増加すると考えられるので、後に同じ検索を行った場合には、このヒット数は更に増加すると予想される。このようなヒットリストに基づいて、ヒットした全てのコンテンツに目を通す(Reviewing)ことは、現実的には殆ど不可能な程に時間がかかる作業である。
大量のコンテンツコレクションを活用することが困難である理由は、一般的には、以下のようなものがある。
・ユーザは、関連するコンテンツが存在することを知らない。
・ユーザは、関連するコンテンツが存在することを知っているが、そのコンテンツがどこにあるかを知らない。
・ユーザは、コンテンツが存在していることを知っているが、そのコンテンツが関連するコンテンツであることを知らない。
・ユーザは、関連するコンテンツが存在し、そのコンテンツを見つけ出す手法も知っているが、コンテンツを見つけ出すには時間がかかる。
「大量の文書集合の自己組織化(Self Organisation of a Massive Document Collection)」、コホネン(Kohonen)他、ニューラルネットワークに関するIEEEトランザクション(IEEE Transactions on Neural Networks)、Vol11、No.3、2000年5月、574〜585頁には、所謂「自己組織化マップ(self-organising maps:以下、SOMという。)」を用いた技術が開示されている。SOMは、各文書の属性を表す「特徴ベクトル(特徴ベクトル)」をSOMのノードにマッピングする、所謂教師なき自己学習ニューラルネットワークアルゴリズム(unsupervised self-learning neural network algorithm)を利用している。
コホネン他の論文に開示されている手法では、まず、文書テキストを前処理し、前処理された各文書から特徴ベクトルが導かれる。この特徴ベクトルは、大きな単語の辞書における各単語の出現頻度を示すヒストグラムの形式で表してもよい。ヒストグラム内の各データ値(すなわち、辞書中のそれぞれの単語の各出現頻度)は、辞書内の候補となる単語の総数(この論文に記述されている具体例では、43222個)をnとして、n値のベクトルにおける値となる。例えば、ある単語の適合度を増加させ又は特異性を強調するために、n個のベクトル値に重み付けを適用してもよい。
n値のベクトルは、次元がより小さいベクトル(すなわちnに比べてかなり小さな値の数m(論文内の具体例では500)の値を有するベクトル)にマッピングされる。これは、乱数の配列により構成されるn×mの「射影行列(projection matrix)」をベクトルに乗算することによって実現される。この手法により、次元が小さくされたどの2つのベクトルをとっても、それぞれ対応する2つの入力ベクトルと略同じ内積を有する、次元がより小さいベクトルが生成される。このベクトルマッピング処理は、論文「ランダムマッピングによる次元縮退:クラスタリングのための高速類似性演算(Dimensionality Reduction by Random Mapping; Fast Similarity Computation for Clustering)」、カスキ(Kaski)、ProcIJCNN、413〜418頁、1998年に記載されている。
次元が縮退されたベクトルは、各ベクトルを1つの「モデル(他のベクトル)」に乗算する処理によって、SOM上のノード(ニューロンともいう)にマッピングされる。これらのモデルは、学習プロセスによって生成される。この学習プロセスでは、モデルを相互の類似性に基づいてSOM上に順序付けし、SOMは、通常、ノードの2次元グリッドとして表される。これは、膨大な演算を必要とする処理であり、コホネン他は、この処理のために、700万の文書に満たない文書データベースに対して、800MBのメモリを有する6プロセッサのコンピュータで6週間を費やしている。最終的には、SOMを構成するノードのグリッドが表示され、ユーザはマップの領域をズームしてノードを選択することができ、これにより、ユーザインタフェースは、そのノードにリンクされた文書が含まれるインターネットページへのリンクを提供する。
これらの技術は、大量の文書集合のうち、検索における有用な領域を決定する効果的な手法を提供する。しかしながら、これらの技術を用いても、検索処理が有効な多数の検索引用を提供することは希である。最も高度な検索法を用いても、人間のオペレータがクエリに対して特に関連性が高く、又は特に有用であるかを判断して検索引用をソートする作業と同等の作業までは実行されない。このような作業は、コンピュータの助けを借りた検索処理において、最も時間がかかる作業である。
本発明に係る情報アイテム処理方法は、複数のテキスト情報を含む情報アイテムを処理する情報アイテム処理方法において、a)情報アイテムのテキスト情報を分析して、情報アイテムに関連する情報構成要素の集合を検出するステップと、b)情報構成要素のそれぞれについて、情報アイテムに関する情報構成要素の出現の頻度及び性質の少なくとも一方に基づいて、相対的な重要度の程度を検出するステップと、c)少なくとも2つの情報構成要素の部分集合(subset)を選択するステップと、d)情報構成要素の選択された部分集合を含み、情報アイテムを代表する擬似画像であって、d.1)部分集合の最も重要な情報構成要素が代表擬似画像内の第1の所定の領域において最も目立つように表示され、d.2)部分集合の1つ以上の他の情報構成要素がそれぞれの相対的な重要度の程度に応じて、代表擬似画像の他の所定の領域に表示される所定のレイアウトに構成された、擬似画像を生成するステップとを有する。
本発明は、情報アイテム内の異なる情報構成要素の相対的な重要度又は関連性に関する客観的な(自動的な)評価を行い、この評価に基づいて、情報アイテムに関連する代表擬似画像を構築することにより、上述した問題を解決する。擬似画像は、所定のフォーマットを有し、ユーザが(例えば、検索クエリに対する結果として)複数の擬似画像を見た際に、ユーザは、非常に素早く及び効果的に対応する情報アイテムのコンテンツを把握することができる。
最も重要な情報構成要素は、代表擬似画像における中央領域に表示することによって目立たせてもよい。
また、より関連性を有する情報を目立たせるために、好ましくは、代表擬似画像の所定の領域は、関連付けられた(例えば、異なる)背景色を有し、及び/又は代表擬似画像の所定の領域には、所定の領域内に表示される情報構成要素の相対的な重要度に応じたテキストフォントサイズを用いて、テキスト情報を表示してもよい。
本発明は、少なくとも1つの情報アイテムがウェブページであり、情報構成要素がテキスト情報を含む場合に特に好適である。
情報アイテムが主要な画像又は映像情報を含む場合、異なる技術によって、情報アイテムからの代表画像を含む情報アイテムを代表する代表擬似画像を生成してもよく、又は情報アイテムにおける複数の画像から1つの代表画像を選択してもよい。
情報アイテムの集合のコンテンツをユーザに評価させる特に有効な手法として、情報アイテムの集合に対応する代表擬似画像の時間的シーケンス(好ましくは、同じ位置に対応する及び/又は同じ画像表示サイズを有する)を表示してもよい。この手法は、画像アイテムの擬似画像及びテキストアイテムの擬似画像が混合された情報にも適用することができる。擬似画像の標準的なフォーマットは、ユーザが擬似画像内の常に同じ位置に視線を向けることを利用しており、このため、ユーザは、最も高い関連性を有する情報をより高速に評価することができるようになる。
更に、本発明に係る情報アイテム処理装置は、複数のテキスト情報を含む情報アイテムを処理する情報アイテム処理装置において、1)情報アイテムのテキスト情報を分析して、情報アイテムに関連する情報構成要素の集合を検出するテキスト分析器と、2)情報構成要素のそれぞれについて、情報アイテムに関する情報構成要素の出現の頻度及び性質の少なくとも一方に基づいて、相対的な重要度の程度を検出する検出器と、3)少なくとも2つの情報構成要素の部分集合を選択する選択器と、4)情報構成要素の選択された部分集合を含み、情報アイテムを代表する擬似画像であって、a)部分集合の最も重要な情報構成要素が代表擬似画像内の第1の所定の領域において最も目立つように表示され、b)部分集合の1つ以上の他の情報構成要素がそれぞれの相対的な重要度の程度に応じて、代表擬似画像の他の所定の領域に表示される所定のレイアウトに構成された、擬似画像を生成する擬似画像生成器とを備える。
本発明の更なる側面及び特徴は、添付の請求の範囲において定義されている。
図1は、情報格納及び検索システム(information storage and retrieval system)の構成を概略的に示す図であり、この情報格納及び検索システムは、汎用コンピュータ10によって実現されており、汎用コンピュータ10は、プログラム及びデータを格納するディスク記憶装置30を含むプロセッサユニット20と、イーサネット(登録商標)(Ethernet network)又はインターネット等のネットワーク50に接続されたネットワークインタフェースカード40と、例えば陰極線管等の表示装置60と、キーボード70及びマウス80等のユーザ入力装置とを備える。この情報格納及び検索システムは、プログラム制御の下に動作し、このプログラムは、ディスク記憶装置30に格納され、及び、例えばネットワーク50又はリムーバブルディスク(図示せず)から、若しくはディスク記憶装置30にプリインストールされて提供される。
情報格納及び検索システムは、2つの通常の動作モードで動作する。第1のモードでは、第1の情報アイテム(例えば、テキスト情報アイテム)の集合がディスク記憶装置30に又はネットワーク50を介して接続されたネットワークディスクドライブに集められ(assembled)、検索動作のために予めソートされるとともに、インデックスが付けられる。第2のモードの動作では、ソートされ、インデックスが付されたデータに対して実際の検索が行われる。
この具体例は、多くの種類の情報アイテムに適用できる。適用される情報アイテムとしては、以下に限定されるものではないが、例えば、特許情報、ビデオマテリアル、電子メール、プレゼンテーション、インターネットコンテンツ、放送コンテンツ、営業報告書、オーディオマテリアル、グラフィクス及びクリップアート、写真、これらの組合せ又は混合された情報等がある。ここでは、テキスト情報アイテム、又は少なくともテキストコンテンツを含む又は関連した情報について説明する。但し、テキスト情報アイテムは、非テキスト情報アイテムに関連付けられ又はリンクされていてもよい。例えば、オーディオ及び/又はビデオマテリアル等の放送コンテンツは、そのマテリアルをテキスト用語(textual terms)で定義する関連したメタデータを有することができる。
情報アイテムは、従来の方法でディスク記憶装置30にロードされる。好ましくは、情報アイテムは、アイテムに索引を付けてより容易に検索できるようにデータベース構造の一部として格納されるが、このことは必ずしも必要なわけではない。情報及びアイテムが一旦格納されると、検索のために格納された情報を整理する、図2に示す処理が行われる。
なお、インデックスが付されたデータは、必ずしもローカルのディスクドライブであるディスク記憶装置30に格納する必要はない。情報アイテムは、ネットワーク50を介して汎用コンピュータ10に接続されたリモートのドライブに格納することもできる。これに代えて、情報は、分散方式で、例えばインターネット全域の様々サイトに格納することもできる。情報が異なるインターネットサイト又はネットワークサイトに格納されている場合、リモートの情報への「リンク」(例えば、ユニバーサルリソース識別子:universal resource identifier:URI)を、例えば関連した要約(summary)、概要(abstract)、又はこのリンク関するメタデータと共に格納する第2のレベルの情報格納を用いることができる。リモートに格納された情報は、ユーザが(例えば、後述する結果リスト260から)関連するリンクを選択しない限り、アクセスされないが、以下に記述する技術的な説明においては、リモートに格納された情報、又は要約、概要、メタデータ、若しくはリンク/URIも「情報アイテム」とみなすことができる。
換言すると、「情報アイテム」の正式な定義とは、(後述のように)特徴ベクトルを導出及び処理して、自己組織化マップ(SOM)へのマッピングを行うことができるアイテムと形式的に定義することができる。後述する結果リスト260内のデータは、(情報アイテムがローカルに格納され、容易に表示できる程に十分短い場合)ユーザが要求している実際の情報アイテムであってもよく、及び/又は、例えばメタデータ、URI、概要、キーワードのセット、代表的なキースタンプ画像等のうちの1つ以上である、情報アイテムを表現及び/又は指示するデータであってもよい。これは、必ずではないが、多くの場合、1組のアイテムを表すデータを一覧化する「リスト」動作に特有なものである。
更なる具体例においては、情報アイテムは、例えば研究チームや法律事務所等のネットワーク化されたワークグループ全体に格納してもよい。また、ハイブリッド法は、ローカルに格納された情報アイテム及び/又はローカルエリアネットワーク全体に格納された情報アイテム及び/又はワイドエリアネットワーク全体に格納された情報アイテムを含んでいてもよい。この場合、本発明に基づくシステムは、他者による類似した業績を検索するのに有用であり、例えば、後述するように、複数の国に亘る大規模な研究開発組織において、類似した研究業績をSOMにおける類似した出力ノードにマッピングすることができる。あるいは、新たなテレビジョン番組を企画する場合、本発明に基づく技術を用いて、類似するコンテンツを有する以前の番組を検索することにより、企画中の番組の独創性を確認することもできる。
図1に示す汎用コンピュータ10は、インデックスが付された情報アイテムを用いる可能なシステムの一例にすぎない。初期の(インデックス付与)段階は、相当の演算能力を有するコンピュータ、可能性としては携帯型ではないコンピュータによって実行されるが、後の段階では、例えば、携帯情報端末(personal digital assistant:PDA)(ディスプレイとユーザ入力装置とを備えた、通常片手で持てる程度の寸法のデータ処理装置を指す)、ラップトップコンピュータ等の携帯型コンピュータによって、情報のアクセスを実行してもよく、更に携帯電話、ビデオ編集装置、ビデオカメラ等の機器で行ってもよい。包括的に言えば、情報にアクセスする動作段階では、ディスプレイを有するあらゆる機器を用いることができる。
この処理は、特定の数の情報アイテムに対する処理に限定されるものではない。
情報アイテムの自己組織化マップ(SOM)表現を生成する処理について、図2〜図6を用いて説明する。図2は、SOMマッピング処理の前に行われる、所謂「特徴抽出(feature extraction)」を説明するフローチャートである。
特徴抽出は、生のデータ(raw data)を抽象的表現(abstract representation)に変換する処理である。そして、この抽象的表現は、パターン分類、クラスタリング、認識等の処理に用いることができる。この処理により、所謂「特徴ベクトル」が生成される。特徴ベクトルは、文書内で使用される用語の頻度の抽象的表現である。
特徴ベクトルを生成することにより、ビジュアライゼーション(visualisation)を形成する処理は、以下のステップを含む。
・用語の「文書データベース辞書(document database dictionary)」を作成する。
・「文書データベース辞書」に基づいて、個々の各文書について、「用語頻度ヒストグラム(term frequency histogram)」を作成する。
・ランダムマッピングを用いて、「用語頻度ヒストグラム」の次元を縮退する。
・情報空間の2次元ビジュアライゼーションを作成する。
以下、これらのステップをより詳細に説明する。各文書(情報アイテム)100は、順番に開かれる。ステップ110において、文書から全ての「ストップワード(stop word)」を取り除く。ストップワードとは、例えば「a」、「the」、「however」、「about」、「and」等、予め準備されたリストに挙げられている極めてありふれた単語である。これらの単語は、極めてありふれており、平均的に、十分な長さを有するあらゆる文書において、同様の頻度で出現する可能性が高い。したがって、これらの単語は、特定の文書のコンテンツを特徴付ける目的には殆ど貢献せず、このため、これらのストップワードを削除する。
ストップワードを削除した後、ステップ120において、残っている単語の語幹を調べる。これは、単語の活用形に対する共通の原形を見出す処理を含む。例えば「thrower」、「throws」、「throwing」は、共通の語幹又は原形「throw」を有している。
文書内に出現する(ストップワードを除く)単語の語幹又は原形の辞書は、保守される。すなわち、新たな単語が出現すると、この単語は辞書に追加され、文書集合(情報アイテムの集合)全体の中でその単語が出現した回数も記録される。
この結果、その集合内の全ての文書内で使用された用語が、その出現頻度とともに登録されたリストが作成される。出現頻度が高すぎる又は低すぎる単語は除外(discount)され、すなわち、これらの単語は辞書から削除され、後の分析には使用しない。出現頻度が低すぎる単語は、綴り間違いのある単語や、造語(made up)、又はその文書集合によって表されている分野に関係がない単語である可能性がある。一方、出現頻度が高すぎる単語は、その集合内の文書を区別するために用いるには不適切である。例えば、「News」という単語が試験的な放送関連の文書集合全体の内、3分の1の文書において使用されており、一方、「football」という単語がこの試験的な文書集合全体の内、約2%しか使用されていないとする。この場合、「football」は、「News」より、文書のコンテンツを特徴付けるために適切な用語であると考えることができる。一方、「fottball(footballの綴り間違い)」が文書集合全体の内、1回しか出現していないとすると、この単語は、出現頻度が低すぎるとして除外される。これらの単語は、平均出現頻度に対して2標準偏差小さい出現頻度を有する単語、又は平均出現頻度に対して2標準偏差大きな出現頻度を有する単語と定義してもよい。
そして、ステップ130において、特徴ベクトルを生成する。
特徴ベクトルを生成するために、集合内の各文書に対して用語頻度ヒストグラムを作成する。用語頻度ヒストグラムは、辞書(文書集合に関連付けられている)内に存在する単語が、個々の文書内で出現する頻度を計数することによって作成される。辞書内の大半の用語は、単一の文書内には存在せず、したがって、これらの用語の出現頻度は0である。図3(a)及び(b)は、2つの異なる文書についての用語頻度ヒストグラムの具体例を示している。
この具体例から、用語頻度ヒストグラムが、どのようにして文書のコンテンツを特徴付けているかがわかる。この具体例の場合、文書1は、文書2に比べて、「MPEG」、「Video」という用語の出現頻度が高く、一方、文書2は、文書1に比べて、「MetaData」という用語の出現頻度が高い。用語頻度ヒストグラム内の多くの項目(entry)は、対応する単語がその文書内に存在しないため、値が0となっている。
実際の具体例では、実際の用語頻度ヒストグラムは、この具体例に示す用語頻度ヒストグラムよりも遙かに多くの用語を含んでいる。多くの場合、用語頻度ヒストグラムは、50000個以上の異なる用語の頻度を示し、したがって、用語頻度ヒストグラムの次元は、50000以上となる。この用語頻度ヒストグラムの次元は、SOM情報空間の構築に使用するためには、かなり減らす必要がある。
用語頻度ヒストグラム内の各項目は、その文書を表現する特徴ベクトルにおける対応する値として使用される。この処理の結果、文書集合内の各文書について、辞書によって特定された全ての用語の頻度を含む(50000×1)ベクトルが生成される。このベクトルでは、殆どの値が0であり、更にこの他の値の大半が1程度の非常に低い値を取るため、このベクトルは、「疎らな(sparse)」ベクトルと呼ばれる。
ステップ140において、特徴ベクトルのサイズ、したがって用語頻度ヒストグラムの次元を小さくする。用語頻度ヒストグラムの次元を小さくする手法としては、例えば以下のような2つの手法がある。
1)ランダムマッピング法:用語頻度ヒストグラムに乱数の行列を乗算する手法。これは、計算機的には安い処理である。
2)潜在的意味抽出法(Latent Semantic Indexing):文書内で同時に出現する可能性が高い用語のグループを調べることによって用語頻度ヒストグラムの次元を小さくする手法。これにより得られた単語のグループは、単一のパラメータにすることができる。これは、計算機的には高価な処理である。
ここで説明する具体例においては、用語頻度ヒストグラムの次元を縮退するために、上述したカスキ(Kaski)の論文に開示されているランダムマッピング法を用いる。ランダムマッピング法では、用語頻度ヒストグラムに乱数の行列を乗算することによって、用語頻度ヒストグラムの次元を縮退する。
上述のように、「生の」特徴ベクトル(図4(a)に示す)は、50000個もの値を有する疎らなベクトルである。このベクトルは、約200個の値を有するサイズ(図4(b)に示す)にまで縮退されるが、それでもなお、特徴ベクトルの相対的特徴を保持しており、すなわち、同様に処理された他の特徴ベクトルに対する相対角(ベクトル内積)等の関係を保っている。これは、特定の次元の直交ベクトルの数が限られていても、略直交するベクトルの数が非常に多いので、有効である。
実際、ベクトルの次元が増加すると、ランダムに生成されたあらゆるベクトルの集合が、互いに略直交するようになる。このような性質は、ベクトルの相対的な向きは、そのベクトルに乱数の行列を乗算しても保たれることを意味する。この性質は、ランダムマッピングの前後のベクトルの内積の類似性によって示される。
疎らなベクトルの数を50000個から200個に低減しても、これらのベクトルの相対的な類似性が保たれることが経験的に確認されている。このマッピングは、完全ではないが、文書のコンテンツを簡潔に特徴付ける目的としては十分である。
文書集合に対して、特徴ベクトルを作成し、文書集合の情報空間を定義した後、ステップ150において、意味論的なマップを生成するために、特徴ベクトルを2次元SOMに射影する。以下、図5を参照して、コホネン(Kohonen)の自己組織化マップを用いて、特徴ベクトルをクラスタリングすることによって2次元にマッピングする処理を説明する。
コホネンの自己組織化マップは、各文書に対して作成された特徴ベクトルをクラスタ化し、組織化するために使用される。
自己組織化マップは、入力ノード170と、2次元平面185として示されるノードの2次元アレー又はグリッド内の出力ノード180とを含む。自己組織化マップをトレーニングするために使用される特徴ベクトルの数と同じ数の入力ノード170が存在する。自己組織化マップ上の各出力ノード180は、重み付けされたコネクション(weighted connection)190(1つのコネクションにつき、1つの重み)によって入力ノード170に関連付けられている。
まず、各重みは、ランダムな値に設定され、繰返し処理により、これらの重みが「トレーニング」される。自己組織化マップは、このマップの入力ノード170に各特徴ベクトルを供給することによってトレーニングされる。各出力ノードの入力ベクトルと重みとの間のユークリッド距離を算出することにより、「最も近い」出力ノードが算出される。
最も近い出力ノードは、「勝者(winner)」と呼ばれ、このノードの重みは、このノードが入力ベクトルにより近づくように重みの値を若干変更することによってトレーニングされる。勝者のノードに加えて、この勝者のノードに隣接するノードもトレーニングされ、入力ベクトルに若干近づけられる。
単一のノードを重み付けするだけではなく、マップ上のノードの領域を重み付けするこの処理によって、マップは、一旦トレーニングされれば、ノードの2次元マップ内に入力空間のトポロジの大部分を保存することができる。
マップが一旦トレーニングされると、各文書をマップにマッピングし、どの出力ノードが、その文書の入力された特徴ベクトルに最も近いかを確認することができる。重みが特徴ベクトルと等しいことは希であり、特徴ベクトルとこの特徴ベクトルに最も近いノードとの間のユークリッド距離は、「量子化誤差」として知られる。
各文書についての特徴ベクトルをマップに与えて、この特徴ベクトルがどこに存在するかを確かめることにより、各文書について、(x,y)座標で表されるマップ上の位置が得られる。これらの(x,y)座標で表されるマップ上の位置は、文書IDとともにルックアップテーブルで照合することにより、文書間の関係を視覚化するために使用することができる。
更に、ステップ160においてディザ成分(dither component)を加算する。ディザ成分については、図6を用いて後に説明する。
上述の手法では、2つの同一の又は実質的に同一の情報アイテムが、SOMのノードアレー内の同じノードにマッピングされてしまうことがある。これは、データを取り扱う上では問題にならないが、表示画面(後に説明する)上にデータを視覚化して表示する際には問題となる。特に、データを表示画面上に視覚化して表示する場合、多数の非常に似ているアイテムを特定のノードにおいて単一のアイテム上で区別できることが有用であると認められる。したがって、各情報アイテムがマッピングされるノード位置にディザ成分を加算する。ディザ成分は、ノード間隔の最大±1/2をランダムに加算するものである。例えば、図6に示すように、マッピング処理により出力ノード200が選択された情報アイテムにはディザ成分が加算され、この情報アイテムは、実際には、図6に点線枠で示す領域210内のノード200の周囲の任意のマップ位置にマッピングされる。
このように、情報アイテムは、図6の面上において、SOM処理の「出力ノード」とは異なるノード位置にマッピングされることもある。
いかなる時点においても、SOMに新たな情報アイテムを追加することができる。この処理は、上述したステップ(すなわち、ステップ110〜ステップ140)を実行し、これにより得られた縮退された特徴ベクトルを「先にトレーニングされている」SOMモデル、すなわちマップの自己組織化処理によって得られたSOMモデルの組に適用することによって行われる。したがって、新たに追加された情報アイテムについては、マップは、通常、「再トレーニング」されない。これに代えて、変更されていない全てのSOMモデルとともに、ステップ150及びステップ160を実行する。新たな情報アイテムが追加される毎にSOMを再トレーニングすると、演算コストが高くなり、また、ユーザは、マップ内においてよくアクセスする情報アイテムの相対的位置に慣れてくるので、再トレーニングは、ユーザを困惑させる場合もある。
しかしながら、再トレーニング処理を行う方が望ましい場合もある。例えば、最初にSOMが作成された後に、新たな用語(例えば、ニュース又は新たな技術分野における新たな用語)が辞書に追加されたとすると、これらの新たな用語は、既存の出力ノードの組には、うまくマッピングできない場合がある。これは、新たに受け取った情報アイテムの既存のSOMへのマッピングの際に検出される所謂「量子化誤差」の増大によって検出される。この具体例では、量子化誤差を誤差量の閾値と比較する。量子化誤差が閾値を超えている場合、(a)SOMに元から含まれる情報アイテム及びSOMの作成後に加えられたあらゆる情報アイテムを用いてSOMを自動的に再トレーニングし、又は(b)適切なときに再トレーニング処理を開始するようユーザに促す。再トレーニング処理は、関連する全ての情報アイテムの特徴ベクトルを用いて、ステップ150及びステップ160を全ての特徴アイテムを用いて再び実行することによって行われる。
図7は、検索作業のために、SOMに格納されたデータを視覚的に表示する表示装置60に表示される画面を示している。この画面には、検索文字列入力枠250、結果リスト260、SOM表示領域270が表示されている。
実際の作業では、ユーザは、検索文字列入力枠250にキーワード検索文字列を入力する。次にユーザは、キーボード70のエンターボタンを押圧操作し、又はマウス80を用いて画面上の検索開始ボタンを選択することにより検索を開始する。キーワード検索文字列入力枠250に入力されたキーワードは、標準的なキーワード検索技術を用いて、データベース内の情報アイテムと比較される。この検索の結果は、結果リスト260内の各エントリ280として表示される。表示領域270は、検索結果として得られた各アイテムに対応する点のみを表示する。
SOM表現を作成するために用いたソート処理により、互いに類似する情報アイテムがSOM内でグループ化されるため、文字列の検索結果は、例えばクラスタ290のように、クラスタ内に集中しやすい。ここで、SOM表示領域270内の各点は、結果リスト260内の関連する結果の1つに対応しており、SOM表示領域270内の各点が表示されている位置は、ノードアレー内におけるこれらのノードのアレー位置に対応している。
ヒット(結果リスト内の結果)の数を少なくする手法を図8を用いて説明する。ユーザは、マウス80を用いて、興味があるノードに対応する表示点の集合の周辺をボックス300で囲む。結果リスト260内には、ボックス300内の点に対応する結果のみが表示される。これらの結果が、ユーザの求めるものと違うことが判明した場合、ユーザは、新たなボックスで他の表示点の集合を囲む。
なお、結果リスト260は、検索文字列入力枠250に入力されたキーワードによる検索条件を満たし、且つ、表示点がボックス300内にある結果に対応するエントリを表示している。ボックス300は、ノードアレー内に含まれる(populated)ノードに対応する他の表示点を囲むこともできるが、これらのノードが検索条件を満たしていない場合、これらのノードは表示されず、したがって、結果リスト260内の結果には含まれない。
図9に示すように、ユーザは、図7を用いて上述したように、キーワード検索901を用いて検索処理を行ってもよく、及び/又は図8を参照して説明したように、境界300を描画してクラスタ902を選択することによって検索処理を行ってもよい。また、フィルタ903を用いて、「ヒット」数を削減してもよい。フィルタ903は、検索の結果に例えばジャンルや日付の範囲等の条件を適用するこれにより、検索結果904が得られる。
検索結果は、例えば、図10、図11及び図12に示すような形式で表示してもよい。このような検索結果は、図7及び図8に示す結果リスト260に加えて表示してもよく、これらの代わりに表示してもよい。
フィルタ903を用いてもなお、検索の「ヒット」数が大きくなってしまう場合がある。ユーザは、どのような結果が得られたのか、素早く把握することを望む。この実施例では、検索によって検出された情報アイテムは、情報アイテムを代表するサムネイル画像とともに、静止画像及び/又は動画によって表現される。情報アイテムは、例えば、テキスト文書であってもよく、ウェブページ又はビデオ画像であってもよい。
本発明の一実施例では、高速系列視覚提示(Rapid Serial Visual Presentation:以下、RSVPという)の技術を用いる。RSVPは、「高速系列視覚提示における視線のパターン(Patterns of Eye Gaze during Rapid Serial Visual Presentation)、オスカー・デ・ブルイジン(Oscar de Bruijn)及びロバート・スペンス(Robert Spence)著、インペリアル科学大学(Imperial College of Science)、テクノロジー及び医学(Technology and Medicine)、英国、ロンドンSW7 2BT、エキジビジョンロード、アドバンスドビジュアルインタフェース(AVI)に関する議事録(Proceedings of Advanced Visual Interfaces (AVI))2002、トレノ、イタリア、2002年5月」に開示されている。この名称が示唆するように、RSVPは、連続する多くの画像を高速に提示する。この論文では、画像を提示するための幾つかの異なる手法を開示しており、本発明では、これらのうちのいずれの利用を用いてもよい。RSVPの種類としては、例えば、以下のようなものがある。
・一時刻において1つの画像のみが現れ、各画像が同じ寸法で同じ位置に現れるキーホール(keyhole)RSVP。
・各画像が略円形の軌道を描き、出現地の小さな寸法から最大の寸法に拡大され、出現位置に戻るまでに再び縮小されて他の画像に置き換わるカルーセル(Carousel)RSVP。
・いかなる時刻においても多数の(例えば、5個又は6個の)画像が、可視となるように、画像の組が表示領域上の高速シーケンス内に配置されるコラージュ(Collage)RSVP。
・画像の初期的なビューが小さな寸法で表示領域の中心に配置されるフローティング(Floating)RSVP。初期的な画像は、「焦点が合わない(out of focus)」画像であってもよい。画像は、例えば表示領域の対角線に沿って移動すると寸法が大きくなる。ここでは、多数の画像が同時に示される。
・連続する画像が所定の軌道に沿って移動し(例えば、あたかもシェルフに沿って移動するかのように移動し)、表示領域の端の出現位置においては、小さな寸法から開始され、表示領域の中央では最大の大きさとなり、ここから再び寸法を小さくしながら表示領域の他端で消滅するシェルフ(Shelf)RSVP。ここでは、この軌道に沿って移動する複数の画像が表示される。
RSVPにおいて表示される画像は、キーワード検索901から返される検索結果のリストから及び/又はクラスタ902の周囲に境界300を描くことによって生成された修正された検索結果から導き出される。更に、検索は、フィルタ903を用いて定義してもよい。
図10を用いて、RSVPの一具体例を説明する。図10は、画像907を表示するためのウィンドウ906及び表示操作子908、フィルタ操作子903’、媒体操作子911、916等を含む様々な操作子を有するグラフィカルユーザインタフェース(GUI)900を示している。フィルタ操作子903’は、検索によって提供される「ヒット」数を削減するための、上述したようなフィルタリング条件を選択するために設けられている。表示操作子908は、RSVPタイプ、連続する画像の手動又は自動表示の選択、自動表示が選択された場合の表示速度、画像の表示順序等を始めとする様々な制御を行うために設けられている。媒体操作子911により、ユーザは、選択したアイテムに関する情報を確認するための媒体アイテムを選択でき、及び後に詳細に説明するように、選択されたアイテムの表示を制御することができる。
図10に示す実施例では、ウィンドウ906に、連続する画像が表示され、これは、上述したキーホールRSVPに対応している。
図11に示す実施例では、ウィンドウ906は、同時に4個の画像のストリームを表示する。図11では、表示操作子908を用いて、所望のストリームを選択することができる。
図12に示す実施例では、ウィンドウ906内に画像のアレー910が同時に表示される。これは、上述したコラージュRSVPに対応している。
再び図11に示す実施例を参照すると、境界912として示すように、媒体制御子911を用いて、4個のストリームのうちの1つを選択することができる。1つのストリームの表現を選択することにより、この選択された表現に関連する情報も選択される。
媒体制御子911により、ユーザは、表示された連続する画像の1つを選択することができる。例えば、選択された画像がビデオシーケンスを代表する代表キースタンプ(representative key stamp:RKS又はサムネイル)である場合、画像の選択により、ユーザは、対応する映像のコピーにアクセスし、これを表示させることができる。画像は、デスクトップアイコンと同様の手法で、保存された情報アイテムのコピーにリンクされ、この画像を(例えば、マウスを用いて)選択することにより、対応する情報アイテムを表示させることができる。
表示操作子908は、更に、ストリーム内の画像を表示する速度を制御するために用いられるスクロールバー913を備える。
表示操作子908は、更に、ユーザが選択された画像に対応するビデオを再生するためのスクロールバー916を備える。
図10及び図11に示す画像のストリーム又は図12に示す画像のアレーは、各画像のテキストタイトルの表示を伴っていてもよい。これにより、画像に関連するキーワードを利用できるようにすることができる。
RSVPにおいて画像が現れる順序は、定義されていなくてもよい。
これに代えて、この順序は、例えば、日付順や関連性の高い順等、ユーザによって予め設定された基準に基づいて定義してもよい。
上述の実施例は、ユーザによって検索された情報アイテムを表す画像及びビデオに関連するものであるが、本発明はこれに限定されるものではない。表示される検索結果907、909、910は、例えば、RSVPとして表された検索によって見出されたタイトル等のテキストアイテムであってもよい。
また、表示される検索結果907、909、910は、ユーザが探している実際の情報アイテムを表しておらず、これらのアイテムへのリンクを表していてもよい。これらのリンクは、例えば、ユニバーサルリソース識別子(universal resource identifiers:URI)であってもよい。表示された結果を選択することにより、ユーザが探している所望の情報アイテムに接続するようにしてもよい。
図13は、ビデオ取得及び/又は処理装置(video acquisition and/or processing apparatus)の具体例として、カムコーダ500の構成を示す図である。カムコーダ500は、撮像素子510と、撮像素子510に取り付けられたレンズ520と、データ/信号プロセッサ530と、テープ状記録媒体540と、ディスク状又はランダムアクセス記録媒体550と、ユーザ操作子560と、表示装置570と、表示装置570に取り付けられた接眼レンズ580とを備える。周知のカムコーダ又は他の代替物におけるこの他の特徴(例えば、異なる記録媒体又は異なる表示画面構成)は、当業者にとって明らかである。実際の使用時には、捕捉されたビデオマテリアルに関連するメタデータがディスク状又はランダムアクセス記録媒体550に保存され、この保存されたデータに関連するSOMが表示装置570に表示され、ユーザ操作子560を用いて、上述のように制御される。
図14は、携帯可能なデータ表示装置の具体例として、携帯情報端末(personal digital assistant:以下、PDAという。)600の構成を示す図である。PDA600は、表示領域620及びユーザ操作子として機能するタッチセンサ領域630を有する表示画面610と、データ処理部及びデータ記録部(図示せず)とを備える。ここでも、この分野における当業者は、変形例を容易に想到できる。PDA600は、図1を用いて説明したシステムと同様に使用することができる。
「パームトップ画像検索のためのインタフェース(Interfaces for Palmtop Image Search)、マーク・デーシック(Mark Derthick)著、ヒューマン・コンピュータ・インタラクション・インスティチュート(Human Computer Interaction Institute)、カーネギーメロン大学(Carnegie Mellon University)、(Proc Joint ACM/IEEE Conference on Digital Libraries)、米国、オレゴン州、ポートランド、2002年、7月、340〜341頁」には、パームトップコンピュータにおいてRSVPを用いる実験が開示されている。
図15は、インターネットに接続された様々なサイトにおいて、ローカル及び/又はリモートに保存されている情報のための検索インタフェースを提供する本発明の実施例を示している。この構成は、検索アプレット(search applet)710と、検索ウェブサービス(search web service)720と、例えばビデオアーカイブ(video archive)742、ウェブ検索エンジン744、ローカルエリアネットワーク(local area network:LAN)746等の情報ソースとのインタフェースを司るインデックスサービス(index service)730とを備える。また、この構成は、意味マップサービス(semantic map service)750と、関連するキャッシュ760とを備える。
検索アプレット710は、ユーザが検索クエリを入力するためのユーザインタフェースを提供する。アプレット(applet)とは、ウェブページのハイパーテキストマークアップ言語(hypertext markup LANguage:HTML)ソースコードによって参照することができるオブジェクト指向言語であるJava(登録商標)で書かれた小さなアプリケーションプログラムである。検索アプレット710は、ウェブサーバからインターネットブラウザに動的にダウンロードすることができ、ブラウザによって提供される環境内で実行することができる。Javaは、インターネットの分散型コンピューティング環境(distributed computing environment)において使用できるように設計されたコンピュータプログラミング言語である。Javaプログラムは、ソースプログラムがJava仮想マシン(Java virtual machine)を有するサーバ又はクライアント上であればネットワーク内のどこでも実行できるJavaバイトコードにコンパイルされているため、コンピュータネットワーク内を移動(portable)することができる。Java仮想マシンは、バイトコードを解釈実行するために用いられる。
ユーザは、検索を開始するために、アプレットに関連したグラフィカルユーザインタフェース(Graphical User Interface:GUI)のダイアログボックスに所望のキーワードを入力した後、コンピュータキーボードのリターンキーを押し、又はマウスを用いてGUIの「検索」アクションボタンをクリックする。これにより、アプレットは、ユーザが入力したキーワードに基づいて、情報の検索を開始する。検索アプレット710は、シンプルオブジェクトアクセスプロトコル(Simple Object Access Protocol:SOAP)を用いて検索ウェブサービス720と通信を行う。
SOAPは、ワールドワイドウェブのハイパーテキストトランスファープロトコル(Hypertext Transfer Protocol:HTTP)及びその拡張マークアップ言語(Extensible Markup LANguage:XML)を情報交換のメカニズムとして用いて、ある種類のオペレーティングシステムで動作しているプログラムが同じ又は異なるオペレーティングシステムで動作しているプログラムと通信を行うことができるプロトコルである。SOAPは、HTTPヘッダと、XMLファイルとをどのようにしてエンコードするかを定めており、これにより、1つのコンピュータ内のプログラムが異なるコンピュータ内のプログラムを呼び出し、そのプログラムに情報を渡すことができる。更に、SOAPは、呼び出されたプログラムがどのようにして応答を返すかも定義している。HTTP要求は、通常、ファイアウォールを通過することを許可されているため、HTTP SOAPを用いることにより、アプリケーションにとって既知である要求以外の要求を排除するために用いられるファイアウォールサーバを越えて、プログラムを呼び出すことができる。SOAPは、メッセージのコンテンツのフレームワークと、メッセージをどのように処理するかとを定義するエンベロープ(envelope)を提供するコンポーネントと、アプリケーションにおいて定義されたデータタイプのインスタンスにフラグを付すための符号化規則の組を定義するコンポーネントと、リモートプロシージャの呼出及び応答を表現するための規則(convention)を提供するコンポーネントとの3個の主なコンポーネントを備える。この実施例では、AXISとして知られるSOAPのインプリメンテーションを使用する。本発明の変形例においては、検索アプレットと利用可能なサービスとの間のインタフェースとしてSOAP以外のプロトコルを用いてもよい。例えば、変形例においては、Javaリモートメッソド呼出(Java Remote Method Invocation:RMI)、リモートプロシージャコール(Remote Procedure Call:RPC)、又は単純な伝送制御プロトコル/インターネットプロトコル(Transmission Control Protocol/Internet Protocol:TCP/IP)ソケットをこの目的で用いてもよい。
HTTPは、ウェブ上のテキスト、画像、音声、映像及びこの他のマルチメディアファイルの交換を定義する1組の規則を含むアプリケーション層プロトコルである。HTTPの基本的な概念の1つとして、ファイルは、インターネット内のいずれかの場所に存在する情報への相互参照を提供するハイパーテキストリンクを含むことができる。HTMLファイルの形式の情報は、クライアントの要求に応じて転送したりダウンロードしたりすることができる。
XMLは、マークアップ言語である。最も広く用いられているマークアップ言語であるHTMLは、ヘディング及びタイトルに関して文書構造を定義し、及び例えば、キャプション及びフォント等に関する表現を定義することによって、ウェブブラウザに対し、ウェブページのテキスト及び画像をどのように表示するかに関する命令を提供する。一方、XMLは、共通の情報フォーマットを定義し、及びウェブ及びイントラネット上でこれらのフォーマットと関連するデータとを共有する手法を提供する。HTMLは、テキスト及び情報をどのように表示し、どのようにインタラクトさせるかを定義する目的に制限されているが、XMLでは、アプリケーション開発者は、例えば、タグ<DATE>及び<CHANNEL>は、テレビジョン番組リストを含む文書内で用いられると定義する等、文書内のセクション又は単語を特定のデータカテゴリに属するものであるとマークするカスタムタグを定義することができるため、XMLは、文書のコンテンツに関する文脈的情報(contextual information)を提供することができる。また、XML文書においては、カスタムタグ利用して、選択的な情報を特定及び抽出することにより、データ処理タスクを実行することができる。これは、例えば、ビデオアーカイブ及び文書集合等の膨大な情報を含むレポジトリ(repository)からコンテンツを選択的に検索し、範疇化する場合に特に有用である。
ウェブ検索サービス720は、Javaアプリケーションサーバプラットホームを有し、HTTPによって、インデックスサービス730及び意味マップソース750と通信を行う。ウェブ検索サービス720は、ユーザが入力したキーワードをインデックスサービス730に伝える。インデックスサービス730は、3つの異なる情報レポジトリ、すなわちビデオアーカイブ742、ウェブ検索エンジン744及びローカルエリアネットワーク746のコンテンツへのインタフェースを提供する。ユーザが入力したキーワードは、例えば、「Google(商標)」等のウェブ検索エンジンに供給され、これにより、関連するウェブページが検索される。ウェブ検索エンジンは、検索が可能な各ウェブサイトの全てのページ又は代表的なページを調べ、ウェブページのコンテンツを分析し、各ページのハイパーテキストリンクを用いてウェブサイトの他のページにアクセスする「スパイダ(spider)」と、読み出されたウェブページから大量のインデックスを生成するプログラムと、検索要求を受け取り、この検索要求とインデックス内のエントリとを比較し、検索条件との一致を返すプログラムとを備えるコンピュータプログラムの調整された組(co-ordinated set)である。
ビデオアーカイブ742及びLAN746内の情報コンテンツは、予めログとして保存(pre-logged)してもよい。インデックスサービス730は、3つのレポジトリ742、744、746からユーザが入力したキーワードに関連すると判定された全ての情報コンテンツを抽出し、「ヒット」した各アイテムに関する情報ロケータ(information locator)、ショートタイトル(short title)及び簡単な記述子(brief descriptor)を返す。ユニフォームリソースロケータ(uniform resource locator:URL)は、情報ロケータとして用いられる。URLは、ウェブページについて、通常、HTTPプロトコルと、インターネットサーバロケーションと、ファイルパス及びファイル名とを特定する。また、URLは、ビデオアーカイブ742内の及びLAN746上のファイルを識別し、見つけるためにも用いられる。URL及び対応する文書記述子は、意味マップソース750に供給され、意味マップソース750は、図2〜図6を用いて上述した情報アイテム類似性マッピング分析(information item similarity mapping analysis)を実行する。
URLが供給された各情報アイテムに対して適切な特徴ベクトルを生成するために、意味マップソース750は、情報をダウンロードし、ダウンロードされたデータに対して、単語頻度分析を行う。上述のように、特徴ベクトル成分の値は、文書内の又は関連するビデオクリップを記述するメタデータ内の対応する単語の出現の相対頻度に等しい。これに代えて、出現頻度の関数及び単語の重要性を用いて、特徴ベクトル成分を判定してもよい。特徴ベクトルの生成を容易にするために、意味マップソース750は、供給されたURLに基づき、200個の並列プログラムスレッドに情報を同時にダウンロードすることができる。スレッドとは、コンピュータプログラム処理内の実行(execution)のシーケンスである。スレッドは、自らのアドレス空間を有しておらず、スレッドが実行されているプロセスのメモリ及び他のリソースを使用する。ダウンロードをスレッド方式で行うことにより、マッピング効率が向上する。(x,y)マッピング点は、縮退された特徴ベクトル(reduced feature vector)に基づき、検索キーワードに関連付けられた各URLに対して、すなわち各検索引用(search citation)に対して、算出される。(x,y)マッピングは、情報アイテム記述子とともに用いられ、SOM表示領域270のノード上で表示点をクラスタ化することによって検索引用間の関係の抽象的表現(abstract representation)、視覚的表現(visualisation)が提供される。マッピング処理を実行する前に、まず、各URLについてキャッシュ760のコンテンツを確認し、特定のURLが既にマッピングされているか否かを判定する。キャッシュがヒットした場合、(x,y)マッピング値をキャッシュから直接読み出すことができる。これにより、情報アイテムをダウンロードし、又は特徴ベクトルを再計算する必要がなくなる。
図16は、代表擬似画像(representative pseudo-image)を情報アイテムから生成する手法を説明するフローチャートである。情報アイテムを構成する情報要素の相対的な重要性を判定するために、単語頻度分析を行うこの分析は、意味マップソース760によって維持されているストップワード及び語幹又は原形の索引(concordance)を参照して行われる。この実施例では、特徴ベクトルの各次元に関連付けられた語幹を含む一次派生索引(primary concordance)を使用する。また、変形例においては、特徴ベクトル語幹と、最も最近のマップ再トレーニング演算以来、意味マップソースによって分析された検索引用から導出された新たに遭遇した語幹との両方を含む「更新索引(update concordance)」を用いる。ステップ1010においては、情報アイテム1020からのテキスト情報に対してストップワード処理及び語幹処理を行い、索引1022における各語幹がテキスト内に現れる頻度を判定する。この場合、情報構成要素は、情報要素内のテキスト成分(textual matter)と、索引との両方に含まれる語幹である。テキスト成分は、ウェブページ/文書内の生のテキストと、オーディオ/ビデオファイルに伴うメタデータのいずれに対応してもよい。ステップ1030において、最大「m」(整数)個の文字を含む所定数「n」個の最も頻繁に出現する語幹が、擬似画像に含めることが適切な情報アイテム1020の最も重要な情報構成要素として選択される。語幹出現頻度(word stem frequency count)を相対的な重要度の尺度として用いる代わりに、単語の出現の性質を用いることもできる。したがって、ステップ1032においては、最も大きいテキストフォントサイズで表現されている最大m個の文字からなるn個の単語を抽出することによって、情報アイテムのテキスト成分を分析する。この手法は、テキスト成分におけるタイトル及びセクションのヘディングが大きなフォントで示されることが多いという事実を利用している。この場合、タイトルに用いられる語句における文法的な歪みを無視するために、単語に対するストップワード処理及び語幹処理は行わない。次に、ステップ1040において、擬似画像の第1の所定の領域に最も目立つように表示すべきメインタイトルを選択する。この実施例では、第1の所定の領域は、擬似画像1090の中央部分1092に対応する。メインタイトルは、最も頻繁に出現する1又は複数の語幹に対応していてもよく、最も大きなフォントが用いられている1又は複数の単語に対応していてもよい。なお、情報アイテムがユーザによって開始された検索要求に応じて列挙されている場合、単語頻度分析において、検索キーワードに対応する単語及びフレーズを優先的に重み付けしてもよい。これらのキーワードは、検索結果のコンテキストにおいて、相対的により高い重要度を有していると考えられる。ステップ1040において、メインタイトルとして適切なテキストが選択されると、次に、ステップ1050において、擬似画像1090の上位部分1094に対応する次の所定の画像領域のためのテキストが選択される。擬似画像の上位部分1094には、最大m個の文字からなる次に頻度が高いn’個の単語を割り当てる。ステップ1060において、所定の擬似画像フォーマットにおいて、テキストを選択すべき更なる画像領域があるか否かを判定する。更なる画像領域がある場合、処理はステップ1050に戻り、次に頻度が高い所定数の単語を選択する。この実施例では、更にテキストを割り当てるべき擬似画像の下位部分1096が存在するため、ステップ1050を繰り返すステップ1060を2度目に行うと、全ての画像領域にテキストが割り当てられ、処理は、ステップ1070に進み、ここで所定の各画像領域に関するテキストに適切なフォント及び色を選択する。ステップ1080においては、選択されたテキスト、フォント及び色を適用し、擬似画像1090を擬似画像テンプレートに表示画面にレンダリングする。
図17A〜図17Cは、情報アイテムの擬似画像1090の画像レイアウトを図式的に示す図である。これらの3つの図において、擬似画像は、2つの水平境界線によって中央部分1092、上位部分1094、下位部分1096の3つの所定の領域にセグメント化されている。図17Aにおいては、中央部分1092は、情報要素からのこの代表テキストは最も重要な代表テキストを含み、大きなフォントサイズで表示される。中央部分1092は、画像の中央の位置にあり、ここでは、大きなフォントサイズが用いられているため、ユーザには最も目立って見える。したがって、上述したRSVP技術の1つを用いて、複数の擬似画像が連続的に表示され、各画像からの情報を認識するためのユーザの時間が制限されている場合、最も重要な代表テキストが認識されやすくなっている。擬似画像1090の上位部分1094は、中間のフォントサイズで次に重要なテキストを表示する。このテキストは、まとまったフレーズ及び/又は独立した単語から構成されていてもよい。擬似画像1090の下位部分1096は、上位部分1094と同じ相対的重要度を有すると判定されたテキストを表示するために用いられるため、上位部分1094と同じ中間的なフォントサイズで表示される。これらの画像部分1092、1094、1096は、同じ面積である必要はなく、例えば、中央部分1092が最も大きな面積を有し、下位部分1096が最も小さな面積を有していてもよい。なお、各画像領域が同じ面積を有する場合、小さなフォントサイズが用いられる領域では、より多くのテキスト情報を表示することができる。
図17Bは、各画像領域1092、1094、1096の背景埋込特性(background fill-characteristics)を用いてより重要な画像領域のテキストを区別する手法を図式的に示す図である。この実施例では、擬似画像1090の中央部分1092は、適切な背景パターンを選択することによって強調されている。適切なコントラストを有する背景色を選択することによって、及び/又は中央部分1092に太字のテキストを用いることによっても同様の効果が実現される。
図17Cは、所定の画像領域において、分割されたタイトル(split titles)を用いた実施例を図式的に示す図である。この実施例では、擬似画像1090内のテキストは、3つの異なるレベルの重要度に対応する。ここでも、最も重要なテキストは、画像の中央領域1092に表示される。中間の重要度の度合いを有するテキストは、画像の上位領域1094において、より小さなフォントで表示され、より重要度が低いテキストは、画像の下位領域1096において、更に小さなフォントで表される。画像の中央領域1092は、垂直方向の境界線によって、それぞれタイトルフレーズが関連付けられた2つのサブ領域に更に分割されている中央の2つのサブ領域では、それぞれのタイトルフレーズのテキストには同じフォントサイズを用いてるが、背景効果が変えられている。また、画像の上位領域1094にも弁別的な背景埋込処理が施されている。図17Cに示す実施例では、更に、関連付けられた情報アイテムのデータタイプを示す、この実施例では、情報アイテムがワード文書(Word document)であることを示すアイコンであるデータタイプインジケータ(data type indicator)1098を表示している。データタイプインジケータは、このようなアイコンに変えて、例えば、スプレッドシートロゴ又はブラウザロゴ等であってもよい。データタイプインジケータを用いることにより、種類が異なるテキストコンテンツを区別することができる。
図18は、擬似画像の代表的なシーケンスを単一の情報アイテムからどのように生成するかを図式的に説明する図である。例えば個々のウェブページ等の幾つかの情報アイテムについては、単一の画像によってそのコンテンツを十分に表現できる。しかしながら、例えば多くの頁を有する文書、ウェブページリンクされたウェブページのシーケンス、複数の章を有する電子ブック、異なる複数のシーンを含むビデオクリップ等の他の情報アイテムでは、複数の擬似画像を生成することが望ましい場合もある。シーケンス1100は、コンテンツが6つの異なるセグメントに分割された単一の情報アイテムを表している。各セグメントには、同程度の量のテキストを含めてもよく、他の情報を含めてもよく、これに代えて、セグメント化の際に、例えば、文書における章等の情報アイテムの既存の構造を考慮してもよい。更なるシーケンス1110では、6個の各情報セグメントを分析し、各セグメントにおいて、最も重要な情報構成要素を選択する。図16に示すフローチャートを用いて上述したように、この分析は、単語の出現頻度及び/又は情報要素内に出現するテキストの画像的特性(graphical properties)に基づいて行われる。相対的な重要度を客観的に判断するために用いることができる情報アイテム内のテキストの出現の性質の他の側面としては、情報アイテムのページにおけるテキストの物理的な位置(例えば、ページの先頭にあるテキストは、より重要であると考えられる)、テキスト文字列がURLに含まれているか否か、ウェブページのメタタグに含まれているか、又は他のウェブページへのリンクに含まれているか等が含まれる。
最後のシーケンス1120では、標準的な画像レイアウトに各情報セグメントの関連性の尺度を適用し、連続する代表擬似画像を生成する。3つのシーケンス1100、1110、1120の要素を接続する矢印によって示すように、情報セグメントと各関連性の尺度との間及びこれらの関連性の尺度と代表擬似画像との間では、一対一のマッピングを行う。最後のシーケンス1120は、それぞれが各情報セグメントの最も重要なコンテンツのみを含む6個の擬似画像を含む、順序付けられたシーケンスである。最後のシーケンス1120は、RSVP技術を用いて、自動的に、連続してユーザに表示してもよく、これに代えて、ユーザは、手動で速度を変更してシーケンス1120を表示させて、情報アイテムのコンテンツの概観を把握してもよい。情報コンテンツは、各擬似画像の情報要素の対応するセグメントにおける最も重要な情報の部分集合(subset)を表す。これにより、ユーザに表示する情報の量を低減することができ、したがって、情報を把握するために必要となる認識のための時間を削減することができる。選択されたテキストは、認識のための時間を更に削減するために、適切に再フォーマットされ及び位置を変更され(re-positioned)、これにより、ユーザは、最も重要な情報のカテゴリをより素早く認識することができる。
図19は、情報アイテム内の情報を特定するために用いられるスクロールバー及びこれに関連付けられた関連性インジケータ(relevance indicator)を図式的に示す図である。関連性グラフ1200は、情報コンテンツの関連性を位置の関数として示している。この位置は、例えば、ビデオクリップのタイムラインにおける位置を表していてもよい。これに代えて、この位置は、文書内の現在の位置を表していてもよい。関連性グラフの横軸は、スクロールバー1220の最大の可動範囲に対応する。スクロールバー1220は、情報アイテムのコンテンツをナビゲートするために用いられる。関連性グラフの縦軸は、例えばパーセントにより、関連するスクロールバー位置に対応するコンテンツの関連性を示している。ウィンドウ1230は、スクロールバー1220の現在の位置に対応する情報コンテンツから導出された代表キースタンプ画像又は擬似画像を表示している。擬似画像を用いることにより、スクロールバー1220を高速に移動させて、ウィンドウ1230に表示される画像が高速に変化しても情報が認識しやすくなる。縦軸に示される関連性の尺度は、例えば、ユーザによって入力された検索用のキーワード等のキーワードに基づいて決定される。ビデオマテリアルを含む情報アイテムの場合、付随するメタデータを用いて各ショット又はシーンの関連性を示してもよい。少なくとも1つのキーワードが検出された情報アイテムの位置は、局所的な最大値(local maximum)に対応し、情報コンテンツ内の最も重要な部分は、全体的な最大値(global maximum)として示される。このように、関連性グラフ1200により、ユーザは、検索条件に最も関連性を有する情報コンテンツの部分に直接アクセスすることができる。
図20は、同時に表示される代表画像のシーケンス1300に対して、関連性グラフ及びスクロールバーをどのように使用するかを図式的に説明する図である。スクロールバー1220をスライディングスケール1200に沿ってドラッグすると、現在のスクロールバー1220の位置におけるコンテンツに対応する代表画像1310が強調表示され、シーケンス内の他の画像から区別される。6個の代表画像1300の各シーケンスは、例えば、ビデオシーケンス内の所定のショット、電子ブックにおける所定の章、又は特定の電子文書における所定のページに対応していてもよい。情報コンテンツの確認は、スクロールバー1220をドラッグし、又は所定の代表画像を選択して強調表示させることによって行うことができる。スクロールバー1220の位置を変更すると、現在強調表示されている代表画像がこれに応じて変更され、逆に、強調表示される画像を変更すると、これに応じて、スクロールバー1220の位置が変更される。代表画像から実行可能なファイルへのショートカット又はハイパーリンクを設け、これにより、マウスを用いて画像をダブルクリックすると、ビデオショットが再生され、又は、その情報セグメントに対応する擬似画像のシーケンスが連続的に表示されるようにしてもよい。
図21は、関連性グラフ及びスクロールバーとともに再分割された2つの異なる情報をユーザに表示する変形例を図式的に示す図である。上位に示す6個の画像のシーケンス1410は、6個の独立したショットに対応し、一方、下位に示す6個の画像のシーケンス1420は、6個の独立したシーンに対応する。各シーンは、複数のショットを含み、例えば、画像1422によって表されるシーンは、上位に示す画像のシーケンス1410における6個のショットを含む。図22に示す実施例では、スクロールバーの現在の位置に基づいて、シーケンス内の3番目のシーンを表す画像1322及びこのシーンの3番目のショットを表す画像1412が強調表示されている。この構成では、スクロールバーは、影付きの中央領域1220を有し、この中央領域1220の位置は、ショット1412を表し、この中央領域1220は、2つのローブ(lobe)1320に挟まれており、これらの全体の長さが情報アイテムにおけるシーン1422の位置を表している。これに代えて、上位の画像シーケンス1410が文書のページに対応し、下位の画像のシーケンス1420が文書の章又は節に対応し、代表画像は、最も重要なテキスト情報を示す擬似画像であってもよい。
図22は、スライドバーを関連性グラフ上に重ねた具体例を図式的に示す図である。更に、この構成は、ビデオクリップを再生し、又は元の情報アイテムのウェブ/テキストページをスクロールするためのユーザ操作子1442に関連付けられたビューウィンドウ1440を備える。
添付の図面を参照して本発明を詳細に説明したが、本発明は上述の実施の形態の詳細に限定されるものではなく、当業者は、添付の請求の範囲に定義された本発明の思想及び範囲から逸脱することなく、上述の実施の形態を様々に変更及び修正することができる。
情報保存及び検索システムの構成を示す図である。 自己組織化マップ(SOM)の作成の手順を説明するフローチャートである。 用語頻度ヒストグラムを示す図である。 (a)は、生の特徴ベクトルを示す図であり、(b)は、縮退された特徴ベクトルを示す図である。 SOMの構造を示す図である。 ディザ処理を説明する図である。 SOMによって表現された情報にアクセスするためのユーザインタフェースを提供する表示画面を示す図である。 SOMによって表現された情報にアクセスするためのユーザインタフェースを提供する表示画面を示す図である。 検索処理を説明するフローチャートである。 図9に示す検索処理の結果を表示するモードを示す図である。 図9に示す検索処理の結果を表示するモードを示す図である。 図9に示す検索処理の結果を表示するモードを示す図である。 ビデオ取得及び/又は処理装置の具体例として、カムコーダの構成を示す図である。 携帯型データ処理装置の具体例として、携帯情報端末の構成を示す図である。 インターネット内の様々なサイトにローカル及び/又はリモートに保存されている情報のための検索インタフェースを提供する構成の具体例を図式的に示す図である。 情報アイテムから代表擬似画像を生成するための処理を説明するフローチャートである。 情報アイテムの擬似画像の画像レイアウトの具体例を示す図である。 情報アイテムの擬似画像の画像レイアウトの具体例を示す図である。 情報アイテムの擬似画像の画像レイアウトの具体例を示す図である。 情報アイテムから擬似画像の代表シーケンスを生成する手法を図式的に説明する図である。 情報アイテム内の情報を検索するために用いられる関連性インジケータに関連付けられたスクロールバーを示す図である。 同時に表示される複数の代表画像のシーケンスについて用いられる関連性グラフ及びスクロールバーを示す図である。 関連性グラフ及びスクロールバーとともに再分割された2つの異なる情報をユーザに表示する変形例を図式的に示す図である。 スライドバーを関連性グラフ上に重ねた具体例を図式的に示す図である。

Claims (22)

  1. 複数のテキスト情報を含む情報アイテムを処理する情報アイテム処理方法において、
    a)上記情報アイテムのテキスト情報を分析して、上記情報アイテムに関連する情報構成要素の集合を検出するステップと、
    b)上記情報構成要素のそれぞれについて、上記情報アイテムに関する該情報構成要素の出現の頻度及び性質の少なくとも一方に基づいて、相対的な重要度の程度を検出するステップと、
    c)少なくとも2つの情報構成要素の部分集合を選択するステップと、
    d)上記情報構成要素の選択された部分集合を含み、上記情報アイテムを代表する擬似画像であって、
    d.1)上記部分集合の最も重要な情報構成要素が上記代表擬似画像内の第1の所定の領域において最も目立つように表示され、
    d.2)上記部分集合の1つ以上の他の情報構成要素がそれぞれの相対的な重要度の程度に応じて、上記代表擬似画像の他の所定の領域に表示される所定のレイアウトに構成された、擬似画像を生成するステップとを有する情報アイテム処理方法。
  2. 上記最も重要な情報構成要素は、上記代表擬似画像における中央領域に表示されることを特徴とする請求項1記載の情報アイテム処理方法。
  3. 上記代表擬似画像の上記所定の領域は、関連付けられた背景色を有することを特徴とする請求項1記載の情報アイテム処理方法。
  4. 上記代表擬似画像の上記所定の領域には、該所定の領域内に表示される上記情報構成要素の相対的な重要度に応じたテキストフォントサイズを用いて、テキスト情報が表示されることを特徴とする請求項1記載の情報アイテム処理方法。
  5. 少なくとも1つの情報アイテムがウェブページであることを特徴とする請求項1記載の情報アイテム処理方法。
  6. 上記情報構成要素は、テキスト情報を含むことを特徴とする請求項1記載の情報アイテム処理方法。
  7. 主要な画像又は映像情報を含む情報アイテムについて、該情報アイテムからの代表画像を含む上記情報アイテムを代表する代表擬似画像を生成するステップを更に有する請求項1記載の情報アイテム処理方法。
  8. 情報アイテムの集合に対応する代表擬似画像の時間的シーケンスを表示するステップを更に有する請求項1記載の情報アイテム処理方法。
  9. 上記情報アイテムに関する代表擬似画像が表示された際に、ユーザが情報アイテムを選択するためのユーザ操作子を提供するステップを更に有する請求項8記載の情報アイテム処理方法。
  10. 上記代表擬似画像の時間的シーケンスは、実質的に一定の画像表示サイズで表示されることを特徴とする請求項8記載の情報アイテム処理方法。
  11. 情報アイテムのグループに検索クエリを適用するステップを更に有し、
    上記情報アイテムの集合は、上記検索クエリの結果のグループから導出されることを特徴とする請求項8記載の情報アイテム処理方法。
  12. 順序付けられた情報のシーケンスを含む情報アイテムについて、該順序付けられた情報のシーケンスにおける、それぞれの異なる位置に関連する複数の代表擬似画像を導出するステップを更に有する請求項1記載の情報アイテム処理方法。
  13. 上記情報アイテム内の異なる各位置によって表される情報に、検索クエリを適用するステップと、
    上記検索クエリに対する上記異なる各位置によって表される関連する情報のグラフィック表現を生成するステップとを更に有する請求項12記載の情報アイテム処理方法。
  14. 上記情報アイテムに関連する情報構成要素の集合を検出するステップは、上記情報構成要素のそれぞれについて、上記情報アイテムにおける該情報構成要素のそれぞれの位置に基づいて、相対的な重要度の程度を検出するステップを更に有することを特徴とする請求項1記載の情報アイテム処理方法。
  15. 上記情報アイテムに関連する情報構成要素の集合を検出するステップは、上記情報構成要素のそれぞれについて、上記情報アイテムにおける該情報構成要素の出現の顕著性に基づいて、相対的な重要度の程度を検出するステップを更に有することを特徴とする請求項1記載の情報アイテム処理方法。
  16. 請求項1記載の情報アイテム処理方法を実行するためのプログラムコードを有するコンピュータソフトウェア。
  17. 請求項16記載のプログラムコードを提供するための提供媒体。
  18. 上記媒体は、記録媒体であることを特徴とする請求項17記載の提供媒体。
  19. 上記媒体は、伝送媒体であることを特徴とする請求項17記載の提供媒体。
  20. 複数のテキスト情報を含む情報アイテムを処理する情報アイテム処理装置において、
    1)上記情報アイテムのテキスト情報を分析して、上記情報アイテムに関連する情報構成要素の集合を検出するテキスト分析器と、
    2)上記情報構成要素のそれぞれについて、上記情報アイテムに関する該情報構成要素の出現の頻度及び性質の少なくとも一方に基づいて、相対的な重要度の程度を検出する検出器と、
    3)少なくとも2つの情報構成要素の部分集合を選択する選択器と、
    4)上記情報構成要素の選択された部分集合を含み、上記情報アイテムを代表する擬似画像であって、
    a)上記部分集合の最も重要な情報構成要素が上記代表擬似画像内の第1の所定の領域において最も目立つように表示され、
    b)上記部分集合の1つ以上の他の情報構成要素がそれぞれの相対的な重要度の程度に応じて、上記代表擬似画像の他の所定の領域に表示される所定のレイアウトに構成された、擬似画像を生成する擬似画像生成器とを備える情報アイテム処理装置。
  21. 請求項20記載の情報アイテム処理装置を備える携帯型データ処理装置。
  22. 請求項20記載の情報アイテム処理装置を備えるビデオ取得及び処理装置。
JP2004197180A 2003-07-02 2004-07-02 情報処理 Expired - Fee Related JP4711385B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0315500A GB2403558A (en) 2003-07-02 2003-07-02 Document searching and method for presenting the results
GB0315500.9 2003-07-02

Publications (2)

Publication Number Publication Date
JP2005122690A true JP2005122690A (ja) 2005-05-12
JP4711385B2 JP4711385B2 (ja) 2011-06-29

Family

ID=27676536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004197180A Expired - Fee Related JP4711385B2 (ja) 2003-07-02 2004-07-02 情報処理

Country Status (4)

Country Link
US (1) US7647345B2 (ja)
EP (1) EP1494143A3 (ja)
JP (1) JP4711385B2 (ja)
GB (1) GB2403558A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096073A (ja) * 2009-10-30 2011-05-12 Rakuten Inc 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及びコンテンツ生成装置
JP2011096078A (ja) * 2009-10-30 2011-05-12 Rakuten Inc 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置
JP2019028984A (ja) * 2017-07-30 2019-02-21 富士ゼロックス株式会社 非常に大きな画像集合における近似重複画像をクラスタ化するためのシステム及び方法、複数の画像をクラスタ化するための方法及びシステム、プログラム、複数の内容項目をクラスタ化するための方法
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium
JP2022546658A (ja) * 2020-10-09 2022-11-07 グーグル エルエルシー 目の注視データを用いたテキストレイアウト解釈

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7174453B2 (en) 2000-12-29 2007-02-06 America Online, Inc. Message screening system
US6778995B1 (en) * 2001-08-31 2004-08-17 Attenex Corporation System and method for efficiently generating cluster groupings in a multi-dimensional concept space
US7640336B1 (en) 2002-12-30 2009-12-29 Aol Llc Supervising user interaction with online services
US7610313B2 (en) 2003-07-25 2009-10-27 Attenex Corporation System and method for performing efficient document scoring and clustering
US7191175B2 (en) 2004-02-13 2007-03-13 Attenex Corporation System and method for arranging concept clusters in thematic neighborhood relationships in a two-dimensional visual display space
US7561755B2 (en) * 2004-09-22 2009-07-14 Google Inc. Image distortion for content security
US7418660B2 (en) * 2004-09-23 2008-08-26 Microsoft Corporation Method and system for caching and adapting dynamic display pages for small display devices
US7856413B2 (en) * 2004-10-14 2010-12-21 International Business Machines Corporation Dynamic search criteria on a search graph
US7356777B2 (en) 2005-01-26 2008-04-08 Attenex Corporation System and method for providing a dynamic user interface for a dense three-dimensional scene
US7404151B2 (en) 2005-01-26 2008-07-22 Attenex Corporation System and method for providing a dynamic user interface for a dense three-dimensional scene
US7730531B2 (en) * 2005-04-15 2010-06-01 Microsoft Corporation System and method for detection of artificially generated system load
US7590612B2 (en) * 2005-06-17 2009-09-15 Microsoft Corporation Blog map for searching and/or navigating the blogosphere
US20070185857A1 (en) * 2006-01-23 2007-08-09 International Business Machines Corporation System and method for extracting salient keywords for videos
EP1816550A1 (en) * 2006-02-07 2007-08-08 Sony Ericsson Mobile Communications AB Portable equipment with improved link display
US7783497B2 (en) 2006-03-28 2010-08-24 Intel Corporation Method of adaptive browsing for digital content
US8024329B1 (en) * 2006-06-01 2011-09-20 Monster Worldwide, Inc. Using inverted indexes for contextual personalized information retrieval
JP4900931B2 (ja) * 2006-10-04 2012-03-21 キヤノン株式会社 情報処理装置及び画像処理システムとその制御方法
US7840538B2 (en) * 2006-12-20 2010-11-23 Yahoo! Inc. Discovering query intent from search queries and concept networks
US8413060B1 (en) 2007-12-18 2013-04-02 Aol Inc. Methods and systems for visually distinguishing user attribute similarities and differences
US8572084B2 (en) 2009-07-28 2013-10-29 Fti Consulting, Inc. System and method for displaying relationships between electronically stored information to provide classification suggestions via nearest neighbor
CA2772082C (en) 2009-08-24 2019-01-15 William C. Knight Generating a reference set for use during document review
US8311808B2 (en) * 2009-12-15 2012-11-13 Thinkmap, Inc. System and method for advancement of vocabulary skills and for identifying subject matter of a document
AU2011203833B2 (en) * 2010-01-11 2014-07-10 Apple Inc. Electronic text manipulation and display
US9384678B2 (en) 2010-04-14 2016-07-05 Thinkmap, Inc. System and method for generating questions and multiple choice answers to adaptively aid in word comprehension
US9235566B2 (en) 2011-03-30 2016-01-12 Thinkmap, Inc. System and method for enhanced lookup in an online dictionary
US20120278216A1 (en) * 2011-04-28 2012-11-01 Nokia Corporation Method and apparatus for sharing a self-created account for storing assets
JP5911492B2 (ja) * 2011-08-05 2016-04-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報検索システム、方法、及びプログラム
US20130149681A1 (en) * 2011-12-12 2013-06-13 Marc Tinkler System and method for automatically generating document specific vocabulary questions
US10129324B2 (en) 2012-07-03 2018-11-13 Google Llc Contextual, two way remote control
US8903174B2 (en) 2012-07-12 2014-12-02 Spritz Technology, Inc. Serial text display for optimal recognition apparatus and method
US9552596B2 (en) 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
US9483109B2 (en) 2012-07-12 2016-11-01 Spritz Technology, Inc. Methods and systems for displaying text using RSVP
US20140189586A1 (en) 2012-12-28 2014-07-03 Spritz Technology Llc Methods and systems for displaying text using rsvp
US10650063B1 (en) * 2012-11-27 2020-05-12 Robert D. Fish Systems and methods for making correlations
US9195440B2 (en) * 2013-11-26 2015-11-24 International Business Machines Corporation Intelligent data source selection in application development
US10003659B2 (en) * 2014-10-31 2018-06-19 Qualcomm Incorporated Efficient group communications leveraging LTE-D discovery for application layer contextual communication
US9438412B2 (en) * 2014-12-23 2016-09-06 Palo Alto Research Center Incorporated Computer-implemented system and method for multi-party data function computing using discriminative dimensionality-reducing mappings
US9992209B1 (en) * 2016-04-22 2018-06-05 Awake Security, Inc. System and method for characterizing security entities in a computing environment
WO2017210618A1 (en) 2016-06-02 2017-12-07 Fti Consulting, Inc. Analyzing clusters of coded documents

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266094A (ja) * 1992-03-23 1993-10-15 Toshiba Corp 画像検索装置
JP2000222088A (ja) * 1999-02-02 2000-08-11 Fujitsu Ltd 情報提供サーバ,仲介サーバ,および閲覧端末
JP2001266659A (ja) * 2000-03-15 2001-09-28 Hitachi Metals Ltd 伝送ケーブル並びに伝送ケーブルを用いた装置
JP2002259112A (ja) * 2001-02-15 2002-09-13 Internatl Business Mach Corp <Ibm> デジタル文書閲覧システム、ブラウザ、文章要約システム、デジタル文書表示方法、文章要約方法、プログラム及び記憶媒体
JP2003162532A (ja) * 2001-08-08 2003-06-06 Xerox Corp サムネイル生成方法
JP2003167571A (ja) * 2001-11-30 2003-06-13 Sony Corp データ表示装置及び表示制御方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5125045A (en) * 1987-11-20 1992-06-23 Hitachi, Ltd. Image processing system
US5459587A (en) * 1991-05-02 1995-10-17 Minolta Camera Kabushiki Kaisha Processing apparatus capable of discriminating between pseudo half-tone/non-half-tone image data based upon the number of adjacencies of similar type of pixels within a block
US5423032A (en) * 1991-10-31 1995-06-06 International Business Machines Corporation Method for extracting multi-word technical terms from text
CA2077604C (en) * 1991-11-19 1999-07-06 Todd A. Cass Method and apparatus for determining the frequency of words in a document without document image decoding
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
EP0766183B1 (en) * 1995-09-29 2002-12-04 Hewlett-Packard Company, A Delaware Corporation Browsing electronically stored information
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
US6041331A (en) * 1997-04-01 2000-03-21 Manning And Napier Information Services, Llc Automatic extraction and graphic visualization system and method
JP3607462B2 (ja) * 1997-07-02 2005-01-05 松下電器産業株式会社 関連キーワード自動抽出装置及びこれを用いた文書検索システム
US6192111B1 (en) * 1998-02-06 2001-02-20 Avaya Inc. Abstracting system for multi-media messages
MXPA00012660A (es) * 1998-06-18 2003-08-01 Mackinac Group Inc METODO PARA AMORTIGUAR EL RUIDO, LA VIBRACION Y LA ASPEREZA DE UN SUBSTRATO Y COMPOSICIoN PARA EL MISMO.
JP2000071520A (ja) * 1998-08-28 2000-03-07 Seiko Epson Corp 画像印刷方法およびその装置
US6167147A (en) * 1998-10-26 2000-12-26 The Standard Register Company Security document including pseudo-random image and method of making the same
US6411962B1 (en) * 1999-11-29 2002-06-25 Xerox Corporation Systems and methods for organizing text
JP3573688B2 (ja) * 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
US6720860B1 (en) * 2000-06-30 2004-04-13 International Business Machines Corporation Password protection using spatial and temporal variation in a high-resolution touch sensitive display
US7058199B1 (en) * 2000-08-14 2006-06-06 The Hong Kong University Of Science And Technology Methods and apparatus for hiding data in halftone images
WO2002027508A1 (en) * 2000-09-26 2002-04-04 Alltrue Networks, Inc. Method and software for graphical representation of qualitative search results
JP3805613B2 (ja) * 2000-10-27 2006-08-02 シャープ株式会社 画像処理装置
WO2002041190A2 (en) * 2000-11-15 2002-05-23 Holbrook David M Apparatus and method for organizing and/or presenting data
KR20020038141A (ko) * 2000-11-16 2002-05-23 윤종용 인터넷 광고 방법 및 장치
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7155668B2 (en) * 2001-04-19 2006-12-26 International Business Machines Corporation Method and system for identifying relationships between text documents and structured variables pertaining to the text documents
JP4593842B2 (ja) * 2001-08-03 2010-12-08 キヤノン株式会社 動画像検索装置及びその制御方法
US7192283B2 (en) * 2002-04-13 2007-03-20 Paley W Bradford System and method for visual analysis of word frequency and distribution in a text

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266094A (ja) * 1992-03-23 1993-10-15 Toshiba Corp 画像検索装置
JP2000222088A (ja) * 1999-02-02 2000-08-11 Fujitsu Ltd 情報提供サーバ,仲介サーバ,および閲覧端末
JP2001266659A (ja) * 2000-03-15 2001-09-28 Hitachi Metals Ltd 伝送ケーブル並びに伝送ケーブルを用いた装置
JP2002259112A (ja) * 2001-02-15 2002-09-13 Internatl Business Mach Corp <Ibm> デジタル文書閲覧システム、ブラウザ、文章要約システム、デジタル文書表示方法、文章要約方法、プログラム及び記憶媒体
JP2003162532A (ja) * 2001-08-08 2003-06-06 Xerox Corp サムネイル生成方法
JP2003167571A (ja) * 2001-11-30 2003-06-13 Sony Corp データ表示装置及び表示制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096073A (ja) * 2009-10-30 2011-05-12 Rakuten Inc 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及びコンテンツ生成装置
JP2011096078A (ja) * 2009-10-30 2011-05-12 Rakuten Inc 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium
JP2019028984A (ja) * 2017-07-30 2019-02-21 富士ゼロックス株式会社 非常に大きな画像集合における近似重複画像をクラスタ化するためのシステム及び方法、複数の画像をクラスタ化するための方法及びシステム、プログラム、複数の内容項目をクラスタ化するための方法
JP7020170B2 (ja) 2017-07-30 2022-02-16 富士フイルムビジネスイノベーション株式会社 非常に大きな画像集合における近似重複画像をクラスタ化するためのシステム及び方法、複数の画像をクラスタ化するための方法及びシステム、プログラム、複数の内容項目をクラスタ化するための方法
JP2022546658A (ja) * 2020-10-09 2022-11-07 グーグル エルエルシー 目の注視データを用いたテキストレイアウト解釈
JP7242902B2 (ja) 2020-10-09 2023-03-20 グーグル エルエルシー 目の注視データを用いたテキストレイアウト解釈
US11941342B2 (en) 2020-10-09 2024-03-26 Google Llc Text layout interpretation using eye gaze data

Also Published As

Publication number Publication date
US20050004949A1 (en) 2005-01-06
EP1494143A3 (en) 2005-10-05
JP4711385B2 (ja) 2011-06-29
GB0315500D0 (en) 2003-08-06
US7647345B2 (en) 2010-01-12
GB2403558A (en) 2005-01-05
EP1494143A2 (en) 2005-01-05

Similar Documents

Publication Publication Date Title
JP4711385B2 (ja) 情報処理
JP4776894B2 (ja) 情報検索方法
JP4569955B2 (ja) 情報格納及び検索方法
KR101377389B1 (ko) 다차원 검색 시스템, 다차원 검색을 수행하는 컴퓨터 구현 방법 및 컴퓨터 실행가능 시스템
US7502780B2 (en) Information storage and retrieval
US20040107221A1 (en) Information storage and retrieval
JP2008276768A (ja) 情報検索装置及び方法
JP2006127484A (ja) 情報処理方法
EP1906317A2 (en) Information storage and retrieval based on self-organising maps
US20040107195A1 (en) Information storage and retrieval
JP2004110834A (ja) 情報記憶検索システム及び方法
JP2002197115A (ja) 評価基準データを用いたウェブページ検索方法及び記憶媒体
Yang et al. Search for flash movies on the web
JP3778270B2 (ja) 選択履歴管理情報、選択履歴情報、情報記憶媒体、及びユーザーインターフェース補助システム
GB2403559A (en) Index updating system employing self organising maps

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070606

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080418

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100922

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100922

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100928

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110318

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees