JP5098315B2 - 関連情報決定方法及び装置並びにプログラム - Google Patents

関連情報決定方法及び装置並びにプログラム Download PDF

Info

Publication number
JP5098315B2
JP5098315B2 JP2006331307A JP2006331307A JP5098315B2 JP 5098315 B2 JP5098315 B2 JP 5098315B2 JP 2006331307 A JP2006331307 A JP 2006331307A JP 2006331307 A JP2006331307 A JP 2006331307A JP 5098315 B2 JP5098315 B2 JP 5098315B2
Authority
JP
Japan
Prior art keywords
document
surrounding structural
structural element
surrounding
location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006331307A
Other languages
English (en)
Other versions
JP2007164788A (ja
Inventor
ヘンク ヴァン デン マーティン
エル.シオン ジョバンニ
ポーラニー リビア
リーフェル エレノア
チィーウ パトリック
イヤン リュウ ビー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2007164788A publication Critical patent/JP2007164788A/ja
Application granted granted Critical
Publication of JP5098315B2 publication Critical patent/JP5098315B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、情報検索に関し、詳細には、関連情報決定方法及び装置並びにプログラムに関する。
参考資料、報告書、技術論文、及びその他のドキュメントは、デジタル形式での提示が増えている。新規作品の生成者は、その新規作品の一部と他のドキュメントとをリンクする若しくは接続することが多い。しかしながら、従来のドキュメント・オーサリング・システムのほとんどでは、このようなリンクを手動で行う必要がある。従来の推薦システムの中には、例えばグーグルの類似検索(Google's Find Similar)のような、ドキュメント・リストの第1ドキュメントに類似したドキュメントを自動的に選択するものもある。このような従来の推薦システムは、選択された第1ドキュメントに対する統計的なドキュメント類似性に基づいて、関連ドキュメントを選択する。従って、第1ドキュメントにおいて頻繁に用いられているが関連性の低い語句は、追加の関連ドキュメントの選択を歪める可能性がある。
従って、ドキュメント構造に基づいて関連情報を決定するシステム及び方法が有用である。談話構造表現および関連性スコアに基づいてハイブリッド・テキスト要約を決定する特許文献1に記載の発明、及び、非特許文献1、非特許文献2などに記載の発明は、本発明に関連する。
米国特許出願公開第2005/0086592号明細書 ブリル(Brill)、「品詞タグ付けの曖昧性除去規則の教師なし学習("Unsupervised Learning of Disambiguation Rules for Part of Speech Tagging")、クルワ・アカデミック・プレス(Kluwer Academic Press)、1997年 イデら(Ide, et al.)、「語意の曖昧性除去に関する特殊問題入門:技術動向("Introduction to the Special Issue on Word Sense Disambiguation: the state of the art")、コンピュータ的言語学(Computational Linguistics)、1998年、24(1)、頁1〜40
上記に鑑み、本発明はドキュメント構造に基づいて関連情報を決定することを課題とする。
ドキュメントからその構造に基づいて関連情報を決定するシステム及び方法が提供される。ドキュメントが選択され、このドキュメント内における支配関係を有する構造要素が決定される。このドキュメント内における第1ロケーションが選択される。この第1ロケーション周囲の構造要素が決定され、周囲構造要素及び非周囲構造要素が特徴付けられる。これらの周囲構造要素及び非周囲構造要素の特徴付けに基づいて、追加ドキュメントが周囲構造要素における第1ロケーションと関連付けられる。また、ドキュメント構造に基づいて画像に対する注釈を動的に決定するシステム及び方法も提供される。
本発明の第1の態様は段落関連情報決定方法であって、ドキュメントを決定し、前記ドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別し、前記ドキュメントにおいて第1ロケーションを選択し、前記第1ロケーション周囲の構造要素を決定し、前記周囲構造要素を特徴付け、非周囲構造要素を特徴付け、前記周囲構造要素及び前記非周囲構造要素の特徴付けに基づいて、少なくとも1つの追加ドキュメントを前記周囲構造要素と関連付ける。
本発明の第2の態様は、第1の態様の段落関連情報決定方法であって、前記構造要素が、明示的情報又は暗示的情報に基づいて決定される。
本発明の第3の態様は、第2の態様の段落関連情報決定方法であって、前記暗示的情報が、分析理論に基づいて決定される。
本発明の第4の態様は、第3の態様の段落関連情報決定方法であって、前記分析理論が、言語談話モデル(LDM)、統一言語談話モデル(ULDM)、談話構造理論(DST)、修辞構造理論(RST)、及び構造談話表示理論(SDRT)のうちの少なくとも1つである。
本発明の第5の態様は、第1の態様の段落関連情報決定方法であって、前記第1ロケーションが、手動及びプログラム制御のうちの少なくとも1つに基づいて選択される。
本発明の第6の態様は、第5の態様の段落関連情報決定方法であって、前記第1ロケーションの前記手動選択が、明示的ユーザ入力及び暗示的ユーザ入力のうちの少なくとも1つに基づく。
本発明の第7の態様は、第1の態様の段落関連情報決定方法であって、前記構造要素の特徴付けが、潜在意味分析及び代表ベクトルの類似性のうちの少なくとも1つに基づく。
本発明の第8の態様は、第1の態様の段落関連情報決定方法であって、前記少なくとも1つの追加ドキュメントが、前記周囲構造要素との類似性による特徴付け及び前記非周囲構造要素との相違性による特徴付けに基づく。
本発明の第9の態様は、第1の態様の段落関連情報決定方法であって、前記追加ドキュメントが、人間が感知可能な情報を含む。
本発明の第10の態様は、第9の態様の段落関連情報決定方法であって、前記人間が感知可能な情報が、テキスト情報、オーディオ情報、及びビデオ情報のうちの少なくとも1つである。
本発明の第11の態様は、第1の態様の段落関連情報決定方法であって、前記決定されたドキュメントが、テキスト情報、オーディオ情報、及びビデオ情報のうちの少なくとも1つを含む。
本発明の第12の態様は関連情報決定装置であって、ドキュメント・リポジトリからドキュメントを取り出す、入出力手段と、前記取り出されたドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別する、ドキュメント構造マネジャーと、選択された第1ロケーション周囲の構造要素及び非周囲構造要素を識別する、構造要素マネジャーと、前記周囲構造要素及び前記非周囲構造要素を特徴付ける、特徴付けマネジャーと、前記周囲構造要素及び前記非周囲構造要素の特徴付けに基づいて、追加ドキュメントを前記取り出されたドキュメントにおける前記第1ロケーションと選択的に関連付ける、探索マネジャーと、を備える。
本発明の第13の態様は、第12の態様の関連情報決定装置であって、前記構造要素マネジャーが、明示的情報又は暗示的情報に基づいて前記構造要素を決定する。
本発明の第14の態様は、第13の態様の関連情報決定装置であって、前記暗示的情報が、分析理論に基づいて決定される。
本発明の第15の態様は、第14の態様の関連情報決定装置であって、前記分析理論が、言語談話モデル(LDM)、統一言語談話モデル(ULDM)、談話構造理論(DST)、修辞構造理論(RST)、及び構造談話表示理論(SDRT)のうちの少なくとも1つである。
本発明の第16の態様は、第12の態様の関連情報決定装置であって、前記第1ロケーションが、手動及びプログラムのうちの少なくとも1つに基づいて選択される。
本発明の第17の態様は、第16の態様の関連情報決定装置であって、前記第1ロケーションの前記手動選択が、明示的ユーザ入力及び暗示的ユーザ入力のうちの少なくとも1つに基づく。
本発明の第18の態様は、第12の態様の関連情報決定装置であって、前記構造要素の特徴付けが、潜在意味分析及び表現ベクトルの類似性のうちの少なくとも1つに基づく。
本発明の第19の態様は、第12の態様の関連情報決定装置であって、少なくとも1つの前記追加ドキュメントが、前記周囲構造要素との類似性による特徴付け及び前記非周囲構造要素との相違性による特徴付けに基づく。
本発明の第20の態様は、第12の態様の関連情報決定装置であって、前記追加ドキュメントが、人間が感知可能な情報を含む。
本発明の第21の態様は、第20の態様の関連情報決定装置であって、前記人間が感知可能な情報が、テキスト情報、オーディオ情報、及びビデオ情報のうちの少なくとも1つである。
本発明の第22の態様は、第12の態様の関連情報決定装置であって、決定された前記ドキュメントが、テキスト情報、オーディオ情報、及びビデオ情報のうちの少なくとも1つを含む。
本発明の第23の態様は、関連情報を決定する方法をコンピュータに実行させるプログラムであって、ドキュメントを決定するステップと、前記ドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別するステップと、前記ドキュメントにおいて第1ロケーションを選択するステップと、前記第1ロケーション周囲の構造要素を決定するステップと、前記周囲構造要素を特徴付けるステップと、非周囲構造要素を特徴付けるステップと、前記周囲構造要素及び前記非周囲構造要素の特徴付けに基づいて、少なくとも1つの追加ドキュメントを前記周囲構造要素と関連付けるステップと、を含む。
本発明では、ドキュメントを決定し、前記ドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別し、前記ドキュメントにおいて第1ロケーションを選択し、前記第1ロケーション周囲の構造要素を決定し、前記周囲構造要素を特徴付け、非周囲構造要素を特徴付け、前記周囲構造要素及び前記非周囲構造要素の特徴付けに基づいて、少なくとも1つの追加ドキュメントを前記周囲構造要素と関連付ける、ようにしているので、ドキュメント構造に基づいて関連情報(追加ドキュメント)を決定することができる。
図1は、本発明による一例としての、関連情報を決定するシステムの概略図である。通信可能なパーソナル・コンピュータ300が、通信リンク99を介して、関連情報決定システム100及び情報リポジトリ200に接続されている。この情報リポジトリ200は、ドキュメント1000〜1002にアクセスする。
通信可能なパーソナル・コンピュータ300のユーザは、情報リポジトリ200からドキュメント1000を選択する。この選択されたドキュメント1000は、通信リンク99を介して、関連情報決定システム100へ送信される。この選択されたドキュメント1000に対して、少なくとも2つの構造要素が決定される。構造要素とは、構造的に関連した単位(談話分析理論におけるアトミック・オブジェクト)のグループである。従って、一例としての実施形態では、アトミック単位は、談話分析の統一言語談話モデル(ULDM:Unified Linguistic Discourse Model)理論によって定義された談話構成要素である。様々な他の例としての実施形態では、本発明の範囲を逸脱しない限り、談話分析理論によって特定された文、段落、又はその他の単位を用いてもよい。
通信可能なパーソナル・コンピュータ300のユーザは、この選択されたドキュメント1000内において第1ロケーションを選択する。この選択された第1ロケーションの周囲にある構造要素が、談話分析理論に基づいて決定される。様々な例としての実施形態では、選択されたドキュメント1000内のロケーションは、語若しくは位置を強調表示する、マウス・ジェスチャーを用いる、様々なその他の既知の又はこれから開発される入力若しくは選択方法を用いる、ことなどによって、選択される。次に、この選択された語若しくは位置の周囲にある構造要素が選択される。一例としてのULDMに基づいた実施形態では、第1ロケーションが従属、同格、又はn進(n−ary)の談話単位内に位置している場合、この第1ロケーションの周囲にある従属、同格、又はn進の談話単位が、周囲構造要素として選択される。
この周囲構造要素の特徴付けが決定される。この周囲構造要素の特徴付けとしては、例えば、構造要素における語句の頻度に基づいたベクトルの生成、構造要素に対する潜在意味分析(LSA:latent semantic analysis)の実行、及び、ドキュメント構造に関する明示的若しくは暗示的情報を用いるあらゆる既知の又はこれから開発される測定基準などが挙げられるが、これらに限定されない。従って、一例としての実施形態では、タイトル、特定の提示スタイル又はドキュメント作成者のシーケンスを明示的に使用することで、ドキュメント構造を明示している。ドキュメント構造を決定するシステム及び方法については、特許文献1(この特許出願は、参照により、その全体が本明細書中に組み込まれる)に、さらに説明されている。暗示的ドキュメント構造とは、ドキュメントに示された言語的又は視覚的情報やドキュメント内容の分析などから得られる構造である。
ドキュメントにおけるその他の又は非周囲構造要素のそれぞれの特徴付けが決定される。上述したように、非周囲構造要素の特徴付けは、語句の発生頻度、潜在意味分析、及び、様々な既知の若しくはこれから開発される測定基準決定方法などに基づく。
この周囲構造要素及び非周囲構造要素の特徴付けに基づいて、追加ドキュメントが決定される。一例としての本発明による実施形態では、第1セットのドキュメントが、周囲構造要素との類似性に基づいて選択される。これら第1セットのドキュメントにおける、非周囲構造要素とも類似するドキュメントは、追加ドキュメントのリストから削除されたり格下げされたりする。このように削減された追加ドキュメントのリストは、第1ドキュメントにおけるユーザが選択したロケーションには類似しているが、第1ドキュメントのその他の部分とは相違している、ドキュメントを示す。様々な例としての本発明による実施形態では、ドキュメントにおける第1ロケーションは、テキスト又は画像に基づいた情報と関連付けられる。しかし、さらに別の実施形態では、この第1ロケーションは、オーディオ、ビデオ、及び、類似性測度が計算可能なあらゆるその他のタイプの情報などと関連付けられる。
次に、周囲構造要素と類似した追加ドキュメントの削減されたリストは、通信リンク99を介して、通信可能なパーソナル・コンピュータ300のユーザに送信される。さらに別の例としての実施形態では、周囲構造要素と最も類似した追加ドキュメントが、選択された第1ロケーションと自動的に関連付けられる。従って、一実施形態では、この選択された第1ロケーションを表す画像が識別される。
図2は、一例としての、ドキュメント構造に基づいて関連情報を決定する方法である。処理は、ステップS100で開始し、すぐステップS200に進む。ステップS200では、ドキュメントが決定される。このドキュメントは、ドキュメント・リポジトリ、ハイパーテキスト転送プロトコル(HTTP:hyper-text transfer protocol)サーバによって提供されるページの集合、あらゆるその他の既知の若しくはこれから開発される情報リポジトリなどから選択されてよい。ドキュメントが決定されると、制御はステップS300へ進む。
ステップS300では、このドキュメントにおける1つ以上の構造要素が決定される。この構造要素は、ポラニーらの統一言語談話モデル(ULDM)、修辞構造理論(RST:Rhetorical Structures Theory)、談話構造理論(DST:Discourse Structures Theory)、構造談話表示理論(SDRT:Structure Discourse Representation Theory)、構造要素間の支配関係を識別する様々なその他の既知の若しくはこれから開発される理論などに基づいて決定される。構造要素が決定されると、制御はステップS400へ進み、このステップS400では、ドキュメントにおける第1ロケーションが決定される。
第1ロケーションは、手動で、又は、プログラム制御によって自動的に決定される。明示的ユーザ動作(例えば、マウス又はペン・ジェスチャー、キーボード入力、強調表示など)を用いることにより、第1ロケーションを手動で選択することができる。しかしながら、暗示的ユーザ入力を用い、視線若しくは頭部追跡、その他の関心を示すものに基づいて、第1ロケーションを選択することもできる。この第1ロケーションは、画像、テキストの一部、ビデオ・ファイル、オーディオ・ファイル、類似性測度が計算可能なあらゆるその他のタイプの情報などを示し得る。第1ロケーションが決定されると、制御はステップS500へ進む。
ステップS500では、この第1ロケーションの周囲にある構造要素が選択される。例えば、ULDMに基づいた一例としての実施形態では、この構造要素は、ULDMによって識別された談話構成要素のうちの1つである。しかしながら、本発明の実施においては、文、段落、要素間の支配関係を有するあらゆる既知の若しくはこれから識別される構造要素などを用いてもよい。
別の例としての実施形態では、このような構造要素は、修辞構造理論、談話構造理論、構造要素間の支配関係を識別することのできる様々なその他の分析理論などに基づいて決定される。従って、一例としての実施形態では、第1ロケーションに関連付けられた周囲構造要素及び非周囲構造要素は、修辞構造理論によって識別された核要素及び周辺要素に基づく。周囲構造要素が決定されると、制御はステップS600へ進む。
ステップS600では、この周囲構造要素の特徴付けが決定される。様々な実施形態では、この周囲構造要素の特徴付けは、潜在意味分析で構造要素を分析することによって決定される。潜在意味分析により、この周囲構造要素を表す語がもたらされる。次に、この構造要素のベクトル表現が決定される。周囲構造要素が特徴付けられると、制御はステップS700へ進む。
ステップS700では、非周囲構造要素の特徴付けが決定される。この特徴付けは、潜在意味分析、又は、非周囲構造要素の表現を決定するあらゆるその他の方法に基づく。非周囲構造要素の特徴付けが決定されると、制御はステップS800へ進み、このステップS800では、周囲構造要素及び非周囲構造要素の特徴付けに基づいて、少なくとも1つの追加ドキュメントが決定される。
一実施形態では、周囲構造要素に最も類似し且つ非周囲構造要素と最も相違するドキュメントを選択することによって、少なくとも1つの追加ドキュメントが決定される。より周囲構造要素に類似し且つより非周囲構造要素に類似しないドキュメントが選択されるのは、このようなドキュメントが、周囲構造要素の情報内容と非周囲構造要素の情報内容との間における意味上の相違を信号で伝えるのに有用である可能性が最も高いからである。少なくとも1つの追加ドキュメントが選択されると、制御はステップS900へ進む。
ステップS900では、セッションが終了したかどうかに関して判断がなされる。セッションが終了していないと判断された場合、制御はすぐにステップS400へジャンプする。ユーザがセッションを終了したと判断されるまで、ステップS400〜S900が繰り返される。次に、制御はステップS1000へ進み、処理が終了する。
図3は、本発明による一例としての、関連情報を決定するシステム100である。通信可能なパーソナル・コンピュータ300が、通信リンク99を介して、関連情報決定システム100、及び、ドキュメント1000〜1002にアクセスする情報リポジトリ200に接続されている。
通信可能なパーソナル・コンピュータ300のユーザは、情報リポジトリ200からドキュメント1000を選択する。この選択されたドキュメント1000は、通信リンク99を介して送信され、通信可能なパーソナル・コンピュータ300に表示される。通信可能なパーソナル・コンピュータ300のユーザは、強調表示する、マウス・クリックを用いる、音声選択を用いる、様々な既知の又はこれから開発される入力若しくは選択方法などを用いる、ことによって、この選択されたドキュメント1000内において第1ロケーションを選択する。この第1ロケーションは、画像、テキスト、オーディオ、ビデオ、又は、あらゆるその他の既知の若しくはこれから開発されるタイプの情報と関連付けられ得る。
この第1ロケーション情報及び選択されたドキュメント1000は、通信リンク99を介して、関連情報決定システム100の入出力部10へ送信される。この選択されたドキュメント1000及び第1ロケーション情報は、メモリ20に格納される。次に、プロセッサ30がドキュメント構造マネジャー40を起動させることによって、この格納されたドキュメントの構造が決定される。一実施形態では、このドキュメントの従属、n進(n−ary)、及び同格の談話構成要素が、談話分析のULDM理論によって識別される。しかし、本発明の実施においては、修辞構造理論(RST)、談話構造理論(DST)、構造談話表示理論(SDRT)、選択されたドキュメント1000における支配構造要素及び従属構造要素を決定するあらゆる既知の若しくはこれから開発される方法などを用いてもよいことは明らかである。
プロセッサ30は、この格納されたロケーション情報をメモリ20から取り出し、構造要素マネジャー50を起動させ、これにより、この選択されたドキュメント1000におけるロケーション周囲の構造要素が決定される。プロセッサ30が特徴付けマネジャー60を起動させることによって、周囲構造要素及び非周囲構造要素の特徴付けが決定される。様々な実施形態では、この特徴付けは潜在意味分析や代表ベクトルなどに基づく。
次に、プロセッサ30が探索マネジャー70を起動させることにより、この周囲構造要素及び非周囲構造要素の特徴付けに基づいて、追加ドキュメントが決定される。例えば、一実施形態では、この探索マネジャー70は、周囲構造要素の特徴付けとの類似性及び非周囲構造要素の特徴付けとの相違性に基づいて、追加ドキュメントを識別する。様々な別の実施形態では、N個の最適な追加ドキュメントが第1ロケーションと関連付けられる。Nは、0よりも大きければ、どんな数であってもよい。例えば、N=3である場合、3つの追加ドキュメントが、第1ロケーションと関連付けられる候補ドキュメントとして提示される。
図4は、一例としての、3つの構造要素410〜430から成るドキュメント400である。第1構造要素410は、テキスト・フレーズ“Jane's first trip to Mexico(ジェーンのメキシコへの最初の旅行)”を含む。第2構造要素420は、フレーズ“Ted and Jane's marriage(テッドとジェーンの結婚)”を含む。第3構造要素430は、フレーズ“Jane's last trip to Europe(ジェーンのヨーロッパへの最後の旅行)”を含む。
本発明による一例としての実施形態では、ユーザは、第2構造要素420内の“Jane's”の部分を指し示す、強調表示する、又はその他の方法で選択することによって、第1ロケーション440を示す。この選択された語“Jane's”の周囲にある第2構造要素が識別される。ベクトル又は概念表現が、この第2若しくは周囲構造要素420と関連付けられる。このベクトル又は概念表現は、語句“Ted and Jane's marriage”と関連付けられた意味を捉える。
概念ベクトル若しくは意味表現は、周囲でない第1構造要素410及び第3構造要素430とも関連付けられる。この概念ベクトル若しくは意味表現は、第1フレーズからは“Jane's first trip to Mexico”の意味を、第3フレーズからは“Jane's last trip to Europe”の意味を捉える。このベクトル若しくは概念表現を用いることによって、意味が周囲構造要素とは類似するが非周囲構造要素とは相違する追加ドキュメントが選択され、第1ロケーションと関連付けられる。従って、この追加ドキュメントは、概念的に、“Ted and Jane's marriage”について記載のドキュメントとは類似するが、“Jane's first trip to Mexico”及び“Jane's last trip to Europe”について記載のドキュメントとは相違する。これにより、ドキュメントの概念発達に適合する追加ドキュメントの選択が容易になる。例えば、様々な実施形態では、本発明によるシステム及び方法を用いて、選択された概念を示すピクチャが提案されている。同様に、別の実施形態では、特定の画像を示すテキスト・キャプションが提案されている。
図5は、本発明による一例としての、概念ベクトルを格納するデータ構造500を示している。この概念ベクトルを格納するデータ構造500は、情報ソース部分510及び概念ベクトル部分520から成る。この概念ベクトルを格納するデータ構造500の1行目は、値“INFO.ELEMENT[1]”及び“Jane/trip/Mexico”を含む。この値は、第1構造要素“JANE'S FIRST TRIP TO MEXICO”において最も主要な要素から生成されたベクトル若しくは意味表現を示す。このベクトル若しくは意味表現は、主要概念が“Jane”、“trip”、及び“Mexico”であることを示している。これにより、ドキュメントにおける第1ロケーション周囲の構造要素と比較するための表現がもたらされる。
この概念ベクトルを格納するデータ構造500の2行目は、値“INFO.ELEMENT[2]”及び“Ted/Jane/marriage”を含む。この値は、“TED AND JANE'S MARRIAGE”として識別される第2構造要素における主要概念から生成された意味表現を示す。
この概念ベクトルを格納するデータ構造500の3行目は、値“INFO.ELEMENT[3]”及び“Jane/trip/Europe”を含み、この値は、第3構造要素“JANE'S LAST TRIP TO EUROPE”の主要な要素を示す。第1構造要素と第3構造要素は両方とも“Jane”による“trip”に関するので、この第3概念ベクトル若しくは意味表現は、第1概念ベクトルと類似している。3つの構造要素は全て“Jane”に関しているが、第2構造要素は“marriage”及び“Ted”という追加概念にも関する。また、第3構造要素は“trip”及び“Europe”という追加概念にも関する。
従って、“Ted”、“Jane”、及び“marriage”という概念に関すると共に、“trip”、“Mexico”、及び“Europe”という概念と最も相違する追加ドキュメントが、情報リポジトリから選択される。例えば、“Jane's trips to Mexico and Europe(ジェーンのメキシコ及びヨーロッパへの旅行)”からの概念ベクトルと関連付けられたピクチャを提示する可能性は低くなる一方、“Jane's marriage to Ted(ジェーンのテッドとの結婚)”を説明する概念ベクトルで注釈を付けたピクチャを選択する可能性は高くなる。別の例としての実施形態では、最も可能性の高いドキュメントが、周囲構造要素と動的に関連付けられる。
図6は、本発明による一例としての、ドキュメント構造に基づいて関連情報を決定するユーザ・インタフェースを示している。1文目は、テキストの第1構造要素730を含む。この第1構造要素730は、“Jane/Ted/San Francisco”という概念ベクトル若しくは表現と関連付けられている。この概念ベクトルは、フレーズ“Ted and Jane Doe met in San Francisco in 1981.(テッド・ドウとジェーン・ドウは1981年にサンフランシスコで出会った。)”に関する。
2文目は、第2構造要素731“They were married in New York City in 1984.(彼らは1984年にニューヨーク市で結婚した。)”を含む。この第2構造要素731は、概念ベクトル“Jane/Ted/marriage”と関連付けられている。様々な例としての実施形態では、この概念ベクトルは、その構造要素における“Jane/Ted”の代わりに“they”を用いる。3文目は、第3構造要素732“Ted and Jane now live in Maine with their two children, Jessica and Timothy.(テッドとジェーンは現在2人の子供ジェシカとティモシーと一緒にメーン州に住んでいる。)”を含む。この第3構造要素732は、概念ベクトル“Ted/Jane/live/Maine”と関連付けられている。このドキュメント710内の第1ロケーション740が、“married”の部分を強調表示することによって決定される。この第1ロケーションは、第2構造要素731によって囲まれている。
本発明による一例としての実施形態では、第2構造要素731を特徴付けるベクトル若しくは意味表現、並びに、周囲でない第1構造要素730及び第3構造要素732を特徴付けるベクトル若しくは意味表現を用いることによって、追加ドキュメント721〜723が識別される。つまり、追加ドキュメントおよび追加ドキュメントの一部などは、ベクトル若しくは意味表現と関連付けられている。第1ロケーション740の周囲にある第2構造要素731のベクトル若しくは意味表現に類似し、且つ、周囲でない第1構造要素730及び第3構造要素732の概念ベクトル若しくは意味表現と相違する、追加ドキュメントが選択される。N個の最適な追加ドキュメント又はドキュメント部分が、表示されたり、第1ロケーション740と自動的に関連付けられたりする。
図7は、本発明による一例としての、ドキュメント構造に基づいて関連画像情報を決定するユーザ・インタフェースを示している。ソース・ドキュメント810が決定され、構造要素にセグメント化される。様々な実施形態では、このソース・ドキュメントは、言語分析理論(例えば、ULDM、RST、DST、SDRT)、及び、ドキュメントにおいて構造要素を決定するあらゆる既知の若しくはこれから開発される方法などを用いて、セグメント化される。
ユーザは、マウス若しくはペン・ジェスチャー、目の動き、音声認識、及び、あらゆるその他の入力若しくは選択方法などを用いて、ドキュメント810内の第1ロケーション840を示す。この示され、選択された第1ロケーション840の周囲にある構造要素831が決定される。また、周囲構造要素及び非周囲構造要素の特徴付けも決定される。周囲構造要素831に類似し且つ非周囲構造要素830及び832と相違するものとして特徴付けられる追加画像ドキュメント821〜823の探索が行われる。これらの画像ドキュメント821〜823には、手動で又は自動的に注釈を付けてもよい。結果として得られた追加画像ドキュメントは、周囲構造要素831の意味を表す。
図8は、一例としての、テキスト内に埋め込まれた第1画像910(image 1)及び第2画像(image 2)920を含むドキュメントを示している。第1画像910は、フレーズ“The Golden Gate Bridge links the city and county of San Francisco with Marin County.(ゴールデン・ゲート・ブリッジはサンフランシスコ市及び郡とマリン郡とをつなぐ。)”内に埋め込まれている。本発明による一例としての実施形態では、第1画像910が、ドキュメント900における第1ロケーションとして選択される。この第1画像910の周囲にある構造要素が決定される。次に、概念ベクトル若しくは意味表現が決定され、この第1画像910と関連付けられる。一例としての実施形態では、この概念ベクトルは、“Golden Gate Bridge”911、“links”912、“San Francisco”913、及び“Marin County”914のような、下線を引いた語句から成る。この概念ベクトルは、画像の注釈やメタデータなどに基づいて、自動的に定義されてもよい。
ドキュメント内に埋め込まれた第2画像920が選択される。この第2画像920の周囲にある構造要素が決定される。この場合、周囲構造要素は、2つのフレーズ・ユニット“The roadway of the bridge is 246 feet above sea level while the towers rise to 746 feet. The roadway is suspended from the towers via suspension cables.(このブリッジの道路は海抜246フィートであるが塔は746フィートに達する。道路は塔から吊りケーブルによって吊り下げられている。)”である。この第2画像920に対する概念ベクトルの一例としては、語句“Golden Gate Bridge”911、“towers”921、“rise”922、及び“746 feet”923が挙げられる。概念ベクトルは、画像の意味若しくは概念を説明する。これにより、他のドキュメントを作成している又は見ているときに、画像をより容易に再使用することができる。
図9は、本発明による一例としての、画像概念ベクトルを格納するデータ構造1000を示している。この画像概念ベクトルを格納するデータ構造1000は、画像識別子部分1010、情報ソース部分1020、及び概念ベクトル部分1030から成る。
この画像概念ベクトルを格納するデータ構造1000の1行目は、画像識別子部分1010に値“IMAGE1”を含む。この値は、関連内容を決定するシステムに対し、一意的にその画像を識別する。
この画像概念ベクトルを格納するデータ構造1000の情報ソース部分1020は、値“INFO.ELEMENT[1]”=“The Golden Gate Bridge links the city and county of San Francisco with Marin County.”を含む。これは、“IMAGE1”が埋め込まれた構造要素を示す。
概念ベクトル部分1030は、値“GOLDEN GATE BRIDGE, LINKS, SAN FRANCISCO, MARIN COUNTY”を含む。これは、他の関係においてその画像を表すのに用いられる概念ベクトルを示す。この概念ベクトルは、“IMAGE1”周囲の構造表現に基づいている若しくは“IMAGE1”周囲の構造表現から得られる。
画像概念ベクトルを格納するデータ構造1000の最終行は、画像識別子部分1010に、システムに対して一意的にその画像を識別する値“IMAGE2”を含む。
この画像概念ベクトルを格納するデータ構造1000の情報ソース部分1020は、値“INFO.ELEMENT[99]”=“The roadway of the bridge is 246 feet above sea level while the towers rise to 746 feet. The roadway is suspended from the towers via suspension cables.”を含む。これは、“IMAGE2”が埋め込まれた2つのフレーズの構造要素を示す。
概念ベクトル部分1030は、値“GOLDEN GATE BRIDGE, TOWERS, RISE, 746 FEET”を含む。これは、概念ベクトルが“IMAGE2”を表すのに用いられることを示し、この概念ベクトルは、ゴールデン・ゲート・ブリッジの塔がどのぐらい高いかに関する情報をその画像が示すことを示す。
関連情報決定システム100の構成要素10〜70のそれぞれは、適切にプログラムされた汎用コンピュータの一部として実施されてもよい。或いは、先に略述した関連情報決定システム100の構成要素10〜70は、ASIC内における物理的に別個のハードウェア回路として、又は、FPGA、PDL、PLA、若しくはPALを用いて、又は、個別論理素子若しくは個別回路素子を用いて、実施されてもよい。先に略述した関連情報決定システム100の構成要素10〜70のそれぞれが採る特定形式は、設計上の選択であり、当業者には明白且つ予測可能であろう。
さらに、関連情報決定システム100及び上述した様々な構成要素のそれぞれは、プログラムされた汎用コンピュータ、専用コンピュータ、マイクロプロセッサなどで実行する、ソフトウェア・ルーチン、マネジャー、又はオブジェクトとして、実施されてもよい。この場合、関連情報決定システム100及び上述した様々な構成要素のそれぞれは、通信ネットワークに埋め込まれた1つ以上のルーチン、サーバに備わるリソースなどとして、実施することができる。また、関連情報決定システム100及び上述した様々な回路は、この関連情報決定システム100をソフトウェア及びハードウェア・システム(例えば、ウェブ・サーバ若しくはクライアント・デバイスのハードウェア及びソフトウェア・システム)に物理的に組み込むことによって、実施することもできる。
図3に示したようなメモリ20は、可変の揮発性若しくは不揮発性メモリ、又は、不可変若しくは固定メモリを、適切であればどのように組み合わせて用いて実施してもよい。可変メモリは、揮発性であろうと不揮発性であろうと、スタティック又はダイナミックRAM、フロッピー(登録商標)・ディスク及びディスク・ドライブ、書き込み可能又は書き換え可能光ディスク及びディスク・ドライブ、ハード・ドライブ、フラッシュ・メモリなどのいずれか1つ以上を用いて実施してもよい。同様に、不可変若しくは固定メモリは、ROM、PROM、EPROM、EEPROM、光ROMディスク(例えば、CD−ROM又はDVD−ROMディスク)及びディスク・ドライブなどのうちのいずれの1つ以上を用いて実施してもよい。
図1及び図3に示した通信リンク99はそれぞれ、通信デバイスを関連情報決定システム100に接続するあらゆる既知の又はこれから開発されるデバイス若しくはシステムであってよく、例としては、直結ケーブル接続、広域ネットワーク若しくはローカル・エリア・ネットワークを介する接続、イントラネットを介する接続、インターネットを介する接続、又は、あらゆるその他の分散処理ネットワーク若しくはシステムを介する接続が挙げられる。通常、通信リンク99は、デバイスを接続して通信を容易にするのに使用可能なあらゆる既知の又はこれから開発される接続システム若しくは構造であってよい。
さらに、当然のことながら、通信リンク99は、ネットワークへの有線リンクであっても無線リンクであってもよい。このネットワークは、ローカル・エリア・ネットワーク、広域ネットワーク、イントラネット、インターネット、又は、あらゆるその他の分散処理及び格納ネットワークであってよい。
本発明を、先に略述した例としての実施形態と関連させて説明してきたが、明白なことに、多数の代替例、改良例、及び変形例が当業者には明らかであろう。従って、上述したような本発明の例としての実施形態は、例示を意図するものであって、限定を意図するものではない。本発明の精神及び範囲を逸脱しない限り、様々な変更を行ってもよい。
本発明による一例としての、関連情報を決定するシステムを示す概略図である。 本発明による一例としての、ドキュメント構造に基づいて関連情報を決定する方法を示すフローチャートである。 本発明による一例としての、関連情報を決定するシステムを示す図である。 一例としての、3つの構造要素から成るドキュメントを示す図である。 本発明による一例としての、概念ベクトルを格納するデータ構造を示す図である。 本発明による一例としての、ドキュメント構造に基づいて関連情報を決定するユーザ・インタフェースを示す図である。 本発明による、ドキュメント構造に基づいて関連画像情報を決定するユーザ・インタフェースを示す第2概略図である。 一例としての、テキスト内に埋め込まれた第1画像及び第2画像を含むドキュメントを示す図である。 本発明による一例としての、画像概念ベクトルを格納するデータ構造を示す図である。
符号の説明
99 通信リンク
100 関連情報決定システム
200 情報リポジトリ
300 パーソナル・コンピュータ
400、710、810、900 ドキュメント
410、420、430、730、731、732、830、831、832 構造要素
440、740、840 第1ロケーション
500、1000 データ構造
721、722、723、821、822、823 追加ドキュメント

Claims (10)

  1. プロセッサが、入出力部を介してドキュメントを取得してメモリに記憶し、
    前記プロセッサが、前記ドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別し、
    前記プロセッサが、ユーザによる、前記ドキュメントにおける第1ロケーションの選択を前記入出力部を介して受信するか、もしくは、プログラムにもとづいて該第1ロケーションの選択を実行し、
    前記プロセッサが、前記第1ロケーションの周囲構造要素を決定し、
    前記プロセッサが、前記周囲構造要素を特徴付け、
    前記プロセッサが、前記第1ロケーションの非周囲構造要素を特徴付け、
    前記プロセッサが、前記周囲構造要素および前記非周囲構造要素の特徴付けにもとづいて、前記周囲構造要素と関連付ける少なくとも1つの追加ドキュメント候補のリストを生成し、
    前記リスト内の少なくとも1つの前記追加ドキュメントを前記周囲構造要素と関連付け
    前記周囲構造要素は、修辞構造理論によって識別される核要素および周辺要素にもとづいて決定され、
    前記関連付けにおいて、前記周囲構造要素に類似しているドキュメントが前記追加ドキュメント候補のリストに追加され、前記非周囲構造要素に類似しているドキュメントは前記追加ドキュメント候補のリストから除去され、
    前記追加ドキュメントはオーディオ情報およびビデオ情報の少なくとも一方である、
    段落関連情報決定方法
  2. 前記周囲構造要素および前記非周囲構造要素の特徴付けが、潜在意味分析及び代表ベクトルの類似性のうちの少なくとも1つにもとづく、請求項1に記載の段落関連情報決定方法。
  3. ドキュメント・リポジトリからドキュメントを取り出す入出力手段と、
    前記取り出されたドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別するドキュメント構造マネジャーと、
    選択された第1ロケーションの周囲構造要素及び非周囲構造要素を識別する構造要素マネジャーと、
    前記周囲構造要素および前記非周囲構造要素を特徴付ける特徴付けマネジャーと、
    前記周囲構造要素および前記非周囲構造要素の特徴付けにもとづいて、前記周囲構造要素と関連付ける少なくとも1つの追加ドキュメント候補のリストを生成し、該リスト内の少なくとも1つの該追加ドキュメントを該周囲構造要素と関連付ける、探索マネジャーと、
    を備え、
    前記周囲構造要素は、修辞構造理論によって識別される核要素および周辺要素にもとづいて決定され、
    前記関連付けにおいて、前記周囲構造要素に類似しているドキュメントが前記追加ドキュメント候補のリストに追加され、前記非周囲構造要素に類似しているドキュメントは前記追加ドキュメント候補のリストから除去され、
    前記追加ドキュメントはオーディオ情報およびビデオ情報の少なくとも一方である、
    関連情報決定装置
  4. 前記第1ロケーションが、手動及びプログラムのうちの少なくとも1つにもとづいて選択される、請求項に記載の関連情報決定装置。
  5. 前記第1ロケーションの前記手動にもとづく選択が、明示的ユーザ入力及び暗示的ユーザ入力のうちの少なくとも1つにもとづく、請求項に記載の関連情報決定装置。
  6. 前記周囲構造要素および前記非周囲構造要素の特徴付けが、潜在意味分析及び表現ベクトルの類似性のうちの少なくとも1つにもとづく、請求項3〜5のいずれか一項に記載の関連情報決定装置。
  7. ドキュメントを決定するステップと、
    前記ドキュメントにおいて支配関係を有する少なくとも2つの構造要素を識別するステップと、
    前記ドキュメントにおいて第1ロケーションを選択するステップと、
    前記第1ロケーションの周囲構造要素を決定するステップと、
    前記周囲構造要素を特徴付けるステップと、
    前記第1ロケーションの非周囲構造要素を特徴付けるステップと、
    前記周囲構造要素及び前記非周囲構造要素の特徴付けにもとづいて、前記周囲構造要素と関連付ける少なくとも1つの追加ドキュメント候補のリストを生成し、該リスト内の少なくとも1つの該追加ドキュメントを該周囲構造要素と関連付けるステップと、
    を含み、
    前記周囲構造要素は、修辞構造理論によって識別される核要素および周辺要素にもとづいて決定され、
    前記関連付けにおいて、前記周囲構造要素に類似しているドキュメントが前記追加ドキュメント候補のリストに追加され、前記非周囲構造要素に類似しているドキュメントは前記追加ドキュメント候補のリストから除去され、
    前記追加ドキュメントはオーディオ情報およびビデオ情報の少なくとも一方である、
    関連情報を決定する方法をコンピュータに実行させるプログラム
  8. 前記第1ロケーションが、手動及びプログラムのうちの少なくとも1つにもとづいて選択される、請求項7に記載のプログラム。
  9. 前記第1ロケーションの前記手動にもとづく選択が、明示的ユーザ入力及び暗示的ユーザ入力のうちの少なくとも1つにもとづく、請求項8に記載のプログラム。
  10. 前記周囲構造要素および前記非周囲構造要素の特徴付けが、潜在意味分析及び表現ベクトルの類似性のうちの少なくとも1つにもとづく、請求項7〜9のいずれか一項に記載のプログラム。
JP2006331307A 2005-12-12 2006-12-08 関連情報決定方法及び装置並びにプログラム Expired - Fee Related JP5098315B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/301,853 US7739279B2 (en) 2005-12-12 2005-12-12 Systems and methods for determining relevant information based on document structure
US11/301853 2005-12-12

Publications (2)

Publication Number Publication Date
JP2007164788A JP2007164788A (ja) 2007-06-28
JP5098315B2 true JP5098315B2 (ja) 2012-12-12

Family

ID=38174826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006331307A Expired - Fee Related JP5098315B2 (ja) 2005-12-12 2006-12-08 関連情報決定方法及び装置並びにプログラム

Country Status (2)

Country Link
US (1) US7739279B2 (ja)
JP (1) JP5098315B2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7296027B2 (en) * 2003-08-06 2007-11-13 Sbc Knowledge Ventures, L.P. Rhetorical content management with tone and audience profiles
US20080189608A1 (en) * 2007-01-31 2008-08-07 Nokia Corporation Method and apparatus for identifying reviewed portions of documents
US20100063965A1 (en) * 2007-04-27 2010-03-11 Ken Hanazawa Content processor, content processing method, and content processing program
US8712758B2 (en) 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
US8229730B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Indexing role hierarchies for words in a search index
US8280721B2 (en) * 2007-08-31 2012-10-02 Microsoft Corporation Efficiently representing word sense probabilities
US8463593B2 (en) * 2007-08-31 2013-06-11 Microsoft Corporation Natural language hypernym weighting for word sense disambiguation
US20090070322A1 (en) * 2007-08-31 2009-03-12 Powerset, Inc. Browsing knowledge on the basis of semantic relations
US8209321B2 (en) * 2007-08-31 2012-06-26 Microsoft Corporation Emphasizing search results according to conceptual meaning
US8229970B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Efficient storage and retrieval of posting lists
US8316036B2 (en) 2007-08-31 2012-11-20 Microsoft Corporation Checkpointing iterators during search
US8868562B2 (en) * 2007-08-31 2014-10-21 Microsoft Corporation Identification of semantic relationships within reported speech
US8346756B2 (en) * 2007-08-31 2013-01-01 Microsoft Corporation Calculating valence of expressions within documents for searching a document index
US20090255118A1 (en) * 2008-04-11 2009-10-15 General Electric Company Method of manufacturing mixers
US20120159329A1 (en) * 2010-12-16 2012-06-21 Yahoo! Inc. System for creating anchors for media content
US8626682B2 (en) * 2011-02-22 2014-01-07 Thomson Reuters Global Resources Automatic data cleaning for machine learning classifiers
US9430468B2 (en) * 2012-06-28 2016-08-30 Elsevier Bv Online peer review system and method
US10127230B2 (en) * 2015-05-01 2018-11-13 Microsoft Technology Licensing, Llc Dynamic content suggestion in sparse traffic environment
US11809825B2 (en) 2017-09-28 2023-11-07 Oracle International Corporation Management of a focused information sharing dialogue based on discourse trees
US10853574B2 (en) 2017-09-28 2020-12-01 Oracle International Corporation Navigating electronic documents using domain discourse trees
CN112106056A (zh) 2018-05-09 2020-12-18 甲骨文国际公司 构造虚构的话语树来提高回答聚敛性问题的能力
US11556698B2 (en) * 2019-10-22 2023-01-17 Oracle International Corporation Augmenting textual explanations with complete discourse trees
US11580298B2 (en) 2019-11-14 2023-02-14 Oracle International Corporation Detecting hypocrisy in text
US11501085B2 (en) 2019-11-20 2022-11-15 Oracle International Corporation Employing abstract meaning representation to lay the last mile towards reading comprehension
US11847420B2 (en) 2020-03-05 2023-12-19 Oracle International Corporation Conversational explainability
US11822599B2 (en) * 2020-12-16 2023-11-21 International Business Machines Corporation Visualization resonance for collaborative discourse

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145252A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP3695191B2 (ja) * 1998-12-25 2005-09-14 日本電気株式会社 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体
US7113943B2 (en) * 2000-12-06 2006-09-26 Content Analyst Company, Llc Method for document comparison and selection
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7398201B2 (en) * 2001-08-14 2008-07-08 Evri Inc. Method and system for enhanced data searching
US8635531B2 (en) * 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents
US7610190B2 (en) 2003-10-15 2009-10-27 Fuji Xerox Co., Ltd. Systems and methods for hybrid text summarization
US7403932B2 (en) * 2005-07-01 2008-07-22 The Boeing Company Text differentiation methods, systems, and computer program products for content analysis

Also Published As

Publication number Publication date
US7739279B2 (en) 2010-06-15
JP2007164788A (ja) 2007-06-28
US20070143098A1 (en) 2007-06-21

Similar Documents

Publication Publication Date Title
JP5098315B2 (ja) 関連情報決定方法及び装置並びにプログラム
JP6842167B2 (ja) 要約生成装置、要約生成方法及びコンピュータプログラム
US7076732B2 (en) Document processing apparatus having an authoring capability for describing a document structure
US10096145B2 (en) Method and system for assembling animated media based on keyword and string input
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
JP2010003015A (ja) 文書検索システム
JP7155758B2 (ja) 情報処理装置、情報処理方法及びプログラム
GB2570751A (en) Predicting style breaches within textual content
Basile et al. A platform for collaborative semantic annotation
Beck et al. Representation problems in linguistic annotations: Ambiguity, variation, uncertainty, error and bias
JP5455232B2 (ja) 画像選定装置、方法及びプログラム
JP2009064079A (ja) Webページに対して適合する画像を提示するシステム
JP2009181408A (ja) 単語意味付与装置、単語意味付与方法、プログラムおよび記録媒体
JP7434125B2 (ja) 文書検索装置、文書検索方法、及びプログラム
JP4787955B2 (ja) 対象文書からキーワードを抽出する方法、システムおよびプログラム
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
US7801723B2 (en) Systems and methods for user-interest sensitive condensation
JP4120597B2 (ja) 部分コンテンツ作成方法及び装置及びプログラム
RU2668721C1 (ru) Способ для отображения субтитров в процессе воспроизведения медиаконтента (варианты)
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
KR100832859B1 (ko) 모바일 웹 콘텐츠 서비스 시스템 및 그 방법
JP5214985B2 (ja) テキストセグメンテーション装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体
JP4934115B2 (ja) キーワード抽出装置、方法及びプログラム
JP2008171164A (ja) 分類付与支援装置及び方法及びプログラム
JP4646078B2 (ja) 相互に関係する固有表現の組抽出装置及びその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5098315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees