JP2005316999A5

JP2005316999A5 -

Info

Publication number: JP2005316999A5
Application number: JP2005118172A
Authority: JP
Filing date: 2005-04-15
Publication date: 2008-05-29
Anticipated expiration: 2025-04-15

Claims

エンハンストドキュメント取り出しのために、コンピュータによって実施されるコンテンツ伝播を実現するシステムおよび方法であって、
１つまたは複数のドキュメントを対象とする参照情報を識別するステップであって、前記参照情報が、前記１つまたは複数のドキュメントを含むデータソースと無関係のデータの１つまたは複数のソースから識別されるステップと、
前記参照情報の近くに配置されていて、前記参照情報を取り囲み前記参照情報に意味論的に又は文脈的に関係するメタデータを抽出するステップと、
前記１つまたは複数のドキュメントのうちの関連する複数のドキュメントのコンテンツに対する前記メタデータのそれぞれの特徴間の関連性を計算するステップと、
前記１つまたは複数のドキュメントのうちのそれぞれのドキュメントについて、前記メタデータの関連する部分に対し、前記それぞれの部分からの特徴の関連性と関連性スコアとを使用して、前記ドキュメントのオリジナルコンテンツの中にインデックスを作成するステップとを含み、
前記インデックス作成ステップにより、１つまたは複数のエンハンストドキュメントが生成され、
検索クエリに基づいて関連情報を見付けるために１つまたは複数のエンハンストドキュメントを解析するステップと、
関連性スコアに基づいて１つまたは複数のエンハンストドキュメントをランク付けするステップと、
検索クエリに基づいて１つまたは複数のエンハンストドキュメントについての断片的記述とランク付けされた結果を通信するステップと、
データの前記１つまたは複数のソースは、検索クエリログを含み、関連性を計算するステップは、さらに、
前記検索クエリログから、前記データソースを検索するために比較的大きな出現頻度（ＦＯＯ）を持つ検索クエリを識別するステップと、
検索クエリ結果からエンドユーザにより選択された、前記データソースからのアーティクルを決定するステップと、
選択されなかった前記検索クエリ内のアーティクルである欠損エンドユーザ選択を決定するステップとを含み、
前記欠損エンドユーザ選択を決定するステップは、さらに、層間リンクを使用して異種オブジェクトをクラスタリングし、前記異種オブジェクトの複数の特徴に対する重要性尺度を決定するステップを含み、前記異種オブジェクトは、類似のクエリの第１のクラスタと、関係するドキュメントの第２のクラスタとを含み、前記類似のクエリは前記検索クエリログで識別されており、前記類似のクエリは前記１つまたは複数のドキュメントを含む関連付けられた検索結果であり、前記関係するドキュメントは、前記関係する複数のドキュメントの個々の複数のドキュメントが前記複数の検索結果からエンドユーザにより選択されたか否かに関係なく前記検索結果で識別されることを特徴とする方法。
前記参照情報は、前記１つまたは複数のドキュメントのうちの１つのドキュメントに関連付けられているリンクまたは実質的に一意のドキュメントＩＤの少なくとも１つを含むことを特徴とする請求項１に記載の方法。
前記１つまたは複数のドキュメントは、知識ベースアーティクル、製品ヘルプ、タスク、または開発者データの１つを含むことを特徴とする請求項１に記載の方法。
データの前記１つまたは複数のソースは、サービス要求、ニュースグループポスティング、または検索クエリログの少なくとも１つを含むことを特徴とする請求項１に記載の方法。
前記メタデータは、前記１つまたは複数のドキュメントのうちの複数の関連付けられているドキュメントの意味上または文脈上の少なくとも１つに関係したものを有することを特徴とする請求項１に記載の方法。
前記メタデータは、ドキュメントのタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含むことを特徴とする請求項１に記載の方法。
前記１つまたは複数のエンハンストドキュメントのうちのそれぞれのエンハンストドキュメントについて、前記エンハンストドキュメントが生成された対応するオリジナルドキュメントがあることを特徴とする請求項１に記載の方法。
前記関連性を計算するステップは、前記１つまたは複数のドキュメントのうちの特定の１つのドキュメントが前記メタデータ内の文脈の範囲内で何回識別されるかに基づくことを特徴とする請求項１に記載の方法。
前記メタデータは、アーティクルタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含み、関連性を計算するステップは、さらに、前記アーティクルタイトルまたは製品問題の状況に重みを付けて、製品問題解決情報より高い関連性を示すステップを含むことを特徴とする請求項１に記載の方法。
関連性を計算するステップは、さらに、前記データソースのコンテンツ内で、前記コンテンツ内の他のメタデータ特徴の出現の頻度と比較してより大きな頻度で出現する前記メタデータの特徴に対し、より大きな関連性を割り当てるステップを含むことを特徴とする請求項１に記載の方法。
関連性を計算するステップは、さらに、前記１つまたは複数のドキュメントのうちの１つのドキュメント内で見つかった前記メタデータの特徴に対し、前記ドキュメントの経過期間に応じて、より大きな重みを割り当てるステップを含むことを特徴とする請求項１に記載の方法。
前記複数の特徴は、前記第１および第２のクラスタ内のそれぞれの複数のノードにより表され、前記複数のノードのそれぞれに対する前記重要性尺度は、前記第１および第２のクラスタ内のオブジェクト間の距離を測定する類似度関数に基づくことを特徴とする請求項１に記載の方法。
エンハンストドキュメント取り出しのためのコンテンツ伝播を実現するコンピュータ実行可能命令を格納したコンピュータ可読記録媒体であって、前記コンピュータ実行可能命令は、
１つまたは複数のドキュメントを対象とする参照情報を識別する命令であって、前記参照情報が、前記１つまたは複数のドキュメントを含むデータソースと無関係のデータの１つまたは複数のソースから識別される命令と、
前記参照情報の近くに配置されていて、前記参照情報を取り囲み前記参照情報に意味論的に又は文脈的に関係するメタデータを抽出する命令と、
前記１つまたは複数のドキュメントのうちの関連する複数のドキュメントのコンテンツに対する前記メタデータのそれぞれの特徴間の関連性を計算する命令と、
前記１つまたは複数のドキュメントのうちのそれぞれのドキュメントについて、前記メタデータの関連する部分に対し、前記それぞれの部分からの特徴の関連性と関連性スコアとを使用して、前記ドキュメントのオリジナルコンテンツの中にインデックスを作成する命令とを含み、
前記インデックス作成ステップにより、１つまたは複数のエンハンストドキュメントが生成され、
検索クエリに基づいて関連情報を見付けるために１つまたは複数のエンハンストドキュメントを解析する命令と、
関連性スコアに基づいて１つまたは複数のエンハンストドキュメントをランク付けする命令と、
検索クエリに基づいて１つまたは複数のエンハンストドキュメントについての断片的記述とランク付けされた結果を通信する命令と、
データの前記１つまたは複数のソースは、検索クエリログを含み、関連性を計算する命令は、さらに、
前記検索クエリログから、前記データソースを検索するために比較的大きな出現頻度（ＦＯＯ）を持つ検索クエリを識別する命令と、
検索クエリ結果からエンドユーザにより選択された、前記データソースからのアーティクルを決定する命令と、
選択されなかった前記検索クエリ内のアーティクルである欠損エンドユーザ選択を決定する命令とを含み、
前記欠損エンドユーザ選択を決定する命令は、さらに、層間リンクを使用して異種オブジェクトをクラスタリングし、前記異種オブジェクトの複数の特徴に対する重要性尺度を決定するステップを含み、前記異種オブジェクトは、類似のクエリの第１のクラスタと、関係するドキュメントの第２のクラスタとを含み、前記類似のクエリは前記検索クエリログで識別されており、前記類似のクエリは前記１つまたは複数のドキュメントを含む関連付けられた検索結果であり、前記関係するドキュメントは、前記関係する複数のドキュメントの個々の複数のドキュメントが前記複数の検索結果からエンドユーザにより選択されたか否かに関係なく前記検索結果で識別されることを特徴とするコンピュータ可読記録媒体。
前記参照情報は、前記１つまたは複数のドキュメントのうちの１つのドキュメントに関連付けられているリンクまたは実質的に一意のドキュメントＩＤの少なくとも１つを含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記１つまたは複数のドキュメントは、知識ベースアーティクル、製品ヘルプ、タスク、または開発者データの１つを含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
データの前記１つまたは複数のソースは、サービス要求、ニュースグループポスティング、または検索クエリログの少なくとも１つを含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記メタデータは、前記１つまたは複数のドキュメントのうちの複数の関連付けられているドキュメントに意味上または文脈上関係することを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記メタデータは、ドキュメントのタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記１つまたは複数のエンハンストドキュメントのうちのそれぞれのエンハンストドキュメントについて、前記エンハンストドキュメントが生成された対応するオリジナルドキュメントがあることを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記関連性を計算するステップは、前記１つまたは複数のドキュメントのうちの特定の１つのドキュメントが前記メタデータ内の文脈の範囲内で何回識別されるかに基づくことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記メタデータは、アーティクルタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含み、関連性を計算する命令は、さらに、前記アーティクルタイトルまたは製品問題の状況に重みを付けて、製品問題解決情報より高い関連性を示す命令を含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
関連性を計算する命令は、さらに、前記データソースのコンテンツ内で、前記コンテンツ内の他のメタデータ特徴の出現の頻度と比較してより大きな頻度で出現する前記メタデータの特徴に対し、より大きな関連性を割り当てる命令を含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
関連性を計算する命令は、さらに、前記１つまたは複数のドキュメントのうちの１つのドキュメント内で見つかった前記メタデータの特徴に対し、前記ドキュメントの経過期間に応じて、より大きな重みを割り当てる命令を含むことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
前記複数の特徴は、前記第１および第２のクラスタ内のそれぞれの複数のノードにより表され、前記複数のノードのそれぞれに対する前記重要性尺度は、前記第１および第２のクラスタ内のオブジェクト間の距離を測定する類似度関数に基づくことを特徴とする請求項１３に記載のコンピュータ可読記録媒体。
エンハンストドキュメント検索のためのコンテンツ伝播を実現するコンピューティングデバイスであって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
該メモリはその中に前記プロセッサにより実行可能な、
１つまたは複数のドキュメントを対象とする参照情報を識別する命令であって、前記参照情報が、前記１つまたは複数のドキュメントを含むデータソースと無関係のデータの１つまたは複数のソースから識別される命令と、
前記参照情報の近くに配置されていて、前記参照情報を取り囲み前記参照情報に意味論的に又は文脈的に関係するメタデータを抽出する命令と、
前記１つまたは複数のドキュメントのうちの関連する複数のドキュメントのコンテンツに対する前記メタデータのそれぞれの特徴間の関連性を計算する命令と、
前記１つまたは複数のドキュメントのうちのそれぞれのドキュメントについて、前記メタデータの関連する部分に対し、前記それぞれの部分からの特徴の関連性と関連性スコアとを使用して、前記ドキュメントのオリジナルコンテンツの中にインデックスを作成する命令とを含み、
前記インデックス作成命令により、１つまたは複数のエンハンストドキュメントが生成され、
検索クエリに基づいて関連情報を見付けるために１つまたは複数のエンハンストドキュメントを解析する命令と、
関連性スコアに基づいて１つまたは複数のエンハンストドキュメントをランク付けする命令と、
検索クエリに基づいて１つまたは複数のエンハンストドキュメントについての断片的記述とランク付けされた結果を通信する命令と、
データの前記１つまたは複数のソースは、検索クエリログを含み、関連性を計算する命令は、さらに、
前記検索クエリログから、前記データソースを検索するために比較的大きな出現頻度（ＦＯＯ）を持つ検索クエリを識別する命令と、
検索クエリ結果からエンドユーザにより選択された、前記データソースからのアーティクルを決定する命令と、
選択されなかった前記検索クエリ内のアーティクルである欠損エンドユーザ選択を決定する命令とを含み、
前記欠損エンドユーザ選択を決定する命令は、さらに、層間リンクを使用して異種オブジェクトをクラスタリングし、前記異種オブジェクトの複数の特徴に対する重要性尺度を決定する命令を含み、前記異種オブジェクトは、類似のクエリの第１のクラスタと、関係するドキュメントの第２のクラスタとを含み、前記類似のクエリは前記検索クエリログで識別されており、前記類似のクエリは前記１つまたは複数のドキュメントを含む関連付けられた検索結果であり、前記関係するドキュメントは、前記関係する複数のドキュメントの個々の複数のドキュメントが前記複数の検索結果からエンドユーザにより選択されたか否かに関係なく前記検索結果で識別されることを特徴とするコンピューティングデバイス。
前記参照情報は、前記１つまたは複数のドキュメントのうちの１つのドキュメントに関連付けられているリンクまたは実質的に一意のドキュメントＩＤの少なくとも１つを含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
前記１つまたは複数のドキュメントは、知識ベースアーティクル、製品ヘルプ、タスク、または開発者データの１つを含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
データの前記１つまたは複数のソースは、サービス要求、ニュースグループポスティング、または検索クエリログの少なくとも１つを含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
前記メタデータは、前記１つまたは複数のドキュメントのうちの複数の関連付けられているドキュメントに意味上または文脈上関係することを特徴とする請求項２５に記載のコンピューティングデバイス。
前記メタデータは、ドキュメントのタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
前記１つまたは複数のエンハンストドキュメントのうちのそれぞれのエンハンストドキュメントについて、前記エンハンストドキュメントが生成された対応するオリジナルドキュメントがあることを特徴とする請求項２５に記載のコンピューティングデバイス。
前記関連性を計算するステップは、前記１つまたは複数のドキュメントのうちの特定の１つのドキュメントが前記メタデータ内の文脈の範囲内で何回識別されるかに基づくことを特徴とする請求項２５に記載のコンピューティングデバイス。
前記メタデータは、アーティクルタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含み、関連性を計算する命令は、さらに、前記アーティクルタイトルまたは製品問題の状況に重みを付けて、製品問題解決情報より高い関連性を示す命令を含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
関連性を計算する命令は、さらに、前記データソースのコンテンツ内で、前記コンテンツ内の他のメタデータ特徴の出現の頻度と比較してより大きな頻度で出現する前記メタデータの特徴に対し、より大きな関連性を割り当てる命令を含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
関連性を計算する命令は、さらに、前記１つまたは複数のドキュメントのうちの１つのドキュメント内で見つかった前記メタデータの特徴に対し、前記ドキュメントの経過期間に応じて、より大きな重みを割り当てる命令を含むことを特徴とする請求項２５に記載のコンピューティングデバイス。
前記複数の特徴は、前記第１および第２のクラスタ内のそれぞれの複数のノードにより表され、前記複数のノードのそれぞれに対する前記重要性尺度は、前記第１および第２のクラスタ内のオブジェクト間の距離を測定する類似度関数に基づくことを特徴とする請求項２５に記載のコンピューティングデバイス。
エンハンストドキュメント検索のためのコンテンツ伝播を実現するコンピューティングデバイスであって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
該メモリは前記プロセッサにより実行可能なプログラム命令を含み、該プログラム命令は実行されると、
１つまたは複数のドキュメントを対象とする参照情報を識別する手段であって、前記参照情報が、前記１つまたは複数のドキュメントを含むデータソースと無関係のデータの１つまたは複数のソースから識別される手段と、
前記参照情報の近くに配置されていて、前記参照情報を取り囲み前記参照情報に意味論的に又は文脈的に関係するメタデータを抽出する手段と、
前記１つまたは複数のドキュメントのうちの関連する複数のドキュメントのコンテンツに対する前記メタデータのそれぞれの特徴間の関連性を計算する手段と、
前記１つまたは複数のドキュメントのうちのそれぞれのドキュメントについて、前記メタデータの関連する部分に対し、前記それぞれの部分からの特徴の関連性と関連性スコアとを使用して、前記ドキュメントのオリジナルコンテンツの中にインデックスを作成する手段とを含み、
前記インデックス作成する手段により、１つまたは複数のエンハンストドキュメントが生成され、
検索クエリに基づいて関連情報を見付けるために１つまたは複数のエンハンストドキュメントを解析する手段と、
関連性スコアに基づいて１つまたは複数のエンハンストドキュメントをランク付けする手段と、
検索クエリに基づいて１つまたは複数のエンハンストドキュメントについての断片的記述とランク付けされた結果を通信する手段とを実現し、
前記計算する手段は、さらに、層間リンクを使用して異種オブジェクトをクラスタリングし、前記異種オブジェクトの複数の特徴に対する重要性尺度を決定する手段を含み、前記異種オブジェクトは、類似のクエリの第１のクラスタと、関係するドキュメントの第２のクラスタとを含み、前記類似のクエリは前記検索クエリログで識別されており、前記類似のクエリは前記１つまたは複数のドキュメントを含む関連付けられた検索結果であり、前記関係するドキュメントは、前記関係する複数のドキュメントの個々の複数のドキュメントが前記複数の検索結果からエンドユーザにより選択されたか否かに関係なく前記検索結果で識別されることを特徴とするコンピューティングデバイス。
前記参照情報は、前記１つまたは複数のドキュメントのうちの１つのドキュメントに関連付けられているリンクまたは実質的に一意のドキュメントＩＤの少なくとも１つを含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
前記１つまたは複数のドキュメントは、知識ベースアーティクル、製品ヘルプ、タスク、または開発者データの１つを含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
データの前記１つまたは複数のソースは、サービス要求、ニュースグループポスティング、または検索クエリログの少なくとも１つを含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
前記メタデータは、前記１つまたは複数のドキュメントのうちの複数の関連付けられているドキュメントに意味上または文脈上関係することを特徴とする請求項３７に記載のコンピューティングデバイス。
前記メタデータは、アーティクルタイトル、製品問題の状況、または製品問題解決情報の少なくとも１つを含み、関連性を計算する手段は、さらに、前記アーティクルタイトルまたは製品問題の状況に重みを付けて、製品問題解決情報より高い関連性を示す手段を含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
関連性を計算する手段は、さらに、前記データソースのコンテンツ内で、前記コンテンツ内の他のメタデータ特徴の出現の頻度と比較してより大きな頻度で出現する前記メタデータの特徴に対し、より大きな関連性を割り当てる手段を含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
関連性を計算する手段は、さらに、前記１つまたは複数のドキュメントのうちの１つのドキュメント内で見つかった前記メタデータの特徴に対し、前記ドキュメントの経過期間に応じて、より大きな重みを割り当てる手段を含むことを特徴とする請求項３７に記載のコンピューティングデバイス。
データの前記１つまたは複数のソースは、検索クエリログを含み、関連性を計算する手段は、さらに、
前記検索クエリログから、前記データソースを検索するために比較的大きな出現頻度（ＦＯＯ）を持つ検索クエリを識別する手段と、
検索クエリ結果からエンドユーザにより選択された、前記データソースからのアーティクルを決定する手段と、
選択されなかった前記検索クエリ内のアーティクルである欠損エンドユーザ選択を計算する手段とを含むことを特徴とする請求項３７に記載のコンピューティングデバイス。