JP2009093647A - ワードと文書の深さの決定 - Google Patents
ワードと文書の深さの決定 Download PDFInfo
- Publication number
- JP2009093647A JP2009093647A JP2008259627A JP2008259627A JP2009093647A JP 2009093647 A JP2009093647 A JP 2009093647A JP 2008259627 A JP2008259627 A JP 2008259627A JP 2008259627 A JP2008259627 A JP 2008259627A JP 2009093647 A JP2009093647 A JP 2009093647A
- Authority
- JP
- Japan
- Prior art keywords
- document
- depth
- word
- words
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】一実施形態では、文書の深さの決定には文書を説明する記録へのアクセスを含む。その記録はその文書の類似性を記録するものである。文書の深さはその類似性により決定する。文書の深さ分析をその文書の深さを用いて行うことができる。一実施形態では、ワードの深さの決定にはそのワードの類似性を記載した記録へのアクセスを含む。ワードの深さはその類似性により決定する。
【選択図】図1
Description
[関連出願]
本願は、デイビッド・マービットらにより2007年10月5日に出願された米国仮出願第60/977,782号、発明の名称「ワードの深さと文書の深さの決定及びその応用」、代理人管理第073338.0547号の米国特許法第119条(e)項の利益を主張するものである。
1. ドメイン内の文書の収集実施形態では、文書はターム(collection of terms)の集まりである。文書とは、例えば新約聖書などの可読テキストである。文書は、必ずしも物語形式のテキストでなくてもよく、例えば画像コンテンツを個別かつ集合的に記述する一組のユーザ入力タグであってもよい。文書の集まりは「ドメイン・コーパス(domain corpus)」と呼ぶ。
1. 基本類似性
a) タームAとタームBとの間の基本類似性(A)を、タームAまたはBのいずれかを含むコンテキスト数に対する、タームA及びBを両方とも含むコンテキスト数の比として定義する。
タームAとタームBとの間の有向類似性(DAff)を、コンテキスト中にタームAが出現することを条件として、タームBが出現する条件付き確立として定義してもよい。
タームAとタームBとの間の差分有向類似性(DiffDAff)は、タームAとBとの間の有向類似性から、コーパスにおけるタームBの一般性(common-ness)を示すファクタを引いたものとして定義してもよい。コーパスにおけるタームBの一般性は、そのコーパス中の他のタームに対するタームBの基本類似性または有向類似性の統計値である。一実施形態では、コーパスにおけるタームBの一般性(common-ness)は、タームBの平均類似性(AA)である。その場合、差分有向類似性の定義は次のようになる:
差分類似性を様々に応用できる。一例では、人の名前の間の差分類似性を用いて社会的ネットワークを研究できる。他の例では、言語要素間の差分類似性を用いて自然言語処理を研究できる。他の例では、製品間の差分類似性を用いてマーケティングを研究できる。
本発明の実施形態により以下の技術的有利性がもたらされる。一実施形態の技術的優位性として、ワードのワード深さ(word depth)をそのワードの類似性から決定できる。一実施形態の他の技術的優位性として、文書の文書深さ(document depth)をその文書の類似性から決定できる。一実施形態の他の技術的優位性として、深さ分析を行うことができる。深さ分析の例としては、要求された深さ(文書深さ)を満たす文書の検索、文書の深さを示すグラフィカル要素の表示、ユーザ文書に基づくユーザ深さ(user depth)の決定がある。 本発明の実施形態には、上記の技術的な優位性を含まないもの、一部を含むもの、すべてを含むものがある。図面、詳細な説明、及び特許請求の範囲に基づき、当業者には容易に1つ以上の技術的な優位性が明らかとなるであろう。
本開示を実施形態に関して説明したが、これらの実施形態の変形や置き換えは当業者には明らかであろう。従って、上記の実施形態の説明は本開示を限定するものではない。特許請求の範囲に記載した本開示の精神と範囲から逸脱せずに、その他の変更、置き換え、改変も可能である。
(付記1) 複数のワードを含む複数の文書を記述する、前記複数の文書の複数の類似性を記録した、有体の媒体に記憶された記録にアクセスする段階と、
前記複数の類似性に応じて前記複数の文書の少なくとも一部に含まれる各文書の文書深さを決定する段階と、
前記文書深さにより文書深さ分析を行いその結果を得る段階と、
前記文書深さ分析の結果をレポートする段階とを含む方法。
(付記2) 前記複数の類似性は前記複数のワードの複数の平均類似性をさらに含む、付記1に記載の方法。
(付記3)
前記記録は前記複数の類似性を含む文書類似性グラフをさらに含み、前記文書類似性グラフは複数のノードを含み、各ノードは1つの文書を表し、
各文書の文書深さを決定する段階は、
前記文書類似性グラフにリンク分析を適用して前記複数のノードの少なくとも一部の人気度を決定する段階と、
各文書が、人気度が低いノードで表されているときその文書は深いと決定する段階と、
各文書が、人気度が高いノードで表されているときその文書は浅いと決定する段階とを含む、付記1に記載の方法。
(付記4) 前記文書深さにより文書深さ分析を行いその結果を生成する段階は、
文書深さ要求を含む検索クエリーを受け取る段階と、
前記検索クエリーと前記文書深さ要求とを満たす前記複数の文書のうちの一組の文書を検索する段階とを含む、付記1に記載の方法。
(付記5) 前記文書深さにより文書深さ分析を行いその結果を生成する段階は、
各文書の文書深さのグラフィカル表示を行い、前記グラフィカル表示はグラフィカルインジケータとグラフィカルな修正と深さスライダーと深さグラフとよりなる集合から選択した要素を含む段階を含む、付記1に記載の方法。
(付記6) 前記文書深さにより文書深さ分析を行いその結果を生成する段階は、
検索クエリーを受け取る段階と、
前記検索クエリーを満たす前記複数の文書のうちの一組の文書を検索する段階と、
前記一組の文書をソートする段階とを含む、付記1に記載の方法。
(付記7) 前記複数の文書はユーザに関連し、
各文書の文書深さを決定する段階は、
前記複数の文書から前記ユーザのユーザ深さを決定する段階を含む、付記1に記載の方法。
(付記8) 前記複数の文書はユーザに関連し、
各文書の文書深さを決定する段階は、
前記複数の文書からテーマに応じて前記ユーザのユーザ深さを決定する段階を含む、付記1に記載の方法。
(付記9) ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
複数のワードを含む複数の文書を記述する、前記複数の文書の複数の類似性を記録した、有体の媒体に記憶された記録にアクセスする段階と、
前記複数の類似性に応じて前記複数の文書の少なくとも一部に含まれる各文書の文書深さを決定する段階と、
前記文書深さにより文書深さ分析を行いその結果を生成する段階と、
前記文書深さ分析の結果をレポートする段階とを実行する媒体。
(付記10) 前記複数の類似性は前記複数のワードの複数の平均類似性をさらに含む、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記11) 前記記録は前記複数の類似性を含む文書類似性グラフをさらに含み、前記文書類似性グラフは複数のノードを含み、各ノードは1つの文書を表し、
前記コンピュータ読み取り可能有体媒体は、
前記文書類似性グラフにリンク分析を適用して前記複数のノードの少なくとも一部の人気度を決定する段階と、
各文書が、人気度が低いノードで表されているときその文書は深いと決定する段階と、
各文書が、人気度が高いノードで表されているときその文書は浅いと決定する段階とにより各文書の文書深さを決定できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記12) 文書深さ要求を含む検索クエリーを受け取る段階と、
前記検索クエリーと前記文書深さ要求とを満たす前記複数の文書のうちの一組の文書を検索する段階と
により前記文書深さにより文書深さ分析を行いその結果を生成できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記13) 各文書の文書深さのグラフィカル表示を行い、前記グラフィカル表示はグラフィカルインジケータとグラフィカルな修正と深さスライダーと深さグラフとよりなる集合から選択した要素を含む段階により前記文書深さにより文書深さ分析を行いその結果を生成できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記14) 検索クエリーを受け取る段階と、
前記検索クエリーを満たす前記複数の文書のうちの一組の文書を検索する段階と、
前記一組の文書をソートする段階と
により前記文書深さにより文書深さ分析を行いその結果を生成できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記15) 前記複数の文書はユーザに関連し、
前記コンピュータ読み取り可能有体媒体は、
前記複数の文書から前記ユーザのユーザ深さを決定する段階により各文書の文書深さを決定できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記16) 前記複数の文書はユーザに関連し、
前記コンピュータ読み取り可能有体媒体は、
前記複数の文書からテーマに応じて前記ユーザのユーザ深さを決定する段階により各文書の文書深さを決定できる、付記9に記載のコンピュータ読み取り可能有体媒体。
(付記17) 有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードで記載され、前記記録は前記複数のワードの複数の類似性を含む段階と、
前記複数の類似性に応じて前記複数のワードのうちの各ワードのワード深さを決定する段階と、
前記複数のワード深さをレポートする段階とを含む方法。
(付記18) 前記複数の類似性は複数の平均類似性をさらに含み、平均類似性はワードの深さを示し、
前記複数のワードの各ワードのワード深さを決定する段階は、さらに、
各ワードの平均類似性が低いときそのワードは深いと決定する段階と、
各ワードの平均類似性が高いときそのワードは浅いと決定する段階とを含む、
付記17に記載の方法。
(付記19) 前記記録は前記複数の類似性から生成した複数のクラスターを含み、前記複数のクラスターは前記複数のワードを含み、
前記複数のワードの各ワードのワード深さを決定する段階は、さらに、
各ワードが属するクラスター数が少ないときそのワードは深いと決定する段階と、
各ワードが属するクラスター数が多いときそのワードは浅いと決定する段階とを含む、
付記17に記載の方法。
(付記20) 前記記録は前記複数の類似性を含む類似性グラフを含み、前記類似性グラフは複数のノードを含み、各ノードは1つのワードを表し、
前記複数のワードの各ワードのワード深さを決定する段階は、さらに、
前記類似性グラフにリンク分析を適用して、前記類似性グラフの各ノードの人気度を決定する段階と、
各ワードが、人気度が低いノードで表されているときそのワードは深いと決定する段階と、
各ワードが、人気度が高いノードで表されているときそのワードは浅いと決定する段階とを含む、
付記17に記載の方法。
(付記21) ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードで記載され、前記記録は前記複数のワードの複数の類似性を含む段階と、
前記複数の類似性に応じて前記複数のワードのうちの各ワードのワード深さを決定する段階と、
前記複数のワード深さをレポートする段階とを実行する媒体。
(付記22) 前記複数の類似性は複数の平均類似性をさらに含み、平均類似性はワードの深さを示し、
前記コンピュータ読み取り可能有体媒体は、
各ワードの平均類似性が低いときそのワードは深いと決定する段階と、
各ワードの平均類似性が高いときそのワードは浅いと決定する段階と
により前記複数のワードのうちの各ワードのワード深さを決定できる、付記21に記載のコンピュータ読み取り可能有体媒体。
(付記23) 前記記録は前記複数の類似性から生成した複数のクラスターを含み、前記複数のクラスターは前記複数のワードを含み、
前記コンピュータ読み取り可能有体媒体は、
各ワードが属するクラスター数が少ないときそのワードは深いと決定する段階と、
各ワードが属するクラスター数が多いときそのワードは浅いと決定する段階と
により前記複数のワードのうちの各ワードのワード深さを決定できる、付記21に記載のコンピュータ読み取り可能有体媒体。
(付記24) 前記記録は前記複数の類似性を含む類似性グラフを含み、前記類似性グラフは複数のノードを含み、各ノードは1つのワードを表し、
前記コンピュータ読み取り可能有体媒体は、
前記類似性グラフにリンク分析を適用して、前記類似性グラフの各ノードの人気度を決定する段階と、
各ワードが、人気度が低いノードで表されているときそのワードは深いと決定する段階と、
各ワードが、人気度が高いノードで表されているときそのワードは浅いと決定する段階と
により前記複数のワードのうちの各ワードのワード深さを決定できる、付記21に記載のコンピュータ読み取り可能有体媒体。
(付記25) 有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードを含む文書を記述する段階と、
前記文書の前記複数のワードのうちの2つ以上のワードの組みの平均ワード深さを決定する段階と、
前記平均ワード深さから前記文書の文書深さを計算する段階とを含む方法。
(付記26) 前記2つ以上のワードの組みは前記文書の2つ以上の基本ワードを含む、付記25に記載の方法。
(付記27) 前記2つ以上のワードの組みは最も深いX%のワードを含み、Xは50以上である、付記25に記載の方法。
(付記28) 前記2つ以上のワードの組みは最も深いX%のワードを含み、Xは50以下である、付記25に記載の方法。
(付記29) 前記2つ以上のワードの組みは前記文書の標準的文法ワードをP%除いたものであり、Pは50以上である、付記25に記載の方法。
(付記30) 前記2つ以上のワードの組みは前記文書の標準的文法ワードをP%除いたものであり、Pは50以下である、付記25に記載の方法。
(付記31) 前記2つ以上のワードの組みは前記文書のストップワードのQ%を除いたものであり、Qは50以上である、付記25に記載の方法。
(付記32) 前記2つ以上のワードの組みは前記文書のストップワードのQ%を除いたものであり、Qは50以下である、付記25に記載の方法。
(付記33) ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードを含む文書を記述する段階と、
前記文書の前記複数のワードのうちの2つ以上のワードの組みの平均ワード深さを決定する段階と、
前記平均ワード深さから前記文書の文書深さを計算する段階と、
を実行する媒体。
(付記34) 前記2つ以上のワードの組みは前記文書の2つ以上の基本ワードを含む、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記35) 前記2つ以上のワードの組みは最も深いX%のワードを含み、Xは50以上である、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記36) 前記2つ以上のワードの組みは最も深いX%のワードを含み、Xは50以下である、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記37) 前記2つ以上のワードの組みは前記文書の標準的文法ワードをP%除いたものである、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記38) 前記2つ以上のワードの組みは前記文書の標準的文法ワードをP%除いたものであり、Pは50以下である、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記39) 前記2つ以上のワードの組みは前記文書のストップワードのQ%を除いたものであり、Qは50以上である、付記33に記載のコンピュータ読み取り可能有体媒体。
(付記40) 前記2つ以上のワードの組みは前記文書のストップワードのQ%を除いたものであり、Qは50以下である、付記33に記載のコンピュータ読み取り可能有体媒体。
22 サーバ
24 メモリ
26 ディシジョン・ダイアグラム・エンジン
30 類似性モジュール
31 クラスタリングモジュール
32 オントロジー特性モジュール
34 類似性計算器
38 オントロジー生成器
42 類似性マトリックス生成器
46 類似性グラフ生成器
48 ワード推奨器
50 ページ
54 レコード
58 インデックス
62 逆インデックス
66 オントロジー
67 クラスター
210 クラスタリングエンジン
214 クラスタ分析器
230 深さエンジン
240 テーマエンジン
244 具体性エンジン
250 オントロジー特性アプリケーションモジュール
Claims (6)
- 複数のワードを含む複数の文書を記述する、前記複数の文書の複数の類似性を記録した、有体の媒体に記憶された記録にアクセスする段階と、
前記複数の類似性に応じて前記複数の文書の少なくとも一部に含まれる各文書の文書深さを決定する段階と、
前記文書深さにより文書深さ分析を行いその結果を得る段階と、
前記文書深さ分析の結果をレポートする段階とを含む方法。 - ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
複数のワードを含む複数の文書を記述する、前記複数の文書の複数の類似性を記録した、有体の媒体に記憶された記録にアクセスする段階と、
前記複数の類似性に応じて前記複数の文書の少なくとも一部に含まれる各文書の文書深さを決定する段階と、
前記文書深さにより文書深さ分析を行いその結果を生成する段階と、
前記文書深さ分析の結果をレポートする段階とを実行する媒体。 - 有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードで記載され、前記記録は前記複数のワードの複数の類似性を含む段階と、
前記複数の類似性に応じて前記複数のワードのうちの各ワードのワード深さを決定する段階と、
前記複数のワード深さをレポートする段階とを含む方法。 - ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードで記載され、前記記録は前記複数のワードの複数の類似性を含む段階と、
前記複数の類似性に応じて前記複数のワードのうちの各ワードのワード深さを決定する段階と、
前記複数のワード深さをレポートする段階とを実行する媒体。 - 有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードを含む文書を記述する段階と、
前記文書の前記複数のワードのうちの2つ以上のワードの組みの平均ワード深さを決定する段階と、
前記平均ワード深さから前記文書の文書深さを計算する段階とを含む方法。 - ソフトウェアをエンコードしたコンピュータ読み取り可能有体媒体であって、実行したとき、
有体媒体に格納された記録にアクセスする段階であって、前記記録は複数のワードを含む文書を記述する段階と、
前記文書の前記複数のワードのうちの2つ以上のワードの組みの平均ワード深さを決定する段階と、
前記平均ワード深さから前記文書の文書深さを計算する段階と、
を実行する媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US97778207P | 2007-10-05 | 2007-10-05 | |
US60/977,782 | 2007-10-05 | ||
US12/243,012 US20090094209A1 (en) | 2007-10-05 | 2008-10-01 | Determining The Depths Of Words And Documents |
US12/243,012 | 2008-10-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009093647A true JP2009093647A (ja) | 2009-04-30 |
JP5391632B2 JP5391632B2 (ja) | 2014-01-15 |
Family
ID=40282348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008259627A Expired - Fee Related JP5391632B2 (ja) | 2007-10-05 | 2008-10-06 | ワードと文書の深さの決定 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20090094209A1 (ja) |
EP (1) | EP2045732A3 (ja) |
JP (1) | JP5391632B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020181390A (ja) * | 2019-04-25 | 2020-11-05 | 株式会社アナリティクスデザインラボ | 分析方法、分析装置及び分析プログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8543380B2 (en) * | 2007-10-05 | 2013-09-24 | Fujitsu Limited | Determining a document specificity |
US9336302B1 (en) | 2012-07-20 | 2016-05-10 | Zuci Realty Llc | Insight and algorithmic clustering for automated synthesis |
US9367607B2 (en) | 2012-12-31 | 2016-06-14 | Facebook, Inc. | Natural-language rendering of structured search queries |
US9703844B2 (en) | 2012-12-31 | 2017-07-11 | Facebook, Inc. | Search result snippets for structured search queries |
US9361363B2 (en) | 2012-12-31 | 2016-06-07 | Facebook, Inc. | Modifying structured search queries on online social networks |
US10162820B2 (en) * | 2014-05-16 | 2018-12-25 | Microsoft Technology Licensing, Llc | Suggested keywords |
US9727654B2 (en) | 2014-05-16 | 2017-08-08 | Linkedin Corporation | Suggested keywords |
CN106575418B (zh) * | 2014-05-16 | 2021-06-08 | 微软技术许可有限责任公司 | 建议的关键词 |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN106802918A (zh) * | 2016-12-13 | 2017-06-06 | 成都数联铭品科技有限公司 | 用于自然语言处理的领域词典生成系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005322244A (ja) * | 2004-04-30 | 2005-11-17 | Microsoft Corp | 情報の多様性および豊富さを向上させるよう検索結果のドキュメントを順位付ける方法およびシステム |
WO2007102657A1 (en) * | 2006-03-06 | 2007-09-13 | Nhn Corporation | Method for computing index of expert classified by keyword and system for executing the method |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5488725A (en) * | 1991-10-08 | 1996-01-30 | West Publishing Company | System of document representation retrieval by successive iterated probability sampling |
US6996572B1 (en) * | 1997-10-08 | 2006-02-07 | International Business Machines Corporation | Method and system for filtering of information entities |
US6446061B1 (en) * | 1998-07-31 | 2002-09-03 | International Business Machines Corporation | Taxonomy generation for document collections |
US6353825B1 (en) * | 1999-07-30 | 2002-03-05 | Verizon Laboratories Inc. | Method and device for classification using iterative information retrieval techniques |
US6421668B1 (en) * | 1999-08-05 | 2002-07-16 | Agilent Technologies, Inc. | Method and system for partitioning data into subsets of related data |
US6587848B1 (en) * | 2000-03-08 | 2003-07-01 | International Business Machines Corporation | Methods and apparatus for performing an affinity based similarity search |
WO2002069202A2 (en) * | 2001-02-28 | 2002-09-06 | The Johns Hopkins University | Method for determining synthetic term senses using reference text |
US20030135499A1 (en) * | 2002-01-14 | 2003-07-17 | Schirmer Andrew Lewis | System and method for mining a user's electronic mail messages to determine the user's affinities |
US7617176B2 (en) * | 2004-07-13 | 2009-11-10 | Microsoft Corporation | Query-based snippet clustering for search result grouping |
GB2456369A (en) * | 2008-01-11 | 2009-07-15 | Ibm | String pattern analysis for word or genome analysis |
-
2008
- 2008-10-01 US US12/243,012 patent/US20090094209A1/en not_active Abandoned
- 2008-10-02 EP EP08165778A patent/EP2045732A3/en not_active Withdrawn
- 2008-10-06 JP JP2008259627A patent/JP5391632B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005322244A (ja) * | 2004-04-30 | 2005-11-17 | Microsoft Corp | 情報の多様性および豊富さを向上させるよう検索結果のドキュメントを順位付ける方法およびシステム |
WO2007102657A1 (en) * | 2006-03-06 | 2007-09-13 | Nhn Corporation | Method for computing index of expert classified by keyword and system for executing the method |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020181390A (ja) * | 2019-04-25 | 2020-11-05 | 株式会社アナリティクスデザインラボ | 分析方法、分析装置及び分析プログラム |
JP7221527B2 (ja) | 2019-04-25 | 2023-02-14 | 株式会社アナリティクスデザインラボ | 分析方法、分析装置及び分析プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090094209A1 (en) | 2009-04-09 |
JP5391632B2 (ja) | 2014-01-15 |
EP2045732A3 (en) | 2009-05-13 |
EP2045732A2 (en) | 2009-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5353173B2 (ja) | 文書の具体性の決定 | |
JP5332477B2 (ja) | ターム階層の自動生成 | |
JP5391634B2 (ja) | 文書の段落分析によるその文書のタグの選択 | |
JP5423030B2 (ja) | ワードセットに関係するワードの決定 | |
JP5391633B2 (ja) | オントロジー空間を規定するタームの推奨 | |
JP5391632B2 (ja) | ワードと文書の深さの決定 | |
US9317593B2 (en) | Modeling topics using statistical distributions | |
US8108405B2 (en) | Refining a search space in response to user input | |
Deveaud et al. | Accurate and effective latent concept modeling for ad hoc information retrieval | |
US8108392B2 (en) | Identifying clusters of words according to word affinities | |
Kaptein et al. | Exploiting the category structure of Wikipedia for entity ranking | |
EP2090992A2 (en) | Determining words related to a given set of words | |
Jain et al. | A theoretical study of text document clustering | |
Heydari et al. | Analysis of Persian News Agencies on Instagram, A Words Co-occurrence Graph-based Approach | |
Steinmetz et al. | About the influence of negative context | |
Gedam et al. | Study of Existing Method of Finding Aliases and Improve Method of Finding Aliases from Web [J] | |
EP2045736A1 (en) | Identifying clusters of words according to word affinities | |
Font Corbera et al. | Folksonomy-based tag recommendation for collaborative tagging systems | |
Miyanishi | Time-Aware Information Retrieval in Social Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130930 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |