JP5251099B2 - 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム - Google Patents
用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム Download PDFInfo
- Publication number
- JP5251099B2 JP5251099B2 JP2007316422A JP2007316422A JP5251099B2 JP 5251099 B2 JP5251099 B2 JP 5251099B2 JP 2007316422 A JP2007316422 A JP 2007316422A JP 2007316422 A JP2007316422 A JP 2007316422A JP 5251099 B2 JP5251099 B2 JP 5251099B2
- Authority
- JP
- Japan
- Prior art keywords
- term
- terms
- search
- occurrence
- occurrence degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
共起頻度 = |K1 AND K2|
相互情報量 = −log{N×|K1 AND K2|/(|K1|×|K2|)}
Dice係数 = |K1 AND K2|/(|K1|+|K2|)
Jaccard係数 = |K1 AND K2|/|K1 OR K2|
Simpson係数 = |K1 AND K2|/min(|K1|,|K2|)
Cosine係数 = |K1 AND K2|/√(|K1|×|K2|)
検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出装置であって、
未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定手段と、
前記共起度検出確度判定手段で判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定手段と、
前記検索戦略決定手段で決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索手段と、
前記検索手段で検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算手段と、
を備えることを特徴とする。
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込む、
ことによって前記用語を抽出する規則を生成してもよい。
検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出装置が行う用語共起度抽出方法であって、
共起度検出確度判定手段が行う、未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定ステップと、
検索戦略決定手段が行う、前記共起度検出確度判定ステップで判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定ステップと、
検索手段が行う、前記検索戦略決定ステップで決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索ステップと、
共起度計算手段が行う、前記検索ステップで検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算ステップと、
を備えることを特徴とする。
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込むことによって前記用語を抽出する規則を生成してもよい。
検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出プログラムであって、
コンピュータを、
未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定手段と、
前記共起度検出確度判定手段で判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定手段と、
前記検索戦略決定手段で決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索手段と、
前記検索手段で検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算手段、
として機能させることを特徴とする。
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込む、
ことによって前記用語を抽出する規則を生成してもよい。
図1は、本発明の実施の形態1に係る用語共起度抽出装置100の構成例を示すブロック図である。本発明の実施の形態1に係る用語共起度抽出装置100は、記憶装置1と、処理装置2と、キーボード等の入力部3と、ディスプレイやプリンタ等の出力部4を含む。また、処理装置2は、インターネットやイントラネット等のネットワーク5を介してWeb検索エンジン等の公開データ6にアクセス可能な構成となっている。
−log{N×|K1 AND K2|/(|K1|×|K2|’)}
として共起度を計算することが可能である。図4(b)から明らかなように、|K2|>|K2|’であるため、片側検索済みにおける近似的な相互情報量の値は、両側検索済みにおける真の相互情報量の値の下限が分かっていることになる。
OR K2|の代わりに用語K1が出現する文書集合と用語K2が抽出された文書集合の和集合に含まれる文書の数|K1 OR K2|’を用いることによって、近似的に|K1 AND K2|/|K1 OR K2|’として共起度を計算することが可能である。この場合、片側検索済みにおける近似的なJaccard係数は、両側検索済みにおける真のJaccard係数の値の上限となる。
|K1 AND K2|/min(|K1|,|K2|’)
として共起度を計算することが可能である。この場合、片側検索済みにおける近似的なSimpson係数は、両側検索済みにおける真のSimpson係数の値の上限となる。
|K1 AND K2|/√(|K1| × |K2|’)
として共起度を計算することが可能である。この場合、片側検索済みにおける近似的なCosine係数は、両側検索済みにおける真のCosine係数の値の上限となる。
AND K2|’を用いることによって、用語間の近似的な共起度を算出することができる。
AGS(Ki) = ΔN ×(α|E01| + β|E12| + γ|E11|)
ここで、△Nは用語Kiを検索することによって、新たに抽出される用語の数の期待値である。一般に、より多くの抽出済み用語と共起している用語ほど、多くの未抽出の用語とも共起していると推測できるため、△Nには、図3の共起度グラフにおける用語Kiのまわりのエッジ数が目安として利用できる。例えば、図3において、用語K16の周りのエッジはK16−K07、K16−K12、K16−K13、K16−K14、K16−K15、K16−K17の6本であるので、K16に関する△Nの値は6になる。
AGS(K11)= △N×(α|E01|+β|E12|+γ|E11|)
= 6×(100×0+10×6+1×0)
= 360
AGS(K12) = ΔN×(α|E01|+β|E12|+γ|E11|)
= 2×(100×1+10×1+1×1)
= 222
AGS(K13) = ΔN×(α|E01|+β|E12|+γ|E11|)
= 2×(100×1+10×1+1×1)
= 222
AGS(K14) = ΔN×(α|E01|+β|E12|+γ|E11|)
= 2×(100×1+10×1+1×1)
= 222
AGS(K15)= ΔN×(α|E01|+β|E12|+γ|E11|)
= 3×(100×1+10×2+1×1)
= 363
K16−K17の5本、片側検索済みから両側検索済みになるエッジの数|E12|はK16−K07の1本、片側検索済みのままだが情報量が増えるエッジの数|E11|はK12−K10,K13−K08,K14−K08,K15−K07,K15−K08,K17−K07,K17−K09の7本である。従って、
AGS(K16) = △N×(α|E01|+β|E12|+γ|E11|)
= 6×(100×5+10×1+1×7)
= 3,102
AGS(K17) = △N×(α|E01|+β|E12|+γ|E11|)
= 3×(100×1+10×2+1×l)
= 363
本実施の形態では、公開データ6に対する検索は、用語のペアではなく、用語1語ずつで行う。そのため、検索回数はたかだか用語リストに含まれる用語の数であり、検索回数が幾何級数的に増加するのを防ぐことができる。
図10は、本発明の実施の形態2に係る用語共起度抽出装置100の構成例を示すブロック図である。実施の形態2は、実施の形態1の構成に加えて、処理装置2に用語抽出部23が追加されている点で異なる。また、記憶装置1に抽出ルール記憶部12が追加されている。
図15は、本発明の実施の形態3に係る用語共起度抽出装置100の構成例を示すブロック図である。図15を参照すると、本発明の実施の形態3は、図10に示された実施の形態2の構成に加えて、処理装置2に抽出ルール学習部25が追加されている点で異なる。
図16は、本発明の実施の形態3の動作の一例を示す流れ図である。図16におけるステップS201〜S205における、検索戦略決定部21、データ検索部22、共起度計算部24の動作は、図5に示す実施の形態1における検索戦略決定部21〜共起度計算部24の動作と同一のため、説明は省略する。用語抽出部23は、図16のステップS203の後、データ検索部22から渡された検索結果の文書群をそのまま抽出ルール学習部25に渡すものとする。
「株式会社の“[品詞:名詞−固有名詞−姓][品詞:名詞−固有名詞−名]”」、
「株式会社の“[品詞:名詞−固有名国−姓][品詞:名詞−固有名詞]”」、
「株式会社の“[品詞:名詞−固有名詞−姓][品詞:名詞]”」、
「株式会社の“[品詞:名詞−固有名詞」[品詞:名詞−固有名詞−名]”」、
「株式会社の“[品詞:名詞−固有名詞][品詞:名詞−固有名詞]”」、
「株式会社の“[品詞:名詞−固有名詞][品詞:名詞]”」、
「株式会社の“[品詞:名詞][品詞:名詞−固有名詞−名]”」、
「株式会社の“[品詞:名詞][品詞:名詞−固有名詞]”」、
「株式会社の“[品詞:名詞][品詞:名詞]”」、
の9つのルールがルール候補Rに追加される。
Disc Random-Access Memory)、DVD−RW(Digital Versatile
Disc ReWritable)等の不揮発性メモリから構成され、前記の処理を制御部31に行わせるための用語共起度抽出用プログラム500を予め記憶し、また、制御部31の指示に従って、このプログラムが記憶するデータを制御部31に供給し、制御部31から供給されたデータを記憶する。図1、図10または図15の用語記憶部11、抽出ルール記憶部12および共起度データ記憶部13は、外部記憶部33に構成される。用語共起度抽出処理を行っているときは、それらのデータの一部は主記憶部32に記憶されて制御部31の作業に用いる。
2 処理装置
3 入力部
4 出力部
5 ネットワーク
6 公開データ
11 用語記憶部
12 抽出ルール記憶部
13 共起度データ記憶部
21 検索戦略決定部
22 データ検索部
23 用語抽出部
24 共起度計算部
25 抽出ルール学習部
31 制御部
32 主記憶部
33 外部記憶部
34 操作部
35 表示部
36 送受信部
100 用語共起度抽出装置
500 用語共起度抽出用プログラム
Claims (15)
- 検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出装置であって、
未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定手段と、
前記共起度検出確度判定手段で判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定手段と、
前記検索戦略決定手段で決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索手段と、
前記検索手段で検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算手段と、
を備えることを特徴とする用語共起度抽出装置。 - 所定の規則に基づいて、前記検索結果文書から、前記検索対象の用語に含まれていない用語を抽出する用語抽出手段を備えることを特徴とする請求項1に記載の用語共起度抽出装置。
- 前記検索結果文書における用語の出現傾向から、動的に用語を抽出する規則を生成する抽出規則学習手段を備えることを特徴とする請求項2に記載の用語共起度抽出装置。
- 前記抽出規則学習手段は、
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込む、
ことによって前記用語を抽出する規則を生成することを特徴とする請求項3に記載の用語共起度抽出装置。 - 前記用語抽出手段は、単語属性および単語属性の正規表現によって記述された所定の規則に基づいて用語を抽出することを特徴とする請求項2ないし4のいずれか1項に記載の用語共起度抽出装置。
- 検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出装置が行う用語共起度抽出方法であって、
共起度検出確度判定手段が行う、未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定ステップと、
検索戦略決定手段が行う、前記共起度検出確度判定ステップで判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定ステップと、
検索手段が行う、前記検索戦略決定ステップで決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索ステップと、
共起度計算手段が行う、前記検索ステップで検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算ステップと、
を備えることを特徴とする用語共起度抽出方法。 - 用語抽出手段が行う、所定の規則に基づいて、前記検索結果文書から、前記検索対象の用語に含まれていない用語を抽出する用語抽出ステップを備えることを特徴とする請求項6に記載の用語共起度抽出方法。
- 抽出規則学習手段が行う、前記検索結果文書における用語の出現傾向から、動的に用語を抽出する規則を生成する抽出規則学習ステップを備えることを特徴とする請求項7に記載の用語共起度抽出方法。
- 前記抽出規則学習ステップでは、前記抽出規則学習手段は、
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込むことによって前記用語を抽出する規則を生成する
ことを特徴とする請求項8に記載の用語共起度抽出方法。 - 前記用語抽出ステップでは、前記用語抽出手段は、単語属性および単語属性の正規表現によって記述された所定の規則に基づいて用語を抽出することを特徴とする請求項7ないし9のいずれか1項に記載の用語共起度抽出方法。
- 検索対象の用語をノードとし、前記検索対象の任意の2つの用語について、該2つの用語が同一文書で出現する度合いを示す共起度を該2つの用語に対応するノードの間のエッジとする、共起度グラフを抽出する用語共起度抽出プログラムであって、
コンピュータを、
未検索の用語について、着目する未検索の用語と共起していることがわかっている既知共起用語の数と、該既知共起用語のうち未検索の用語の数および検索済みの用語の数、ならびに、該既知共起用語の未検索の用語と共起している検索済みの用語に接続するエッジの数、の線形和と、の積である近似グラフスコアを、前記着目する未検索の用語を検索することによって用語間の共起度が求まる可能性として算出する共起度検出確度判定手段と、
前記共起度検出確度判定手段で判定した可能性の大きい用語から順に所定の基準で、用語の検索順を決定する検索戦略決定手段と、
前記検索戦略決定手段で決定した順序に従って、検索対象の用語1語ずつをキーワードとして、文書データを検索する検索手段と、
前記検索手段で検索した用語を含む検索結果文書から、未検索の用語についてはそれまでに検索された該未検索の用語が出現する文書の数を検索対象の全文書における出現文書数とみなして、該検索結果文書に含まれる検索対象の用語について、検索対象の全文書における用語間の共起度を近似的に求める共起度計算手段、
として機能させることを特徴とする用語共起度抽出プログラム。 - 所定の規則に基づいて、前記検索結果文書から、前記検索対象の用語に含まれていない用語を抽出する用語抽出手段としての機能を備えることを特徴とする請求項11に記載の用語共起度抽出プログラム。
- 前記検索結果文書における用語の出現傾向から、動的に用語を抽出する規則を生成する抽出規則学習手段としての機能を備えることを特徴とする請求項12に記載の用語共起度抽出プログラム。
- 前記抽出規則学習手段は、
前記検索結果文書における用語の周辺に出現する文字列を列挙し、
前記検索対象の用語に登録されている用語の単語属性、および該単語属性を一般化した正規表現によって、前記周辺文字列から規則候補の集合を生成し、
前記規則候補の出現頻度および/または用語抽出率の値をそれぞれの所定の閾値と比較して、前記規則候補を絞り込む、
ことによって前記用語を抽出する規則を生成することを特徴とする請求項13に記載の用語共起度抽出プログラム。 - 前記用語抽出手段は、単語属性および単語属性の正規表現によって記述された所定の規則に基づいて用語を抽出することを特徴とする請求項12ないし14のいずれか1項に記載の用語共起度抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007316422A JP5251099B2 (ja) | 2007-12-06 | 2007-12-06 | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007316422A JP5251099B2 (ja) | 2007-12-06 | 2007-12-06 | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009140263A JP2009140263A (ja) | 2009-06-25 |
JP5251099B2 true JP5251099B2 (ja) | 2013-07-31 |
Family
ID=40870801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007316422A Active JP5251099B2 (ja) | 2007-12-06 | 2007-12-06 | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5251099B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081494A (ja) * | 2009-10-05 | 2011-04-21 | Tokyo Electric Power Co Inc:The | 文書データ解析装置、方法及びプログラム |
JP5586435B2 (ja) * | 2010-11-25 | 2014-09-10 | 株式会社日立ソリューションズ | 電子文書マスキングシステム |
JP2014182529A (ja) * | 2013-03-19 | 2014-09-29 | Dainippon Printing Co Ltd | 可視化方法、コンピュータプログラム、可視化装置 |
JP6524790B2 (ja) * | 2015-05-14 | 2019-06-05 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP7305312B2 (ja) * | 2018-06-14 | 2023-07-10 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09245058A (ja) * | 1996-03-11 | 1997-09-19 | Dainippon Printing Co Ltd | データベースシステムおよびキーワードネットワークの構築装置 |
JP3431836B2 (ja) * | 1998-06-18 | 2003-07-28 | 株式会社トレンディ | ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体 |
JP2005122665A (ja) * | 2003-10-20 | 2005-05-12 | Sony Corp | 電子機器装置、関連語データベースの更新方法、プログラム |
-
2007
- 2007-12-06 JP JP2007316422A patent/JP5251099B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009140263A (ja) | 2009-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8108405B2 (en) | Refining a search space in response to user input | |
US8543380B2 (en) | Determining a document specificity | |
KR100974906B1 (ko) | 위치와 관련하여 신뢰성 있는 문서를 식별하는 시스템 및 방법 | |
Kaptein et al. | Exploiting the category structure of Wikipedia for entity ranking | |
US20110161309A1 (en) | Method Of Sorting The Result Set Of A Search Engine | |
US20090254540A1 (en) | Method and apparatus for automated tag generation for digital content | |
Xiong et al. | Towards better text understanding and retrieval through kernel entity salience modeling | |
US20130110839A1 (en) | Constructing an analysis of a document | |
JP4942727B2 (ja) | テキスト要約装置、その方法およびプログラム | |
JP5391632B2 (ja) | ワードと文書の深さの決定 | |
US20140359409A1 (en) | Learning Synonymous Object Names from Anchor Texts | |
Hasibi et al. | On the reproducibility of the TAGME entity linking system | |
JP5251099B2 (ja) | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム | |
Chen et al. | Entity set expansion with semantic features of knowledge graphs | |
JP2002132811A (ja) | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 | |
Najadat et al. | Automatic keyphrase extractor from arabic documents | |
Oh et al. | Efficient semantic network construction with application to PubMed search | |
Orăsan | Comparative evaluation of term-weighting methods for automatic summarization | |
Ren et al. | Role-explicit query extraction and utilization for quantifying user intents | |
US20080033953A1 (en) | Method to search transactional web pages | |
Liu et al. | A new method to compose long unknown Chinese keywords | |
Zhu et al. | Enhance web pages genre identification using neighboring pages | |
Huang et al. | Constructing personal knowledge base: automatic key-phrase extraction from multiple-domain web pages | |
Ghorai | An Information Retrieval System for FIRE 2016 Microblog Track. | |
Stratogiannis et al. | Related Entity Finding Using Semantic Clustering Based on Wikipedia Categories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120918 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5251099 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |