JP5504097B2 - 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 - Google Patents
意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 Download PDFInfo
- Publication number
- JP5504097B2 JP5504097B2 JP2010185391A JP2010185391A JP5504097B2 JP 5504097 B2 JP5504097 B2 JP 5504097B2 JP 2010185391 A JP2010185391 A JP 2010185391A JP 2010185391 A JP2010185391 A JP 2010185391A JP 5504097 B2 JP5504097 B2 JP 5504097B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- dependency
- pair
- noun
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
例文 :「ソメイヨシノなどの桜」
語彙統語パターン:「*などの*」
上位下位関係 :(桜,ソメイヨシノ)
述語「ぶらつく」の係り受け名詞:「河原」「街」「公園」
述語「行く」の係り受け名詞 :「街」「公園」「砂浜」
2つの述語に共通して係る名詞 :「街」「公園」
多数の文書情報を蓄積した文章集合蓄積部を有し、
文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する第1のステップと、
語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する第2のステップと、
第2のステップによって抽出された語対について、文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する第3のステップと、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する第4のステップと、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する文書集合中の出現頻度とを計数する第5のステップと、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する第6のステップと、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する第7のステップと
してコンピュータを更に機能させることを特徴とする。
語は、名詞であり、
語対は、名詞対であり、
係り受け語集合は、述語集合であり、
述語は、動詞又は形容詞であり、
特徴係り受け語集合は、特徴述語集合である
ようにコンピュータを更に機能させることも好ましい。
語は、動詞又は形容詞である述語であり、
語対は、述語対であり、
係り受け語集合は、名詞集合であり、
特徴係り受け語集合は、特徴名詞集合である
ようにコンピュータを更に機能させることも好ましい。
第7のステップについて、第2のステップにおける類似度として相互情報量を用い所定閾値以上となる対のみをクラスタリングするようにコンピュータを更に機能させることも好ましい。
多数の文書情報を蓄積した文章集合蓄積部を有し、
文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する第1のステップと、
語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する第2のステップと、
第2のステップによって抽出された語対について、文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する第3のステップと、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する第4のステップと、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する文書集合中の出現頻度とを計数する第5のステップと、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する第6のステップと、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する第7のステップと
を有することを特徴とする。
多数の文書情報を蓄積した文章集合蓄積手段と、
文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する語対抽出手段と、
語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する類似語対抽出手段と、
類似語対抽出手段によって抽出された語対について、文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する係り受け語集合抽出手段と、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する特徴係り受け語集合抽出手段と、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する文書集合中の出現頻度とを計数する係り受け語出現頻度計数手段と、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する語対類似度算出手段と、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する語対クラスタ生成手段と
を有することを特徴とする。
単純語 :「山」
複合語 :「山登り」
内容語の例:名詞(吉野山)、動詞(行く)、形容詞(きれい)
機能語の例:助詞(が,を,に,の)、助動詞(れる,られる,た)
名詞対 :(桜,ソメイヨシノ)、(ビアパーティー,枝豆)
動詞/形容詞対:(寝る,起きる)、(早い,起きる)、(速い,すばやい)
(a)名詞間関係(桜,ソメイヨシノ) :上位下位関係
(b)動詞間関係(寝る,起きる) :因果関係
(c)名詞間関係(ビアパーティー,枝豆):「イベント−イベントに必須の道具」関係
例えば、前述の(a)(b)は、FellBaumらによる関係分類に属する関係である。これに対し、前述の(c)は、FellBaumらによる関係分類に属する関係ではない。本発明によれば、このような意味的関係も考慮して分類することができ、関係分類の定義のための膨大な人手によるコストを要しない。
(S1)文章集合蓄積部に蓄積されている文章から、複数の語対が抽出される。「語対」は、第1の語及び第2の語からなる。
(S2)抽出された語対の中から、第1の語及び第2の語が共起しやすい語対のみが抽出される。
(S3)S2によって抽出された語対について、文章集合蓄積部から、第1の語と共起する第1の係り受け語集合と、第2の語と共起する第2の係り受け語集合とが抽出される。
(S4)第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合合に出現しない係り受け語からなる第2の特徴係り受け語集合とが抽出される。
(S5)第1の特徴係り受け語集合に属する係り受け語毎に、文章集合蓄積部に蓄積されている文章中の、第1の語と共起する係り受け語の出現頻度が計数される。同様に、第2の特徴係り受け語集合に属する係り受け語毎に、文章集合蓄積部に蓄積されている文章中の、第2の語と共起する係り受け語の出現頻度が計数される。
(S6)第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度を表す第1のベクトルが生成される。同様に、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度を表す第2のベクトルが生成される。第1のベクトルと第2のベクトルとを結合したベクトルが導出される。
(S7)S6で生成されたベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する。
パターン:「<n1>の<n2>」
「<n1>で<n2>」
[文章] [名詞対]
「吉野山の桜をみたい」 ==> (吉野山,桜)
「新宿御苑のソメイヨシノはきれいだ」 ==> (新宿御苑,ソメイヨシノ)
「庭の桜が咲く」 ==> (庭,桜)
名詞対<吉野山,桜>
名詞「吉野山」 ==>述語集合{行く,植樹する,立ち寄る,咲く}
名詞「桜」 ==>述語集合{咲く,植樹する,守る,みる}
名詞対<新宿御苑,ソメイヨシノ>
名詞「新宿御苑」 ==>述語集合{行く,整備する,立ち寄る}
名詞「ソメイヨシノ」==>述語集合{咲く,植樹する,守る,みる}
名詞対<庭,桜>
名詞「庭」 ==>述語集合{手入れする,植樹する,掃除する}
名詞「桜」 ==>述語集合{咲く,植樹する,みる}
名詞対<吉野山,桜>
名詞「吉野山」 ==>特徴述語集合{行く,立ち寄る}
名詞「桜」 ==>特徴述語集合{守る,みる}
名詞対<新宿御苑,ソメイヨシノ>
名詞「新宿御苑」 ==>特徴述語集合{行く,整備する,立ち寄る}
名詞「ソメイヨシノ」==>特徴述語集合{咲く,植樹する,守る,みる}
名詞対<庭,桜>
名詞「庭」 ==>特徴述語集合{手入れする,掃除する}
名詞「桜」 ==>特徴述語集合{咲く,みる}
いずれの名詞対についても、第1の名詞と共起する第1の特徴述語集合には、共通して「行く」「立ち寄る」が含まれており、第2の名詞と共起する第2の特徴述語集合には、共通して「みる」「守る」が含まれている。従って、これらの名詞対は類似性が高い、と判断される。
両方の名詞対は、第2の名詞「桜」で共通する。しかしながら、名詞対<吉野山,桜>の第1の名詞「吉野山」と共起する第1の特徴述語集合には、「行く」「立ち寄る」のように場所に関する述語である。これに対し、名詞対<庭,桜>の第1の名詞「庭」と共起する第1の特徴述語集合には、「手入れする」「掃除する」などの造園に関する述語である。即ち、2つの名詞対で共通する述語が異なる。従って、これらの名詞対は類似性が低い、と判断される。
freq(吉野山,行く) =132回
freq(吉野山,立ち寄る)=76回
freq(桜,守る) =63回
freq(桜,みる) =142回
freq(n,p):名詞nと共起する述語pの出現頻度
freq_np=[freq(n,p1),freq(n,p2)…..]T
名詞「吉野山」に関するベクトル:freq_np1'=[…,132,…,76,… ]T
名詞「桜」に関するベクトル :freq_np2'=[ …,63,…,142,…]T
f(吉野山,桜)=[…,行く,…,立ち寄る,…,守る,…,みる,…]T
f(吉野山,桜)=[…,132, …,76, …,63, …,142, …]T
名詞対 ベクトル クラスタID クラスタ寄与度
f(吉野山,桜) =[132,76,63,142]T r1 0.8
f(新宿御苑,ソメイヨシノ)=[130,78,63,140]T r1 0.85
パターン:「<p1>ながら<p2>」
「<p1>て<p2>」
[文章] [述語対]
「吉野山を歩きながら、桜をみる」 ==> (歩く,みる)
「新宿御苑に行って、桜をみる」 ==> (行く,みる)
述語対<歩く,みる>
述語「歩く」 ==>名詞集合{公園,道,山,街}
述語「みる」 ==>名詞集合{花,山,森,街}
述語対<行く,みる>
述語「行く」 ==>名詞集合{会社,学校,山,街}
述語「みる」 ==>名詞集合{花,山,森,街}
述語対<歩く,みる>
述語「歩く」 ==>特徴名詞集合{公園,道}
述語「みる」 ==>特徴名詞集合{花,森}
述語対<行く,みる>
述語「行く」 ==>名詞集合{会社,学校}
述語「みる」 ==>名詞集合{花,森}
freq(歩く,公園)=128回
freq(歩く,道) =60回
freq(みる,花) =48回
freq(みる,森) =122回
freq(p,n):述語pと共起する名詞nの出現頻度
freq_pn=[freq(p,n1),freq(p,n2)…..]T
述語「歩く」に関するベクトル:freq_pn1'=[…,128,…,60,… ]T
述語「みる」に関するベクトル:freq_pn2'=[ …,48,…,122,…]T
f(歩く,みる)=[…,公園,…,道,…,花,…,森,…]T
f(歩く,みる)=[…,128, …,60,…,48,…,122,…]T
名詞対 ベクトル クラスタID クラスタ寄与度
f(歩く,みる) =[128,60,48,122]T r1 0.9
f(行く,みる) =[130,60,45,121]T r1 0.7
10 文章集合蓄積部
11 語対抽出部
12 類似語対抽出部
13 係り受け語集合抽出部
14 特徴係り受け語集合抽出部
15 語出現頻度計数部
16 語対類似度算出部
17 語対クラスタ生成部
Claims (6)
- 語対を意味的な二項関係に分類するために、装置に搭載されたコンピュータを実行させる二項関係分類プログラムにおいて、
多数の文書情報を蓄積した文章集合蓄積部を有し、
前記文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する第1のステップと、
前記語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する第2のステップと、
第2のステップによって抽出された前記語対について、前記文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する第3のステップと、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する第4のステップと、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する前記文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する前記文書集合中の出現頻度とを計数する第5のステップと、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する第6のステップと、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する第7のステップと
してコンピュータを機能させることを特徴とする二項関係分類プログラム。 - 前記語は、名詞であり、
前記語対は、名詞対であり、
前記係り受け語集合は、述語集合であり、
前記述語は、動詞又は形容詞であり、
前記特徴係り受け語集合は、特徴述語集合である
ようにコンピュータを更に機能させることを特徴とする請求項1に記載の二項関係分類プログラム。 - 前記語は、動詞又は形容詞である述語であり、
前記語対は、述語対であり、
前記係り受け語集合は、名詞集合であり、
前記特徴係り受け語集合は、特徴名詞集合である
ようにコンピュータを更に機能させることを特徴とする請求項1に記載の二項関係分類プログラム。 - 第7のステップについて、第2のステップにおける前記類似度として相互情報量を用い所定閾値以上となる対のみをクラスタリングするようにコンピュータを更に機能させることを特徴とする請求項1から3のいずれか1項に記載の二項関係分類プログラム。
- 語対を意味的な二項関係に分類する装置における二項関係分類方法において、
多数の文書情報を蓄積した文章集合蓄積部を有し、
前記文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する第1のステップと、
前記語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する第2のステップと、
第2のステップによって抽出された前記語対について、前記文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する第3のステップと、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する第4のステップと、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する前記文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する前記文書集合中の出現頻度とを計数する第5のステップと、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する係り受け語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する第6のステップと、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する第7のステップと
を有することを特徴とする二項関係分類方法。 - 語対を意味的な二項関係に分類する装置における二項関係分類装置において、
多数の文書情報を蓄積した文章集合蓄積手段と、
前記文章集合蓄積部から、第1の語及び第2の語からなる複数の語対を抽出する語対抽出手段と、
前記語対の中で共起しやすさを表す類似度が、所定閾値以上となる語対を抽出する類似語対抽出手段と、
前記類似語対抽出手段によって抽出された前記語対について、前記文章集合蓄積部から、第1の語に共起する第1の係り受け語集合と、第2の語に共起する第2の係り受け語集合とを抽出する係り受け語集合抽出手段と、
第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する特徴係り受け語集合抽出手段と、
第1の特徴係り受け語集合に属する係り受け語毎に、第1の語と共起する前記文書集合中の出現頻度と、第2の特徴係り受け語集合に属する係り受け語毎に、第2の語と共起する前記文書集合中の出現頻度とを計数する係り受け語出現頻度計数手段と、
第1の語に基づく第1の特徴係り受け語集合に属する係り受け語毎の出現頻度と、第2の語に基づく第2の特徴係り受け語集合に属する語毎の出現頻度とを、係り受け語を固定の要素順に並べた各出現頻度のベクトルを導出する語対類似度算出手段と、
ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する語対クラスタ生成手段と
を有することを特徴とする二項関係分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010185391A JP5504097B2 (ja) | 2010-08-20 | 2010-08-20 | 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010185391A JP5504097B2 (ja) | 2010-08-20 | 2010-08-20 | 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012043294A JP2012043294A (ja) | 2012-03-01 |
JP5504097B2 true JP5504097B2 (ja) | 2014-05-28 |
Family
ID=45899492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010185391A Active JP5504097B2 (ja) | 2010-08-20 | 2010-08-20 | 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5504097B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321404A (zh) * | 2019-07-10 | 2019-10-11 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
CN110334215A (zh) * | 2019-07-10 | 2019-10-15 | 北京麒才教育科技有限公司 | 词汇学习框架的构建方法、装置、电子设备及存储介质 |
US11107096B1 (en) * | 2019-06-27 | 2021-08-31 | 0965688 Bc Ltd | Survey analysis process for extracting and organizing dynamic textual content to use as input to structural equation modeling (SEM) for survey analysis in order to understand how customer experiences drive customer decisions |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5916016B2 (ja) * | 2012-12-17 | 2016-05-11 | 日本電信電話株式会社 | 同義判定装置、同義学習装置、及びプログラム |
JP2020187419A (ja) | 2019-05-10 | 2020-11-19 | 富士通株式会社 | エンティティリンキング方法、情報処理装置およびエンティティリンキングプログラム |
CN111814456A (zh) * | 2020-05-25 | 2020-10-23 | 国网上海市电力公司 | 一种基于动词的中文文本相似度计算方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102272754B (zh) * | 2008-11-05 | 2015-04-01 | 谷歌公司 | 定制语言模型 |
JP5474704B2 (ja) * | 2010-08-16 | 2014-04-16 | Kddi株式会社 | 意味的に類似している事態対を二項関係に分類する二項関係分類プログラム、方法及び装置 |
-
2010
- 2010-08-20 JP JP2010185391A patent/JP5504097B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11107096B1 (en) * | 2019-06-27 | 2021-08-31 | 0965688 Bc Ltd | Survey analysis process for extracting and organizing dynamic textual content to use as input to structural equation modeling (SEM) for survey analysis in order to understand how customer experiences drive customer decisions |
CN110321404A (zh) * | 2019-07-10 | 2019-10-11 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
CN110334215A (zh) * | 2019-07-10 | 2019-10-15 | 北京麒才教育科技有限公司 | 词汇学习框架的构建方法、装置、电子设备及存储介质 |
CN110321404B (zh) * | 2019-07-10 | 2021-08-10 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2012043294A (ja) | 2012-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Andhale et al. | An overview of text summarization techniques | |
Sonawane et al. | Graph based representation and analysis of text document: A survey of techniques | |
Hajar | Using YouTube comments for text-based emotion recognition | |
US7685118B2 (en) | Method using ontology and user query processing to solve inventor problems and user problems | |
US9633005B2 (en) | Exhaustive automatic processing of textual information | |
Vicient et al. | An automatic approach for ontology-based feature extraction from heterogeneous textualresources | |
CN106844331A (zh) | 一种句子相似度计算方法和系统 | |
JP5504097B2 (ja) | 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 | |
JP5474704B2 (ja) | 意味的に類似している事態対を二項関係に分類する二項関係分類プログラム、方法及び装置 | |
CN109783806A (zh) | 一种利用语义解析结构的文本匹配方法 | |
Rajagopal et al. | Commonsense-based topic modeling | |
Krzywicki et al. | Data mining for building knowledge bases: techniques, architectures and applications | |
Yang et al. | Ontology generation for large email collections. | |
CN115757819A (zh) | 裁判文书中引用法条信息获取方法及装置 | |
Guo et al. | Topic mining for call centers based on A‐LDA and distributed computing | |
Jiang et al. | A semantic-based approach to service clustering from service documents | |
Huang et al. | Learning to identify comparative sentences in Chinese text | |
Kian et al. | An efficient approach for keyword selection; improving accessibility of web contents by general search engines | |
Jayabharathy et al. | Correlation based multi-document summarization for scientific articles and news group | |
Aslam et al. | A Semantic Query Interpreter framework by using knowledge bases for image search and retrieval | |
AlAgha et al. | An Efficient Approach For Semantically-Enhanced Document Clustering By Using Wikipedia Link Structure | |
Xu et al. | Open relation extraction from chinese microblog text | |
Kulkarni et al. | System for collective entity disambiguation | |
Shirai et al. | Context-based Query using Dependency Structures based on Latent Topic Model | |
Saruladha et al. | Design of new indexing techniques based on ontology for information retrieval systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140317 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5504097 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |