JP2015118498A - 同一意図の類似文を作成するプログラム、装置及び方法 - Google Patents
同一意図の類似文を作成するプログラム、装置及び方法 Download PDFInfo
- Publication number
- JP2015118498A JP2015118498A JP2013260804A JP2013260804A JP2015118498A JP 2015118498 A JP2015118498 A JP 2015118498A JP 2013260804 A JP2013260804 A JP 2013260804A JP 2013260804 A JP2013260804 A JP 2013260804A JP 2015118498 A JP2015118498 A JP 2015118498A
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- word
- seed
- sentence
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】シード文で係り合う第1シード語及び第2シード語を検出し、類義語データベースを用いて、シード語に類似する類義語を検索する。次に、同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出する。次に、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する。そして、シード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する。最後に、シード語と各類義語とが共起する類似文を作成する。
【選択図】図1
Description
上位意図「指定なしのルート変更意図」とそれに属する文「ルートを選択したい」、
->下位意図「一般道優先のルート変更意図」
それに属する文「一般道優先ルートを選択」、「下道で行く」、
->下位意図「有料道優先のルート変更意図」
それに属する文「有料優先ルートで行く」、「有料優先ルートがいいな」
この場合、これらの階層に属する文の一致部分と不一致部分から、以下のような新しい文を生成することで、発話文を拡充する。
->下位意図「一般道優先のルート変更意図」
それに属する文「一般道優先ルートがいいな」、「下道がいいな」
->下位意図「有料道優先のルート変更意図」
それに属する文「有料優先ルートを選択」、「有料優先ルートを選択」
上位意図「メール作成意図」とそれに属する文「新規メール」
->下位意図「返信メール作成意図」
それに属する文「メールを返信する」
この場合、下位意図に「新規メールを返信する」といった不自然な文が生成される。
また、特許文献1に記載の技術によれば、上位意図に対しては文を生成することができない。
任意の同一意図文をシード文の中で係り合うシード語を検出するシード文解析手段と、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する類義語検索手段と、
同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出するシード語共起ベクトル算出手段と、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する類義語共起ベクトル算出手段と、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する類義語選択手段と、
シード語と各類義語とが共起する類似文を作成する類似文作成手段と
してコンピュータを機能させることを特徴とする。
シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
類義語検索手段は、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
シード語共起ベクトル算出手段は、同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
類義語選択手段は、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
してコンピュータを機能させることも好ましい。
各共起ベクトルは、各文脈語の出現頻度から相互情報量基準によって共起強度を算出し、該共起強度を正規化した値を要素に対応付けたものである
ようにコンピュータを機能させることも好ましい。
類義語選択手段は、選択すべき類義語を所定個数以下とする
ようにコンピュータを機能させることも好ましい。
任意の同一意図文をシード文の中で係り合うシード語を検出するシード文解析手段と、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する類義語検索手段と、
同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出するシード語共起ベクトル算出手段と、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する類義語共起ベクトル算出手段と、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する類義語選択手段と、
シード語と各類義語とが共起する類似文を作成する類似文作成手段と
してコンピュータを機能させることを特徴とする。
シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
類義語検索手段は、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
シード語共起ベクトル算出手段は、同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
類義語選択手段は、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
ことも好ましい。
任意の同一意図文をシード文の中で係り合うシード語を検出する第1のステップと、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する第2のステップと、
同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出する第3のステップと、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する第4のステップと、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する第5のステップと、
シード語と各類義語とが共起する類似文を作成する第6のステップと
を有することを特徴とする。
第1のステップは、シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
第2のステップは、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
第3のステップは、同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
第4のステップは、類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
第5のステップは、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
第6のステップは、類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
ことも好ましい。
一般文データベース101は、大量の一般文(テキストデータ)を蓄積する。大量の一般文は、マスメディアによって配信されたものや、Webサーバ上のブログやSNSによって発信されたものである。
文:「父からCメールが届きました」
BOS/父/から/Cメール/が/届き/まし/た/EOS
文:「設定された地点まで到達しないと完了しない」
BOS/設定さ/れ/た/地点/まで/到達し/ない/と
/完了し/ない/EOS
尚、文節毎に文節IDが付与されて、係り元文節から見て、係り先文節の文節IDが対応付けられている(係り先が無い場合には−1が付与されている)。
共起対(w1,w2,w3)
w1:係り元の名詞・動詞・形容詞
w2:係り先の連続する助詞・助動詞列(機能語)
w3:係り先の名詞・動詞・形容詞
共起対(w1,w2,w3)
[単語]->[文脈語]
w1->(L_+w2;w3):w1に後置するw2とw3との対
w3->(F_+w1;w2):w3に前置するw1とw2との対
図2(c)によれば、共起対毎に以下のように区分され、出現頻度が表されている。
共起対(父,から,届く) :出現頻度123回
父 ->(L_+から;届く)
届く ->(F_+父 ;から)
共起対(Cメール,が,届く):出現頻度326回
Cメール->(L_+が ;届く)
届く ->(F_+Cメール;が)
尚、一般文データベース全体の中での各単語wの出現頻度C(w)を記憶すると共に、全単語の出現数C(*)も記憶する。
同一意図文データベース101は、複数の同一意図文(例えば発話文例)の集合を登録したものである。
文:「メールは届いていますか」
BOS/メール/は/届い/て/い/ます/か/EOS
文:「Eメールを確認したい」
BOS/Eメール/を/確認し/たい/EOS
共起対(メール,は,届く) :出現頻度24回
メール ->(L_+は ;届く)
届く ->(F_+メール;は)
共起対(Eメール,を,確認する):出現頻度11回
Eメール->(L_+を ;確認する)
確認する->(F_+Eメール;を)
尚、同一意図文データベース全体の中での各単語wの出現頻度C(w)を記憶すると共に、全単語の出現数C(*)も記憶する。
類義語データベース103は、各単語に対する類義語を登録した既存のデータベースである。
・「新しい」「斬新」「新型」「新着」「新規」「新鮮」「目新しい」
・「メッセージ」「郵便」「Cメール」「メール」「伝言」「手紙」「Eメール」「ショートメール」
・「至る」「到着する」「届く」「来る」「受信する」「着信する」「受け取る」「到達する」
シード文解析部11は、任意の同一意図文をシード文の中で係り合うシード語を検出する。具体的には、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出する。図3の同一意図文データベース102から、以下の同一意図文をシード文としたとする。
シード文:「メールは届いていますか」
BOS/メール/は/届い/て/い/ます/か/EOS
第1シード語「メール」
第2シード語「届く」
「シード文」とは「種」文を意味し、そのシード文の中で係り合う第1シード語及び第2シード語が検出される。
類義語検索部12は、類義語データベース103を用いて、シード語に類似する1つ以上の類義語を検索する。具体的には、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索する。
図4によれば、第1シード語「メール」及び第2シード語「届く」について、以下のような類義語が検索される。
第1シード語「メール」 「は」 第2シード語「届く」
->第1類義語「メッセージ」 ->第2類義語「至っ」
「郵便」 「到着し」
「Cメール」 「来る」
「伝言」 「受信し」
「手紙」 「着信し」
「Eメール」 「受け取っ」
「ショートメール」 「到達し」
これら類義語は、シード文に対する類似文を作成する際に、置換候補となる語である。
シード語共起ベクトル算出部13は、同一意図文データベース102を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出する。具体的には、以下の共起ベクトルを算出する。
「第1シード語共起ベクトル」第1シード語に係る各文脈語の出現頻度からなる
「第2シード語共起ベクトル」第2シード語に係る各文脈語の出現頻度からなる
類義語共起ベクトル算出部14は、一般文データベース101を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する。具体的には、以下の共起ベクトルを算出する。
「第1類義語共起ベクトル」各第1類義語に係る各文脈語の出現頻度からなる
「第2類義語共起ベクトル」各第2類義語に係る各文脈語の出現頻度からなる
図5(b)によれば、一般文データベース101を用いて、各第1類義語及び各文脈語の共起対に対する出現頻度、共起強度及び共起ベクトルが表されている。
ここで、共起ベクトルの要素となる文脈語の並びは、全ての共起ベクトルで共通である。従って、文脈語の数を次元数とするベクトルとして表される。
図6(b)によれば、一般文データベース101を用いて、各第2類義語及び各文脈語の共起対に対する出現頻度、共起強度及び共起ベクトルが表されている。
(S1)最初に、データベース全体の中で、単語w及び各文脈語が出現する出現頻度C(w,s)を算出する。
pmi(w,s)=log2{(C(*)・C(w,s))/(C(w)・C(s))}
図5(a)によれば、例えば以下のように算出されている。
pmi(メール,(L_を:書く))
=log2{(C(*)・C(メール,(L_を:書く))/
(C(メール)・C(L_を:書く))}
類義語選択部15は、シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する。具体的には、以下のような第1類義語と第2類義語とを選択する。
(1)第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語
(2)第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語
例えば類義語候補「手紙」は、第1シード語「メール」と比較して文章中での使われ方が異なるために、共起類似度は低い値となる。
例えば類義語候補「来る」は、第1シード語「届く」と比較して文章中での使われ方が異なるために、共起類似度は低い値となる。
類似文作成部16は、シード語と各類義語とが共起する類似文を作成する。具体的には、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する。
シード文「メールは届いていますか」
「Eメール」 「は」「届いていますか」
「Cメール」 「は」「届いていますか」
「ショートメール」「は」「届いていますか」
「メッセージ」 「は」「届いていますか」
「メール」 「は」「受信していますか」
「Eメール」 「は」「受信していますか」
・・・・・
「メール」 「は」「到着していますか」
「Eメール」 「は」「到着していますか」
・・・・・
「メール」 「は」「着信していますか」
「Eメール」 「は」「着信していますか」
・・・・・
「メール」 「は」「受け取っていますか」
「Eメール」 「は」「受け取っていますか」
・・・・・
×「メールは至っていますか」
×「メールは到達していますか」
本発明によれば、シード文「メールは届いていますか」に対して、類義語「至る」「到達する」等が除外されることとなる。
101 一般文データベース
102 同一意図文データベース
103 類義語データベース
11 シード文解析部
12 類義語検索部
13 シード語共起ベクトル算出部
14 類義語共起ベクトル算出部
15 類義語選択部
16 類似文作成部
2 ユーザ端末
3 外部サーバ
Claims (8)
- 同一意図の類似文を作成するようにコンピュータを機能させるプログラムであって、
任意の同一意図文をシード文の中で係り合うシード語を検出するシード文解析手段と、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する類義語検索手段と、
前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出するシード語共起ベクトル算出手段と、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する類義語共起ベクトル算出手段と、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する類義語選択手段と、
シード語と各類義語とが共起する類似文を作成する類似文作成手段と
してコンピュータを機能させることを特徴とするプログラム。 - 前記シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
前記類義語検索手段は、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
前記シード語共起ベクトル算出手段は、前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
前記類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
前記類義語選択手段は、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
前記類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
してコンピュータを機能させることを特徴とする請求項1に記載のプログラム。 - 各共起ベクトルは、各文脈語の出現頻度から相互情報量基準によって共起強度を算出し、該共起強度を正規化した値を前記要素に対応付けたものである
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。 - 前記類義語選択手段は、選択すべき類義語を所定個数以下とする
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。 - 同一意図の類似文を作成する装置であって、
任意の同一意図文をシード文の中で係り合うシード語を検出するシード文解析手段と、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する類義語検索手段と、
前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出するシード語共起ベクトル算出手段と、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する類義語共起ベクトル算出手段と、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する類義語選択手段と、
シード語と各類義語とが共起する類似文を作成する類似文作成手段と
してコンピュータを機能させることを特徴とする装置。 - 前記シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
前記類義語検索手段は、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
前記シード語共起ベクトル算出手段は、前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
前記類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
前記類義語選択手段は、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
前記類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
ことを特徴とする請求項5に記載の装置。 - 装置を用いて、同一意図の類似文を作成する方法であって、
任意の同一意図文をシード文の中で係り合うシード語を検出する第1のステップと、
類義語データベースを用いて、シード語に類似する1つ以上の類義語を検索する第2のステップと、
前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、シード語に係る各文脈語の出現頻度からなるシード語共起ベクトルを算出する第3のステップと、
大量の一般文集合を参照し、各文脈語をベクトルの要素として、各類義語に係る各文脈語の出現頻度からなる類義語共起ベクトルを算出する第4のステップと、
シード語に対するシード語共起ベクトルと比較して所定閾値以上の類似度となる類義語共起ベクトルの類義語を選択する第5のステップと、
シード語と各類義語とが共起する類似文を作成する第6のステップと
を有することを特徴とする方法。 - 第1のステップは、前記シード文解析手段は、任意の同一意図文をシード文として、その中で係り合う第1シード語及び第2シード語を検出し、
第2のステップは、類義語データベースを用いて、第1シード語に類似する1つ以上の第1類義語と、第2シード語に類似する1つ以上の第2類義語とを検索し、
第3のステップは、前記同一意図文の集合を参照し、各文脈語をベクトルの要素として、第1シード語に係る各文脈語の出現頻度からなる第1シード語共起ベクトルと、第2シード語に係る各文脈語の出現頻度からなる第2シード語共起ベクトルとを算出し、
第4のステップは、前記類義語共起ベクトル算出手段は、大量の一般文集合を参照し、各文脈語をベクトルの要素として、各第1類義語に係る各文脈語の出現頻度からなる第1類義語共起ベクトルと、各第2類義語に係る各文脈語の出現頻度からなる第2類義語共起ベクトルとを算出し、
第5のステップは、第1シード語に対する第1シード語共起ベクトルと比較して所定閾値以上の類似度となる第1類義語共起ベクトルの第1類義語と、第2シード語に対する第2シード語共起ベクトルと比較して所定閾値以上の類似度となる第2類義語共起ベクトルの第2類義語とを選択し、
第6のステップは、前記類似文作成手段は、第1シード語と各第2類義語とが共起する類似文と、各第1類義語と第2シード語と共起する類似文とを作成する
ことを特徴とする請求項7に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013260804A JP6251562B2 (ja) | 2013-12-18 | 2013-12-18 | 同一意図の類似文を作成するプログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013260804A JP6251562B2 (ja) | 2013-12-18 | 2013-12-18 | 同一意図の類似文を作成するプログラム、装置及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015118498A true JP2015118498A (ja) | 2015-06-25 |
JP2015118498A5 JP2015118498A5 (ja) | 2016-08-25 |
JP6251562B2 JP6251562B2 (ja) | 2017-12-20 |
Family
ID=53531178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013260804A Active JP6251562B2 (ja) | 2013-12-18 | 2013-12-18 | 同一意図の類似文を作成するプログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6251562B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9916304B2 (en) | 2016-02-01 | 2018-03-13 | Panasonic Intellectual Property Management Co., Ltd. | Method of creating translation corpus |
JP2018055670A (ja) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム |
US10318642B2 (en) | 2016-02-01 | 2019-06-11 | Panasonic Intellectual Property Management Co., Ltd. | Method for generating paraphrases for use in machine translation system |
US10650195B2 (en) | 2017-05-23 | 2020-05-12 | Panasonic Intellectual Property Management Co., Ltd. | Translated-clause generating method, translated-clause generating apparatus, and recording medium |
CN111373391A (zh) * | 2017-11-29 | 2020-07-03 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
WO2022244106A1 (ja) * | 2021-05-18 | 2022-11-24 | 日本電信電話株式会社 | データ変換装置、データ変換方法、及び、データ変換プログラム |
JP7434125B2 (ja) | 2020-09-16 | 2024-02-20 | 株式会社東芝 | 文書検索装置、文書検索方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2011175574A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Hoso Kyokai <Nhk> | 文書平易化装置および平易化規則テーブル作成装置、ならびにプログラム |
-
2013
- 2013-12-18 JP JP2013260804A patent/JP6251562B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2011175574A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Hoso Kyokai <Nhk> | 文書平易化装置および平易化規則テーブル作成装置、ならびにプログラム |
Non-Patent Citations (1)
Title |
---|
野崎 徹郎 外1名: "単語の難易度比較を用いた文章簡略化システム", 第74回(平成24年)全国大会講演論文集(2) 人工知能と認知科学, JPN6017022400, 6 March 2012 (2012-03-06), JP, pages 2 - 627, ISSN: 0003581812 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9916304B2 (en) | 2016-02-01 | 2018-03-13 | Panasonic Intellectual Property Management Co., Ltd. | Method of creating translation corpus |
US10318642B2 (en) | 2016-02-01 | 2019-06-11 | Panasonic Intellectual Property Management Co., Ltd. | Method for generating paraphrases for use in machine translation system |
JP2018055670A (ja) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム |
US10650195B2 (en) | 2017-05-23 | 2020-05-12 | Panasonic Intellectual Property Management Co., Ltd. | Translated-clause generating method, translated-clause generating apparatus, and recording medium |
CN111373391A (zh) * | 2017-11-29 | 2020-07-03 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
CN111373391B (zh) * | 2017-11-29 | 2023-10-20 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
JP7434125B2 (ja) | 2020-09-16 | 2024-02-20 | 株式会社東芝 | 文書検索装置、文書検索方法、及びプログラム |
WO2022244106A1 (ja) * | 2021-05-18 | 2022-11-24 | 日本電信電話株式会社 | データ変換装置、データ変換方法、及び、データ変換プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6251562B2 (ja) | 2017-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251562B2 (ja) | 同一意図の類似文を作成するプログラム、装置及び方法 | |
US10282468B2 (en) | Document-based requirement identification and extraction | |
US7636657B2 (en) | Method and apparatus for automatic grammar generation from data entries | |
Gräbner et al. | Classification of customer reviews based on sentiment analysis | |
US9524291B2 (en) | Visual display of semantic information | |
US7269544B2 (en) | System and method for identifying special word usage in a document | |
JP5831951B2 (ja) | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
Tabassum et al. | A survey on text pre-processing & feature extraction techniques in natural language processing | |
US9436681B1 (en) | Natural language translation techniques | |
JP6663826B2 (ja) | 計算機及び応答の生成方法 | |
US20180053235A1 (en) | Unbiased search and user feedback analytics | |
US11328712B2 (en) | Domain specific correction of output from automatic speech recognition | |
Ingólfsdóttir et al. | Named entity recognition for icelandic: Annotated corpus and models | |
KR102206781B1 (ko) | 지식 기반 추론 및 신뢰도 분석을 이용한 가짜뉴스 판별 방법, 이를 수행하기 위한 기록매체 및 장치 | |
JP6049201B2 (ja) | 類義語を検出するための共起パターンを生成するプログラム、方法、装置及びサーバ | |
Baqapuri | Twitter sentiment analysis | |
Melero et al. | Holaaa!! writin like u talk is kewl but kinda hard 4 NLP | |
JP5364529B2 (ja) | 辞書登録装置、文書ラベル判定システムおよび辞書登録プログラム | |
Han et al. | A Method for Extracting Lexicon for Sentiment Analysis Based on Morphological Sentence Patterns | |
JP5506482B2 (ja) | 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム | |
Oudah et al. | Studying the impact of language-independent and language-specific features on hybrid Arabic Person name recognition | |
JP7312841B2 (ja) | 法律分析装置、及び法律分析方法 | |
JP6058563B2 (ja) | モデル学習装置、フィルタ装置、方法、及びプログラム | |
Rahamatallah et al. | Constructing opinion mining model of sudanese telecom products |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6251562 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |