JP6232358B2 - 次発話候補ランキング装置、方法、及びプログラム - Google Patents

次発話候補ランキング装置、方法、及びプログラム Download PDF

Info

Publication number
JP6232358B2
JP6232358B2 JP2014173122A JP2014173122A JP6232358B2 JP 6232358 B2 JP6232358 B2 JP 6232358B2 JP 2014173122 A JP2014173122 A JP 2014173122A JP 2014173122 A JP2014173122 A JP 2014173122A JP 6232358 B2 JP6232358 B2 JP 6232358B2
Authority
JP
Japan
Prior art keywords
utterance
next utterance
concept
candidate
utterance candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014173122A
Other languages
English (en)
Other versions
JP2016048463A (ja
Inventor
克人 別所
克人 別所
東中 竜一郎
竜一郎 東中
牧野 俊朗
俊朗 牧野
松尾 義博
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014173122A priority Critical patent/JP6232358B2/ja
Publication of JP2016048463A publication Critical patent/JP2016048463A/ja
Application granted granted Critical
Publication of JP6232358B2 publication Critical patent/JP6232358B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザとの間で対話を行う対話システムにおいて、ユーザとの間で、ある発話列がやり取りされた後、システムが生成した次発話候補集合の中で、システム側が発する次発話として相応しい次発話候補を決定するための次発話候補ランキング装置、方法、及びプログラムに関する。
非タスク指向型対話システムでは、対話の内容は雑談であり、非特許文献1では、ウェブやツイッター(登録商標)などの文章をデータベース化しておき、ユーザ発話に類似するものを選択することでシステム発話を生成する。
これまでやり取りされてきた発話列における焦点(トピック)を求め、当該焦点について言及した文をデータベースから次発話候補として複数取り、この次発話候補をランキングする手法がある。ランキングをした後、ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補をシステムがユーザに返す。
このような手法として、直前のN(≧1)個の発話の列を文脈とし、文脈発話列及び次発話候補における単語や品詞、単語の意味カテゴリ等の特徴量と、事前に教師あり学習で得たモデルとから、該次発話候補が次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングする、結束性に基づく手法がある。
Bessho, F., Harada, T., and Kuniyoshi, Y."Dialog System Using Real-Time Crowdsourcing and Twitter Large-Scale Corpus."InProc. SIGDIAL, pp. 227-231, 2012.
上述した結束性に基づく手法では、単語の意味カテゴリ等の特徴量を用いて、シソーラス上の同一ノードに属する単語の間の意味的類似性を考慮できるが、ノードを超えた単語間の意味的類似性を考慮できないという課題がある。このため、文脈発話列と次発話候補との間で、文字列は異なるが、意味的には類似している単語が存在する場合、該文脈発話列と該次発話候補の類似性が不当に低くなり、該次発話候補が次発話として相応しいにも関わらず、そのスコアが不当に低くなるという課題がある。
本発明の第1の目的は、この課題を解決するため、任意の単語間の意味的類似性を考慮できる次発話候補ランキング装置、方法、及びプログラムを提供することにある。具体的には、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースを利用することにより、この課題を解決する。
上記概念ベースに基づく手法により、任意の単語間の意味的類似性を考慮した次発話候補ランキングができるようになるが、一般に概念ベースでは、名詞・動詞・形容詞等の内容語にのみ概念ベクトルが振られている。次発話として相応しいかは、文脈発話列と次発話候補に含まれる文末表現等の付属語も手掛かりとなり、概念ベースを利用した手法ではそれが考慮されない。また、文脈発話列または次発話候補に内容語が無い等の理由で概念ベクトルが生成されない場合、該次発話候補のスコアを算出できない。
本発明の第2の目的は、この課題を解決するため、結束性に基づく手法と概念ベースに基づく手法それぞれの長所を活かし、短所を他方で補うことにより高精度な次発話候補ランキング装置、方法、及びプログラムを提供することにある。
上記第1の目的を達成するため、本発明に係る次発話候補ランキング装置は、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする概念スコア算出手段と、を含んで構成されている。
また、本発明に係る次発話候補ランキング方法は、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、概念スコア算出手段とを含む次発話候補ランキング装置における次発話候補ランキング方法であって、前記概念スコア算出手段が、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする。
また、本発明のプログラムは、コンピュータを、上記の次発話候補ランキング装置を構成する各手段として機能させるためのプログラムである。
また、上記第2の目的を達成するため、上記の次発話候補ランキング装置は、教師あり学習で得たモデルと、前記発話列A及び前記次発話候補集合における各次発話候補Bに関する特徴量とから、各次発話候補Bに対し、前記次発話候補Bが前記発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする結束スコア算出手段と、前記次発話候補集合における各次発話候補Bに対し、前記概念スコア算出手段によるランキング結果における順位をCとし、前記結束スコア算出手段によるランキング結果における順位をDとしたとき、前記概念スコア算出手段で前記発話列A及び前記次発話候補Bの概念ベクトルが生成される場合は、順位Cと順位Dとを重みづけして足し合わせた値を、前記次発話候補Bの結合順位とし、前記概念スコア算出手段で前記発話列Aまたは前記次発話候補Bの概念ベクトルが生成されない場合は、順位Dを前記次発話候補Bの結合順位とし、前記結合順位の昇順に前記次発話候補集合をランキングする統合手段と、を更に含むようにすることができる。
本発明に係る次発話候補ランキング装置、方法、及びプログラムによれば、概念ベースを参照し、発話列Aの概念ベクトルを生成し、次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、発話列Aの概念ベクトルと次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングして、次発話として相応しい発話をシステムが返すことにより、システムとユーザとのインタラクションが円滑になる、という効果を有する。
本発明の実施の形態に係る次発話候補ランキング装置の機能的構成を示すブロック図である。 概念ベースの例を示す図である。 本発明の実施の形態に係る次発話候補ランキング装置における処理ルーチンを示すフローチャート図である。 本発明の実施の形態に係る次発話候補ランキング装置の機能的構成を示すブロック図である。 本発明の実施の形態に係る次発話候補ランキング装置における処理ルーチンを示すフローチャート図である。 評価の結果を示した図である。 重みα毎の評価の結果を示した図である。
以下、図面とともに本発明の実施の形態を説明する。
<次発話候補ランキング装置の構成>
次に、本発明の実施の形態に係る次発話候補ランキング装置の構成について説明する。図1は、本発明の請求項1の次発話候補ランキング装置の構成例である。図1に示すように、本発明の実施の形態に係る次発話候補ランキング装置100は、CPUと、RAMと、後述する処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この次発話候補ランキング装置100は、機能的には図1に示すように入力手段10と、演算手段20と、出力手段30とを備えている。
入力手段10は、入力された文脈となる発話列Aと、次発話候補集合とを受け付ける。
システムとユーザとの間でこれまでやり取りされてきた発話を時系列順に並べて、x1,x2,・・・,xmとする。N(≧1)を定め、当該発話列において、直前のN個の発話の列(x(m-N+1),x(m-N+2),・・・,xm)を、文脈となる発話列Aとして入力する。発話列Aとして、直前までの全発話(x1,x2,・・・,xm)を入力してもよい。
別途、これまでの発話列から抽出した焦点(トピック)について言及した文を、データベースから次発話候補として複数取るものとし、次発話候補集合として入力する。
演算手段20は、概念スコア算出手段21と、概念ベース22とを含んで構成されている。
概念ベース22は、単語(名詞、動詞、形容詞等の内容語)と該単語の意味を表す概念ベクトルとの対の集合を記憶している。図2は、概念ベース22の例である。概念ベース22は、例えば、非特許文献2の手法によって生成する(非特許文献2:別所克人, 内山俊郎, 内山匡, 片岡良治, 奥雅博,“単語・意味属性間共起に基づくコーパス概念ベースの生成方式,”情報処理学会論文誌, Dec. 2008, Vol.49, No.12, pp.3997-4006.)。
内容語は、該内容語の終止形で登録されており、概念ベース22を検索する際は、内容語の終止形で検索する。各内容語の概念ベクトルは長さ1に正規化されたk次元ベクトルであり、意味的に近い内容語の概念ベクトルは、近くに配置されている。内容語同士の類似度は、例えば、対応する概念ベクトル間の内積によって算出する。
もっとも、概念ベース22に内容語以外の単語を登録してもよく、また、与えられたテキストの概念ベクトルを生成する際に、該テキスト中の内容語以外の単語で概念ベース22を検索して取得した単語概念ベクトルも使用してもよい。以下では、概念ベース22には内容語のみが登録されており、与えられたテキストの概念ベクトルを生成する際は、該テキスト中の内容語で概念ベース22を検索して取得した単語概念ベクトルのみを使用するものとして記述する。
図3は、概念スコア算出手段21の処理フローの一例である。図3に沿って、概念スコア算出手段21の処理内容を説明する。
まず、ステップS1において、発話列Aの全発話を単語分割して得られた各内容語で概念ベース22を検索し、取得した概念ベクトルを加算し、その結果得られた概念ベクトルを長さ1に正規化したものを、発話列Aの概念ベクトルVAとして生成する。
そして、ステップS2において、次発話候補集合における各次発話候補Bに対し、次発話候補Bを単語分割して得られた各内容語で概念ベース22を検索し、取得した概念ベクトルを加算し、その結果得られた概念ベクトルを長さ1に正規化したものを、次発話候補Bの概念ベクトルVBとして生成する。
次のステップS3において、次発話候補集合における各次発話候補Bに対し、上記ステップS1で生成された発話列Aの概念ベクトルVA、及び上記ステップS2で生成された次発話候補Bの概念ベクトルVBに基づいて、次発話候補Bのスコアを、以下の式1に従って算出する。
(VA・VB+1)/2 (式1)
ここで、VA・VBは、VAとVBの内積である。スコア値は0以上1以下となり、値が大きい程、発話列Aと次発話候補Bとの意味的な類似度が高い。
ステップS4において、スコアの降順に次発話候補集合をランキングし、処理ルーチンを終了する。これにより、発話列Aとの意味的な類似度の高い順に次発話候補集合がランキングされる。
ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補を、出力手段30によりシステムがユーザに返す。
発話列Aと次発話候補Bとの間で、文字列は異なるが、意味的には類似している単語が存在する場合でも、算出するスコアが高くなるので、本発明により、次発話として相応しい次発話候補が選択されやすくなる。
上記処理では、発話列Aの概念ベクトルを求めた。発話列A中の各発話ごとに概念ベクトルを求めると、ある発話で十分な内容語が無い等の場合に、該発話の概念ベクトルの品質が低いものとなる可能性がある。各発話に十分な内容語が無い場合でも、発話列A全体では、内容語が十分揃うことがあり、そのような場合、発話列Aの概念ベクトルは品質が高いものとなる。上記処理により、より高品質な概念ベクトルを生成できる。
もっともあえて、発話列Aの各発話ごとに概念ベクトルを求め、取得した概念ベクトルの和を長さ1に正規化したものを、発話列Aの概念ベクトルとするというようにしてもよい。
スコア算出の別の手法として、以下の手法もある。例えば、発話列Aの各発話ごとに概念ベクトルを求め、次発話候補Bの概念ベクトルを求める。発話列Aの少なくとも一つの発話の概念ベクトル、及び、次発話候補Bの概念ベクトルが取得できた場合に、取得した全概念ベクトルの重心と、取得した各概念ベクトルとの距離の自乗の平均の平方根を、次発話候補Bのスコアとする。スコア値は0以上となり、値が小さい程、発話列Aと次発話候補Bとの意味的な類似度が高い。スコアの昇順に次発話候補集合をランキングする。
これまで述べたスコア算出の各手法では、発話列Aまたは次発話候補Bから概念ベクトルが生成されない場合は、次発話候補Bのスコアは算出されない。この場合には、スコアが算出されない次発話候補は、スコアが算出された次発話候補よりも順位は低いものとし、スコアが算出されない次発話候補同士はランダムに順序付けすればよい。
図4は、本発明の請求項2の次発話候補ランキング装置の構成例である。なお、上記の構成例と同様の構成については、同一符号を付して説明を省略する。
図4に示すように、本発明の実施の形態に係る次発話候補ランキング装置200は、機能的には図4に示すように入力手段10と、演算手段220と、出力手段30とを備えている。
演算手段220は、概念スコア算出手段21と、概念ベース22と、結束スコア算出手段223と、統合手段224とを含んで構成されている。
概念スコア算出手段21では、請求項1の次発話候補ランキング装置の構成例と同様の処理を行い、次発話候補集合のランキング結果を出力する。
結束スコア算出手段223では、教師あり学習で得た、次発話候補が次発話として相応しい度合いを判定するためのモデルと、発話列A及び次発話候補集合における各次発話候補Bに含まれる単語や品詞等に関する特徴量とから、各次発話候補Bに対し、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングし、次発話候補集合のランキング結果を出力する。本処理は、例えば、以下の第1の手法、又は第2の手法により行われる。
第1の手法では、教師あり学習として、結束性のラベルが付与された発話列について、さまざまな特徴量を抽出し、これらの特徴量が、どのような条件で発話列に含まれているときに結束性が高くなるか、低くなるかを、パターンマイニングの手法で発見する。特徴量としては、対話行為、質問タイプ、述語項構造、固有表現に関する情報、依存構造に関する情報を用いる。発話列におけるこれらの特徴量を、木構造として表す。パターンマイニングによって発見されたパターン(部分木)は、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する処理に用いられる。具体的には、結束性の高さに寄与する部分木を多く含むものを結束性が高いとして、スコアが算出される。
第2の手法では、教師あり学習として、例えば、結束性が高い発話列と結束性が低い発話列をそれぞれ準備し、これらから結束性が高いか低いかを二値分類する分類器を学習する。また、第2の手法においては、雑多な話題を持った対話のような学習事例を、疑似負例を用いて作成する。
具体的には、まず大量の対話データを用意する。人間同士が話した自然な対話であれば何でもよい。そして、これらの対話データから一定の長さの発話列をサンプリングする。この発話列をEとする。同時に、発話列Eの最後の発話を他の発話とランダムに入れ替えた発話列(発話列F)も作成する。発話列Eを正例とし、発話列Fを負例(疑似負例)とすることで、教師あり学習の手法を適用する。
なお、学習手法としてはランキング学習を用いる。具体的には、発話列Fよりも発話列Eが上位にランキングされるようにランキング規則を学習する。
また、第2の手法においては、発話列を表す特徴量として、最後の発話に含まれる単語、品詞、及び意味属性と、それ以前の発話のそれぞれに含まれる単語、品詞、及び意味属性とのすべての組み合わせを特徴量として用いる。
第2の手法では、上述したように教師あり学習で得られたモデルと、発話列A及び次発話候補集合における各次発話候補Bの特徴量とから、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する。
統合手段224は、概念スコア算出手段21が出力した次発話候補集合のランキング結果と、結束スコア算出手段223が出力した次発話候補集合のランキング結果とを入力とする。
次発話候補集合における各次発話候補Bの、概念スコア算出手段21によるランキング結果における順位をCとし、結束スコア算出手段223によるランキング結果における順位をDとする。
次発話候補Bの結合順位Uを以下のようにして算出する。重みαを0以上1以下の定数とする。
概念スコア算出手段21で、発話列A及び次発話候補Bの概念ベクトルが生成される場合、すなわち、次発話候補Bのスコアが算出される場合は、以下の式に従って、結合順位Uを算出する。
U:=α・C+(1-α)・D
概念スコア算出手段21で、発話列Aまたは次発話候補Bの概念ベクトルが生成されない場合、すなわち、次発話候補Bのスコアが算出されない場合は、以下の式に従って、結合順位Uを算出する。
U:=D
統合手段224は、結合順位Uの昇順に次発話候補集合をランキングする。
ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補を、出力手段30によりシステムがユーザに返す。
概念スコア算出手段21でスコアが算出された次発話候補に対しては、概念スコア算出手段21による文脈発話列と次発話候補との意味的類似性を考慮した順位と、結束スコア算出手段223による文脈発話列と次発話候補における内容語以外の言語表現を考慮した順位とを重みづけで足し合わせることにより、両方の長所を加味した結合順位が得られる。
概念スコア算出手段21でスコアが算出されなかった次発話候補に対しては、結束スコア算出手段223による順位を結合順位とすることにより、文脈発話列と次発話候補における内容語以外の言語表現を考慮した順位を反映できる。
図5は、概念スコア算出手段21、結束スコア算出手段223、及び統合手段224による処理フローの一例である。なお、図3の処理フローと同様の処理については、同一符号を付して、詳細な説明を省略する。
まず、ステップS1において、発話列Aの概念ベクトルVAを生成する。ステップS2において、次発話候補集合における各次発話候補Bに対し、次発話候補Bの概念ベクトルVBを生成する。
次のステップS3において、次発話候補集合における各次発話候補Bに対し、上記ステップS1で生成された発話列Aの概念ベクトルVA、及び上記ステップS2で生成された次発話候補Bの概念ベクトルVBに基づいて、次発話候補Bのスコアを、上記の式1に従って算出する。
ステップS4において、スコアの降順に次発話候補集合をランキングする。
次のステップS21において、発話列A及び各次発話候補Bに対し、特徴量を抽出する。ステップS22において、各次発話候補Bに対し、教師あり学習で得られたモデルと、上記ステップS21で抽出された発話列A及び次発話候補Bの特徴量とに基づいて、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する。
そして、ステップS23において、上記ステップS22で算出されたスコアの降順に次発話候補集合をランキングする。
ステップS24において、上記ステップS1、S2で概念ベクトルが生成されたか否かと、上記ステップS4で得られたランキング結果と、上記ステップS23で得られたランキング結果とに基づいて、各次発話候補Bに対し、結合順位Uを算出し、結合順位Uの昇順に次発話候補集合をランキングし、処理ルーチンを終了する。
本発明の手法の評価を以下のようにして行った。
本発明において次発話は、システムがこれまでの文脈に沿って発話するものである。そこで、二人の人間同士の対話ログ(各発話には、話者と話題のタグがつけられている)において、次の条件(1)、(2)を満たす発話境界Eを対象とし、Eの直前発話までの文脈から、Eの直後発話を導出する問題ととらえた。
条件(1) [Eの直前発話の話者]≠[Eの直後発話の話者]
条件(2) [Eの直前発話の話題]=[Eの直後発話の話題]
Eの直前2発話を文脈発話列とし、Eの直後発話を正解とする。対話ログ中で、Eの直後発話からの全発話を次発話候補とし、正解発話を次発話候補ランキング結果において上位にもってこられるかを評価することとした。
評価指標は、MRR(Mean Reciprocal Rank:正解発話の順位の逆数の平均)を用いることとした。この値が高い程、精度が高い。
対話ログは1746個あり、1対話ログ中の発話の数の平均が約39であったため、各対話ログにおいて、発話候補数が約半分の約20となる上記条件を満たす発話境界Eを一つ定めた。これにより対象発話境界は1746個となり、概念スコア算出手段による手法(次発話候補のスコアは、上記式1で算出)と、結束スコア算出手段による手法(次発話候補のスコアは、上記第2の手法で算出)のMRRは図6のようになった。
統合手段において、重みαを0から1まで0.1刻みに変化させた場合のMRRは、図7のようになった。
αを増加させていくにしたがい、MRRは大きくなっていき、最大値に達すると小さくなっていく。上記では、αが0.7のときMRRは最大値0.424をとった。統合手段により、概念スコア算出手段単独のときと比べ、MRRが0.362→0.424のように向上した。
1746個の対象発話境界の中で、概念スコア算出手段で、文脈発話列または正解発話の概念ベクトルが生成されず、正解発話のスコアが算出されなかった境界は、433個(全体の24.8%)であった。このような、概念スコア算出手段でスコアが算出されなかった正解発話に対しては、統合手段で、結束スコア算出手段による順位が採用されており、上位の順位が付与されていると考えられる。
本発明の統合手段における重みαは、事前に、ある評価データにおいて、αを変化させて精度を算出し、最高精度を出したαを採用するというようにしてもよい。
これまで述べた処理をプログラムとして構築し、当該プログラムを通信回線または記録媒体からインストールし、CPU等の手段で実施することが可能である。
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、システムとユーザとの円滑なインタラクションを実現する対話処理技術に適用可能である。
10 入力手段
20、220 演算手段
21 概念スコア算出手段
22 概念ベース
30 出力手段
100、200 次発話候補ランキング装置
223 結束スコア算出手段
224 統合手段

Claims (3)

  1. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、
    文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする概念スコア算出手段と、
    教師あり学習で得たモデルと、前記発話列A及び前記次発話候補集合における各次発話候補Bに関する特徴量とから、各次発話候補Bに対し、前記次発話候補Bが前記発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする結束スコア算出手段と、
    前記次発話候補集合における各次発話候補Bに対し、前記概念スコア算出手段によるランキング結果における順位をCとし、前記結束スコア算出手段によるランキング結果における順位をDとしたとき、前記概念スコア算出手段で前記発話列A及び前記次発話候補Bの概念ベクトルが生成される場合は、順位Cと順位Dとを重みづけして足し合わせた値を、前記次発話候補Bの結合順位とし、前記概念スコア算出手段で前記発話列Aまたは前記次発話候補Bの概念ベクトルが生成されない場合は、順位Dを前記次発話候補Bの結合順位とし、前記結合順位の昇順に前記次発話候補集合をランキングする統合手段と、
    を含むことを特徴とする次発話候補ランキング装置。
  2. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、概念スコア算出手段と、結束スコア算出手段と、統合手段とを含む次発話候補ランキング装置における次発話候補ランキング方法であって、
    前記概念スコア算出手段が、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングし、
    前記結束スコア算出手段が、教師あり学習で得たモデルと、前記発話列A及び前記次発話候補集合における各次発話候補Bに関する特徴量とから、各次発話候補Bに対し、前記次発話候補Bが前記発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングし、
    前記統合手段が、前記次発話候補集合における各次発話候補Bに対し、前記概念スコア算出手段によるランキング結果における順位をCとし、前記結束スコア算出手段によるランキング結果における順位をDとしたとき、前記概念スコア算出手段で前記発話列A及び前記次発話候補Bの概念ベクトルが生成される場合は、順位Cと順位Dとを重みづけして足し合わせた値を、前記次発話候補Bの結合順位とし、前記概念スコア算出手段で前記発話列Aまたは前記次発話候補Bの概念ベクトルが生成されない場合は、順位Dを前記次発話候補Bの結合順位とし、前記結合順位の昇順に前記次発話候補集合をランキングする
    次発話候補ランキング方法。
  3. コンピュータを、請求項記載の次発話候補ランキング装置を構成する各手段として機能させるためのプログラム。
JP2014173122A 2014-08-27 2014-08-27 次発話候補ランキング装置、方法、及びプログラム Active JP6232358B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014173122A JP6232358B2 (ja) 2014-08-27 2014-08-27 次発話候補ランキング装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014173122A JP6232358B2 (ja) 2014-08-27 2014-08-27 次発話候補ランキング装置、方法、及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017194166A Division JP6574469B2 (ja) 2017-10-04 2017-10-04 次発話候補ランキング装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016048463A JP2016048463A (ja) 2016-04-07
JP6232358B2 true JP6232358B2 (ja) 2017-11-15

Family

ID=55649335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014173122A Active JP6232358B2 (ja) 2014-08-27 2014-08-27 次発話候補ランキング装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6232358B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11711469B2 (en) 2021-05-10 2023-07-25 International Business Machines Corporation Contextualized speech to text conversion

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7159778B2 (ja) * 2018-10-16 2022-10-25 日本電信電話株式会社 発話生成装置、方法、及びプログラム
WO2023119674A1 (ja) * 2021-12-24 2023-06-29 日本電信電話株式会社 学習方法、学習装置及び学習プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001306090A (ja) * 2000-04-25 2001-11-02 Sharp Corp 対話装置および方法、音声制御装置および方法、ならびにコンピュータを対話装置および音声制御装置として機能させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体
JP2002358304A (ja) * 2001-05-31 2002-12-13 P To Pa:Kk 会話制御システム
JP2006172280A (ja) * 2004-12-17 2006-06-29 Keywalker Inc 自動対話その他の自動応答出力作成方法及び自動対話その他の自動応答出力作成装置
JP2006244262A (ja) * 2005-03-04 2006-09-14 Nec Corp 質問回答検索システム、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11711469B2 (en) 2021-05-10 2023-07-25 International Business Machines Corporation Contextualized speech to text conversion

Also Published As

Publication number Publication date
JP2016048463A (ja) 2016-04-07

Similar Documents

Publication Publication Date Title
US10936664B2 (en) Dialogue system and computer program therefor
US10997370B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
Agrawal et al. Affective representations for sarcasm detection
US20220114340A1 (en) System and method for an automatic search and comparison tool
CN110909116B (zh) 一种面向社交媒体的实体集合扩展方法及系统
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
Palogiannidi et al. Tweester at SemEval-2016 Task 4: Sentiment analysis in Twitter using semantic-affective model adaptation
JP6232358B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP2007102104A (ja) 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
JP6220762B2 (ja) 次発話候補スコアリング装置、方法、及びプログラム
JP2017027233A (ja) 質問文生成装置、方法、及びプログラム
Khan et al. A clustering framework for lexical normalization of Roman Urdu
JP6574469B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
US20230244934A1 (en) Augmenting machine learning language models using search engine results
CN112182159B (zh) 一种基于语义表示的个性化检索式对话方法和系统
Vu et al. Building a vietnamese sentiwordnet using vietnamese electronic dictionary and string kernel
Juncal-Martínez et al. GTI at SemEval-2016 Task 4: Training a naive Bayes classifier using features of an unsupervised system
JP2019087157A (ja) 単語ベクトル変換装置、方法、及びプログラム
JP5506482B2 (ja) 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム
JP2017129994A (ja) 文書き換え装置、方法、及びプログラム
Forsati et al. Cooperation of evolutionary and statistical PoS-tagging
JP5277090B2 (ja) リンク作成支援装置、リンク作成支援方法およびプログラム
JP2016110440A (ja) 用語意味学習装置、用語意味判定装置、方法、及びプログラム
JP5744150B2 (ja) 発話生成装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170606

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171023

R150 Certificate of patent or registration of utility model

Ref document number: 6232358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150