JP6574469B2 - 次発話候補ランキング装置、方法、及びプログラム - Google Patents

次発話候補ランキング装置、方法、及びプログラム Download PDF

Info

Publication number
JP6574469B2
JP6574469B2 JP2017194166A JP2017194166A JP6574469B2 JP 6574469 B2 JP6574469 B2 JP 6574469B2 JP 2017194166 A JP2017194166 A JP 2017194166A JP 2017194166 A JP2017194166 A JP 2017194166A JP 6574469 B2 JP6574469 B2 JP 6574469B2
Authority
JP
Japan
Prior art keywords
utterance
concept
candidate
next utterance
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017194166A
Other languages
English (en)
Other versions
JP2018028925A (ja
Inventor
克人 別所
克人 別所
東中 竜一郎
竜一郎 東中
牧野 俊朗
俊朗 牧野
松尾 義博
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017194166A priority Critical patent/JP6574469B2/ja
Publication of JP2018028925A publication Critical patent/JP2018028925A/ja
Application granted granted Critical
Publication of JP6574469B2 publication Critical patent/JP6574469B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザとの間で対話を行う対話システムにおいて、ユーザとの間で、ある発話列がやり取りされた後、システムが生成した次発話候補集合の中で、システム側が発する次発話として相応しい次発話候補を決定するための次発話候補ランキング装置、方法、及びプログラムに関する。
非タスク指向型対話システムでは、対話の内容は雑談であり、非特許文献1では、ウェブやツイッター(登録商標)などの文章をデータベース化しておき、ユーザ発話に類似するものを選択することでシステム発話を生成する。
これまでやり取りされてきた発話列における焦点(トピック)を求め、当該焦点について言及した文をデータベースから次発話候補として複数取り、この次発話候補をランキングする手法がある。ランキングをした後、ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補をシステムがユーザに返す。
このような手法として、直前のN(≧1)個の発話の列を文脈とし、文脈発話列及び次発話候補における単語や品詞、単語の意味カテゴリ等の特徴量と、事前に教師あり学習で得たモデルとから、該次発話候補が次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングする、結束性に基づく手法がある。
Bessho, F., Harada, T., and Kuniyoshi, Y."Dialog System Using Real-Time Crowdsourcing and Twitter Large-Scale Corpus."InProc. SIGDIAL, pp. 227-231, 2012.
上述した結束性に基づく手法では、単語の意味カテゴリ等の特徴量を用いて、シソーラス上の同一ノードに属する単語の間の意味的類似性を考慮できるが、ノードを超えた単語間の意味的類似性を考慮できないという課題がある。このため、文脈発話列と次発話候補との間で、文字列は異なるが、意味的には類似している単語が存在する場合、該文脈発話列と該次発話候補の類似性が不当に低くなり、該次発話候補が次発話として相応しいにも関わらず、そのスコアが不当に低くなるという課題がある。
本発明の第1の目的は、この課題を解決するため、任意の単語間の意味的類似性を考慮できる次発話候補ランキング装置、方法、及びプログラムを提供することにある。具体的には、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースを利用することにより、この課題を解決する。
上記概念ベースに基づく手法により、任意の単語間の意味的類似性を考慮した次発話候補ランキングができるようになるが、一般に概念ベースでは、名詞・動詞・形容詞等の内容語にのみ概念ベクトルが振られている。次発話として相応しいかは、文脈発話列と次発話候補に含まれる文末表現等の付属語も手掛かりとなり、概念ベースを利用した手法ではそれが考慮されない。また、文脈発話列または次発話候補に内容語が無い等の理由で概念ベクトルが生成されない場合、該次発話候補のスコアを算出できない。
本発明の第2の目的は、この課題を解決するため、結束性に基づく手法と概念ベースに基づく手法それぞれの長所を活かし、短所を他方で補うことにより高精度な次発話候補ランキング装置、方法、及びプログラムを提供することにある。
上記第1の目的を達成するため、本発明に係る次発話候補ランキング装置は、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする概念スコア算出手段と、を含んで構成されている。
また、本発明に係る次発話候補ランキング方法は、単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、概念スコア算出手段とを含む次発話候補ランキング装置における次発話候補ランキング方法であって、前記概念スコア算出手段が、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする。
また、本発明のプログラムは、コンピュータを、上記の次発話候補ランキング装置を構成する各手段として機能させるためのプログラムである。
また、上記第2の目的を達成するため、上記の次発話候補ランキング装置は、教師あり学習で得たモデルと、前記発話列A及び前記次発話候補集合における各次発話候補Bに関する特徴量とから、各次発話候補Bに対し、前記次発話候補Bが前記発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする結束スコア算出手段と、前記次発話候補集合における各次発話候補Bに対し、前記概念スコア算出手段によるランキング結果における順位をCとし、前記結束スコア算出手段によるランキング結果における順位をDとしたとき、前記概念スコア算出手段で前記発話列A及び前記次発話候補Bの概念ベクトルが生成される場合は、順位Cと順位Dとを重みづけして足し合わせた値を、前記次発話候補Bの結合順位とし、前記概念スコア算出手段で前記発話列Aまたは前記次発話候補Bの概念ベクトルが生成されない場合は、順位Dを前記次発話候補Bの結合順位とし、前記結合順位の昇順に前記次発話候補集合をランキングする統合手段と、を更に含むようにすることができる。
本発明に係る次発話候補ランキング装置、方法、及びプログラムによれば、概念ベースを参照し、発話列Aの概念ベクトルを生成し、次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、発話列Aの概念ベクトルと次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングして、次発話として相応しい発話をシステムが返すことにより、システムとユーザとのインタラクションが円滑になる、という効果を有する。
本発明の実施の形態に係る次発話候補ランキング装置の機能的構成を示すブロック図である。 概念ベースの例を示す図である。 本発明の実施の形態に係る次発話候補ランキング装置における処理ルーチンを示すフローチャート図である。 本発明の実施の形態に係る次発話候補ランキング装置の機能的構成を示すブロック図である。 本発明の実施の形態に係る次発話候補ランキング装置における処理ルーチンを示すフローチャート図である。 評価の結果を示した図である。 重みα毎の評価の結果を示した図である。
以下、図面とともに本発明の実施の形態を説明する。
<次発話候補ランキング装置の構成>
次に、本発明の実施の形態に係る次発話候補ランキング装置の構成について説明する。図1は、本発明の請求項1の次発話候補ランキング装置の構成例である。図1に示すように、本発明の実施の形態に係る次発話候補ランキング装置100は、CPUと、RAMと、後述する処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この次発話候補ランキング装置100は、機能的には図1に示すように入力手段10と、演算手段20と、出力手段30とを備えている。
入力手段10は、入力された文脈となる発話列Aと、次発話候補集合とを受け付ける。
システムとユーザとの間でこれまでやり取りされてきた発話を時系列順に並べて、x1,x2,・・・,xmとする。N(≧1)を定め、当該発話列において、直前のN個の発話の列(x(m-N+1),x(m-N+2),・・・,xm)を、文脈となる発話列Aとして入力する。発話列Aとして、直前までの全発話(x1,x2,・・・,xm)を入力してもよい。
別途、これまでの発話列から抽出した焦点(トピック)について言及した文を、データベースから次発話候補として複数取るものとし、次発話候補集合として入力する。
演算手段20は、概念スコア算出手段21と、概念ベース22とを含んで構成されている。
概念ベース22は、単語(名詞、動詞、形容詞等の内容語)と該単語の意味を表す概念ベクトルとの対の集合を記憶している。図2は、概念ベース22の例である。概念ベース22は、例えば、非特許文献2の手法によって生成する(非特許文献2:別所克人, 内山俊郎, 内山匡, 片岡良治, 奥雅博,“単語・意味属性間共起に基づくコーパス概念ベースの生成方式,”情報処理学会論文誌, Dec. 2008, Vol.49, No.12, pp.3997-4006.)。
内容語は、該内容語の終止形で登録されており、概念ベース22を検索する際は、内容語の終止形で検索する。各内容語の概念ベクトルは長さ1に正規化されたk次元ベクトルであり、意味的に近い内容語の概念ベクトルは、近くに配置されている。内容語同士の類似度は、例えば、対応する概念ベクトル間の内積によって算出する。
もっとも、概念ベース22に内容語以外の単語を登録してもよく、また、与えられたテキストの概念ベクトルを生成する際に、該テキスト中の内容語以外の単語で概念ベース22を検索して取得した単語概念ベクトルも使用してもよい。以下では、概念ベース22には内容語のみが登録されており、与えられたテキストの概念ベクトルを生成する際は、該テキスト中の内容語で概念ベース22を検索して取得した単語概念ベクトルのみを使用するものとして記述する。
図3は、概念スコア算出手段21の処理フローの一例である。図3に沿って、概念スコア算出手段21の処理内容を説明する。
まず、ステップS1において、発話列Aの全発話を単語分割して得られた各内容語で概念ベース22を検索し、取得した概念ベクトルを加算し、その結果得られた概念ベクトルを長さ1に正規化したものを、発話列Aの概念ベクトルVAとして生成する。
そして、ステップS2において、次発話候補集合における各次発話候補Bに対し、次発話候補Bを単語分割して得られた各内容語で概念ベース22を検索し、取得した概念ベクトルを加算し、その結果得られた概念ベクトルを長さ1に正規化したものを、次発話候補Bの概念ベクトルVBとして生成する。
次のステップS3において、次発話候補集合における各次発話候補Bに対し、上記ステップS1で生成された発話列Aの概念ベクトルVA、及び上記ステップS2で生成された次発話候補Bの概念ベクトルVBに基づいて、次発話候補Bのスコアを、以下の式1に従って算出する。
(VA・VB+1)/2 (式1)
ここで、VA・VBは、VAとVBの内積である。スコア値は0以上1以下となり、値が大きい程、発話列Aと次発話候補Bとの意味的な類似度が高い。
ステップS4において、スコアの降順に次発話候補集合をランキングし、処理ルーチンを終了する。これにより、発話列Aとの意味的な類似度の高い順に次発話候補集合がランキングされる。
ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補を、出力手段30によりシステムがユーザに返す。
発話列Aと次発話候補Bとの間で、文字列は異なるが、意味的には類似している単語が存在する場合でも、算出するスコアが高くなるので、本発明により、次発話として相応しい次発話候補が選択されやすくなる。
上記処理では、発話列Aの概念ベクトルを求めた。発話列A中の各発話ごとに概念ベクトルを求めると、ある発話で十分な内容語が無い等の場合に、該発話の概念ベクトルの品質が低いものとなる可能性がある。各発話に十分な内容語が無い場合でも、発話列A全体では、内容語が十分揃うことがあり、そのような場合、発話列Aの概念ベクトルは品質が高いものとなる。上記処理により、より高品質な概念ベクトルを生成できる。
もっともあえて、発話列Aの各発話ごとに概念ベクトルを求め、取得した概念ベクトルの和を長さ1に正規化したものを、発話列Aの概念ベクトルとするというようにしてもよい。
スコア算出の別の手法として、以下の手法もある。例えば、発話列Aの各発話ごとに概念ベクトルを求め、次発話候補Bの概念ベクトルを求める。発話列Aの少なくとも一つの発話の概念ベクトル、及び、次発話候補Bの概念ベクトルが取得できた場合に、取得した全概念ベクトルの重心と、取得した各概念ベクトルとの距離の自乗の平均の平方根を、次発話候補Bのスコアとする。スコア値は0以上となり、値が小さい程、発話列Aと次発話候補Bとの意味的な類似度が高い。スコアの昇順に次発話候補集合をランキングする。
これまで述べたスコア算出の各手法では、発話列Aまたは次発話候補Bから概念ベクトルが生成されない場合は、次発話候補Bのスコアは算出されない。この場合には、スコアが算出されない次発話候補は、スコアが算出された次発話候補よりも順位は低いものとし、スコアが算出されない次発話候補同士はランダムに順序付けすればよい。
図4は、本発明の請求項2の次発話候補ランキング装置の構成例である。なお、上記の構成例と同様の構成については、同一符号を付して説明を省略する。
図4に示すように、本発明の実施の形態に係る次発話候補ランキング装置200は、機能的には図4に示すように入力手段10と、演算手段220と、出力手段30とを備えている。
演算手段220は、概念スコア算出手段21と、概念ベース22と、結束スコア算出手段223と、統合手段224とを含んで構成されている。
概念スコア算出手段21では、請求項1の次発話候補ランキング装置の構成例と同様の処理を行い、次発話候補集合のランキング結果を出力する。
結束スコア算出手段223では、教師あり学習で得た、次発話候補が次発話として相応しい度合いを判定するためのモデルと、発話列A及び次発話候補集合における各次発話候補Bに含まれる単語や品詞等に関する特徴量とから、各次発話候補Bに対し、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出し、該スコアに基づき次発話候補集合をランキングし、次発話候補集合のランキング結果を出力する。本処理は、例えば、以下の第1の手法、又は第2の手法により行われる。
第1の手法では、教師あり学習として、結束性のラベルが付与された発話列について、さまざまな特徴量を抽出し、これらの特徴量が、どのような条件で発話列に含まれているときに結束性が高くなるか、低くなるかを、パターンマイニングの手法で発見する。特徴量としては、対話行為、質問タイプ、述語項構造、固有表現に関する情報、依存構造に関する情報を用いる。発話列におけるこれらの特徴量を、木構造として表す。パターンマイニングによって発見されたパターン(部分木)は、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する処理に用いられる。具体的には、結束性の高さに寄与する部分木を多く含むものを結束性が高いとして、スコアが算出される。
第2の手法では、教師あり学習として、例えば、結束性が高い発話列と結束性が低い発話列をそれぞれ準備し、これらから結束性が高いか低いかを二値分類する分類器を学習する。また、第2の手法においては、雑多な話題を持った対話のような学習事例を、疑似負例を用いて作成する。
具体的には、まず大量の対話データを用意する。人間同士が話した自然な対話であれば何でもよい。そして、これらの対話データから一定の長さの発話列をサンプリングする。この発話列をEとする。同時に、発話列Eの最後の発話を他の発話とランダムに入れ替えた発話列(発話列F)も作成する。発話列Eを正例とし、発話列Fを負例(疑似負例)とすることで、教師あり学習の手法を適用する。
なお、学習手法としてはランキング学習を用いる。具体的には、発話列Fよりも発話列Eが上位にランキングされるようにランキング規則を学習する。
また、第2の手法においては、発話列を表す特徴量として、最後の発話に含まれる単語、品詞、及び意味属性と、それ以前の発話のそれぞれに含まれる単語、品詞、及び意味属性とのすべての組み合わせを特徴量として用いる。
第2の手法では、上述したように教師あり学習で得られたモデルと、発話列A及び次発話候補集合における各次発話候補Bの特徴量とから、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する。
統合手段224は、概念スコア算出手段21が出力した次発話候補集合のランキング結果と、結束スコア算出手段223が出力した次発話候補集合のランキング結果とを入力とする。
次発話候補集合における各次発話候補Bの、概念スコア算出手段21によるランキング結果における順位をCとし、結束スコア算出手段223によるランキング結果における順位をDとする。
次発話候補Bの結合順位Uを以下のようにして算出する。重みαを0以上1以下の定数とする。
概念スコア算出手段21で、発話列A及び次発話候補Bの概念ベクトルが生成される場合、すなわち、次発話候補Bのスコアが算出される場合は、以下の式に従って、結合順位Uを算出する。
U:=α・C+(1-α)・D
概念スコア算出手段21で、発話列Aまたは次発話候補Bの概念ベクトルが生成されない場合、すなわち、次発話候補Bのスコアが算出されない場合は、以下の式に従って、結合順位Uを算出する。
U:=D
統合手段224は、結合順位Uの昇順に次発話候補集合をランキングする。
ランキング結果における上位1位の次発話候補、あるいは、上位何位かまでからランダムに選択した次発話候補を、出力手段30によりシステムがユーザに返す。
概念スコア算出手段21でスコアが算出された次発話候補に対しては、概念スコア算出手段21による文脈発話列と次発話候補との意味的類似性を考慮した順位と、結束スコア算出手段223による文脈発話列と次発話候補における内容語以外の言語表現を考慮した順位とを重みづけで足し合わせることにより、両方の長所を加味した結合順位が得られる。
概念スコア算出手段21でスコアが算出されなかった次発話候補に対しては、結束スコア算出手段223による順位を結合順位とすることにより、文脈発話列と次発話候補における内容語以外の言語表現を考慮した順位を反映できる。
図5は、概念スコア算出手段21、結束スコア算出手段223、及び統合手段224による処理フローの一例である。なお、図3の処理フローと同様の処理については、同一符号を付して、詳細な説明を省略する。
まず、ステップS1において、発話列Aの概念ベクトルVAを生成する。ステップS2において、次発話候補集合における各次発話候補Bに対し、次発話候補Bの概念ベクトルVBを生成する。
次のステップS3において、次発話候補集合における各次発話候補Bに対し、上記ステップS1で生成された発話列Aの概念ベクトルVA、及び上記ステップS2で生成された次発話候補Bの概念ベクトルVBに基づいて、次発話候補Bのスコアを、上記の式1に従って算出する。
ステップS4において、スコアの降順に次発話候補集合をランキングする。
次のステップS21において、発話列A及び各次発話候補Bに対し、特徴量を抽出する。ステップS22において、各次発話候補Bに対し、教師あり学習で得られたモデルと、上記ステップS21で抽出された発話列A及び次発話候補Bの特徴量とに基づいて、次発話候補Bが発話列Aの次発話として相応しい度合いを表すスコアを算出する。
そして、ステップS23において、上記ステップS22で算出されたスコアの降順に次発話候補集合をランキングする。
ステップS24において、上記ステップS1、S2で概念ベクトルが生成されたか否かと、上記ステップS4で得られたランキング結果と、上記ステップS23で得られたランキング結果とに基づいて、各次発話候補Bに対し、結合順位Uを算出し、結合順位Uの昇順に次発話候補集合をランキングし、処理ルーチンを終了する。
本発明の手法の評価を以下のようにして行った。
本発明において次発話は、システムがこれまでの文脈に沿って発話するものである。そこで、二人の人間同士の対話ログ(各発話には、話者と話題のタグがつけられている)において、次の条件(1)、(2)を満たす発話境界Eを対象とし、Eの直前発話までの文脈から、Eの直後発話を導出する問題ととらえた。
条件(1) [Eの直前発話の話者]≠[Eの直後発話の話者]
条件(2) [Eの直前発話の話題]=[Eの直後発話の話題]
Eの直前2発話を文脈発話列とし、Eの直後発話を正解とする。対話ログ中で、Eの直後発話からの全発話を次発話候補とし、正解発話を次発話候補ランキング結果において上位にもってこられるかを評価することとした。
評価指標は、MRR(Mean Reciprocal Rank:正解発話の順位の逆数の平均)を用いることとした。この値が高い程、精度が高い。
対話ログは1746個あり、1対話ログ中の発話の数の平均が約39であったため、各対話ログにおいて、発話候補数が約半分の約20となる上記条件を満たす発話境界Eを一つ定めた。これにより対象発話境界は1746個となり、概念スコア算出手段による手法(次発話候補のスコアは、上記式1で算出)と、結束スコア算出手段による手法(次発話候補のスコアは、上記第2の手法で算出)のMRRは図6のようになった。
統合手段において、重みαを0から1まで0.1刻みに変化させた場合のMRRは、図7のようになった。
αを増加させていくにしたがい、MRRは大きくなっていき、最大値に達すると小さくなっていく。上記では、αが0.7のときMRRは最大値0.424をとった。統合手段により、概念スコア算出手段単独のときと比べ、MRRが0.362→0.424のように向上した。
1746個の対象発話境界の中で、概念スコア算出手段で、文脈発話列または正解発話の概念ベクトルが生成されず、正解発話のスコアが算出されなかった境界は、433個(全体の24.8%)であった。このような、概念スコア算出手段でスコアが算出されなかった正解発話に対しては、統合手段で、結束スコア算出手段による順位が採用されており、上位の順位が付与されていると考えられる。
本発明の統合手段における重みαは、事前に、ある評価データにおいて、αを変化させて精度を算出し、最高精度を出したαを採用するというようにしてもよい。
これまで述べた処理をプログラムとして構築し、当該プログラムを通信回線または記録媒体からインストールし、CPU等の手段で実施することが可能である。
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、システムとユーザとの円滑なインタラクションを実現する対話処理技術に適用可能である。
10 入力手段
20、220 演算手段
21 概念スコア算出手段
22 概念ベース
30 出力手段
100、200 次発話候補ランキング装置
223 結束スコア算出手段
224 統合手段

Claims (7)

  1. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、
    文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする概念スコア算出手段と、
    を含み、
    前記概念スコア算出手段は、前記発話列Aの概念ベクトルを生成する際に、前記発話列Aの各発話ごとに概念ベクトルを生成し、生成した各発話ごとの概念ベクトルから前記発話列Aの概念ベクトルを生成することを特徴とする次発話候補ランキング装置。
  2. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、
    文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする概念スコア算出手段と、
    を含み、
    前記概念スコア算出手段は、前記発話列Aの概念ベクトルを生成する際に、前記発話列Aの複数の発話に対し、前記発話に対応する概念ベクトルを複数生成し、
    前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出する際に、前記発話列Aの複数の発話に対する複数の概念ベクトルと、前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出することを特徴とする次発話候補ランキング装置。
  3. 前記発話列Aは、複数主体間の発話からなることを特徴とする請求項1または請求項2記載の次発話候補ランキング装置。
  4. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、概念スコア算出手段とを含む次発話候補ランキング装置における次発話候補ランキング方法であって
    前記概念スコア算出手段が、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする
    ことを含み、
    前記概念スコア算出手段は、前記発話列Aの概念ベクトルを生成する際に、前記発話列Aの各発話ごとに概念ベクトルを生成し、生成した各発話ごとの概念ベクトルから前記発話列Aの概念ベクトルを生成することを特徴とする次発話候補ランキング方法。
  5. 単語と該単語の意味を表す概念ベクトルとの対の集合である概念ベースと、概念スコア算出手段とを含む次発話候補ランキング装置における次発話候補ランキング方法であって
    前記概念スコア算出手段が、文脈となる発話列Aと次発話候補集合とを入力とし、前記概念ベースを参照し、前記発話列Aの概念ベクトルを生成し、前記次発話候補集合における各次発話候補Bの概念ベクトルを生成し、各次発話候補Bに対し、前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出し、該スコアに基づき前記次発話候補集合をランキングする
    ことを含み、
    前記概念スコア算出手段は、前記発話列Aの概念ベクトルを生成する際に、前記発話列Aの複数の発話に対し、前記発話に対応する概念ベクトルを複数生成し、
    前記発話列Aの概念ベクトルと前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出する際に、前記発話列Aの複数の発話に対する複数の概念ベクトルと、前記次発話候補Bの概念ベクトルとの近さを表すスコアを算出することを特徴とする次発話候補ランキング方法。
  6. 前記発話列Aは、複数主体間の発話からなることを特徴とする請求項4または請求項5記載の次発話候補ランキング方法。
  7. コンピュータを、請求項1〜請求項の何れか1項記載の次発話候補ランキング装置を構成する各手段として機能させるためのプログラム。
JP2017194166A 2017-10-04 2017-10-04 次発話候補ランキング装置、方法、及びプログラム Active JP6574469B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017194166A JP6574469B2 (ja) 2017-10-04 2017-10-04 次発話候補ランキング装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017194166A JP6574469B2 (ja) 2017-10-04 2017-10-04 次発話候補ランキング装置、方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014173122A Division JP6232358B2 (ja) 2014-08-27 2014-08-27 次発話候補ランキング装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018028925A JP2018028925A (ja) 2018-02-22
JP6574469B2 true JP6574469B2 (ja) 2019-09-11

Family

ID=61248470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017194166A Active JP6574469B2 (ja) 2017-10-04 2017-10-04 次発話候補ランキング装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6574469B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11711469B2 (en) 2021-05-10 2023-07-25 International Business Machines Corporation Contextualized speech to text conversion

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001306090A (ja) * 2000-04-25 2001-11-02 Sharp Corp 対話装置および方法、音声制御装置および方法、ならびにコンピュータを対話装置および音声制御装置として機能させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体
JP2002358304A (ja) * 2001-05-31 2002-12-13 P To Pa:Kk 会話制御システム
JP2006172280A (ja) * 2004-12-17 2006-06-29 Keywalker Inc 自動対話その他の自動応答出力作成方法及び自動対話その他の自動応答出力作成装置
JP2006244262A (ja) * 2005-03-04 2006-09-14 Nec Corp 質問回答検索システム、方法およびプログラム
JP2012141713A (ja) * 2010-12-28 2012-07-26 Osaka Prefecture Univ 擬似会話装置及びコンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11711469B2 (en) 2021-05-10 2023-07-25 International Business Machines Corporation Contextualized speech to text conversion

Also Published As

Publication number Publication date
JP2018028925A (ja) 2018-02-22

Similar Documents

Publication Publication Date Title
US10936664B2 (en) Dialogue system and computer program therefor
CN107944027B (zh) 创建语义键索引的方法及系统
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
US20220114340A1 (en) System and method for an automatic search and comparison tool
CN110909116B (zh) 一种面向社交媒体的实体集合扩展方法及系统
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
Palogiannidi et al. Tweester at SemEval-2016 Task 4: Sentiment analysis in Twitter using semantic-affective model adaptation
JP2007102104A (ja) 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
JP6232358B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP2017027233A (ja) 質問文生成装置、方法、及びプログラム
Khan et al. A clustering framework for lexical normalization of Roman Urdu
CN112182159B (zh) 一种基于语义表示的个性化检索式对话方法和系统
JP6220762B2 (ja) 次発話候補スコアリング装置、方法、及びプログラム
Gupta et al. Text analysis and information retrieval of text data
Malandrakis et al. Sail: Sentiment analysis using semantic similarity and contrast features
JP6574469B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP2005149014A (ja) 文書関連語彙獲得方法及び装置及びプログラム
Agrawal et al. Comparative analysis of NLP models for Google Meet Transcript summarization
Aliyanto et al. Supervised probabilistic latent semantic analysis (sPLSA) for estimating technology readiness level
Lee N-Gram Language Model
Vu et al. Building a vietnamese sentiwordnet using vietnamese electronic dictionary and string kernel
Juncal-Martínez et al. GTI at SemEval-2016 Task 4: Training a naive Bayes classifier using features of an unsupervised system
JP5744150B2 (ja) 発話生成装置、方法、及びプログラム
JP2015075952A (ja) 発話生成装置、方法、及びプログラム
JP5506482B2 (ja) 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190816

R150 Certificate of patent or registration of utility model

Ref document number: 6574469

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150