JP6299563B2 - 応答生成方法、応答生成装置及び応答生成プログラム - Google Patents

応答生成方法、応答生成装置及び応答生成プログラム Download PDF

Info

Publication number
JP6299563B2
JP6299563B2 JP2014227215A JP2014227215A JP6299563B2 JP 6299563 B2 JP6299563 B2 JP 6299563B2 JP 2014227215 A JP2014227215 A JP 2014227215A JP 2014227215 A JP2014227215 A JP 2014227215A JP 6299563 B2 JP6299563 B2 JP 6299563B2
Authority
JP
Japan
Prior art keywords
verb
noun
response
user
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014227215A
Other languages
English (en)
Other versions
JP2016090891A (ja
Inventor
生聖 渡部
生聖 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2014227215A priority Critical patent/JP6299563B2/ja
Publication of JP2016090891A publication Critical patent/JP2016090891A/ja
Application granted granted Critical
Publication of JP6299563B2 publication Critical patent/JP6299563B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、ユーザに対して応答を行う応答生成方法、応答生成装置及び応答生成プログラムに関するものである。
ユーザの音声を認識する音声認識手段と、音声認識手段により認識された音声の構造を解析する構造解析手段と、構造解析手段により解析された音声の構造に基づいて、ユーザの音声に対する応答文を生成し、該生成した応答文を出力する応答出力手段と、を備える応答生成装置が知られている(例えば、特許文献1参照)。
特開2010−157081号公報
上記のような応答生成装置は、音声の構造解析、及びその応答文の生成に時間を要し、応答待ちが生じる。このため、対話に違和感が生じる虞がある。そこで、例えば、その応答待ちの間に音声認識手段により認識したユーザの音声を繰返し応答文として用い簡易に応答を行うことが考えられる。この場合、応答待ちが短くなり対話の違和感が緩和されるが、画一的な応答パターンとなり対話としての不自然さが残る。
本発明は、このような問題点を解決するためになされたものであり、画一的な応答パターンによる対話の違和感を緩和することができる応答生成方法、応答生成装置、及び応答生成プログラムを提供することを主たる目的とする。
上記目的を達成するための本発明の一態様は、ユーザの音声を認識するステップと、前記認識した音声の構造を解析するステップと、複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報を記憶するステップと、前記認識した音声から名詞又は動詞を抽出するステップと、前記抽出した名詞又は動詞と一致する前記記憶した情報のキーワードを選択し、該選択したキーワードに対応する付加語を、該抽出した名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成するステップと、前記解析した音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力するステップと、を含む応答生成方法であって、第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出するステップと、抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問するステップと、前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶するステップと、を含む、ことを特徴とする応答生成方法である。
この一態様において、ネットワーク上に存在する前記所定の文章集合情報から、前記第1の名詞又は動詞と、第2の名詞又は動詞と、を抽出し、抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞との共起頻度を用いて、該第1の名詞又は動詞と第2の名詞又は動詞との類似度を算出し、該算出した類似度が閾値以上となる場合に、抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問し、前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶してもよい。
この一態様において、前記記憶されたキーワードと関連する連想ワード及び付加語、の数を所定条件で制限するステップを更に含んでいてもよい。
この一態様において、前記ユーザの音声の音韻を分析するステップと、前記分析された音韻の分析結果に基づいて、前記ユーザの音声に対する相槌の応答を生成するステップと、を更に含み、前記生成される繰返しの応答文を出力する前に、前記生成された相槌の応答を出力してもよい。
上記目的を達成するための本発明の一態様は、ユーザの音声を認識する音声認識手段と、前記音声認識手段により認識された音声の構造を解析する構造解析手段と、複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報を記憶する記憶手段と、前記音声認識手段により認識された音声から名詞又は動詞を抽出する品詞抽出手段と、前記品詞抽出手段により抽出された名詞又は動詞と一致する前記記憶手段のキーワードを選択し、該選択したキーワードに対応する付加語を、該抽出された名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成する繰返生成手段と、前記構造解析手段により解析された音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力する応答出力手段と、を含む応答生成装置であって、第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出する抽出手段と、前記抽出手段により抽出された前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問する質問手段と、前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして前記記憶手段に登録する判定手段と、を含む、ことを特徴とする応答生成装置であってもよい。
上記目的を達成するための本発明の一態様は、ユーザの音声を認識する処理と、前記認識した音声の構造を解析する処理と、前記認識した音声から名詞又は動詞を抽出する処理と、複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報が記憶されており、前記抽出した名詞又は動詞と一致する前記キーワードを選択し、該選択したキーワードに対応する付加語を、該抽出した名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成する処理と、前記解析した音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力する処理と、コンピュータに実行させる応答生成プログラムをであって、第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出する処理と、抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問する処理と、前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶する処理と、をコンピュータに実行させる、ことを特徴とする応答生成プログラムであってもよい。
本発明によれば、画一的な応答パターンによる対話の違和感を緩和することができる応答生成方法、応答生成装置、及び応答生成プログラムを提供することができる。
本発明の実施形態1に係る応答生成装置の概略的なシステム構成を示すブロック図である。 本発明の実施形態1に係る応答生成装置の概略的なハードウェア構成を示すブロック図である。 本発明の実施形態1に係る応答生成方法の処理フローを示すフローチャートである。 本発明の実施形態2に係る応答生成装置の概略的なシステム構成を示すブロック図である。 関連ワード情報がネットワーク装置に記憶され更新される構成の一例を示す概略図である。
実施形態1
以下、図面を参照して本発明の実施の形態について説明する。図1は、本発明の実施形態1に係る応答生成装置の概略的なシステム構成を示すブロック図である。本実施形態1に係る応答生成装置1は、ユーザの音声を認識する音声認識部2と、音声の構造を解析する構造解析部と3、ユーザの音声に対する応答文を生成し、出力する応答出力部4と、繰返しの応答文を生成する繰返生成部5と、品詞抽出部9と、関連ワード抽出部10と、ユーザ質問部11と、記憶判定部12と、を備えている。
なお、応答生成装置1は、例えば、演算処理等と行うCPU(Central Processing Unit)1a、CPU1aによって実行される演算プログラム、制御プログラム等が記憶されたROM(Read Only Memory)やRAM(Random Access Memory)からなるメモリ1b、外部と信号の入出力を行うインターフェイス部(I/F)1c、などからなるマイクロコンピュータを中心にして、ハードウェア構成されている(図2)。CPU1a、メモリ1b、及びインターフェイス部1cは、データバス1dなどを介して相互に接続されている。
音声認識部2は、マイク6により取得されたユーザの音声情報に基づいて音声認識処理を行い、ユーザの音声情報をテキスト化し文字列情報として認識する。音声認識部2は、音声認識手段の一具体例である。音声認識部2は、マイク6から出力されるユーザの音声情報から発話区間を検出し、検出した発話区間の音声情報に対して、例えば、統計言語モデルを参照してパターンマッチングを行うことで音声認識を行う。ここで、統計言語モデルは、例えば、単語の出現分布やある単語の次に出現する単語の分布等、言語表現の出現確率を計算するための確率モデルであり、形態素単位で連結確率を学習したものである。統計言語モデルは、メモリ1bなどに予め記憶されている。なお、音声認識部2は、ユーザの音声情報の各形態素に対してその品詞種類(名詞、形容詞、動詞、副詞など)を付加した品詞情報付き形態素情報を生成する。音声認識部2は、認識したユーザの音声情報を構造解析部3、及び品詞抽出部9に出力する。
構造解析部3は、音声認識部2により認識された音声情報の構造を解析する。構造解析部3は、構造解析手段の一具体例である。構造解析部3は、例えば、一般的な形態素解析器を用いて音声認識されたユーザの音声情報を示す文字列情報に対して形態素解析などを行い、文字列情報の意味解釈を行う。構造解析部3は、文字列情報の解析結果を応答出力部4に出力する。
応答出力部4は、構造解析部3により解析された音声情報の構造に基づいて、ユーザの音声情報に対する応答文(以下、随意応答文と称す)を生成し、該生成した随意応答文を出力する。応答出力部4は、応答出力手段の一具体例である。応答出力部4は、例えば、構造解析部3から出力される文字列情報の解析結果に基づいて、ユーザの音声情報に対する随意応答文を生成する。そして、応答出力部4は、生成した応答文をスピーカ7を用いて出力する。
より、具体的には、構造解析部3は、文字列情報「トンカツ を 食べる」において、述語項構造を抽出し、述語「食べる」と格助詞「を」を特定する。そして、応答出力部4は、構造解析部3により特定された述語「食べる」に係り得る格助詞の種類を、述語と格助詞との対応関係が記憶された不足格辞書データベース8の中から抽出する。なお、不足格辞書データベース8は、例えば、メモリ1bに構築されている。
応答出力部4は、例えば、「何 を 食べる」、「どこ で 食べる」、「いつ に 食べる」、「誰 と 食べる」とういう述語項構造を、随意応答文として生成する。さらに、応答出力部4は、上記生成した述語項構造の中で、ユーザの音声と一致しない表層格「を」を除いた、他の述語項構造の中からランダムに選択し、選択した述語項構造を随意応答文とする。応答出力部4は、例えば、「誰と食べたの?」という述語項構造を選択し、随意応答文として出力する。なお、上述した随意応答文の生成方法は一例であり、これに限定されず、任意の生成方法を用いることができる。
品詞抽出部9は、音声認識部2から出力された音声情報の品詞情報付き形態素情報に基づいて、認識されたユーザの音声情報から名詞及び/又は動詞を抽出する。品詞抽出部9は、品詞抽出手段の一具体例である。品詞抽出部9は、例えば、音声認識部2から出力された音声情報の品詞情報付き形態素情報「トンカツ(名詞)を(助詞)食べた(動詞)よ(助詞)」から、「トンカツ(名詞)」又は「食べた(動詞)」を抽出する。品詞抽出部9は、上記名詞として、例えば、トンカツ(一般名詞)、矢場トン(固有名詞)、投票する=>投票(サ変名詞)(但し、数詞などの一部の名詞を除く)などを抽出する。また、品詞抽出部9は、上記動詞として、例えば、投票する(サ変動詞)、泳ぐ、などを抽出する。品詞抽出部9は、抽出した名詞又は動詞を繰返生成部5及び関連ワード抽出部10に出力する。
ところで、上述したような、音声情報の構造解析、及びその応答文の生成には時間を要し(例えば、3秒程度)、処理コストが高い。このため、応答待ちが生じ、対話に違和感が生じる虞がある。
これに対し、本実施の形態1に係る応答生成装置1において、繰返生成部5は、音声認識部2により認識されたユーザの音声から、繰返しの応答文(以下、繰返応答文と称す)を簡易に生成する。そして、応答出力部4は、繰返生成部5により生成された繰返応答文した後、音声の構造に基づいた随意応答文を出力する。
これにより、繰返応答文は、認識されたユーザの音声をオウム返しで繰り返すだけなので生成時間を要せず(例えば、1秒程度)、処理コストが低い。したがって、上記処理コストが高い随意応答文を出力するまでの応答待ちの間に、処理コストが低い繰返応答文を出力することができる。したがって、応答待ちによって生じる対話の間が大きいことによる対話の違和感を緩和することができる。
繰返生成部5は、上述の如く、音声認識部2により認識された音声情報を、オウム返しを行うための繰返応答文として生成する。ここで、ユーザの音声を全く変えずにそのままオウム返しするよりも、ユーザの音声情報の名詞又は動詞に特定の付加語を付加してオウム返しをした方が、より対話の自然性が向上する。例えば、ユーザの発話「海に行ったよ」に対して、応答生成装置1が単にそのまま「海に行ったよ」と応答するよりも、「海かぁ」あるいは「お、海かぁ」と応答した方がより対話の自然性が向上する。
したがって、本実施の形態1に係る繰返生成部5は、品詞抽出部9により抽出された名詞又は動詞に対して特定の付加語を付加することで、繰返応答文を生成する。これにより、オウム返しの繰返応答文の語感に多様性を持たせることができるため、画一的な応答パターンにならず、対話の違和感をより緩和することができる。
メモリ1bには、例えば、複数のキーワードと、複数の付加語(語頭、語尾など)と、を夫々対応付けた付加情報(テーブル情報など)が記憶されている。繰返生成部5は、品詞抽出部9から出力される名詞又は動詞と、メモリ1bに記憶された付加情報と、に基づいて、その名詞又は動詞と一致する付加情報のキーワードを選択する。そして、繰返生成部5は、選択したキーワードに対応する付加語を選択する。繰返生成部5は、品詞抽出部9から出力される名詞又は動詞に、選択した付加語を、付加することで繰返応答文を生成する。
より具体的には、繰返生成部5は、品詞抽出部9から出力される名詞「ラーメン」と、メモリ1bに記憶された付加情報と、に基づいて、その名詞「ラーメン」に対応する付加語「かぁ」を選択する。繰返生成部5は、品詞抽出部9から出力される名詞「ラーメン」に選択した付加語「かぁ」を付加することで、繰返応答文「ラーメンかぁ」を生成する。
さらに、画一的な応答パターンを改善し対話としての自然さをより向上させるために、本実施形態1に係る応答生成装置1において、繰返生成部5は、上記名詞又は動詞に特定の付加語を付加するだけでなく、その名詞又は動詞を、関連する関連ワードに置き換えて、繰返応答文を生成する。これにより、オウム返しの繰返応答文の語感に対しより多様性を持たせることができ、対話の違和感をより緩和することができる。
メモリ1bには、例えば、下記に示すような、複数のキーワードに該各キーワードに関連する関連ワードに夫々対応付けた関連ワード情報(テーブル情報など)が記憶されている。
キーワード「トンカツ」 関連ワード「豚肉」、
キーワード「ステーキ」 関連ワード「牛肉」、
キーワード「A型」 関連ワード「慎重型」、
キーワード「O型」 関連ワード「おおらか型」
キーワード「牛肉」 関連ワード「お肉」
キーワード「矢場トン」 関連ワード「味噌カツ」
キーワード「投票する」 関連ワード「国民の義務」
キーワード「泳ぐ」 関連ワード「スイミング」
・・・・・
なお、関連ワードは、例えば、キーワードに類似するワード、あるいは、キーワードの上位概念に相当するワードなどの、ユーザがそのキーワードに基づいて連想するワードである。また、関連ワード情報は、キーワードと関連ワードとを一対一で対応付けたテーブル情報となっているが、これに限定されない。例えば、関連ワード情報は、単一のキーワードと複数の関連ワードとが対応付けられたテーブル情報であってもよく、ツリー状のオントロジー情報であってもよい。また、関連ワード情報および上記付加情報は、一体(両者が対応付けられたテーブル情報など)で構成されていてもよい。
繰返生成部5は、品詞抽出部9から出力される名詞又は動詞と、メモリ1bに記憶された関連ワード情報と、に基づいて、その名詞又は動詞と一致する関連ワード情報のキーワードを選択する。繰返生成部5は、選択したキーワードに対応する関連ワードを選択する。なお、単一のキーワードに複数の関連ワードが対応付けられている場合、繰返生成部5は、例えば、その複数の関連ワードの中からランダムにあるいは登録順に1つを選択してもよい。繰返生成部5は、品詞抽出部9により抽出された名詞又は動詞を、該選択した関連ワードに、置き換えて繰返応答文を生成する。
ここで、ユーザの使用するワードは、その時々の流行り廃りで常時変化している。このため、上述したメモリ1b内の関連ワード情報にも、例えば、新しいキーワード及び関連ワードを追加するなどのメンテナンスが必要となる。一方で、新しいキーワード及び関連ワードの抽出は、知的判断を伴うものであり単純なルール化は困難である。したがって、そのような新しいキーワード及び関連ワードを追加するなどのメンテナンスを人が行った場合、その人に大きな負荷となる。
これに対し本実施形態1に係る応答生成装置1は、メモリ1b内の関連ワード情報に新しいキーワード及び関連ワードを追加することで、その関連ワード情報を自動的に更新する機能を有している。これにより、メモリ1b内の関連ワード情報をメンテナンスする際のユーザの負荷を大幅に低減することができる。さらに、関連ワードが適宜増え、繰返応答文により多様性を持たせることができ、対話の違和感をより緩和することができる。
関連ワード抽出部10は、第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出する。関連ワード抽出部10は、ワード抽出手段の一具体例である。関連ワード抽出部10は、例えば、ネットワーク上のサーバ、端末装置、データベースなどに格納された文章集合情報から、第1の名詞又は動詞(以下、第1単語)と、第2の名詞又は動詞(以下、第2単語)と、を抽出する。文章集合情報は、例えば、新聞、雑誌、小説、会話などのテキスト情報や階層化されたコーパス情報を含む。
なお、関連ワード抽出部10は、応答生成装置1に直接入力された、あるいは、予めメモリ1bに記憶された文書集合情報から、第1及び第2単語を抽出してもよい。例えば、関連ワード抽出部10は、マイク6を介して入力されたユーザの音声情報に基づいて第1及び第2単語を抽出してもよい。
関連ワード抽出部10は、例えば、文章集合情報から抽出した第1単語と第2単語との共起頻度に基づいて、該第1単語と第2単語との類似度を下記式により算出する。
sim(“第1単語”、“第2単語”)
={“第1単語”と“第2単語”の共起頻度}/{“第1単語”の頻度ד第2単語”の頻度}
関連ワード抽出部10は、算出した類似度が閾値以上となる場合に、抽出した第1単語と第2単語とが関連すると判断する。なお、関連ワード抽出部10は、第1単語と第2単語の共起頻度を用いて、その類似度を算出しているが、これに限定されない。関連ワード抽出部10は、任意の算出方法を用いて第1単語と第2単語との類似度を算出してもよい。
関連ワード抽出部10は、類似度が閾値以上となり、第1単語と第2単語とが関連すると判断したとき、その第1単語と第2単語をユーザ質問部11に出力する。
ユーザ質問部11は、関連ワード抽出部10から出力された第1単語と第2単語とが同一であるか否かをユーザに対して問う質問を行う。ユーザ質問部11は、質問手段の一具体例である。ユーザ質問部11は、例えば、スピーカ7を用いて音声によりあるいは表示装置を用いて文字表示により、ユーザに対して質問を行う。より具体的には、ユーザ質問部11は、「トンカツは豚肉だよね?」との質問をユーザに対して行う。
記憶判定部12は、ユーザ質問部11の質問に対するユーザの回答が肯定的である場合に、第1単語をキーワードとし第2単語を連想ワードとして、メモリ1bの関連ワード情報に登録する。記憶判定部12は、判定手段の一具体例である。
記憶判定部12は、ユーザ質問部11の質問に対するユーザの回答が、例えば、「そうだよ」、「そう」、「はい」などの所定の肯定的なパターンである場合に、その回答が肯定的と判断する。一方、記憶判定部12は、ユーザ質問部11の質問に対するユーザの回答が、所定の肯定的なパターン以外である場合に、その回答が否定的と判断する。
より具体的に、記憶判定部12は、ユーザ質問部11の質問「トンカツは豚肉だよね?」に対するユーザの回答が、「そうだよ」と肯定的なパターンであると判断した場合、その回答が肯定的と判断する。記憶判定部12は、第1単語「トンカツ」をキーワードとし第2単語「豚肉」を連想ワードとし対応させて、メモリ1bの関連ワード情報に登録する。
ここで、記憶判定部12は、第1単語「トンカツ」をキーワードとし第2単語「豚肉」を連想ワードとして関連ワード情報に登録するが、第1及び第2単語の逆の登録を行わない。すなわち、記憶判定部12は、第1単語「豚肉」をキーワードとし第2単語「トンカツ」を連想ワードとして関連ワード情報に登録を行わない。
さらに、記憶判定部12は、新しい第1及び第2単語を関連ワード情報に登録する際に、その新しい第1単語と同一のキーワードが既に関連ワード情報に登録されている場合がある。この場合、記憶判定部12は、その同一のキーワードに対し、新たな第2単語と既に登録された関連ワードとを対応させて関連ワード情報に登録してもよい。例えば、キーワード「トンカツ」と、このキーワードに対応して関連ワード「豚肉」及び「肉」と、が関連ワード情報に登録される。このように、単一のキーワードに対して複数の関連ワードが対応付けられて関連ワード情報に登録されてもよい。これにより、メモリ1bの記憶容量の節約に繋がる。
記憶判定部12は、上述の如く、単一のキーワードに対して複数の関連ワードを重複させて関連ワード情報に登録する場合、ユーザの選択に応じてその重複登録を実行する或いは中止してもよい。
例えば、記憶判定部12は、単一のキーワードに対して複数の関連ワードを重複させて登録する場合、その重複登録の実行及び中止を選択させるための質問をスピーカ7などを用いて行う。記憶判定部12は、その質問に対して、マイク6などにより入力されたユーザの選択に応じて、その重複登録を実行する或いは中止する。
図3は、本実施形態1に係る応答生成方法の処理フローを示すフローチャートである。
関連ワード抽出部10は、第1単語と、該第1単語と関連する第2単語と、をネットワーク上のコーパス情報などから抽出する(ステップS101)。
関連ワード抽出部10は、抽出した第1単語と第2単語と類似度を算出する(ステップS102)。関連ワード抽出部10は、算出した類似度が閾値以上であり、抽出した第1単語と第2単語とが関連するか否かを判断する(ステップS103)。
関連ワード抽出部10は、類似度が閾値以上となり、第1単語と第2単語とが関連すると判断したとき(ステップS103のYES)、その第1単語と第2単語をユーザ質問部11に出力する。
ユーザ質問部11は、関連ワード抽出部10から出力された第1単語と第2単語とが同一であるか否かの質問をスピーカ7などを用いて行う(ステップS104)。記憶判定部12は、ユーザ質問部11の質問に対するユーザの回答が肯定的であるか否かを判定する(ステップS105)。記憶判定部12は、ユーザの回答が肯定的であると判定したとき(ステップS105のYES)、第1単語をキーワードとし第2単語を連想ワードとして、メモリ1bの関連ワード情報に登録する(ステップS106)。
音声認識部2は、マイク6により取得されたユーザの音声情報の音声認識を行い(ステップS107)、認識したユーザの音声情報を構造解析部3、及び品詞抽出部9に出力する。
品詞抽出部9は、音声認識部2から出力された音声情報の品詞情報付き形態素情報に基づいて、認識されたユーザの音声情報から名詞又は動詞を抽出する(ステップS108)。品詞抽出部9は、抽出した名詞又は動詞を繰返生成部5に出力する。
繰返生成部5は、品詞抽出部9から出力された名詞又は動詞と、メモリ1bの付加情報と、に基づいて、品詞抽出部9から出力された名詞又は動詞と一致する付加情報のキーワードを選択する。そして、繰返生成部5は、該選択したキーワードに対応する付加語を、該抽出された名詞又は動詞に対して付加する(ステップS109)。
繰返生成部5は、品詞抽出部9から出力された名詞又は動詞と、メモリ1bの関連ワード情報と、に基づいて、品詞抽出部9から出力された名詞又は動詞と一致する関連ワード情報のキーワードを選択する。そして、繰返生成部5は、品詞抽出部9から出力された名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えて(ステップS110)、繰返応答文を生成する(ステップS111)。
繰返生成部5は、生成した繰返応答文を応答出力部4に出力する。応答出力部4は、繰返生成部5から出力される繰返応答文をスピーカ7から出力する(ステップS112)。
上記(ステップ108)及び(ステップ112)と平行して、構造解析部3は、音声認識部2により認識された音声情報の構造を解析し(ステップS113)、その文字列情報の解析結果を応答出力部4に出力する。
応答出力部4は、構造解析部3から出力される文字列情報の解析結果に基づいて随意応答文を生成し(ステップS114)、生成した随意応答文をスピーカ7から出力する(ステップS115)。ここで、応答出力部4は、処理時間の低い繰返応答文を出力した後、処理時間の高い随意応答文を出力することとなる。
なお、上述した(ステップS101)乃至(ステップS106)の処理(関連ワード情報の更新処理)は、(ステップS107)乃至(ステップS115)(実際のユーザとの対話処理)の前に実行されているが、これに限定されず、任意のタイミング実行できる。例えば、(ステップS101)乃至(ステップS106)の処理は、(ステップS107)乃至(ステップS115)の後、あるいは、途中、さらには前後で実行されてもよい。
以上、本実施形態1に係る応答生成装置1において、繰返生成部5は、品詞抽出部9により抽出された名詞又は動詞と一致するメモリ1bのキーワードを選択し、該選択したキーワードに対応する付加語を、該抽出された名詞又は動詞に対して付加する。さらに、繰返生成部5は、該抽出された名詞又は動詞を、該選択したメモリ1bのキーワードに対応する関連ワードに、置き換えて、繰返し応答文を生成する。これより、オウム返しの繰返応答文の語感に多様性を持たせることができ、対話の違和感をより緩和することができる。さらに、上記関連ワードに置き換える際に必要となる関連ワード情報を自動的に更新できる。このため、ユーザの負荷を低減しつつ、繰返応答文により多様性を持たせ対話の違和感をより緩和することができる。
実施形態2.
図4は、本発明の実施形態2に係る応答生成装置の概略的なシステム構成を示すブロック図である。本実施形態2に係る応答生成装置20は、上記実施形態1に係る応答生成装置1の構成に加えて、ユーザの音声情報の音韻を分析する音韻分析部21と、ユーザの音声情報に対する相槌の応答を生成する相槌生成部22と、を更に備える点を特徴とする。
音韻分析部21は、マイク6により取得されたユーザの音声情報に基づいてユーザの音声情報の音韻を分析する。音韻分析部21は、音韻分析手段の一具体例である。例えば、音韻分析部21は、音声情報の音量レベル変化や周波数変化(基本周波数等)を検出することで、ユーザの音声の切れ目を推定する。音韻分析部21は、音韻の分析結果を相槌生成部22に出力する。
相槌生成部22は、音韻分析部21から出力される音韻の分析結果に基づいて、ユーザの音声に対する相槌の応答(以下、相槌応答と称す)を生成する。相槌生成部22は、相槌生成手段の一具体例である。例えば、相槌生成部22は、音声情報の音量レベルが閾値以下となったとき、相槌のパターンが記憶された定型応答データベース23を検索する。そして、相槌生成部22は、定型応答データベース23からランダムに相槌応答を選択する。定型応答データベース23は、「うん。うん。」などの相槌に用いられる複数のパターンが記憶されている。定型応答データベース23は、上記メモリ1bなどに構築されている。相槌生成部22は、生成した相槌応答を応答出力部4に出力する。
応答出力部4は、繰返生成部5により生成された繰返応答文の前に、相槌生成部22により生成された相槌応答をスピーカ7から出力させる。なお、音韻分析部21は、処理コストの低い特徴量を用いて音韻分析を行っている。このため、その相槌応答の生成時間は、上記繰返応答文の生成時間より短く、処理コストがより低い。
したがって、上記繰返応答文を出力するまでの間に、より処理コストが低い相槌応答を出力することができる。これにより、対話間の繋がりがよりスムーズになり、対話の違和感をより緩和することができる。さらに、処理コストの異なるより多くの応答及び応答文を並列で生成し、その生成順に出力する。これにより、対話の連続性をより滑らかに維持しそのテンポ感を損なわないより自然な対話を実現できる。
なお、相槌生成部22は、相槌応答を定型的に生成しており、繰返生成部5は、音声認識結果の表層的な解釈のみを行って繰返応答文を生成している。したがって、応答出力部4は、相槌生成部22により生成された相槌応答および繰返生成部5により生成された繰返応答と同様の随意応答候補を生成することが想定される。
これに対し、応答出力部4は、随意応答候補の中から、相槌生成部22により生成された相槌応答および繰返生成部5により生成された繰返応答と重複する随意応答候補を除外する。そして、応答出力部4は、その除外された随意応答候補の中から最適な候補を選択し、随意応答文とする。これにより、重複する無駄な言葉を排除できより自然な対話を実現できる。
例えば、ユーザの発話「今日は暑いね」に対して、相槌生成部22が相槌応答「うん」を生成する。続いて、繰返生成部5は、繰返応答文「暑いね」を生成する。これに対し、応答出力部4は、随意応答候補「嫌だね」、「いつまで暑いのかな?」、「暑いね」、「そうだね」等を生成する。応答出力部4は、生成した随意応答候補の中から繰返生成部5により生成された繰返応答文と重複する「暑いね」を排除する。そして、応答出力部4は、その除外された随意応答候補の中から、例えば「いつまで暑いのかな?」を選択し、随意応答文とする。
なお、本実施形態2に係る応答生成装置20において、上記実施形態1に係る応答生成装置1と同一部分に同一符号を付して詳細な説明は省略する。
以下、応答生成装置20とユーザとの対話の一例を示す。下記一例において、Mは、応答生成装置20の応答文及び応答であり、Uはユーザの発話である。
M(話題提供):お昼何を食べたの?
U:トンカツを食べたよ。
M(相槌応答):うん。うん。
M(繰返応答文):トンカツかぁ。(「かぁ」を付加)
M(判断処理):第1単語「トンカツ」と第2単語「豚肉」とが関連と判断
M(随意応答文):トンカツは豚肉だよね?
U:(肯定的な回答)そうだね。
M(相槌応答):そうなんだ。
M(随意応答文):どこで食べたのかな?
・・・・・
U:トンカツを食べたよ。
M(相槌応答):なるほど。
M(繰返応答文):豚肉、豚肉だね。(「だね」を付加、「トンカツ」を「豚肉」に置換え)
M(随意応答文):食べたんだね。
上記対話の一例が示すように、ユーザが発話すると、この発話に対して、応答生成装置20の相槌応答、繰返応答文、及び随意応答文がテンポよく連続し、対話間の繋がりがよりスムーズになることが分かる。また、適宜、関連ワード情報を自動的に更新(キーワード「トンカツ」に対応する関連ワード「豚肉」を追加)でき、人的負荷が掛からないことが分かる。さらに、動詞又は名詞に付加語を付加し関連ワードへ置き換えることにより、繰返応答文に多様性を持たせることで、対話の自然性がより向上していることが分かる。
実施形態3
上記実施形態1及び2において、記憶判定部12は、ユーザ質問部11の質問に対するユーザの回答が肯定的である場合に、第1単語をキーワードとし第2単語を連想ワードとして、メモリ1bの関連ワード情報に逐次登録している。記憶判定部12が、キーワード及び連想ワードを、メモリ1bの関連ワード情報に制限なく登録を行った場合、メモリ1bの記憶容量に余裕がなくなることも想定される。
したがって、本実施形態3に係る記憶判定部12は、メモリ1bに記憶される関連ワード情報のキーワードの数を所定条件で制限する。関連ワード情報において、例えば、キーワードと、キーワードの関連ワードと、キーワードの利用数と、キーワードの登録時間と、が下記のように対応付けられている。
キーワード 関連ワード 利用数 登録時間
「トンカツ」 「豚肉」 1 YY:MM:DD
「ステーキ」 「牛肉」 0 YY:MM:DD
・・・・・・・・・・・・・・・・・・・・・・
例えば、記憶判定部12は、メモリ1bに記憶された関連ワード情報において、キーワード及び関連ワードの登録時間が新しいもの順で所定数(50語など)だけキーワード及び関連ワードを残し、その他を削除してもよい。記憶判定部12は、メモリ1bに記憶された関連ワード情報において、キーワード及び関連ワードの利用数が多いもの順で所定数だけキーワード及び関連ワードを残し、その他を削除してもよい。記憶判定部12は、メモリ1bに記憶された関連ワード情報において、登録時間から所定期間(N日など)経過し且つ利用数が所定数(1回など)以下のキーワード及び関連ワードを削除してもよい。
記憶判定部12は、メモリ1bに記憶された関連ワード情報において、連想強度やユーザプロファイル情報(ユーザの好感度、嗜好パターンなど)に基づいてキーワード及び関連ワードを削除してもよい。
なお、関連ワード情報は、ネットワーク100上のサーバやデータベースなどネットワーク装置101に記憶され、更新されてもよい(図5)。この場合、例えば、複数の応答生成装置1がネットワーク100クに接続されている。
各応答生成装置1は、第1単語のキーワード及び第2単語の連想ワードを、ネットワーク100上のネットワーク装置101に送信し、ネットワーク装置101に記憶された関連ワード情報を更新する。さらに、ネットワーク装置101は、関連ワード情報のキーワード及び関連ワードの数を上記のような所定条件で制限する。そして、ネットワーク装置101は、所定条件で制限した関連ワード情報を各応答生成装置1に送信する。各応答生成装置1は、ネットワーク装置101から送信された関連ワード情報をメモリ1bに記憶する。このように、複数の応答生成装置1からの情報に基づいて、ネットワーク装置で一括して関連ワード情報を更新することで、繰返応答文により多様性を持たせることができる。なお、本実施形態3において、上記実施形態1及び2と同一部分に同一符号を付して詳細な説明は省略する。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
上記実施形態において、繰返生成部5は、品詞抽出部9から出力された名詞又は動詞にメモリ1bの付加情報の付加語を付加した後、該名詞又は動詞をメモリ1bの関連ワード情報の関連ワードに、置き換えているが、これに限定されない。繰返生成部5は、品詞抽出部9から出力された名詞又は動詞を、メモリ1bの関連ワード情報の関連ワードに、置き換えた後、該置き換えた関連ワードにメモリ1bの付加情報の付加語を付加してもよい。
例えば、繰返生成部5は、品詞抽出部9から出力された名詞又は動詞と、メモリ1bの関連ワード情報と、に基づいて、品詞抽出部9から出力された名詞又は動詞と一致する関連ワード情報のキーワードを選択する。繰返生成部5は、品詞抽出部9から出力された名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換える。繰返生成部5は、品詞抽出部9から出力された名詞又は動詞と、メモリ1bの付加情報と、に基づいて、品詞抽出部9から出力された名詞又は動詞と一致する付加情報のキーワードを選択する。繰返生成部5は、該選択したキーワードに対応する付加語を、上記置き換えられた関連ワードに対して付加することで、繰返応答文を生成する。
上記実施形態において、応答出力部4は相槌生成部22により生成された相槌応答をスピーカ7から出力させているが、これに限られない。応答出力部4は、相槌生成部22により生成された相槌応答に基づいて、処理負荷の低い任意の応答を行っても良い。例えば、応答出力部4は、振動装置の振動、ライト装置の点灯/点滅、表示装置の表示、ロボットの手足、頭部、胴体など各部の動作などをおこなってもよく、これらを任意に組み合わせて行ってもよい。
上記実施形態において、応答出力部4は、繰返生成部5により生成された繰返応答文をスピーカ7から出力させているが、これに限らない。応答出力部4は、繰返生成部5により生成された繰返応答文に基づいて、処理負荷の低い任意の繰返応答文を出力しても良い。例えば、応答出力部4は、表示装置の表示などを用いて繰返応答文を出力してもよく、任意に手段を組み合わせて出力してもよい。この場合、例えば、応答出力部4の出力態様は、文字の大きさ、輝度、形状などの設定であってもよい。
また、本発明は、例えば、図3に示す処理を、CPU1aにコンピュータプログラムを実行させることにより実現することも可能である。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 応答生成装置、2 音声認識部、3 構造解析部、4 応答出力部、5 繰返生成部、6 マイク、7 スピーカ、8 不足格辞書データベース、9 品詞抽出部、10 関連ワード抽出部、11 ユーザ質問部、12 記憶判定部、21 音韻分析部、22 相槌生成部、23 定型応答データベース

Claims (6)

  1. ユーザの音声を認識するステップと、
    前記認識した音声の構造を解析するステップと、
    複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報を記憶するステップと、
    前記認識した音声から名詞又は動詞を抽出するステップと、
    前記抽出した名詞又は動詞と一致する前記記憶した情報のキーワードを選択し、該選択したキーワードに対応する付加語を、該抽出した名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成するステップと、
    前記解析した音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力するステップと、
    を含む応答生成方法であって、
    第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出するステップと、
    抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問するステップと、
    前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶するステップと、
    を含む、ことを特徴とする応答生成方法。
  2. 請求項1記載の応答生成方法であって、
    ネットワーク上に存在する前記所定の文章集合情報から、前記第1の名詞又は動詞と、第2の名詞又は動詞と、を抽出し、
    抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞との共起頻度を用いて、該第1の名詞又は動詞と第2の名詞又は動詞との類似度を算出し、該算出した類似度が閾値以上となる場合に、抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問し、
    前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶する、ことを特徴とする応答生成方法。
  3. 請求項1又は2記載の応答生成方法であって、
    前記記憶されたキーワードと関連する連想ワード及び付加語、の数を所定条件で制限するステップを更に含む、ことを特徴とする応答生成装置。
  4. 請求項1乃至3のうちいずれか1項記載の応答生成方法であって、
    前記ユーザの音声の音韻を分析するステップと、
    前記分析された音韻の分析結果に基づいて、前記ユーザの音声に対する相槌の応答を生成するステップと、を更に含み、
    前記生成される繰返しの応答文を出力する前に、前記生成された相槌の応答を出力する、ことを特徴する応答生成方法。
  5. ユーザの音声を認識する音声認識手段と、
    前記音声認識手段により認識された音声の構造を解析する構造解析手段と、
    複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報を記憶する記憶手段と、
    前記音声認識手段により認識された音声から名詞又は動詞を抽出する品詞抽出手段と、
    前記品詞抽出手段により抽出された名詞又は動詞と一致する前記記憶手段のキーワードを選択し、該選択したキーワードに対応する付加語を、該抽出された名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成する繰返生成手段と、
    前記構造解析手段により解析された音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力する応答出力手段と、
    を含む応答生成装置であって、
    第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出する抽出手段と、
    前記抽出手段により抽出された前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問する質問手段と、
    前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして前記記憶手段に登録する判定手段と、
    を含む、ことを特徴とする応答生成装置。
  6. ユーザの音声を認識する処理と、
    前記認識した音声の構造を解析する処理と、
    前記認識した音声から名詞又は動詞を抽出する処理と、
    複数のキーワードに該各キーワードに関連する連想ワード及び付加語を夫々対応付けた情報が記憶されており、前記抽出した名詞又は動詞と一致する前記キーワードを選択し、該選択したキーワードに対応する付加語を、該抽出した名詞又は動詞に対して付加し、該名詞又は動詞を、該選択したキーワードに対応する関連ワードに、置き換えることで、前記ユーザの音声を繰り返すための繰返し応答文を生成する処理と、
    前記解析した音声の構造に基づいて、前記ユーザの音声に対する随意の応答文を生成し、前記繰返し応答文を出力した後、前記随意の応答文を出力する処理と、
    コンピュータに実行させる応答生成プログラムをであって、
    第1の名詞又は動詞と、該第1の名詞又は動詞と関連する第2の名詞又は動詞と、を所定の文章集合情報から抽出する処理と、
    抽出した前記第1の名詞又は動詞と前記第2の名詞又は動詞とが同一であるか否かを前記ユーザに対して質問する処理と、
    前記質問に対するユーザの回答が肯定的である場合に、前記第1の名詞又は動詞を前記キーワードとし、前記第2の名詞又は動詞を前記連想ワードとして記憶する処理と、
    をコンピュータに実行させる、ことを特徴とする応答生成プログラム。
JP2014227215A 2014-11-07 2014-11-07 応答生成方法、応答生成装置及び応答生成プログラム Active JP6299563B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014227215A JP6299563B2 (ja) 2014-11-07 2014-11-07 応答生成方法、応答生成装置及び応答生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014227215A JP6299563B2 (ja) 2014-11-07 2014-11-07 応答生成方法、応答生成装置及び応答生成プログラム

Publications (2)

Publication Number Publication Date
JP2016090891A JP2016090891A (ja) 2016-05-23
JP6299563B2 true JP6299563B2 (ja) 2018-03-28

Family

ID=56016603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014227215A Active JP6299563B2 (ja) 2014-11-07 2014-11-07 応答生成方法、応答生成装置及び応答生成プログラム

Country Status (1)

Country Link
JP (1) JP6299563B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6790791B2 (ja) * 2016-12-14 2020-11-25 トヨタ自動車株式会社 音声対話装置および対話方法
WO2018207485A1 (ja) * 2017-05-11 2018-11-15 株式会社村田製作所 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法
JP6985311B2 (ja) * 2019-02-06 2021-12-22 Kddi株式会社 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法
CN114417891B (zh) * 2022-01-22 2023-05-09 平安科技(深圳)有限公司 基于粗糙语义的回复语句确定方法、装置及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145541A (ja) * 2002-10-23 2004-05-20 Inosu:Kk チャットシステム
JP4192799B2 (ja) * 2004-02-13 2008-12-10 日本電気株式会社 同義語辞書作成支援システム、同義語辞書作成支援方法および同義語辞書作成支援プログラム
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
JP2009193448A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 対話システム、方法及びプログラム

Also Published As

Publication number Publication date
JP2016090891A (ja) 2016-05-23

Similar Documents

Publication Publication Date Title
US10936664B2 (en) Dialogue system and computer program therefor
CN110827821B (zh) 一种语音交互装置、方法和计算机可读存储介质
CN102831891B (zh) 一种语音数据处理方法及系统
US20190164551A1 (en) Response sentence generation apparatus, method and program, and voice interaction system
Johar Emotion, affect and personality in speech: The Bias of language and paralanguage
WO2021179701A1 (zh) 多语种语音识别方法、装置及电子设备
JP6390264B2 (ja) 応答生成方法、応答生成装置及び応答生成プログラム
CN110334197A (zh) 语料处理方法及相关装置
JP6299563B2 (ja) 応答生成方法、応答生成装置及び応答生成プログラム
JP7059813B2 (ja) 音声対話システム、その処理方法及びプログラム
US20070136067A1 (en) Audio dialogue system and voice browsing method
CN108536668A (zh) 唤醒词评估方法及装置、存储介质、电子设备
CN106843523A (zh) 基于人工智能的文字输入方法和装置
JP6828667B2 (ja) 音声対話装置、音声対話方法及びプログラム
JP2012037790A (ja) 音声対話装置
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
JP6295869B2 (ja) 応答生成装置、応答生成方法及びプログラム
JP2016080981A (ja) 応答生成装置、応答生成方法及び応答生成プログラム
Ekstedt et al. Automatic Evaluation of Turn-taking Cues in Conversational Speech Synthesis
JP6287754B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
Charfuelan MARY TTS HMMbased voices for the Blizzard Challenge 2012
KR102090240B1 (ko) 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법
CN114492382A (zh) 人物提取方法、文本朗读方法、对话式文本生成方法、装置、设备及存储介质
JP6773074B2 (ja) 応答生成方法、応答生成装置及び応答生成プログラム
JP6538399B2 (ja) 音声処理装置、音声処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180212

R151 Written notification of patent or utility model registration

Ref document number: 6299563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151