JP2001188783A - 情報処理装置および方法、並びに記録媒体 - Google Patents

情報処理装置および方法、並びに記録媒体

Info

Publication number
JP2001188783A
JP2001188783A JP37378399A JP37378399A JP2001188783A JP 2001188783 A JP2001188783 A JP 2001188783A JP 37378399 A JP37378399 A JP 37378399A JP 37378399 A JP37378399 A JP 37378399A JP 2001188783 A JP2001188783 A JP 2001188783A
Authority
JP
Japan
Prior art keywords
history
user
unit
dialogue
response sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP37378399A
Other languages
English (en)
Inventor
Hironaga Tsutsumi
洪長 包
Kazuhiko Tajima
和彦 田島
Masatoshi Takeda
正資 武田
Masanori Omote
雅則 表
Atsuo Hiroe
厚夫 廣江
Hideki Kishi
秀樹 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP37378399A priority Critical patent/JP2001188783A/ja
Publication of JP2001188783A publication Critical patent/JP2001188783A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 算出した重み付け値の優先順位で対話履歴を
利用し、応答文を生成することができるようにする。 【解決手段】 対話制御部91は、ユーザの発話の意味
理解の結果に関連する対話履歴を、重み付け部92を介
して、対話履歴記憶部93から読み取るとともに、重み
付け部92から与えられる、その対話履歴の重み付け値
を受け取り、その重み付け値に対応する優先順位で対話
履歴を利用し、ユーザの発話に対する応答としての応答
文の意味等を示す情報を生成する。すなわち、対話履歴
記憶部93は、ユーザとの対話の履歴(対話履歴)を記
憶している。重み付け部92は、対話制御部91により
読み出される対話履歴とともに、その重み付け値を算出
し、対話制御部91に供給する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、並びに記録媒体に関し、特に、外部から与えら
れる要因、または内部で発生する要因に対応して、発話
に対する応答としての応答文を生成することができる情
報処理装置および方法、並びに記録媒体に関する。
【0002】
【従来の技術】音声認識技術を利用して、ユーザの発話
を認識し、その発話に対する応答としての応答文を発話
し、ユーザと対話する機能、いわゆる、対話機能を有す
るロボットが実用化されている。
【0003】この対話機能においては、過去のユーザの
対話が、対話履歴として管理されており、現在の対話を
行う上で必要な情報源として利用される。例えば、ユー
ザの発話で省略された事柄が、対話履歴が参照されて推
測され、その推測結果に基づいて、その発話に対する応
答としての応答文が生成される。
【0004】
【発明が解決しようとする課題】しかしながら、応答文
生成のための対話履歴の利用は、時間経過や、外部から
与えられる要因(例えば、強く叩かれることによる圧
力)、内部で発生する要因(例えば、バッテリの残量)
などに対応しておらず、例えば、強く叩かれたときに、
対話履歴が利用できないようにし、あたかも記憶を喪失
したかのような発話をさせたり、より変化に富んだ対話
を行うことができない課題があった。
【0005】本発明はこのような状況に鑑みてなされた
ものであり、時間経過や、外部から与えられる要因、内
部で発生する要因に対応して、応答文を生成することが
できるようにするものである。
【0006】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、ユーザとの対話の履歴を管理する管理手段
と、外部から与えられる要因、または内部で発生する要
因に基づいて、管理手段により管理されている対話の履
歴の重み付け値を算出する算出手段と、算出手段により
算出された対話の履歴の重み付け値に基づいて、応答文
を生成する生成手段とを備えることを特徴とする。
【0007】請求項2に記載の情報処理方法は、ユーザ
との対話の履歴を管理する管理ステップと、外部から与
えられる要因、または内部で発生する要因に基づいて、
管理ステップの処理で管理された対話の履歴の重み付け
値を算出する算出ステップと、算出ステップの処理で算
出された対話の履歴の重み付け値に基づいて、応答文を
生成する生成ステップとを含むことを特徴とする。
【0008】請求項3に記載の記録媒体のプログラム
は、ユーザとの対話の履歴を管理する管理ステップと、
外部から与えられる要因、または内部で発生する要因に
基づいて、管理ステップの処理で管理された対話の履歴
の重み付け値を算出する算出ステップと、算出ステップ
の処理で算出された対話の履歴の重み付け値に基づい
て、応答文を生成する生成ステップとを含むことを特徴
とする。
【0009】請求項1に記載の情報処理装置、請求項2
に記載の情報処理方法、および請求項3に記載の記録媒
体のプログラムにおいては、ユーザとの対話の履歴が管
理され、外部から与えられる要因、または内部で発生す
る要因に基づいて、管理された対話の履歴の重み付け値
が算出され、算出された対話の履歴の重み付け値に基づ
いて、応答文が生成される。
【0010】
【発明の実施の形態】図1は、本発明を適用したロボッ
トの外観構成例を示しており、図2は、その電気的構成
例を示している。このロボットは、例えば、ユーザから
の「なでる」や「たたく」といった外部からの物理的な
働きかけに対する応答として、またはユーザの発話に対
する応答として、頭部を上下左右に振らせ、若しくは歩
行するなどの行動を行ったり、または応答文を発話す
る。
【0011】本実施の形態では、ロボットは、犬形状の
ものとされており、胴体部ユニット2の前後左右に、そ
れぞれ脚部ユニット3A,3B,3C,3Dが連結され
るとともに、胴体部ユニット2の前端部と後端部に、そ
れぞれ頭部ユニット4と尻尾部ユニット5が連結される
ことにより構成されている。
【0012】尻尾部ユニット5は、胴体部ユニット2の
上面に設けられたベース部5Bから、2自由度をもって
湾曲または揺動自在に引き出されている。
【0013】胴体部ユニット2には、ロボット全体の制
御を行うコントローラ10、ロボットの動力源となるバ
ッテリ11、並びにバッテリセンサ12および熱センサ
13からなる内部センサ部14などが収納されている。
【0014】頭部ユニット4には、「耳」に相当するマ
イク(マイクロフォン)15、「目」に相当するCCD
(Charge Coupled Device)カメラ16、触覚に相当する
タッチセンサ17、「口」に相当するスピーカ18など
が、それぞれ所定位置に配設されている。
【0015】脚部ユニット3A乃至3Dそれぞれの関節
部分や、脚部ユニット3A乃至3Dそれぞれと胴体部ユ
ニット2の連結部分、頭部ユニット4と胴体部ユニット
2の連結部分、並びに尻尾部ユニット5と胴体部ユニッ
ト2の連結部分などには、図2に示すように、それぞれ
アクチュエータ3AA1乃至3AAK、3BA1乃至3B
AK、3CA1乃至3CAK、3DA1乃至3DAK、4A1
乃至4AL、5A1および5A2が配設されており、これ
により、各連結部分は、所定の自由度をもって回転する
ことができるようになっている。
【0016】頭部ユニット4におけるマイク15は、ユ
ーザからの発話を含む周囲の音声(音)を集音し、得ら
れた音声信号を、コントローラ10に送出する。CCD
カメラ16(例えば、152万画素を有するCCDカメ
ラ)は、周囲の状況を撮像し、得られた画像信号を、コ
ントローラ10に送出する。
【0017】タッチセンサ17は、例えば、頭部ユニッ
ト4の上部に設けられており、ユーザからの「なでる」
や「たたく」といった物理的な働きかけにより受けた圧
力を検出し、その検出結果を圧力検出信号としてコント
ローラ10に送出する。
【0018】胴体部ユニット2におけるバッテリセンサ
12は、バッテリ11の残量を検出し、その検出結果
を、バッテリ残量検出信号としてコントローラ10に送
出する。熱センサ13は、ロボット内部の熱や外気の温
度を検出し、その検出結果を、コントローラ10に送出
する。
【0019】コントローラ10は、CPU(Central Pro
cessing Unit)10Aやメモリ10B等を内蔵してお
り、CPU10Aにおいて、メモリ10Bに記憶された
制御プログラムが実行されることにより、各種の処理を
行う。
【0020】即ち、コントローラ10は、バッテリセン
サ12や、熱センサ13、マイク15、CCDカメラ1
6、タッチセンサ17から与えられる各信号に基づい
て、周囲の状況や、ユーザからの指令、ユーザからの働
きかけなどの有無を判断する。
【0021】さらに、コントローラ10は、この判断結
果等に基づいて、続く行動を決定し、その決定結果に基
づいて、アクチュエータ3AA1乃至3AAK、3BA1
乃至3BAK、3CA1乃至3CAK、3DA1乃至3DA
K、4A1乃至4AL、5A1、5A2のうちの必要なもの
を駆動させ、これにより、頭部ユニット4を上下左右に
振らせたり、尻尾部ユニット5を動かせたり、各脚部ユ
ニット3A乃至3Dを駆動して、ロボットを歩行させる
などの行動を行わせる。
【0022】また、コントローラ10は、必要に応じ
て、合成音を生成し、スピーカ18に供給して出力させ
る。
【0023】以上のようにして、ロボットは、周囲の状
況等に基づいて自律的に行動をとることができるように
なっている。
【0024】次に、図3は、コントローラ10の、ユー
ザの発話に対する応答としての応答文を発話し、対話を
行う機能(以下、対話機能と称する)の第1の実施の形
態の構成例を示している。なお、この対話機能の構成
は、CPU10Aが、メモリ10Bに記憶された制御プ
ログラムを実行することで実現されるようになってい
る。
【0025】音声認識部31には、ユーザが発話した音
声がマイク15を介して入力されるようになっており、
音声認識部31は、入力された音声を音声認識し、その
音声認識結果としてのテキスト、その他付随する情報
(例えば、ワードグラフ等)を言語解析部32に供給す
る。
【0026】言語解析部32は、音声認識部31からの
音声認識結果を解析し、ユーザの発話の内容の意味理解
を行い、その意味理解の結果を対話管理部33に出力す
る。
【0027】対話管理部33は、言語解析部32からの
意味理解の結果に基づき、ユーザとの対話の履歴(対話
履歴)を管理する。
【0028】対話管理部33はまた、その意味理解の結
果に関連する対話履歴を利用して、ユーザの発話に対す
る応答としての応答文を生成するための応答文の意味や
概念を示す情報(以下、応答文意味情報と称する)を生
成し、応答文生成部34に出力する。対話管理部33
は、このとき管理する対話履歴の重み付け値を、所定の
重み付け関数(後述)に基づき算出し、その算出結果に
基づく優先順位で、対話履歴を利用する。
【0029】応答文生成部34は、対話管理部33から
の応答文意味情報に基づいて、応答文を生成し、音声合
成部35に出力する。
【0030】音声合成部35は、応答文生成部34から
の応答文に対応する合成音を生成し、スピーカ18に出
力する。
【0031】図4は、音声認識部31の構成例を示して
いる。ユーザの発話は、マイク15に入力され、マイク
15で、電気信号としての音声信号に変換され、AD(A
nalog Digital)変換部51に供給される。AD変換部5
1では、マイク15からのアナログ信号である音声信号
がサンプリング、量子化され、ディジタル信号である音
声データに変換される。この音声データは、特徴抽出部
52に供給される。
【0032】特徴抽出部52は、AD変換部51からの
音声データについて、短時間パワーと自己相関分析を組
み合わせた方法などにより、音声区間を検出する。特徴
抽出部52は、検出した音声区間毎に、例えば、スペク
トルや、線形予測係数、ケプストラム係数、線スペクト
ル対等の特徴パラメータを抽出し、マッチング部53に
供給する。
【0033】マッチング部53は、その特徴パラメータ
に基づき、音響モデルデータベース54、辞書データベ
ース55、および文法データベース56を参照して、マ
イク15に入力された音声(入力音声)を認識する。
【0034】すなわち、音響モデルデータベース54
は、音声認識する音声の言語における個々の音素や音節
などの音響的な特徴を表す音響モデルを記憶している。
ここで、音響モデルとしては、例えば、HMM(Hidden
Markov Model)などを用いることができる。
【0035】辞書データベース55は、認識対象の各単
語について、その発音に関する辞書情報が記述されてい
る単語辞書を記憶している。文法データベース56は、
辞書データベース55の単語辞書に登録されている各単
語が、どのように連鎖する(つながる)かを記述した文
法規則を記憶している。ここで、文法規則としては、例
えば、文脈自由文法(CFG)や、統計的な単語連鎖確
率(N−gram)などに基づく規則を用いることがで
きる。
【0036】マッチング部53は、辞書データベース5
5の辞書情報を参照することにより、音響モデルデータ
ベース54に記憶されている音響モデルを接続すること
で、単語の音響モデル(単語モデル)を構成する。さら
に、マッチング部53は、幾つかの単語モデルを、文法
データベース56に記憶された文法規則を参照すること
により接続し、そのようにして接続された単語モデルを
用いて、特徴パラメータに基づき、例えば、HMM法等
によって、マイク15に入力された音声を認識する。
【0037】マッチング部53による音声認識結果は、
例えば、テキスト等で、言語解析部32に送出される。
【0038】図5は、言語解析部32の構成例を示して
いる。言語解析部32のテキスト解析部71には、音声
認識部31が出力する音声認識結果としてのテキスト等
が、入力されるようになっており、テキスト解析部71
は、辞書データベース72および解析用文法データベー
ス73を参照しながら、そのテキストを解析し、意味理
解を行う。
【0039】すなわち、辞書データベース72は、各単
語の表記や、解析用文法を適用するために必要な品詞情
報などの辞書情報が記述されている単語辞書を記憶して
いる。
【0040】解析用文法データベース73は、単語辞書
に記述された各単語の情報に基づいて、単語連鎖に関す
る制約等が記述された解析用文法規則を記憶している。
【0041】テキスト解析部71は、その辞書情報およ
び解析用文法規則に基づいて、入力されるテキスト(入
力テキスト)の形態素解析や、構文解析等を行って、入
力テキストの意味理解を行う。
【0042】テキスト解析部71による意味理解の結果
は、対話管理部33に供給される。
【0043】図6は、対話管理部33の構成例を示して
いる。対話管理部33の対話制御部91には、言語解析
部32からの意味理解の結果が入力されるようになって
いる。対話制御部91は、その意味理解の結果の一部ま
たは全部を、重み付け部92を介して、対話履歴記憶部
93に順次供給して記憶させる。これにより、この対話
機能を介して行われた対話の履歴(対話履歴)が対話履
歴記憶b93に記録される。
【0044】対話制御部91はまた、意味理解の結果に
関連する対話履歴を、重み付け部92を介して、対話履
歴記憶部93から読み取るとともに、重み付け部92か
ら与えられる、その対話履歴の重み付け値を受け取り、
その重み付け値に基づく優先順位で対話履歴を利用し
て、ユーザの発話に対する応答としての応答文の応答文
意味情報を生成する。
【0045】すなわち、対話履歴記憶部93は、ユーザ
との対話の履歴(対話履歴)を記憶している。重み付け
部92は、対話制御部91により読み出される対話履歴
とともに、その重み付け値を算出し、対話制御部91に
供給する。
【0046】重み付け部92は、例えば、対話履歴が対
話履歴記憶部93に記録された時刻t(内部で発生する
要因)を1つの変数とし、式(1)を満たし、さらにそ
の値が図7に示すように変化する重み付け関数W(t)
で、重み付け値を算出する。
【0047】
【数1】 なお、式中、t0は、その対話履歴(対話)が記憶され
た時刻を示し、t(n-1)は、現在の時刻tnの直前の時刻
を示し、[t0,t(n-1)]は、対話履歴記憶部93により
設定される時間領域である。
【0048】対話制御部91は、対話履歴記憶部93か
ら読み出した対話履歴を、重み付け部92から与えられ
たその重み付け値の大きい方から順番に利用して応答文
意味情報を生成する。
【0049】なお、重み付け関数W(t)は、対話履歴
が対話履歴記憶部93に記憶された時刻が、現在の時刻
に近ければ近いほど(対話履歴記憶部93に記憶されて
いる時間が短ければ短いほど)、その値が単純に増加す
る関数ではない。すなわち、重み付け関数W(t)は、
記憶時間の長さと対話履歴の利用価値が対応しない場合
に用いられる関数である。
【0050】一方、対話履歴の記憶時間の長さに伴っ
て、対話履歴の利用価値が低下する場合の場合(いわゆ
る、情報としての新鮮度が低下する場合)においては、
対話履歴が対話履歴記憶部93に記録された時刻tを1
つの変数とし、式(2)を満たし、さらにその値が図8
に示すように変化する重み付け関数F(t)で、重み付
け値を算出することもできる。
【0051】
【数2】 0<=F(t)<=1 F(t1)>=F(t2), t1は、t2より現在に近い時刻 ・・・・(2)
【0052】F(t)は、記憶された時刻が、現在の時
刻に近ければ近いほど(記憶されている時間が短ければ
短いほど)、その値が単純に増加する関数である。
【0053】また、内容や含まれるキーワードが共通す
る対話履歴の重み付け値を累積し、その累積された値
を、その対話履歴の重み付け値とすることもできる。図
9の例では、キーワードAを含む対話履歴の重み付け値
は、0.55(=0.05+0.1+0.15+0.25)で、キーワード
Bを含む対話履歴の重み付け値は、0.25(=0.05+0.
2)で、キーワードCを含む対話履歴の重み付け値は、
0.2となり、その結果、この例の場合、キーワードA
を含む対話履歴、キーワードBを含む対話履歴、そして
キーワードCを含む対話履歴の順番でそれらが利用さ
れ、応答文意味情報が生成される。
【0054】図10は、応答文生成部34の構成例を示
している。応答文生成部34のテキスト生成部101に
は、対話管理部33からの応答文意味情報が入力され
る。応答文生成部101は、入力された応答文意味情報
に基づき、生成規則データベース102を参照して、応
答文(テキスト)を生成する。
【0055】すなわち、生成規則データベース102に
は、例えば単語の活用規則や語順の制約等の生成用文法
規則が記述されている単語辞書が記憶されている。
【0056】図11は、対話機能の第2の実施の形態の
構成例を示している。この対話機能には、図3に示す対
話機能に、その出力が、対話管理部33に供給される入
力処理部201が設けられている。
【0057】入力処理部201は、バッテリセンサ12
から与えられるバッテリ残量検出信号(内部で発生する
要因)を入力し、対話管理部33に送出する。
【0058】入力処理部201から入力されたバッテリ
残量検出信号は、対話管理部33の重み付け部92(図
6)に供給されるようになっており、重み付け部92
は、その信号を利用して、対話制御部91により読み出
された対話履歴の重み付け値を算出する。
【0059】重み付け部92は、例えば、バッテリセン
サ12により検出されたバッテリ残量検出信号の大きさ
(バッテリの残量)を1つの変数とし、式(3)を満た
し、さらにその値が図12に示すように変化する重み付
け関数G(e)で、重み付け値を算出する。
【0060】
【数3】
【0061】すなわち、重み付け関数G(e)によれ
ば、バッテリの残量が少なくなればなるほど、そのとき
対話履歴記憶部93から読み出される対話履歴の重み付
け値は、小さい値となる。
【0062】なお、以上においては、バッテリセンサ1
2からのバッテリ残量検出信号を1つの変数とする重み
付け関数G(e)で、重み付け値を算出する場合を例と
して説明したが、入力処理部201が、タッチセンサ1
7により検出された圧力検出信号(外部から与えられる
要因)を入力し、対話管理部33に供給し、対話管理部
33において、圧力検出信号を1つの変数とし、例え
ば、式(4)に示すように、その信号の大きさが、所定
のしきい値L以上である場合(例えば、ロボットが落下
し、強い衝撃を受けた場合)、重み付け値が0となり、
それ未満の圧力検出信号が検出された場合、上述した重
み付け関数W(t)(また、重み付け関数F(t))で
重み付け値が算出される重み付け関数H(t)で、重み
付け値を算出することもできる。
【0063】
【数4】 ・・・(4)
【0064】これにより、例えば、図9の例の場合にお
いて、時刻t4で、ロボットが落下し、その結果、しき
い値Lより大きい圧力検出信号が発生した場合、図13
に示すように、時刻t4以前に記憶された対話履歴の重
み付け値は0となる。その結果、キーワードAを含む対
話履歴の重み付け値は、0.25、キーワードBを含む
対話履歴の重み付け値は、0.2、そしてキーワードC
を含む対話履歴の重み付け値は、0となる。すなわち、
この場合、キーワードCを含む対話履歴が利用されない
で応答文が生成されず、ロボットは、あたかもキーワー
ドCを含む対話履歴の内容を喪失したかのような応答文
を発話する。
【0065】また、入力処理部201が、画像信号また
は音声信号(外部から与えられる要因)を入力して、そ
の信号を対話管理部33に供給し、例えば、周囲の明る
さに対応する重み付け値を算出するようにしたり、大き
な音がしたときに重み付け値を変更するようにして重み
付け値を算出することができる。また、ロボットの成長
状態や、感情状態、性別(内部で発生する要因)を利用
して重み付け値を算出することもできる。さらに所定の
キーワード毎に、重み付け値を設定しておくこともでき
る。
【0066】上述した一連の処理は、ハードウエアによ
り実現させることもできるが、ソフトウエアにより実現
させることもできる。一連の処理をソフトウエアにより
実現する場合には、そのソフトウエアを構成するプログ
ラムがコンピュータにインストールされ、そのプログラ
ムがコンピュータで実行されることより、上述した路ロ
ボットが機能的に実現される。
【0067】図14は、上述のようなロボットとして機
能するコンピュータ501の一実施の形態の構成を示す
ブロック図である。CPU511にはバス515を介して
入出力インタフェース516が接続されており、CPU5
11は、入出力インタフェース516を介して、ユーザ
から、キーボード、マウスなどよりなる入力部518か
ら指令が入力されると、例えば、ROM(Read Only Memor
y)512、ハードディスク514、またはドライブ5
20に装着される磁気ディスク531、光ディスク53
2、光磁気ディスク533、若しくは半導体メモリ53
4などの記録媒体に格納されているプログラムを、RAM
(Random Access Memory)513にロードして実行す
る。これにより、上述した各種の処理が行われる。さら
に、CPU511は、その処理結果を、例えば、入出力イ
ンタフェース516を介して、LCD(Liquid Crystal Di
splay)などよりなる表示部517に必要に応じて出力
する。なお、プログラムは、ハードディスク514やRO
M512に予め記憶しておき、コンピュータ501と一
体的にユーザに提供したり、磁気ディスク531、光デ
ィスク532、光磁気ディスク533,半導体メモリ5
34等のパッケージメディアとして提供したり、衛星、
ネットワーク等から通信部519を介してハードディス
ク514に提供することができる。
【0068】
【発明の効果】請求項1に記載の情報処理装置、請求項
2に記載の情報処理方法、および請求項3に記載の記録
媒体のプログラムによれば、外部から与えられる要因、
または内部で発生する要因に基づいて、対話の履歴の重
み付け値を算出し、算出した前記対話の履歴の前記重み
付け値に基づいて、前記応答文を生成するようにしたの
で、より変化に富んだ対話を可能とする。
【図面の簡単な説明】
【図1】本発明を適用したロボットの外観の構成例を示
す図である。
【図2】図1のロボットの内部の構成例を示すブロック
図である。
【図3】図2のコントローラ10の、対話機能の第1の
実施の形態の構成例を示すブロック図である。
【図4】図3の音声認識部31の構成例を示すブロック
図である。
【図5】図3の言語解析部32の構成例を示すブロック
図である。
【図6】図3の対話管理部33の構成例を示すブロック
図である。
【図7】重み付け関数W(t)を説明する図である。
【図8】重み付け関数F(t)を説明する図である。
【図9】キーワードが共通する対話履歴の重み付け値の
累積方法を説明する図である。
【図10】図3の応答文生成部34の構成例を示すブロ
ック図である。
【図11】図2のコントローラ10の、対話機能の第2
の実施の形態の構成例を示すブロック図である。
【図12】重み付け関数G(e)を説明する図である。
【図13】キーワードが共通する対話履歴の重み付け値
の累積方法を説明する他の図である。
【図14】コンピュータ501の構成例を示す図であ
る。
【符号の説明】
10 コントローラ, 10A CPU, 10B メ
モリ, 15 マイク, 16 CCDカメラ, 3
1 音声認識部, 32 言語解析部, 33対話管理
部, 34 応答文生成部, 35 音声合成部, 9
1 対話制御部, 92 重み付け部, 93 対話履
歴記憶部, 201 入力処理部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 武田 正資 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 表 雅則 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 廣江 厚夫 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 岸 秀樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 2C150 CA02 DA02 DA23 DA24 DF01 DF33 DJ08 ED31 ED42 ED47 ED49 ED59 EF13 EF15 EF16 EF23 EF28 EH07 FA01 FA02 5B091 AA15 CA14 CA21 CB12 CB32 CD01 DA06 5D015 AA04 AA05 BB01 HH03 HH13 KK01 LL06 5D045 AB11 AB30

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ロボットが出力する、ユーザの発話に対
    する応答としての応答文を生成し、前記ユーザと対話す
    る情報処理装置において、 前記ユーザとの対話の履歴を管理する管理手段と、 外部から与えられる要因、または内部で発生する要因に
    基づいて、前記管理手段により管理されている前記対話
    の履歴の重み付け値を算出する算出手段と、 前記算出手段により算出された前記対話の履歴の前記重
    み付け値に基づいて、前記応答文を生成する生成手段と
    を備えることを特徴とする情報処理装置。
  2. 【請求項2】 ロボットが出力する、ユーザの発話に対
    する応答としての応答文を生成し、前記ユーザと対話す
    る情報処理装置の情報処理方法において、 前記ユーザとの対話の履歴を管理する管理ステップと、 外部から与えられる要因、または内部で発生する要因に
    基づいて、前記管理ステップの処理で管理された前記対
    話の履歴の重み付け値を算出する算出ステップと、 前記算出ステップの処理で算出された前記対話の履歴の
    前記重み付け値に基づいて、前記応答文を生成する生成
    ステップとを含むことを特徴とする情報処理方法。
  3. 【請求項3】 ロボットが出力する、ユーザの発話に対
    する応答としての応答文を生成し、前記ユーザと対話す
    る場合の、情報処理用のプログラムであって、 前記ユーザとの対話の履歴を管理する管理ステップと、 外部から与えられる要因、または内部で発生する要因に
    基づいて、前記管理ステップの処理で管理された前記対
    話の履歴の重み付け値を算出する算出ステップと、 前記算出ステップの処理で算出された前記対話の履歴の
    前記重み付け値に基づいて、前記応答文を生成する生成
    ステップとを含むことを特徴とするコンピュータが読み
    取り可能なプログラムが記録されている記録媒体。
JP37378399A 1999-12-28 1999-12-28 情報処理装置および方法、並びに記録媒体 Pending JP2001188783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP37378399A JP2001188783A (ja) 1999-12-28 1999-12-28 情報処理装置および方法、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37378399A JP2001188783A (ja) 1999-12-28 1999-12-28 情報処理装置および方法、並びに記録媒体

Publications (1)

Publication Number Publication Date
JP2001188783A true JP2001188783A (ja) 2001-07-10

Family

ID=18502753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37378399A Pending JP2001188783A (ja) 1999-12-28 1999-12-28 情報処理装置および方法、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP2001188783A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
JP2006137366A (ja) * 2004-11-15 2006-06-01 Honda Motor Co Ltd 車両用機器制御装置
CN100371926C (zh) * 2004-07-26 2008-02-27 索尼株式会社 通过响应输入语句而输出应答语句的交互对话装置和方法
JP2008293019A (ja) * 2007-05-22 2008-12-04 Honda Motor Co Ltd 言語理解装置
CN109176535A (zh) * 2018-07-16 2019-01-11 北京光年无限科技有限公司 基于智能机器人的交互方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN100371926C (zh) * 2004-07-26 2008-02-27 索尼株式会社 通过响应输入语句而输出应答语句的交互对话装置和方法
JP2006137366A (ja) * 2004-11-15 2006-06-01 Honda Motor Co Ltd 車両用機器制御装置
JP2008293019A (ja) * 2007-05-22 2008-12-04 Honda Motor Co Ltd 言語理解装置
US8244522B2 (en) 2007-05-22 2012-08-14 Honda Motor Co., Ltd. Language understanding device
CN109176535A (zh) * 2018-07-16 2019-01-11 北京光年无限科技有限公司 基于智能机器人的交互方法及系统
CN109176535B (zh) * 2018-07-16 2021-10-19 北京光年无限科技有限公司 基于智能机器人的交互方法及系统

Similar Documents

Publication Publication Date Title
JP4296714B2 (ja) ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム
US20210035552A1 (en) Non-speech input to speech processing system
KR101229034B1 (ko) 디바이스 인터페이싱을 위한 다중모드 조음 통합
JP2002268699A (ja) 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
US10176809B1 (en) Customized compression and decompression of audio data
JP2004090109A (ja) ロボット装置およびロボット装置の対話方法
JP4667082B2 (ja) 音声認識方法
JP2001188555A (ja) 情報処理装置および方法、並びに記録媒体
JP2001215993A (ja) 対話処理装置および対話処理方法、並びに記録媒体
JP2019514045A (ja) 話者照合方法及びシステム
US11495235B2 (en) System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks
JP2004198831A (ja) 音声認識装置および方法、プログラム、並びに記録媒体
JP2013205842A (ja) プロミネンスを使用した音声対話システム
JP2001188779A (ja) 情報処理装置および方法、並びに記録媒体
JP6712754B2 (ja) 談話機能推定装置及びそのためのコンピュータプログラム
JP2002342323A (ja) 言語モデル学習装置およびそれを用いた音声認識装置ならびに言語モデル学習方法およびそれを用いた音声認識方法ならびにそれらの方法を記憶した記憶媒体
JP2001188783A (ja) 情報処理装置および方法、並びに記録媒体
US20230148275A1 (en) Speech synthesis device and speech synthesis method
JP2001188782A (ja) 情報処理装置および方法、並びに記録媒体
JP2004286805A (ja) 話者識別装置および話者識別方法、並びにプログラム
JP2002258886A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP5476760B2 (ja) コマンド認識装置
US11176930B1 (en) Storing audio commands for time-delayed execution
JP4656354B2 (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP2004170756A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071026