JP4729902B2 - 音声対話システム - Google Patents
音声対話システム Download PDFInfo
- Publication number
- JP4729902B2 JP4729902B2 JP2004319327A JP2004319327A JP4729902B2 JP 4729902 B2 JP4729902 B2 JP 4729902B2 JP 2004319327 A JP2004319327 A JP 2004319327A JP 2004319327 A JP2004319327 A JP 2004319327A JP 4729902 B2 JP4729902 B2 JP 4729902B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- response
- semantic processing
- timing
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
以下、図面を参照して本発明の第1の実施の形態を詳細に説明する。本実施の形態には、図1に示すように、発話者であるユーザの顔部分を撮影するカメラ10、及び発話者の音声を入力するためのマイク12が設けられている。
(1)ステップ1
まず、最初のステップ1では、図4に示すように、応答単位の情報及び意味処理単位の情報を備えた発話について、モデル化する地点の前後に直前N個及び直後n個の窓(ウインド)を設けて、形態素単位に区切られた単語列を抽出する。図4は「大人の雰囲気の」の直後が応答単位もしくは意味処理単位であるかどうかをモデル化する場合を示すものである。窓幅は任意に定めることができるが、本実施の形態の窓では、直前4個、直後1個の単語が含まれる大きさとした。
(2)ステップ2
ステップ2では、ステップ1で、窓枠を設けた各範囲に対して、特徴量をベクトルデータに変換する。本実施の形態では、形態素情報や係り受け情報等の言語的特徴、ピッチの時系列情報等の音響的特徴、及び視線の時系列情報等の画像情報を特徴として用い、これらの全ての特徴に対して特徴量である一意のベクトル値を割り当てる。
(3)ステップ3
ステップ3では、全学習データに対して学習器44及び学習器46でモデルを作成する。すなわち、上記ステップ2で作成した学習データに対して、応答単位と意味処理単位の各モデルを各々作成する。
(1)ステップ1
ステップ1では、判別する地点の前後に窓を設けて判別する箇所の前後の単語を抽出する。ここで使用する窓は、抽出する単語の個数がモデル化の際の個数と同一になる窓を使用する。
(2)ステップ2
ステップ2では、与えられた線形ベクトルの値をSVMで計算する。すなわち、ステップ1で得られた範囲のデータを学習時と同様に特徴ベクトルデータxに変換し、学習時に得られたパラメータを用いて、下記(3)式に基づいてCを求める。
ステップ3では、計算されたCの値により区切りか、つなぎかを判定する。すなわち、ステップ2で計算されたCの値が正であれば応答単位や意味処理単位の区切りを表し、負であれば応答単位や意味処理単位のつなぎを表すと判断する。
つぎに、本発明の第2の実施形態について説明する。なお、第1の実施形態と同一の部位には同一の符号を付し、その詳細な説明は省略する。
ユーザ :「すごく行列だったけど(無音区間)」
システム:「えー最悪だね」
ユーザ :「そんなに待たなくて(無音区間)」
システム:「いいね」
ユーザ :「よかったよ(無音区間)」
システム:「へーよかったね」
となり、テンポの悪い対話になっていた。
ユーザ :「すごく行列だったけど(無音区間)」
システム:「うん」
ユーザ :「そんなに待たなくて(無音区間)」
システム:「うん」
ユーザ :「よかったよ(無音区間)」
システム:「へーよかったね」
となり、テンポのよい対話が成立する。
つぎに、本発明の第3の実施形態について説明する。なお、上述した実施形態と同一の部位には同一の符号を付し、その詳細な説明は省略する。
(1)1つの応答単位の中で矛盾した感情語が複数存在する場合は後半の節の感情語を優先する。
(2)同じ節の中で感情語が矛盾した場合は、述語の感情語を優先する。
(3)上記の(1)及び(2)を適用してもなおポジティブ/ネガティブの判定が矛盾する場合は、ニュートラルと判定する。
応答単位判定部53の詳細な構成について説明する。応答単位判定部53は、形態素情報、係り受け、ピッチに基づいて、無音区間が応答タイミングであるか否かを判定する。
第1の実施の形態では、学習器は、形態素情報、係り受け、ピッチなどの特徴量列の正解値を学習した結果、形態素情報、係り受け、ピッチなどの各モデルを生成する。つまり、学習器で使用される学習データは、特徴量列の正解値である。
12 マイク
16 処理単位判定部
26 応答単位モデルを記憶した記憶装置
28 意味処理単位モデルを記憶した記憶装置
50、50A 発話生成部
53 応答単位判定部
54、54A 応答生成部
55、55A 相槌生成部
60 非言語応答生成部
70 インタフェースロボット
Claims (3)
- 発話中のユーザーの画像情報を抽出する抽出手段と、
ユーザーから発話された音声の音響的特徴を抽出する抽出手段と、
ユーザーから発話された音声を認識する音声認識手段と、
前記音声認識手段の音声認識結果に基づいて、ユーザーから発話された音声の言語的特徴を抽出する抽出手段と、
前記画像情報、前記音響的特徴、前記音声認識手段の音声認識結果、及び前記言語的特徴と、意味処理単位であるか否かを表わすデータとに基づいて予め生成された、意味処理を行う単位を統計的にモデル化した意味処理単位モデルを記憶した意味処理単位モデル記憶手段と、
前記画像情報、前記音響的特徴、前記音声認識手段の音声認識結果、及び前記言語的特徴と、応答単位であるか否かを表わすデータとに基づいて予め生成された、対話中の一方の話者が応答を行う応答タイミングを統計的にモデル化した応答単位モデルを記憶した応答単位モデル記憶手段と、
前記抽出手段によって抽出された前記画像情報、前記抽出手段によって抽出された前記音響的特徴、前記音声認識手段の音声認識結果、前記抽出手段によって抽出された前記言語的特徴、及び前記意味処理単位モデルに基づいて、意味処理タイミングを判定し、前記抽出手段によって抽出された前記画像情報、前記抽出手段によって抽出された前記音響的特徴、前記音声認識手段の音声認識結果、前記抽出手段によって抽出された前記言語的特徴、及び前記応答単位モデルに基づいて、応答タイミングを判定する判定手段と、
前記音声認識手段の認識結果に基づいて、前記意味処理タイミングで意味処理単位の意味処理を行う処理手段と、
意味処理タイミングでかつ応答タイミングであると判定されたときに、意味処理を行なった内容を反映させて音声で応答する応答手段と、
を含む音声対話システム。 - 前記抽出手段は、前記画像情報として、視線の時系列情報を抽出する請求項1記載の音声対話システム。
- コンピュータを、
発話中のユーザーの画像情報を抽出する抽出手段、
ユーザーから発話された音声の音響的特徴を抽出する抽出手段、
ユーザーから発話された音声を認識する音声認識手段、
前記音声認識手段の音声認識結果に基づいて、ユーザーから発話された音声の言語的特徴を抽出する抽出手段、
前記画像情報、前記音響的特徴、前記音声認識手段の音声認識結果、及び前記言語的特徴と、意味処理単位であるか否かを表わすデータとに基づいて予め生成された、意味処理を行う単位を統計的にモデル化した意味処理単位モデルを記憶した意味処理単位モデル記憶手段、
前記画像情報、前記音響的特徴、前記音声認識手段の音声認識結果、及び前記言語的特徴と、応答単位であるか否かを表わすデータとに基づいて予め生成された、対話中の一方の話者が応答を行う応答タイミングを統計的にモデル化した応答単位モデルを記憶した応答単位モデル記憶手段、
前記抽出手段によって抽出された前記画像情報、前記抽出手段によって抽出された前記音響的特徴、前記音声認識手段の音声認識結果、前記抽出手段によって抽出された前記言語的特徴、及び前記意味処理単位モデルに基づいて、意味処理タイミングを判定し、前記抽出手段によって抽出された前記画像情報、前記抽出手段によって抽出された前記音響的特徴、前記音声認識手段の音声認識結果、前記抽出手段によって抽出された前記言語的特徴、及び前記応答単位モデルに基づいて、応答タイミングを判定する判定手段、
前記音声認識手段の認識結果に基づいて、前記意味処理タイミングで意味処理単位の意味処理を行う処理手段、及び
意味処理タイミングでかつ応答タイミングであると判定されたときに、意味処理を行なった内容を反映させて音声で応答する応答手段
として機能させるための音声対話プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004319327A JP4729902B2 (ja) | 2003-12-12 | 2004-11-02 | 音声対話システム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003414820 | 2003-12-12 | ||
JP2003414820 | 2003-12-12 | ||
JP2004319327A JP4729902B2 (ja) | 2003-12-12 | 2004-11-02 | 音声対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005196134A JP2005196134A (ja) | 2005-07-21 |
JP4729902B2 true JP4729902B2 (ja) | 2011-07-20 |
Family
ID=34829080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004319327A Expired - Fee Related JP4729902B2 (ja) | 2003-12-12 | 2004-11-02 | 音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4729902B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4953767B2 (ja) * | 2006-11-02 | 2012-06-13 | アルパイン株式会社 | 音声生成装置 |
JP5030150B2 (ja) * | 2007-03-20 | 2012-09-19 | 独立行政法人産業技術総合研究所 | 筋電位信号による音声認識装置 |
JP5051882B2 (ja) * | 2007-06-20 | 2012-10-17 | 学校法人早稲田大学 | 音声対話装置、音声対話方法及びロボット装置 |
JP5251132B2 (ja) * | 2008-01-09 | 2013-07-31 | 株式会社豊田中央研究所 | 応答生成装置、及び応答生成プログラム |
JP6375605B2 (ja) * | 2013-09-25 | 2018-08-22 | ヤマハ株式会社 | 音声制御装置、音声制御方法およびプログラム |
EP3007165B1 (en) | 2013-05-31 | 2018-08-01 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
JP6448950B2 (ja) * | 2014-08-20 | 2019-01-09 | シャープ株式会社 | 音声対話装置及び電子機器 |
JP6649200B2 (ja) * | 2016-08-04 | 2020-02-19 | 日本電信電話株式会社 | 発話生成装置、方法、及びプログラム |
JP6712754B2 (ja) * | 2016-08-23 | 2020-06-24 | 株式会社国際電気通信基礎技術研究所 | 談話機能推定装置及びそのためのコンピュータプログラム |
JP6461058B2 (ja) * | 2016-09-06 | 2019-01-30 | 国立大学法人京都大学 | 音声対話装置および音声対話装置を用いた自動対話方法 |
JP2018140477A (ja) * | 2017-02-28 | 2018-09-13 | シャープ株式会社 | 発話制御装置、電子機器、発話制御装置の制御方法、および制御プログラム |
JP6736225B2 (ja) * | 2017-03-28 | 2020-08-05 | 日本電信電話株式会社 | 対話装置、対話装置の制御方法およびプログラム |
JP2019053351A (ja) * | 2017-09-12 | 2019-04-04 | 大日本印刷株式会社 | 応対装置、コンピュータプログラム及び応対方法 |
CN110140167A (zh) * | 2017-11-02 | 2019-08-16 | 索尼公司 | 信息处理设备和信息处理方法 |
KR101891489B1 (ko) * | 2017-11-03 | 2018-08-24 | 주식회사 머니브레인 | 적시에 간투사 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
KR101932263B1 (ko) | 2017-11-03 | 2018-12-26 | 주식회사 머니브레인 | 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
EP3486900A1 (en) * | 2017-11-16 | 2019-05-22 | Softbank Robotics Europe | System and method for dialog session management |
WO2020036195A1 (ja) * | 2018-08-15 | 2020-02-20 | 日本電信電話株式会社 | 話し終わり判定装置、話し終わり判定方法およびプログラム |
JP7342419B2 (ja) * | 2019-05-20 | 2023-09-12 | カシオ計算機株式会社 | ロボットの制御装置、ロボット、ロボットの制御方法及びプログラム |
JP2021117371A (ja) * | 2020-01-27 | 2021-08-10 | ソニーグループ株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
WO2021246056A1 (ja) * | 2020-06-05 | 2021-12-09 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法、並びにコンピュータプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61123324A (ja) * | 1984-11-20 | 1986-06-11 | Matsushita Electric Ind Co Ltd | 反響信号除去装置 |
JPH07219961A (ja) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | 音声対話システム |
JPH09269889A (ja) * | 1996-04-02 | 1997-10-14 | Sharp Corp | 対話装置 |
JPH1069292A (ja) * | 1996-08-29 | 1998-03-10 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 発話関係認識装置 |
JP2000214882A (ja) * | 1999-01-22 | 2000-08-04 | Matsushita Electric Ind Co Ltd | 子供や外国人話者の対処に苦慮する音声に対し、迅速に照合できる音声認識および音声学習装置 |
JP2001296879A (ja) * | 2000-04-12 | 2001-10-26 | Sharp Corp | 感情喚起処理装置 |
JP2001306199A (ja) * | 2000-04-17 | 2001-11-02 | Sharp Corp | ネットワーク機器制御装置 |
JP2002182685A (ja) * | 2000-12-12 | 2002-06-26 | Sony Corp | 認識装置および認識方法、学習装置および学習方法、並びに記録媒体 |
JP2003202895A (ja) * | 2002-01-10 | 2003-07-18 | Sony Corp | 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム |
-
2004
- 2004-11-02 JP JP2004319327A patent/JP4729902B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61123324A (ja) * | 1984-11-20 | 1986-06-11 | Matsushita Electric Ind Co Ltd | 反響信号除去装置 |
JPH07219961A (ja) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | 音声対話システム |
JPH09269889A (ja) * | 1996-04-02 | 1997-10-14 | Sharp Corp | 対話装置 |
JPH1069292A (ja) * | 1996-08-29 | 1998-03-10 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 発話関係認識装置 |
JP2000214882A (ja) * | 1999-01-22 | 2000-08-04 | Matsushita Electric Ind Co Ltd | 子供や外国人話者の対処に苦慮する音声に対し、迅速に照合できる音声認識および音声学習装置 |
JP2001296879A (ja) * | 2000-04-12 | 2001-10-26 | Sharp Corp | 感情喚起処理装置 |
JP2001306199A (ja) * | 2000-04-17 | 2001-11-02 | Sharp Corp | ネットワーク機器制御装置 |
JP2002182685A (ja) * | 2000-12-12 | 2002-06-26 | Sony Corp | 認識装置および認識方法、学習装置および学習方法、並びに記録媒体 |
JP2003202895A (ja) * | 2002-01-10 | 2003-07-18 | Sony Corp | 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2005196134A (ja) | 2005-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4729902B2 (ja) | 音声対話システム | |
US7280968B2 (en) | Synthetically generated speech responses including prosodic characteristics of speech inputs | |
JP5327054B2 (ja) | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム | |
KR101203188B1 (ko) | 개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체 | |
US7949530B2 (en) | Conversation controller | |
US7949531B2 (en) | Conversation controller | |
US11538478B2 (en) | Multiple virtual assistants | |
JP3454897B2 (ja) | 音声対話システム | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP3581881B2 (ja) | 音声補完方法、装置および記録媒体 | |
JP2001215993A (ja) | 対話処理装置および対話処理方法、並びに記録媒体 | |
WO2002086864A1 (en) | System and method for adaptive language understanding by computers | |
JP2013205842A (ja) | プロミネンスを使用した音声対話システム | |
JP7036015B2 (ja) | 対話制御装置および方法 | |
JP2011504624A (ja) | 自動同時通訳システム | |
Fellbaum et al. | Principles of electronic speech processing with applications for people with disabilities | |
Basak et al. | Challenges and Limitations in Speech Recognition Technology: A Critical Review of Speech Signal Processing Algorithms, Tools and Systems. | |
JP2001188779A (ja) | 情報処理装置および方法、並びに記録媒体 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
JP2010197644A (ja) | 音声認識システム | |
JP6712754B2 (ja) | 談話機能推定装置及びそのためのコンピュータプログラム | |
Venkatagiri | Speech recognition technology applications in communication disorders | |
US11670285B1 (en) | Speech processing techniques | |
Schuller et al. | Speech communication and multimodal interfaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110404 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |