JP2010197858A - 音声対話システム - Google Patents
音声対話システム Download PDFInfo
- Publication number
- JP2010197858A JP2010197858A JP2009044460A JP2009044460A JP2010197858A JP 2010197858 A JP2010197858 A JP 2010197858A JP 2009044460 A JP2009044460 A JP 2009044460A JP 2009044460 A JP2009044460 A JP 2009044460A JP 2010197858 A JP2010197858 A JP 2010197858A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- dialogue
- sentence
- dictionary
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声対話システムの対話コンピュータ2は、音声情報9を音声情報取得手段10と、共通聞返辞書12b及び個別聞返辞書12cを有する対話語彙辞書12aを記憶する辞書記憶手段13と、対話語彙辞書12aに基づいて対話文3を生成する対話文生成手段15と、対話文3を音声出力する対話文出力手段16と、話者が発する聞返音声を検出し、聞返情報15として取得する聞返情報取得手段18と、共通聞返辞書12b及び個別聞返辞書12cに基づいて、応答する応答文22を生成する応答文生成手段23と、応答文22を音声出力する応答文出力手段24とを具備する。
【選択図】図2
Description
2 対話コンピュータ
3 対話文
4 音声入力機器
7 音声出力機器
9 音声情報
10 音声情報取得手段
11 音声認識辞書
12 対話辞書
12a 対話語彙辞書
12b 共通聞返辞書
12c 個別聞返辞書
13 辞書記憶手段
14 音声認識手段
15 対話文生成手段
16 対話文出力手段
17 聞返情報
18 聞返情報取得手段
21 聞返音声認識手段
22 応答文
23 応答文生成手段
24 応答文出力手段
25 共通応答生成手段
26 個別応答生成手段
S 話者
V 音声
V’ 聞返音声
Claims (4)
- 話者の音声を検出し、音声情報として取得する音声情報取得手段と、
前記音声情報に基づいて前記音声の内容を認識するための音声認識辞書、及び認識された前記音声に対応し、前記話者と対話するための語彙を含んで予め構築された対話辞書を記憶する辞書記憶手段と、
取得した前記音声情報及び前記音声認識辞書に基づいて前記音声の内容を認識する音声認識手段と、
認識された前記音声に対し、前記話者と対話するための対話文を前記対話辞書を利用して生成する対話文生成手段と、
生成された前記対話文を前記話者に対して出力する対話文出力手段と、
出力された前記対話文を認識した前記話者が発する音声による聞返し、前記対話文の内容に関する確認、及び前記対話文に関する要求を含む聞返音声を検出し、聞返情報として取得する聞返情報取得手段と、
前記聞返情報に基づいて前記聞返音声の内容を認識するための聞返音声認識辞書を記憶する聞返辞書記憶手段と、
取得した前記聞返情報及び前記聞返音声認識辞書に基づいて前記聞返音声の内容を認識する聞返音声認識手段と、
認識された前記聞返音声に対する応答文を前記対話辞書を利用して生成する応答文生成手段と、
生成された前記応答文を前記話者に対して出力する応答文出力手段と
を具備することを特徴とする聞返対話システム。 - 前記対話辞書は、
前記話者との全ての対話において共通的に想定され、前記対話文の再出力要求、前記対話文の出力音量の調整、前記対話文の出力速度の調整を含む音声を前記聞返音声として認識可能な複数の語彙が予め記憶された共通聞返辞書を含んで構築され、
前記応答文作成手段は、
前記共通聞返辞書を利用し、前記対話文の再出力、前記対話文の出力音量の増減、前記対話文の出力速度の加減を含んだ前記応答文を生成する共通応答生成手段をさらに具備することを特徴とする請求項1に記載の聞返対話システム。 - 前記対話辞書は、
前記話者とのそれぞれ個別の対話において想定され、前記対話文を全く同一に繰り返すオウム返し音声、前記対話文を同意の語彙に置換し、前記対話文の内容の確認を行う置換確認音声、及び前記対話文に関連する単語を含み、前記対話文の内容の確認を行う関連単語音声を前記聞返音声として認識可能な複数の語彙が予め記憶された個別聞返辞書を含んで構築され、
前記応答文生成手段は、
前記個別聞返辞書を利用し、前記オウム返し音声に対する応答、前記置換確認音声に対する認否、及び前記関連単語音声に対する認否を含む前記応答分を生成する個別応答生成手段をさらに具備することを特徴とする請求項1に記載の聞返対話システム。 - 前記対話文出力手段及び前記応答文出力手段は、
前記対話文及び前記応答文の少なくとも一方が音声によって出力されることを特徴とする請求項1乃至請求項3のいずれか一つに記載の聞返対話システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009044460A JP2010197858A (ja) | 2009-02-26 | 2009-02-26 | 音声対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009044460A JP2010197858A (ja) | 2009-02-26 | 2009-02-26 | 音声対話システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010197858A true JP2010197858A (ja) | 2010-09-09 |
Family
ID=42822616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009044460A Pending JP2010197858A (ja) | 2009-02-26 | 2009-02-26 | 音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010197858A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016042815A1 (en) * | 2014-09-18 | 2016-03-24 | Kabushiki Kaisha Toshiba | Speech interaction apparatus and method |
JP2019505011A (ja) * | 2015-12-07 | 2019-02-21 | エスアールアイ インターナショナルSRI International | 統合化された物体認識および顔表情認識を伴うvpa |
WO2020121638A1 (ja) * | 2018-12-13 | 2020-06-18 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
US11270691B2 (en) | 2018-05-31 | 2022-03-08 | Toyota Jidosha Kabushiki Kaisha | Voice interaction system, its processing method, and program therefor |
JP7032681B1 (ja) | 2020-12-10 | 2022-03-09 | 富士通クライアントコンピューティング株式会社 | 情報処理装置及びプログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPH07219961A (ja) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | 音声対話システム |
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
US5694558A (en) * | 1994-04-22 | 1997-12-02 | U S West Technologies, Inc. | Method and system for interactive object-oriented dialogue management |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
JPH10326176A (ja) * | 1997-05-23 | 1998-12-08 | Oki Hokuriku Syst Kaihatsu:Kk | 音声対話制御方法 |
US5999904A (en) * | 1997-07-02 | 1999-12-07 | Lucent Technologies Inc. | Tracking initiative in collaborative dialogue interactions |
JP2001188787A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
JP2003330487A (ja) * | 2002-05-09 | 2003-11-19 | Nec Corp | 対話エージェント |
JP2007188510A (ja) * | 2007-01-24 | 2007-07-26 | P To Pa:Kk | 会話制御システム、会話制御方法、プログラム及びプログラムを記録した記録媒体 |
-
2009
- 2009-02-26 JP JP2009044460A patent/JP2010197858A/ja active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPH07219961A (ja) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | 音声対話システム |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5694558A (en) * | 1994-04-22 | 1997-12-02 | U S West Technologies, Inc. | Method and system for interactive object-oriented dialogue management |
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
JPH10326176A (ja) * | 1997-05-23 | 1998-12-08 | Oki Hokuriku Syst Kaihatsu:Kk | 音声対話制御方法 |
US5999904A (en) * | 1997-07-02 | 1999-12-07 | Lucent Technologies Inc. | Tracking initiative in collaborative dialogue interactions |
JP2001188787A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
JP2003330487A (ja) * | 2002-05-09 | 2003-11-19 | Nec Corp | 対話エージェント |
JP2007188510A (ja) * | 2007-01-24 | 2007-07-26 | P To Pa:Kk | 会話制御システム、会話制御方法、プログラム及びプログラムを記録した記録媒体 |
Non-Patent Citations (1)
Title |
---|
家守正人他: ""自然言語対話処理のための聞き返し発話生成手法"", 言語処理学会第8回年次大会発表論文集, JPN6013030934, March 2002 (2002-03-01), pages 264 - 266, ISSN: 0002565758 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016042815A1 (en) * | 2014-09-18 | 2016-03-24 | Kabushiki Kaisha Toshiba | Speech interaction apparatus and method |
JP2019505011A (ja) * | 2015-12-07 | 2019-02-21 | エスアールアイ インターナショナルSRI International | 統合化された物体認識および顔表情認識を伴うvpa |
JP7022062B2 (ja) | 2015-12-07 | 2022-02-17 | エスアールアイ インターナショナル | 統合化された物体認識および顔表情認識を伴うvpa |
US11270691B2 (en) | 2018-05-31 | 2022-03-08 | Toyota Jidosha Kabushiki Kaisha | Voice interaction system, its processing method, and program therefor |
WO2020121638A1 (ja) * | 2018-12-13 | 2020-06-18 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
US12002460B2 (en) | 2018-12-13 | 2024-06-04 | Sony Group Corporation | Information processing device, information processing system, and information processing method, and program |
JP7032681B1 (ja) | 2020-12-10 | 2022-03-09 | 富士通クライアントコンピューティング株式会社 | 情報処理装置及びプログラム |
JP2022092529A (ja) * | 2020-12-10 | 2022-06-22 | 富士通クライアントコンピューティング株式会社 | 情報処理装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210104238A1 (en) | Voice enablement and disablement of speech processing functionality | |
US11145222B2 (en) | Language learning system, language learning support server, and computer program product | |
US6996528B2 (en) | Method for efficient, safe and reliable data entry by voice under adverse conditions | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
Alonso-Martín et al. | Integration of a voice recognition system in a social robot | |
KR20210114518A (ko) | 종단간 음성 변환 | |
KR20220124295A (ko) | 제작자 제공 콘텐츠 기반 인터랙티브 대화 애플리케이션 테일링 | |
JP7557085B2 (ja) | 対話中のテキスト-音声の瞬時学習 | |
JP2005331882A (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
WO2019031268A1 (ja) | 情報処理装置、及び情報処理方法 | |
WO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
US20150254238A1 (en) | System and Methods for Maintaining Speech-To-Speech Translation in the Field | |
JP2010197858A (ja) | 音声対話システム | |
CN111902831B (zh) | 演示支援系统 | |
KR20230020508A (ko) | 텍스트 에코 제거 | |
Sirikongtham et al. | Improving speech recognition using dynamic multi-pipeline API | |
JP5818753B2 (ja) | 音声対話システム及び音声対話方法 | |
Ward et al. | Hands-free documentation | |
JP2010197859A (ja) | 発話差音声認識システム | |
Garg et al. | Automation and presentation of word document using speech recognition | |
JP2004021028A (ja) | 音声対話装置及び音声対話プログラム | |
US12125477B2 (en) | Hot-word free pre-emption of automated assistant response presentation | |
US20230395066A1 (en) | Hot-word free pre-emption of automated assistant response presentation | |
JP7274376B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
US20240220738A1 (en) | Increasing Comprehension Through Playback of Translated Speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130822 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131029 |