JP2012073364A - 音声対話装置、方法、プログラム - Google Patents
音声対話装置、方法、プログラム Download PDFInfo
- Publication number
- JP2012073364A JP2012073364A JP2010217487A JP2010217487A JP2012073364A JP 2012073364 A JP2012073364 A JP 2012073364A JP 2010217487 A JP2010217487 A JP 2010217487A JP 2010217487 A JP2010217487 A JP 2010217487A JP 2012073364 A JP2012073364 A JP 2012073364A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- barge
- utterance
- output
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】検出部は、ユーザの音声を検出する検出する。認識部は、音声を認識する。出力部は、音声の認識結果に対応した応答音声を出力する。制御部は、応答音声の出力中に、ユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、応答音声の出力中にユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、バージイン発声を採用するか否かを判定することを特徴とする。
【選択図】図1
Description
第1の実施の形態に係る音声対話装置1は、ユーザとの音声対話により、ハンズフリーダイヤル装置や、カーナビゲーション装置等のシステム100を制御するものである。音声対話装置1は、バージイン機能を有する。本実施形態では、ハンズフリーダイヤル装置を例として説明する。
図2のフローチャートでは、応答出力や音声認識の開始の前に応答出力中のバージイン確率変動を推定していた。しかし、そのバージイン確率変動を利用するのは音声認識結果が得られた後(S106)であるため、音声認識結果が得られた後や、音声認識の起動中に、出力し始めた応答音声からバージイン確率変動を推定しても、制御部13は、バージイン確率変動からバージイン発声の採用のしやすさを調整することは可能である。
スピーカ62からの応答音声の出力がマイク入力に回り込み、ユーザの入力発声と混入してしまう場合は、応答音声を用いて、入力信号からスピーカ62からの応答音声を除去するエコーキャンセル機能を用いてもよい。
本実施形態では、バージイン確率変動からバージイン発声を受け付けるか判定する方法として、バージイン確率変動から音声認識結果の採用のしやすさを調整しており、信頼度スコアや関連度の閾値を上下させることで実現できるとしていが、これに限られない。
図8は、第2の実施形態に係る音声対話装置2を示すブロック図である。この第2の実施形態に係わるバージイン機能付き音声対話装置2は、音声対話装置1における推定部15が、推定部25に置き換わったものである。
図11は、第3の実施形態に係る音声対話装置3の構成を表すブロック図である。音声対話装置3は、音声対話装置2における推定部25が、推定部35に置き換わったものである。
図14は、第4の実施形態に係る音声対話装置4を表すブロック図である。本実施の形態において、検出部11は、推定部15から供給されるバージイン確率変動から、音声の始端の検出のしやすさを調整する点が、第1の実施の形態と異なる。
音声対話装置4では、バージイン確率変動からバージイン発声を受け付けるか判定する方法として、バージイン発声の起こりやすさの変動の情報から音声始端の検出のしやすさを調整しており、音声を検出する装置のパラメータを調整することで実現できるとしていた。
11 検出部
12 認識部
13 制御部
14 出力部
15、25、35 推定部
16 エコーキャンセル部
51 音声格納部
61マイク
62スピーカ
100 システム
Claims (7)
- ユーザの音声を検出する検出部と、
検出した前記音声を認識する認識部と、
前記音声の認識結果に対応した応答音声を出力する出力部と
前記応答音声の出力中に前記ユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、前記バージイン発声を採用するか否かを判定する制御部とを備える
音声対話装置。 - 前記制御部は、前記バージイン確率変動における確率が高い程、前記バージイン発声の前記音声認識結果を採用する基準を下げる
請求項1記載の音声対話装置。 - 前記バージイン確率変動を推定する推定部をさらに備え、
前記制御部は、
推定された前記バージイン確率変動に基づいて、前記応答音声の出力中に前記認識部が認識したバージイン発声を採用するか否かを判定する
請求項1記載の音声対話装置。 - 前記バージイン発声を採用する場合、
前記制御部は、
前記バージイン発声に応じた応答音声を出力するよう、前記出力部を制御する
請求項1記載の音声対話装置。 - 前記制御部は、前記バージイン確率変動に基づいて、前記検出部の前記音声の検出の精度を変更する、
請求項2記載の音声対話装置。 - ユーザの音声を検出し、
検出した前記音声を認識し、
前記音声の認識結果に対応した応答音声を出力し、
前記応答音声の出力中に前記ユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、前記バージイン発声を採用するか否かを判定する
音声対話方法。 - コンピュータを、
ユーザの音声を検出する手段と、
検出した前記音声を認識する手段と、
前記音声の認識結果に対応した応答音声を出力する手段と、
前記ユーザからのバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、前記応答音声の出力中に前記認識部が認識したバージイン発声を採用するか否かを判定する手段として機能させる音声対話プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217487A JP5431282B2 (ja) | 2010-09-28 | 2010-09-28 | 音声対話装置、方法、プログラム |
US13/051,144 US20120078622A1 (en) | 2010-09-28 | 2011-03-18 | Spoken dialogue apparatus, spoken dialogue method and computer program product for spoken dialogue |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217487A JP5431282B2 (ja) | 2010-09-28 | 2010-09-28 | 音声対話装置、方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073364A true JP2012073364A (ja) | 2012-04-12 |
JP5431282B2 JP5431282B2 (ja) | 2014-03-05 |
Family
ID=45871521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217487A Active JP5431282B2 (ja) | 2010-09-28 | 2010-09-28 | 音声対話装置、方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120078622A1 (ja) |
JP (1) | JP5431282B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016061888A (ja) * | 2014-09-17 | 2016-04-25 | 株式会社デンソー | 音声認識装置、音声認識対象区間設定方法、及び音声認識区間設定プログラム |
JP2018124484A (ja) * | 2017-02-02 | 2018-08-09 | トヨタ自動車株式会社 | 音声認識装置 |
JP2019132997A (ja) * | 2018-01-31 | 2019-08-08 | 日本電信電話株式会社 | 音声処理装置、方法およびプログラム |
WO2020195022A1 (ja) * | 2019-03-26 | 2020-10-01 | 株式会社Nttドコモ | 音声対話システム、モデル生成装置、バージイン発話判定モデル及び音声対話プログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014191212A (ja) * | 2013-03-27 | 2014-10-06 | Seiko Epson Corp | 音声処理装置、集積回路装置、音声処理システム及び音声処理装置の制御方法 |
US20200058319A1 (en) * | 2017-05-11 | 2020-02-20 | Sharp Kabushiki Kaisha | Information processing device, electronic apparatus, control method, and storage medium |
JP6969491B2 (ja) * | 2018-05-11 | 2021-11-24 | トヨタ自動車株式会社 | 音声対話システム、音声対話方法及びプログラム |
US11151986B1 (en) * | 2018-09-21 | 2021-10-19 | Amazon Technologies, Inc. | Learning how to rewrite user-specific input for natural language understanding |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH086590A (ja) * | 1994-06-16 | 1996-01-12 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声対話のための音声認識方法及び装置 |
JPH10240284A (ja) * | 1997-02-27 | 1998-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出方法及び装置 |
JPH11298382A (ja) * | 1998-04-10 | 1999-10-29 | Kobe Steel Ltd | ハンズフリー装置 |
JP2001331196A (ja) * | 2000-05-22 | 2001-11-30 | Nec Corp | 音声応答装置 |
JP2006201749A (ja) * | 2004-12-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声による選択装置、及び選択方法 |
JP2006215418A (ja) * | 2005-02-07 | 2006-08-17 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2006337942A (ja) * | 2005-06-06 | 2006-12-14 | Nissan Motor Co Ltd | 音声対話装置及び割り込み発話制御方法 |
WO2009047871A1 (ja) * | 2007-10-12 | 2009-04-16 | Fujitsu Limited | エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US6246986B1 (en) * | 1998-12-31 | 2001-06-12 | At&T Corp. | User barge-in enablement in large vocabulary speech recognition systems |
GB0113583D0 (en) * | 2001-06-04 | 2001-07-25 | Hewlett Packard Co | Speech system barge-in control |
US7069213B2 (en) * | 2001-11-09 | 2006-06-27 | Netbytel, Inc. | Influencing a voice recognition matching operation with user barge-in time |
DE10158583A1 (de) * | 2001-11-29 | 2003-06-12 | Philips Intellectual Property | Verfahren zum Betrieb eines Barge-In-Dialogsystems |
US7019749B2 (en) * | 2001-12-28 | 2006-03-28 | Microsoft Corporation | Conversational interface agent |
US7246062B2 (en) * | 2002-04-08 | 2007-07-17 | Sbc Technology Resources, Inc. | Method and system for voice recognition menu navigation with error prevention and recovery |
EP1378886A1 (en) * | 2002-07-02 | 2004-01-07 | Ubicall Communications en abrégé "UbiCall" S.A. | Speech recognition device |
JP3984526B2 (ja) * | 2002-10-21 | 2007-10-03 | 富士通株式会社 | 音声対話システム及び方法 |
CN1842787B (zh) * | 2004-10-08 | 2011-12-07 | 松下电器产业株式会社 | 对话支援装置 |
US7809569B2 (en) * | 2004-12-22 | 2010-10-05 | Enterprise Integration Group, Inc. | Turn-taking confidence |
JP4197344B2 (ja) * | 2006-02-20 | 2008-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声対話システム |
DE602006002132D1 (de) * | 2006-12-14 | 2008-09-18 | Harman Becker Automotive Sys | beitung |
US8001469B2 (en) * | 2007-11-07 | 2011-08-16 | Robert Bosch Gmbh | Automatic generation of interactive systems from a formalized description language |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
US8166297B2 (en) * | 2008-07-02 | 2012-04-24 | Veritrix, Inc. | Systems and methods for controlling access to encrypted data stored on a mobile device |
-
2010
- 2010-09-28 JP JP2010217487A patent/JP5431282B2/ja active Active
-
2011
- 2011-03-18 US US13/051,144 patent/US20120078622A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH086590A (ja) * | 1994-06-16 | 1996-01-12 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声対話のための音声認識方法及び装置 |
JPH10240284A (ja) * | 1997-02-27 | 1998-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出方法及び装置 |
JPH11298382A (ja) * | 1998-04-10 | 1999-10-29 | Kobe Steel Ltd | ハンズフリー装置 |
JP2001331196A (ja) * | 2000-05-22 | 2001-11-30 | Nec Corp | 音声応答装置 |
JP2006201749A (ja) * | 2004-12-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声による選択装置、及び選択方法 |
JP2006215418A (ja) * | 2005-02-07 | 2006-08-17 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2006337942A (ja) * | 2005-06-06 | 2006-12-14 | Nissan Motor Co Ltd | 音声対話装置及び割り込み発話制御方法 |
WO2009047871A1 (ja) * | 2007-10-12 | 2009-04-16 | Fujitsu Limited | エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016061888A (ja) * | 2014-09-17 | 2016-04-25 | 株式会社デンソー | 音声認識装置、音声認識対象区間設定方法、及び音声認識区間設定プログラム |
JP2018124484A (ja) * | 2017-02-02 | 2018-08-09 | トヨタ自動車株式会社 | 音声認識装置 |
JP2019132997A (ja) * | 2018-01-31 | 2019-08-08 | 日本電信電話株式会社 | 音声処理装置、方法およびプログラム |
WO2020195022A1 (ja) * | 2019-03-26 | 2020-10-01 | 株式会社Nttドコモ | 音声対話システム、モデル生成装置、バージイン発話判定モデル及び音声対話プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20120078622A1 (en) | 2012-03-29 |
JP5431282B2 (ja) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5431282B2 (ja) | 音声対話装置、方法、プログラム | |
US11776540B2 (en) | Voice control of remote device | |
US11295748B2 (en) | Speaker identification with ultra-short speech segments for far and near field voice assistance applications | |
US10074371B1 (en) | Voice control of remote device by disabling wakeword detection | |
US10593328B1 (en) | Voice control of remote device | |
US9354687B2 (en) | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events | |
JP5381988B2 (ja) | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム | |
US7949523B2 (en) | Apparatus, method, and computer program product for processing voice in speech | |
US8428944B2 (en) | System and method for performing compensated speech recognition | |
US9335966B2 (en) | Methods and apparatus for unsupervised wakeup | |
US9940926B2 (en) | Rapid speech recognition adaptation using acoustic input | |
EP1678706A1 (en) | System and method enabling acoustic barge-in | |
WO2010084881A1 (ja) | 音声対話装置、対話制御方法及び対話制御プログラム | |
JP2018049132A (ja) | 音声対話システムおよび音声対話方法 | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP2004333543A (ja) | 音声対話システム及び音声対話方法 | |
JP2018132624A (ja) | 音声対話装置 | |
JP4491438B2 (ja) | 音声対話装置、音声対話方法、およびプログラム | |
KR102197387B1 (ko) | 자연어 대화체 음성 인식 방법 및 장치 | |
JP2018021953A (ja) | 音声対話装置および音声対話方法 | |
JP2018155980A (ja) | 対話装置および対話方法 | |
JP2009025579A (ja) | 音声認識装置および音声認識方法 | |
JP2019191477A (ja) | 音声認識装置及び音声認識方法 | |
JP2019002997A (ja) | 音声認識装置および音声認識方法 | |
JP2017201348A (ja) | 音声対話装置、音声対話装置の制御方法、および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121030 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130819 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5431282 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |