JP5271330B2 - 音声対話システム、方法、及びプログラム - Google Patents
音声対話システム、方法、及びプログラム Download PDFInfo
- Publication number
- JP5271330B2 JP5271330B2 JP2010219986A JP2010219986A JP5271330B2 JP 5271330 B2 JP5271330 B2 JP 5271330B2 JP 2010219986 A JP2010219986 A JP 2010219986A JP 2010219986 A JP2010219986 A JP 2010219986A JP 5271330 B2 JP5271330 B2 JP 5271330B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- audio
- sound
- saving signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 16
- 230000003993 interaction Effects 0.000 claims description 32
- 238000001514 detection method Methods 0.000 claims description 28
- 230000005236 sound signal Effects 0.000 claims description 24
- 238000005259 measurement Methods 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Description
第1の実施の形態に係る音声対話システム1は、例えば、カーナビゲーションシステム等に用いられる。
第2の実施の形態に係る音声対話システム2は、ユーザとの対話の進捗の状態を表す「対話状態」に応じて、省音声信号に対する動作を決定できる点が、第1の実施の形態と異なる。
11 検出部
12 計測部
13 取得部
14 回数判定部
15 生成部
16 出力部
17 キャンセル判定部
18 実行部
51 履歴記憶部
52 音声記憶部
Claims (8)
- ユーザとの音声対話により、動作を実行する音声対話システムであって、
現在までに実行された前記動作の動作名と、その実行回数とを対応付けた動作履歴を記憶する履歴記憶部と、
各々の前記動作名に対応する音声データを記憶する音声記憶部と、
ユーザからの音声入力を省略することを示す省音声信号を検出する検出部と、
前記検出部が前記省音声信号を検出した場合、前記履歴記憶部から、最も実行回数の多い動作名を取得する取得部と、
取得された前記動作名に対応する音声データを前記音声記憶部から読み出し、音声信号を生成する生成部と、
前記音声信号を音声に変換して出力する出力部と、
前記音声の出力が終了するまでに前記省音声信号がキャンセルされたか否かを判定するキャンセル判定部と、
前記省音声信号がキャンセルされていない場合に、前記動作名に対応する動作を実行する実行部と
を備える音声対話システム。 - 前記キャンセル判定部は、
前記音声の出力が終了するまでに前記省音声信号がキャンセルされたか否かを、前記検出部が前記省音声信号の検出を継続しているか否かで判定する、
請求項1記載の音声対話システム。 - 前記検出部が前記省音声信号の検出を開始した時刻から、前記省音声信号の継続時間を計測する計測部をさらに備え、
前記キャンセル判定部は、
前記音声の出力が終了した時点において、前記省音声信号が継続されているか否かを前記継続時間に基づいて判定する、
請求項2記載の音声対話システム。 - 前記取得部は、
前記検出部が前記省音声信号を検出した場合、前記履歴記憶部から、各動作の実行回数を取得し、それらを合計した値である総実行回数を求め、
前記総実行回数が所定の閾値以下であるか否かを判定する回数判定部をさらに備え、
前記実行部は、
前記回数判定部における判定が真の場合に、前記動作名に対応する動作を実行する、
請求項3記載の音声対話システム。 - 省音声信号を発生させるボタンをさらに有し、
前記ボタンは、
押下された状態では省音声信号を発生し、押下されない状態では省音声信号を発生しない、
請求項1〜4記載の音声対話システム。 - 前記音声記憶部は、
前記音声データを前記対話状態に対応させて記憶し、
前記管理部は、
前記検出部が、前記省音声信号の検出を終了した時刻に前記出力部が出力している音声の前記音声データに対応する状態に、前記対話状態を遷移させる
請求項5記載の音声対話システム。 - ユーザとの音声対話により、動作を実行する音声対話方法であって、
履歴記憶部が、現在までに実行された前記動作の動作名と、その実行回数とを対応付けた動作履歴を記憶し、
音声記憶部が、各々の前記動作名に対応する音声データを記憶し、
検出部が、ユーザからの音声入力を省略することを示す省音声信号を検出し、
取得部が、前記検出部が前記省音声信号を検出した場合、前記履歴記憶部から、最も実行回数の多い動作名を取得し、
生成部が、取得された前記動作名に対応する音声データを前記音声記憶部から読み出し、音声信号を生成し、
出力部が、前記音声信号を音声に変換して出力し、
キャンセル判定部が、前記音声の出力が終了するまでに前記省音声信号がキャンセルされたか否かを判定し、
実行部が、前記省音声信号がキャンセルされていない場合に、前記動作名に対応する動作を実行する
音声対話方法。 - コンピュータを、
現在までに実行された前記動作の動作名と、その実行回数とを対応付けた動作履歴を記憶する手段と、
各々の前記動作名に対応する音声データを記憶する手段と、
ユーザからの音声入力を省略することを示す省音声信号を検出する手段と、
前記省音声信号を検出した場合、前記動作履歴を記憶する手段から、最も実行回数の多い動作名を取得する手段と、
取得された前記動作名に対応する音声データを、前記音声データを記憶する手段から読み出し、音声信号を生成する手段と、
前記音声信号を音声に変換して出力する手段と、
前記音声の出力が終了するまでに前記省音声信号がキャンセルされたか否かを判定する
手段と、
前記省音声信号がキャンセルされていない場合に、前記動作名に対応する動作を実行する手段と
して機能させるための音声対話プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010219986A JP5271330B2 (ja) | 2010-09-29 | 2010-09-29 | 音声対話システム、方法、及びプログラム |
US13/048,193 US8719036B2 (en) | 2010-09-29 | 2011-03-15 | Voice dialogue system, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010219986A JP5271330B2 (ja) | 2010-09-29 | 2010-09-29 | 音声対話システム、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073536A JP2012073536A (ja) | 2012-04-12 |
JP5271330B2 true JP5271330B2 (ja) | 2013-08-21 |
Family
ID=45871530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010219986A Active JP5271330B2 (ja) | 2010-09-29 | 2010-09-29 | 音声対話システム、方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8719036B2 (ja) |
JP (1) | JP5271330B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140054643A (ko) * | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
KR101406181B1 (ko) | 2013-04-30 | 2014-06-13 | 현대엠엔소프트 주식회사 | 음성인식 네비게이션 장치의 음성안내 및 응답방법 |
US20180239442A1 (en) * | 2015-03-17 | 2018-08-23 | Sony Corporation | Information processing apparatus, information processing method, and program |
TWI614676B (zh) * | 2016-08-26 | 2018-02-11 | Walton Advanced Eng Inc | 數位語音導引裝置及其方法 |
KR102695306B1 (ko) * | 2018-06-27 | 2024-08-16 | 현대자동차주식회사 | 대화 시스템, 그를 가지는 차량 및 차량의 제어 방법 |
US20190385711A1 (en) | 2018-06-19 | 2019-12-19 | Ellipsis Health, Inc. | Systems and methods for mental health assessment |
JP2021529382A (ja) | 2018-06-19 | 2021-10-28 | エリプシス・ヘルス・インコーポレイテッド | 精神的健康評価のためのシステム及び方法 |
US11691076B2 (en) | 2020-08-10 | 2023-07-04 | Jocelyn Tan | Communication with in-game characters |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0460237A (ja) | 1990-06-29 | 1992-02-26 | Sumitomo Heavy Ind Ltd | 撓み噛合い式歯車噛合構造 |
US5470233A (en) * | 1994-03-17 | 1995-11-28 | Arkenstone, Inc. | System and method for tracking a pedestrian |
JP3919210B2 (ja) * | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
JP4137399B2 (ja) * | 2001-03-30 | 2008-08-20 | アルパイン株式会社 | 音声検索装置 |
JP3724461B2 (ja) * | 2002-07-25 | 2005-12-07 | 株式会社デンソー | 音声制御装置 |
JP2004333543A (ja) | 2003-04-30 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 音声対話システム及び音声対話方法 |
JP4060237B2 (ja) | 2003-05-30 | 2008-03-12 | 日本電信電話株式会社 | 音声対話システム、音声対話方法及び音声対話プログラム |
JP2004354942A (ja) * | 2003-05-30 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 音声対話システム、音声対話方法及び音声対話プログラム |
JP2007052397A (ja) * | 2005-07-21 | 2007-03-01 | Denso Corp | 操作装置 |
US8219407B1 (en) * | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
JP2009300696A (ja) * | 2008-06-12 | 2009-12-24 | Toyota Motor Corp | 音声認識装置 |
JP2010078851A (ja) * | 2008-09-25 | 2010-04-08 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
US10540976B2 (en) * | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US8294683B2 (en) * | 2009-09-25 | 2012-10-23 | Mitac International Corp. | Method of processing touch commands and voice commands in parallel in an electronic device supporting speech recognition |
-
2010
- 2010-09-29 JP JP2010219986A patent/JP5271330B2/ja active Active
-
2011
- 2011-03-15 US US13/048,193 patent/US8719036B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012073536A (ja) | 2012-04-12 |
US8719036B2 (en) | 2014-05-06 |
US20120078634A1 (en) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5271330B2 (ja) | 音声対話システム、方法、及びプログラム | |
KR101801308B1 (ko) | 음성 입력의 워드-레벨 수정 | |
KR102115541B1 (ko) | 외부 데이터 소스들을 사용한 스피치 재-인식 | |
KR102196400B1 (ko) | 핫워드 적합성을 결정하는 방법 및 장치 | |
WO2015151157A1 (ja) | 意図理解装置および方法 | |
US10850745B2 (en) | Apparatus and method for recommending function of vehicle | |
US20180090132A1 (en) | Voice dialogue system and voice dialogue method | |
JP6812843B2 (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
WO2010084881A1 (ja) | 音声対話装置、対話制御方法及び対話制御プログラム | |
JP2018081185A (ja) | 音声認識装置、音声認識システム | |
JP2010020102A (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
JP2014202848A (ja) | テキスト生成装置、方法、及びプログラム | |
JP6576968B2 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
JP4967519B2 (ja) | 音声認識装置 | |
JP2019197182A (ja) | 音声対話システム、音声対話方法及びプログラム | |
KR101562222B1 (ko) | 발음의 정확도 평가 장치 및 그 방법 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JP2019045831A (ja) | 音声処理装置、方法およびプログラム | |
JP2015038526A (ja) | 音声処理装置、及び音声処理方法 | |
JP6391925B2 (ja) | 音声対話装置、方法およびプログラム | |
CN112863496B (zh) | 一种语音端点检测方法以及装置 | |
JP6499228B2 (ja) | テキスト生成装置、方法、及びプログラム | |
JP2018132623A (ja) | 音声対話装置 | |
JP2005283646A (ja) | 音声認識率推定装置 | |
JP2009020352A (ja) | 音声処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130510 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5271330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |