JP2006201749A - 音声による選択装置、及び選択方法 - Google Patents
音声による選択装置、及び選択方法 Download PDFInfo
- Publication number
- JP2006201749A JP2006201749A JP2005347641A JP2005347641A JP2006201749A JP 2006201749 A JP2006201749 A JP 2006201749A JP 2005347641 A JP2005347641 A JP 2005347641A JP 2005347641 A JP2005347641 A JP 2005347641A JP 2006201749 A JP2006201749 A JP 2006201749A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- selection
- output
- item
- guide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000010187 selection method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 description 44
- 241000276569 Oryzias latipes Species 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical group N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【解決手段】選択項目をガイドするガイド音声を出力する出力手段101と、出力手段101よって出力されたガイド音声の出力中又はその出力終了後に一定時間内に発声された、選択項目を選択するための選択指示を認識する音声認識手段106と、音声認識手段106によって選択指示が認識された場合、選択指示された選択項目を選択する対話制御・結果選択手段107とを備えることにより、出力手段101によってガイド音声が出力されている間、その出力が終了し一定時間が経過するまでに選択項目を選択する音声を発することで、音声認識手段106によってその選択項目を選択することができ、ガイド音声の出力中でも選択項目を選択することができる。
【選択図】図1
Description
する構成を有する。
で、音声認識手段によってその選択項目を選択することができ、ガイド音声の出力中でも選択項目をより確実に選択することができる。
図1は、本発明の実施の形態1における音声による選択装置の概略構成を示すブロック図である。
図4は、本発明の実施の形態2における音声による選択装置の概略構成を示すブロック図、図5は、同装置の動作を説明するフローチャート、図6は、同装置の動作を説明するタイムチャートである。
図7は、本発明の実施の形態2における音声による選択装置の概略構成を示すブロック図、図8は、同装置の動作を説明するフローチャート、図9は、同装置の動作を説明するタイムチャートである。
上記各実施の形態では、例えば図3に示す、選択のための時間308B、309B等を積極的に設ける構成は有していないが、この選択のための時間308B、309B等を設ける入力待ち時間設定部を有する音声による選択装置について図10から図12を用いて説明する。
入力待ち時間が設定される。
そして、「めだかの学校。」というガイド音声(303)が出力されている間308Aと、その出力が終了した後の一定時間1208Bは、第1番目の選択項目である「めだかの学校」を選択できる時間1208となる。したがって、この間1208にユーザーが選択を指示する言葉、例えば、「これだ!」という言葉を発声すれば、「めだかの学校」を選択することができる。
102 マイクロホン
103 システム音声除去部
104 フィルタ係数学習部
105 適応フィルタ部
106 音声認識部
107,1007 対話制御・結果選択部
108,1008 応答生成部
109 応答音声データベース
110 減算器
411 音楽再生部
412 音楽データベース
413 ミキサー部
700 ディスプレイ
711 画像生成部
712 画像・動画データベース
1011 入力待ち時間設定部
Claims (7)
- 選択項目をガイドするガイド音声を出力する出力手段と、前記出力手段よって出力された前記ガイド音声の出力中又はその出力終了後に一定時間内に発声された、前記選択項目を選択するための選択指示を認識する音声認識手段と、前記音声認識手段によって前記選択指示が認識された場合、前記選択指示された選択項目を選択する対話制御・結果選択手段とを備えた音声による選択装置。
- 前記出力手段よって出力された前記ガイド音声の出力中又はその出力終了後に一定時間内に選択指示が発声されなかった場合、前記対話制御・結果選択手段が前記出力手段に前記選択項目の次の選択項目をガイドするガイド音声を出力するよう制御することを特徴とする請求項1記載の音声による選択装置。
- 前記音声認識手段が、前記音声認識手段に入力される音声から前記出力手段よって出力された前記ガイド音声を減じる音声除去手段を備えた請求項1または2に記載の音声による選択装置。
- 前記ガイド音声に対応する楽曲の一部または全部を再生する楽曲再生手段をさらに備え、前記音声認識手段が、前記楽曲再生手段によって前記楽曲を再生している間又は再生終了後に一定時間内に入力された選択指示を音声認識することを特徴とする請求項1から3までのうちのいずれかに記載の音声による選択装置。
- 前記ガイド音声に対応する画像を生成する画像生成手段をさらに備え、前記音声認識手段が、前記画像生成手段によって前記画像を生成している間又は生成後に一定時間内に入力された選択指示を音声認識することを特徴とする請求項1から4までのうちのいずれかに記載の音声による選択装置。
- 選択項目をガイドするガイド音声を出力する出力手順と、前記出力手順において出力された前記ガイド音声の出力中又はその出力終了後に一定時間内に発声された、前記選択項目を選択するための選択指示を認識する音声認識手順と、前記音声認識手順によって前記選択指示が認識された場合、前記選択指示された選択項目を選択する対話制御・結果選択手順とを備えた音声による選択方法。
- 選択項目をガイドするガイド音声を出力する出力手段と、前記出力手段よって出力された前記ガイド音声の出力中又はその出力終了後に一定時間を設定する入力待ち時間設定部と、前記入力待ち時間設定部によって設定された前記一定時間内に発声された、前記選択項目を選択するための選択指示を認識する音声認識手段と、前記音声認識手段によって前記選択指示が認識された場合、前記選択指示された選択項目を選択する対話制御・結果選択手段とを備えた音声による選択装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005347641A JP2006201749A (ja) | 2004-12-21 | 2005-12-01 | 音声による選択装置、及び選択方法 |
CN2005800194453A CN1969315B (zh) | 2004-12-21 | 2005-12-20 | 基于声音的选择装置以及选择方法 |
PCT/JP2005/023336 WO2006068123A1 (ja) | 2004-12-21 | 2005-12-20 | 音声による選択装置、及び選択方法 |
US11/570,470 US7698134B2 (en) | 2004-12-21 | 2005-12-20 | Device in which selection is activated by voice and method in which selection is activated by voice |
EP05820332.4A EP1768103B1 (en) | 2004-12-21 | 2005-12-20 | Device in which selection is activated by voice and method in which selection is activated by voice |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004368807 | 2004-12-21 | ||
JP2005347641A JP2006201749A (ja) | 2004-12-21 | 2005-12-01 | 音声による選択装置、及び選択方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006201749A true JP2006201749A (ja) | 2006-08-03 |
JP2006201749A5 JP2006201749A5 (ja) | 2008-12-25 |
Family
ID=36601723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005347641A Withdrawn JP2006201749A (ja) | 2004-12-21 | 2005-12-01 | 音声による選択装置、及び選択方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7698134B2 (ja) |
EP (1) | EP1768103B1 (ja) |
JP (1) | JP2006201749A (ja) |
CN (1) | CN1969315B (ja) |
WO (1) | WO2006068123A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012073364A (ja) * | 2010-09-28 | 2012-04-12 | Toshiba Corp | 音声対話装置、方法、プログラム |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
JP4131978B2 (ja) * | 2006-02-24 | 2008-08-13 | 本田技研工業株式会社 | 音声認識機器制御装置 |
JP2008065789A (ja) * | 2006-09-11 | 2008-03-21 | Canon Inc | 入力操作支援装置およびその制御方法 |
US20100250253A1 (en) * | 2009-03-27 | 2010-09-30 | Yangmin Shen | Context aware, speech-controlled interface and system |
US8700405B2 (en) * | 2010-02-16 | 2014-04-15 | Honeywell International Inc | Audio system and method for coordinating tasks |
US9432611B1 (en) | 2011-09-29 | 2016-08-30 | Rockwell Collins, Inc. | Voice radio tuning |
US9922651B1 (en) * | 2014-08-13 | 2018-03-20 | Rockwell Collins, Inc. | Avionics text entry, cursor control, and display format selection via voice recognition |
KR102081925B1 (ko) | 2012-08-29 | 2020-02-26 | 엘지전자 주식회사 | 디스플레이 디바이스 및 스피치 검색 방법 |
EP2908281A4 (en) * | 2012-10-12 | 2016-04-06 | Kazuo Kaneko | PRODUCT INFORMATION PROCESSING SYSTEM, PRODUCT INFORMATION PROCESSING DEVICE AND PRODUCT INFORMATION EDITOR |
US8977555B2 (en) * | 2012-12-20 | 2015-03-10 | Amazon Technologies, Inc. | Identification of utterance subjects |
US10255038B2 (en) * | 2013-04-26 | 2019-04-09 | Microsoft Technology Licensing, Llc | Techniques to present a user interface for the visually impaired |
JP6411017B2 (ja) * | 2013-09-27 | 2018-10-24 | クラリオン株式会社 | サーバ、及び、情報処理方法 |
KR102158315B1 (ko) * | 2013-10-14 | 2020-09-21 | 삼성전자주식회사 | 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법 |
JP2016061970A (ja) * | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 音声対話装置、方法およびプログラム |
US10448762B2 (en) | 2017-09-15 | 2019-10-22 | Kohler Co. | Mirror |
US11093554B2 (en) | 2017-09-15 | 2021-08-17 | Kohler Co. | Feedback for water consuming appliance |
US10887125B2 (en) | 2017-09-15 | 2021-01-05 | Kohler Co. | Bathroom speaker |
US11314214B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Geographic analysis of water conditions |
US11099540B2 (en) | 2017-09-15 | 2021-08-24 | Kohler Co. | User identity in household appliances |
CN108156497B (zh) * | 2018-01-02 | 2020-12-18 | 联想(北京)有限公司 | 一种控制方法、控制设备及控制系统 |
JP7002823B2 (ja) * | 2018-12-06 | 2022-01-20 | アルパイン株式会社 | 案内音声出力制御システムおよび案内音声出力制御方法 |
DE102023101499A1 (de) | 2023-01-23 | 2024-07-25 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren und Vorrichtung zum Betrieb eines virtuellen Assistenten |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63240598A (ja) * | 1987-03-27 | 1988-10-06 | 日本電気株式会社 | 音声応答認識装置 |
JPH03293400A (ja) | 1990-04-10 | 1991-12-25 | Oki Electric Ind Co Ltd | 音声制御方法 |
JPH04301697A (ja) * | 1991-03-29 | 1992-10-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置 |
JPH06149534A (ja) | 1992-11-13 | 1994-05-27 | Toshiba Corp | 音声画面操作装置 |
US7509270B1 (en) * | 1992-12-09 | 2009-03-24 | Discovery Communications, Inc. | Electronic Book having electronic commerce features |
US5918213A (en) * | 1995-12-22 | 1999-06-29 | Mci Communications Corporation | System and method for automated remote previewing and purchasing of music, video, software, and other multimedia products |
JPH11224265A (ja) * | 1998-02-06 | 1999-08-17 | Pioneer Electron Corp | 情報検索装置及び情報検索方法並びに情報検索プログラムを記録した記録媒体 |
JP3178426B2 (ja) * | 1998-07-29 | 2001-06-18 | 日本電気株式会社 | 自然言語対話システム及び自然言語対話プログラム記録媒体 |
US7209892B1 (en) * | 1998-12-24 | 2007-04-24 | Universal Music Group, Inc. | Electronic music/media distribution system |
JP3629384B2 (ja) | 1999-06-29 | 2005-03-16 | シャープ株式会社 | 情報選択装置及び記録媒体 |
JP2000338992A (ja) * | 1999-05-26 | 2000-12-08 | Fujitsu Ten Ltd | 音声認識装置 |
US7173177B1 (en) * | 1999-12-28 | 2007-02-06 | Blue Dolphin Solutions Llc | User interface for simultaneous management of owned and unowned inventory |
US6693236B1 (en) * | 1999-12-28 | 2004-02-17 | Monkeymedia, Inc. | User interface for simultaneous management of owned and unowned inventory |
GB2360106B (en) * | 2000-02-21 | 2004-09-22 | Ac Properties Bv | Ordering playable works |
JP4543294B2 (ja) * | 2000-03-14 | 2010-09-15 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
WO2001071608A2 (en) * | 2000-03-17 | 2001-09-27 | Mark Nair | System, method and apparatus for controlling the dissemination of digital works |
US6510417B1 (en) | 2000-03-21 | 2003-01-21 | America Online, Inc. | System and method for voice access to internet-based information |
US7526450B2 (en) * | 2000-04-19 | 2009-04-28 | Sony Corporation | Interface for presenting downloadable digital data content format options |
US7043447B2 (en) * | 2000-04-19 | 2006-05-09 | Sony Corporation | Method for facilitating a transaction for purchasable content over an electronic network |
WO2002052546A1 (en) * | 2000-12-27 | 2002-07-04 | Intel Corporation | Voice barge-in in telephony speech recognition |
US6885735B2 (en) * | 2001-03-29 | 2005-04-26 | Intellisist, Llc | System and method for transmitting voice input from a remote location over a wireless data channel |
US6555738B2 (en) * | 2001-04-20 | 2003-04-29 | Sony Corporation | Automatic music clipping for super distribution |
JP2002366187A (ja) * | 2001-06-08 | 2002-12-20 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
US6941268B2 (en) * | 2001-06-21 | 2005-09-06 | Tellme Networks, Inc. | Handling of speech recognition in a declarative markup language |
WO2003017045A2 (en) * | 2001-08-16 | 2003-02-27 | Trans World New York Llc | User-personalized media sampling, recommendation and purchasing system using real-time inventory database |
JP2003177788A (ja) * | 2001-12-12 | 2003-06-27 | Fujitsu Ltd | 音声対話システムおよびその方法 |
US7103542B2 (en) * | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
JP3892302B2 (ja) | 2002-01-11 | 2007-03-14 | 松下電器産業株式会社 | 音声対話方法および装置 |
JP2004191705A (ja) * | 2002-12-12 | 2004-07-08 | Renesas Technology Corp | 音声認識装置 |
KR100668297B1 (ko) * | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
JP2005071522A (ja) * | 2003-08-27 | 2005-03-17 | Sony Corp | コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法 |
US7624016B2 (en) * | 2004-07-23 | 2009-11-24 | Microsoft Corporation | Method and apparatus for robustly locating user barge-ins in voice-activated command systems |
-
2005
- 2005-12-01 JP JP2005347641A patent/JP2006201749A/ja not_active Withdrawn
- 2005-12-20 US US11/570,470 patent/US7698134B2/en active Active
- 2005-12-20 CN CN2005800194453A patent/CN1969315B/zh active Active
- 2005-12-20 WO PCT/JP2005/023336 patent/WO2006068123A1/ja active Application Filing
- 2005-12-20 EP EP05820332.4A patent/EP1768103B1/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012073364A (ja) * | 2010-09-28 | 2012-04-12 | Toshiba Corp | 音声対話装置、方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1768103A4 (en) | 2008-02-27 |
US20070219805A1 (en) | 2007-09-20 |
CN1969315A (zh) | 2007-05-23 |
EP1768103A1 (en) | 2007-03-28 |
US7698134B2 (en) | 2010-04-13 |
WO2006068123A1 (ja) | 2006-06-29 |
EP1768103B1 (en) | 2014-06-11 |
CN1969315B (zh) | 2012-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006201749A (ja) | 音声による選択装置、及び選択方法 | |
KR101818980B1 (ko) | 다중 화자 음성 인식 수정 시스템 | |
JP5118280B2 (ja) | 自然言語インターフェースコントロールシステム | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
JPWO2017145373A1 (ja) | 音声認識装置 | |
JP2003518266A (ja) | 音声認識システムのテキスト編集用音声再生 | |
JP2006201749A5 (ja) | ||
JP2005084102A (ja) | 音声認識評価装置、音声認識評価方法、及び音声認識評価プログラム | |
JP2006504130A (ja) | 音声に基づく装置制御 | |
JP2003022087A (ja) | 音声認識方法 | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
WO2007055233A1 (ja) | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム | |
JP5451982B2 (ja) | 支援装置、プログラムおよび支援方法 | |
JP2004333543A (ja) | 音声対話システム及び音声対話方法 | |
JP2003150194A (ja) | 音声対話装置および音声対話装置における入力音声最適化方法ならびに音声対話装置における入力音声最適化処理プログラム | |
JP2003241797A (ja) | 音声対話システム | |
JP2004029354A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
WO2018173295A1 (ja) | ユーザインタフェース装置及び方法、並びに音操作システム | |
JP2009104025A (ja) | 音声認識制御装置 | |
JP2019132979A (ja) | カラオケ装置 | |
JP2005031150A (ja) | 音声処理装置および方法 | |
JP2009116107A (ja) | 情報処理装置及び方法 | |
JP2005157166A (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP2019020475A (ja) | 音声認識装置、音声認識方法 | |
JP2005241767A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081112 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081112 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090311 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090727 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20091127 |