JP2008064885A - 音声認識装置、音声認識方法、及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法、及び音声認識プログラム Download PDFInfo
- Publication number
- JP2008064885A JP2008064885A JP2006240639A JP2006240639A JP2008064885A JP 2008064885 A JP2008064885 A JP 2008064885A JP 2006240639 A JP2006240639 A JP 2006240639A JP 2006240639 A JP2006240639 A JP 2006240639A JP 2008064885 A JP2008064885 A JP 2008064885A
- Authority
- JP
- Japan
- Prior art keywords
- input
- speech recognition
- task
- voice
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000008569 process Effects 0.000 claims description 66
- 230000004044 response Effects 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 21
- 230000003993 interaction Effects 0.000 description 63
- 230000008859 change Effects 0.000 description 33
- 239000013598 vector Substances 0.000 description 15
- 238000001514 detection method Methods 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 5
- LKAPTZKZHMOIRE-KVTDHHQDSA-N (2s,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolane-2-carbaldehyde Chemical compound OC[C@H]1O[C@H](C=O)[C@@H](O)[C@@H]1O LKAPTZKZHMOIRE-KVTDHHQDSA-N 0.000 description 4
- LKAPTZKZHMOIRE-UHFFFAOYSA-N chitose Natural products OCC1OC(C=O)C(O)C1O LKAPTZKZHMOIRE-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】音声認識装置1は、入力された音声についての認識結果に基づいて制御対象の制御内容を決定する。制御内容を表すタスクの種類を所定の決定入力に基づいて決定するタスク種類決定手段23と、タスク種類決定手段23により決定された種類のタスクを認識対象として、入力された音声を認識する音声認識手段11とを備える。
【選択図】図1
Description
[対話例]
次に、上述した音声対話処理について、図8(a)(b)に示した対話例を用いて説明する。図8(a)(b)の対話例は、いずれも運転者がラジオの選局を変更する対話例である。図8(a)は、上述の音声対話処理による対話例を示し、図8(b)は、参考例として、上述の音声対話処理において、STEP2でタスクの種類を決定して言語モデル16を選択する処理を行わない場合における対話例を示している。
Claims (10)
- 入力された音声についての認識結果に基づいて制御対象の制御内容を決定する音声認識装置において、
前記制御内容を表すタスクの種類を所定の決定入力に基づいて決定するタスク種類決定手段と、
前記タスク種類決定手段により決定された種類のタスクを認識対象として、入力された音声を認識する音声認識手段とを備えることを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記所定の決定入力は、逐次入力される音声について前記音声認識手段での前回の認識結果に含まれるタスクを示すデータであることを特徴とする音声認識装置。 - 請求項1又は2記載の音声認識装置において、
前記制御対象を表すドメインの種類を所定の決定入力に基づいて決定するドメイン種類決定手段を備え、
前記音声認識手段は、前記タスク種類決定手段により決定された種類のタスクに加えて、前記ドメイン種類決定手段により決定された種類のドメインを認識対象として、入力された音声を認識することを特徴とする音声認識装置。 - 請求項1又は2記載の音声認識装置において、
前記音声認識手段により入力された音声を認識する際に用いる、少なくとも前記タスクの種類毎に分類された音声認識用データを備え、
前記音声認識手段は、前記音声認識用データのうち、少なくとも前記タスク種類決定手段により決定された種類のタスクに分類されたデータに基づいて、入力された音声を認識することを特徴とする音声認識装置。 - 請求項3記載の音声認識装置において、
前記音声認識手段により入力された音声を認識する際に用いる、前記タスク及びドメインの種類毎に分類された音声認識用データを備え、
前記音声認識手段は、前記音声認識用データのうちの、前記タスク決定手段により決定された種類のタスクで、且つ前記ドメイン決定手段により決定された種類のドメインに分類されたデータに基づいて、入力された音声を認識することを特徴とする音声認識装置。 - 請求項4又は5記載の音声認識装置において、
前記音声認識用データは、少なくとも認識対象である単語についての確率をデータとして有する言語モデルを含むことを特徴とする音声認識装置。 - 請求項1〜6のいずれか記載の音声認識装置において、
少なくとも前記音声認識手段の認識結果に基づいて制御対象の制御内容を決定し、所定の制御処理を実行する制御手段を備えることを特徴とする音声認識装置。 - 請求項7記載の音声認識装置において、
前記音声を入力する使用者への応答を出力する応答出力手段を備え、前記制御手段の実行する制御処理は、音声の入力を該使用者に促すように該使用者への応答を制御する処理を含むことを特徴とする音声認識装置。 - 入力された音声についての認識結果に基づいて制御対象の制御内容を決定する音声認識方法であって、
前記制御内容を表すタスクの種類を所定の決定入力に基づいて決定するタスク種類決定ステップと、
前記タスク種類決定ステップで決定された種類のタスクを認識対象として、入力された音声を認識する音声認識ステップとを備えたことを特徴とする音声認識方法。 - 入力された音声についての認識結果に基づいて制御対象の制御内容を決定する処理をコンピュータに実行させる音声認識プログラムであって、
前記制御内容であるタスクの種類を所定の決定入力に基づいて決定するタスク種類決定処理と、
前記タスク種類決定処理で決定された種類のタスクを認識対象として、入力された音声を認識する音声認識処理とを前記コンピュータに実行させる機能を有することを特徴とする音声認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006240639A JP2008064885A (ja) | 2006-09-05 | 2006-09-05 | 音声認識装置、音声認識方法、及び音声認識プログラム |
US11/896,527 US20080177541A1 (en) | 2006-09-05 | 2007-09-04 | Voice recognition device, voice recognition method, and voice recognition program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006240639A JP2008064885A (ja) | 2006-09-05 | 2006-09-05 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008064885A true JP2008064885A (ja) | 2008-03-21 |
Family
ID=39287676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006240639A Pending JP2008064885A (ja) | 2006-09-05 | 2006-09-05 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080177541A1 (ja) |
JP (1) | JP2008064885A (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010191194A (ja) * | 2009-02-18 | 2010-09-02 | Toyota Motor Corp | 音声認識装置 |
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
JP2015081971A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
US9618352B2 (en) | 2014-03-27 | 2017-04-11 | Electronics And Telecommunications Research Institute | Apparatus and method for controlling navigator via speech dialogue |
JP2017161644A (ja) * | 2016-03-08 | 2017-09-14 | トヨタ自動車株式会社 | 音声処理システムおよび音声処理方法 |
US9886947B2 (en) | 2013-02-25 | 2018-02-06 | Seiko Epson Corporation | Speech recognition device and method, and semiconductor integrated circuit device |
JP2018116728A (ja) * | 2010-01-18 | 2018-07-26 | アップル インコーポレイテッド | インテリジェント自動アシスタント |
JP2018169624A (ja) * | 2013-09-03 | 2018-11-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話制御方法 |
CN109389974A (zh) * | 2017-08-09 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 一种语音操作的方法及装置 |
JP2019070957A (ja) * | 2017-10-10 | 2019-05-09 | 株式会社トヨタIt開発センター | 対話システムおよびドメイン決定方法 |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
JP2021184290A (ja) * | 2018-04-02 | 2021-12-02 | サウンドハウンド,インコーポレイテッド | 異なるドメインにおいて潜在的に曖昧な意味を有する表現の解釈 |
WO2022269760A1 (ja) * | 2021-06-22 | 2022-12-29 | ファナック株式会社 | 音声認識装置 |
JP2023051952A (ja) * | 2018-10-02 | 2023-04-11 | シャープ株式会社 | 音声操作システム及び音声操作方法 |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8965145B2 (en) | 2006-07-31 | 2015-02-24 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8856108B2 (en) * | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US8825682B2 (en) * | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8838591B2 (en) * | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US8989431B1 (en) | 2007-07-11 | 2015-03-24 | Ricoh Co., Ltd. | Ad hoc paper-based networking with mixed media reality |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US9848447B2 (en) * | 2007-06-27 | 2017-12-19 | Ford Global Technologies, Llc | Method and system for emergency notification |
WO2009081861A1 (ja) * | 2007-12-21 | 2009-07-02 | Nec Corporation | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 |
EP2211336B1 (en) * | 2009-01-23 | 2014-10-08 | Harman Becker Automotive Systems GmbH | Improved speech input using navigation information |
US8903351B2 (en) * | 2009-03-06 | 2014-12-02 | Ford Motor Company | Method and system for emergency call handling |
US9002713B2 (en) * | 2009-06-09 | 2015-04-07 | At&T Intellectual Property I, L.P. | System and method for speech personalization by need |
US20110098016A1 (en) * | 2009-10-28 | 2011-04-28 | Ford Motor Company | Method and system for emergency call placement |
US8903354B2 (en) * | 2010-02-15 | 2014-12-02 | Ford Global Technologies, Llc | Method and system for emergency call arbitration |
US20110230159A1 (en) * | 2010-03-19 | 2011-09-22 | Ford Global Technologies, Llc | System and Method for Automatic Storage and Retrieval of Emergency Information |
US9146122B2 (en) * | 2010-09-24 | 2015-09-29 | Telenav Inc. | Navigation system with audio monitoring mechanism and method of operation thereof |
DE102010049869B4 (de) | 2010-10-28 | 2023-03-16 | Volkswagen Ag | Verfahren zum Bereitstellen einer Sprachschnittstelle in einem Fahrzeug und Vorrichtung dazu |
US20120190324A1 (en) | 2011-01-25 | 2012-07-26 | Ford Global Technologies, Llc | Automatic Emergency Call Language Provisioning |
US8818325B2 (en) | 2011-02-28 | 2014-08-26 | Ford Global Technologies, Llc | Method and system for emergency call placement |
JP5709980B2 (ja) * | 2011-04-08 | 2015-04-30 | 三菱電機株式会社 | 音声認識装置およびナビゲーション装置 |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
WO2013022135A1 (en) * | 2011-08-11 | 2013-02-14 | Lg Electronics Inc. | Electronic device and method of controlling the same |
US9576573B2 (en) * | 2011-08-29 | 2017-02-21 | Microsoft Technology Licensing, Llc | Using multiple modality input to feedback context for natural language understanding |
US8594616B2 (en) | 2012-03-08 | 2013-11-26 | Ford Global Technologies, Llc | Vehicle key fob with emergency assistant service |
US8521539B1 (en) * | 2012-03-26 | 2013-08-27 | Nuance Communications, Inc. | Method for chinese point-of-interest search |
US8996377B2 (en) | 2012-07-12 | 2015-03-31 | Microsoft Technology Licensing, Llc | Blending recorded speech with text-to-speech output for specific domains |
US9049584B2 (en) | 2013-01-24 | 2015-06-02 | Ford Global Technologies, Llc | Method and system for transmitting data using automated voice when data transmission fails during an emergency call |
US9747898B2 (en) * | 2013-03-15 | 2017-08-29 | Honda Motor Co., Ltd. | Interpretation of ambiguous vehicle instructions |
JP2015089697A (ja) * | 2013-11-05 | 2015-05-11 | トヨタ自動車株式会社 | 車両用音声認識装置 |
US9773499B2 (en) * | 2014-06-18 | 2017-09-26 | Google Inc. | Entity name recognition based on entity type |
KR102301880B1 (ko) * | 2014-10-14 | 2021-09-14 | 삼성전자 주식회사 | 전자 장치 및 이의 음성 대화 방법 |
CN105632499B (zh) * | 2014-10-31 | 2019-12-10 | 株式会社东芝 | 用于优化语音识别结果的方法和装置 |
US10572810B2 (en) * | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US10249297B2 (en) | 2015-07-13 | 2019-04-02 | Microsoft Technology Licensing, Llc | Propagating conversational alternatives using delayed hypothesis binding |
US10475447B2 (en) * | 2016-01-25 | 2019-11-12 | Ford Global Technologies, Llc | Acoustic and domain based speech recognition for vehicles |
US9978367B2 (en) * | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
US9972312B2 (en) * | 2016-08-19 | 2018-05-15 | Panasonic Avionics Corporation | Digital assistant and associated methods for a transportation vehicle |
US10446137B2 (en) | 2016-09-07 | 2019-10-15 | Microsoft Technology Licensing, Llc | Ambiguity resolving conversational understanding system |
US10546578B2 (en) * | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
KR102458343B1 (ko) * | 2016-12-26 | 2022-10-25 | 삼성전자주식회사 | 음성 데이터를 송수신하는 디바이스 및 방법 |
CN109920429A (zh) * | 2017-12-13 | 2019-06-21 | 上海擎感智能科技有限公司 | 一种用于车载的语音识别数据处理方法及系统 |
KR102479035B1 (ko) * | 2018-03-22 | 2022-12-20 | 한국전자통신연구원 | 청각장애인용 언어학습 시스템 및 방법 |
JP7176228B2 (ja) * | 2018-05-21 | 2022-11-22 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
KR20200072020A (ko) * | 2018-12-12 | 2020-06-22 | 현대자동차주식회사 | 음성인식시스템의 대화 안내 방법 |
KR20200072021A (ko) * | 2018-12-12 | 2020-06-22 | 현대자동차주식회사 | 음성인식시스템의 도메인 관리 방법 |
CN110990632B (zh) * | 2019-12-19 | 2023-05-02 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及装置 |
US11977841B2 (en) * | 2021-12-22 | 2024-05-07 | Bank Of America Corporation | Classification of documents |
CN115294964B (zh) * | 2022-09-26 | 2023-02-10 | 广州小鹏汽车科技有限公司 | 语音识别方法、服务器、语音识别系统和可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249685A (ja) * | 2000-03-03 | 2001-09-14 | Alpine Electronics Inc | 音声対話装置 |
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2004086150A (ja) * | 2002-06-28 | 2004-03-18 | Denso Corp | 音声制御装置 |
JP2004252121A (ja) * | 2003-02-20 | 2004-09-09 | Sony Corp | 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体 |
JP2004333870A (ja) * | 2003-05-08 | 2004-11-25 | Nissan Motor Co Ltd | 移動体用音声認識装置 |
WO2005062296A1 (ja) * | 2003-12-05 | 2005-07-07 | Kabushikikaisha Kenwood | 機器制御装置及び機器制御方法 |
WO2005064592A1 (ja) * | 2003-12-26 | 2005-07-14 | Kabushikikaisha Kenwood | 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5168353A (en) * | 1990-12-21 | 1992-12-01 | Gte Laboratories Incorporated | Video distribution system allowing viewer access to time staggered indentical prerecorded programs |
JPH0781498A (ja) * | 1993-09-20 | 1995-03-28 | Mitsubishi Electric Corp | 車両用走行制御装置 |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US20020110246A1 (en) * | 2001-02-14 | 2002-08-15 | Jason Gosior | Wireless audio system |
-
2006
- 2006-09-05 JP JP2006240639A patent/JP2008064885A/ja active Pending
-
2007
- 2007-09-04 US US11/896,527 patent/US20080177541A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249685A (ja) * | 2000-03-03 | 2001-09-14 | Alpine Electronics Inc | 音声対話装置 |
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2004086150A (ja) * | 2002-06-28 | 2004-03-18 | Denso Corp | 音声制御装置 |
JP2004252121A (ja) * | 2003-02-20 | 2004-09-09 | Sony Corp | 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体 |
JP2004333870A (ja) * | 2003-05-08 | 2004-11-25 | Nissan Motor Co Ltd | 移動体用音声認識装置 |
WO2005062296A1 (ja) * | 2003-12-05 | 2005-07-07 | Kabushikikaisha Kenwood | 機器制御装置及び機器制御方法 |
WO2005064592A1 (ja) * | 2003-12-26 | 2005-07-14 | Kabushikikaisha Kenwood | 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010191194A (ja) * | 2009-02-18 | 2010-09-02 | Toyota Motor Corp | 音声認識装置 |
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
US12087308B2 (en) | 2010-01-18 | 2024-09-10 | Apple Inc. | Intelligent automated assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
JP2018116728A (ja) * | 2010-01-18 | 2018-07-26 | アップル インコーポレイテッド | インテリジェント自動アシスタント |
US9886947B2 (en) | 2013-02-25 | 2018-02-06 | Seiko Epson Corporation | Speech recognition device and method, and semiconductor integrated circuit device |
JP2018169624A (ja) * | 2013-09-03 | 2018-11-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話制御方法 |
JP2015081971A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
KR101770187B1 (ko) * | 2014-03-27 | 2017-09-06 | 한국전자통신연구원 | 음성 대화를 통한 네비게이션 제어 장치 및 방법 |
US9618352B2 (en) | 2014-03-27 | 2017-04-11 | Electronics And Telecommunications Research Institute | Apparatus and method for controlling navigator via speech dialogue |
JP2017161644A (ja) * | 2016-03-08 | 2017-09-14 | トヨタ自動車株式会社 | 音声処理システムおよび音声処理方法 |
CN109389974A (zh) * | 2017-08-09 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 一种语音操作的方法及装置 |
JP2019070957A (ja) * | 2017-10-10 | 2019-05-09 | 株式会社トヨタIt開発センター | 対話システムおよびドメイン決定方法 |
JP7095254B2 (ja) | 2017-10-10 | 2022-07-05 | トヨタ自動車株式会社 | 対話システムおよびドメイン決定方法 |
JP2021184290A (ja) * | 2018-04-02 | 2021-12-02 | サウンドハウンド,インコーポレイテッド | 異なるドメインにおいて潜在的に曖昧な意味を有する表現の解釈 |
JP2023051952A (ja) * | 2018-10-02 | 2023-04-11 | シャープ株式会社 | 音声操作システム及び音声操作方法 |
WO2022269760A1 (ja) * | 2021-06-22 | 2022-12-29 | ファナック株式会社 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20080177541A1 (en) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4188989B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP4412504B2 (ja) | 音声認識装置、音声認識方法、及び音声認識用プログラム | |
JP2008064885A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP4666648B2 (ja) | 音声応答システム、音声応答プログラム | |
US11170776B1 (en) | Speech-processing system | |
JP2008233678A (ja) | 音声対話装置、音声対話方法、及び音声対話用プログラム | |
US11830485B2 (en) | Multiple speech processing system with synthesized speech styles | |
US8340958B2 (en) | Text and speech recognition system using navigation information | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
US9449599B2 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
Zweig et al. | SCARF: a segmental conditional random field toolkit for speech recognition. | |
US11715472B2 (en) | Speech-processing system | |
JP2008089625A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
US20240071385A1 (en) | Speech-processing system | |
JP2008076811A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
CN111712790B (zh) | 计算设备的语音控制 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP2008076812A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
WO2014035437A1 (en) | Using character describer to efficiently input ambiguous characters for smart chinese speech dictation correction | |
JP2005070330A (ja) | 音声認識装置及びプログラム | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
JP2001242887A (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP2006184421A (ja) | 音声認識装置及び音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101102 |