JP4790024B2 - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP4790024B2 JP4790024B2 JP2008549220A JP2008549220A JP4790024B2 JP 4790024 B2 JP4790024 B2 JP 4790024B2 JP 2008549220 A JP2008549220 A JP 2008549220A JP 2008549220 A JP2008549220 A JP 2008549220A JP 4790024 B2 JP4790024 B2 JP 4790024B2
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- dictionary
- unit
- word
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004891 communication Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Description
図1は、この発明の実施の形態1に係る音声認識装置の構成を示すブロック図である。この音声認識装置は、マイクロフォン(以下、「マイク」と略する)1、音声認識辞書2、音声認識部3、対話制御部4および提示部5から構成されている。なお、この音声認識装置が適用されるカーナビゲーション装置は、図示は省略しているが、検索データベースとして、検索対象とされる語彙をジャンル毎に格納したジャンルデータベースを備えている。
図3は、この発明の実施の形態2に係る音声認識装置の構成を示すブロック図である。この音声認識装置は、実施の形態1に係る音声認識装置に、検索データベース6および検索部7が追加されて構成されている。以下、実施の形態1と相違する部分を中心に説明する。
図5は、この発明の実施の形態3に係る音声認識装置の構成を示すブロック図である。この音声認識装置は、実施の形態1に係る音声認識装置に、通信部8が追加されて構成されている。通信部8は、ネットワーク9に接続されている。以下、実施の形態1と相違する部分を中心に説明する。
図7は、この発明の実施の形態4に係る音声認識装置の構成を示すブロック図である。この音声認識装置は、実施の形態1に係る音声認識装置に、辞書更新部10が追加されて構成されている。辞書更新部10には、PCカード11が装着される。以下、実施の形態1と相違する部分を中心に説明する。
図9は、この発明の実施の形態5に係る音声認識装置の構成を示すブロック図である。この音声認識装置は、実施の形態4に係る音声認識装置に、通信部8、訂正スイッチ12およびネットワーク9に接続された音声認識サーバ13が追加されるとともに、対話制御部4および辞書更新部10の機能が変更されて構成されている。以下、実施の形態4と相違する部分を中心に説明する。
Claims (5)
- 検索対象とされる語彙がジャンル毎に格納されたジャンルデータベースを備えた車載機器用の音声認識装置であって、
発話された音声を電気信号に変換し、発話データとして出力するマイクロフォンと、
前記ジャンルデータベースで検索対象とされるジャンルの語彙を認識するための第1音声認識辞書と、
前記ジャンルデータベースで検索対象外とされるジャンルの語彙を認識するための第2音声認識辞書と、
前記マイクロフォンから送られてくる発話データと前記第1音声認識辞書および前記第2音声認識辞書に含まれる語彙とを照合することにより、発話された音声を認識する音声認識部と、
前記音声認識部から認識結果として送られてくる語が、前記第2音声認識辞書に含まれる語彙と照合することにより得られた語である場合は、検索対象とされるジャンルの語でない旨を表すメッセージを提示情報として出力する対話制御部と、
前記対話制御部から送られてくる提示情報を外部に提示する提示部
とを備えた音声認識装置。 - 検索対象とされる語彙を名称別に格納した名称データベースと、
対話制御部から送られてくる語を検索キーとして前記名称データベースを検索し、該検索により得られた前記検索キーを名称に含む語を前記対話制御部に返す検索部を備え、
前記対話制御部は、音声認識部から認識結果として送られてくる語が、第2音声認識辞書に含まれる語彙と照合することにより得られた語である場合は、該語を前記検索部に送って検索を指示し、該指示に応答して前記検索部から返される前記検索キーを名称に含む語を提示情報として出力する
ことを特徴とする請求項1記載の音声認識装置。 - 対話制御部から送られてくる語をキーワードとしてネットワーク検索を実行し、該ネットワーク検索により得られた前記キーワードを含む語を前記対話制御部に返す通信部を備え、
前記対話制御部は、音声認識部から認識結果として送られてくる語が、第2音声認識辞書に含まれる語彙と照合することにより得られた語である場合は、該語を前記通信部に送ってネットワーク検索を指示し、該指示に応答して前記検索部から返される前記キーワードを含む語を提示情報として出力する
ことを特徴とする請求項1記載の音声認識装置。 - 既存の第2音声認識辞書を、外部から取得した更新用音声認識辞書で置き換えることにより新しい第2音声認識辞書とする辞書更新部
を備えたことを特徴とする請求項1記載の音声認識装置。 - 音声認識部から送られてくる認識結果の訂正を指示する認識訂正手段と、
前記認識訂正手段からの指示に応じて、マイクロフォンから対話制御部を介して送られてくる発話データを、ネットワークを介して音声認識サーバに送信し、該音声認識サーバにおいて該発話データを認識できた場合に使用された語彙を含むように生成された更新用音声認識辞書を前記音声認識サーバからネットワークを介して受信して前記対話制御部に返す通信部を備え、
辞書更新部は、前記対話制御部から更新用音声認識辞書を取得し、該取得した更新用音声認識辞書で既存の第2音声認識辞書を置き換えることにより新しい第2音声認識辞書とする
ことを特徴とする請求項4記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008549220A JP4790024B2 (ja) | 2006-12-15 | 2007-10-04 | 音声認識装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006338813 | 2006-12-15 | ||
JP2006338813 | 2006-12-15 | ||
PCT/JP2007/069479 WO2008072413A1 (ja) | 2006-12-15 | 2007-10-04 | 音声認識装置 |
JP2008549220A JP4790024B2 (ja) | 2006-12-15 | 2007-10-04 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008072413A1 JPWO2008072413A1 (ja) | 2010-03-25 |
JP4790024B2 true JP4790024B2 (ja) | 2011-10-12 |
Family
ID=39511444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008549220A Expired - Fee Related JP4790024B2 (ja) | 2006-12-15 | 2007-10-04 | 音声認識装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8195461B2 (ja) |
JP (1) | JP4790024B2 (ja) |
CN (1) | CN101558443B (ja) |
DE (1) | DE112007002665B4 (ja) |
HK (1) | HK1135225A1 (ja) |
WO (1) | WO2008072413A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8423353B2 (en) * | 2009-03-25 | 2013-04-16 | Microsoft Corporation | Sharable distributed dictionary for applications |
JP5426913B2 (ja) * | 2009-04-02 | 2014-02-26 | アルパイン株式会社 | 音声認識辞書編集装置及び音声認識装置 |
JP5378907B2 (ja) * | 2009-08-07 | 2013-12-25 | 株式会社豊田中央研究所 | 音声対話装置及び音声対話プログラム |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
CN102566961A (zh) * | 2010-12-31 | 2012-07-11 | 上海博泰悦臻电子设备制造有限公司 | 基于车载设备的应用程序的语音执行方法及装置 |
CN102915729B (zh) * | 2011-08-01 | 2014-11-26 | 佳能株式会社 | 语音关键词检出系统、创建用于其的词典的系统和方法 |
JP5942559B2 (ja) * | 2012-04-16 | 2016-06-29 | 株式会社デンソー | 音声認識装置 |
JP5925313B2 (ja) * | 2012-07-03 | 2016-05-25 | 三菱電機株式会社 | 音声認識装置 |
DE102012213668A1 (de) * | 2012-08-02 | 2014-05-22 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren und Vorrichtung zum Betreiben eines sprachgesteuerten Informationssystems für ein Fahrzeug |
JP6150268B2 (ja) * | 2012-08-31 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | 単語登録装置及びそのためのコンピュータプログラム |
JP6281856B2 (ja) * | 2012-08-31 | 2018-02-21 | 国立研究開発法人情報通信研究機構 | ローカル言語資源の補強装置及びサービス提供設備装置 |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
USRE49014E1 (en) | 2013-06-19 | 2022-04-05 | Panasonic Intellectual Property Corporation Of America | Voice interaction method, and device |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
US10565984B2 (en) * | 2013-11-15 | 2020-02-18 | Intel Corporation | System and method for maintaining speech recognition dynamic dictionary |
JP6597527B2 (ja) * | 2016-09-06 | 2019-10-30 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
JP6804909B2 (ja) * | 2016-09-15 | 2020-12-23 | 東芝テック株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
JP6611091B2 (ja) * | 2017-05-11 | 2019-11-27 | 株式会社村田製作所 | 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法 |
US20190019516A1 (en) * | 2017-07-14 | 2019-01-17 | Ford Global Technologies, Llc | Speech recognition user macros for improving vehicle grammars |
JP2021026188A (ja) * | 2019-08-08 | 2021-02-22 | 本田技研工業株式会社 | 通信制御システム、通知制御方法、及び通信制御プログラム |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3397372B2 (ja) * | 1993-06-16 | 2003-04-14 | キヤノン株式会社 | 音声認識方法及び装置 |
JP3579971B2 (ja) | 1995-07-28 | 2004-10-20 | マツダ株式会社 | 車載用地図表示装置 |
JPH09230889A (ja) | 1996-02-23 | 1997-09-05 | Hitachi Ltd | 音声認識応答装置 |
JPH11202891A (ja) | 1998-01-12 | 1999-07-30 | Toyota Motor Corp | 音声認識装置 |
JPH11224265A (ja) * | 1998-02-06 | 1999-08-17 | Pioneer Electron Corp | 情報検索装置及び情報検索方法並びに情報検索プログラムを記録した記録媒体 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
US6499013B1 (en) | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6434524B1 (en) | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
EP1083545A3 (en) * | 1999-09-09 | 2001-09-26 | Xanavi Informatics Corporation | Voice recognition of proper names in a navigation apparatus |
JP4116233B2 (ja) * | 2000-09-05 | 2008-07-09 | パイオニア株式会社 | 音声認識装置ならびにその方法 |
JP4283984B2 (ja) * | 2000-10-12 | 2009-06-24 | パイオニア株式会社 | 音声認識装置ならびに方法 |
JP2002123279A (ja) * | 2000-10-16 | 2002-04-26 | Pioneer Electronic Corp | 施設検索装置ならびにその方法 |
JP2002123290A (ja) * | 2000-10-16 | 2002-04-26 | Pioneer Electronic Corp | 音声認識装置ならびに音声認識方法 |
JP2002215186A (ja) | 2001-01-12 | 2002-07-31 | Auto Network Gijutsu Kenkyusho:Kk | 音声認識システム |
DE10119677A1 (de) * | 2001-04-20 | 2002-10-24 | Philips Corp Intellectual Pty | Verfahren zum Ermitteln von Datenbankeinträgen |
JP2002366578A (ja) | 2001-06-08 | 2002-12-20 | Mitsubishi Electric Corp | 車載情報端末装置および情報検索システム |
JP3576511B2 (ja) | 2001-09-19 | 2004-10-13 | 松下電器産業株式会社 | 音声対話装置 |
JP4275357B2 (ja) | 2002-06-11 | 2009-06-10 | 三菱電機株式会社 | 音声認識装置、辞書管理方法およびプログラム |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JP2004333729A (ja) | 2003-05-06 | 2004-11-25 | All Nippon Airways Co Ltd | 音声認識による航空券電話予約システム |
JP2005044071A (ja) | 2003-07-25 | 2005-02-17 | Sharp Corp | 電子辞書 |
JP2005189667A (ja) | 2003-12-26 | 2005-07-14 | Mitsubishi Electric Corp | 車載機器、音声対話ドキュメント作成サーバ及びこれらを用いたナビゲーションシステム |
JP4705023B2 (ja) * | 2004-06-10 | 2011-06-22 | パナソニック株式会社 | 音声認識装置、音声認識方法、及びプログラム |
JP4684583B2 (ja) | 2004-07-08 | 2011-05-18 | 三菱電機株式会社 | 対話装置 |
CN100375006C (zh) * | 2006-01-19 | 2008-03-12 | 吉林大学 | 车辆导航装置语音控制系统 |
DE102006029755A1 (de) | 2006-06-27 | 2008-01-03 | Deutsche Telekom Ag | Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung |
-
2007
- 2007-10-04 CN CN2007800459044A patent/CN101558443B/zh not_active Expired - Fee Related
- 2007-10-04 WO PCT/JP2007/069479 patent/WO2008072413A1/ja active Application Filing
- 2007-10-04 JP JP2008549220A patent/JP4790024B2/ja not_active Expired - Fee Related
- 2007-10-04 US US12/447,352 patent/US8195461B2/en not_active Expired - Fee Related
- 2007-10-04 DE DE112007002665.0T patent/DE112007002665B4/de active Active
-
2010
- 2010-02-09 HK HK10101446.6A patent/HK1135225A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
HK1135225A1 (en) | 2010-05-28 |
CN101558443A (zh) | 2009-10-14 |
US20100076751A1 (en) | 2010-03-25 |
CN101558443B (zh) | 2012-01-04 |
US8195461B2 (en) | 2012-06-05 |
JPWO2008072413A1 (ja) | 2010-03-25 |
DE112007002665T5 (de) | 2009-09-10 |
DE112007002665B4 (de) | 2017-12-28 |
WO2008072413A1 (ja) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4790024B2 (ja) | 音声認識装置 | |
CN107039038B (zh) | 学习个性化实体发音 | |
US8285537B2 (en) | Recognition of proper nouns using native-language pronunciation | |
US7826945B2 (en) | Automobile speech-recognition interface | |
US9449599B2 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
EP2259252B1 (en) | Speech recognition method for selecting a combination of list elements via a speech input | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
KR101445904B1 (ko) | 현장 음성 번역 유지 시스템 및 방법 | |
US20070016421A1 (en) | Correcting a pronunciation of a synthetically generated speech object | |
JP4283984B2 (ja) | 音声認識装置ならびに方法 | |
US20030144846A1 (en) | Method and system for modifying the behavior of an application based upon the application's grammar | |
US20070156405A1 (en) | Speech recognition system | |
JP2001005488A (ja) | 音声対話システム | |
JP2010191400A (ja) | 音声認識装置およびデータ更新方法 | |
WO2016136207A1 (ja) | 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム | |
JP2005043461A (ja) | 音声認識方法及び音声認識装置 | |
JP5335165B2 (ja) | 発音情報生成装置、車載情報装置およびデータベース生成方法 | |
US20070136070A1 (en) | Navigation system having name search function based on voice recognition, and method thereof | |
WO2014194299A1 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
JP3795409B2 (ja) | 音声認識装置及び方法 | |
WO2013164870A1 (ja) | 音声合成装置 | |
JP2003330488A (ja) | 音声認識装置 | |
US11176930B1 (en) | Storing audio commands for time-delayed execution | |
US20080133240A1 (en) | Spoken dialog system, terminal device, speech information management device and recording medium with program recorded thereon | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20110606 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20110610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110621 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110719 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4790024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |