JP6227209B2 - 車載用音声認識装置および車載機器 - Google Patents
車載用音声認識装置および車載機器 Download PDFInfo
- Publication number
- JP6227209B2 JP6227209B2 JP2017538774A JP2017538774A JP6227209B2 JP 6227209 B2 JP6227209 B2 JP 6227209B2 JP 2017538774 A JP2017538774 A JP 2017538774A JP 2017538774 A JP2017538774 A JP 2017538774A JP 6227209 B2 JP6227209 B2 JP 6227209B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- unit
- vehicle
- speech
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000007958 sleep Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007257 malfunction Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 3
- 101000760620 Homo sapiens Cell adhesion molecule 1 Proteins 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Description
実施の形態1.
図1は、この発明の実施の形態1に係る車載機器1の構成例を示すブロック図である。この車載機器1は、音声認識部11、判断部12、認識制御部13および制御部14を備えている。音声認識部11、判断部12および認識制御部13は、音声認識装置10を構成している。また、車載機器1には、音声入力部2、カメラ3、圧力センサ4、表示部5およびスピーカ6が接続されている。
図1の例では、車載機器1に音声認識装置10を組み込んだ構成を示すが、音声認識装置10を、車載機器1から独立した構成にしてもよい。
この車載機器1は、例えば、ナビゲーション装置またはオーディオ装置等の車両に搭載される機器である。
本実施の形態1において、「発話者」は、音声によって音声認識装置10と車載機器1を誤動作させる可能性があるものをいい、赤ん坊および動物等も含まれるものとする。
上述した判断方法は公知の技術を用いればよいため詳細な説明を省略する。なお、判断方法はこれらに限られない。また、図1ではカメラ3と圧力センサ4の両方を用いる構成を示すが、例えば、カメラ3のみを用いる構成でもよい。
例えば、判断部12は、カメラ3から取得した画像データを解析して、搭乗者が起きているか寝ているかを判断し、起きている搭乗者の人数を発話者の人数として数える。一方、寝ている搭乗者は発話する可能性がないので、判断部12は、寝ている搭乗者の人数を発話者の人数として数えない。
したがって、車内の発話者が一人である状況でこの発話者がコマンドのみまたはキーワードとコマンドの組み合わせを発話した場合、音声認識装置10が認識に成功し、車載機器1がコマンドに対応する動作を実行する。他方、車内に複数の発話者がいる状況でいずれかの発話者がキーワードとコマンドの組み合わせを発話した場合には、音声認識装置10が認識に成功し、車載機器1がコマンドに対応する動作を実行し、いずれかの発話者がコマンドのみを発話した場合には、音声認識装置10が認識に失敗し、車載機器1はコマンドに対応する動作を実行しない。
判断結果が「単数」である場合に、上述したように「コマンド」と「キーワードとコマンドの組み合わせ」を認識語彙として用いて少なくとも「コマンド」を認識可能なように音声認識部11を構成する以外にも、例えば、ワードスポッティング等の公知の技術により「コマンド」を含む発話から「コマンド」のみを認識結果として出力するように音声認識部11を構成してもよい。
まず、判断部12は、カメラ3または圧力センサ4から取得した情報に基づいて、車内の発話者の人数を判断する(ステップST01)。そして、判断結果を認識制御部13へ出力する(ステップST02)。
図4は、この発明の実施の形態2に係る車載機器1の構成例を示すブロック図である。なお、実施の形態1で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。
指示入力部7は、コマンドの発話開始を指示するための入力を受け付けると、当該発話開始の指示を認識制御部13aに対して出力する。
そして、認識制御部13aは、指示入力部7からのコマンドの発話開始の指示を受けた後に音声認識部11aから受け取った認識結果を採用し、制御部14に対して出力する。一方、指示入力部7からのコマンドの発話開始の指示を受けていない場合、認識制御部13aは、音声認識部11aにより出力された認識結果を採用せず破棄する。すなわち、認識制御部13aは当該認識結果を制御部14に対して出力しない。
図1に示した音声認識装置10において、音声認識部11は、車内の発話者が複数か単数かによらず、「コマンド」と「キーワードとコマンドの組み合わせ」を認識語彙として用いて、発話音声を認識する。音声認識部11は、「コマンド」のみを認識結果として出力するか、「キーワード」と「コマンド」を認識結果として出力するか、認識に失敗した旨を認識結果として出力する。
つまり、音声認識部11から受け取った認識結果に「キーワード」と「コマンド」が含まれている場合、認識制御部13は、認識結果から「キーワード」に対応する部分を削除し、「キーワード」の後に発話された「コマンド」に対応する部分を制御部14へ出力する。一方、音声認識部11から受け取った認識結果に「キーワード」が含まれていない場合、認識制御部13は、該認識結果を採用せず破棄し、制御部14に対して出力しない。
また、音声認識部11で認識に失敗した場合、認識制御部13は何もしない。
つまり、音声認識部11から受け取った認識結果に「キーワード」と「コマンド」が含まれている場合、認識制御部13は、認識結果から「キーワード」に対応する部分を削除し、「キーワード」の後に発話された「コマンド」に対応する部分を制御部14へ出力する。一方、音声認識部11から受け取った認識結果に「キーワード」が含まれていない場合、認識制御部13は、「コマンド」に対応する認識結果をそのまま制御部14へ出力する。
また、音声認識部11で認識に失敗した場合、認識制御部13は何もしない。
車載機器1における音声認識部11,11a、判断部12、認識制御部13,13aおよび制御部14の各機能は、処理回路により実現される。すなわち、車載機器1は、車内の発話者の人数が複数か単数かを判断し、発話者の人数が複数であると判断された場合は発話開始の指示を受けた後に発話された音声の認識結果を採用し、単数であると判断された場合は発話開始の指示を受けたか否かにかかわらず発話された音声の認識結果を採用し、採用した認識結果に応じた動作を行うための処理回路を備える。処理回路は、メモリ102に格納されるプログラムを実行するプロセッサ101である。プロセッサ101は、CPU(Central Processing Unit)中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、またはDSP(Digital Signal Processor)などともいう。なお、複数のプロセッサ101により、車載機器1の各機能を実現してもよい。
Claims (4)
- 音声を認識して認識結果を出力する音声認識部と、
車内の発話者の人数が複数か単数かを判断して判断結果を出力する判断部と、
前記音声認識部および前記判断部からの出力結果に基づき、発話者の人数が複数であると判断された場合は発話開始の指示を受けた後に発話された音声の認識結果を採用し、単数であると判断された場合は発話開始の指示を受けた後に発話された音声の認識結果であっても発話開始の指示を受けていないときに発話された音声の認識結果であっても採用する認識制御部とを備える車載用音声認識装置。 - 前記判断部は、前記車内の搭乗者の人数が複数であっても発話する可能性のある人数が単数である場合、前記発話者の人数を単数と判断することを特徴とする請求項1記載の車載用音声認識装置。
- 前記判断部は、前記車内の搭乗者が起きているか寝ているかを判断し、起きている搭乗者を前記発話する可能性のある人数に数えることを特徴とする請求項2記載の車載用音声認識装置。
- 音声を認識して認識結果を出力する音声認識部と、
車内の発話者の人数が複数か単数かを判断して判断結果を出力する判断部と、
前記音声認識部および前記判断部からの出力結果に基づき、発話者の人数が複数であると判断された場合は発話開始の指示を受けた後に発話された音声の認識結果を採用し、単数であると判断された場合は発話開始の指示を受けた後に発話された音声の認識結果であっても発話開始の指示を受けていないときに発話された音声の認識結果であっても採用する認識制御部と、
前記認識制御部が採用した認識結果に応じた動作を行う制御部とを備えることを特徴とする車載機器。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/075595 WO2017042906A1 (ja) | 2015-09-09 | 2015-09-09 | 車載用音声認識装置および車載機器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6227209B2 true JP6227209B2 (ja) | 2017-11-08 |
JPWO2017042906A1 JPWO2017042906A1 (ja) | 2017-11-24 |
Family
ID=58239449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017538774A Expired - Fee Related JP6227209B2 (ja) | 2015-09-09 | 2015-09-09 | 車載用音声認識装置および車載機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180130467A1 (ja) |
JP (1) | JP6227209B2 (ja) |
CN (1) | CN107949880A (ja) |
DE (1) | DE112015006887B4 (ja) |
WO (1) | WO2017042906A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018173293A1 (ja) * | 2017-03-24 | 2018-09-27 | ヤマハ株式会社 | 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法 |
US20200411012A1 (en) * | 2017-12-25 | 2020-12-31 | Mitsubishi Electric Corporation | Speech recognition device, speech recognition system, and speech recognition method |
JP7235441B2 (ja) * | 2018-04-11 | 2023-03-08 | 株式会社Subaru | 音声認識装置及び音声認識方法 |
CN112585674B (zh) * | 2018-08-31 | 2024-08-02 | 三菱电机株式会社 | 信息处理装置、信息处理方法和存储介质 |
JP7103089B2 (ja) * | 2018-09-06 | 2022-07-20 | トヨタ自動車株式会社 | 音声対話装置、音声対話方法および音声対話プログラム |
CN109410952B (zh) * | 2018-10-26 | 2020-02-28 | 北京蓦然认知科技有限公司 | 一种语音唤醒方法、装置及系统 |
JP7023823B2 (ja) * | 2018-11-16 | 2022-02-22 | アルパイン株式会社 | 車載装置及び音声認識方法 |
CN109285547B (zh) * | 2018-12-04 | 2020-05-01 | 北京蓦然认知科技有限公司 | 一种语音唤醒方法、装置及系统 |
JP7266432B2 (ja) * | 2019-03-14 | 2023-04-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN110265010A (zh) * | 2019-06-05 | 2019-09-20 | 四川驹马科技有限公司 | 基于百度语音的货车多人语音识别方法及系统 |
JP7242873B2 (ja) * | 2019-09-05 | 2023-03-20 | 三菱電機株式会社 | 音声認識補助装置および音声認識補助方法 |
US20220415321A1 (en) * | 2021-06-25 | 2022-12-29 | Samsung Electronics Co., Ltd. | Electronic device mounted in vehicle, and method of operating the same |
WO2024070080A1 (ja) * | 2022-09-30 | 2024-04-04 | パイオニア株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4320880B2 (ja) * | 1999-12-08 | 2009-08-26 | 株式会社デンソー | 音声認識装置及び車載ナビゲーションシステム |
US6889189B2 (en) * | 2003-09-26 | 2005-05-03 | Matsushita Electric Industrial Co., Ltd. | Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations |
JP2005157086A (ja) * | 2003-11-27 | 2005-06-16 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2008250236A (ja) * | 2007-03-30 | 2008-10-16 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
US9111538B2 (en) * | 2009-09-30 | 2015-08-18 | T-Mobile Usa, Inc. | Genius button secondary commands |
DE102009051508B4 (de) * | 2009-10-30 | 2020-12-03 | Continental Automotive Gmbh | Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung |
CN101770774B (zh) * | 2009-12-31 | 2011-12-07 | 吉林大学 | 基于嵌入式的开集说话人识别方法及其系统 |
US8359020B2 (en) * | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US9159324B2 (en) * | 2011-07-01 | 2015-10-13 | Qualcomm Incorporated | Identifying people that are proximate to a mobile device user via social graphs, speech models, and user context |
JP2013080015A (ja) | 2011-09-30 | 2013-05-02 | Toshiba Corp | 音声認識装置および音声認識方法 |
CN102568478B (zh) * | 2012-02-07 | 2015-01-07 | 合一网络技术(北京)有限公司 | 一种基于语音识别的视频播放控制方法和系统 |
US9305555B2 (en) * | 2012-06-25 | 2016-04-05 | Mitsubishi Electric Corporation | Onboard information device |
CN102945671A (zh) * | 2012-10-31 | 2013-02-27 | 四川长虹电器股份有限公司 | 语音识别方法 |
CN103971685B (zh) * | 2013-01-30 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 语音命令识别方法和系统 |
US9747900B2 (en) * | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
WO2015029304A1 (ja) * | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識方法及び音声認識装置 |
CN104700832B (zh) * | 2013-12-09 | 2018-05-25 | 联发科技股份有限公司 | 语音关键字检测系统及方法 |
US9240182B2 (en) * | 2013-09-17 | 2016-01-19 | Qualcomm Incorporated | Method and apparatus for adjusting detection threshold for activating voice assistant function |
US8938394B1 (en) * | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9715875B2 (en) * | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
-
2015
- 2015-09-09 US US15/576,648 patent/US20180130467A1/en not_active Abandoned
- 2015-09-09 JP JP2017538774A patent/JP6227209B2/ja not_active Expired - Fee Related
- 2015-09-09 CN CN201580082815.1A patent/CN107949880A/zh active Pending
- 2015-09-09 DE DE112015006887.2T patent/DE112015006887B4/de not_active Expired - Fee Related
- 2015-09-09 WO PCT/JP2015/075595 patent/WO2017042906A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20180130467A1 (en) | 2018-05-10 |
CN107949880A (zh) | 2018-04-20 |
DE112015006887T5 (de) | 2018-05-24 |
WO2017042906A1 (ja) | 2017-03-16 |
JPWO2017042906A1 (ja) | 2017-11-24 |
DE112015006887B4 (de) | 2020-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6227209B2 (ja) | 車載用音声認識装置および車載機器 | |
CN106796786B (zh) | 语音识别系统 | |
EP3414759B1 (en) | Techniques for spatially selective wake-up word recognition and related systems and methods | |
JP5601419B2 (ja) | エレベーターの呼び登録装置 | |
JP5677650B2 (ja) | 音声認識装置 | |
JPWO2017145373A1 (ja) | 音声認識装置 | |
JP2002091466A (ja) | 音声認識装置 | |
JP5077107B2 (ja) | 車両用飲酒検知装置及び車両用飲酒検知方法 | |
JP2015107867A (ja) | エレベータの音声呼び登録装置 | |
JP2009015148A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2003114698A (ja) | コマンド受付装置及びプログラム | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2006208486A (ja) | 音声入力装置 | |
JP2016133378A (ja) | カーナビゲーション装置 | |
JP2018116130A (ja) | 車内音声処理装置および車内音声処理方法 | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
JP4604377B2 (ja) | 音声認識装置 | |
JP2006215317A (ja) | 音声認識システム、音声認識装置及び音声認識プログラム | |
JP3764302B2 (ja) | 音声認識装置 | |
JP2007057805A (ja) | 車両用情報処理装置 | |
JP2019132997A (ja) | 音声処理装置、方法およびプログラム | |
JP6748565B2 (ja) | 音声対話システム及び音声対話方法 | |
JP7242873B2 (ja) | 音声認識補助装置および音声認識補助方法 | |
JP2009003205A (ja) | 音声認識装置、および音声認識方法 | |
JP2006023444A (ja) | 音声対話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170726 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170726 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6227209 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |