JP7242873B2 - 音声認識補助装置および音声認識補助方法 - Google Patents
音声認識補助装置および音声認識補助方法 Download PDFInfo
- Publication number
- JP7242873B2 JP7242873B2 JP2021543881A JP2021543881A JP7242873B2 JP 7242873 B2 JP7242873 B2 JP 7242873B2 JP 2021543881 A JP2021543881 A JP 2021543881A JP 2021543881 A JP2021543881 A JP 2021543881A JP 7242873 B2 JP7242873 B2 JP 7242873B2
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- speech recognition
- voice recognition
- information
- status information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 230000008859 change Effects 0.000 claims description 58
- 238000001514 detection method Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 20
- 230000004913 activation Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
- Traffic Control Systems (AREA)
Description
図1は、実施の形態1における音声認識補助装置100の構成を示すブロック図である。
実施の形態2における音声認識補助装置および音声認識補助方法を説明する。実施の形態2は実施の形態1の下位概念であり、実施の形態2における音声認識補助装置は、実施の形態1における音声認識補助装置100の各構成を含む。なお、実施の形態1と同様の構成および動作については説明を省略する。
図6のステップS10において、開口度情報取得部11Aは、ドライバーの口の開閉度合いを示す開口度情報に代えて、ドライバーの口の開閉パターンを示す開口度情報を取得してもよい。その場合、ステップS20において、車両状況判定部30は、開口度情報取得部11Aにて取得されたドライバーの口の開閉パターンと、特定のキーフレーズが発話される際の口の開閉パターンと、に基づいて、ドライバーの口の開閉度合いおよび開口形状の時系列変化を判定する。特定のキーフレーズが発話される際の口の開閉パターンは、予め音声認識補助装置101に登録されている。ステップS30において、車両状況判定部30は、それら2つの開閉パターンが一致するか否かを判定する。開閉パターンが一致しない場合、ステップS40が実行され、一致している場合、ステップS50が実行される。このような音声認識補助装置101も、上記と同様の効果を奏する。
判定基準は、検出される搭乗者の状態ごとに、すなわち車両状況情報ごとに、予め定められたものであってもよい。その場合、車両状況情報ごとに予め定められた判定基準は、音声認識補助装置101または音声認識装置200に記憶されている。
実施の形態3における音声認識補助装置および音声認識補助方法を説明する。実施の形態3は実施の形態1の下位概念であり、実施の形態3における音声認識補助装置は、実施の形態1における音声認識補助装置100の各構成を含む。なお、実施の形態1または2と同様の構成および動作については説明を省略する。
判定基準変更部20は、車両の窓の開閉状態の情報、車両の位置および時刻の情報、車両の乗車人数の情報の全てに基づいて、判定基準を変更する制御を行う必要はなく、車両に設けられたセンサー110または車載機器120が検出できる情報の組み合わせに基づいて、その制御を行ってもよい。
実施の形態4における音声認識補助装置および音声認識補助方法を説明する。実施の形態4は実施の形態1の下位概念であり、実施の形態4における音声認識補助装置は、実施の形態1における音声認識補助装置の各構成を含む。なお、実施の形態1から3のいずれかと同様の構成および動作については説明を省略する。
実施の形態5における音声認識補助装置および音声認識補助方法を説明する。実施の形態5は実施の形態1の下位概念であり、実施の形態5における音声認識補助装置は、実施の形態1における音声認識補助装置100の各構成を含む。なお、実施の形態1から4のいずれかと同様の構成および動作については説明を省略する。
実施の形態6における音声認識補助装置および音声認識補助方法を説明する。実施の形態6は実施の形態1の下位概念であり、実施の形態6における音声認識補助装置は、実施の形態1における音声認識補助装置100の各構成を含む。なお、実施の形態1から5のいずれかと同様の構成および動作については説明を省略する。
以上の各実施の形態に示された音声認識補助装置は、ナビゲーション装置と、通信端末と、サーバと、これらにインストールされるアプリケーションの機能とを適宜に組み合わせて構築されるシステムにも適用することができる。ここで、ナビゲーション装置とは、例えば、PND(Portable Navigation Device)などを含む。通信端末とは、例えば、携帯電話、スマートフォンおよびタブレットなどの携帯端末を含む。
Claims (6)
- ユーザが発話した音声に含まれる特定のキーフレーズを検出して音声認識を開始する音声認識装置に対して、前記特定のキーフレーズを検出するための判定基準を変更する制御を行う音声認識補助装置であって、
前記ユーザである車両の搭乗者の口の動きに関する情報、または、車両状態に関する情報を含む車両状況情報を取得する車両状況情報取得部と、
前記車両状況情報に基づいて前記判定基準を変更する制御を、前記音声認識装置に対して行う判定基準変更部と、
前記音声認識装置が前記判定基準に基づいて前記特定のキーフレーズを検出した後に前記搭乗者が続けて発話した前記音声に対して前記音声認識を開始した回数である音声認識回数を、前記車両状況情報取得部にて取得された前記車両状況情報ごとに記憶する履歴情報記憶部と、を備え、
前記判定基準変更部は、
前記履歴情報記憶部に記憶されている前記音声認識回数のうち、前記車両状況情報取得部で取得された前記車両状況情報に対応する前記音声認識回数が予め定められた回数以上である場合に、前記判定基準を緩和する音声認識補助装置。 - ユーザが発話した音声に含まれる特定のキーフレーズを検出して音声認識を開始する音声認識装置に対して、前記特定のキーフレーズを検出するための判定基準を変更する制御を行う音声認識補助装置であって、
前記ユーザである車両の搭乗者の口の動きに関する情報、または、車両状態に関する情報を含む車両状況情報を取得する車両状況情報取得部と、
前記車両状況情報に基づいて前記判定基準を変更する制御を、前記音声認識装置に対して行う判定基準変更部と、
前記車両状況情報に基づいて、前記特定のキーフレーズの検出を省略して前記音声認識を開始する制御を、前記音声認識装置に対して行うキーフレーズ省略判定部と、
前記音声認識装置が前記判定基準に基づいて前記特定のキーフレーズを検出した後に前記搭乗者が続けて発話した前記音声に対して前記音声認識を開始した回数である音声認識回数を、前記車両状況情報取得部にて取得された前記車両状況情報ごとに記憶する履歴情報記憶部と、を備え、
前記判定基準変更部は、
前記履歴情報記憶部に記憶されている前記音声認識回数のうち、前記車両状況情報取得部で取得された前記車両状況情報に対応する前記音声認識回数が予め定められた回数以上である場合に、前記判定基準を緩和する音声認識補助装置。 - 前記車両状況情報取得部は、
前記車両に設けられたセンサーによって検出される前記車両状況情報のうち、前記車両の前記搭乗者の前記口の動きに関する前記情報を取得する搭乗者情報取得部を含み、
前記搭乗者の前記口の動きに関する前記情報は、前記搭乗者の前記口の開閉度、または、前記口の開閉パターンの情報を含む、請求項1または請求項2に記載の音声認識補助装置。 - 前記車両状況情報取得部は、
前記車両に設けられたセンサーまたは車載機器によって検出される前記車両状況情報のうち、前記車両状態に関する前記情報を取得する車両情報取得部を含み、
前記車両状態の前記情報は、前記車両の窓の開閉状態の情報、前記車両の位置と時刻との情報、または、前記車両の乗車人数の情報を含む、請求項1または請求項2に記載の音声認識補助装置。 - ユーザが発話した音声に含まれる特定のキーフレーズを検出して音声認識を開始する音声認識装置に対して、前記特定のキーフレーズを検出するための判定基準を変更する制御を行う音声認識補助方法であって、
前記ユーザである車両の搭乗者の口の動きに関する情報、または、車両状態に関する情報を含む車両状況情報を取得し、
前記車両状況情報に基づいて前記判定基準を変更する制御を、前記音声認識装置に対して行い、
前記音声認識装置が前記判定基準に基づいて前記特定のキーフレーズを検出した後に前記搭乗者が続けて発話した前記音声に対して前記音声認識を開始した回数である音声認識回数を、取得された前記車両状況情報ごとに記憶し、
記憶されている前記音声認識回数のうち、取得された前記車両状況情報に対応する前記音声認識回数が予め定められた回数以上である場合に、前記判定基準を緩和する、音声認識補助方法。 - ユーザが発話した音声に含まれる特定のキーフレーズを検出して音声認識を開始する音声認識装置に対して、前記特定のキーフレーズを検出するための判定基準を変更する制御を行う音声認識補助方法であって、
前記ユーザである車両の搭乗者の口の動きに関する情報、または、車両状態に関する情報を含む車両状況情報を取得し、
前記車両状況情報に基づいて前記判定基準を変更する制御を、前記音声認識装置に対して行い、
前記車両状況情報に基づいて、前記特定のキーフレーズの検出を省略して前記音声認識を開始する制御を、前記音声認識装置に対して行い、
前記音声認識装置が前記判定基準に基づいて前記特定のキーフレーズを検出した後に前記搭乗者が続けて発話した前記音声に対して前記音声認識を開始した回数である音声認識回数を、取得された前記車両状況情報ごとに記憶し、
記憶されている前記音声認識回数のうち、取得された前記車両状況情報に対応する前記音声認識回数が予め定められた回数以上である場合に、前記判定基準を緩和する、音声認識補助方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/034922 WO2021044569A1 (ja) | 2019-09-05 | 2019-09-05 | 音声認識補助装置および音声認識補助方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021044569A1 JPWO2021044569A1 (ja) | 2021-12-09 |
JP7242873B2 true JP7242873B2 (ja) | 2023-03-20 |
Family
ID=74853305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021543881A Active JP7242873B2 (ja) | 2019-09-05 | 2019-09-05 | 音声認識補助装置および音声認識補助方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7242873B2 (ja) |
WO (1) | WO2021044569A1 (ja) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001075595A (ja) | 1999-09-02 | 2001-03-23 | Honda Motor Co Ltd | 車載用音声認識装置 |
JP2004245938A (ja) | 2003-02-12 | 2004-09-02 | Fujitsu Ten Ltd | 音声認識装置及びプログラム |
JP2011081541A (ja) | 2009-10-06 | 2011-04-21 | Canon Inc | 入力装置及びその制御方法 |
WO2014025012A1 (ja) | 2012-08-10 | 2014-02-13 | 株式会社ホンダアクセス | 音声認識方法及び音声認識装置 |
JP2015219440A (ja) | 2014-05-20 | 2015-12-07 | パナソニックIpマネジメント株式会社 | 操作補助装置および操作補助方法 |
JP2017037176A (ja) | 2015-08-10 | 2017-02-16 | クラリオン株式会社 | 音声操作システム、サーバー装置、車載機器および音声操作方法 |
WO2017042906A1 (ja) | 2015-09-09 | 2017-03-16 | 三菱電機株式会社 | 車載用音声認識装置および車載機器 |
JP2018072599A (ja) | 2016-10-31 | 2018-05-10 | アルパイン株式会社 | 音声認識装置および音声認識方法 |
WO2019176252A1 (ja) | 2018-03-13 | 2019-09-19 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
-
2019
- 2019-09-05 JP JP2021543881A patent/JP7242873B2/ja active Active
- 2019-09-05 WO PCT/JP2019/034922 patent/WO2021044569A1/ja active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001075595A (ja) | 1999-09-02 | 2001-03-23 | Honda Motor Co Ltd | 車載用音声認識装置 |
JP2004245938A (ja) | 2003-02-12 | 2004-09-02 | Fujitsu Ten Ltd | 音声認識装置及びプログラム |
JP2011081541A (ja) | 2009-10-06 | 2011-04-21 | Canon Inc | 入力装置及びその制御方法 |
WO2014025012A1 (ja) | 2012-08-10 | 2014-02-13 | 株式会社ホンダアクセス | 音声認識方法及び音声認識装置 |
JP2015219440A (ja) | 2014-05-20 | 2015-12-07 | パナソニックIpマネジメント株式会社 | 操作補助装置および操作補助方法 |
JP2017037176A (ja) | 2015-08-10 | 2017-02-16 | クラリオン株式会社 | 音声操作システム、サーバー装置、車載機器および音声操作方法 |
WO2017042906A1 (ja) | 2015-09-09 | 2017-03-16 | 三菱電機株式会社 | 車載用音声認識装置および車載機器 |
JP2018072599A (ja) | 2016-10-31 | 2018-05-10 | アルパイン株式会社 | 音声認識装置および音声認識方法 |
WO2019176252A1 (ja) | 2018-03-13 | 2019-09-19 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021044569A1 (ja) | 2021-12-09 |
WO2021044569A1 (ja) | 2021-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3414759B1 (en) | Techniques for spatially selective wake-up word recognition and related systems and methods | |
US7050550B2 (en) | Method for the training or adaptation of a speech recognition device | |
JP6227209B2 (ja) | 車載用音声認識装置および車載機器 | |
EP1933303B1 (en) | Speech dialog control based on signal pre-processing | |
JP2002091466A (ja) | 音声認識装置 | |
JP6350903B2 (ja) | 操作補助装置および操作補助方法 | |
JP2012128440A (ja) | 音声対話装置 | |
JP6767082B2 (ja) | 車内通話制御装置、車内通話システムおよび車内通話制御方法 | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
CN112585674B (zh) | 信息处理装置、信息处理方法和存储介质 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2008026463A (ja) | 音声対話装置 | |
JP6827536B2 (ja) | 音声認識装置および音声認識方法 | |
JP2016133378A (ja) | カーナビゲーション装置 | |
JP7242873B2 (ja) | 音声認識補助装置および音声認識補助方法 | |
JP3916861B2 (ja) | 音声認識装置 | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
JP4026198B2 (ja) | 音声認識装置 | |
JP2004318026A (ja) | セキュリティペットロボット及びその装置に関する信号処理方法 | |
JP6748565B2 (ja) | 音声対話システム及び音声対話方法 | |
JP2004184803A (ja) | 車両用音声認識装置 | |
JP2020091435A (ja) | 音声認識システム、音声認識システムの通知方法、プログラム、及び移動体搭載機器 | |
JP7449070B2 (ja) | 音声入力装置、音声入力方法及びそのプログラム | |
JP2019191477A (ja) | 音声認識装置及び音声認識方法 | |
JP7429107B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220817 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230118 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230118 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230126 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7242873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |