JP2009069707A - 車両用音声認識装置 - Google Patents

車両用音声認識装置 Download PDF

Info

Publication number
JP2009069707A
JP2009069707A JP2007240315A JP2007240315A JP2009069707A JP 2009069707 A JP2009069707 A JP 2009069707A JP 2007240315 A JP2007240315 A JP 2007240315A JP 2007240315 A JP2007240315 A JP 2007240315A JP 2009069707 A JP2009069707 A JP 2009069707A
Authority
JP
Japan
Prior art keywords
level
noise level
utterance
voice
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007240315A
Other languages
English (en)
Other versions
JP4873177B2 (ja
Inventor
Takeshi Ejiri
剛士 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Seiki Co Ltd
Original Assignee
Nippon Seiki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Seiki Co Ltd filed Critical Nippon Seiki Co Ltd
Priority to JP2007240315A priority Critical patent/JP4873177B2/ja
Publication of JP2009069707A publication Critical patent/JP2009069707A/ja
Application granted granted Critical
Publication of JP4873177B2 publication Critical patent/JP4873177B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 予測雑音レベル及び推奨発声レベルを表示することにより、認識率向上に繋がる行動を起こすための判断がし易い音声認識装置を提供する。
【解決手段】 車両情報入力部4は、車両の走行情報を入力する。音声レベル検出部2は、音声入力部1が出力した音声データから発声レベルL1及び雑音レベルL3を検出する。音声認識部3は、音声データに基づいて音声認識を行う。表示部6は、音声認識部3による認識結果Rと発声レベルL1及び雑音レベルL3とを表示する。る制御部5は、車両情報入力部4からの前記走行情報に基づいて決定された予測雑音レベルL4及び推奨発声レベルL2を表示部6に表示させる。
【選択図】 図1

Description

本発明は、音声入力による音声認識機能を備えた車両用音声認識装置に関するものであり、特に、音声認識機能の作動状況について表示できる車両用音声認識装置に関するものである。
従来より、音声認識時の入力音声に関する情報を提供する音声認識装置が知られており、例えば特許文献1,特許文献2及び特許文献3に開示されている。
特許文献1には、音声を入力したとき、使用者の発声の仕方や音声環境が誤認識を引き起こすものであるかどうかを、誤認識の原因ごとに区別して使用者に通知する音声認識装置が開示されている。
特許文献2には、音声認識の正確さを示す尤度を表示することにより、入力された音声が、音声認識される単語に比してどの程度類似していたのか判断できる音声認識装置が開示されている。
特許文献3には、入力音声内の雑音レベルと発声レベルとを切り分け、入力された音声と音声認識の動作基準となる音声レベルを可視的に表示する音声認識装置が開示されている。
特開2007−156076 特開2002−215188 特開2000−209309
しかしながら、特許文献1に開示された音声認識装置では、過大な入力音声レベルや雑音レベルによって認識結果に影響を与えたと推定された内容をメッセージで通知するが、どの程度の影響があるのかが使用者に分かり難いという問題を有している。また、特許文献2に開示された音声認識装置では、認識結果の尤度を使用者に通知するが、その通知内容がどの程度良いのかまたは悪いのかが分かり難いという問題を有している。
また、文献3に開示された音声認識装置では、発声レベルと雑音レベルを並べて可視的に表示するが、車両内環境では走行による車外からの雑音とエアコンや乗員などによる車内からの雑音が存在するため、背景雑音の支配的な要因がロードノイズによるものなのか、或いはそれ以外の要因によるものであるのかが分かり難いという問題を有している。
本発明は、これらの問題に鑑みなされたものであり、予測雑音レベル及び推奨発声レベルを表示することにより、認識率向上に繋がる行動を起こすための判断がし易い音声認識装置を提供するものである。
本発明は、請求項1に記載したように、車両の走行情報を入力する車両情報入力部4と、音声を入力する音声入力部1と、前記音声入力部1が出力した音声データから発声レベルL1及び雑音レベルL3を検出する音声レベル検出部2と、前記音声データに基づいて音声認識を行う音声認識部3と、前記音声認識部3による認識結果Rと前記発声レベルL1及び前記雑音レベルL3とを表示する表示部6と、前記車両情報入力部4からの前記走行情報に基づいて決定された予測雑音レベルL4及び推奨発声レベルL2を前記表示部6に表示させる制御部5と、を備えたものである。
また、本発明は、請求項2に記載したように、前記制御部5は、前記雑音レベルL3と前記予測雑音レベルL4とを比較し、前記雑音レベルL3及び前記予測雑音レベルL4の大きい方を前記推奨発声レベルL2にするものである。
また、本発明は、請求項3に記載したように、前記制御部5は、前記発声レベルL1が前記推奨発声レベルL2より大きい場合と、前記発声レベルL1が前記推奨発声レベルL2より小さい場合とで、前記表示部6に表示させる前記発声レベルL1の表示形態を変化させるものである。
また、本発明は、請求項4に記載したように、前記制御部5は、前記雑音レベルL3が前記予測雑音レベルL4より大きい場合と、前記雑音レベルL3が前記予測雑音レベルL4より小さい場合とで、前記表示部6に表示させる発声レベルL1の表示形態を変化させるものである。
また、本発明は、請求項5に記載したように、前記制御部5は、前記雑音レベルL3が前記予測雑音レベルL4を上回ったとき、前記表示部6に表示させる前記雑音レベルL3の変動を所定時間停止させるものである。
また、本発明は、請求項6に記載したように、前記制御部5は、前記音声認識部3による前記認識結果の算出後に、音声認識の正確さを示す尤度値L5と、所定の閾値L6とを前記表示部6に表示させるものである。
また、本発明は、請求項7に記載したように、前記制御部5は、前記尤度値L5が前記閾値L6より大きい場合と、前記尤度値L5が前記閾値L6より小さい場合とで、前記表示部6に表示させる前記尤度値L5の表示形態を変化させるものである。
表示部に予測雑音レベル及び推奨発声レベルを表示させことにより、使用者が認識率向上に繋がる行動を起こすための判断が可能である。
以下、添付図面に基づいて、本発明の一実施形態を説明する。
車両用音声認識装置は、音声入力部1,音声レベル検出部2,音声認識部3,車両情報入力部4,制御部5,表示部6から構成されている。
音声入力部1はマイクロフォンからなるものであり、この音声入力部1は音声レベル検出部2及び音声認識部3に音声データを出力する。音声レベル検出部2は、音声入力部1から入力した音声データから発声レベルL1と雑音レベルL3とを分析し、雑音レベルデータ及び発声レベルデータを制御部5に出力する。音声認識部3は、音声入力部1から入力した音声データの処理を行い、予め設定されている認識対象ワードの中から入力音声に最も近いワードと認識処理の正確さを示す尤度値L5を認識結果として制御部5に出力する。
車両情報入力部4は、音声入力期間中の車速情報からロードノイズによる背景雑音の予測値を予測雑音レベルL4として算出し、予測雑音レベルデータを制御部5に出力する。車両情報入力部4が出力する予測雑音レベルL4は、車速に対する各車種固有のロードノイズによる雑音の大きさであり、車種別のロードノイズ特性に応じて算出される。制御部5は、音声認識結果Rと共に、音声レベル検出部2,音声認識部3,車両情報入力部4から入力した各データに基づいて決定した表示内容を表示部6に表示させる。
図2乃至図5は、表示部6による表示内容を示すものである。表示部6は、発声レベル表示エリア6a,背景雑音表示エリア6b,尤度表示エリア6cを有している。
発声レベル表示エリア6aは、連続的に変化する発声レベルL1と、推奨発声レベルL2とを表示する。発声レベルL1が推奨発声レベルL2より上回っているときは、発声レベルL1を緑色にて表示する(図2参照)。発声レベルL1が推奨発声レベルL2より下回ったときは、発話音声レベルL1を橙色にて表示する(図3参照)。また、発声レベルL1が、最大入力レベルを上回ったときも、発声レベルL1を橙色にて表示する。
背景雑音表示エリア6bは、連続的に変化する雑音レベルL3と、車速から算出した予測雑音レベルL4とを表示する。雑音レベルL3が予測雑音レベルL4より下回っているときは、雑音レベルL3を緑色にて表示する(図2参照)。雑音レベルL3が、予測雑音レベルL4より上回ったときは、雑音レベルL3を橙色にて表示する(図3参照)。雑音レベルL3が、予測雑音レベルL4を上回ったとき、表示部6の背景雑音表示エリア6bに表示させる雑音レベルL3の変動を所定時間(例えば1秒間)停止する。
尤度表示エリア6cは、認識結果算出後において、算出された尤度値L5と、予め設定された尤度の閾値L6とを表示する。尤度値L5が閾値L6を上回っているときは、尤度値L5を青色で表示する(図4参照)。尤度値L5が閾値L6を下回ったときは、尤度値を橙色で表示する(図5参照)。
図6及び図7は、制御部5における表示内容決定方法を示すフローチャートである。
音声入力開始後、入力音声の雑音レベルL3と発声レベルL1を検出する(ステップS1)。このステップS1と同時に、車速から予測雑音レベルL4を算出し、表示部6の背景雑音表示エリア6bに予測雑音レベルL4を表示させる(ステップS2,S3)。
次に、雑音レベルL3と予測雑音レベルL4とを比較する(ステップS4)。雑音レベルL3が予測雑音レベルL4よりも大きい場合は、表示部6の発声レベル表示エリア6aに雑音レベルL3と同値の推奨発声レベルL2を表示させると共に、表示部6の背景雑音表示エリア6bに雑音レベルL3を橙色にて表示させる(ステップS5,S6)。雑音レベルL3が予測雑音レベルL4以下である場合は、表示部6の発生レベル表示エリア6aに予測雑音レベルL4と同値の推奨発声レベルL2を表示させると共に、表示部6の背景雑音表示エリア6bに雑音レベルL3を緑色にて表示させる(ステップS7,S8)。なお、ステップS6,S8にて、雑音レベルL3の表示色を変化させた場合、変化させた状態で一定時間表示を更新させない。
次に、発声レベルL1が推奨発声レベルL2を下回っているか判断し(ステップS9)、発声レベルL1が推奨発声レベルL2を下回っている場合は、表示部6の発声レベル表示エリア6aに発声レベルL1を橙色にて表示させる(ステップS10)。発声レベルL1が推奨発声レベルL2以上の場合は、発声レベルL1が最大入力レベルを上回っているか判断し(ステップS11)、発声レベルL1が最大入力レベルを上回っている場合は、表示部6の発声レベル表示エリア6aに発声レベルL1を赤色にて表示させる(ステップS12)。発声レベルL1が最大入力レベル以下である場合は、表示部6の発声レベル表示エリア6aに発声レベルL1を緑色にて表示させる(ステップS13)。
次に、音声入力が続行しているか判断し(ステップS14)、音声入力が続いている場合は、ステップ1に戻る。音声入力が終了している場合は、表示更新を終了する。
本実施形態によれば、走行中の音声認識操作において、走行によって発生するロードノイズによる背景雑音を予測した予測雑音レベルL2を雑音レベルL1に重ねて表示することによってその差を比較しやすくなり、ロードノイズ以外の背景雑音源の影響を少なくして認識率を高めるためにエアコンの風量を下げるなどの認識率向上に繋がる行動を起こすための判断がし易くなる。
また、雑音レベルL3以上に認識させたい音声を入力できるように、検出された雑音レベルL3と予測雑音レベルL4の大きな方を推奨発声レベルL2として発声レベルL1と重ねて表示することにより、使用者が発声した音声の大きさが音声認識機能を正しく動作させるために必要な大きさであるかを確認し易くすることができる。
なお、表示部6の表示内容は、車両運転中の使用者にメータ内ディスプレイやHUDなどのドライバー正面に位置する表示で提供することにより、安全に音声認識機能を利用することができる。
本発明の実施形態を示すブロック図。 同上実施形態を示す表示例の説明図。 同上実施形態を示す表示例の説明図。 同上実施形態を示す表示例の説明図。 同上実施形態を示す表示例の説明図。 同上実施形態を示すフロー図。 同上実施形態を示すフロー図。
符号の説明
1 音声入力部
2 音声レベル検出部
3 音声認識部
4 車両情報入力部
5 制御部
6 表示部
6a 発声レベル表示エリア
6b 背景雑音表示エリア
6c 尤度表示エリア
L1 発声レベル
L2 推奨発声レベル
L3 雑音レベル
L4 予測雑音レベル
L5 尤度値
L6 閾値

Claims (7)

  1. 車両の走行情報を入力する車両情報入力部と、音声を入力する音声入力部と、前記音声入力部が出力した音声データから発声レベル及び雑音レベルを検出する音声レベル検出部と、前記音声データに基づいて音声認識を行う音声認識部と、前記音声認識部による認識結果と前記発声レベル及び前記雑音レベルとを表示する表示部と、前記車両情報入力部からの前記走行情報に基づいて決定された予測雑音レベル及び推奨発声レベルを前記表示部に表示させる制御部と、を備えたことを特徴とする車両用音声認識装置。
  2. 前記制御部は、前記雑音レベルと前記予測雑音レベルとを比較し、前記雑音レベル及び前記予測雑音レベルの大きい方を前記推奨発声レベルにすることを特徴とする請求項1に記載の車両用音声認識装置。
  3. 前記制御部は、前記発声レベルが前記推奨発声レベルより大きい場合と、前記発声レベルが前記推奨発声レベルより小さい場合とで、前記表示部に表示させる前記発声レベルの表示形態を変化させることを特徴とする請求項1に記載の車両用音声認識装置。
  4. 前記制御部は、前記雑音レベルが前記予測雑音レベルより大きい場合と、前記雑音レベルが前記予測雑音レベルより小さい場合とで、前記表示部に表示させる発声レベルの表示形態を変化させることを特徴とする請求項1に記載の車両用音声認識装置。
  5. 前記制御部は、前記雑音レベルが前記予測雑音レベルを上回ったとき、前記表示部に表示させる前記雑音レベルの変動を所定時間停止させることを特徴とする請求項1に記載の車両用音声認識装置。
  6. 前記制御部は、前記音声認識部による前記認識結果の算出後に、音声認識の正確さを示す尤度値と、所定の閾値とを前記表示部に表示させることを特徴とする請求項1に記載の車両用音声認識装置。
  7. 前記制御部は、前記尤度値が前記閾値レベルより大きい場合と、前記尤度値が前記閾値より小さい場合とで、前記表示部に表示させる前記尤度値の表示形態を変化させることを特徴とする請求項6に記載の車両用音声認識装置。
JP2007240315A 2007-09-17 2007-09-17 車両用音声認識装置 Expired - Fee Related JP4873177B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007240315A JP4873177B2 (ja) 2007-09-17 2007-09-17 車両用音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007240315A JP4873177B2 (ja) 2007-09-17 2007-09-17 車両用音声認識装置

Publications (2)

Publication Number Publication Date
JP2009069707A true JP2009069707A (ja) 2009-04-02
JP4873177B2 JP4873177B2 (ja) 2012-02-08

Family

ID=40605988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007240315A Expired - Fee Related JP4873177B2 (ja) 2007-09-17 2007-09-17 車両用音声認識装置

Country Status (1)

Country Link
JP (1) JP4873177B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016103809A1 (ja) * 2014-12-25 2016-06-30 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN109920410A (zh) * 2017-12-11 2019-06-21 现代自动车株式会社 用于基于车辆的环境确定推荐的可靠性的装置和方法
WO2019142418A1 (ja) * 2018-01-22 2019-07-25 ソニー株式会社 情報処理装置および情報処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JPH09146586A (ja) * 1995-11-20 1997-06-06 Sony Corp 音声認識装置
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JPH09146586A (ja) * 1995-11-20 1997-06-06 Sony Corp 音声認識装置
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016103809A1 (ja) * 2014-12-25 2016-06-30 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN107112018A (zh) * 2014-12-25 2017-08-29 索尼公司 信息处理装置、信息处理方法和程序
JPWO2016103809A1 (ja) * 2014-12-25 2017-10-05 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US20170345423A1 (en) * 2014-12-25 2017-11-30 Sony Corporation Information processing device, method of information processing, and program
US10720154B2 (en) 2014-12-25 2020-07-21 Sony Corporation Information processing device and method for determining whether a state of collected sound data is suitable for speech recognition
CN109920410A (zh) * 2017-12-11 2019-06-21 现代自动车株式会社 用于基于车辆的环境确定推荐的可靠性的装置和方法
CN109920410B (zh) * 2017-12-11 2023-09-26 现代自动车株式会社 用于基于车辆的环境确定推荐的可靠性的装置和方法
WO2019142418A1 (ja) * 2018-01-22 2019-07-25 ソニー株式会社 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
JP4873177B2 (ja) 2012-02-08

Similar Documents

Publication Publication Date Title
EP2051241B1 (en) Speech dialog system with play back of speech output adapted to the user
US11189274B2 (en) Dialog processing system, vehicle having the same, dialog processing method
JP6361565B2 (ja) 車載機器の動作制御装置
JP6075577B2 (ja) 運転支援装置
JP4873177B2 (ja) 車両用音声認識装置
JP2014000882A (ja) 車両用走行制御装置
WO2017051676A1 (ja) 危険度指標変換装置
JP6512174B2 (ja) 車載警告システム
WO2017154358A1 (ja) 音声認識装置、音声認識プログラム
JP4770374B2 (ja) 音声認識装置
JP7294775B2 (ja) 情報処理装置、プログラム、及び制御方法
WO2020079755A1 (ja) 情報提供装置及び情報提供方法
JP5157596B2 (ja) 音声認識装置
JP6722409B2 (ja) 運転支援装置
JP2011232637A (ja) 車両の制御装置
JP6596771B2 (ja) 情報提供装置および情報提供方法
CN114834456A (zh) 向车辆的驾驶员提供辅助信息的方法和装置
JP6610445B2 (ja) 車両用運転支援システム及び運転支援方法
JP2002149191A (ja) 音声入力装置
JP6708531B2 (ja) 音声対話装置、音声対話方法および音声対話プログラム
JP2018169806A (ja) 運転支援装置
JPH10203197A (ja) 車両用運転状況監視装置
JP2003029785A (ja) 音声認識装置
JP2005053331A (ja) 車載機器用情報提示装置
JP2017146531A (ja) 音声案内システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100818

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4873177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees