JP6451606B2 - 車両用音声認識装置 - Google Patents

車両用音声認識装置 Download PDF

Info

Publication number
JP6451606B2
JP6451606B2 JP2015230310A JP2015230310A JP6451606B2 JP 6451606 B2 JP6451606 B2 JP 6451606B2 JP 2015230310 A JP2015230310 A JP 2015230310A JP 2015230310 A JP2015230310 A JP 2015230310A JP 6451606 B2 JP6451606 B2 JP 6451606B2
Authority
JP
Japan
Prior art keywords
frequency
voice
vehicle
sound
occupant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015230310A
Other languages
English (en)
Other versions
JP2017097206A (ja
Inventor
貴行 森谷
貴行 森谷
康隆 大坪
康隆 大坪
剛 有永
剛 有永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mazda Motor Corp
Original Assignee
Mazda Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mazda Motor Corp filed Critical Mazda Motor Corp
Priority to JP2015230310A priority Critical patent/JP6451606B2/ja
Publication of JP2017097206A publication Critical patent/JP2017097206A/ja
Application granted granted Critical
Publication of JP6451606B2 publication Critical patent/JP6451606B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

本発明は、車両内において乗員の発する音声を認識するための車両用音声認識装置に関するものである。
従来から、自動車等の車両においては、乗員(特にドライバ)の発する音声を認識するための車両用音声認識装置が、各種装置に利用されている。例えば、カーナビゲーション装置においては、ドライバが音声として発した命令(目的地)を認識することによって、命令通りの目的地への案内が実行されるようになっている。
このような車両用音声認識装置においては、車内で取得される音からロードノイズや風切音等の雑音を適切に取り除いて、乗員の発する音声を正確に認識する必要がある。例えば、特許文献1には、車両用音声認識装置において、車内音に含まれる定常ノイズ量の大きさにしたがって、車内音に定常ノイズを加えるか否かを変更することにより、音声認識の精度を高めた発明が開示されている。
特開2005−352397
このように、車両用音声認識装置においては、様々な雑音を含む車内音の中から、乗員の音声を正確に認識することが強く求められている。また、このような音声認識は、音声認識の対象となる乗員(ドライバ)が変わった場合でも正確に行われる必要があるが、所定のフィルタをかけただけでは、音声認識すべき乗員の変更に適切に対応することは難しかった。
本発明は、以上のような事情を勘案してなされたもので、その目的は、車両において乗員(特にドライバ)の発する音声を認識するための車両用音声認識装置において、より高精度な音声認識を行い得るようにした車両用音声認識装置を提供することである。
前記目的を達成するため、本発明にあっては、次のような解決方法を採択している。すなわち、請求項1に記載のように、
車両における乗員の音声を認識するための音声認識手段を備えた車両用音声認識装置において、
前記車両内の状態を撮影する撮像手段と、
前記車両内の音を取得する車内音取得手段と、
前記撮像手段によって撮影された映像から、音声認識の対象となる対象乗員が音声を発していることを検出する映像分析手段と、
前記映像分析手段により前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数に基づいて、前記対象乗員の発した音声周波数である対象乗員音声周波数を学習する周波数学習手段と、
前記車両内の音の周波数から前記対象乗員音声周波数以外の周波数をフィルタリングするフィルタリング手段と
を備え、前記音声認識手段は、前記フィルタリング手段によりフィルタリングされた後の前記車両内の音に基づいて、前記対象乗員の音声認識を行い、
前記撮像手段は、前記対象乗員を含む複数の乗員の状態を撮影可能であり、
前記車内音取得手段は、前記対象乗員以外の乗員よりも前記対象乗員に近接して設置されており、
前記周波数学習手段は、前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数の中で音圧が所定値よりも大きな周波数を前記対象乗員音声周波数と判別して学習するようにしている。
上記解決手法によれば、撮像手段により対象乗員(例えばドライバ)が音声を発していることが検出されたタイミングで現れた車両内の音の周波数に基づいて、対象乗員音声周波数の学習がなされるので、対象乗員が音声を発した正確なタイミングで対象乗員音声周波数の学習を行うことができ、音声認識の精度が向上する。また、対象乗員音声周波数以外の周波数がフィルタリングされるので、対象乗員が変わった場合でも、適切な音声認識を行える。また、撮像手段としては、例えばドライバモニタ装置に備えられた撮像手段を利用することができるので、音声認識装置は、最小限の設備の追加で構成し得る。また、複数の乗員が音声を発している場合でも、複雑になり過ぎない処理により、対象乗員音声周波数を取り出して学習することができる。
上記解決手法を前提とした好ましい態様は、特許請求の範囲における請求項2以下に記載の通りである。すなわち、前記周波数学習手段は、前記映像分析手段により前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数を、前記対象乗員音声周波数として学習する(請求項2対応)。この場合、対象乗員が音声を発したタイミングで新たに現れる車内音が対象乗員音声周波数として学習されるので、対象乗員音声周波数の適切な学習を、複雑になり過ぎない処理により高精度で達成できる。
前記周波数学習手段は、前記対象乗員が音声を発する度に学習された前記対象乗員音声周波数を記憶しておき、次回以降に前記対象乗員が音声を発した際の音声認識において利用する(請求項3対応)。この場合、対象乗員音声周波数の学習が上手くできなかった場合でも、事前に記憶されている対象乗員音声周波数を用いて、適切な音声認識を行うことができる。
本発明によれば、撮像手段により対象乗員が音声を発したことが検出されたタイミングで、対象乗員音声周波数の学習がなされるので、正確なタイミングで対象乗員音声周波数の学習を行うことができ、高精度の音声認識を達成できる。また、複数の乗員が話しているときでも、音声認識の対象となる乗員の音声を適切に認識できる。
本発明の車両用音声認識装置の一例を示すブロック構成図。 本発明の車両用音声認識処理の一例の処理手順を示すフローチャート。
以下、添付図面に基づいて本発明の実施形態について説明する。
図1には、本発明の一実施形態における車両用音声認識装置をブロック図で示す。図示されるように、音声認識装置は、撮像装置1と、車内音取得装置2と、処理装置3とを備えている。
撮像装置1は、車両の内部の状態を撮影するための撮像手段であり、例えばCCDカメラ等から構成される。本実施形態において、撮像装置1は、ドライバの顔の表情を撮影できるとともに、ドライバ以外の各乗員の顔の表情も撮影できるようになっている。なお、撮像装置1としては、ドライバの居眠り防止等に用いられるドライバモニタ装置における撮像装置を利用するようにしてもよい。
車内音取得装置2は、車両内における各種の音を取得する装置である。撮像装置1で撮影された映像データと、車内音取得装置2で取得された車内音データは、処理装置3に送信され、処理装置3内で処理されるようになっている。
処理装置3には、映像分析手段4と、周波数学習手段5と、フィルタリング手段6と、音声認識手段7とが備えられている。
映像分析手段4は、撮像手段1により撮影された映像データを分析する手段であり、各乗員の口元の動きから乗員の各々が音声を発していることを検出し、各乗員が音声を発しているタイミングを、検出結果として周波数学習手段5に与える。
周波数学習手段5は、車内音取得装置2からの車内音データを受け取り、車内音データの周波数分析を行う手段である。周波数学習手段5は、映像分析手段4から受け取った検出結果に基づいて、音声認識の対象となる対象乗員(本実施形態ではドライバ)が発したと考えられる対象乗員音声周波数(ドライバ音声周波数)を学習する。
この場合、音声を発しているのがドライバだけである場合には、車内音の周波数のうちで、ドライバが音声を発しているタイミングで新たに現れてきた周波数を、ドライバ音声周波数として学習する。
一方、ドライバが音声を発している間に、ドライバ以外の乗員も音声を発していると検出されたときには、ドライバが音声を発しているタイミングで新たに現れてきた周波数(全乗員音声周波数)を更に分析することにより、全乗員音声周波数から、ドライバ音声周波数を取り出すようにする。
具体的には、映像分析手段4から受け取った各乗員の音声を発したタイミングと全乗員音声周波数を比較対照することにより、ドライバ音声周波数を判別する。この場合、例えば、ドライバのみが音声を発しているときに取得される周波数は、ドライバ音声周波数であると判断できるし、ドライバ以外の乗員が音声を発しているときのみに取得される周波数は、ドライバ音声周波数ではないと判断できることになる。
また、複数の乗員が音声を発しているときのドライバ音声周波数判別のための他の手法としては、車内音取得装置2を、ドライバ以外の乗員よりもドライバに近接して設置しておくとともに、全乗員音声周波数の中で、音圧が所定値よりも大きな周波数をドライバ音声周波数と判別することもできる。
フィルタリング手段6は、車内音から音声認識すべき周波数(すなわち、ドライバ音声周波数)を取り出す手段であり、車内音取得装置2により取得された車内音の周波数から、ドライバ音声周波数以外の周波数をフィルタリング(除外)する。音声認識手段7は、フィルタリング手段6から、フィルタリング後の車内音データ(したがって、ドライバ音声周波数のみを含むデータ)を受け取り、このフィルタリング後の車内音データを処理することにより、ドライバの音声認識を行う。
なお、周波数学習手段6は、学習したドライバ音声周波数を記憶しておき、次回以降にドライバが音声を発した際の音声認識に利用するようにしてもよい。これにより、ドライバ音声周波数の学習が上手くできなかった場合でも、事前に記憶されているドライバ音声周波数を用いて、適切な音声認識を行うことができる。
次に、図2のフローチャートを用いて、本実施形態の車両用音声認識装置による処理手順を説明する。
音声認識処理においては、まずステップS1において、音取得装置2により車室内の音を取得し、ステップS2において、撮像装置1により車室内の乗員の状態を検出する。
続くステップS3においては、撮像装置1からの映像データに基づいて、映像分析装置1によりドライバ(対象乗員)が音声を発しているか否かの判断がなされ、ドライバが音声を発していないと判定されたならば、そのまま、1サイクルの処理を終了する。
一方、ステップS3においてドライバが音声を発していると判定されたならば、ステップS4に進み、音声を発しているのはドライバだけであるか否かの判断がなされ、音声を発しているのがドライバだけであると判定されたならば、ステップS5に進む。ステップS5においては、ドライバが音声を発したタイミングで現れた車内音周波数を、ドライバ音声周波数であると学習し、ステップS8に進む。
ステップS4において、音声を発しているのがドライバだけではないと判定されたならば、ステップS6に進み、乗員が音声を発したタイミングで現れた音声周波数を全乗員音声周波数と判別する。続くステップS7においては、全乗員音声周波数から、ドライバ音声周波数を取り出す。例えば、各乗員の口元の状態と全乗員音声周波数を比較対照してドライバ音声周波数の判別をするか、または全乗員音声周波数の中で音圧が所定値よりも大きな周波数をドライバ音声周波数と判別する。このように、ドライバ音声周波数の学習を行ったら、ステップS8に進む。
ステップS8では、フィルタリング手段6により、車内音取得装置2により取得された車内音の周波数から、ドライバ音声周波数以外の周波数をフィルタリングして、ステップS9に進む。ステップS9においては、音声認識手段7により、フィルタリング後の車内音データを処理し、ドライバの音声認識を実行する。
以上、本発明の実施形態について説明したが、本発明は、上記実施形態に限定されるものではなく、特許請求の範囲に記載された範囲において適宜の変更が可能である。例えば、上記実施形態では、撮像装置1により車室内の複数の乗員の状態を検出可能としたが、撮像装置1は、音声認識の対象乗員(例えばドライバ)の状態のみを検出可能なものであってもよい。
本発明は、車両用音声認識装置において、音声認識の精度を向上するために利用できる。
1 撮像装置
2 車内音取得装置
3 処理装置
4 映像分析手段
5 周波数学習手段
6 フィルタリング手段
7 音声認識手段

Claims (3)

  1. 車両における乗員の音声を認識するための音声認識手段を備えた車両用音声認識装置において、
    前記車両内の状態を撮影する撮像手段と、
    前記車両内の音を取得する車内音取得手段と、
    前記撮像手段によって撮影された映像から、音声認識の対象となる対象乗員が音声を発していることを検出する映像分析手段と、
    前記映像分析手段により前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数に基づいて、前記対象乗員の発した音声周波数である対象乗員音声周波数を学習する周波数学習手段と、
    前記車両内の音の周波数から前記対象乗員音声周波数以外の周波数をフィルタリングするフィルタリング手段と
    を備え、前記音声認識手段は、前記フィルタリング手段によりフィルタリングされた後の前記車両内の音に基づいて、前記対象乗員の音声認識を行い、
    前記撮像手段は、前記対象乗員を含む複数の乗員の状態を撮影可能であり、
    前記車内音取得手段は、前記対象乗員以外の乗員よりも前記対象乗員に近接して設置されており、
    前記周波数学習手段は、前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数の中で音圧が所定値よりも大きな周波数を前記対象乗員音声周波数と判別して学習する車両用音声認識装置。
  2. 請求項1に記載の車両用音声認識装置において、
    前記周波数学習手段は、前記映像分析手段により前記対象乗員が音声を発していることが検出されたときに現れた前記車両内の音の周波数を、前記対象乗員音声周波数として学習する車両用音声認識装置。
  3. 請求項1又は請求項2に記載の音声認識装置において、
    前記周波数学習手段は、前記対象乗員が音声を発する度に学習された前記対象乗員音声周波数を記憶しておき、次回以降に前記対象乗員が音声を発した際の音声認識において利用する車両用音声認識装置。
JP2015230310A 2015-11-26 2015-11-26 車両用音声認識装置 Expired - Fee Related JP6451606B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015230310A JP6451606B2 (ja) 2015-11-26 2015-11-26 車両用音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015230310A JP6451606B2 (ja) 2015-11-26 2015-11-26 車両用音声認識装置

Publications (2)

Publication Number Publication Date
JP2017097206A JP2017097206A (ja) 2017-06-01
JP6451606B2 true JP6451606B2 (ja) 2019-01-16

Family

ID=58817731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015230310A Expired - Fee Related JP6451606B2 (ja) 2015-11-26 2015-11-26 車両用音声認識装置

Country Status (1)

Country Link
JP (1) JP6451606B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102462171B1 (ko) * 2021-02-09 2022-11-03 홍익대학교 산학협력단 선박 안전보안 감시용 블랙박스 장치 및 원격관제 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862700A (ja) * 1981-10-12 1983-04-14 株式会社デンソー 音声認識装置
JP2006039267A (ja) * 2004-07-28 2006-02-09 Nissan Motor Co Ltd 音声入力装置
JP4561222B2 (ja) * 2004-07-30 2010-10-13 日産自動車株式会社 音声入力装置
JP2009122598A (ja) * 2007-11-19 2009-06-04 Pioneer Electronic Corp 電子機器、電子機器の制御方法、音声認識装置、音声認識方法及び音声認識プログラム
US20160267924A1 (en) * 2013-10-22 2016-09-15 Nec Corporation Speech detection device, speech detection method, and medium

Also Published As

Publication number Publication date
JP2017097206A (ja) 2017-06-01

Similar Documents

Publication Publication Date Title
JP7091807B2 (ja) 情報提供システムおよび情報提供方法
JP6888950B2 (ja) 画像処理装置、外界認識装置
US9697430B2 (en) Method and apparatus for identifying road signs
CN112397065A (zh) 语音交互方法、装置、计算机可读存储介质及电子设备
US20180096699A1 (en) Information-providing device
CN106537492A (zh) 具有用于语音识别的校正策略的机动车操作装置
JP5607416B2 (ja) 車外音検出装置
CN105788591B (zh) 使用声音信号处理器来识别喇叭声的装置和方法
JP2008152125A (ja) 発話検出装置及び発話検出方法
JP6728634B2 (ja) 検知装置、検知方法及びプログラム
JP2014096632A (ja) 撮像システム
JP2009070344A (ja) 画像認識装置、画像認識方法および電子制御装置
JP6451606B2 (ja) 車両用音声認識装置
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
US20220036877A1 (en) Speech recognition device, speech recognition system, and speech recognition method
CN108973855B (zh) 用于车道偏离预警的方法和装置
US11325609B2 (en) Vehicle driving assist system
JP2008215874A (ja) エンジン音認識装置および駐車場管理システム
WO2020008568A1 (ja) 報知対象検知装置、警報システムおよび報知対象検知方法
JP2019197964A (ja) マイク制御装置
JPH11352987A (ja) 音声認識装置
WO2018029071A1 (en) Audio signature for speech command spotting
KR101582454B1 (ko) 촬영영상에서의 움직임 객체 인식 방법 및 이를 이용한 차량 승하차 사고 예방 시스템
JP2010262424A (ja) 車載カメラシステム
KR101531873B1 (ko) 운전자 판단 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181126

R150 Certificate of patent or registration of utility model

Ref document number: 6451606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees