JPWO2012137263A1 - 音声認識装置およびナビゲーション装置 - Google Patents

音声認識装置およびナビゲーション装置 Download PDF

Info

Publication number
JPWO2012137263A1
JPWO2012137263A1 JP2013508631A JP2013508631A JPWO2012137263A1 JP WO2012137263 A1 JPWO2012137263 A1 JP WO2012137263A1 JP 2013508631 A JP2013508631 A JP 2013508631A JP 2013508631 A JP2013508631 A JP 2013508631A JP WO2012137263 A1 JPWO2012137263 A1 JP WO2012137263A1
Authority
JP
Japan
Prior art keywords
unit
vehicle
recognition
voice
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013508631A
Other languages
English (en)
Other versions
JP5709980B2 (ja
Inventor
裕三 丸田
裕三 丸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2012137263A1 publication Critical patent/JPWO2012137263A1/ja
Application granted granted Critical
Publication of JP5709980B2 publication Critical patent/JP5709980B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

音声認識装置100を搭載する車両の車両状態を検出する車両状態検出部7と、音響分析部3が変換した音響特徴量と認識辞書格納部4に格納された認識辞書とを照合してマイク1に入力された音声を認識する音響データマッチング部5がマイク1に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部10と、車両状態検出部7で検出された車両状態が所定の条件を満たす場合に、認識パラメータ設定部10に認識パラメータの変更を指示する制御部9とを備えた。

Description

この発明は、使用環境に応じた音声認識を行う音声認識装置および該装置を搭載したナビゲーション装置に関するものである。
従来より、音声認識装置の使用環境に応じて音声認識のための閾値などを調整する技術が提案されている。例えば、特許文献1では、車両の現在の車速と基準値とを比較して、周囲が静寂環境下にあるか、または騒音環境下にあるかを判定し、当該判定結果に基づいて静寂環境下と騒音環境下とで音声の区間検出を行うための閾値(検出レベル)を変え、騒音環境下の場合の閾値を静寂環境下の場合の閾値よりも大きく設定することにより、オーディオ音の残差成分のレベル変動や微小な音などに敏感に反応して音声区間の誤検出を行ってしまうという不都合を解消する音声認識装置が提案されている。
特開2002−41073号公報
しかしながら、上述した特許文献1では、音声の区間検出を行うための閾値を発話者の音声および騒音の情報のみに基づいて設定しているため、閾値の設定が音声認識装置の使用環境に必ずしも適さず、正確な認識結果を得ることができないという課題があった。
この発明は、上記のような課題を解決するためになされたもので、発話者の音声および騒音以外の音声認識装置の使用環境を示す情報も考慮して、音声認識のための閾値を調整する音声認識装置を得ることを目的とする。
この発明に係る音声認識装置は、当該音声認識装置を搭載する車両の車両状態を検出する車両状態検出部と、音響分析部が変換した音響特徴量と認識辞書格納部に格納された認識辞書とを照合して集音部に入力された音声を認識する音響照合部が集音部に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部と、車両状態検出部で検出された車両状態が所定の条件を満たす場合に、認識パラメータ設定部に認識パラメータの変更を指示する制御部とを備えるものである。
この発明によれば、ユーザの運転状況に応じて音声認識のための閾値を設定することが可能となり、音声認識性能を向上させることができる。
実施の形態1による音声認識装置の構成を示すブロック図である。 実施の形態1による音声認識装置のパラメータテーブルの一例を示す図である。 実施の形態1による音声認識装置の動作を示すフローチャートである。 実施の形態1による音声認識装置のデータ取得処理および認識パラメータ設定処理を示す説明図である。 実施の形態2による音声認識装置の構成を示すブロック図である。 実施の形態2による音声認識装置の動作を示すフローチャートである。 実施の形態3による音声認識装置の構成を示すブロック図である。 実施の形態3による音声認識装置の動作を示すフローチャートである。 実施の形態3による音声認識装置を適用したナビゲーション装置の構成を示すブロック図である。
以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1は、この発明の実施の形態1による音声認識装置の構成を示すブロック図である。
実施の形態1の音声認識装置100はマイク1、音声処理部2、音響分析部3、認識辞書格納部4、音響データマッチング部5、ゲイン設定部6、車両状態検出部7、認識パラメータ格納部8、制御部9および認識パラメータ設定部10で構成されている。
マイク1は、入力された音声を取り込む。音声処理部2は、マイク1により取り込まれたアナログ信号の音声をデジタル信号に変換する。音響分析部3は、音声処理部2においてデジタル信号に変換された音声信号を分析し、音響特徴を時系列に示した音響特徴データに変換する。認識辞書格納部4は、認識語彙と音響特徴データとを対応付けた認識辞書を格納している。音響データマッチング部5は、音響特徴データと認識辞書とを照合して、最も確からしい音声認識結果を出力する。ゲイン設定部6は、マイク1への入力の音量を調整する。車両状態検出部7は、車内ネットワーク(不図示)に接続され、車両の車速やハンドル回転角度などの車両情報を取得する。また、車両状態検出部7は、取得した車両情報を格納するメモリ部7aを備えている。認識パラメータ格納部8は、認識パラメータの種別と値とを定義したパラメータテーブルを格納している。なお、パラメータテーブルの詳細については後述する。
制御部9は、車両状態検出部7が取得した車両情報を参照し、車両が定常運転状態であるか、異常運転状態であるか判断する。ここで、定常運転状態とは、車速が安定し、急なハンドル操作などが行われていない状態である。具体的には、高速道路を一定速度で走行している場合などである。一方、異常運転状態とは、車両の加減速が頻繁に行われたり、ハンドルが大きく回転している場合などである。具体的には、車両が交差点に入り、右左折している場合などである。制御部9は、車両情報、例えば車速やハンドル回転角度の閾値を設定した判断テーブルを保有しており、車両状態検出部7が取得した車両情報が閾値以上であるかに基づいて車両が定常運転状態であるか、異常運転状態であるかを判断する。さらに制御部9は、認識パラメータ格納部8に格納されたパラメータテーブルを参照して、車両の運転状況に応じたパラメータ値を取得する。
認識パラメータ設定部10は、制御部9で取得したパラメータ値を音響データマッチング部5に設定する。設定する認識パラメータとしては、例えば発話音声の始まりを検知するための音声パワー閾値や、発話終了を検知するための無音時間(タイムアウト時間)などを設定する。
次に、認識パラメータの詳細について説明する。
認識パラメータは、音声認識の認識精度を向上させるために設定もしくは変更する数値または数値の組み合わせである。認識パラメータ設定部10が音響データマッチング部5に設定する認識パラメータとしては、例えば発話音声の始まりを検知するための音声パワー閾値や、発話終了を検知するための無音時間(タイムアウト時間)、音声認識処理の過程で保持すべき最大単語数、言語モデルと音響モデルによる各スコアのバランスを調整する重み係数などがある。
図2は、実施の形態1による音声認識装置のパラメータテーブルの一例を示す図である。
パラメータテーブルには、上述した音声パワー検出閾値、タイムアウト時間およびマイクゲイン値などの各認識パラメータについて、車両が定常運転状態である場合に設定する値と、車両が異常運転状態である場合に設定する値とが格納されている。
図2のパラメータテーブルを用いた場合、例えば、制御部9において車両が定常運転状態であると判断されると音声パワー検出閾値を40dBに設定し、異常運転状態であると判断されると音声パワー検出閾値を60dBに設定する。また、タイムアウト時間は、車両が定常運転状態である場合には3秒と短い値に設定し、異常運転状態である場合には8秒など長い値に設定する。なお、図2に示した認識パラメータの種類および各パラメータ値は適宜変更可能である。
次に、音声認識装置100の動作について図3および図4を参照しながら説明する。図3は、実施の形態1の音声認識装置の動作を示すフローチャートであり、図4は車両情報の取得およびタイムアウト時間を示した説明図である。なお、図3のフローチャートでは、車両情報として取得した車速の時間変化を分析して急発進や急加速が多いと判断される場合にはユーザが運転に気をとられていると判断し、マイク1への音声入力のタイムアウト時間を長く設定する構成を示す。
車両状態検出部7は、車内ネットワークを介して車両の車速を継続して取得し、取得した車速情報をメモリ部7aに記憶する(ステップST1)。ステップST1での車両の車速の取得は図4におけるAで示される。
一方、制御部9は操作入力部(不図示)などを介してユーザの音声認識開始指示が入力されたか否か判定する(ステップST2)。音声認識開始指示が入力されていない場合(ステップST2;NO)、ステップST1の処理に戻る。一方、音声認識開始指示が入力された場合(ステップST2;YES)、制御部9は、車両状態検出部7のメモリ部7aに記憶された車速情報のうち所定時間における車速情報を取得し、取得した車速情報の変化が閾値以上であるか判定する(ステップST3)。ここで、制御部9が取得する所定時間における車両情報について図4を用いて説明する。図4において、地点Oは音声認識開始指示が入力された地点であり、期間Bは地点Oから所定時間(例えば5秒)遡った期間であり、この期間Bの車速情報を取得し、変化が閾値以上か判定に用いる。
車速の変化が閾値以上の場合(ステップST3;YES)、車両が急発進、急停車、あるいは急加速している異常運転状態と判断し、パラメータテーブルを参照して異常運転状態におけるタイムアウト時間のパラメータ値を取得し、認識パラメータ設定部10に通知する(ステップST4)。認識パラメータ設定部10は、ステップST4で通知された異常運転状態でのパラメータ値を、音響データマッチング部5のタイムアウト時間に設定する(ステップST5)。ステップST5のタイムアウト時間は図4のCであり、ユーザが運転操作に気を取られて、発話までに時間を要する場合があると予測し、8秒と長く設定される。
車速の変化が閾値未満の場合(ステップST3;NO)、さらに制御部9は車両状態検出部7のメモリ部7aに記憶された車速情報を取得し、車速の変化が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST6)。ステップST6において車速の変化が閾値未満の状態が所定時間以上継続しているかの判定には、図4の期間Dの車速情報を用いる。車速の変化が閾値未満の状態が所定時間以上継続していない場合(ステップST6;NO)、車両はまだ定常運転状態に復帰していないと判断し、ステップST4の処理に進む。
一方、車速の変化が閾値未満の状態が所定時間以上継続している場合(ステップST6;YES)、車両は定常運転状態に復帰していると判断し、制御部9はパラメータテーブルを参照して定常運転状態におけるタイムアウト時間のパラメータ値を取得し、認識パラメータ設定部10に通知する(ステップST7)。認識パラメータ設定部10は、ステップST7で通知された定常運転状態でのパラメータ値を、音響データマッチング部5のタイムアウト時間に設定する(ステップST8)。ステップST8のタイムアウト時間は図4の期間Eであり、ユーザの発話までに時間を要しないと予測し、3秒と短く設定される。
次に、マイク1は、ユーザが発話したコマンドを指定する音声を取得する(ステップST9)。音声処理部2は、ステップST9で取得した音声をデジタル化し(ステップST10)、音響分析部3はステップST10でデジタル化された音声信号を分析して音響特徴データに変換する(ステップST11)。音響データマッチング部5は、ステップST5またはステップST8で設定されたパラメータ値を用いて、ステップST11で変換された音響特徴データと認識辞書とを照合して最も確からしい認識結果を算出し、音声認識結果として出力し(ステップST12)、処理を終了する。
なお、図3のフローチャートでは、タイムアウト時間を音響データマッチング部5に設定する構成を示したが、これに加えて認識パラメータ設定部10が、設定したタイムアウト時間内に音声処理部2にアナログ信号の取り込み停止を指示する停止信号を出力し、音声信号の取り込みを停止するように構成してもよい。これにより、音声認識装置100の電力消費を抑制することができる。
以上のように、この実施の形態1によれば、車両が定常運転状態であるか、異常運転状態であるかによって異なる設定値を定めたパラメータテーブルを格納した認識パラメータ格納部8と、車速の時間変化が閾値以上である場合に車両が異常運転状態であると判断して、パラメータテーブルから異常運転状態での音声認識のタイムアウト時間を取得し、認識パラメータ設定部10を介して音響データマッチング部5に設定する制御部9とを備えるように構成したので、ユーザの運転状況に応じてタイムアウト時間を変更することができ、ユーザが運転操作に気を取られて発話に間が生じる場合でもタイムアウトせずに音声認識処理を行うことができる。
また、この実施の形態1によれば、車速の変化が閾値未満の状態が所定時間以上継続している場合には、制御部9は車両が定常運転状態であると判断して定常運転状態でのタイムアウト時間を設定するように構成したので、音声認識のタイムアウト時間を長く設定した場合に起こり得るノイズの誤検出および誤認識を最小限に抑制し、認識性能が劣化するのを抑制することができる。
なお、上述した実施の形態1で示した期間Bから期間Dの時間は適宜変更可能である。また、各期間の開始地点は音声認識開始指示が入力された地点Oとして説明したが、この各期間の開始地点も適宜変更可能である。
実施の形態2.
今日では、車両内にオーディオ装置が設置され、オーディオ(音楽)を聞きながら運転動作を行うことは一般的である。このようにオーディオが再生されている状況では、ユーザは発話直前のオーディオの出力音量に応じて発話する声の大きさが変化する。例えば、オーディオの出力音量が大きい場合には、ユーザはより大きな声で発話する傾向がある。そこで、この実施の形態2ではオーディオの出力音量が大きく、ユーザが通常よりも大きい声で発話した場合でも音声認識性能を維持するための構成を示す。
図5は、この発明の実施の形態2による音声認識装置の構成を示すブロック図である。
図5では、図1で示した車両状態検出部7に替えてオーディオ出力検知部11を備えている。なお、以下では、実施の形態1による音声認識装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
オーディオ出力検知部11は、車内に設置されたオーディオ装置(不図示)からのオーディオの出力音量を検知し、音量情報として制御部9に出力する。なお、オーディオから音量情報を取得する構成としては、接続されたオーディオ装置から直接ボリューム値などの情報を取得してもよいし、車内に流れているオーディオをマイク1とは異なるマイク(不図示)で集音して音量情報を算出してもよい。また、オーディオ出力検知部11は、取得した音量情報を格納するメモリ部11aを備えている。
制御部9は、オーディオ出力検知部11が検知した音量情報を参照し、車両が定常運転状態であるか、異常運転状態であるか判断する。この実施の形態2における定常運転状態とは、オーディオの出力音量が閾値未満でありユーザの発話音量に影響を与えない状態である。一方、異常運転状態とは、オーディオの出力音量が閾値以上でありユーザの発話音量に影響を与える状態である。制御部9は、オーディオの出力音量の閾値を設定した判断テーブルを有しており、オーディオ出力検知部11が検知した音量情報が閾値以上であるかに基づいて車両が定常運転状態であるか、異常運転状態であるかを判断する。さらに制御部9は、認識パラメータ格納部8に格納されたパラメータテーブルを参照して、車両の運転状況に応じたパラメータ値を取得する。ゲイン設定部6は、制御部9で取得したパラメータ値をマイク1に設定する。設定する認識パラメータとしては、例えばマイク1のマイクゲイン値などがある。
マイクゲイン値について、上述した実施の形態1で示した図2のパラメータテーブルを例に説明する。車両が定常運転状態(オーディオの出力音量が閾値未満の場合)であると判断された場合には、10dBに設定し、車両が異常運転状態である場合(オーディオの出力音量が閾値以上の場合)では、音声認識開始指示が入力される直前のオーディオの出力音量に応じて低い値を設定する。具体的には、直前のオーディオの出力音量が60dBAの場合には、マイクゲイン値を5dBに設定する。また、直前のオーディオの出力音量がより大きい100dBAの場合には、ユーザの発話はより大きくなると判断できることからマイクゲイン値を3dBに設定する。
次に、実施の形態2による音声認識装置の動作について図6に示すフローチャートを参照しながら説明を行う。なお、実施の形態1による音声認識装置と同一ステップには図3で使用した符号と同一の符号を付し、説明を省略または簡略化する。
また、図6のフローチャートでは、オーディオの出力音量を検知し、当該出力音量が大きい場合にはユーザが大きな声で発話すると判断し、ゲイン設定部6に設定するマイクゲイン値を小さくする構成を示す。
また、ユーザは音声認識開始指示を入力する前、あるいは入力した後に、オーディオの出力音声の影響を排除して音声認識性能を維持するために、オーディオをミュート(中止)するのが一般的であるが、例えばノイズキャンセラなどの既知の技術を用いてオーディオをミュートに設定することなく音声認識を行うことも可能である。なお、図6のフローチャートでは、オーディオをミュートに設定した場合を例に説明する。これは、オーディオがミュートに設定されるか否かに関わらず、直前のオーディオ出力音量が大きい場合には、ユーザはより大きな声で発話を行うという傾向に基づくものである。
オーディオ出力検知部11は、車内のオーディオの出力音量を検知し、検知した出力音量情報をメモリ部11aに記憶する(ステップST21)。一方、制御部9は、音声認識開始指示の入力およびミュートの設定指示が入力されたか否か判定する(ステップST22)。音声認識開始指示およびミュートの設定指示が入力されていない場合(ステップST22;NO)、ステップST21の処理に戻る。一方、音声認識開始指示およびミュート設定指示が入力された場合(ステップST22;YES)、制御部9はオーディオ出力検知部11のメモリ部11aに記憶された出力音量のうち、音声認識開始指示が入力される直前の出力音量が閾値以上であるか判定する(ステップST23)。
音声認識開始指示が入力された直前の出力音量が閾値以上の場合(ステップST23;YES)、車両は異常運転状態であると判断し、ミュート設定指示が入力される直前の出力音量に対応したマイクゲイン値をパラメータテーブルを参照して取得し、ゲイン設定部6に通知する(ステップST24)。ゲイン設定部6は、ステップST24で通知された異常運転状態でのパラメータ値を、マイク1のマイクゲイン(例えば、5dB)に設定する(ステップST25)。
音声認識開始指示が入力された直前の出力音量が閾値未満の場合(ステップST23;NO)、さらに出力音量が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST26)。出力音量が閾値未満の状態が所定時間以上継続していない場合(ステップST26;NO)、ユーザはまだオーディオの出力音量の影響を受けた発話を行う可能性があると判断し、ステップST24の処理に進む。
一方、出力音量が閾値未満の状態が所定時間以上継続している場合(ステップST26;YES)、ユーザはオーディオの出力音量の影響を受けた発話を行わないと判断し、制御部9はパラメータテーブルを参照して定常運転状態におけるマイクゲイン値を取得し、ゲイン設定部6に通知する(ステップST27)。ゲイン設定部6は、ステップST27で通知された定常運転状態でのパラメータ値を、マイク1のマイクゲイン(例えば、10dB)に設定する(ステップST28)。以降の処理は、実施の形態1で示したステップST9からステップST12の処理と同様である。
なお、上述したステップST26において出力音量が閾値未満の状態が所定時間以上継続しているか否か判断する際の時間は、例えば実施の形態1の図4で示した期間D、すなわち音声認識開始指示が入力された地点Oから所定期間遡った期間である。なお、地点Oから遡る時間は適宜変更可能である。
以上のように、この実施の形態2によれば、車両が定常運転状態であるか、異常運転状態であるかに応じて異なる設定値を定めたパラメータテーブルを格納する認識パラメータ格納部8と、オーディオの出力音量が閾値以上である場合に車両が異常運転状態であると判断して、パラメータテーブルから異常運転状態でのマイクゲイン値を取得し、ゲイン設定部6を介してマイク1のマイクゲインを設定する制御部9とを備えるように構成したので、ユーザがオーディオの出力音量の影響を受けた発話を行った場合でもゲインが適正に保たれ、認識性能の低下を抑制することができる。
なお、上述した実施の形態2では、オーディオの出力音量に基づいてマイクゲイン値を設定する構成を示したが、オーディオ装置から出力されるオーディオの周波数分析を行い、人間の音声に近い周波数を有する出力信号の出力強度に基づいてマイクゲイン値を設定する構成としてもよい。これにより、ユーザの発話に影響を与える人間の音声に近い周波数を有するオーディオ信号の信号強度を確認すればよく、効率よく認識性能の低下を抑制することができる。
なお、上述した実施の形態2では、音声認識開始指示を入力する前後にオーディオをミュートに設定する構成を例に示したが、ミュートに設定しない場合には、以下のように構成することにより音声認識処理を行うことができる。例えば2つの集音手段(不図示)を車両の運転席付近および助手席付近に設ける。オーディオは車内に均一に流れているため、2つの集音手段に入力される。一方、運転者の発話音声は運転席付近の集音手段にのみ入力される。そこで、2つの集音手段に入力された音声を差し引いて得られる音声を運転者の発話音声として音声認識処理に用いる。なお、オーディオとユーザの発話音声との区別は、異なる手法を用いて構成してもよい。
実施の形態3.
上述した実施の形態1および実施の形態2では、車両状態やオーディオの出力音量に応じて認識パラメータの値を設定する構成を示したが、この実施の形態3では車両状態に応じて音声認識処理を停止する構成を示す。
図7は、実施の形態3による音声認識装置の構成を示すブロック図である。図7では、図1で示した認識パラメータ設定部10に替えて音声認識停止処理部12を備えている。なお、以下では、実施の形態1による音声認識装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
車両状態検出部7は、実施の形態1で示した車速の検出以外に、ハンドルの回転角度、ハンドルの回転速度、ウインカのON/OFF状態、GPS信号を用いた現在位置情報から車両の進行方向、交差点への侵入などの車両状態の検出を行う。なお、GPS信号を用いた現在位置情報は、車両状態検出部7内で算出してもよいし、外部から取得してもよい。制御部9は、車両状態検出部7の検出結果に基づいて、ユーザが運転に集中すべき状況であるかを判断し、集中すべき状況であると判断した場合に、音声認識の停止指示を出力する。音声認識停止処理部12は、制御部9から入力される音声認識の停止指示に基づいて、音声処理部2、音響分析部3および音響データマッチング部5に停止信号を出力して、音声認識に関する処理を停止させる。さらに外部スピーカ(不図示)あるいは外部ディスプレイ(不図示)を介して音声認識を停止している旨を音声出力あるいは表示出力する。
次に、実施の形態3による音声認識装置100の動作について図8のフローチャートを参照しながら説明する。なお、図8のフローチャートでは、車両情報としてハンドルの回転角度を検出し、当該ハンドルの回転角度が大きい場合にはユーザがハンドル動作に集中すべきであると判断し、音声認識処理を停止する場合を例に示す。
車両状態検出部7は、車内ネットワークを介して車両のハンドル回転角度を継続して取得し、取得した回転角度情報をメモリ部7aに記憶する(ステップST31)。
一方、制御部9は音声認識開始指示が入力されたか否か判定する(ステップST32)。音声認識開始指示が入力されていない場合(ステップST32;NO)、ステップST31の処理に戻る。一方、音声認識開始指示が入力された場合(ステップST32;YES)、制御部9は、車両状態検出部7のメモリ部7aに記憶されたハンドル回転角度のうち、音声認識開始指示が入力された時点のハンドル回転角度が閾値以上であるか判定する(ステップST33)。
ハンドル回転角度が閾値以上の場合(ステップST33;YES)、制御部9は車両がカーブなどを走行中でありハンドル操作に集中すべきと判断し、音声認識停止処理部12に音声認識の停止指示を出力する(ステップST34)。音声認識停止処理部12は、ステップST34で入力される停止指示に従って、音声処理部2、音響分析部3、および音響データマッチング部5に停止信号を出力し、音声認識に関する処理を停止させると共に、「現在、音声認識は使用できません。運転に集中して下さい。」という応答メッセージを外部のスピーカ(不図示)から出力、あるいは外部のディスプレイ(不図示)に表示する(ステップST35)。
ハンドル回転角度が閾値未満の場合(ステップST33;NO)、さらに制御部9は車両状態検出部7のメモリ部7aに記憶されたハンドル回転角度を取得し、ハンドル回転角度が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST36)。ハンドル回転角度が閾値未満の車両状態が所定時間以上継続していない場合(ステップST36;NO)、まだハンドル操作に集中すべき状態から脱していないと判断し、ステップST34の処理に進む。一方、ハンドル回転角度が閾値未満の車両状態が所定時間以上継続している場合(ステップST36;YES)、ハンドル操作に集中すべき状態から脱していると判断し、ステップST9の処理に進む。ステップST9以降の処理は、実施の形態1と同様である。
なお、上述したステップST34およびST35において、音声認識に関する処理を停止させると共に、応答メッセージを出力する構成を示したが、制御部9が音声認識開始指示の操作入力の受付を無効にし、さらに無効にした旨を音声認識停止処理部12に通知し、音声認識停止処理部12が警告を表示、あるいはブザー音を発するように構成してもよい。
また、上述したステップST36においてハンドル回転角度が閾値未満の車両状態が所定時間以上継続しているか否か判断する際の時間は、例えば実施の形態1の図4で示した期間D、すなわち音声認識開始指示が入力された地点Oから所定期間遡った期間である。 なお、地点Oから遡る時間は適宜変更可能である。
また、上述した図8のフローチャートでは車両情報としてハンドルの回転角度を検出し、回転角度が大きい場合には車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる構成を示したが、ハンドルの回転角度以外の種々の車両情報に基づいて音声認識処理の実施あるいは停止を制御することができる。
具体的には、車両情報としてハンドルの回転速度を検出し、音声認識開始指示が入力されてから所定期間遡った期間の回転速度の平均速度が閾値よりも速い時には車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる。また、ウインカのON/OFF状態からも同様に車両の進行方向の変化を把握することができる。ウインカのON/OFF状態の検知はウインカの点灯動作の有無あるいはウインカ動作音などに基づいて行う。また、GPS信号を用いて車両の進行方向を取得し、過去の一定期間の進行方向と現在の進行方向との差異が一定値以上である場合に、車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる。
さらに、既知の白線検知手法を用いて、車線変更時などに起こる、道路上の白線が延びる方向と車両の進行方向との差異から車両の進行方向の変化を把握する、あるいは既知の交差点への進入検知手法を用いて車両の交差点への進入を判断して車両の進行方向の変化を把握することも可能である。なお、交差点への進入は、地図情報などを参照して判断する。地図情報は音声認識装置100内に設けた記憶領域(不図示)に記憶させてもよいし、外部装置から取得してもよい。また、これらのハンドルの回転角度、ハンドルの回転速度、ウインカのON/OFF状態、車両の進行方向の変化および車両の交差点への信号を組み合わせて、制御部9が車両の進行方向の変化を判定してもよい。
以上のように、この実施の形態3によれば、車両状態検出部7が検出した車両状態に基づいて、ユーザが運転に集中すべき状況であるかを判断して音声認識の停止指示を出力する制御部9と、制御部9から出力された音声認識の停止指示に基づいて停止信号を出力する音声認識停止処理部12とを備えるように構成したので、ユーザの運転状況に応じて音声認識処理を停止することができる。これにより、ユーザの安全運転を確保した音声認識処理を行うことができる。
なお、上記実施の形態3では、車両状態に応じて音声認識の開始を停止する構成を示したが、マイク1、音声処理部2、音響分析部3および音響データマッチング部5において音声認識処理を行っている最中であっても車両状態に基づいて音声認識処理を停止する構成とすることも可能である。
なお、上記実施の形態3では、車両状態検出部7が車両状態を取得する構成を示したが、車両状態検出部7に映像解析手段(不図示)を設けて、外部に設けたカメラなどが取得した映像を当該映像解析手段が解析し、解析した映像の変化率を算出し、映像の変化率が閾値以上である場合に車両の進行方向に大きな変化が生じていると判断してもよい。また、解析した映像中に特定の標識(特定の画像)が出現したときに車両の変化が大きくなると判断するように構成してもよい。
さらに図9に示すように、音声認識装置100を搭載したナビゲーション装置200として構成してもよい。なお、図9では実施の形態3で示した構成を有する音声認識装置100を適用したブロック図を示したが、実施の形態1および実施の形態2で示した音声認識装置100を適用してナビゲーション装置200を構成してもよい。
ナビゲーション装置200は、音声認識装置100を備えると共に、ナビゲーション機能として自車両の現在位置を取得する位置情報取得部21、地図データを記憶する地図データ記憶部22と、現在位置と地図データを用いて経路探索を行って経路案内情報を生成する経路案内部23と、生成した経路案内情報を表示または音声でユーザに提示する出力部24を備えている。
音声認識装置100は、ユーザが目的地や経由地を音声入力した場合に、当該音声入力を音声発話としてマイク1に取り込み、上述した実施の形態1から実施の形態3で示したいずれかの音声認識処理により音声認識を行い、音声認識結果を経路案内部23に出力する。経路案内部23は、入力された音声認識結果に基づき、さらに位置情報取得部21から入力される自車位置情報および地図データ記憶部22に記憶された地図データを用いて経路探索を行い、経路案内情報を出力部24から出力する。
さらに、音声認識装置100をナビゲーション装置200に搭載した場合、位置情報取得部21から現在位置情報を取得し、車両の進行方向、交差点への進入などの車両状態の検出を行うように構成してもよい。同様に、地図データ記憶部22に記憶された地図データを参照し、自車両の交差点への進入を判断するように構成してもよい。
このように、音声認識装置100をナビゲーション装置に搭載することにより、車両の運転状態に適した音声認識処理により得られた音声認識結果を用いて経路案内を行うことができ、ユーザの安全運転を支援するナビゲーション装置を提供することができる。また、認識性能の高い認識結果を用いて経路探索を行うことができる。
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
この発明に係る音声認識装置は、移動体内での音声認識処理の認識精度向上に利用することができると共に、ユーザの安全運転の支援にも活用することができる。
1 マイク、2 音声処理部、3 音響分析部、4 認識辞書格納部、5 音響データマッチング部、6 ゲイン設定部、7 車両状態検出部、8 認識パラメータ格納部、9 制御部、10 認識パラメータ設定部、11 オーディオ出力検知部、12 音声認識停止処理部、7a,11a メモリ部、21 位置情報取得部、22 地図データ記憶部、23 経路案内部、24 出力部、100 音声認識装置、200 ナビゲーション装置。
【書類名】 明細書
【発明の名称】 音声認識装置およびナビゲーション装置
【技術分野】
【0001】
この発明は、使用環境に応じた音声認識を行う音声認識装置および該装置を搭載したナビゲーション装置に関するものである。
【背景技術】
【0002】
従来より、音声認識装置の使用環境に応じて音声認識のための閾値などを調整する技術が提案されている。例えば、特許文献1では、車両の現在の車速と基準値とを比較して、周囲が静寂環境下にあるか、または騒音環境下にあるかを判定し、当該判定結果に基づいて静寂環境下と騒音環境下とで音声の区間検出を行うための閾値(検出レベル)を変え、騒音環境下の場合の閾値を静寂環境下の場合の閾値よりも大きく設定することにより、オーディオ音の残差成分のレベル変動や微小な音などに敏感に反応して音声区間の誤検出を行ってしまうという不都合を解消する音声認識装置が提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】
特開2002−41073号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した特許文献1では、音声の区間検出を行うための閾値を発話者の音声および騒音の情報のみに基づいて設定しているため、閾値の設定が音声認識装置の使用環境に必ずしも適さず、正確な認識結果を得ることができないという課題があった。
【0005】
この発明は、上記のような課題を解決するためになされたもので、発話者の音声および騒音以外の音声認識装置の使用環境を示す情報も考慮して、音声認識のための閾値を調整する音声認識装置を得ることを目的とする。
【課題を解決するための手段】
【0006】
この発明に係る音声認識装置は、当該音声認識装置を搭載する車両の車両状態を検出する車両状態検出部と、音声認識装置を搭載した車両内に設置されたオーディオ装置から出力される音声信号の音量を検知するオーディオ出力検知部と、集音部の音声取得ゲインを設定するゲイン設定部と、音響分析部が変換した音響特徴量と認識辞書格納部に格納された認識辞書とを照合して集音部に入力された音声を認識する音響照合部が集音部に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部と、車両状態検出部で検出された車両状態および前記オーディオ出力検知部で検知された音声信号の音量が所定の条件を満たす場合に、認識パラメータ設定部に認識パラメータの変更を指示する制御部とを備えるものである。
【発明の効果】
【0007】
この発明によれば、ユーザの運転状況に応じて音声認識のための閾値を設定することが可能となり、音声認識性能を向上させることができる。
【図面の簡単な説明】
【0008】
【図1】 実施の形態1による音声認識装置の構成を示すブロック図である。
【図2】 実施の形態1による音声認識装置のパラメータテーブルの一例を示す図である。
【図3】 実施の形態1による音声認識装置の動作を示すフローチャートである。
【図4】 実施の形態1による音声認識装置のデータ取得処理および認識パラメータ設定処理を示す説明図である。
【図5】 実施の形態2による音声認識装置の構成を示すブロック図である。
【図6】 実施の形態2による音声認識装置の動作を示すフローチャートである。
【図7】 実施の形態3による音声認識装置の構成を示すブロック図である。
【図8】 実施の形態3による音声認識装置の動作を示すフローチャートである。
【図9】 実施の形態3による音声認識装置を適用したナビゲーション装置の構成を示すブロック図である。
【発明を実施するための形態】
【0009】
以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1は、この発明の実施の形態1による音声認識装置の構成を示すブロック図である。
実施の形態1の音声認識装置100はマイク1、音声処理部2、音響分析部3、認識辞書格納部4、音響データマッチング部5、ゲイン設定部6、車両状態検出部7、認識パラメータ格納部8、制御部9および認識パラメータ設定部10で構成されている。
【0010】
マイク1は、入力された音声を取り込む。音声処理部2は、マイク1により取り込まれたアナログ信号の音声をデジタル信号に変換する。音響分析部3は、音声処理部2においてデジタル信号に変換された音声信号を分析し、音響特徴を時系列に示した音響特徴データに変換する。認識辞書格納部4は、認識語彙と音響特徴データとを対応付けた認識辞書を格納している。音響データマッチング部5は、音響特徴データと認識辞書とを照合して、最も確からしい音声認識結果を出力する。ゲイン設定部6は、マイク1への入力の音量を調整する。車両状態検出部7は、車内ネットワーク(不図示)に接続され、車両の車速やハンドル回転角度などの車両情報を取得する。また、車両状態検出部7は、取得した車両情報を格納するメモリ部7aを備えている。認識パラメータ格納部8は、認識パラメータの種別と値とを定義したパラメータテーブルを格納している。なお、パラメータテーブルの詳細については後述する。
【0011】
制御部9は、車両状態検出部7が取得した車両情報を参照し、車両が定常運転状態であるか、異常運転状態であるか判断する。ここで、定常運転状態とは、車速が安定し、急なハンドル操作などが行われていない状態である。具体的には、高速道路を一定速度で走行している場合などである。一方、異常運転状態とは、車両の加減速が頻繁に行われたり、ハンドルが大きく回転している場合などである。具体的には、車両が交差点に入り、右左折している場合などである。制御部9は、車両情報、例えば車速やハンドル回転角度の閾値を設定した判断テーブルを保有しており、車両状態検出部7が取得した車両情報が閾値以上であるかに基づいて車両が定常運転状態であるか、異常運転状態であるかを判断する。さらに制御部9は、認識パラメータ格納部8に格納されたパラメータテーブルを参照して、車両の運転状況に応じたパラメータ値を取得する。
【0012】
認識パラメータ設定部10は、制御部9で取得したパラメータ値を音響データマッチング部5に設定する。設定する認識パラメータとしては、例えば発話音声の始まりを検知するための音声パワー閾値や、発話終了を検知するための無音時間(タイムアウト時間)などを設定する。
【0013】
次に、認識パラメータの詳細について説明する。
認識パラメータは、音声認識の認識精度を向上させるために設定もしくは変更する数値または数値の組み合わせである。認識パラメータ設定部10が音響データマッチング部5に設定する認識パラメータとしては、例えば発話音声の始まりを検知するための音声パワー閾値や、発話終了を検知するための無音時間(タイムアウト時間)、音声認識処理の過程で保持すべき最大単語数、言語モデルと音響モデルによる各スコアのバランスを調整する重み係数などがある。
【0014】
図2は、実施の形態1による音声認識装置のパラメータテーブルの一例を示す図である。パラメータテーブルには、上述した音声パワー検出閾値、タイムアウト時間およびマイクゲイン値などの各認識パラメータについて、車両が定常運転状態である場合に設定する値と、車両が異常運転状態である場合に設定する値とが格納されている。
図2のパラメータテーブルを用いた場合、例えば、制御部9において車両が定常運転状態であると判断されると音声パワー検出閾値を40dBに設定し、異常運転状態であると判断されると音声パワー検出閾値を60dBに設定する。また、タイムアウト時間は、車両が定常運転状態である場合には3秒と短い値に設定し、異常運転状態である場合には8秒など長い値に設定する。なお、図2に示した認識パラメータの種類および各パラメータ値は適宜変更可能である。
【0015】
次に、音声認識装置100の動作について図3および図4を参照しながら説明する。図3は、実施の形態1の音声認識装置の動作を示すフローチャートであり、図4は車両情報の取得およびタイムアウト時間を示した説明図である。なお、図3のフローチャートでは、車両情報として取得した車速の時間変化を分析して急発進や急加速が多いと判断される場合にはユーザが運転に気をとられていると判断し、マイク1への音声入力のタイムアウト時間を長く設定する構成を示す。
車両状態検出部7は、車内ネットワークを介して車両の車速を継続して取得し、取得した車速情報をメモリ部7aに記憶する(ステップST1)。ステップST1での車両の車速の取得は図4におけるAで示される。
【0016】
一方、制御部9は操作入力部(不図示)などを介してユーザの音声認識開始指示が入力されたか否か判定する(ステップST2)。音声認識開始指示が入力されていない場合(ステップST2;NO)、ステップST1の処理に戻る。一方、音声認識開始指示が入力された場合(ステップST2;YES)、制御部9は、車両状態検出部7のメモリ部7aに記憶された車速情報のうち所定時間における車速情報を取得し、取得した車速情報の変化が閾値以上であるか判定する(ステップST3)。ここで、制御部9が取得する所定時間における車両情報について図4を用いて説明する。図4において、地点Oは音声認識開始指示が入力された地点であり、期間Bは地点Oから所定時間(例えば5秒)遡った期間であり、この期間Bの車速情報を取得し、変化が閾値以上か判定に用いる。
【0017】
車速の変化が閾値以上の場合(ステップST3;YES)、車両が急発進、急停車、あるいは急加速している異常運転状態と判断し、パラメータテーブルを参照して異常運転状態におけるタイムアウト時間のパラメータ値を取得し、認識パラメータ設定部10に通知する(ステップST4)。認識パラメータ設定部10は、ステップST4で通知された異常運転状態でのパラメータ値を、音響データマッチング部5のタイムアウト時間に設定する(ステップST5)。ステップST5のタイムアウト時間は図4のCであり、ユーザが運転操作に気を取られて、発話までに時間を要する場合があると予測し、8秒と長く設定される。
【0018】
車速の変化が閾値未満の場合(ステップST3;NO)、さらに制御部9は車両状態検出部7のメモリ部7aに記憶された車速情報を取得し、車速の変化が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST6)。ステップST6において車速の変化が閾値未満の状態が所定時間以上継続しているかの判定には、図4の期間Dの車速情報を用いる。車速の変化が閾値未満の状態が所定時間以上継続していない場合(ステップST6;NO)、車両はまだ定常運転状態に復帰していないと判断し、ステップST4の処理に進む。
【0019】
一方、車速の変化が閾値未満の状態が所定時間以上継続している場合(ステップST6;YES)、車両は定常運転状態に復帰していると判断し、制御部9はパラメータテーブルを参照して定常運転状態におけるタイムアウト時間のパラメータ値を取得し、認識パラメータ設定部10に通知する(ステップST7)。認識パラメータ設定部10は、ステップST7で通知された定常運転状態でのパラメータ値を、音響データマッチング部5のタイムアウト時間に設定する(ステップST8)。ステップST8のタイムアウト時間は図4の期間Eであり、ユーザの発話までに時間を要しないと予測し、3秒と短く設定される。
【0020】
次に、マイク1は、ユーザが発話したコマンドを指定する音声を取得する(ステップST9)。音声処理部2は、ステップST9で取得した音声をデジタル化し(ステップST10)、音響分析部3はステップST10でデジタル化された音声信号を分析して音響特徴データに変換する(ステップST11)。音響データマッチング部5は、ステップST5またはステップST8で設定されたパラメータ値を用いて、ステップST11で変換された音響特徴データと認識辞書とを照合して最も確からしい認識結果を算出し、音声認識結果として出力し(ステップST12)、処理を終了する。
【0021】
なお、図3のフローチャートでは、タイムアウト時間を音響データマッチング部5に設定する構成を示したが、これに加えて認識パラメータ設定部10が、設定したタイムアウト時間内に音声処理部2にアナログ信号の取り込み停止を指示する停止信号を出力し、音声信号の取り込みを停止するように構成してもよい。これにより、音声認識装置100の電力消費を抑制することができる。
【0022】
以上のように、この実施の形態1によれば、車両が定常運転状態であるか、異常運転状態であるかによって異なる設定値を定めたパラメータテーブルを格納した認識パラメータ格納部8と、車速の時間変化が閾値以上である場合に車両が異常運転状態であると判断して、パラメータテーブルから異常運転状態での音声認識のタイムアウト時間を取得し、認識パラメータ設定部10を介して音響データマッチング部5に設定する制御部9とを備えるように構成したので、ユーザの運転状況に応じてタイムアウト時間を変更することができ、ユーザが運転操作に気を取られて発話に間が生じる場合でもタイムアウトせずに音声認識処理を行うことができる。
【0023】
また、この実施の形態1によれば、車速の変化が閾値未満の状態が所定時間以上継続している場合には、制御部9は車両が定常運転状態であると判断して定常運転状態でのタイムアウト時間を設定するように構成したので、音声認識のタイムアウト時間を長く設定した場合に起こり得るノイズの誤検出および誤認識を最小限に抑制し、認識性能が劣化するのを抑制することができる。
【0024】
なお、上述した実施の形態1で示した期間Bから期間Dの時間は適宜変更可能である。また、各期間の開始地点は音声認識開始指示が入力された地点Oとして説明したが、この各期間の開始地点も適宜変更可能である。
【0025】
実施の形態2.
今日では、車両内にオーディオ装置が設置され、オーディオ(音楽)を聞きながら運転動作を行うことは一般的である。このようにオーディオが再生されている状況では、ユーザは発話直前のオーディオの出力音量に応じて発話する声の大きさが変化する。例えば、オーディオの出力音量が大きい場合には、ユーザはより大きな声で発話する傾向がある。そこで、この実施の形態2ではオーディオの出力音量が大きく、ユーザが通常よりも大きい声で発話した場合でも音声認識性能を維持するための構成を示す。
【0026】
図5は、この発明の実施の形態2による音声認識装置の構成を示すブロック図である。
図5では、図1で示した車両状態検出部7に替えてオーディオ出力検知部11を備えている。なお、以下では、実施の形態1による音声認識装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
【0027】
オーディオ出力検知部11は、車内に設置されたオーディオ装置(不図示)からのオーディオの出力音量を検知し、音量情報として制御部9に出力する。なお、オーディオから音量情報を取得する構成としては、接続されたオーディオ装置から直接ボリューム値などの情報を取得してもよいし、車内に流れているオーディオをマイク1とは異なるマイク(不図示)で集音して音量情報を算出してもよい。また、オーディオ出力検知部11は、取得した音量情報を格納するメモリ部11aを備えている。
【0028】
制御部9は、オーディオ出力検知部11が検知した音量情報を参照し、車両が定常運転状態であるか、異常運転状態であるか判断する。この実施の形態2における定常運転状態とは、オーディオの出力音量が閾値未満でありユーザの発話音量に影響を与えない状態である。一方、異常運転状態とは、オーディオの出力音量が閾値以上でありユーザの発話音量に影響を与える状態である。制御部9は、オーディオの出力音量の閾値を設定した判断テーブルを有しており、オーディオ出力検知部11が検知した音量情報が閾値以上であるかに基づいて車両が定常運転状態であるか、異常運転状態であるかを判断する。さらに制御部9は、認識パラメータ格納部8に格納されたパラメータテーブルを参照して、車両の運転状況に応じたパラメータ値を取得する。ゲイン設定部6は、制御部9で取得したパラメータ値をマイク1に設定する。設定する認識パラメータとしては、例えばマイク1のマイクゲイン値などがある。
【0029】
マイクゲイン値について、上述した実施の形態1で示した図2のパラメータテーブルを例に説明する。車両が定常運転状態(オーディオの出力音量が閾値未満の場合)であると判断された場合には、10dBに設定し、車両が異常運転状態である場合(オーディオの出力音量が閾値以上の場合)では、音声認識開始指示が入力される直前のオーディオの出力音量に応じて低い値を設定する。具体的には、直前のオーディオの出力音量が60dBAの場合には、マイクゲイン値を5dBに設定する。また、直前のオーディオの出力音量がより大きい100dBAの場合には、ユーザの発話はより大きくなると判断できることからマイクゲイン値を3dBに設定する。
【0030】
次に、実施の形態2による音声認識装置の動作について図6に示すフローチャートを参照しながら説明を行う。なお、実施の形態1による音声認識装置と同一ステップには図3で使用した符号と同一の符号を付し、説明を省略または簡略化する。
また、図6のフローチャートでは、オーディオの出力音量を検知し、当該出力音量が大きい場合にはユーザが大きな声で発話すると判断し、ゲイン設定部6に設定するマイクゲイン値を小さくする構成を示す。
【0031】
また、ユーザは音声認識開始指示を入力する前、あるいは入力した後に、オーディオの出力音声の影響を排除して音声認識性能を維持するために、オーディオをミュート(中止)するのが一般的であるが、例えばノイズキャンセラなどの既知の技術を用いてオーディオをミュートに設定することなく音声認識を行うことも可能である。なお、図6のフローチャートでは、オーディオをミュートに設定した場合を例に説明する。これは、オーディオがミュートに設定されるか否かに関わらず、直前のオーディオ出力音量が大きい場合には、ユーザはより大きな声で発話を行うという傾向に基づくものである。
【0032】
オーディオ出力検知部11は、車内のオーディオの出力音量を検知し、検知した出力音量情報をメモリ部11aに記憶する(ステップST21)。一方、制御部9は、音声認識開始指示の入力およびミュートの設定指示が入力されたか否か判定する(ステップST22)。音声認識開始指示およびミュートの設定指示が入力されていない場合(ステップST22;NO)、ステップST21の処理に戻る。一方、音声認識開始指示およびミュート設定指示が入力された場合(ステップST22;YES)、制御部9はオーディオ出力検知部11のメモリ部11aに記憶された出力音量のうち、音声認識開始指示が入力される直前の出力音量が閾値以上であるか判定する(ステップST23)。
【0033】
音声認識開始指示が入力された直前の出力音量が閾値以上の場合(ステップST23;YES)、車両は異常運転状態であると判断し、ミュート設定指示が入力される直前の出力音量に対応したマイクゲイン値をパラメータテーブルを参照して取得し、ゲイン設定部6に通知する(ステップST24)。ゲイン設定部6は、ステップST24で通知された異常運転状態でのパラメータ値を、マイク1のマイクゲイン(例えば、5dB)に設定する(ステップST25)。
【0034】
音声認識開始指示が入力された直前の出力音量が閾値未満の場合(ステップST23;NO)、さらに出力音量が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST26)。出力音量が閾値未満の状態が所定時間以上継続していない場合(ステップST26;NO)、ユーザはまだオーディオの出力音量の影響を受けた発話を行う可能性があると判断し、ステップST24の処理に進む。
【0035】
一方、出力音量が閾値未満の状態が所定時間以上継続している場合(ステップST26;YES)、ユーザはオーディオの出力音量の影響を受けた発話を行わないと判断し、制御部9はパラメータテーブルを参照して定常運転状態におけるマイクゲイン値を取得し、ゲイン設定部6に通知する(ステップST27)。ゲイン設定部6は、ステップST27で通知された定常運転状態でのパラメータ値を、マイク1のマイクゲイン(例えば、10dB)に設定する(ステップST28)。以降の処理は、実施の形態1で示したステップST9からステップST12の処理と同様である。
【0036】
なお、上述したステップST26において出力音量が閾値未満の状態が所定時間以上継続しているか否か判断する際の時間は、例えば実施の形態1の図4で示した期間D、すなわち音声認識開始指示が入力された地点Oから所定期間遡った期間である。なお、地点Oから遡る時間は適宜変更可能である。
【0037】
以上のように、この実施の形態2によれば、車両が定常運転状態であるか、異常運転状態であるかに応じて異なる設定値を定めたパラメータテーブルを格納する認識パラメータ格納部8と、オーディオの出力音量が閾値以上である場合に車両が異常運転状態であると判断して、パラメータテーブルから異常運転状態でのマイクゲイン値を取得し、ゲイン設定部6を介してマイク1のマイクゲインを設定する制御部9とを備えるように構成したので、ユーザがオーディオの出力音量の影響を受けた発話を行った場合でもゲインが適正に保たれ、認識性能の低下を抑制することができる。
【0038】
なお、上述した実施の形態2では、オーディオの出力音量に基づいてマイクゲイン値を設定する構成を示したが、オーディオ装置から出力されるオーディオの周波数分析を行い、人間の音声に近い周波数を有する出力信号の出力強度に基づいてマイクゲイン値を設定する構成としてもよい。これにより、ユーザの発話に影響を与える人間の音声に近い周波数を有するオーディオ信号の信号強度を確認すればよく、効率よく認識性能の低下を抑制することができる。
【0039】
なお、上述した実施の形態2では、音声認識開始指示を入力する前後にオーディオをミュートに設定する構成を例に示したが、ミュートに設定しない場合には、以下のように構成することにより音声認識処理を行うことができる。例えば2つの集音手段(不図示)を車両の運転席付近および助手席付近に設ける。オーディオは車内に均一に流れているため、2つの集音手段に入力される。一方、運転者の発話音声は運転席付近の集音手段にのみ入力される。そこで、2つの集音手段に入力された音声を差し引いて得られる音声を運転者の発話音声として音声認識処理に用いる。なお、オーディオとユーザの発話音声との区別は、異なる手法を用いて構成してもよい。
【0040】
実施の形態3.
上述した実施の形態1および実施の形態2では、車両状態やオーディオの出力音量に応じて認識パラメータの値を設定する構成を示したが、この実施の形態3では車両状態に応じて音声認識処理を停止する構成を示す。
図7は、実施の形態3による音声認識装置の構成を示すブロック図である。図7では、図1で示した認識パラメータ設定部10に替えて音声認識停止処理部12を備えている。なお、以下では、実施の形態1による音声認識装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
【0041】
車両状態検出部7は、実施の形態1で示した車速の検出以外に、ハンドルの回転角度、ハンドルの回転速度、ウインカのON/OFF状態、GPS信号を用いた現在位置情報から車両の進行方向、交差点への侵入などの車両状態の検出を行う。なお、GPS信号を用いた現在位置情報は、車両状態検出部7内で算出してもよいし、外部から取得してもよい。制御部9は、車両状態検出部7の検出結果に基づいて、ユーザが運転に集中すべき状況であるかを判断し、集中すべき状況であると判断した場合に、音声認識の停止指示を出力する。音声認識停止処理部12は、制御部9から入力される音声認識の停止指示に基づいて、音声処理部2、音響分析部3および音響データマッチング部5に停止信号を出力して、音声認識に関する処理を停止させる。さらに外部スピーカ(不図示)あるいは外部ディスプレイ(不図示)を介して音声認識を停止している旨を音声出力あるいは表示出力する。
【0042】
次に、実施の形態3による音声認識装置100の動作について図8のフローチャートを参照しながら説明する。なお、図8のフローチャートでは、車両情報としてハンドルの回転角度を検出し、当該ハンドルの回転角度が大きい場合にはユーザがハンドル動作に集中すべきであると判断し、音声認識処理を停止する場合を例に示す。
車両状態検出部7は、車内ネットワークを介して車両のハンドル回転角度を継続して取得し、取得した回転角度情報をメモリ部7aに記憶する(ステップST31)。
【0043】
一方、制御部9は音声認識開始指示が入力されたか否か判定する(ステップST32)。音声認識開始指示が入力されていない場合(ステップST32;NO)、ステップST31の処理に戻る。一方、音声認識開始指示が入力された場合(ステップST32;YES)、制御部9は、車両状態検出部7のメモリ部7aに記憶されたハンドル回転角度のうち、音声認識開始指示が入力された時点のハンドル回転角度が閾値以上であるか判定する(ステップST33)。
【0044】
ハンドル回転角度が閾値以上の場合(ステップST33;YES)、制御部9は車両がカーブなどを走行中でありハンドル操作に集中すべきと判断し、音声認識停止処理部12に音声認識の停止指示を出力する(ステップST34)。音声認識停止処理部12は、ステップST34で入力される停止指示に従って、音声処理部2、音響分析部3、および音響データマッチング部5に停止信号を出力し、音声認識に関する処理を停止させると共に、「現在、音声認識は使用できません。運転に集中して下さい。」という応答メッセージを外部のスピーカ(不図示)から出力、あるいは外部のディスプレイ(不図示)に表示する(ステップST35)。
【0045】
ハンドル回転角度が閾値未満の場合(ステップST33;NO)、さらに制御部9は車両状態検出部7のメモリ部7aに記憶されたハンドル回転角度を取得し、ハンドル回転角度が閾値未満の状態が所定時間以上継続しているか否か判定する(ステップST36)。ハンドル回転角度が閾値未満の車両状態が所定時間以上継続していない場合(ステップST36;NO)、まだハンドル操作に集中すべき状態から脱していないと判断し、ステップST34の処理に進む。一方、ハンドル回転角度が閾値未満の車両状態が所定時間以上継続している場合(ステップST36;YES)、ハンドル操作に集中すべき状態から脱していると判断し、ステップST9の処理に進む。ステップST9以降の処理は、実施の形態1と同様である。
【0046】
なお、上述したステップST34およびST35において、音声認識に関する処理を停止させると共に、応答メッセージを出力する構成を示したが、制御部9が音声認識開始指示の操作入力の受付を無効にし、さらに無効にした旨を音声認識停止処理部12に通知し、音声認識停止処理部12が警告を表示、あるいはブザー音を発するように構成してもよい。
【0047】
また、上述したステップST36においてハンドル回転角度が閾値未満の車両状態が所定時間以上継続しているか否か判断する際の時間は、例えば実施の形態1の図4で示した期間D、すなわち音声認識開始指示が入力された地点Oから所定期間遡った期間である。 なお、地点Oから遡る時間は適宜変更可能である。
【0048】
また、上述した図8のフローチャートでは車両情報としてハンドルの回転角度を検出し、回転角度が大きい場合には車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる構成を示したが、ハンドルの回転角度以外の種々の車両情報に基づいて音声認識処理の実施あるいは停止を制御することができる。
具体的には、車両情報としてハンドルの回転速度を検出し、音声認識開始指示が入力されてから所定期間遡った期間の回転速度の平均速度が閾値よりも速い時には車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる。また、ウインカのON/OFF状態からも同様に車両の進行方向の変化を把握することができる。ウインカのON/OFF状態の検知はウインカの点灯動作の有無あるいはウインカ動作音などに基づいて行う。また、GPS信号を用いて車両の進行方向を取得し、過去の一定期間の進行方向と現在の進行方向との差異が一定値以上である場合に、車両の進行方向が大きく変化していると判断して音声認識に関する処理を停止させる。
【0049】
さらに、既知の白線検知手法を用いて、車線変更時などに起こる、道路上の白線が延びる方向と車両の進行方向との差異から車両の進行方向の変化を把握する、あるいは既知の交差点への進入検知手法を用いて車両の交差点への進入を判断して車両の進行方向の変化を把握することも可能である。なお、交差点への進入は、地図情報などを参照して判断する。地図情報は音声認識装置100内に設けた記憶領域(不図示)に記憶させてもよいし、外部装置から取得してもよい。また、これらのハンドルの回転角度、ハンドルの回転速度、ウインカのON/OFF状態、車両の進行方向の変化および車両の交差点への信号を組み合わせて、制御部9が車両の進行方向の変化を判定してもよい。
【0050】
以上のように、この実施の形態3によれば、車両状態検出部7が検出した車両状態に基づいて、ユーザが運転に集中すべき状況であるかを判断して音声認識の停止指示を出力する制御部9と、制御部9から出力された音声認識の停止指示に基づいて停止信号を出力する音声認識停止処理部12とを備えるように構成したので、ユーザの運転状況に応じて音声認識処理を停止することができる。これにより、ユーザの安全運転を確保した音声認識処理を行うことができる。
【0051】
なお、上記実施の形態3では、車両状態に応じて音声認識の開始を停止する構成を示したが、マイク1、音声処理部2、音響分析部3および音響データマッチング部5において音声認識処理を行っている最中であっても車両状態に基づいて音声認識処理を停止する構成とすることも可能である。
【0052】
なお、上記実施の形態3では、車両状態検出部7が車両状態を取得する構成を示したが、車両状態検出部7に映像解析手段(不図示)を設けて、外部に設けたカメラなどが取得した映像を当該映像解析手段が解析し、解析した映像の変化率を算出し、映像の変化率が閾値以上である場合に車両の進行方向に大きな変化が生じていると判断してもよい。また、解析した映像中に特定の標識(特定の画像)が出現したときに車両の変化が大きくなると判断するように構成してもよい。
【0053】
さらに図9に示すように、音声認識装置100を搭載したナビゲーション装置200として構成してもよい。なお、図9では実施の形態3で示した構成を有する音声認識装置100を適用したブロック図を示したが、実施の形態1および実施の形態2で示した音声認識装置100を適用してナビゲーション装置200を構成してもよい。
ナビゲーション装置200は、音声認識装置100を備えると共に、ナビゲーション機能として自車両の現在位置を取得する位置情報取得部21、地図データを記憶する地図データ記憶部22と、現在位置と地図データを用いて経路探索を行って経路案内情報を生成する経路案内部23と、生成した経路案内情報を表示または音声でユーザに提示する出力部24を備えている。
音声認識装置100は、ユーザが目的地や経由地を音声入力した場合に、当該音声入力を音声発話としてマイク1に取り込み、上述した実施の形態1から実施の形態3で示したいずれかの音声認識処理により音声認識を行い、音声認識結果を経路案内部23に出力する。経路案内部23は、入力された音声認識結果に基づき、さらに位置情報取得部21から入力される自車位置情報および地図データ記憶部22に記憶された地図データを用いて経路探索を行い、経路案内情報を出力部24から出力する。
【0054】
さらに、音声認識装置100をナビゲーション装置200に搭載した場合、位置情報取得部21から現在位置情報を取得し、車両の進行方向、交差点への進入などの車両状態の検出を行うように構成してもよい。同様に、地図データ記憶部22に記憶された地図データを参照し、自車両の交差点への進入を判断するように構成してもよい。
【0055】
このように、音声認識装置100をナビゲーション装置に搭載することにより、車両の運転状態に適した音声認識処理により得られた音声認識結果を用いて経路案内を行うことができ、ユーザの安全運転を支援するナビゲーション装置を提供することができる。また、認識性能の高い認識結果を用いて経路探索を行うことができる。
【0056】
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
【符号の説明】
【0058】
1 マイク、2 音声処理部、3 音響分析部、4 認識辞書格納部、5 音響データマッチング部、6 ゲイン設定部、7 車両状態検出部、8 認識パラメータ格納部、9 制御部、10 認識パラメータ設定部、11 オーディオ出力検知部、12 音声認識停止処理部、7a,11a メモリ部、21 位置情報取得部、22 地図データ記憶部、23 経路案内部、24 出力部、100 音声認識装置、200 ナビゲーション装置。
この発明に係る音声認識装置は、音声認識装置を搭載する車両の車両状態を検出する車両状態検出部と、音響照合部が集音部に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部と、車両状態検出部で検出された車両状態が音声認識処理の開始を指示する操作入力を受け付けた時点から所定時間遡った期間継続して所定の条件を満たしている場合に、認識パラメータ設定部に認識パラメータの変更を指示する制御部とを備えるものである。

Claims (17)

  1. 入力された音声を取得する集音部と、
    前記集音部が取得した音声をデジタル信号処理する音声処理部と、
    前記音声処理部により処理された音声信号の音響分析を行い、音響特徴を時系列で示した音響特徴量に変換する音響分析部と、
    前記音響分析部が変換した音響特徴量と認識語彙との対応を記述した認識辞書と、
    前記音響特徴量と前記認識辞書とを照合し、前記集音部に入力された音声を認識する音響照合部とを備えた音声認識装置において、
    前記音声認識装置を搭載する車両の車両状態を検出する車両状態検出部と、
    前記音響照合部が前記集音部に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部と、
    前記車両状態検出部で検出された車両状態が所定の条件を満たす場合に、前記認識パラメータ設定部に認識パラメータの変更を指示する制御部とを備えたことを特徴とする音声認識装置。
  2. 前記車両状態検出部は、前記車両の車速を検出し、
    前記制御部は、音声認識処理開始を指示する操作入力を受け付けると、当該操作入力を受け付けた時点から所定時間遡った期間に前記車両状態検出部が検出した車速の変化が閾値以上である場合に、前記認識パラメータ設定部に認識パラメータの変更を指示することを特徴とする請求項1記載の音声認識装置。
  3. 前記制御部は、前記車速の変化が閾値以上である場合に、前記認識パラメータのうち、音声入力の終了を検知するタイムアウト時間を定常値より長い値に設定することを特徴とする請求項2記載の音声認識装置。
  4. 前記制御部は、前記車速の変化が閾値未満であり、且つ前記操作入力を受け付けた時点から所定時間遡った期間継続して前記車速の変化が閾値未満である場合に、前記認識パラメータを定常値へ復帰させることを特徴とする請求項2記載の音声認識装置。
  5. 入力された音声を取得する集音部と、
    前記集音部が取得した音声をデジタル信号処理する音声処理部と、
    前記音声処理部により処理された音声信号の音響分析を行い、音響特徴を時系列で示した音響特徴量に変換する音響分析部と、
    前記音響分析部が変換した音響特徴量と認識語彙との対応を記述した認識辞書と、
    前記音響特徴量と前記認識辞書とを照合し、集音部に入力された音声を認識する音響照合部とを備えた音声認識装置において、
    前記音声認識装置を搭載した車両内に設置されたオーディオ装置から出力される音声信号の音量を検知するオーディオ出力検知部と、
    前記集音部の音声取得ゲインを設定するゲイン設定部と、
    前記オーディオ出力検知部が検知した音声信号の音量が閾値以上である場合に、前記ゲイン設定部に音声取得ゲインを定常値より小さい値に設定するよう指示する制御部とを備えたことを特徴とする音声認識装置。
  6. 前記制御部は、音声認識処理開始を指示する操作入力を受け付けると、当該操作入力を受け付けた直前の音声信号の音量が閾値以上であるか判定することを特徴とする請求項5記載の音声認識装置。
  7. 前記制御部は、前記音声信号の音量が閾値未満であり、且つ前記操作入力を受け付けた時点から所定時間遡った期間継続して前記音声信号の音量が閾値未満である場合に、前記音声取得ゲインを定常値に復帰させることを特徴とする請求項6記載の音声認識装置。
  8. 入力された音声を取得する集音部と、
    前記集音部が取得した音声をデジタル信号処理する音声処理部と、
    前記音声処理部により処理された音声信号の音響分析を行い、音響特徴を時系列で示した音響特徴量に変換する音響分析部と、
    前記音響分析部が変換した音響特徴量と認識語彙との対応を記述した認識辞書と、
    前記音響特徴量と前記認識辞書とを照合し、前記集音部に入力された音声を認識する音響照合部とを備えた音声認識装置において、
    前記音声認識装置を搭載する車両の車両状態を検出する車両状態検出部と、
    前記音響照合部が前記集音部に入力された音声を認識する際の認識パラメータを設定する認識パラメータ設定部と、
    前記車両状態検出部で検出された車両状態が所定の条件を満たす場合に、音声認識処理の停止を指示する制御部と、
    前記制御部から音声認識処理の停止が指示されると、前記音声処理部、前記音響分析部および前記音響照合部のうち少なくとも1つの音声認識処理を停止させる音声認識停止処理部とを備えたことを特徴とする音声認識装置。
  9. 前記車両状態検出部は、前記車両のハンドルの回転角度または回転速度を検出し、
    前記制御部は、前記車両状態検出部が取得したハンドルの回転角度または回転速度が前記閾値以上である場合に、音声認識処理の停止を指示することを特徴とする請求項8記載の音声認識装置。
  10. 前記車両状態検出部は、前記車両のウインカの点灯情報を取得し、
    前記制御部は、前記ウインカが点灯している場合に、音声認識処理の停止を指示することを特徴とする請求項8記載の音声認識装置。
  11. 前記車両状態検出部は、前記車両の進行方向情報を取得し、
    前記制御部は、前記車両状態検出部で取得された進行方向情報を参照し、過去の車両の進行方向と現在の車両の進行方向との差異が閾値以上である場合に、音声認識処理の停止を指示することを特徴とする請求項8記載の音声認識装置。
  12. 前記車両状態検出部は、前記車両の進行方向情報および道路上の白線情報を取得し、
    前記制御部は、前記車両状態検出部で取得された進行方向情報および白線情報を参照し、車両の進行方向と白線の延伸方向との差異が閾値以上である場合に、音声認識処理の停止を指示することを特徴とする請求項8記載の音声認識装置。
  13. 前記制御部は、地図情報および前記車両の現在位置情報を参照し、前記車両が交差点に進入している場合に、音声認識処理の停止を指示することを特徴とする請求項8記載の音声認識装置。
  14. 前記制御部は、前記車両状態が所定の条件を満たさず、且つ音声認識開始処理の操作入力を受け付けた時点から所定時間遡った期間継続して前記所定の条件を満たしていない場合に、前記音声認識処理の停止指示を解除することを特徴とする請求項8記載の音声認識装置。
  15. 前記制御部は、前記音声認識停止処理部に音声認識処理の停止を指示している場合に、音声認識開始を指示する操作入力の受け付けを無効とすることを特徴とする請求項8記載の音声認識装置。
  16. 前記音声認識停止処理部は、前記制御部が音声認識開始を指示する操作入力の受け付けを無効とした旨を表示または音声により通知することを特徴とする請求項15記載の音声認識装置。
  17. 請求項1から請求項16のうちのいずれか1項記載の音声認識装置を搭載し、
    前記車両の現在位置を取得する位置情報取得部と、
    地図データを記憶する地図データ記憶部と、
    前記音声認識装置において音声認識処理された音声入力情報に基づいて、前記地図データ記憶部に格納された地図データおよび前記位置情報取得部で取得された前記車両の現在位置を用いて、前記車両の経路を案内する経路案内部と、
    前記経路案内部の経路案内を表示または音声出力する出力部とを備えたナビゲーション装置。
JP2013508631A 2011-04-08 2011-04-08 音声認識装置およびナビゲーション装置 Active JP5709980B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/002103 WO2012137263A1 (ja) 2011-04-08 2011-04-08 音声認識装置およびナビゲーション装置

Publications (2)

Publication Number Publication Date
JPWO2012137263A1 true JPWO2012137263A1 (ja) 2014-07-28
JP5709980B2 JP5709980B2 (ja) 2015-04-30

Family

ID=46968705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508631A Active JP5709980B2 (ja) 2011-04-08 2011-04-08 音声認識装置およびナビゲーション装置

Country Status (5)

Country Link
US (1) US9230538B2 (ja)
JP (1) JP5709980B2 (ja)
CN (1) CN103403798B (ja)
DE (1) DE112011105136B4 (ja)
WO (1) WO2012137263A1 (ja)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US9052197B2 (en) 2012-06-05 2015-06-09 Apple Inc. Providing navigation instructions while device is in locked mode
US20130321400A1 (en) 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
US10156455B2 (en) 2012-06-05 2018-12-18 Apple Inc. Context-aware voice guidance
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
CN103871401B (zh) * 2012-12-10 2016-12-28 联想(北京)有限公司 一种语音识别的方法及电子设备
JP2015018146A (ja) * 2013-07-12 2015-01-29 株式会社Nttドコモ 機能管理システム及び機能管理方法
CN104345649B (zh) * 2013-08-09 2017-08-04 晨星半导体股份有限公司 应用于声控装置的控制器与相关方法
US9469247B2 (en) * 2013-11-21 2016-10-18 Harman International Industries, Incorporated Using external sounds to alert vehicle occupants of external events and mask in-car conversations
DE102013021861A1 (de) * 2013-12-20 2015-06-25 GM Global Technology Operations LLC (n. d. Ges. d. Staates Delaware) Verfahren zum Betrieb eines Kraftfahrzeuges mit einer Spracheingabevorrichtung, Kraftfahrzeug
KR101621774B1 (ko) 2014-01-24 2016-05-19 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
WO2015111772A1 (ko) 2014-01-24 2015-07-30 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
KR101621766B1 (ko) 2014-01-28 2016-06-01 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
JP6427755B2 (ja) * 2014-02-24 2018-11-28 パナソニックIpマネジメント株式会社 データ入力装置、データ入力方法、プログラム及び車載機
KR101621780B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101621797B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101569343B1 (ko) * 2014-03-28 2015-11-30 숭실대학교산학협력단 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
US9826135B2 (en) * 2014-03-31 2017-11-21 Sony Corporation Information processing method, control device, recording device, information processing system and program
JP2015215433A (ja) * 2014-05-09 2015-12-03 株式会社ナビタイムジャパン 情報提供システム、端末装置、情報提供サーバ、情報提供方法、および、プログラム
DE102014009689A1 (de) * 2014-06-30 2015-12-31 Airbus Operations Gmbh Intelligentes Soundsystem/-modul zur Kabinenkommunikation
JP6011584B2 (ja) * 2014-07-08 2016-10-19 トヨタ自動車株式会社 音声認識装置及び音声認識システム
CN106486127A (zh) * 2015-08-25 2017-03-08 中兴通讯股份有限公司 一种语音识别参数自动调整的方法、装置及移动终端
KR102444061B1 (ko) * 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
DE102016204315A1 (de) 2016-03-16 2017-09-21 Bayerische Motoren Werke Aktiengesellschaft Fortbewegungsmittel, System und Verfahren zur Anpassung einer Länge einer erlaubten Sprechpause im Rahmen einer Spracheingabe
EP3434024B1 (en) * 2016-04-21 2023-08-02 Hewlett-Packard Development Company, L.P. Electronic device microphone listening modes
JP6725933B2 (ja) * 2016-05-14 2020-07-22 株式会社ユピテル システム及びプログラム
FR3056813B1 (fr) * 2016-09-29 2019-11-08 Dolphin Integration Circuit audio et procede de detection d'activite
CN106525070B (zh) * 2016-10-31 2019-07-19 成都路行通信息技术有限公司 一种汽车运动状态的检测方法和系统
US10276161B2 (en) * 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10580405B1 (en) * 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
KR102350306B1 (ko) * 2017-04-18 2022-01-13 엘지전자 주식회사 차량 내 음성 제어 방법
DE102017207038A1 (de) * 2017-04-26 2018-10-31 Bayerische Motoren Werke Aktiengesellschaft Spracheingabe bei einem Kraftfahrzeug
CN108364663A (zh) * 2018-01-02 2018-08-03 山东浪潮商用系统有限公司 一种自动录制人声的方法及模块
US11223339B2 (en) * 2018-02-06 2022-01-11 Mitsubishi Electric Corporation Sound control device for vehicle and sound control method for vehicle
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
US10490207B1 (en) * 2018-05-11 2019-11-26 GM Global Technology Operations LLC Automated speech recognition using a dynamically adjustable listening timeout
US10468026B1 (en) * 2018-08-17 2019-11-05 Century Interactive Company, LLC Dynamic protection of personal information in audio recordings
JP2020085953A (ja) * 2018-11-16 2020-06-04 トヨタ自動車株式会社 音声認識支援装置及び音声認識支援プログラム
JP2020170101A (ja) * 2019-04-04 2020-10-15 日本電信電話株式会社 音量調整装置、その方法、およびプログラム
CN110217242A (zh) * 2019-04-25 2019-09-10 深圳航天科创智能科技有限公司 一种汽车导航语音识别方法及系统
CN110415710B (zh) * 2019-08-06 2022-05-31 大众问问(北京)信息科技有限公司 车载语音交互系统的参数调整方法、装置、设备及介质
CN112542164B (zh) * 2019-09-19 2024-01-26 中车时代电动汽车股份有限公司 一种车辆方向盘的语音控制方法、装置、设备及存储介质
CN111081243A (zh) * 2019-12-20 2020-04-28 大众问问(北京)信息科技有限公司 一种反馈方式调整方法、装置及设备
WO2021186679A1 (ja) * 2020-03-19 2021-09-23 日産自動車株式会社 音声認識装置及び音声認識方法
CN111580775B (zh) * 2020-04-28 2024-03-05 北京小米松果电子有限公司 信息控制方法及装置、存储介质
KR20220013799A (ko) * 2020-07-27 2022-02-04 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
US12027163B2 (en) * 2020-07-27 2024-07-02 Samsung Electronics Co., Ltd. Electronic device and operation method thereof
CN118398011B (zh) * 2024-06-26 2024-10-11 广州小鹏汽车科技有限公司 语音请求处理方法、服务器设备以及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09329458A (ja) * 1996-06-12 1997-12-22 Toyota Central Res & Dev Lab Inc 車載用情報音読装置
JPH11342808A (ja) * 1998-06-04 1999-12-14 Toyota Motor Corp 音声入力機能付きの車両用方向指示器
JP2000338994A (ja) * 1999-05-27 2000-12-08 Fujitsu Ten Ltd 車載用音声認識装置
JP2000353294A (ja) * 1999-06-11 2000-12-19 Fujitsu Ten Ltd 車載用情報提供装置及び音声認識装置
JP2002055696A (ja) * 2000-08-11 2002-02-20 Mitsubishi Motors Corp 車両用音声操作装置
JP2004045616A (ja) * 2002-07-10 2004-02-12 Equos Research Co Ltd 車載装置、データ作成装置、及びデータ作成プログラム
JP2004348657A (ja) * 2003-05-26 2004-12-09 Nissan Motor Co Ltd 車両用情報提供方法および車両用情報提供装置
JP2005142936A (ja) * 2003-11-07 2005-06-02 Clarion Co Ltd 車載用音響装置、車載用音響装置の制御方法、車載用音響装置の制御プログラム、及び記録媒体
JP2006195302A (ja) * 2005-01-17 2006-07-27 Honda Motor Co Ltd 音声認識システム及びこの音声認識システムを備える車両
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
JP2010119108A (ja) * 1999-03-30 2010-05-27 Qualcomm Inc 移動電話内のスピーカ利得およびマイクロフォン利得を自動的に調整するための方法および装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3119510B2 (ja) 1991-10-28 2000-12-25 株式会社リコー 音声認識装置
JPH08297497A (ja) 1995-04-27 1996-11-12 Fujitsu Ten Ltd 車両用音声処理装置
US6744882B1 (en) 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US6259892B1 (en) * 1997-09-19 2001-07-10 Richard J. Helferich Pager transceiver and methods for performing action on information at desired times
US6434527B1 (en) * 1999-05-17 2002-08-13 Microsoft Corporation Signalling and controlling the status of an automatic speech recognition system for use in handsfree conversational dialogue
JP2002041073A (ja) 2000-07-31 2002-02-08 Alpine Electronics Inc 音声認識装置
JP2004198832A (ja) 2002-12-19 2004-07-15 Nissan Motor Co Ltd 音声認識装置
JP4497834B2 (ja) * 2003-04-28 2010-07-07 パイオニア株式会社 音声認識装置及び音声認識方法並びに音声認識用プログラム及び情報記録媒体
US6889189B2 (en) * 2003-09-26 2005-05-03 Matsushita Electric Industrial Co., Ltd. Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations
DE102005014486B4 (de) 2004-03-31 2009-04-09 Honda Motor Co., Ltd. Fahrrad-Simulationsvorrichtung
JP4469644B2 (ja) 2004-03-31 2010-05-26 本田技研工業株式会社 自転車シミュレーション装置
JP4469645B2 (ja) 2004-03-31 2010-05-26 本田技研工業株式会社 二輪車シミュレーション装置
JP4804052B2 (ja) * 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US8060368B2 (en) * 2005-12-07 2011-11-15 Mitsubishi Electric Corporation Speech recognition apparatus
WO2007069377A1 (ja) * 2005-12-14 2007-06-21 Mitsubishi Electric Corporation 音声認識装置
JP2008064885A (ja) * 2006-09-05 2008-03-21 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識プログラム
JP4471128B2 (ja) * 2006-11-22 2010-06-02 セイコーエプソン株式会社 半導体集積回路装置、電子機器
US8140325B2 (en) 2007-01-04 2012-03-20 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
JP4466718B2 (ja) * 2007-11-01 2010-05-26 トヨタ自動車株式会社 走行軌跡生成方法及び走行軌跡生成装置
US9302630B2 (en) * 2007-11-13 2016-04-05 Tk Holdings Inc. System and method for receiving audible input in a vehicle
CN201611572U (zh) 2009-09-29 2010-10-20 北京爱国者存储科技有限责任公司 一种带有自动增益功能的录音笔
JP5916054B2 (ja) * 2011-06-22 2016-05-11 クラリオン株式会社 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
JP5831308B2 (ja) * 2012-03-13 2015-12-09 アイシン・エィ・ダブリュ株式会社 移動体位置検出システム、移動体位置検出装置、移動体位置検出方法及びコンピュータプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09329458A (ja) * 1996-06-12 1997-12-22 Toyota Central Res & Dev Lab Inc 車載用情報音読装置
JPH11342808A (ja) * 1998-06-04 1999-12-14 Toyota Motor Corp 音声入力機能付きの車両用方向指示器
JP2010119108A (ja) * 1999-03-30 2010-05-27 Qualcomm Inc 移動電話内のスピーカ利得およびマイクロフォン利得を自動的に調整するための方法および装置
JP2000338994A (ja) * 1999-05-27 2000-12-08 Fujitsu Ten Ltd 車載用音声認識装置
JP2000353294A (ja) * 1999-06-11 2000-12-19 Fujitsu Ten Ltd 車載用情報提供装置及び音声認識装置
JP2002055696A (ja) * 2000-08-11 2002-02-20 Mitsubishi Motors Corp 車両用音声操作装置
JP2004045616A (ja) * 2002-07-10 2004-02-12 Equos Research Co Ltd 車載装置、データ作成装置、及びデータ作成プログラム
JP2004348657A (ja) * 2003-05-26 2004-12-09 Nissan Motor Co Ltd 車両用情報提供方法および車両用情報提供装置
JP2005142936A (ja) * 2003-11-07 2005-06-02 Clarion Co Ltd 車載用音響装置、車載用音響装置の制御方法、車載用音響装置の制御プログラム、及び記録媒体
JP2006195302A (ja) * 2005-01-17 2006-07-27 Honda Motor Co Ltd 音声認識システム及びこの音声認識システムを備える車両
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム

Also Published As

Publication number Publication date
DE112011105136B4 (de) 2018-12-13
CN103403798A (zh) 2013-11-20
WO2012137263A1 (ja) 2012-10-11
CN103403798B (zh) 2016-09-28
US20130253933A1 (en) 2013-09-26
DE112011105136T5 (de) 2014-02-06
US9230538B2 (en) 2016-01-05
JP5709980B2 (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
JP5709980B2 (ja) 音声認識装置およびナビゲーション装置
JP4859982B2 (ja) 音声認識装置
US10176806B2 (en) Motor vehicle operating device with a correction strategy for voice recognition
JP4846735B2 (ja) 音声認識装置
WO2017081960A1 (ja) 音声認識制御システム
JP4433704B2 (ja) 音声認識装置および音声認識用プログラム
JP2012128440A (ja) 音声対話装置
JP2007219207A (ja) 音声認識装置
JP2010204637A (ja) 音声認識装置、音声認識方法、及びナビゲーション装置
JPWO2014068788A1 (ja) 音声認識装置
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP4400951B2 (ja) 車載用音声認識装置、及び車載用音声認識制御方法
JP4910563B2 (ja) 音声認識装置
JP2008250236A (ja) 音声認識装置および音声認識方法
JP2018116206A (ja) 音声認識装置、音声認識方法及び音声認識システム
JP5074759B2 (ja) 対話制御装置、対話制御方法及び対話制御プログラム
JP2000321080A (ja) 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置
JP2019197964A (ja) マイク制御装置
JP2019211599A (ja) 音声認識装置、音声認識方法およびプログラム
JPH08211892A (ja) 音声認識装置
US20220415318A1 (en) Voice assistant activation system with context determination based on multimodal data
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
KR20080061901A (ko) 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템
WO2023157783A1 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP2019191477A (ja) 音声認識装置及び音声認識方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150303

R150 Certificate of patent or registration of utility model

Ref document number: 5709980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250