JP3979080B2 - Voice recognition device - Google Patents

Voice recognition device Download PDF

Info

Publication number
JP3979080B2
JP3979080B2 JP2001384452A JP2001384452A JP3979080B2 JP 3979080 B2 JP3979080 B2 JP 3979080B2 JP 2001384452 A JP2001384452 A JP 2001384452A JP 2001384452 A JP2001384452 A JP 2001384452A JP 3979080 B2 JP3979080 B2 JP 3979080B2
Authority
JP
Japan
Prior art keywords
vehicle control
control command
information
accuracy
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001384452A
Other languages
Japanese (ja)
Other versions
JP2003186492A (en
Inventor
泰久 早川
浩介 佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2001384452A priority Critical patent/JP3979080B2/en
Publication of JP2003186492A publication Critical patent/JP2003186492A/en
Application granted granted Critical
Publication of JP3979080B2 publication Critical patent/JP3979080B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Steering Control In Accordance With Driving Conditions (AREA)
  • Traffic Control Systems (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、車両の走行状態を変更するための車両制御指令を、音声認識と操作入力装置とを用いることによって、操作感を保ちつつ簡単に行うための音声認識装置であって、特に、アクセル、ブレーキ及び操舵を自律的に制御することが可能であり、かつ、ドライバからの指令を受け付けることが可能な自律走行車両において好適な音声認識装置に関する。
【0002】
【従来の技術
音声認識インタフェースの車両制御への導入としては、例えば、トヨタ自動車による特開2000−320657号明細書に記載のものがあり、この音声認識インタフェースでは、音声認識によって走行特性を音声によって所定のモードに設定することにより、例えば、電子スロットルの開度の制御や、二輪駆動と四輪駆動との間での駆動方式の切り替えなどを行っている。また、例えば、路面μが明らかに高いことを感知し、雪が降っていないと判断すると、ドライバからの音声指令が音声認識によって「雪」と認識されても、このような制御は適切でなく、誤認識であったと判断して、処理を中止するような制御もしている。
【0003】
このような車両特性のみの制御の場合には、誤認識によって車両特性を変更したとしても、進路方向が変わるなど走行上大きな影響があるわけではなく、また処理を中止しても、走行上のドライバの感覚を大きく損なうことはない。しかし、加減速や操舵を自律的に制御する車両においてこのような音声認識による制御を導入する場合、意図しない方向への制御が加わったり、逆に判定を厳しくしすぎて意図する制御が行われなかったりすると、操作性は著しく損なわれてしまう。そのために、一般的に用いられる音声による指令の復唱や、モニタ画面やタッチパネル画面で確認を行う確認手段を常にとるようにすると、今度は音声指令を与えてから実行までに時間がかかり、使い勝手が悪くなってしまう。それで、車両が認識した音声指令がどの程度ドライバの意図する指令と一致しているかの一致度合い(ここでは、確度と呼ぶ)を向上させると共に、制御指令が実行に移される前に高い確度が得られていることを、時間遅れによって操作性を損なうことなくドライバが確認できるようにすることが必要である。
【0004】
したがって、本発明の目的は、ドライバによる音声指令を、操作感を損なうことなく、簡単かつ迅速に実行するために、音声入力に加えて操作入力及び道路情報を用いることによって、ドライバの意図する指令との一致度合いを示す「確度」を高く保ちつつ、ドライバからの直接的な操作入力を併用することによって、迅速な音声認識を可能にする音声認識装置を提供することである。
【0005】
【課題を解決するための手段】
本発明の請求項1に記載の発明は、
音声入力情報を認識する音声入力認識手段と、
操作入力情報を認識する操作入力認識手段と、
前記音声入力認識手段が認識した音声入力情報と前記操作入力認識手段が認識した指令とに基づいて車両制御指令を生成する車両制御指令生成手段と、
前記車両制御指令生成手段により生成された車両制御指令に基づいて車両の加減速及び操舵を制御する車両制御手段と
車両が移行可能な分岐情報と、地図情報から得られる車線幅などの道路構造と、外界認識センサやインフラ情報などから得られる混雑度などの道路状況と、前記分岐情報の各分岐までの距離に応じた重み付けである距離係数とのうち少なくとも1つを含む道路情報とを認識する道路情報認識手段と、
前記分岐情報における車両が移行可能な各分岐に移行する確度を、前記音声入力情報と、操作入力情報と、道路情報とに基づいて算出する確度算出手段と、を具え、前記車両制御指令生成手段が、最も高い確度の分岐への移行を行わせる指令を前記車両制御指令として生成することを特徴とする音声認識装置である。
【0006】
本発明の請求項に記載の発明は、請求項1に記載の音声認識装置において、前記音声入力認識手段が、前記音声入力情報において、車両制御動作の目標と、前記目標に対する動作と、前記動作の方向とのうち少なくとも1つを認識することを特徴とする音声認識装置である。
【0007】
本発明の請求項に記載の発明は、請求項1又は2に記載の音声認識装置において、前記車両制御指令生成手段が、前記車両制御指令をただちに前記車両制御手段に送るか否かを前記確度に応じて判断することを特徴とする音声認識装置である。
【0008】
本発明の請求項に記載の発明は、請求項1ないし3のいずれか1項に記載の音声認識装置において、前記確度算出手段が、前記車両が移行可能な各分岐に移行する確度を算出する際に、前記音声入力情報と、操作入力情報と、道路情報との中で欠けている情報があっても、残りの情報に基づいて前記確度を算出することを特徴とする音声認識装置である。
【0009】
本発明の請求項に記載の発明は、請求項1ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、前記音声入力情報が前記操作入力情報と実際的に同時に入力された場合にのみ車両制御指令を生成することを特徴とする音声認識装置である。
【0010】
本発明の請求項に記載の発明は、請求項1ないし5のいずれか1項に記載の音声認識装置において、前記確度算出手段が、前記確度の算出後に追加の音声入力情報及び/又は操作入力情報があった場合、これらの追加の情報にも基づいて確度を再算出することを特徴とする音声認識装置である。
【0011】
本発明の請求項に記載の発明は、請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、現在の走行速度に関する情報を受け、現在の走行速度に応じて、前記道路情報を取得する範囲と、各分岐への移行確度に付与する重みとを決定することを特徴とする音声認識装置である。
【0012】
本発明の請求項に記載の発明は、請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、操作入力装置に加えられた力の大きさに応じて道路情報(距離係数)を決定することを特徴とする音声認識装置である。
【0013】
本発明の請求項に記載の発明は、請求項1ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、前記車両制御指令についての情報をドライバに提示する制御指令提示手段をさらに具え、前記車両制御指令を前記車両制御手段に送る際、前記制御指令提示手段がこの車両制御指令についての情報を提示することを特徴とする音声認識装置である。
【0014】
本発明の請求項10に記載の発明は、請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が車両制御指令を前記車両制御手段にすぐに送らないと判断した場合、最も確度の高い分岐への移行に関する車両制御指令を実行するか否かの質問を前記制御指令提示手段によってドライバに対して提示する制御指令確認手段をさらに具え、この質問に対する音声入力及び/又は操作入力に応じて前記車両制御指令生成手段が前記車両制御指令を前記車両制御手段に送るか否かを決定することを特徴とする音声認識装置である。
【0015】
本発明の請求項11に記載の発明は、請求項10に記載の音声認識装置において、前記制御指令確認手段が、ドライバに対して車両制御指令の実行の有無を確認する場合、この車両制御指令における目標が所定の距離以内に接近している場合、自動的に減速する指令を車両制御装置に送ることを特徴とする音声認識装置である。
【0016】
本発明の請求項12に記載の発明は、請求項10又は11に記載の音声認識装置において、ドライバからの応答が所定の時間内になかった場合、前記車両制御指令に対応する分岐の確度に応じて、前記車両制御装置に前記車両制御指令を送るか、同じ質問を再度提示するか、次に確度の高い分岐に対応する車両制御指令を実行するか否かに関する質問をドライバに提示するかのいずれかを選択することを特徴とする音声認識装置である。
【0017】
【発明の効果】
請求項1の発明によれば、ドライバからの指令として音声入力と操作入力が複合して入力されること、および、車両が走行中の道路の情報をあわせて認識することにより、ドライバが意図した指令を高精度に推定できるため、意図した指令を簡単かつ迅速に車両制御装置に伝達することが可能になるとともに、音声入力情報、操作入力情報及び道路情報を、各々の確からしさを表す確度を算出して評価するため、正確な推定を行うことが可能になる
【0018】
請求項の発明によれば、音声指令による車両動作の目標と、目標に対する動作と、動作の方向とを別々に認識することにより、音声入力情報にこれらのすべてが含まれていなくても車両制御指令を生成することが可能になる。
【0019】
請求項の発明によれば、車両制御をただちに実行するか否かを判断するために、情報の確かさを表す確度が算出されるので、確度が低い場合、違和感のないように対応を変えることが可能になる。
【0020】
請求項の発明によれば、ドライバからの指令入力と道路情報の中で、得られている情報の範囲内で制御指令を生成できるので、ドライバの感覚に合った柔軟な指令が可能になる。
【0021】
請求項の発明によれば、操作入力によってドライバが車両に対して音声で指令を与えたことが明示的に確認されるので、ラジオの音声や助手席の人との会話や独り言といった意図しない音声発話に対する誤作動を防止することが可能になる。
【0022】
請求項の発明によれば、確度が所定の値より低い場合、ポイントとなる指令のみを追加入力することによって、迅速に違和感なく車両に対して行いたい制御指令に関する情報を与えることが可能になる。
【0023】
請求項の発明によれば、走行速度に応じて検索する分岐情報の範囲が調節されるため、その範囲内での音声指令との照合が取れることで音声認識精度を向上することが可能になる。
【0024】
請求項の発明によれば、ドライバが早く制御指令を発行するように無意識又は意識的に加えた力に対して自車両近くの分岐への車両動作移行がしやすくなるので、感覚に合った制御指令の生成が可能になる。
【0025】
請求項の発明によれば、車両が実行する指令と一連の動作がドライバに提示され、車両が行う動作がドライバに伝えられるため、安心感を向上することができるようになる。
【0026】
請求項10の発明によれば、再入力をすることなく可能性が高い指令が提示されるので、ドライバへの負担を軽減することが可能になる。
【0027】
請求項11の発明によれば、分岐する可能性の高い指令対象が接近している際に、車両がそこを通過しないように減速するため、意図した指令を車両に対して確認をしている間に通過してしまうことを防止することが可能になる。
【0028】
請求項12の発明によれば、確度に応じて対応を変えることにより、ドライバの感覚に合った違和感のない指令系を構成することが可能になる。
【0029】
【発明の実施の形態】
図1は、本発明による音声認識装置の一実施形態を含む車両制御システムの一例を示すブロック図である。このシステムは、例えば、特に、アクセル、ブレーキ及び操舵を自律的に制御することが可能であり、かつ、ドライバからの指令を受け付けることが可能な自律走行車両の走行を制御するものであり、音声認識装置2と、ドライバインタフェース部4と、走行位置検出部6と、車両制御部8と、通信部10とを含む。ドライバインタフェース部4は、例えば、音声認識装置2にドライバからの音声入力指令を供給する音声入力装置12と、音声認識装置2からの車両の移行動作情報をドライバに提示する表示装置14と、音声認識装置2にドライバからの操作入力指令を供給する操作入力装置16と、音声認識装置2からの操作確認などをドライバに提示する音声発話装置18とを具える。走行位置検出部6は、例えば、音声認識装置2に車両の位置情報を供給するGPSナビゲーション装置20と、磁気ネイル検出装置22とを具える。車両制御部8は、例えば、音声認識装置2からの車両制御情報を受け、車両の操舵を制御する自動操舵装置24と、前車との車間距離を保つためのレーダ装置26と、音声認識装置2からの車両制御情報を受け、車両の速度を制御する車速制御装置28とを具える。通信部10は、例えば、路車間通信装置30と、車車間通信装置32とを具える。
【0030】
図1に示す本発明による音声認識装置2の一実施形態は、音声入力認識手段34と、操作入力認識手段36と、重み決定手段38と、道路情報認識手段40と、確度算出手段42と、車両制御指令生成手段44と、制御指令提示手段46と、制御指令確認手段48と、車両制御手段50とを具える。
【0031】
図2は、図1に音声認識装置2の動作を説明するフローチャートである。ステップS1において、ドライバインタフェース4の音声入力装置18からの音声入力情報を音声認識手段34が受ける。音声認識装置2は、これによって音声認識動作を開始する。
【0032】
ステップS2において、ドライバインタフェース4の操作入力装置14からの操作入力情報を操作入力認識手段36が受ける。なお、ステップS1の音声認識動作を、ステップS2における操作入力情報によって開始してもよく、また、音声の検出後しばらく操作入力がなかった場合には、音声認識動作を中止してもよい。また、操作入力がされた前後の音声検出結果を認識してもよい。
【0033】
ステップS3において、走行位置検出部6のGPSナビゲーション装置20や磁気ネイル検出装置22によって決定された自車位置情報と、属性を含めた道路情報とを道路情報認識手段40が受ける。なお、道路情報は、通信部10の路車間通信装置30や車車間通信装置32による、インフラや専用電波局からの通信や、周囲の車両との通信や、又は、自車両の外界認識センサなどから取得してもよく、例えば、図3に示すような自車と周囲の車両の位置が示された自車の周囲の一定範囲の地図のような情報とする。なお、交通法規によって決められている車線変更禁止区間や分岐可能な地点情報を道路属性として明示的に示された、例えば図4に示すようなデータあるいは通信手段によって補完された地図情報を用いてもよい。また、道路属性としては、道路幅、道路車線数、制限速度等を取得してもよい。
【0034】
ステップS4において、道路情報認識手段40は、ステップS3で得られた自車位置情報と道路情報とから、車両行動の方向を変更することが可能な経路分岐を車両が移行可能な分岐として認識し、分岐情報を発生する。移行可能な分岐は、右左折といった道路の分岐、車両変更や道路脇での停車や加減速するといった、同一道路上での移行可能な経路を含む。図5は、このような分岐情報を図式的に示したものである。また、車両行動を移行せずに現在の動きを継続するという分岐もあわせて保持しておいてもよい。
【0035】
ステップS5において、音声入力認識手段34は、前記音声入力情報から、指令目標を辞書情報との照合により抽出する。前記指令目標は、曲がった先の向かう方面の地名(例えば、「横浜」)や、曲がるポイント(例えば、「次の交差点」)や、施設(例えば、「ガソリンスタンド」)といったものを含む。前記辞書情報に含まれる単語との照合を行う際には、あるしきい値以上の尤度の単語をすべて抽出しておく。認識結果として、どれほど確実性があるかについて、認識された単語の相対的な確度を例えば尤度によって決定する。
【0036】
ステップS6において、音声入力認識手段34は、前記音声入力情報から、指令動作を辞書情報との照合により抽出する。前記指令動作は、「曲がる」、「入る」、「加速する」等を含む。ステップS5におけるのと同様に、前記辞書情報に含まれる単語との照合を行う際には、あるしきい値以上の尤度の単語をすべて抽出しておく。認識結果として、どれほど確実性があるかについて、認識された単語の相対的な確度を例えば尤度によって決定する。
【0037】
ステップS7において、音声入力認識手段34は、前記音声入力情報から、指令方向を辞書情報との照合により抽出する。前記指令方向は、例えば、「右」、「左」、「右斜め」等を含む。ここでもまたステップS5及びS6と同様に、前記辞書情報に含まれる単語との照合を行う際には、あるしきい値以上の尤度の単語をすべて抽出しておく。認識結果として、どれほど確実性があるかについて、認識された単語の相対的な確度を例えば尤度によって決定する。
【0038】
なお、ステップS5、S6及びS7において単語を辞書情報から選択する際、最も尤度が高いいくつかの単語のみを選択するようにしてもよい。また、ステップS5、S6及びS7で使用する辞書情報に関して、自車位置と連動する辞書情報に基づいて使用する辞書を設定してもよい。また、ステップS5、S6及びS7のすべてを認識する手段を具えなくてもよい。また、「左折」といった指令を「左」と「曲がる」に分解して抽出したり、「速度40」といった指令を現在の車速との比較により「加速」として変換して抽出したりしてもよい。この際には、「40」といった制御量に相当する部分について、他の「50」、「60」、「20」といった数値情報との一致度合いを含めて制御量の確度を尤度に基づいて保持しておき、後述するステップS13において実際に車両制御指令を発行する際にこの保持しておいた情報を使用してもよい。
【0039】
ステップS8において、道路情報認識手段40は、例えば、道路の幅や制限速度によって決定される容量などの、車両に搭載した地図情報から取得可能な道路の構造に関する車両の走行のし易さについての情報を、道路構造情報として取得する。
【0040】
ステップS9において、道路情報認識手段40は、車両が走行することによって決定される情報を取得する。このような情報は、例えば、走り易さについての係数を制限速度に対する交通の速度の割合として含む。交通の速度を、例えば、外界センサによって測定した先行車両の速度から推定し、又は、走行中の路車間通信などから得てもよい。また、ナビゲーションシステムによって予め走行する経路が設定されている場合、設定されている経路の重みが大きくなるように設定してもよく、例えば重みを2倍にする。
【0041】
ステップS10において、重み決定手段38は、距離係数を決定する。この距離係数は、ステップS4において得られた各分岐に移行する確度に関する重み付け係数であり、図6のaないしdは、このような距離係数を説明するグラフである。例えば、図6aに示すように自車両から指令対象までの距離に応じて重みが変化するように規定する。操作入力装置に加えられた力又は操作の変化量が大きくなった場合に、図6bに示すように自車両近くの重みが大きくなるようにしてもよい。また、このような重み付け特性を自車両の走行速度に応じて変化させてもよく、例えば、走行速度が高い場合、図6cに示すように、自車両付近は物理的に車両経路変更が困難だとみなして重みをゼロにしたり、重みを付与する前方距離を延長したりしてもよい。さらに、図6dに示すように、指数関数的に重みが変化するように設定してもよい。
【0042】
ステップS11において、確度算出手段42は、ステップS4において得られた各分岐に移行する確度を、ステップS2、S5、S6、S7、S8及びS9において得られた情報と、ステップS10において決定した距離係数とに基づいて算出し、車両制御指令生成手段44に供給する。この算出方法については後により詳細に説明する。
【0043】
ステップS12において、車両制御指令生成手段44は、ステップS11において算出した最も高い確度を有する分岐に移行する車両制御指令をすぐに車両制御手段50に供給するか否かを、前記確度に応じて決定する。ここで、例として、確度の値が0.8以上の場合は極高、0.65以上0.8未満の場合は高、0.5以上0.65未満の場合は中、0.5以下の場合は低として規定する。極高の場合、ステップS13へ進み、それ以外の場合、ステップS14へ進む。
【0044】
ステップS13において、対応する車両制御指令をすぐに車両制御手段50に供給する。これと同時に、制御指令提示手段46が、ドライバインタフェース部4の表示装置14及び/又は音声発話装置18を通じてドライバにこの車両制御指令を実行する旨を提示してもよい。さらに、ナビゲーションシステム20によって予め走行する経路が設定されている場合、選択された分岐に経路をリルートしてもよい。車両制御指令を受けた車両制御手段50は、周囲の車両に関する情報等を考慮しつつこの車両制御指令に基づいて車両制御部8を制御し、指令どおりに車両を走行させる。ドライバに情報提示を行ってから実際に指令を開始するまでの時間を、前記確度の高さに応じて変化させてもよい。また、実際に車両制御指令が車両制御手段50に供給されるまでの間、供給された後でも中止することが可能な時間内に、前記指令を取り消すキャンセル指令が入力された場合、指令をキャンセルする代わりにステップS14にジャンプすることもできる。この場合、連続したキャンセル指令が入力された場合、完全にキャンセルしてもよい。また、実際に車両制御指令が車両制御手段50に供給されるまでの間、供給された後でも中止することが可能な時間内にも音声入力及び/又は操作入力を受け付け、これらの入力を考慮した確度を再計算し、その結果に基づいてステップS12に戻ってもよい。また、ステップS5、S6及びS7に関して上述したように、音声指令によって速度「40」のように制御量が指定されていた場合の処理を行うが、これについては後に説明する。
【0045】
ステップS22において、車両制御指令が実行された後、保持されている各分岐への確度や車両制御指令をリセットし、次の音声入力及び/又は操作入力があるまで待機する。
【0046】
ステップS14において、ドライバによってすでに否定された分岐を除いた残りの分岐の中で最も確度の高い分岐に対応する車両制御指令を選択する。
【0047】
ステップS15、S20及びS21は、ステップS14で選択された車両制御指令の指令目標がどれくらい近いかについて判定し、オーバランを防止するためのルーチンである。
【0048】
ステップS15において、ステップ14で選択された車両制御指令の指令目標までの距離を決定し、現在の車速及び加速度を考慮して、前記指令目標に到達したときに減速しておく必要のある速度に達するためにある一定以上の減速が必要であるか否かを判定し、必要であると判定された場合、ステップS20に進み、そうでなければステップS21に進む。
【0049】
ステップS20において、車両制御手段50が、車両制御部8を制御して前記指令目標に相当する分岐点をオーバランしないように減速を開始すると共に、表示装置14及び/又は音声発話装置18によってドライバに対して手動運転への切り替えを促す。なお、その間に追加の入力が加わることで、ステップS12の極高に相当するだけの確度が得られた場合は、対応する車両制御指令を車両制御手段50に供給するためにステップS13へと進んでもよい。なお、ステップS15、S20及びS21を省略することもできる。
【0050】
ステップ21において、手動運転への切り替えがなされたか否かを判定する。手動運転への切り替えがされていた場合、自動操舵24及び車両制御装置28を解除する。手動運転への切り替えがされていなければステップS16へ進む。
【0051】
ステップS16において、制御指令確認手段48が、ステップS14で選択された車両制御指令を実行するか否かを表示装置14及び/又は音声発話装置18によってドライバに対して問い合わせる。
【0052】
ステップS17において、ドライバからの応答の有無を判定する。一定時間内に返答があればステップS18へ、返答がなければステップS19へと進む。このような返答は、音声によるものでも操作によるものでもよい。
【0053】
ステップS18において、前記返答が肯定を示すものであるか否かを判定する。肯定を示すものであった場合、ステップS13へと進む。そうでなければステップS14に進み、次に高い確度の分岐に関する車両制御指令に関して同様の処理を行う。なお、前記返答が肯定を示すものでも否定を示すものでもなかった場合、ステップS16にジャンプし、再度ドライバに確認することもできる。
【0054】
ステップS19において、現在処理している分岐の確度が高、中、低のいずれであるかについて判定し、高であればステップS13へ、中であればステップS16へ、低であればステップS14へと進む。なお、中又は低であってもステップS14へ進むモードや、高又は中であってもステップS16へ進むモードといったように、ステップS19における確度に応じて行う処理の分岐については、個別にステップS13、S14、S16のいずれかに接続するように設定してもよい。ただし、ステップS13、S16、S14の順に確度を割り当てた結果、S16への確度がS14以上であり、S13への確度がS16以上となるように設定する。また、ステップS14では、例えば、指令キャンセルスイッチ等の操作による任意の時点での指令キャンセルによって、保持された指令をすべてクリアすることができるようにしてもよい。
【0055】
上述したステップS11における確度の算出方法について説明する。ここで説明のための例として、図3に示すような道路を走行中に、先の交差点で横浜方面に左折するために、「横浜へ曲がる」と発話しながら、操作入力装置において左方向に操作した場合を考える。すなわち、このような操作の時点で図3のような道路情報が認識されており、図5に示すような分岐情報が得られているとする。
【0056】
図7は、このような例の場合において確度を算出するプロセスを説明する図である。フローF1において、「横浜へ曲がる」という音声に対する音声認識の結果、この例における分岐情報に含まれる指令目標に関する項目として、「横浜」に0.6、「横須賀」に0.3、「ガソリンスタンド」に0.1の尤度が認識され、指令動作に関する項目として、「曲がる」に0.6、「入る」に0.2、「加速」に0.2の尤度が認識されたとする。
【0057】
フローF2において、前記分岐情報における各分岐に移行する確度を割り当てる。上記のように認識された尤度に応じて、重み付けをする。この例の場合において、指令目標の「横浜」に対応する分岐に0.6、「横須賀」に対応する分岐に0.3、「ガソリンスタンド」に対応する分岐に0.1の値を与える。予め設定したしきい値以上の尤度がなかった項目に対応する分岐には、一定の値、この例においては0.1を与える。同様にして、指令動作の「曲がる」に対応する分岐に0.6、「車線変更」に対応する分岐に0.2、「入る」に対応する分岐に0.2、「加速」に対応する分岐に0.2の値を与え、予め設定したしきい値以上の尤度がなかった項目に対応する分岐には一定の値、この例においては0.1を与える。
【0058】
この例においては、指令方向に関する音声入力がないが、ある場合は上記の他の指令項目と同様に各分岐に重み付けの値を与える。この例のように関連する音声入力がない場合、すべての分岐に一定の値を与えておいてもよい。他の指令に関する音声入力がない場合も同様である。
【0059】
操作入力情報に関する確度は、操作入力装置において入力された方向に対応する分岐に最も高い値を与え、他の分岐に与える値を、この方向からずれればずれるほど重みが軽くなるように設定する。なお、認識された方向が複数ある場合には、複数の重みを重ねてもよい。なお、例えば、指令目標の交差点が立体交差の場合で右方向に向かうために、いったん現在走行中の道路から左方向に分岐する必要がある場合では、操作入力が右方向に入れられている場合でも左方向に入力されたものとみなし、左方向に対応する分岐への重み付けを重くしてもよい。
【0060】
道路構造情報に関する確度は、道路容量等に応じて各経路の重み付けの値を決定する。
【0061】
道路状況情報に関する確度は、混雑度や現在の走行速度等の車の走り易さに応じて各経路の重み付けの値を決定する。
【0062】
さらに、図2のステップS10に関して説明したような距離係数を各経路に与える。
【0063】
フローF3において、各分岐に関してフローF2で与えられた各情報に関する確度を各々掛け合わせる。この例の場合は各情報に関する確度を掛け合わせる際の重みを均等にしているが、情報間で重みを異ならせてもよい。
【0064】
フローF4は、最終的に算出された確度であり、その数値はすべての分岐に関する移行確度の和が1となるように、確度σ=(最も高い分岐の確度σ)/(Σ各分岐の確度σ)の計算によって基準化してある。この結果から、最も確度が高い分岐は、横浜方向に左折する動作に対応する分岐であることがわかり、その確度は0.86である。
【0065】
図8は、図7と同様の確度を算出するプロセスを説明する図であるが、この図に示す例では、各情報に関する確度を段階的に掛け合わせている。フローF1及びF2は、図7のものと同じであるが、フローF3において、音声入力情報に関する重みのみを掛け合わせた確度と、操作入力情報に関する重みのみを掛け合わせた確度と、道路情報及び距離係数に関する重みのみを掛け合わせた確度とを示している。この段階では、横浜方面に左折する動作に対応する分岐の確度は、それぞれ、0.54、0.28、0.11である。
【0066】
次のフローF3’において、フローF3で算出された3つの確度のうち各々2つを取り出して組み合わせた場合の確度を示している。この段階では、横浜方面に左折する動作に対応する分岐の確度は、0.59(音声入力情報+操作入力情報)、0.69(音声入力情報+道路情報及び距離係数)、0.48(操作入力情報+道路情報及び距離係数)である。
【0067】
フローF4において、フローF3で算出された値を掛け合わせると、横浜方面に左折する動作に対応する分岐の確度は0.86となり、図7の場合と同様になる。したがって、この図におけるフローF3及びF3’のような途中段階の確度は最終的な確度を算出するために必ずしも必要ではないが、このようにして各情報の確度を重ね合わせられる性質により、途中段階、あるいはいったん最終的な確度が算出された段階において、ある情報に関する追加の入力があった場合、この追加入力情報に関する確度をそのとき算出されている確度に掛け合わせることによって、各分岐の確度を新たに算出しなおすことができる。
【0068】
図9は、図7と同様であるが、音声入力として「車線変更」、操作入力として右方向への操作が行われた場合の確度の算出処理を説明する図であり、音声認識による各分岐の確度は、「車線変更」に対して0.7、「曲がる」に対して0.2、「加速」に対して0.2だったとした場合である。図7の場合と同様に算出された値は、ここでは「車線変更」に関する分岐が最も高く、0.96である。
【0069】
上述したステップS13における、ステップS5、S6及びS7において音声指令によって速度「40」のように制御量が指定されていた場合の処理について説明する。このような速度の例においては、現在の車速情報と道路の制限速度情報などと比較し、ステップS11における確度の計算のように、例えば制限速度に達する確度が最も高く、離れるにしたがって小さくなるように設定し、音声認識結果の尤度を図10に示すように掛け合わせて制御量を算出してもよい。
【図面の簡単な説明】
【図1】 本発明による音声認識装置の一実施形態を含む車両制御システムの一例を示すブロック図である。
【図2】 本発明による音声認識装置の一実施形態の動作を説明するフローチャートである。
【図3】 道路情報を表す地図情報の図である。
【図4】 道路属性を補完された地図情報の図である。
【図5】 a及びbは、分岐情報を図式的に示す図である。
【図6】 aないしdは、距離係数を説明するグラフである
【図7】 確度を算出するプロセスを説明する図である。
【図8】 確度を算出するプロセスを説明する図である。
【図9】 確度を算出するプロセスを説明する図である。
【図10】 制御量が指定されていた場合の処理について説明する図である。
【符号の説明】
2 音声認識装置
4 ドライバインタフェース部
6 走行位置検出部
8 車両制御部
10 通信部
12 音声入力装置
14 表示装置
16 操作入力装置
18 音声発話装置
20 GPSナビゲーション装置
22 磁気ネイル検出装置
24 自動操舵装置
26 レーダ装置
28 車速制御装置
30 路車間通信装置
32 車車間通信装置
34 音声入力認識手段
36 操作入力認識手段
38 重み決定手段
40 道路情報認識手段
42 確度算出手段
44 車両制御指令生成手段
46 制御指令提示手段
48 制御指令確認手段
50 車両制御手段
[0001]
BACKGROUND OF THE INVENTION
  The present invention relates to a voice recognition device for easily executing a vehicle control command for changing a running state of a vehicle while maintaining a feeling of operation by using voice recognition and an operation input device. The present invention relates to a speech recognition apparatus suitable for an autonomous traveling vehicle that can autonomously control braking and steering and can receive a command from a driver.
[0002]
【TraditionalTechnology]
  As an introduction to the vehicle control of the voice recognition interface, for example, there is one described in Japanese Patent Application Laid-Open No. 2000-320657 by Toyota Motor. In this voice recognition interface, the running characteristics are set to a predetermined mode by voice recognition. By setting, for example, control of the opening degree of the electronic throttle, switching of the driving method between two-wheel drive and four-wheel drive, and the like are performed. In addition, for example, when it is detected that the road surface μ is clearly high and it is determined that it is not snowing, even if the voice command from the driver is recognized as “snow” by voice recognition, such control is not appropriate, It is also determined that the recognition has been erroneously recognized and the processing is stopped.
[0003]
  In the case of such control of only the vehicle characteristics, even if the vehicle characteristics are changed due to misrecognition, there is no significant influence on the driving such as changing the course direction. The driver's feeling is not greatly impaired. However, when such voice recognition control is introduced in a vehicle that autonomously controls acceleration / deceleration and steering, control in an unintended direction is added, or conversely, the determination is made too strict and intended control is performed. Otherwise, the operability will be significantly impaired. For this reason, if we always use a confirmation method that repeats commands that are generally used by voice, and checks on the monitor screen or touch panel screen, it will take time from the time the voice command is given to the execution. It gets worse. Therefore, the degree of coincidence (here called accuracy) of how much the voice command recognized by the vehicle matches the command intended by the driver is improved, and high accuracy is obtained before the control command is put into execution. It is necessary for the driver to be able to confirm what is being done without losing operability due to time delay.
[0004]
  Accordingly, an object of the present invention is to use a command input intended by the driver by using the operation input and road information in addition to the voice input in order to easily and quickly execute the voice command by the driver without impairing the operational feeling. It is to provide a voice recognition device that enables quick voice recognition by using a direct operation input from a driver while maintaining a high “accuracy” indicating the degree of coincidence with the voice.
[0005]
[Means for Solving the Problems]
  The invention described in claim 1 of the present invention
  Voice input recognition means for recognizing voice input information;
  Operation input recognition means for recognizing operation input information;
  The voiceinputVehicle control command generation means for generating a vehicle control command based on the voice input information recognized by the recognition means and the command recognized by the operation input recognition means;
  Vehicle control means for controlling acceleration / deceleration and steering of the vehicle based on the vehicle control command generated by the vehicle control command generation means;,
  The branch information to which the vehicle can move, the road structure such as the lane width obtained from the map information, the road condition such as the congestion degree obtained from the external recognition sensor and the infrastructure information, and the distance to each branch of the branch information Road information recognition means for recognizing road information including at least one of distance coefficients that are weights according to
  The vehicle control command generating means, comprising: an accuracy calculating means for calculating a probability that the vehicle in the branch information is transferred to each branch to which the vehicle can move based on the voice input information, operation input information, and road information. Generates a command for making a transition to the branch with the highest accuracy as the vehicle control command.The speech recognition apparatus is characterized by the above.
[0006]
  Claims of the invention2According to the invention described in claim 1, in the voice recognition device according to claim 1, the voice input recognition means includes, in the voice input information, a vehicle control action target, an action with respect to the target, and a direction of the action. The speech recognition apparatus is characterized by recognizing at least one.
[0007]
  Claims of the invention3The invention described in claim 11 or 2The speech recognition apparatus according to claim 1, wherein the vehicle control command generation unit determines whether or not to immediately send the vehicle control command to the vehicle control unit according to the accuracy.
[0008]
  Claims of the invention4The invention described in claim 1Any one of 1 to 3In the voice recognition device according to claim 1, when the accuracy calculation means calculates the accuracy of shifting to each branch to which the vehicle can move, it is missing in the voice input information, operation input information, and road information. The speech recognition apparatus is characterized in that the accuracy is calculated based on the remaining information even if there is information.
[0009]
  Claims of the invention5The invention described in claim 1 to claim 14The voice recognition device according to any one of the above, wherein the vehicle control command generation means generates a vehicle control command only when the voice input information is actually input simultaneously with the operation input information. Is a voice recognition device.
[0010]
  Claims of the invention6The invention described in claim 1Any one of 1 to 5In the voice recognition device according to the above, if the accuracy calculation unit has additional voice input information and / or operation input information after the accuracy is calculated, the accuracy is recalculated based on the additional information. Is a voice recognition device characterized by
[0011]
  Claims of the invention7The invention described in claim 11Or6In the voice recognition device according to any one of the above, a range in which the vehicle control command generation unit receives information on the current travel speed and acquires the road information according to the current travel speed, and to each branch The speech recognition apparatus is characterized in that a weight to be given to the transition accuracy is determined.
[0012]
  Claims of the invention8The invention described in claim 11Or7In the voice recognition device according to any one of the above, the vehicle control command generation unit includes:Road information (distance factor) according to the force applied to the operation input deviceIs a speech recognition apparatus characterized by determining the
[0013]
  Claims of the invention9The invention described in claim 1 to claim 186. The voice recognition device according to claim 1, wherein the vehicle control command generation unit further includes a control command presenting unit that presents information about the vehicle control command to a driver, and the vehicle control command is transmitted to the vehicle control unit. The voice recognition device is characterized in that the control command presenting means presents information on the vehicle control command when sending to the vehicle.
[0014]
  Claims of the invention10The invention described in claim 11Or9In the voice recognition device according to any one of the above, when the vehicle control command generation unit determines that the vehicle control command is not immediately sent to the vehicle control unit, the vehicle control command related to the transition to the branch with the highest accuracy Control command confirming means for presenting to the driver a question as to whether or not to execute the control command presenting means, and the vehicle control command generating means responds to voice input and / or operation input for the question. A speech recognition apparatus that determines whether or not to send a vehicle control command to the vehicle control means.
[0015]
  Claims of the invention11The invention described in claim 110In the voice recognition device according to claim 1, when the control command confirmation means confirms whether or not the vehicle control command is executed with respect to the driver, when the target in the vehicle control command approaches within a predetermined distance, The voice recognition device is characterized by sending a command to decelerate automatically to the vehicle control device.
[0016]
  Claims of the invention12The invention described in claim 110Or11If the response from the driver is not within a predetermined time, the vehicle control command is sent to the vehicle control device according to the branching accuracy corresponding to the vehicle control command, or the same It is a voice recognition device that selects whether to present a question again or to present a question to the driver regarding whether or not to execute a vehicle control command corresponding to a branch with the next highest accuracy.
[0017]
【The invention's effect】
  According to the first aspect of the present invention, voice input and operation input are input in combination as a command from the driver., And recognizing information on the road on which the vehicle is runningTherefore, the command intended by the driver can be estimated with high accuracy, so that the intended command can be transmitted to the vehicle control device easily and quickly.At the same time, the voice input information, the operation input information, and the road information are evaluated by calculating the accuracy representing each likelihood, so that accurate estimation can be performed..
[0018]
  Claim2According to the invention of the present invention, the vehicle control command can be issued even if not all of these are included in the voice input information by recognizing separately the vehicle motion target by voice command, the motion with respect to the target, and the direction of motion. Can be generated.
[0019]
  Claim3According to this invention, in order to determine whether or not to immediately execute the vehicle control, the accuracy representing the certainty of the information is calculated. Therefore, when the accuracy is low, it is possible to change the correspondence so that there is no sense of incongruity. become.
[0020]
  Claim4According to the invention, since the control command can be generated within the range of the obtained information in the command input from the driver and the road information, a flexible command suitable for the driver's feeling is possible.
[0021]
  Claim5According to the invention, since it is explicitly confirmed that the driver gives a voice command to the vehicle by the operation input, it is possible to deal with unintentional voice utterances such as radio voice, conversation with a passenger in the passenger seat, and monologue. It becomes possible to prevent malfunction.
[0022]
  Claim6According to the invention, when the accuracy is lower than the predetermined value, it is possible to quickly give information related to the control command to be performed on the vehicle without any sense of incongruity by additionally inputting only the command as the point.
[0023]
  Claim7According to the invention, since the range of the branch information to be searched is adjusted according to the traveling speed, it is possible to improve the voice recognition accuracy by obtaining the collation with the voice command within the range.
[0024]
  Claim8According to the invention, since it becomes easy for the driver to issue the control command quickly, the vehicle operation shifts to the branch near the own vehicle with respect to the force applied unconsciously or consciously. Generation is possible.
[0025]
  Claim9According to the invention, since the command and a series of operations executed by the vehicle are presented to the driver and the operations performed by the vehicle are transmitted to the driver, it is possible to improve the sense of security.
[0026]
  Claim10According to the invention, since a highly probable command is presented without re-inputting, the burden on the driver can be reduced.
[0027]
  Claim11According to the invention, when a command object having a high possibility of branching is approaching, the vehicle decelerates so that the vehicle does not pass therethrough, so that the intended command is passed while checking the vehicle. It becomes possible to prevent that.
[0028]
  Claim12According to this invention, it is possible to configure a command system that does not have a sense of incongruity that matches the driver's feeling by changing the correspondence according to the accuracy.
[0029]
DETAILED DESCRIPTION OF THE INVENTION
  FIG. 1 is a block diagram showing an example of a vehicle control system including an embodiment of a speech recognition apparatus according to the present invention. This system, for example, controls the traveling of an autonomous vehicle that can autonomously control the accelerator, brakes, and steering, and that can accept commands from the driver. It includes a recognition device 2, a driver interface unit 4, a travel position detection unit 6, a vehicle control unit 8, and a communication unit 10. The driver interface unit 4 includes, for example, a voice input device 12 that supplies a voice input command from the driver to the voice recognition device 2, a display device 14 that presents vehicle transition operation information from the voice recognition device 2 to the driver, An operation input device 16 that supplies an operation input command from the driver to the recognition device 2 and a voice utterance device 18 that presents an operation confirmation from the voice recognition device 2 to the driver are provided. The traveling position detection unit 6 includes, for example, a GPS navigation device 20 that supplies vehicle position information to the voice recognition device 2 and a magnetic nail detection device 22. The vehicle control unit 8 receives, for example, vehicle control information from the voice recognition device 2 and controls an automatic steering device 24 for controlling the steering of the vehicle, a radar device 26 for maintaining a distance between the front vehicle, and a voice recognition device. 2 is provided with a vehicle speed control device 28 for receiving the vehicle control information from 2 and controlling the speed of the vehicle. The communication unit 10 includes, for example, a road-vehicle communication device 30 and a vehicle-vehicle communication device 32.
[0030]
  One embodiment of the speech recognition apparatus 2 according to the present invention shown in FIG. 1 includes speech input recognition means 34, operation input recognition means 36, weight determination means 38, road information recognition means 40, accuracy calculation means 42, The vehicle control command generation means 44, the control command presentation means 46, the control command confirmation means 48, and the vehicle control means 50 are provided.
[0031]
  FIG. 2 is a flowchart for explaining the operation of the speech recognition apparatus 2 in FIG. In step S <b> 1, the voice recognition unit 34 receives voice input information from the voice input device 18 of the driver interface 4. Thereby, the speech recognition apparatus 2 starts a speech recognition operation.
[0032]
  In step S <b> 2, the operation input recognition unit 36 receives operation input information from the operation input device 14 of the driver interface 4. Note that the voice recognition operation in step S1 may be started by the operation input information in step S2, and if there is no operation input for a while after the voice is detected, the voice recognition operation may be stopped. Moreover, you may recognize the audio | voice detection result before and behind the operation input.
[0033]
  In step S3, the road information recognition means 40 receives the vehicle position information determined by the GPS navigation device 20 and the magnetic nail detection device 22 of the traveling position detection unit 6 and road information including attributes. The road information includes communication from the infrastructure and the dedicated radio station, communication with surrounding vehicles, or an external recognition sensor of the own vehicle by the road-vehicle communication device 30 or the vehicle-vehicle communication device 32 of the communication unit 10. For example, information such as a map of a certain range around the own vehicle shown in FIG. 3 and the positions of the surrounding vehicles is shown. It should be noted that lane change prohibition sections and branching point information determined by traffic regulations are explicitly shown as road attributes, for example using data as shown in FIG. 4 or map information supplemented by communication means Also good. Further, as the road attributes, a road width, the number of road lanes, a speed limit, and the like may be acquired.
[0034]
  In step S4, the road information recognition means 40 recognizes a route branch that can change the direction of the vehicle action as a branch that the vehicle can move from, based on the vehicle position information and road information obtained in step S3. , Generate branch information. The branch that can be transferred includes a road that can be transferred on the same road, such as a road branch such as a right or left turn, a vehicle change, a stop on the side of the road, or acceleration / deceleration. FIG. 5 schematically shows such branch information. Moreover, you may also hold | maintain the branch of continuing the present movement, without changing vehicle action.
[0035]
  In step S5, the voice input recognition unit 34 extracts a command target from the voice input information by collating with dictionary information. The command target includes a place name (for example, “Yokohama”), a turning point (for example, “next intersection”), a facility (for example, “gas station”), and the like. When collating with words included in the dictionary information, all words having a likelihood equal to or higher than a certain threshold are extracted. As a recognition result, the relative accuracy of the recognized word is determined by the likelihood, for example, as to the certainty.
[0036]
  In step S6, the voice input recognizing means 34 extracts a command action from the voice input information by collation with dictionary information. The command operation includes “turn”, “enter”, “accelerate”, and the like. As in step S5, when collating with words included in the dictionary information, all words having a likelihood equal to or higher than a certain threshold are extracted. As a recognition result, the relative accuracy of the recognized word is determined by the likelihood, for example, as to the certainty.
[0037]
  In step S7, the voice input recognizing means 34 extracts the command direction from the voice input information by collation with dictionary information. The command directions include, for example, “right”, “left”, “right diagonal”, and the like. Again, as in steps S5 and S6, when collating with words included in the dictionary information, all words with a likelihood equal to or greater than a certain threshold are extracted. As a recognition result, the relative accuracy of the recognized word is determined by the likelihood, for example, as to how certain it is.
[0038]
  In addition, when selecting a word from dictionary information in step S5, S6, and S7, you may make it select only some words with the highest likelihood. Further, regarding the dictionary information used in steps S5, S6, and S7, a dictionary to be used may be set based on the dictionary information that is linked to the vehicle position. Further, it is not necessary to provide means for recognizing all of steps S5, S6 and S7. Alternatively, a command such as “turn left” may be extracted by separating it into “left” and “turn”, or a command such as “speed 40” may be extracted as converted to “acceleration” by comparison with the current vehicle speed. Good. At this time, for the portion corresponding to the control amount such as “40”, the accuracy of the control amount including the degree of coincidence with other numerical information such as “50”, “60”, and “20” is determined based on the likelihood. The information stored may be used when the vehicle control command is actually issued in step S13 described later.
[0039]
  In step S8, the road information recognizing means 40 determines, for example, the ease of travel of the vehicle related to the structure of the road that can be acquired from the map information mounted on the vehicle, such as the capacity determined by the width of the road and the speed limit. Information is acquired as road structure information.
[0040]
  In step S9, the road information recognition means 40 acquires information determined by the vehicle traveling. Such information includes, for example, a coefficient for ease of travel as a ratio of the traffic speed to the speed limit. For example, the speed of traffic may be estimated from the speed of a preceding vehicle measured by an external sensor, or may be obtained from road-to-vehicle communication during traveling. In addition, when a route for traveling in advance is set by the navigation system, the weight of the set route may be set to be large, for example, the weight is doubled.
[0041]
  In step S10, the weight determination means 38 determines a distance coefficient. This distance coefficient is a weighting coefficient regarding the probability of shifting to each branch obtained in step S4, and a to d in FIG. 6 are graphs explaining such a distance coefficient. For example, as shown in FIG. 6a, the weight is defined so as to change according to the distance from the own vehicle to the command target. When the force applied to the operation input device or the amount of change in operation increases, the weight near the host vehicle may increase as shown in FIG. 6b. Further, such weighting characteristics may be changed according to the traveling speed of the host vehicle. For example, when the traveling speed is high, it is difficult to physically change the vehicle route in the vicinity of the host vehicle as shown in FIG. The weight may be set to zero, or the front distance to which the weight is applied may be extended. Further, as shown in FIG. 6d, the weight may be set to change exponentially.
[0042]
  In step S11, the accuracy calculation means 42 uses the information obtained in steps S2, S5, S6, S7, S8 and S9 and the distance coefficient determined in step S10 to determine the accuracy of transition to each branch obtained in step S4. And is supplied to the vehicle control command generation means 44. This calculation method will be described in detail later.
[0043]
  In step S12, the vehicle control command generation unit 44 determines whether or not to immediately supply the vehicle control command for shifting to the branch having the highest accuracy calculated in step S11 to the vehicle control unit 50 according to the accuracy. To do. Here, as an example, when the accuracy value is 0.8 or more, it is extremely high, when it is 0.65 or more and less than 0.8, it is high, and when it is 0.5 or more and less than 0.65, it is medium or 0.5 or less. In this case, it is specified as low. If it is extremely high, the process proceeds to step S13; otherwise, the process proceeds to step S14.
[0044]
  In step S13, the corresponding vehicle control command is immediately supplied to the vehicle control means 50. At the same time, the control command presenting means 46 may present the driver to execute this vehicle control command through the display device 14 and / or the voice utterance device 18 of the driver interface unit 4. Furthermore, when a route for traveling in advance is set by the navigation system 20, the route may be rerouted to the selected branch. Upon receiving the vehicle control command, the vehicle control means 50 controls the vehicle control unit 8 based on the vehicle control command while taking into account information related to surrounding vehicles and causes the vehicle to travel according to the command. The time from when the information is presented to the driver until when the command is actually started may be changed according to the accuracy. In addition, when a cancel command for canceling the command is input within a time during which the vehicle control command is actually supplied to the vehicle control means 50 and can be stopped even after the vehicle control command is supplied, the command is canceled. It is also possible to jump to step S14 instead. In this case, when a continuous cancel command is input, it may be completely canceled. Also, until the vehicle control command is actually supplied to the vehicle control means 50, voice input and / or operation input is received even during the time when it can be stopped even after being supplied, and these inputs are taken into consideration. The calculated accuracy may be recalculated, and the process may return to step S12 based on the result. Further, as described above with respect to steps S5, S6, and S7, processing is performed in the case where the control amount is designated as the speed “40” by the voice command, which will be described later.
[0045]
  In step S22, after the vehicle control command is executed, the held accuracy to each branch and the vehicle control command are reset, and the system waits for the next voice input and / or operation input.
[0046]
  In step S14, the vehicle control command corresponding to the branch having the highest accuracy is selected from the remaining branches excluding the branch already denied by the driver.
[0047]
  Steps S15, S20, and S21 are routines for determining how close the command target of the vehicle control command selected in step S14 is to prevent overrun.
[0048]
  In step S15, the distance to the command target of the vehicle control command selected in step 14 is determined, and the speed that needs to be decelerated when the command target is reached in consideration of the current vehicle speed and acceleration. It is determined whether or not a certain degree of deceleration is necessary to reach the target. If it is determined that the deceleration is necessary, the process proceeds to step S20. Otherwise, the process proceeds to step S21.
[0049]
  In step S20, the vehicle control means 50 controls the vehicle control unit 8 to start deceleration so as not to overrun the branch point corresponding to the command target, and to the driver by the display device 14 and / or the voice utterance device 18. Encourage them to switch to manual operation. If the accuracy corresponding to the extreme height in step S12 is obtained by adding an additional input in the meantime, the process proceeds to step S13 in order to supply the corresponding vehicle control command to the vehicle control means 50. But you can. Note that steps S15, S20 and S21 may be omitted.
[0050]
  In step 21, it is determined whether or not switching to manual operation has been performed. When the switching to the manual operation is performed, the automatic steering 24 and the vehicle control device 28 are released. If not switched to manual operation, the process proceeds to step S16.
[0051]
  In step S16, the control command confirmation unit 48 inquires of the driver whether or not to execute the vehicle control command selected in step S14 by the display device 14 and / or the voice utterance device 18.
[0052]
  In step S17, it is determined whether or not there is a response from the driver. If there is a response within a predetermined time, the process proceeds to step S18, and if there is no response, the process proceeds to step S19. Such a reply may be by voice or by operation.
[0053]
  In step S18, it is determined whether or not the reply indicates affirmation. If yes, the process proceeds to step S13. Otherwise, the process proceeds to step S14, and the same processing is performed regarding the vehicle control command relating to the branch with the next highest accuracy. If the reply is neither affirmative nor negative, it is possible to jump to step S16 and confirm again with the driver.
[0054]
  In step S19, it is determined whether the accuracy of the branch currently being processed is high, medium, or low. If high, the process proceeds to step S13, if medium, the process proceeds to step S16, and if low, the process proceeds to step S14. Proceed with Note that processing branches performed according to the accuracy in step S19, such as a mode that proceeds to step S14 even if medium or low, and a mode that proceeds to step S16 even if high or medium, are individually performed in step S13. , S14, and S16 may be set to be connected. However, as a result of assigning the accuracy in the order of steps S13, S16, and S14, the accuracy to S16 is set to S14 or higher, and the accuracy to S13 is set to be S16 or higher. Further, in step S14, for example, all the held commands may be cleared by canceling the command at an arbitrary time point by operating the command cancel switch or the like.
[0055]
  The accuracy calculation method in step S11 described above will be described. As an example for explanation, while driving on a road as shown in FIG. 3, in order to make a left turn in the direction of Yokohama at the previous intersection, say “turn to Yokohama” and turn left on the operation input device. Consider the case of operation. That is, it is assumed that road information as shown in FIG. 3 is recognized at the time of such an operation, and branch information as shown in FIG. 5 is obtained.
[0056]
  FIG. 7 is a diagram for explaining the process of calculating the accuracy in the case of such an example. In the flow F1, as a result of the voice recognition for the voice “turn to Yokohama”, the items related to the command target included in the branch information in this example are 0.6 for “Yokohama”, 0.3 for “Yokosuka”, “Gas station” ”Is recognized, and items relating to the command action are recognized as 0.6 for“ turn ”, 0.2 for“ enter ”, and 0.2 for“ acceleration ”.
[0057]
  In the flow F2, a probability of shifting to each branch in the branch information is assigned. Weighting is performed according to the likelihood recognized as described above. In this example, a value of 0.6 is given to the branch corresponding to the command target “Yokohama”, 0.3 to the branch corresponding to “Yokosuka”, and 0.1 to the branch corresponding to “gas station”. A certain value, 0.1 in this example, is given to a branch corresponding to an item that has no likelihood equal to or greater than a preset threshold value. Similarly, 0.6 corresponds to the branch corresponding to “turn” of the command operation, 0.2 corresponds to the branch corresponding to “change lane”, 0.2 corresponds to the branch corresponding to “enter”, and corresponds to “acceleration”. A value of 0.2 is given to the branch, and a constant value, 0.1 in this example, is given to the branch corresponding to an item that has no likelihood equal to or greater than a preset threshold value.
[0058]
  In this example, there is no voice input related to the command direction, but in some cases, a weight value is given to each branch in the same manner as the other command items. When there is no related voice input as in this example, a constant value may be given to all branches. The same applies when there is no voice input related to other commands.
[0059]
  The accuracy related to the operation input information is set so that the highest value is given to the branch corresponding to the direction input in the operation input device, and the value given to the other branch is set so that the weight becomes lighter as it deviates from this direction. . When there are a plurality of recognized directions, a plurality of weights may be overlapped. In addition, for example, when the intersection of the command target is a three-dimensional intersection, the operation input is put in the right direction when it is necessary to branch leftward from the currently running road in order to go right. However, it may be considered that the input has been made in the left direction, and the weight corresponding to the branch corresponding to the left direction may be increased.
[0060]
  As for the accuracy related to the road structure information, the weighting value of each route is determined according to the road capacity or the like.
[0061]
  As for the accuracy related to the road condition information, the weight value of each route is determined according to the ease of driving of the vehicle such as the degree of congestion and the current traveling speed.
[0062]
  Further, a distance coefficient as described with respect to step S10 in FIG. 2 is given to each path.
[0063]
  In the flow F3, the accuracy regarding each information given in the flow F2 is multiplied for each branch. In the case of this example, the weights for multiplying the accuracy related to each information are made equal, but the weights may be different among the information.
[0064]
  The flow F4 is the finally calculated accuracy, and the numerical value is such that the sum of the transition accuracy for all branches is 1, the accuracy σ = (the highest branch accuracy σi) / (Σ accuracy of each branch σn) Is standardized by calculation. From this result, it can be seen that the branch with the highest accuracy is the branch corresponding to the left turn in the direction of Yokohama, and the accuracy is 0.86.
[0065]
  FIG. 8 is a diagram for explaining a process of calculating the same accuracy as that in FIG. 7, but in the example shown in this diagram, the accuracy for each information is multiplied step by step. Flows F1 and F2 are the same as those in FIG. 7, but in flow F3, the accuracy obtained by multiplying only the weight related to the voice input information, the accuracy obtained by multiplying only the weight related to the operation input information, the road information, and the distance The accuracy obtained by multiplying only the weights related to the coefficients is shown. At this stage, the branching accuracy corresponding to the left turn toward Yokohama is 0.54, 0.28, and 0.11, respectively.
[0066]
  In the next flow F3 ', the accuracy is shown when two of the three accuracy values calculated in the flow F3 are extracted and combined. At this stage, the branching accuracy corresponding to the left turn toward Yokohama is 0.59 (voice input information + operation input information), 0.69 (voice input information + road information and distance coefficient), 0.48 ( Operation input information + road information and distance coefficient).
[0067]
  When the values calculated in the flow F3 are multiplied in the flow F4, the branching accuracy corresponding to the operation of turning left in the direction of Yokohama is 0.86, which is the same as in the case of FIG. Therefore, the accuracy of the intermediate stage such as the flows F3 and F3 ′ in this figure is not necessarily required to calculate the final accuracy, but due to the property that the accuracy of each information can be superimposed in this way, the intermediate stage Or, once the final accuracy is calculated, if there is additional input related to certain information, the accuracy of each additional input information is multiplied by the accuracy calculated at that time to obtain the accuracy of each branch. A new calculation can be performed.
[0068]
  FIG. 9 is a diagram similar to FIG. 7, but illustrates the accuracy calculation process when “lane change” is performed as a voice input and a rightward operation is performed as an operation input. The accuracy of is assumed to be 0.7 for “lane change”, 0.2 for “turn”, and 0.2 for “acceleration”. The value calculated in the same manner as in FIG. 7 is 0.96, which is the highest branch for “lane change” here.
[0069]
  A process when the control amount is designated like the speed “40” by the voice command in steps S5, S6, and S7 in step S13 described above will be described. In such an example of speed, the current vehicle speed information is compared with road speed limit information, etc., and the accuracy of reaching the speed limit is the highest, for example, as in the calculation of the accuracy in step S11, and decreases with increasing distance. And the control amount may be calculated by multiplying the likelihood of the speech recognition result as shown in FIG.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an example of a vehicle control system including an embodiment of a voice recognition device according to the present invention.
FIG. 2 is a flowchart illustrating the operation of an embodiment of a speech recognition apparatus according to the present invention.
FIG. 3 is a diagram of map information representing road information.
FIG. 4 is a diagram of map information supplemented with road attributes.
FIGS. 5a and 5b are diagrams schematically showing branch information. FIGS.
FIGS. 6A to 6D are graphs for explaining a distance coefficient.
FIG. 7 is a diagram illustrating a process of calculating accuracy.
FIG. 8 is a diagram illustrating a process for calculating accuracy.
FIG. 9 is a diagram illustrating a process for calculating accuracy.
FIG. 10 is a diagram illustrating processing when a control amount is specified.
[Explanation of symbols]
  2 Voice recognition device
  4 Driver interface section
  6 Traveling position detector
  8 Vehicle control unit
  10 Communication Department
  12 Voice input device
  14 Display device
  16 Operation input device
  18 Voice utterance device
  20 GPS navigation device
  22 Magnetic nail detector
  24 Automatic steering device
  26 Radar equipment
  28 Vehicle speed control device
  30 Road-to-vehicle communication device
  32 Inter-vehicle communication device
  34 Voice input recognition means
  36 Operation input recognition means
  38 Weight determining means
  40 Road information recognition means
  42 Accuracy calculation means
  44 Vehicle control command generation means
  46 Control command presentation means
  48 Control command confirmation means
  50 Vehicle control means

Claims (12)

音声入力情報を認識する音声入力認識手段と、
操作入力情報を認識する操作入力認識手段と、
前記音声入力認識手段が認識した音声入力情報と前記操作入力認識手段が認識した指令とに基づいて車両制御指令を生成する車両制御指令生成手段と、
前記車両制御指令生成手段により生成された車両制御指令に基づいて車両の加減速及び操舵を制御する車両制御手段と
車両が移行可能な分岐情報と、地図情報から得られる車線幅などの道路構造と、外界認識センサやインフラ情報などから得られる混雑度などの道路状況と、前記分岐情報の各分岐までの距離に応じた重み付けである距離係数とのうち少なくとも1つを含む道路情報とを認識する道路情報認識手段と、
前記分岐情報における車両が移行可能な各分岐に移行する確度を、前記音声入力情報と、操作入力情報と、道路情報とに基づいて算出する確度算出手段と、を具え、前記車両制御指令生成手段が、最も高い確度の分岐への移行を行わせる指令を前記車両制御指令として生成することを特徴とする音声認識装置。
Voice input recognition means for recognizing voice input information;
Operation input recognition means for recognizing operation input information;
And a vehicle control command generation means for generating a vehicle control command based on the command and the voice input information and the operation input recognizing means for said speech input recognition means recognizes recognizes,
Vehicle control means for controlling acceleration / deceleration and steering of the vehicle based on the vehicle control command generated by the vehicle control command generation means ;
The branch information to which the vehicle can move, the road structure such as the lane width obtained from the map information, the road condition such as the congestion degree obtained from the external recognition sensor and the infrastructure information, and the distance to each branch of the branch information Road information recognition means for recognizing road information including at least one of distance coefficients that are weights according to
The vehicle control command generating means, comprising: an accuracy calculating means for calculating a probability that the vehicle in the branch information is transferred to each branch to which the vehicle can move based on the voice input information, operation input information, and road information. but the speech recognition apparatus characterized that you generate a command to perform a shift to the highest probability of the branch as the vehicle control command.
請求項1に記載の音声認識装置において、前記音声入力認識手段が、前記音声入力情報において、車両制御動作の目標と、前記目標に対する動作と、前記動作の方向とのうち少なくとも1つを認識することを特徴とする音声認識装置。  2. The voice recognition device according to claim 1, wherein the voice input recognition means recognizes at least one of a target of a vehicle control action, an action with respect to the target, and a direction of the action in the voice input information. A speech recognition apparatus characterized by that. 請求項1又は2に記載の音声認識装置において、前記車両制御指令生成手段が、前記車両制御指令をただちに前記車両制御手段に送るか否かを前記確度に応じて判断することを特徴とする音声認識装置。 3. The voice recognition apparatus according to claim 1 , wherein the vehicle control command generation unit determines whether or not to immediately send the vehicle control command to the vehicle control unit according to the accuracy. Recognition device. 請求項1ないし3のいずれか1項に記載の音声認識装置において、前記確度算出手段が、前記車両が移行可能な各分岐に移行する確度を算出する際に、前記音声入力情報と、操作入力情報と、道路情報との中で欠けている情報があっても、残りの情報に基づいて前記確度を算出することを特徴とする音声認識装置。4. The voice recognition device according to claim 1 , wherein the accuracy calculation unit calculates the accuracy of shifting to each branch to which the vehicle can shift, and the voice input information and the operation input. 5. A speech recognition apparatus characterized by calculating the accuracy based on the remaining information even if there is missing information in the information and road information. 請求項1ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、前記音声入力情報が前記操作入力情報と実際的に同時に入力された場合にのみ車両制御指令を生成することを特徴とする音声認識装置。The speech recognition apparatus according to any one of claims 1 to 4, wherein the vehicle control command generation means, a vehicle control command only when the speech input information is input at the same time in practice and the operation input information A speech recognition apparatus characterized by generating. 請求項1ないし5のいずれか1項に記載の音声認識装置において、前記確度算出手段が、前記確度の算出後に追加の音声入力情報及び/又は操作入力情報があった場合、これらの追加の情報にも基づいて確度を再算出することを特徴とする音声認識装置。6. The voice recognition device according to claim 1 , wherein when the accuracy calculation means has additional voice input information and / or operation input information after the calculation of the accuracy, these additional information is provided. A speech recognition device characterized by recalculating the accuracy based on the above. 請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、現在の走行速度に関する情報を受け、現在の走行速度に応じて、前記道路情報を取得する範囲と、各分岐への移行確度に付与する重みとを決定することを特徴とする音声認識装置。The voice recognition device according to any one of claims 1 to 6 , wherein the vehicle control command generation means receives information on the current travel speed and acquires the road information according to the current travel speed. And a weight to be given to the transition accuracy to each branch. 請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、操作入力装置に加えられた力の大きさに応じて道路情報(距離係数)を決定することを特徴とする音声認識装置。The speech recognition apparatus according to any one of claims 1 to 7, said vehicle control command generation means, to determine the road information (distance factor) according to the magnitude of the force applied to the operation input device A voice recognition device characterized by the above. 請求項1ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が、前記車両制御指令についての情報をドライバに提示する制御指令提示手段をさらに具え、前記車両制御指令を前記車両制御手段に送る際、前記制御指令提示手段がこの車両制御指令についての情報を提示することを特徴とする音声認識装置。The speech recognition apparatus according to any one of claims 1 to 8, wherein the vehicle control command generating means further comprises a control command presenting means for presenting information about the vehicle control command to the driver, the vehicle control command The voice recognition apparatus, wherein when the control command presenting means is sent to the vehicle control means, the control command presenting means presents information on the vehicle control command. 請求項ないしのいずれか1項に記載の音声認識装置において、前記車両制御指令生成手段が車両制御指令を前記車両制御手段にすぐに送らないと判断した場合、最も確度の高い分岐への移行に関する車両制御指令を実行するか否かの質問を前記制御指令提示手段によってドライバに対して提示する制御指令確認手段をさらに具え、この質問に対する音声入力及び/又は操作入力に応じて前記車両制御指令生成手段が前記車両制御指令を前記車両制御手段に送るか否かを決定することを特徴とする音声認識装置。The speech recognition apparatus according to any one of claims 1 to 9 , wherein when the vehicle control command generation unit determines that the vehicle control command is not immediately sent to the vehicle control unit, the branch to the branch with the highest accuracy is performed. Control command confirmation means for presenting to the driver a question as to whether or not to execute a vehicle control command related to the transition is provided to the driver by the control command presenting means, and the vehicle control is performed according to a voice input and / or an operation input for the question A voice recognition device, wherein the command generation means determines whether or not to send the vehicle control command to the vehicle control means. 請求項10に記載の音声認識装置において、前記制御指令確認手段が、ドライバに対して車両制御指令の実行の有無を確認する場合、この車両制御指令における目標が所定の距離以内に接近している場合、自動的に減速する指令を車両制御装置に送ることを特徴とする音声認識装置。11. The voice recognition device according to claim 10 , wherein when the control command confirmation unit confirms whether or not the vehicle control command is executed with respect to the driver, a target in the vehicle control command approaches within a predetermined distance. In this case, the voice recognition device is characterized by sending a command to automatically decelerate to the vehicle control device. 請求項10又は11に記載の音声認識装置において、ドライバからの応答が所定の時間内になかった場合、前記車両制御指令に対応する分岐の確度に応じて、前記車両制御装置に前記車両制御指令を送るか、同じ質問を再度提示するか、次に確度の高い分岐に対応する車両制御指令を実行するか否かに関する質問をドライバに提示するかのいずれかを選択することを特徴とする音声認識装置。12. The voice recognition device according to claim 10 or 11 , wherein when the response from the driver is not within a predetermined time, the vehicle control command is sent to the vehicle control device according to the branching accuracy corresponding to the vehicle control command. Or presenting the same question again, or presenting the driver with a question as to whether to execute a vehicle control command corresponding to the next most likely branch. Recognition device.
JP2001384452A 2001-12-18 2001-12-18 Voice recognition device Expired - Fee Related JP3979080B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001384452A JP3979080B2 (en) 2001-12-18 2001-12-18 Voice recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001384452A JP3979080B2 (en) 2001-12-18 2001-12-18 Voice recognition device

Publications (2)

Publication Number Publication Date
JP2003186492A JP2003186492A (en) 2003-07-04
JP3979080B2 true JP3979080B2 (en) 2007-09-19

Family

ID=27594182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001384452A Expired - Fee Related JP3979080B2 (en) 2001-12-18 2001-12-18 Voice recognition device

Country Status (1)

Country Link
JP (1) JP3979080B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101918666B1 (en) * 2012-04-03 2018-11-14 현대모비스 주식회사 Steering automatic centering device having speech control and conrol method thereof
CN105867179A (en) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 Vehicle-borne voice control method, device and equipment
JP6916647B2 (en) 2017-03-31 2021-08-11 本田技研工業株式会社 Vehicle control systems, vehicle control methods, and vehicle control programs
JP2018188020A (en) * 2017-05-08 2018-11-29 クラリオン株式会社 Automated driving support device and automated driving support method
JP2019073255A (en) * 2017-10-19 2019-05-16 アイシン精機株式会社 Driving assist device
JP7243567B2 (en) 2019-10-18 2023-03-22 トヨタ自動車株式会社 Change operation support device
CN114248786B (en) * 2022-01-18 2024-03-29 合创汽车科技有限公司 Vehicle control method, system, device, computer equipment and medium

Also Published As

Publication number Publication date
JP2003186492A (en) 2003-07-04

Similar Documents

Publication Publication Date Title
US9937924B1 (en) Modifying a vehicle state based on the presence of a special-purpose vehicle
US10795358B2 (en) Automatic driving control device
CN111976741B (en) Device and method for controlling an autonomous vehicle
CN107567406B (en) Automated vehicle parameter modification based on operator override
KR102165752B1 (en) Autonomous driving system and control method of autonomous driving system
JP6376059B2 (en) Control device for autonomous driving vehicle
JP4648175B2 (en) Driving control apparatus and method for automobile
CN103250195B (en) Drive assistance device
US11392119B2 (en) Autonomous driving device
JP5056220B2 (en) Travel control device
CN110582439A (en) driving assistance method, and driving assistance device and driving assistance system using same
JP2006347531A (en) In-vehicle terminal equipment, traveling control system for automobile and method for controlling automobile
CN113287074A (en) Method and system for increasing autonomous vehicle safety and flexibility using voice interaction
US11945442B2 (en) Autonomous driving system and control method for autonomous driving system
US11332128B2 (en) Driving assistance apparatus
JP2006308848A (en) Vehicle instrument controller
US20190286141A1 (en) Vehicle control apparatus
CN116507537A (en) Vehicle guidance system and method for operating a driving function in accordance with driver data
JP3979080B2 (en) Voice recognition device
US20220161819A1 (en) Automatic motor-vehicle driving speed control based on driver&#39;s driving behaviour
JP2022094311A (en) Method for selecting automated driving process by driving support system
CN114148341A (en) Control device and method for vehicle and vehicle
CN114802250A (en) Data processing method, device, equipment, automatic driving vehicle and medium
CN116390877A (en) Vehicle guidance system and method for operating a driving function when actuating an accelerator pedal
CN116323356A (en) Vehicle guidance system and method for operating a driving function in different modes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070221

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070618

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100706

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130706

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees