JP2001051694A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2001051694A
JP2001051694A JP11226321A JP22632199A JP2001051694A JP 2001051694 A JP2001051694 A JP 2001051694A JP 11226321 A JP11226321 A JP 11226321A JP 22632199 A JP22632199 A JP 22632199A JP 2001051694 A JP2001051694 A JP 2001051694A
Authority
JP
Japan
Prior art keywords
voice
recognition
operation command
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11226321A
Other languages
English (en)
Other versions
JP2001051694A5 (ja
Inventor
Toshiaki Kusano
俊明 草野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP11226321A priority Critical patent/JP2001051694A/ja
Publication of JP2001051694A publication Critical patent/JP2001051694A/ja
Publication of JP2001051694A5 publication Critical patent/JP2001051694A5/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識のタイミングをユーザが指示するた
めの従来のタイミングスイッチを不要とし、かつ、音声
認識結果が出るまでの待ち時間を短縮することができる
ようにする。 【解決手段】 ユーザの音声を常時入力し、サービス機
器15の操作に関連する操作関連音声の切出しを常時行
う音声切出部11と、予め準備された各種の操作コマン
ドを登録する認識辞書部13と、音声切出部11から常
時切り出された操作関連音声と、認識辞書部13に登録
された操作コマンドとの一致/不一致を常時照合し、一
致する操作コマンドを認識したときこれを該当するサー
ビス機器15に与える音声認識部12と、を有して構成
される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置、例
えば、各種の情報を提供する各種のサービス機器を搭載
する車両において該サービス機器に対する操作を音声コ
マンドによって与える場合に用いて好適な車載用の音声
認識装置に関する。サービス機器に対する操作は通常、
該サービス機器に付帯するスイッチあるいはボタンを操
作することにより行われるが、例えば車両に搭載される
サービス機器にあっては、運転上の安全を考慮して、そ
のようなスイッチ等を用いることなく音声で操作できる
ことが望まれる。このために、その音声による操作を認
識するための音声認識装置が種々提案され、実用に供さ
れている。
【0002】本発明は上記のような車載用の音声認識装
置を例にとって述べるが、この本発明の思想は、車載用
に限定されることなく、音声操作による例えばパソコン
を用いた講演/発表システムやロボット制御システム等
にも適用可能である。
【0003】
【従来の技術】従来知られている音声認識装置において
は、タイミングスイッチを併用することが多い。このタ
イミングスイッチは、ユーザがサービス機器を操作する
ための操作コマンドを発声する都度、ユーザによって押
下され、音声認識装置に対して、音声入力される操作コ
マンドの認識タイミングを知らせる。この結果、音声認
識装置による認識精度はきわめて高いものとなる。
【0004】
【発明が解決しようとする課題】上記タイミングスイッ
チを用いる従来の音声認識装置では、上記のとおり高い
認識精度を確保できる反面、次の3つの問題がある。第
1の問題は、タイミングスイッチという特別のハードウ
ェアを必要とすること、第2の問題は、操作コマンドを
発声する都度タイミングスイッチを押下しなければなら
ないので、ユーザにとって煩わしいこと、第3の問題
は、タイミングスイッチが押下されてから音声入力がな
されさらに音声認識動作が開始するので、認識結果が得
られるまでの待ち時間があり、ユーザにとって必ずしも
快適ではないこと、である。
【0005】したがって本発明は上記諸問題点に鑑み、
タイミングスイッチを用いることなしに、しかも、認識
結果が迅速に得られる音声認識装置を提供することを目
的とするものである。
【0006】
【課題を解決するための手段】図1は本発明に係る音声
認識装置の基本構成図である。本図に示す音声認識装置
10は、基本的に、マイクMから入力されたユーザの音
声の中から、各種の情報を提供する各種のサービス機器
15を操作するための操作コマンドの音声を認識して抽
出し、該当するサービス機器15を操作する音声認識装
置である。
【0007】そしてこの音声認識装置10は、図示する
ように、音声切出部11と、音声認識部12と、認識辞
書部13とからなる。さらに好ましくは、後に詳述する
認識処理部14を含む。音声切出部11は、ユーザの音
声を常時マイクMから入力し、サービス機器15の操作
に関連する操作関連音声の切出しを常時行う。
【0008】認識処理部13は、予め準備された各種の
操作コマンドを登録する。音声認識部12は、音声切出
部11から常時切り出された操作関連音声と、認識辞書
部13に登録された操作コマンドとの一致/不一致を常
時照合し、一致する操作コマンドを認識したときこれを
該当するサービス機器15に与える。このように本発明
の音声認識装置10には従来のタイミングスイッチが設
けられておらず、ユーザは煩わしいタイミングスイッチ
の操作から解放される。
【0009】そして音声認識系(11,12,13)
は、マイクMから入力されるユーザからの全ての音声に
対して常時認識動作を実行している。このため、操作コ
マンドの絞り込みならびに操作コマンドの候補の抽出
は、ユーザからの音声入力とに対してほぼリアルタイム
で進行しており、したがって、認識結果は迅速に得られ
る。
【0010】かくして既述の第1〜第3の問題が一挙に
解決される。
【0011】
【発明の実施の形態】図2は本発明の一実施例に基づく
音声認識装置および周辺サービス機器を示す図である。
なお、全図を通じて同様の構成要素には同一の参照番号
または記号を付して示す。図2において新たに示される
構成要素は、音声認識装置10に関して、A/D変換部
21、音声合成部22、設定スイッチ24であり、周辺
のサービス機器15に関して、液晶ディスプレイ等の表
示部23およびオーディオ機器15A、ナビゲーション
機器15N、通信機器15CおよびスピーカSである。
なおサービス機器15としては、この他エアコン等も含
む。
【0012】オーディオ機器15Aについての操作コマ
ンドは、“CD”、“AM”、“FM”等があり、さら
にそれぞれに固有の操作コマンド、例えばFM放送につ
いて“FM大阪”等がある。この場合、表示部23に
は、放送局名、周波数、CDのトラック No.等が表示さ
れる。ナビゲーション機器15Nは、表示部23と一体
になって、車両の位置をその周辺の地図上に表示し、あ
るいは、ユーザが例えば“コンビニエンスストア”と指
示したとき、“ローソン”、“セブンイレブン”等の自
車に近い該当店を表示する。
【0013】通信機器15Cは、携帯移動電話機能によ
って、自車位置周辺の交通情報、天気予報等をそれぞれ
のセンターに接続して入手し、表示部23(またはスピ
ーカS)にて示し、あるいは所望の通話先に接続する。
音声認識装置10において、マイクMから入力されたユ
ーザのアナログ音声信号は、A/D変換器21にてディ
ジタル信号に変換され、音声切出し部11に入力され
て、パターンマッチングにより、一語一語の音声の切出
しが行われる。
【0014】音声切出部11からの音声のうち操作関連
音声が、音声認識部12において、認識辞書部13内の
操作コマンドと照合され、一致したとき、その認識結果
を、認識処理部(MPU)14を介して、サービス機器
15側に転送する。このとき、その認識結果を、音声合
成部22によって音声に変換し、ユーザに伝えることが
できる。これにより、ユーザは自分の発声した操作コマ
ンドがヒットしたことを確認することができる。
【0015】なお、後述するが、設定スイッチ(SW)
24は、ユーザが音声認識装置10による音声認識を中
止させたいときに用いる。これは前述した従来のタイミ
ングスイッチとは全く異なる。以上のように、本発明に
よる音声認識装置10は、原則として常時、マイクMか
らユーザの音声を受け付け、常時音声認識を実行するこ
とを特徴とするものである。
【0016】したがって運転席と助手席にいる双方の者
が会話中であっても、その会話に対して音声認識が常時
実行されることになる。このように連続する会話中から
音声コマンドを抽出することは装置10にとっては困難
なことである。しかし、現実に即して考えると、上記の
会話中であっても、サービス機器15に対しユーザが操
作コマンドを与えようとするときは、その会話は必ず一
瞬中断し、わずかの間を置いて、その操作コマンドが発
声される。
【0017】このようなわずかな間(音声の空白時間)
を装置10が捉えれば、その直後に続くと予想される操
作関連音声を抽出することは容易である。勿論、通常の
会話中に発生する音声の空白を捉えても、その直後に続
く音声が操作関連音声であるとは限らない。このとき
は、音声認識系16において該当操作コマンドにヒット
しないだけで何の不都合も生じない。
【0018】なお図2の大きなブロック(点線で示す)
は、装置10や機器15が一体に構成されたユニットに
なっていることを表す。次に図2における主要部につい
て、本発明による実施態様を説明する。図3は認識辞書
部13の構成を示す図である。本図において、認識辞書
部13は、各種のサービス機器15に対する操作として
予め想定される操作コマンドを全て登録する基本辞書デ
ータを格納し、かつ、この基本辞書データは、各種のサ
ービス機器(15N,15A,15C…)に対応した複
数の機器操作コマンドデータ領域b,c,d…に区分さ
れる。
【0019】そして、使用されないサービス機器を検出
して、当該不使用のサービス機器に対応する機器操作コ
マンドデータ領域をアクセスの対象から除外する。図4
は基本辞書データのアクセス形態の一例を示す図であ
る。上述のように、使用されないサービス機器、例え
ば、オーディオ機器15Aがあるときは、このオーディ
オ機器15Aに対応した機器操作コマンドデータ領域c
については、音声認識部12によるアクセスの対象から
除外する。
【0020】これにより認識速度が向上すると共に認識
率(正しく認識する率)も高くなる。なお各種サービス
機器15のうちいずれが不使用であるかは、図2に示す
認識処理部14が、車載LAN25を介して知ることが
できる。再び図3に戻ると、認識辞書部13は、基本辞
書データに加えて優先辞書データ領域aを有し、この優
先辞書データ領域aには、既述した音声認識部12によ
る照合の結果一致した操作コマンドを登録しておく。こ
の場合、この音声認識部12による照合は、この優先辞
書データ領域a内の操作コマンドを優先して行うように
する。
【0021】基本辞書データb,c,d…から照合の結
果一致した操作コマンドが発生すると、その都度、当該
操作コマンドは、本図の上向き矢印のように吸い上げら
れて優先辞書データを構成して行く。音声認識部12
は、このようにして収集された優先辞書データの領域a
を優先して既述の照合を行う。
【0022】ユーザが頻繁に使用する操作コマンドの種
類はユーザ毎にある特定のものに集中し易い。したがっ
て一度使用した操作コマンドは、二度、三度と繰り返し
使用される蓋然性が高い。このような傾向に鑑み、上記
の優先辞書データを作成しておけば、認識速度ならびに
認識率は大幅に向上する。この場合、使用頻度の高い操
作コマンド程、アクセス順の上位に配置されるようにす
るのが望ましい。逆に使用頻度の低い操作コマンドがい
つまでも優先辞書データ領域aに残留しているのは望ま
しくない。
【0023】そこで、予め定めた一定期間T内に、優先
辞書データ領域aへのアクセスがなかった操作コマンド
については、これを優先辞書データ領域aの登録から抹
消するようにする。この場合、上記の一定期間Tとして
は、半年とか一年とかが考えられる。一方、優先辞書デ
ータ領域aにアクセスしてもここに登録されていない操
作コマンドについては当然認識不可となる。このような
ときは、基本辞書データ(領域b,c,d…)戻って照
合しなければならない。
【0024】つまり、優先辞書データ領域aにアクセス
して、該当する操作コマンドにヒットしないときには、
基本辞書データをアクセスするようにする。このときは
当然認識速度が低下し、認識率が低下することもあり得
る。図5は以上述べた認識辞書部13に関連する動作例
を示すフローチャートである。
【0025】ステップS11:音声入力の有無を検出す
る。 ステップS12:ステップS11にて音声入力ありのと
き(Yes)、優先辞書データ領域a(辞書a)から認
識されるべき候補を抽出する。 ステップS13:その候補の中に操作コマンドに合致す
るものがあるか判断する。
【0026】ステップS14:ステップS13にて合致
するものがないと(No)、今度は基本辞書データの領
域b,c,d…(辞書b,c,d…)から認識されるべ
き候補を抽出する。 ステップS15:その候補の中に操作コマンドに合致す
るものがあるか判断する。
【0027】ステップS16:ステップS15で当該操
作コマンドがあれば(Yes)、その認識結果を音声で
ユーザに知らせる。 ステップS17:さらに接続先の機器へその操作コマン
ドを送信する。 ステップS18:ステップS15で当該操作コマンドが
なければ(No)、認識すべきコマンドとして候補がな
いことをユーザに音声で知らせる。
【0028】以上、主要部として認識辞書部13につい
て述べたが、次にその他の主要部として認識処理部14
について述べる。これはMPUを主体として構成するこ
とができる。認識処理部14の第1の処理機能として、
認識処理部14は、ネットワークに共通に接続される各
種のサービス機器15のそれぞれの動作モードを、この
ネットワークを介して検知し、検知した動作モードが、
音声認識部12で認識された操作コマンドに関連する動
作モードと競合するとき、その検知した動作モードが完
了するまで、上記の認識された操作コマンドに関連する
動作モードの受け付けをしないようにする。ここに言う
ネットワークとは、例えば図2に示す車載LAN25の
ことである。
【0029】一例をもって説明すると、サービス機器1
5の1つである通信機器15Cがある動作モード、例え
ば交通情報入手のためにセンターと接続中のモードにあ
るときにユーザが別の動作モード、例えば“再送信”と
か“天気予報”等を操作コマンドとして音声入力して来
たとすると、前者の動作モードと後者の動作モードとが
競合してしまう。このような競合は明らかに誤動作を生
じさせることになるので、認識処理部14は後者の動作
モードを指定する音声入力の操作コマンドについては受
け付けないようにする。
【0030】図6は認識処理部14の第1の処理機能を
表すフローチャートである。本フローチャートは上述し
た動作モードの競合時における処理を一般的に表したも
のである。 ステップS21:音声入力の有無を常時検出する。 ステップS22:音声入力ありのとき(Yes)、その
音声入力に係る操作コマンドを抽出する。
【0031】ステップS23:抽出した操作コマンドを
伝えるべきサービス機器15の1つ、すなわち接続先の
機器の動作モードを入手する。 ステップS24:入手した動作モードに基づき、その接
続先の機器が、上記の操作コマンドに従って動作可能か
判断する。 動作可能でなければ、今音声入力された操作コマンドは
受け付けない。
【0032】ステップS25:動作可能と判断すれば、
今音声入力された操作コマンドを送信する。次に認識処
理部14の第2の処理機能について説明する。この機能
によれば、認識処理部14は、音声認識部12にて操作
関連音声に該当する操作コマンドをヒットしたことをユ
ーザに、画面表示または合成音声にて、通知するように
する。
【0033】本発明による音声認識装置10は、上記の
ステップS21およびS22のように、従来のようなタ
イミングスイッチなしに音声入力するので、発声した操
作コマンドが装置10によって受け付けられたのかどう
か、ユーザは常に不安感を抱く。そこで本第2の処理機
能によれば、音声入力された操作関連音声に該当する操
作コマンドをヒットしたこと、例えば、当該操作コマン
ドが具体的に何であるか、あるいはその操作コマンドを
認識中である等の事実を、視覚的/聴覚的にユーザに示
し、ユーザに安心感を与えるようにする。
【0034】その事実は、単純にはビープ音で、スピー
カS(図2)からユーザに伝えてもよいし、あるいは、
音声合成部22(図2)を用いて、例えば“ナビゲーシ
ョン装置を選択”のように、スピーカSより合成音声で
ユーザに伝えてもよい。また、液晶ディスプレイ等の表
示部23(図2)上において視覚的にユーザに示すこと
もできる。
【0035】図7の(a)および(b)は認識処理部1
4の第2の処理機能を表す図である。本図は上述した事
実を視覚的にユーザに伝える例であり、特に(a)は
“ナビゲーション”が音声入力で指定されたときの表示
部23の表示例(スクリーン上のパターン)であり、
(b)は引き続いて例えば“経路探索”と音声入力し、
かつ、これが受け付けられたときの表示部23の表示例
を示す。
【0036】本図の(a)および(b)において、31
はスクリーン、CCはその中に表示されたセンターカー
ソル(自車の現在位置)である。32はスクリーン31
の周辺に配置された複数の押しボタンスイッチである。
上述の例で、“経路探索”という操作コマンドをユーザ
が音声入力すると、音声認識系16がこれを何らかの操
作コマンドとして受け付けたとき、認識処理部14は、
図示するように“音声認識中”とスクリーン31上に表
示させる。ユーザはこれを見て音声入力が受け付けられ
たことを確認することができる。
【0037】次に認識処理部14の第3の処理機能につ
いて説明する。この機能は特にナビゲーション装置15
Nがユーザによって指定された場合に発揮されるもので
ある。この第3の処理機能によれば、既述の照合により
一致した操作コマンドに基づき当該サービス機器(15
N)より生成された複数のサービス結果の候補を、表示
部23に付帯する複数の押しボタンスイッチ32または
スクリーン31上に表示される複数のタッチパネルスイ
ッチに順次、所定の優先度に従って割り付けるようにす
る。
【0038】図8の(a)および(b)は認識処理部1
4の第3の処理機能を表す図である。本図の(a)は、
上記複数のサービス結果を複数の押しボタンスイッチ3
2に割り付ける例を示し、本図の(b)はその複数のサ
ービス結果を複数のタッチパネル33に割り付ける例を
示す。
【0039】一例としてユーザがナビゲーション装置1
5Nに対し、操作コマンドとして“コンビニエンススト
ア”を音声入力したものとする。そうすると同装置15
Nは、該当する店舗、例えば“ローソン”、“セブンイ
レブン”等を、スクリーン31を十分に使って表示す
る。したがってユーザにとって店舗の候補が十分見易い
ものとなる。
【0040】これら候補の中でいずれかを選択するため
に、図8の(a)では各候補に対して各押しボタンスイ
ッチ(SW1,SW2…)32を割り付ける。また図8
の(b)では、予め定めた各タッチパネルに対して、各
店舗名を割り付ける。ユーザは、所望の店舗を決定した
ときは、該当するスイッチ(SW1,SW2…)を押せ
ばよい。または、該当するタッチパネルに触れればよ
い。
【0041】上記の割り付けを所定の優先度に従って行
えば、ユーザにとって非常に使い易いものになる。図8
の(a)では例えば、スイッチSW1,SW2…の順
で、自車位置に最も近い店舗を順次割り付ける。また図
8の(b)では、自車位置に最も近い店舗をスクリーン
の左上から順次割り付ける。図9は図8の表示部の変形
例を示す斜視図である。
【0042】図8(a)および(b)の表示例では、ナ
ビゲーションの画面上にスーパーインポーズにより、候
補となる店舗群を表示したが、図9では、その表示を、
表示部23とは別の独立した専用表示ユニット34にて
行わせるものとする。なお、図9はスイッチ形式(SW
1,SW2…)のもので示すが、タッチパネルに置き換
えてもよい。
【0043】つまりこの実施態様は、上記の照合により
一致した操作コマンドに基づき当該サービス機器15N
より生成された複数のサービス結果の候補が、上述した
所定の優先度に従って割り付けられる複数の押しボタン
スイッチ32または複数のタッチパネルスイッチ33が
それぞれ付帯しまたは表示される専用表示ユニット34
を備えることを特徴とするものである。
【0044】このように専用表示ユニット34とするこ
とにより、ユーザの手元にこれを置くことができるか
ら、画面が見易くなり、かつ、操作もし易くなる。次に
認識処理部14の第4の処理機能について説明する。こ
の機能によると、認識処理部14は、音声認識装置10
を駆動すべき条件が満足しているか否か判断し、満足し
ている期間中のみ、この音声認識装置10へ電源供給
(図2の13.2V)するようにする。
【0045】音声認識装置10を駆動すべき条件とは、
例えばエンジンスイッチがオンになっていること、アク
セサリースイッチがオンになっていること、マイクMへ
の入力が途絶えてから所定時間(例えば、30秒)が経
過していないこと等、種々考えられる。図10は以上述
べた電源供給に関連する動作例を示すフローチャートで
ある。
【0046】ステップS31:車両のアクセサリースイ
ッチ(ACC)がオンか否か判断する。オンならば次ス
テップS32に移る。 ステップS32:マイクMへの音声入力が所定時間(3
0秒)途絶えたときに電源をオフするための電源タイマ
ーをオンにする。 ステップS33:機器(15)が動作中か否か判定し、
動作中ならば(Yes)、次ステップS34へ進む。
【0047】ステップS34:音声認識装置10の電源
はオンのままである。 ステップS35:ステップS31の判断の結果がNoで
あると、さらに、前述の電源タイマーにセットされた3
0秒が経過したか否か判断する。経過しているとステッ
プS36へ進む。 ステップS36:音声認識装置10の電源をオフとす
る。
【0048】さらに説明を補足すると、車両の操作にお
いて、イグニッションスイッチのオン/オフに連動して
音声認識を動作させると、オフした後は操作ができなく
なる。例えば、車両停車が一時的な停車の場合、その後
車両に戻ってきた場合の最新の交通情報を入手したい場
面では、再度イグニッションスイッチをオンにして、操
作を行うか、戻ってきた際に情報入手操作を行わなけれ
ばならない。そこで、ある一定時間(30秒)迄は、操
作ができるようにすることで、再度イグニッションスイ
ッチの操作をすることなく音声操作ができるようにする
ことで、より操作の自由度が向上する。
【0049】本発明は音声認識装置10が常時駆動状態
に置かれているので、バッテリ電源の節約を図ることが
望まれる。そのために、上記の第4の処理機能が採用さ
れる。上記のように音声認識装置10が常時駆動状態に
置かれていることは、バッテリ電源の消費が大になると
いう不利をもたらすと共に、ユーザが好むと好まざると
に拘らず入力した音声が認識されてしまい、ときには意
図しない操作コマンド相当の音声が含まれていて、例え
ばエアコンを勝手にオンにしてしまうという誤動作もあ
り得る。
【0050】そこでそのような誤動作の防止とバッテリ
電源の節約とを兼ねて、音声認識装置10の駆動または
非駆動をユーザが任意に設定するための設定スイッチを
備えるようにする。この設定スイッチは図2において参
照番号24として示されている。図11は上述した設定
スイッチ(SW)24に関連する動作例を示すフローチ
ャートである。
【0051】ステップS41:設定スイッチ(SW)2
4がユーザによりオンとされているか判断する。オンな
らば(Yes)、次ステップS42へ進む。 ステップS42:装置10は動作し続ける。 ステップS43:ステップS41の判断がオフであると
(No)、従来と同様既述のタイミングスイッチがオン
(TSW入力有り)のときのみ装置10を動作させる。
【0052】次に認識処理部14の第5の処理機能につ
いて説明する。この機能によれば、、認識処理部14
は、ユーザの音声を集音する複数のマイクM(図2)か
らの音圧レベルを入力とし、ユーザが複数のとき、最も
高い音圧レベルの信号を、音声切出部11(図2)に選
択的に入力するようにする。車室の運転席のみならず、
助手席にも後部座席にも人がいるような場合、これらの
者がお互いに会話を行うと、音声認識装置10にとって
はどの発声をユーザからの音声入力とすべきか全く分か
らない。
【0053】このような場合、音声入力の認識率は極端
に低下してしまう。そこで、マイクMを少なくとも3つ
(M1,M2およびM3)車室内に配置し、最も高い音
圧レベルを示すマイクMからの信号を選択してこれをユ
ーザからの音声入力とし、認識動作を行うようにする。
図12は認識処理部14の第5の処理機能を説明するた
めの図である。
【0054】本図は車を真上から見た図であり、右と左
のAピラーにそれぞれマイクM1およびM2が取り付け
られ、車の天井の中央(ルームライト近傍)にマイクM
3が取り付けられている。これら3つのマイクは全体と
して二等辺三角形の各頂点にくるように配置される。な
お、マイクM1およびM2をそれぞれ左右のBピラーに
取り付け、マイクM3をフロントウィンドウの中央上部
に取り付けするようにしてもよい。
【0055】図13はマイクM3の設置例を示す断面図
である。本図において、51はマイクM3につながるハ
ーネスである。52は内装モール材の形状を維持するA
BS樹脂やウレタン材であり、53はモールの細い毛織
り材を縫込んだガーゼであり、54は内装モール面(細
い毛織り材)である。マイクM3は、天井または、Aピ
ラーの内装として用いるモール材の内側に設置するよう
にして、マイクの存在感や威圧感を無くすことができ
る。
【0056】以上主としてマイクMに関して説明した
が、このマイクMについてはユーザからの音声入力の他
に外部ノイズも考慮する必要がある。このような外部ノ
イズによっても認識率が低下するからである。そこで本
発明の一態様として、次のような構成をとるのが好まし
い。すなわち既述した基本辞書データ(図3)として、
さらに、ユーザの音声を集音するマイクM(M1,M
2,M3)に入力されることが予想される各種の外部ノ
イズに相当するデータ、を登録するようにする。
【0057】ここで言う各種ノイズとは、例えば、ウィ
ンカ、ワイパー、パワーウィンドウ開閉、ハザード、エ
ンジン、アクセル/ブレーキ等の各動作音である。これ
らの動作音は車毎に固有のものであり、マイクMに入力
されることが必ず予想される外部ノイズてある。そこで
これらの固定的な外部ノイズに相当するデータを基本辞
書データ(図3)に登録する。
【0058】そうすると、これら外部ノイズについては
音声入力の中から対象外のものとして迅速に排除するこ
とができ、この結果、間接的に操作コマンドの認識率を
向上させることができる。最後に、認識処理部14の第
6の処理機能について説明する。この機能によれば、認
識処理部14は、ユーザが予め設定したパスワードが発
声されたことを確認したときのみ、優先辞書データ領域
(図3のa)の更新を行うようにするものである。
【0059】通常音声認識を操作するユーザは車両の持
主か専用の運転手である。しかし、このユーザが友人あ
るいは親類に代わることもあり得る。そうすると上記優
先辞書データ領域aへのデータの集積に不都合が生ず
る。なぜならこの領域aは、ユーザ個人のカスタマイズ
機能によって学習機能も加わりながら形成されるものだ
からである。
【0060】そこで認識処理部14は、ユーザ本人であ
ることを、音声入力されたパスワードによって確認した
ときのみ、上記データ領域aの更新を行うようにする。
なおパスワードは認識辞書部13に事前登録される。上
記カスタマイズ機能についてさらに具体的に説明を補足
する。音声認識装置の中で、ユーザ操作の結果を学習さ
せるカスタマイズ機能があるため例えば、車両を友人
や、親類などへ貸して、音声操作された場合にユーザの
好みが判らなくなり、認識の信頼度が低くなってしま
う。そこで、パスワードを予め設定し、このパスワード
が入力されない場合は、今までの学習機能を停止させる
ことで、ユーザのカスタマイズ機能を保護するようにし
たものである。
【0061】パスワードは上述のように、ユーザのカス
タマイズ機能を保護する上できわめて有効である。しか
しながら反面、音声認識装置がそのパスワードを認識で
きないと、本来の音声認識そのものが行えなくなってし
まう。このようなパスワードの誤認識に対処するため
に、パスワードによる確認動作を解除する解除スイッチ
を備えることもできる。この解除スイッチを押せば、パ
スワードなしに本来の音声認識を行わせることができ
る。また、ユーザが他人に車両を貸し渡した場合に、そ
の他人が音声認識装置を使うときに、上記解除スイッチ
を利用することもできる。
【0062】図14は以上述べたパスワードに関連する
動作例を表すフローチャートである。 ステップS51:パスワードの音声入力の有無を検出す
る。この音声入力があれば次ステップS52に進む。 ステップS52:その音声入力されたパスワードが、事
前登録されたパスワードに合致するか判断する。合致す
れば、次ステップS53に進む。
【0063】ステップS53:前述した学習機能に基づ
く音声認識を開始する。 ステップS54:上記ステップS52によってパスワー
ドが合致しないと判断されると(No)、前述した解除
スイッチ(解除SW)がユーザによって押されたか否か
判断する。否のときは(No)、次ステップS55に進
む。 ステップS55:解除SWの押下により、学習機能は休
止させ、学習結果は用いない、すなわち図3の優先辞書
データaを使用せず基本辞書データとのパターンマッチ
ングにのみ基づく音声認識を行う。
【0064】
【発明の効果】以上説明したように本発明によれば、ユ
ーザにとって煩わしい従来のタイミングスイッチの操作
が不要となり、また音声認識結果が出るまでの待ち時間
を短縮して、ユーザにとって快適な音声入力操作が実現
される。
【図面の簡単な説明】
【図1】本発明に係る音声認識装置の基本構成図であ
る。
【図2】本発明の一実施例に基づく音声認識装置および
周辺サービス機器を示す図である。
【図3】認識辞書部13の構成を示す図である。
【図4】基本辞書データのアクセス形態の一例を示す図
である。
【図5】認識辞書部13に関連する動作例を示すフロー
チャートである。
【図6】認識処理部14の第1の処理機能を表すフロー
チャートである。
【図7】(a)および(b)は認識処理部14の第2の
処理機能を表す図である。
【図8】(a)および(b)は認識処理部14の第3の
処理機能を表す図である。
【図9】図8の表示部の変形例を示す斜視図である。
【図10】電源供給に関連する動作例を示すフローチャ
ートである。
【図11】設定スイッチ(SW)24に関連する動作例
を示すフローチャートである。
【図12】認識処理部14の第5の処理機能を説明する
ための図である。
【図13】マイクM3の設置例を示す断面図である。
【図14】パスワードに関連する動作例を表すフローチ
ャートである。
【符号の説明】
10…音声認識装置 11…音声切出部 12…音声認識部 13…認識辞書部 14…認識処理部 15…各種サービス機器 16…音声認識系 21…A/D変換器 22…音声合成部 23…表示部 24…設定スイッチ 25…車載LAN 31…スクリーン 32…押しボタンスイッチ 33…タッチパネル 34…専用表示ユニット

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力されたユーザの音声の中から、各種
    の情報を提供する各種のサービス機器を操作するための
    操作コマンドの音声を認識して抽出し該当するサービス
    機器を操作する音声認識装置において、 前記ユーザの音声を常時入力し、前記サービス機器の操
    作に関連する操作関連音声の切出しを常時行う音声切出
    部と、 予め準備された各種の前記操作コマンドを登録する認識
    辞書部と、 前記音声切出部から常時切り出された前記操作関連音声
    と、前記認識辞書部に登録された前記操作コマンドとの
    一致/不一致を常時照合し、一致する操作コマンドを認
    識したときこれを該当する前記サービス機器に与える音
    声認識部と、からなることを特徴とする音声認識装置。
  2. 【請求項2】 前記認識辞書部は、 前記各種のサービス機器に対する操作として予め想定さ
    れる前記操作コマンドを全て登録する基本辞書データを
    格納し、かつ、該基本辞書データは、前記各種のサービ
    ス機器に対応した複数の機器操作コマンドデータ領域に
    区分され、 使用されない前記サービス機器を検出して、当該不使用
    のサービス機器に対応する前記機器操作コマンドデータ
    領域をアクセスの対象から除外する請求項1に記載の音
    声認識装置。
  3. 【請求項3】 前記認識辞書部は、 前記基本辞書データに加えて優先辞書データ領域を有
    し、該優先辞書データ領域には、前記照合の結果一致し
    た前記操作コマンドを登録しておき、 前記音声認識部による前記の照合は、該優先辞書データ
    領域内の前記操作コマンドを優先して行う請求項2に記
    載の音声認識装置。
  4. 【請求項4】 前記優先辞書データ領域にアクセスし
    て、該当する前記操作コマンドにヒットしないときに、
    前記基本辞書データをアクセスする請求項3に記載の音
    声認識装置。
  5. 【請求項5】 予め定めた一定期間内に、前記優先辞書
    データ領域へのアクセスがなかった前記操作コマンド
    は、該優先辞書データ領域での登録を抹消する請求項3
    に記載の音声認識装置。
  6. 【請求項6】 認識処理部を備え、 該認識処理部は、ネットワークに共通に接続される前記
    各種のサービス機器のそれぞれの動作モードを、該ネッ
    トワークを介して検知し、検知した該動作モードが、前
    記音声認識部で認識された前記操作コマンドに関連する
    動作モードと競合するとき、前記の検知した動作モード
    が完了するまで、前記の認識された操作コマンドに関連
    する動作モードの受け付けをしない請求項1に記載の音
    声認識装置。
  7. 【請求項7】 認識処理部を備え、 該認識処理部は、前記音声認識部にて前記操作関連音声
    に該当する前記操作コマンドをヒットしたことをユーザ
    に、画面表示または合成音声にて、通知する請求項1に
    記載の音声認識装置。
  8. 【請求項8】 認識処理部と、前記各種のサービス機器
    のそれぞれの動作モードを表示する表示部とを備え、 前記照合により一致した操作コマンドに基づき当該サー
    ビス機器より生成された複数のサービス結果の候補を、
    前記表示部に付帯する複数の押しボタンスイッチまたは
    該表示部に表示される複数のタッチパネルスイッチに順
    次、所定の優先度に従って割り付ける請求項1に記載の
    音声認識装置。
  9. 【請求項9】 前記照合により一致した操作コマンドに
    基づき当該サービス機器より生成された複数のサービス
    結果の候補が、前記所定の優先度に従って割り付けられ
    る前記複数の押しボタンスイッチまたは前記複数のタッ
    チパネルスイッチがそれぞれ付帯しまたは表示される専
    用表示ユニットを備える請求項8に記載の音声認識装
    置。
  10. 【請求項10】 認識処理部を備え、 該認識処理部は、前記音声認識装置を駆動すべき条件が
    満足しているか否か判断し、満足している期間中のみ、
    該音声認識装置へ電源供給する請求項1に記載の音声認
    識装置。
  11. 【請求項11】 認識処理部を備え、 該認識処理部は、ユーザの音声を集音する複数のマイク
    からの音圧レベルを入力とし、ユーザが複数のとき、最
    も高い音圧レベルの信号を、前記音声切出部に選択的に
    入力する請求項1に記載の音声認識装置。
  12. 【請求項12】 前記基本辞書データとして、さらに、
    前記ユーザの音声を集音するマイクに入力されることが
    予想される各種の外部ノイズに相当するデータを登録す
    る請求項2に記載の音声認識装置。
  13. 【請求項13】 認識処理部を備え、 該認識処理部は、ユーザが予め設定したパスワードが発
    声されたことを確認したときのみ、前記優先辞書データ
    領域の更新を行う請求項3に記載の音声認識装置。
JP11226321A 1999-08-10 1999-08-10 音声認識装置 Pending JP2001051694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11226321A JP2001051694A (ja) 1999-08-10 1999-08-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11226321A JP2001051694A (ja) 1999-08-10 1999-08-10 音声認識装置

Publications (2)

Publication Number Publication Date
JP2001051694A true JP2001051694A (ja) 2001-02-23
JP2001051694A5 JP2001051694A5 (ja) 2006-09-21

Family

ID=16843368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11226321A Pending JP2001051694A (ja) 1999-08-10 1999-08-10 音声認識装置

Country Status (1)

Country Link
JP (1) JP2001051694A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280688A (ja) * 2002-03-25 2003-10-02 Nissan Diesel Motor Co Ltd 情報交換システム
EP1477965A1 (en) * 2003-05-13 2004-11-17 Matsushita Electric Industrial Co., Ltd. Spoken keyword recognition apparatus and method
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
US7672844B2 (en) 2003-08-04 2010-03-02 Sony Corporation Voice processing apparatus
US7957972B2 (en) 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
JP2016081003A (ja) * 2014-10-22 2016-05-16 株式会社大林組 水中作業支援システム
JP2019144759A (ja) * 2018-02-19 2019-08-29 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム
WO2019187371A1 (ja) * 2018-03-29 2019-10-03 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
JP2020182988A (ja) * 2019-04-26 2020-11-12 ファナック株式会社 ロボット教示装置
JP2021056486A (ja) * 2019-09-29 2021-04-08 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声制御方法、音声制御装置、電子デバイス、および読み取り可能な記憶媒体
JP2021056485A (ja) * 2019-09-29 2021-04-08 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声制御方法、音声制御装置、電子デバイス、および読み取り可能な記憶媒体

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280688A (ja) * 2002-03-25 2003-10-02 Nissan Diesel Motor Co Ltd 情報交換システム
EP1477965A1 (en) * 2003-05-13 2004-11-17 Matsushita Electric Industrial Co., Ltd. Spoken keyword recognition apparatus and method
US7672844B2 (en) 2003-08-04 2010-03-02 Sony Corporation Voice processing apparatus
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
US7957972B2 (en) 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
JP2016081003A (ja) * 2014-10-22 2016-05-16 株式会社大林組 水中作業支援システム
JP7003720B2 (ja) 2018-02-19 2022-01-21 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム
JP2019144759A (ja) * 2018-02-19 2019-08-29 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム
WO2019187371A1 (ja) * 2018-03-29 2019-10-03 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
JP2019174778A (ja) * 2018-03-29 2019-10-10 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
JP7186375B2 (ja) 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
US11804220B2 (en) 2018-03-29 2023-10-31 Panasonic Intellectual Property Management Co., Ltd. Voice processing device, voice processing method and voice processing system
JP2020182988A (ja) * 2019-04-26 2020-11-12 ファナック株式会社 ロボット教示装置
JP7063844B2 (ja) 2019-04-26 2022-05-09 ファナック株式会社 ロボット教示装置
JP2021056486A (ja) * 2019-09-29 2021-04-08 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声制御方法、音声制御装置、電子デバイス、および読み取り可能な記憶媒体
JP2021056485A (ja) * 2019-09-29 2021-04-08 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声制御方法、音声制御装置、電子デバイス、および読み取り可能な記憶媒体

Similar Documents

Publication Publication Date Title
US7702130B2 (en) User interface apparatus using hand gesture recognition and method thereof
US7031659B2 (en) Communication system, communication device, and communication method
US9443510B2 (en) Speech recognition apparatus and method
US6344793B1 (en) Process for assisting a user of a motor vehicle when operating components of the motor vehicle as well as a pertaining system
JP2001051694A (ja) 音声認識装置
JP2017090613A (ja) 音声認識制御システム
CN103873551A (zh) 乘员使用引入装置与车辆系统交互的方法及系统
JPH10316318A (ja) エレベータ設備への音響命令入力用の入力装置およびその方法
CN106030697A (zh) 车载控制装置及车载控制方法
JP2002513969A (ja) 車両のコンポーネントの手書きおよび音声制御
WO2007145003A1 (ja) 車載情報装置
JPH11288296A (ja) 情報処理装置
US20050035855A1 (en) Voice command system for remote control and monitoring of home networked devices
JP5005491B2 (ja) 車載機、その出力態様設定方法
JP7239366B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2000322078A (ja) 車載型音声認識装置
JP2001013994A (ja) 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両
JP6522009B2 (ja) 音声認識システム
JP7286368B2 (ja) 車両機器制御装置、車両機器制御方法、およびプログラム
JP2001042891A (ja) 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
WO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
CN115593496A (zh) 一种面向高级别智能驾驶汽车的方向盘及其操作系统
JP5037041B2 (ja) 車載用音声認識装置及び音声コマンド登録方法
JP2007057805A (ja) 車両用情報処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060809

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091201