JP2017187559A

JP2017187559A - 音声認識装置及びコンピュータプログラム

Info

Publication number: JP2017187559A
Application number: JP2016074682A
Authority: JP
Inventors: 大和鈴木; Yamato Suzuki; 松本　修一; Shuichi Matsumoto; 修一松本
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2016-04-01
Filing date: 2016-04-01
Publication date: 2017-10-12

Abstract

【課題】ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声を間違った語彙に誤認識してしまうことを抑制する「音声認識装置及びコンピュータプログラム」を提供する。【解決手段】音声認識環境設定部４は、音声認識エンジン２が音声認識に用いる音声認識辞書１００を変更する際に、音声認識辞書１００に登録された語彙の数を算定し、音声認識エンジン２に設定する尤度しきい値を語彙の数が少ないほど大きくする。音声認識エンジン２は、音声認識辞書１００に登録されている語彙のうちの、入力音声が表す語彙らしさを表す尤度が最大の語彙の尤度が、設定されている尤度しきい値より大きければ、当該語彙を音声認識結果とし、大きくない場合は音声認識失敗を音声認識の結果とする。【選択図】図１

Description

本発明は、音声認識の技術に関するものである。

音声認識の技術としては、音声認識辞書に登録された語彙の標準的な発音と、ユーザが発話した音声との類似度を算定し、類似度が所定のしきい値より大きい語彙が存在する場合には、当該類似度が最大の語彙を認識結果とし、類似度が所定のしきい値より大きい語彙が存在しなかった場合には、認識結果を失敗とする音声認識装置が知られている。

また、このような音声認識装置において、上述した認識結果を失敗とするか否かの判定に用いるしきい値を、音声認識装置が搭載された自動車の運転状態や（特許文献１）、音声認識の成功率（特許文献２）に応じて変更する技術も知られている（たとえば、特許文献１、２）。

特開2001-75595号公報特開平5-132798号公報

さて、上述のようにユーザが発話した音声が表す語彙を音声認識辞書に登録された語彙のうちから認識する音声認識装置においては、ユーザが発話した音声を間違った語彙に誤認識するよりも、認識結果を失敗としてユーザに提示する方が、認識の非成功を直接ユーザに伝えることができるため望ましい。

そして、上述した音声認識の失敗の判定に用いるしきい値を大きくすれば、ユーザが発話した音声を正しい語彙に認識できなかった場合に、認識結果が他の語彙の誤認識とならずに失敗となる確率を高めることができる。

しかしながら、しきい値を大きくすると、しきい値が小さいときにはユーザが発話した音声を正しい語彙に認識する場合についてまで、認識結果が失敗となるケースが発生するため、ユーザが発話した音声を正しい語彙に認識する確率も、一律に低下してしまうこととなる。

そこで、本発明は、できるだけ、ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声を間違った語彙に誤認識してしまうことを抑制することを課題とする。

前記課題達成のために、音声認識を行う音声認識装置に、現用音声認識辞書として設定された、複数の語彙が登録された音声認識辞書を用いて音声認識を行う音声認識処理部と、前記現用音声認識辞書に登録された語彙の数を算定し、算定した語彙の数が少ないほど大きくなるように尤度しきい値を設定するしきい値設定部とを設けたものである。ただし、前記音声認識処理部は、ユーザが発話した音声を入力音声として受け付け、前記現用音声認識辞書に登録されている語彙のうちの、前記入力音声が表す語彙としての尤度が最大の語彙の尤度が、設定されている前記尤度しきい値より大きければ、当該語彙を音声認識の結果とし、大きくない場合は音声認識の失敗を音声認識の結果として算定する。

ここで、このような音声認識装置は、前記しきい値設定部において、予め定めた数の複数の範囲のうちの、前記算定した語彙の数が含まれる範囲に対して設定されている値を前記尤度しきい値として設定するようにしてもよい。ただし、より小さな数の範囲に対して設定されている値は、より大きな数の範囲に対して設定されている値よりも大きくする。

また、以上の音声認識装置は、当該音声認識装置が自動車に搭載される音声認識装置である場合には、当該音声認識装置に、前記自動車の走行中の有無を検出する検出部を設け、前記しきい値設定部において、前記検出部が前記自動車が走行中であることを検出していないときに、前記検出部が前記自動車が走行中であることを検出しているときよりも、前記尤度しきい値が大きくなるように、当該尤度しきい値を設定するようにしてもよい。

ここで、以上の音声認識装置は、複数の前記音声認識辞書を記憶した記憶部と、前記記憶部に記憶されている前記音声認識辞書のうちから選択的に一つの音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部とを備えたものであってもよく、この場合、前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定して前記尤度しきい値を設定する。

または、以上の音声認識装置は、前記音声認識辞書を生成し、生成した音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部を備えているものであってもよく、この場合、前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定して前記尤度しきい値を設定する。

また、以上の音声認識装置には、前記現用音声認識辞書に登録されている語彙のリストを表示する音声入力メニュー表示部を設けることも好ましい。
以上のような音声認識装置によれば、音声認識処理部が音声認識に用いる音声認識辞書である現用音声認識辞書に登録されている語彙数が少ない場合には、尤度しきい値として大きな値が設定される。一方、現用音声認識辞書に登録されている語彙数が少ない場合には、現用音声認識辞書に登録されている語彙間の相違が大きくなるため、現用音声認識辞書に登録されている語彙のうちのユーザが発話した語彙以外の他の語彙について大きな尤度が算定されることはなく、現用音声認識辞書に登録されている語彙のうちのユーザが発話した語彙についてのみ大きな尤度が算定され得ることが期待できる。よって、現用音声認識辞書に登録されている語彙数が少ない場合に、尤度しきい値として大きな値を設定することにより、語彙数が少ない音声認識辞書を現用音声認識辞書として音声認識に用いている期間中、ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声の間違った語彙への誤認識を抑制することができる。

以上のように、本発明によれば、ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声を間違った語彙に誤認識してしまうことを抑制することができる。

本発明の実施形態に係る情報処理システムの構成を示すブロック図である。本発明の実施形態に係る音声認識辞書を示す図である。本発明の実施形態に係る音声入力メニュー画面を示す図である。本発明の実施形態に係る音声認識環境設定処理を示すフローチャートである。本発明の実施形態に係る音声認識処理を示すフローチャートである。本発明の実施形態に係る音声認識環境設定処理の他の例を示すフローチャートである。

以下、本発明の実施形態に係る音声認識装置の実施形態を、自動車に搭載される情報処理システムへの適用を例にとり説明する。
図示するように、情報処理システムは、マイクロフォン１、音声認識エンジン２、音声認識エンジン２が音声認識に用いる音声認識辞書１００が格納される辞書格納部３、音声認識エンジン２の音声認識環境を設定する音声認識環境設定部４、オペレーティングシステム５、アプリケーション部６、ディスプレイ７、入力装置８、スピーカ９、スピーカ９に音声を出力する音声出力装置１０、ＧＰＳ受信機などの周辺装置１１、複数の音声認識辞書１００と、地図データやアドレスブックやオーディオファイル等のその他の各種データを記憶した記憶装置１２とを備えている。

但し、情報処理システムは、ハードウエア的には、ＣＰＵやメモリなどを備えたコンピュータを用いて構成されるものであり、音声認識エンジン２、辞書格納部３、音声認識環境設定部４、オペレーティングシステム５、アプリケーション部６などは、当該コンピュータが、所定のコンピュータプログラムを実行することにより実現されるものである。

さて、情報処理システムは、自動車に搭載されるシステムであり、ディスプレイ７はダッシュボード上やクラスタ内に配置される。また、入力装置８は、ディスプレイ７の表示面上に配置されたタッチパネルや、ステアリングに配置されたキー等である。

次に、辞書格納部３に格納される音声認識辞書１００は、記憶装置１２に記憶された音声認識辞書１００を選択的にロードしたものである。
また、各音声認識辞書１００には、図２に示すように、複数の語彙と、その発音を表す発音データが登録されている。発音データは、語彙の発音の音素列を表すものであってもよいし、語彙の発音の音声データ等であってもよい。

次に、アプリケーション部６は、たとえば、記憶装置１２に記憶されている地図データを用いて現在位置の提示や、目的地までの経路案内を行うカーナビゲーションアプリケーションや、記憶装置１２に記憶されているオーディオファイルを再生出力するミュージックプレイヤアプリケーションなどの、各々所定のサービスをユーザに提供するアプリケーションであり、各アプリケーション部６は、それぞれ、オペレーティングシステム５を介して、音声認識エンジン２と入力装置８を入力に、ディスプレイ７と音声出力装置１０を出力に用いたユーザインタフェースをユーザに提供しながら、各々の処理を行う。

すなわち、たとえば、アプリケーション部６は、ユーザから目的地の設定を受け付けるために、所定の音声入力メニュー画面をディスプレイ７に表示し、音声認識エンジン２を用いて、表示している音声入力メニュー画面に対応する音声認識辞書１００に登録されている語彙の音声入力を受け付け、音声入力された語彙に対応する処理を行う。

ここで、記憶装置１２には、各アプリケーション部６が表示する各音声入力メニュー画面の各々に対応する音声認識辞書１００が予め記憶されており、各音声認識辞書１００には、対応する音声入力メニュー画面を表示しているときに、その音声入力メニュー画面を表示するアプリケーション部６が音声入力の受け付けの対象とする語彙、すなわち、対応する音声入力メニュー画面を表示しているときに、音声認識エンジン２において音声認識の対象とする語彙が登録されている。

そして、アプリケーション部６は、音声入力メニュー画面を表示しているときに、表示している音声入力メニュー画面に対応する音声認識辞書１００を用いた音声認識を音声認識エンジン２に行わせるために、音声入力の受け付けの開始に先立って、表示する音声入力メニュー画面に対応する音声認識辞書１００の指定を含む音声入力開始要求を音声認識環境設定部４に発行し、音声認識環境設定部４は、音声入力開始要求で指定された音声認識辞書１００を記憶装置１２から読み出して辞書格納部３にロードする。なお、この音声認識環境設定部４の動作については、後に詳述する。

ここで、アプリケーション部６が表示する音声入力メニュー画面の例を示す。
図３ａ、ｂに示した音声入力メニュー画面は、共にカーナビゲーションアプリケーションが表示する音声入力メニュー画面を示している。
図３ａに示した音声入力メニュー画面は、目的地の設定方法を受け付けるための音声入力メニュー画面であり、図３ａの音声入力メニュー画面に対応する音声認識辞書１００に登録されている目的地の設定方法を示す「Go Home」、「Place Na Previous Destination」、「Address」、「Address Book」の各語彙のリスト３０１と、図３ａの音声入力メニュー画面に対応する音声認識辞書１００に登録されているその他のコマンド受付用の語彙が、音声入力の受け付けの対象とする語彙として音声入力メニュー画面に表示されている。

また、図３ｂは、図３ａの目的地の設定方法を受け付けるための音声入力メニュー画面で、「Address Book」の音声入力を受け付けた場合に表示する音声入力メニュー画面であり、この音声入力メニューに対応する音声認識辞書１００には、記憶装置１２に記憶されているアドレスブックに登録されている各人物の氏名を表す語彙が登録されている。そして、図３ｂの音声入力メニュー画面には、対応する音声認識辞書１００に登録されている語彙、すなわち、アドレスブックに登録されている各人物の氏名を表す語彙のリスト３０２と、図３ｂの音声入力メニュー画面に対応する音声認識辞書１００に登録されているその他のコマンド受付用の語彙が、音声入力の受け付けの対象とする語彙として音声入力メニュー画面に表示されている。

ここで、カーナビゲーションアプリケーションは、図３ｂの音声入力メニュー画面で、アドレスブックに登録されている人物の氏名の音声入力を受け付けると、たとえば、アドレスブックに登録されている音声入力を受け付けた氏名の人物の住所を目的地に設定する処理を行う。

さて、図３ａ、ｂの音声入力メニュー画面によっても示されるように、記憶装置１２に記憶されている各音声認識辞書１００に登録されている語彙の数は同一ではなく、音声認識辞書毎に登録されている語彙数は大きく異なる場合がある。

以下、このような構成における音声認識環境設定部４と、音声認識エンジン２が行う動作の詳細について説明する。
まず、音声認識環境設定部４の動作について説明する。
音声認識環境設定部４は、上述した音声入力開始要求をアプリケーション部６から受け取ると音声認識環境設定処理を行う。
図４に、この音声認識環境設定処理の手順を示す。
図示するように音声認識環境設定処理では、音声認識環境設定部４は、まず、音声入力開始要求で指定された音声認識辞書１００を辞書格納部３にロードする（ステップ４０２）。すなわち、音声入力開始要求で指定された音声認識辞書１００を記憶装置１２から読み出して辞書格納部３に格納する。

次に、ロードした音声認識辞書１００に登録されている語彙の数を算定する（ステップ４０４）。
そして、算定した音声認識辞書１００に登録されている語彙の数が、第１のしきい値Ｔｈ１（Ｔｈ１は、たとえば１０）より小さい場合には（ステップ４０６）、音声認識エンジン２に尤度しきいＴｈＬとしてＬ１を設定する（ステップ４０８）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ４１０）、音声認識環境設定処理を終了する。

一方、算定した音声認識辞書１００に登録されている語彙の数が、第１のしきい値Ｔｈ１以上であり（ステップ４０６）、第２のしきい値Ｔｈ２（Ｔｈ２は、たとえば２０）より小さい場合には（ステップ４１２）、音声認識エンジン２に尤度しきいＴｈＬとしてＬ２を設定する（ステップ４１４）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ４１０）、音声認識環境設定処理を終了する。ここで、Ｔｈ１、Ｔｈ２、Ｌ１、Ｌ２は、Ｔｈ１＜Ｔｈ２、Ｌ１＞Ｌ２となる値を予め設定する。

また、算定した音声認識辞書１００に登録されている語彙の数が、第２のしきい値Ｔｈ２以上である場合には（ステップ４１２）、音声認識エンジン２に尤度しきいＴｈＬとしてＬ３を設定する（ステップ４１６）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ４１０）、音声認識環境設定処理を終了する。

ここで、Ｌ３は、Ｌ２＞Ｌ３となる値を予め設定する。
以上、音声認識環境設定部４が行う音声認識環境設定処理について説明した。
このような音声認識環境設定処理によれば、辞書格納部３にロードした音声認識辞書１００に登録されている語彙の数が小さいほど、大きな値が尤度しきいＴｈＬとして音声認識エンジン２に設定されることとなる。

次に、以上の音声認識環境設定処理のステップ４１０で起動される音声認識エンジン２の音声認識処理について説明する。
図５に、音声認識エンジン２が行う音声認識処理の手順を示す。
図示するように音声認識エンジン２は、音声認識処理を開始すると、入力装置８の一つとして設けたトークスイッチのオン操作の発生を監視し（ステップ５０２）、トークスイッチのオン操作が発生したならば、マイクロフォン１からの入力音声の取得を開始する（ステップ５０４）。

そして、マイクロフォン１から有意な音声が所定期間以上入力しなくなったならば（ステップ５０６）、マイクロフォン１からの入力音声の取得を終了する（ステップ５０８）。

そして、次に、辞書格納部３に格納されている音声認識辞書１００に登録されている各語彙と、取得した入力音声のマッチング度を算出する（ステップ５１０）。ここで、各語彙と入力音声のマッチング度は、音声認識辞書１００に登録されている語彙の発音データと入力音声との類似度を、当該語彙のマッチング度として算定することにより行う。

次に、辞書格納部３に格納されている音声認識辞書１００に登録されている各語彙の尤度を算定する（ステップ５１２）。
ここで、各語彙の尤度としては、当該語彙について求めたマッチング度を用いる。
または、各語彙の尤度は、たとえば、マッチング度が最大であった語彙の尤度以外の語彙の尤度は０として算定すると共に、マッチング度が最大であった語彙の尤度を、マッチング度が最大であった語彙のマッチング度をＭ１、マッチング度が二番目であった語彙のマッチング度をＭ１として、
尤度=（ｋ1×Ｍ１）+[ｋ2×（Ｍ1-Ｍ2）]や、尤度=Ｍ１×（Ｍ1-Ｍ2）
等により算定するようにしてもよい。但し、ｋ１、ｋ２は、予め設定したチューニング用の係数である。

なお、この場合において、マッチング度が最大であった語彙の尤度は、（Ｍ1-Ｍ2）が所定値以下である場合には０とするようにしてもよい。
なお、以上の尤度の算出手法は、一例であり、音声認識辞書１００に登録されている各語彙の尤度は、当該語彙が入力音声が表す語彙であることの確からしさを表すものであれば、他の任意の手法により算出するようにして良い。

そして、次に、辞書格納部３に格納されている音声認識辞書１００に登録されている各語彙について算定した尤度のうちの最大の尤度が、設定されている尤度しきいＴｈＬより大きいかどうかを調べ（ステップ５１４）、大きければ、尤度が最大であった語彙を音声認識結果として確定して、オペレーティングシステム５を介して、この時点で音声認識エンジン２を音声入力に用いているアプリケーション部６、すなわち、音声認識環境部に音声入力開始要求を発行したアプリケーション部６に出力し（ステップ５１６）、音声認識処理を終了する。

一方、最大の尤度が、設定されている尤度しきいＴｈＬ以下である場合には、音声認識に失敗した旨を示すメッセージのディスプレイ７への表示や、音声認識に失敗した旨を示す音声メッセージの音声出力装置１０からの出力によりユーザに通知し（ステップ５１８）、ステップ５０２からの処理に戻る。なお、音声認識に失敗した旨を示すメッセージや音声メッセージは、たとえば、「申し訳ありません。理解できませんでした。画面に表示されている言葉を言って下さい」といったものとする。

以上、音声認識エンジン２が行う音声認識処理について説明した。
以上、本発明の実施形態について説明した。
以上のように本実施形態によれば、音声認識エンジン２が音声認識に用いる音声認識辞書１００に登録されている語彙数が少ない場合には、尤度しきい値ＴｈＬとして大きな値が設定される。一方、音声認識に用いる音声認識辞書１００に登録されている語彙数が少ない場合には、音声認識辞書１００に登録されている語彙間の相違が大きくなるため、音声認識辞書１００に登録されている語彙のうちのユーザが発話した語彙以外の他の語彙について大きな尤度が算定されることはなく、音声認識辞書１００に登録されている語彙のうちのユーザが発話した語彙についてのみ大きな尤度が算定され得ることが期待できる。よって、音声認識に用いる音声認識辞書１００に登録されている語彙数が少ない場合に、尤度しきい値ＴｈＬとして大きな値を設定することにより、ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声の間違った語彙への誤認識を抑制することができる。

ところで、以上の実施形態は、情報処理システムに、周辺装置１１として当該情報処理システムが搭載されている自動車の走行中の有無を検出する検出装置を設けると共に、音声認識環境設定部４において、図４に示した音声認識環境設定処理に代えて図６に示す音声認識環境設定処理を行うようにしてもよい。

図示するように、図６に示す音声認識環境設定処理において、音声認識環境設定は、まず、音声入力開始要求で指定された音声認識辞書１００を辞書格納部３にロードし（ステップ６０２）、ロードした音声認識辞書１００に登録されている語彙の数を算定する（ステップ６０４）。

そして、算定した音声認識辞書１００に登録されている語彙の数が、第１のしきい値Ｔｈ１（Ｔｈ１は、たとえば１０）より小さい場合には（ステップ６０６）、音声認識エンジン２に尤度しきいＴｈＬとしてＬ１を設定する（ステップ６０８）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ６１０）、音声認識環境設定処理を終了する。

一方、算定した音声認識辞書１００に登録されている語彙の数が、第１のしきい値Ｔｈ１以上であり（ステップ６０６）、第２のしきい値Ｔｈ２（Ｔｈ２は、たとえば２０）より小さい場合には（ステップ６１２）、現在自動車が走行中であるかどうかを調べ（ステップ６１４）。走行中でなければ、すなわち、自動車が駐停車中であれば、音声認識エンジン２に尤度しきいＴｈＬとしてＬ１を設定し（ステップ６０８）、走行中であれば、音声認識エンジン２に尤度しきいＴｈＬとしてＬ２を設定する（ステップ６１６）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ６１０）、音声認識環境設定処理を終了する。

また、算定した音声認識辞書１００に登録されている語彙の数が、第２のしきい値Ｔｈ２以上である場合には（ステップ６１２）、現在自動車が走行中であるかどうかを調べ（ステップ６１８）。走行中でなければ、すなわち、自動車が駐停車中であれば、音声認識エンジン２に尤度しきいＴｈＬとしてＬ２を設定し（ステップ６１６）、走行中であれば、音声認識エンジン２に尤度しきいＴｈＬとしてＬ３を設定する（ステップ６２０）。そして、オペレーティングシステム５を介して音声認識エンジン２の音声認識処理を起動した上で（ステップ６１０）、音声認識環境設定処理を終了する。

ここで、Ｔｈ１、Ｔｈ２、Ｌ１、Ｌ２、Ｌ３は、Ｔｈ１＜Ｔｈ２、Ｌ１＞Ｌ２＞Ｌ３となる値を予め設定する。
このような図６に示した音声認識環境設定処理によれば、自動車が走行中でなく、駐停車中である場合には、走行中である場合よりも大きな値が尤度しきいＴｈＬとして音声認識エンジン２に設定される。

ここで、自動車が駐停車中である期間は、走行中である期間に比べ、発生するノイズが小さく、走行中である期間に比べ、入力音声とユーザが発話した語彙との間に大きな尤度が得られやすい。よって、このように駐停車中である期間中、走行中である場合よりも大きな値を尤度しきいＴｈＬとして設定することにより、自動車が駐停車中である期間中には、より、ユーザが発話した音声を正しい語彙に認識する確率を低下することなく、ユーザが発話した音声を間違った語彙に誤認識してしまうことを抑制することができるようになる。

また、以上の実施形態においては、記憶装置１２に、各アプリケーション部６が表示する各音声入力メニュー画面の各々に対応する音声認識辞書１００を予め記憶したが、音声入力メニュー画面に対応する音声認識辞書１００は、音声入力メニュー画面を表示する際や、その音声認識辞書１００を用いた音声入力を開始するときに動的に作成して、辞書格納部３に格納するようにしてもよい。なお、この場合には、図４、６の音声認識環境設定処理のステップ４０４、６０４では、動的に作成され辞書格納部３に格納される音声認識辞書１００に登録されている語彙の数を算定するようにする。

なお、以上の実施形態における音声入力処理の技術は、自動車に搭載される情報処理システムのみならず、音声入力を行う任意の情報処理システムに適用することができる。

１…マイクロフォン、２…音声認識エンジン、３…辞書格納部、４…音声認識環境設定部、５…オペレーティングシステム、６…アプリケーション部、７…ディスプレイ、８…入力装置、９…スピーカ、１０…音声出力装置、１１…周辺装置、１２…記憶装置、１００…音声認識辞書。

Claims

音声認識を行う音声認識装置であって、
現用音声認識辞書として設定された、複数の語彙が登録された音声認識辞書を用いて音声認識を行う音声認識処理部と、
前記現用音声認識辞書に登録された語彙の数を算定し、算定した語彙の数が少ないほど大きくなるように尤度しきい値を設定するしきい値設定部とを有し、
前記音声認識処理部は、ユーザが発話した音声を入力音声として受け付け、前記現用音声認識辞書に登録されている語彙のうちの、前記入力音声が表す語彙としての尤度が最大の語彙の尤度が、設定されている前記尤度しきい値より大きければ、当該語彙を音声認識の結果とし、大きくない場合は音声認識の失敗を音声認識の結果として算定することを特徴とする音声認識装置。
請求項１記載の音声認識装置であって、
前記しきい値設定部は、予め定めた数の複数の範囲のうちの、前記算定した語彙の数が含まれる範囲に対して設定されている値を前記尤度しきい値として設定し、かつ、より小さな数の範囲に対して設定されている値は、より大きな数の範囲に対して設定されている値よりも大きいことを特徴とする音声認識装置。
請求項１または２記載の音声認識装置であって、
当該音声認識装置は自動車に搭載される音声認識装置あり、かつ、
当該音声認識装置は、前記自動車の走行中の有無を検出する検出部を有し、
前記しきい値設定部は、前記検出部が前記自動車が走行中であることを検出していないときに、前記検出部が前記自動車が走行中であることを検出しているときよりも、前記尤度しきい値が大きくなるように、当該尤度しきい値を設定することを特徴とする音声認識装置。
請求項１、２または３記載の音声認識装置であって、
複数の前記音声認識辞書を記憶した記憶部と、
前記記憶部に記憶されている前記音声認識辞書のうちから選択的に一つの音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部とを有し、
前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定して前記尤度しきい値を設定することを特徴とする音声認識装置。
請求項１、２または３記載の音声認識装置であって、
前記音声認識辞書を生成し、生成した音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部を有し、
前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定して前記尤度しきい値を設定することを特徴とする音声認識装置。
請求項１、２、３、４または５記載の音声認識装置であって、
前記現用音声認識辞書に登録されている語彙のリストを表示する音声入力メニュー表示部を有することを特徴とする音声認識装置。
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
現用音声認識辞書として設定された、複数の語彙が登録された音声認識辞書を用いて音声認識を行う音声認識処理部と、
前記現用音声認識辞書に登録された語彙の数を算定し、算定した語彙の数が少ないほど大きくなるように尤度しきい値を設定するしきい値設定部として機能させるコンピュータプログラムであって、
前記音声認識処理部は、ユーザが発話した音声を入力音声として受け付け、前記現用音声認識辞書に登録されている語彙のうちの、前記入力音声が表す語彙としての尤度が最大の語彙の尤度が、設定されている前記尤度しきい値より大きければ、当該語彙を音声認識の結果とし、大きくない場合は音声認識の失敗を音声認識の結果として算定することを特徴とするコンピュータプログラム。
請求項７記載のコンピュータプログラムであって、
前記しきい値設定部は、予め定めた数の複数の範囲のうちの、前記算定した語彙の数が含まれる範囲に対して設定されている値を前記尤度しきい値として設定し、かつ、より小さな数の範囲に対して設定されている値は、より大きな数の範囲に対して設定されている値よりも大きいことを特徴とするコンピュータプログラム。
請求項７または８記載のコンピュータプログラムであって、
前記コンピュータは自動車に搭載されるコンピュータあり、かつ、
当該コンピュータには、前記自動車の走行中の有無を検出する検出部が接続されており、
前記しきい値設定部は、前記検出部が前記自動車が走行中であることを検出していないときに、前記検出部が前記自動車が走行中であることを検出しているときよりも、前記尤度しきい値が大きくなるように、当該尤度しきい値を設定することを特徴とするコンピュータプログラム。
請求項７、８または９記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、
複数の前記音声認識辞書を記憶した記憶部と、
前記記憶部に記憶されている前記音声認識辞書のうちから選択的に一つの音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部として機能させ、
前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定し、算定した語彙の数が少ないほど大きくなるように尤度しきい値を設定することを特徴とするコンピュータプログラム。
請求項７、８または９記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、前記音声認識辞書を生成し、生成した音声認識辞書を前記現用音声認識辞書として設定する現用音声認識辞書設定部として機能させ、
前記しきい値設定部は、前記現用音声認識辞書設定部が前記現用音声認識辞書を設定する際に、当該現用音声認識辞書に登録された語彙の数を算定し、算定した語彙の数が少ないほど大きくなるように尤度しきい値を設定することを特徴とするコンピュータプログラム。
請求項７、８、９、１０または１１記載の音声認識装置であって、
当該コンピュータプログラムは、前記コンピュータを、さらに、前記現用音声認識辞書に登録されている語彙のリストを表示する音声入力メニュー表示部として機能させることを特徴とするコンピュータプログラム。