JP2002229587A

JP2002229587A - 音声認識方法

Info

Publication number: JP2002229587A
Application number: JP2001380622A
Authority: JP
Inventors: Daniela Raddino; ダニエーララッディノ; Ralf Kompe; ラルフコンペ; Thomas Kemp; トーマスケムプ
Original assignee: Sony International Europe GmbH
Current assignee: Sony Deutschland GmbH
Priority date: 2000-12-13
Filing date: 2001-12-13
Publication date: 2002-08-16
Also published as: EP1215654A1; EP1215654B1; US6850885B2; DE60028219T2; US20020116193A1; DE60028219T8; DE60028219D1

Abstract

(57)【要約】【課題】ペナルティに基づいたキーワードスポッテ
ィング処理を用いて、正確且つ柔軟性のある音声認識方
法を提供する。【解決手段】キーワードモデル（ＫＭ）とガーベージ
モデル（ＧＭ）の組合わせに基づくキーワードスポッテ
ィング処理を用いた音声認識方法の正確性と柔軟性を高
めるために、少なくとも１つの可変ペナルティ値（Ｐｔ
ｒａｎｓ、Ｐ１、．．．Ｐ６）をグローバルペナルティ
（Ｐｇｌｏｂ）と関連付け、キーワード（Ｋｊ）の認識
を向上させる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、請求項１の前提部
分に示すように、音声を認識する音声認識方法に関し、
特に、ペナルティ（penalty）に基づいて特定のキーワ
ード（keyword）を抽出（spotting）するキーワードス
ポッティング（keyword spotting）処理を用いた音声認
識方法に関する。

【０００２】

【従来の技術】多くの場合、音声認識方法は、事前に定
義された言語モデル又は文法内で、与えられたボキャブ
ラリの１部ではない音声フレーズ（speech phrases）又
は連続音声（word sequences）に対して処理を行う。音
声認識方法において、例えば、アウトオブボキャブラリ
ワード（out-of-vocabulary words）はガーベージ音声
（garbage speech）と呼ばれ、対照的に、インボキャブ
ラリワード（in-vocabulary words）はキーワード（key
word）と呼ばれる。

【０００３】従来の音声認識方法では、特に、キーワー
ドスポッティングに基づいた音声認識処理及び与えられ
た言語モデルを用いることによって、対象となる音声フ
レーズ内の少なくともキーワードが認識される。アウト
オブボキャブラリワードすなわちガーベージモデル（ga
rbage model）と同様にキーワードを考慮するために、
少なくとも１つの第１言語すなわちキーワードモデル
と、１つの第２言語と、１つのアウトオブボキャブラリ
モデルすなわちガーベージモデルとの組合わせが認識処
理の基礎となる言語モデル内で用いられる。キーワード
モデルは、認識可能なインボキャブラリすなわちキーワ
ードすなわち音声フレーズを含有及び／又は表現する。
アウトオブボキャブラリすなわちガーベージモデルは、
アウトオブボキャブラリワード又は音声フレーズの少な
くとも１部を表す。

【０００４】

【発明が解決しようとする課題】上述したような言語モ
デルを用いた従来の音声認識方法では、アウトオブボキ
ャブラリすなわちガーベージモデル及び関連する文法
は、キーワードモデルよりも頻繁に適合してしまう。こ
のため、従来の音声認識方法では、キーワードモデルの
ボキャブラリにないと分類される音声フレーズの数が増
えるにしたがって、誤って拒否されてしまうキーワード
の数も増えてしまう。

【０００５】そこで、キーワードの認識及び出力を向
上、増加させるために、ガーベージモデルすなわちアウ
トオブボキャブラリモデルにペナルティを導入する方法
が提案されてきた。ペナルティは、アウトオブボキャブ
ラリすなわちガーベージモデルに含まれているグローバ
ルスコア（global score）又は、与えられたフレーズ又
は発生音の尤度（liklihood）の計算に用いられる。こ
のように変更又はペナルティを課されたガーベージモデ
ルのグローバルスコアは、キーワード又はキーワードモ
デルの各グローバルスコア又は尤度と比較される。ペナ
ルティが減少するにしたがって、ガーベージモデルのグ
ローバルスコア又は尤度、キーワードの認識及び出力が
増加する。

【０００６】多くのアプリケーションにおいて、上述し
たようなワードスポッティング処理は、例えばアプリケ
ーションの状態、ユーザの嗜好、入力された音声の詳
細、認識処理を考慮しないため厳密過ぎてしまう。

【０００７】したがって、本発明の目的は、特に、正確
且つ柔軟性のある音声認識方法を提供することである。

【０００８】

【課題を解決するための手段】本発明の目的は、請求項
１に示す音声認識方法により達成され、請求項１に示す
ような特徴を有する。従属請求項の主旨は、本発明に係
る音声認識方法の好ましい有益な実施例を達成するため
のものである。

【０００９】本発明に係る音声認識方法は、グローバル
ペナルティ（global penalty）を定義するために、少な
くとも１つの可変ペナルティ値が関連付けられ及び／又
は使用されることを特徴とする。したがって、本発明に
係る音声認識方法の基本概念は、キーワード出力を増加
させるために、言語モデル、特にガーベージモデル内に
導入されたペナルティを可変すなわち変更可能にするこ
とである。これによって、グローバルペナルティを調整
することによって、例えば認識処理自体の内部特性と同
様に、認識状態、ユーザ嗜好を考慮すること可能にな
る。したがって、本発明に係る音声認識方法は、従来の
音声認識方法と比べてより柔軟且つ正確である。

【００１０】グローバルペナルティは、１つの可変ペナ
ルティ値、又は固定及び／又は可変ペナルティ値のセッ
トを導入することで可変にすることができる。固定ペナ
ルティ値のセットを用いて、例えば、認識処理自体、ユ
ーザ嗜好及び／又はその他同様のものに依存する固定ペ
ナルティ値の異なる組合わせを作ることによって、グロ
ーバルペナルティを可変にすることができる。

【００１１】本発明に係る音声認識方法の可変性を高め
るために、可変ペナルティ値は、各処理において、認識
処理、ユーザ入力、供給された音声フレーズ及び／又は
それらの特性等に依存、すなわち関数となっている。し
たがって、可変ペナルティ値は、実時間で、認識処理及
びアプリケーション状態において実際に必要であると考
える。これらの処理によって、音声認識方法の柔軟性と
正確性がさらに増加する。

【００１２】

【発明の実施の形態】少なくとも１つの統計モデルを用
いて行う音声認識方法の好ましい有効な実施例として、
ガーベージモデル等がアウトオブボキャブラリモデルと
して用いられる音声認識方法がある。

【００１３】さらに、このアウトオフボキャブラリモデ
ル、特にガーベージモデルは、少なくとも音声文法（ph
one grammar）等を含むものとして好んで用いられる。
音声文法を用いると、一連の単音、音素、音節等から構
成されるあらゆる発生音（utterance）は、少なくとも
ガーベージモデル内で、キーワードモデルを除いて、確
実に適合する。したがって、この方法によれば、あらゆ
る発生音に対し、発生音がキーワードモデル内に含まれ
ていることによって認識されるか、あるいは、発生音が
ガーベージモデルに含まれていることによって拒否され
るかのどちらかになる。このように、発生音は、認識さ
れるか拒否されるかであって、これ以外の第３の可能性
はない。

【００１４】本発明に係る音声認識方法では、可変ペナ
ルティ値（variable penalty value）を、特に、キーワ
ードモデルから、認識処理の遷移（transition）ととも
に可変ペナルティ値をアウトオフボキャブラリモデル
に、及びアウトオフボキャブラリモデルの中に対応付け
ることによって達成することができる。この方法は、ガ
ーベージワードに関連した認識及びキーワードの出力を
増加させることのできる非常に単純な方法である。

【００１５】ある実施例では、特に、各処理において、
可変ペナルティは、アウトオブボキャブラリモデルすな
わちガーベージモデル内で実行される認識処理の認識ス
テップ及び／又はアウトオブボキャブラリモデルすなわ
ちガーベージモデル内での認識処理に要した認識処理時
間に関連している。すなわち、認識処理がガーベージモ
デル内で要する時間又はステップ数に従って、ガーベー
ジモデル内での認識結果の尤度に大きなペナルティが課
される。これにより、キーワードモデルからの任意の認
識結果がガーベージモデル内のある結果に打ち負かされ
た場合のみに拒否される。一方、ある可能性がキーワー
ド及びインボキャブラリワードに与えられた場合には、
キーワードが出力される。

【００１６】本発明に係る音声認識方法では、認識経路
の格子構造等がキーワードモデル及び／又はアウトオブ
ボキャブラリすなわちガーベージモデルで用いられる。
この実施例によれば、格子内の各経路は、可能性のある
キーワード又はガーベージワードにそれぞれ関連してい
る。この方法によれば、ガーベージモデルへのある経路
に入る度に別個のペナルティが課され、ガーベージモデ
ルへ、及びガーベージモデルの中への経路の尤度が減少
し、これによって、あるガーベージワードの尤度が減少
する。アウトオブボキャブラリモデルの格子構造の認識
経路の少なくとも１部分を、特にアウトオブボキャブラ
リモデルすなわちガーベージモデルの統計情報内の可変
ペナルティ値に関連付けることが好ましい。

【００１７】本発明に係る音声認識方法のさらに好まし
い実施例では、マルコフモデル（Markov model）、特に
単一状態のマルコフモデルがアウトオブボキャブラリす
なわちガーベージモデルに少なくとも含まれている。こ
のような特別な場合には、可変ペナルティ値は、マルコ
フモデル内での認識処理の自己遷移（self-transition
s）と関連付けられている。

【００１８】本発明に係る音声認識方法の柔軟性をさら
に高めるために、可変ペナルティ値は、特定のアプリケ
ーション、アプリケーション状態及び／又はユーザ嗜好
等に依存するようになされている。また、可変ペナルテ
ィ値は、特にユーザインターフェースを介したユーザの
操作によって、相互に変更することが好ましい。

【００１９】あるいは、本発明に係る音声認識方法の柔
軟性と順応性は、可変ペナルティ値が特に言語モデルの
モデル統計情報内にランダムアクセス可能な方法で保有
及び／又は格納されるときに高めることができる。

【００２０】本発明の方法は、キーワードモデル及び可
変ペナルティが課されているアウトオブボキャブラリモ
デル、特に、ガーベージモデルでの認識結果に対する尤
度、グローバルスコア等を決定することによって、ま
た、キーワードモデルの尤度がアウトオブボキャブラリ
モデルの尤度よりも大きいときの認識結果を受け入れる
ことによって、有効に実現することができる。これ以外
のときは、認識結果は拒否される。

【００２１】本発明に係る音声認識方法の主要な特徴の
要約を以下に示す。

【００２２】従来の音声認識方法は、自由形式の語彙文
章内でキーワードをスポット（spot）すなわち抽出する
ことを目的としたワードスポッティングシステムを適用
したものである。キーワードは、アプリケーションボキ
ャブラリの単語であってよい。それ以外の単語は、全て
アウトオブボキャブラリワードすなわちガーベージと呼
ばれる。ガーベージモデルなどと呼ばれる統計モデル
は、これら全てのアウトオブボキャブラリワードと一致
するように操作される。

【００２３】キーワードモデル及びガーベージモデル
は、ワードスポッティングシステムにおいて競合しあ
う。キーワードモデル及びガーベージモデルのそれぞれ
２つの尤度が比較され、尤度が低い方が拒否される。

【００２４】キーワードの出力を増加、向上させるため
に、ペナルティが用いられる。本発明の新規な発明性の
ある特徴は、このペナルティを決定、表現及び／又は操
作する方法にあり、キーワードスポッティングシステム
をより正確且つ柔軟性のあるものにすることである。し
たがって、本発明に係る音声認識方法の主な特徴は、ペ
ナルティすなわちペナルティ値を可変にすることによっ
て、認識処理、アプリケーション状況、ユーザ嗜好等の
さらなる特徴を考慮できるようにすることである。した
がって、認識処理は、基本アルゴリズム又は処理を変更
することなく適用される。

【００２５】ワードスポッティングシステムでは、キー
ワードの尤度がガーベージモデルのガーベージワードの
尤度と比較される。ペナルティを追加することで、ガー
ベージモデルのガーベージワードの尤度が減り、キーワ
ードモデルに含まれるキーワードの出力が増加される。
従来の多くの音声認識方法の場合、ペナルティ値は、キ
ーワードモデルからガーベージモデルへの遷移中のみに
追加される。特に、格子構造を、それぞれが可能なキー
ワード又はガーベージワードを表す異なる経路で仮定し
た場合、従来、システムがガーベージモデルへの経路を
辿る度に固定されたペナルティが追加され、キーワード
モデルからガーベージモデルへの経路の尤度が減少す
る。

【００２６】従来のワードスポッタでは、ペナルティ
は、ガーベージモデルへの最初の遷移のときにおいての
み固定及び追加される。このため、このシステムは、い
わゆる自己遷移中に、累積したグローバルスコアにさら
にペナルティを追加されることなく、長期間ガーベージ
モデル内にあることが可能になる。

【００２７】反対に、本発明に係る音声認識方法におい
ては、例えばガーベージモデル内にある認識処理又はこ
れに関連するガーベージモデル内の認識ステップに要す
る時間に従ってペナルティが可変にされると、ガーベー
ジモデルを除去し、キーワードモデル内の可能性のある
キーワードを一致させるために尤度をさらに高めること
ができる。

【００２８】さらに、従来の音声認識方法及び従来のワ
ードスポッティングシステムでは、この方法及びシステ
ムの設計者がペナルティを固定する。一般に、ペナルテ
ィの値は、ペナルティが高い場合に対応し誤って受け取
られたキーワードの数と、ペナルティが低い場合に対応
し誤って拒否されたキーワードの数の妥協値を示す。

【００２９】これに対し、本発明によれば、ペナルティ
は、実際にアプリケーション及び／又はユーザ嗜好に依
存する。例えば、エンターテイメントロボットを用いた
従来の対話システム（dialogue system）では、誤った
キーワード検出の結果、ロボットは、特に動作状態にお
いて、奇妙且つ特異な動きをしてしまう。一方、ユーザ
は、ロボットのこのような特異な動作には満足すること
はなく、特に動作状態において、ロボットに命令通りに
動いてほしいと思う。本発明では、アプリケーション状
況及び／又はユーザ嗜好に関するこれらの状況は変更で
きるものであると考え、ユーザの目的及び／又はアプリ
ケーション状況の必要性に従って、ガーベージモデル内
のペナルティ及びペナルティ値を変更してペナルティ及
びペナルティ値を調整して適応させる。

【００３０】さらに、従来のワードスポッティングシス
テムは、一般にエンドユーザがアクセス不可能な基本ソ
ースコード内に、固定された方法で定義されたペナルテ
ィ値を備えている。また、本発明によれば、本発明の音
声認識方法の柔軟性をさらに高め、より新規且つ可能性
のあるアプリケーションを達成するために、ユーザは、
ユーザインターフェースを介してペナルティを変更した
り変化させたりすることができる。したがって、ペナル
ティにアクセスし、例えばハードディスク等のアクセス
メモリ内にモデル統計情報と共に保存することが容易に
行える。その結果、ソースコードを変更することなく既
存の音声認識ソフトウェアを用いることが可能になる。

【００３１】さらに、本発明の特徴は、ガーベージすな
わちアウトオフボキャブラリモデル内に残っている認識
処理の各ステップ又はフレームについて、あるペナルテ
ィ又はペナルティ値をグローバルペナルティ変数を作成
するグローバルスコアに追加することができることであ
る。キーワード及びガーベージモデルに対する格子構造
を考慮すると、ガーベージモデル内により長く滞在する
経路にさらなるペナルティが課され、一方、内部にキー
ワードを備えた経路は、より可能性があるので出力され
る。したがって、本発明によれば、ペナルティは、アウ
トオブボキャブラリすなわちガーベージモデル内での認
識処理又はシステムによって費やされた時間に依存す
る。

【００３２】図２は、従来の音声認識方法の具体的な構
成を示すブロック図である。図２に示すように、第１の
ステップ１１において、音声フレーズＳＰが供給され
る。供給された音声フレーズＳＰは、認識ステップすな
わちステップ１２に送られる。例えばキーワードモデル
ＫＭ及びガーベージモデルＧＭもしくは基本の言語モデ
ルＬＭのアウトオブボキャブラリＯＯＶＭの格子構造に
基づいて、異なる経路をチェックし、少なくとも上述し
た可能性のあるキーワードＫ１乃至Ｋ３の１つ又はガー
ベージワードＧ０乃至Ｇ６の１つが供給された音声フレ
ーズＳＰと最適に適合するかどうかを調べる。

【００３３】ガーベージモデルＧＭのペナルティを課さ
れた尤度ＬＧＭを計算するために、ある事前定義された
関数ｆが、遷移ステップＴ及びそれぞれの固定定義され
た遷移ペナルティＰｔｒａｎｓを介して、ガーベージモ
デル尤度ＬＧＭ'上及び言語モデルＬＭ、特にガーベー
ジモデルＧＭ内に挿入された固定グローバルペナルティ
Ｐｇｌｏｂ上で評価される。すなわち、Ｐｇｌｏｂ：＝
Ｐｔｒａｎｓとなる。

【００３４】比較ステップ１３において、キーワードモ
デル尤度ＬＫＭがペナルティを課されたガーベージモデ
ル尤度ＬＧＭよりも大きいかどうかがチェックされる。
大きい場合には、認識された音声フレーズＲＳＰが受け
入れられ、及び／又は一連の認識されたキーワードすな
わちキーフレーズ（Ｋｊ）としてステップ１４で出力さ
れる。大きくない場合には、供給された音声フレーズＳ
Ｐは、ステップ１５で拒否される。

【００３５】図１は、本発明に係る音声認識方法の具体
的な構成を示すブロック図である。図２に示した従来の
音声認識方法とは対照的に、図１に示す音声認識方法で
は、可変グローバルペナルティＰｇｌｏｂを用いてい
る。図１の実施例では、このグローバルペナルティＰｇ
ｌｏｂは、実際にステップ及び／又は時間に依存するペ
ナルティＰ１乃至Ｐ６の機能的な組合わせの可変性に応
じて可変にされる。さらに、遷移ステップＴを介したキ
ーワードモデルＫＭからガーベージモデルＧＭへの遷移
のための遷移ペナルティＰｔｒａｎｓを含むこともで
き、この遷移ペナルティも可変であってよい。

【００３６】６ペナルティＰ１乃至Ｐ６上の選択された
７つのガーベージワードＧ０乃至Ｇ６の数は１つの具体
例であり、本発明はこの具値例に限定されることはな
い。

【００３７】

【発明の効果】キーワードスポッティング処理を適用し
た音声認識方法の正確性と柔軟性を高める。

【図面の簡単な説明】

【図１】本発明に係る音声認識方法の具体的な構成を示
すブロック図である。

【図２】従来の音声認識方法の具体的な構成を示すブロ
ック図である。

【符号の説明】

１１第１ステップ、１２認識ステップ、１３比較
ステップ、１４出力ステップ、１５拒否ステップ

───────────────────────────────────────────────────── フロントページの続き (72)発明者ラッディノダニエーラドイツ連邦共和国 70327 シュトゥットゥガルトヘデルフィンガーシュトラーセ 61 ソニーインターナショナル（ヨーロッパ）ゲゼルシャフトミットベシュレンクテルハフツングアドバンストテクノロジーセンターシュトゥットゥガルト内 (72)発明者コンペラルフドイツ連邦共和国 70327 シュトゥットゥガルトヘデルフィンガーシュトラーセ 61 ソニーインターナショナル（ヨーロッパ）ゲゼルシャフトミットベシュレンクテルハフツングアドバンストテクノロジーセンターシュトゥットゥガルト内 (72)発明者ケムプトーマスドイツ連邦共和国 70327 シュトゥットゥガルトヘデルフィンガーシュトラーセ 61 ソニーインターナショナル（ヨーロッパ）ゲゼルシャフトミットベシュレンクテルハフツングアドバンストテクノロジーセンターシュトゥットゥガルト内Ｆターム(参考） 5D015 HH00

Claims

【特許請求の範囲】

【請求項１】音声認識方法において、供給された音声フレーズ（ＳＰ）内の少なくともキーワ
ード（Ｋｊ）がキーワードスポッティングに基づいた認
識処理（１２）及び与えられた言語モデル（ＬＭ）を用
いて認識され、認識可能なインボキャブラリすなわちキーワードすなわ
ちフレーズ（Ｋｊ）を含有及び／又は表現する少なくと
も１つの第１言語すなわちキーワードモデル（ＫＭ）
と、アウトオブボキャブラリワードすなわちフレーズ
（Ｇｊ）を少なくとも部分的に表す第２言語すなわちア
ウトオブボキャブラリモデル（ＯＯＶＭ）の組合わせが
上記言語モデル（ＬＭ）として用いられ、キーワード（ｋｊ）の認識を増加させるため、グローバ
ルペナルティ（Ｐｇｌｏｂ）が上記言語モデル（ＬＭ）
と関連付けられ及び／又は導入すなわち挿入され、少なくとも１つの可変ペナルティ値（Ｐｔｒａｎｓ、Ｐ
１、．．．Ｐ６）が関連付けられ及び／又は使用され、
上記グローバルペナルティ（Ｐｇｌｏｂ）を定義する、ことを特徴とする音声認識方法。
【請求項２】上記可変ペナルティ値（Ｐｔｒａｎｓ、
Ｐ１、．．．Ｐ６）は、各処理において、認識処理、ユ
ーザ入力、供給された音声フレーズ（ＳＰ）自体及び／
又は等の特性等に依存、すなわち関数となされてること
を特徴とする請求項１に記載の音声認識方法。
【請求項３】少なくとも１つの統計モデル、ガーベー
ジモデル（ＧＭ）及び／又はその他同様のものが上記ア
ウトオブボキャブラリ（ＯＯＶＭ）として用いられるこ
とを特徴とする請求項１又は２のいずれか１項に記載の
音声認識方法。
【請求項４】少なくとも音声文法等を含有するため
に、上記アウトオブボキャブラリ（ＯＯＶＭ）及び上記
ガーベージモデル（ＧＭ）が選択されることを特徴とす
る請求項１乃至３のいずれか１項に記載の音声認識方
法。
【請求項５】上記可変ペナルティ値（Ｐｔｒａｎｓ、
Ｐ１、．．．Ｐ６）は、認識処理（１２）のキーワード
モデル（ＫＭ）からアウトオブボキャブラリモデル（Ｏ
ＯＶＭ）への遷移（Ｔ）と関連付けられていることを特
徴とする請求項１乃至４のいずれか１項に記載の音声認
識方法。
【請求項６】上記可変ペナルティ値（Ｐｔｒａｎｓ、
Ｐ１、．．．Ｐ６）は、各処理において、上記アウトオ
ブボキャブラリモデル（ＯＯＶＭ）すなわちガーベージ
モデル（ＧＭ）内の認識ステップ及び／又は上記認識処
理（１２）の認識又は処理時間と関連付けられているこ
とを特徴とする請求項１乃至５のいずれか１項に記載の
音声認識方法。
【請求項７】上記キーワードモデル（ＫＭ）及び／又
は上記アウトオブボキャブラリモデル（ＯＯＶＭ）すな
わちガーベージモデル（ＧＭ）において、認識経路の格
子構造等が用いられることを特徴とする請求項１乃至６
のいずれか１項に記載の音声認識方法。
【請求項８】上記アウトオブボキャブラリモデル（Ｏ
ＯＶＭ）内の上記認識経路の少なくとも１部は、上記ア
ウトオブボキャブラリモデル（ＯＯＶＭ）すなわちガー
ベージモデル（ＧＭ）の統計情報内の可変ペナルティ値
（Ｐｔｒａｎｓ、Ｐ１、．．．Ｐ６）と関連付けられて
いることを特徴とする請求項１乃至７のいずれか１項に
記載の音声認識方法。
【請求項９】マルコフモデル又は単一状態のマルコフ
レベルが少なくとも上記アウトオブボキャブラリモデル
（ＯＯＶＭ）すなわちガーベージモデル（ＧＭ）内に含
まれており、可変ペナルティ値（Ｐ１、．．．Ｐ６）は、上記マルコ
フモデル内の認識処理の自己遷移と関連付けられている
ことを特徴とする請求項１乃至８のいずれか１項に記載
の音声認識方法。
【請求項１０】可変ペナルティ値は、マルコフモデル
内の全ての遷移と関連付けられていることを特徴とする
請求項１乃至９のいずれか１項に記載の音声認識方法。
【請求項１１】上記可変ペナルティ値（Ｐｔｒａｎ
ｓ、Ｐ１、．．．Ｐ６）は、特定のアプリケーション、
アプリケーション状態及び／又はユーザ嗜好に依存する
ようになされていることを特徴とする請求項１乃至１０
のいずれか１項に記載の音声認識方法。
【請求項１２】上記可変ペナルティ値（Ｐｔｒａｎ
ｓ、Ｐ１、．．．Ｐ６）は、ユーザインターフェースを
介したユーザの操作によって相互に変更されることを特
徴とする請求項１乃至１１のいずれか１項に記載の音声
認識方法。
【請求項１３】上記可変ペナルティ値（Ｐｔｒａｎ
ｓ、Ｐ１、．．．Ｐ６）は、ランダムアクセス方法で、
上記言語モデル（ＬＭ）のモデル統計情報内に保有及び
格納されることを特徴とする請求項１乃至１２のいずれ
か１項に記載の音声認識方法。
【請求項１４】上記キーワードモデル（ＫＭ）及び上
記アウトオブボキャブラリモデル（ＯＯＶＭ）すなわち
上記ガーベージモデル（ＧＭ）における認識結果に対し
尤度（ＬＫＭ、ＬＧＭ）、グローバルスコア等が決定さ
れ、上記ガーベージモデル（ＧＭ）が可変的にペナルテ
ィを課されており、認識結果（ＲＳＰ）は、上記アウトオブボキャブラリモ
デル尤度（ＬＧＭ）よりも大きい上記キーワードモデル
尤度（ＬＫＭ）と共に受け入れられるか、あるいは、ア
ウトオブボキャブラリとして拒否されることを特徴とす
る請求項１乃至１３のいずれか１項に記載の音声認識方
法。