JP2002536691A5

JP2002536691A5 -

Info

Publication number: JP2002536691A5
Application number: JP2000597792A
Authority: JP
Filing date: 2000-02-04
Publication date: 2005-04-28
Anticipated expiration: 2020-02-04

Claims

第１のスコアを生成するために発話を第１の記憶された単語と比較し、
第２のスコアを生成するために発話を第２の記憶された単語と比較し、
第１のスコアと第２のスコアとの間の差を決定し、
その差に対する第１のスコアの比を決定し、
その比に基づいて発話を処理するステップを含んでいる音声認識システムにおける発話捕捉方法。
差に対する第１のスコアの比が第１の値の範囲内に入っている場合、その発話を受入れ、
差に対する第１のスコアの比が第２の値の範囲内に入っている場合、その発話を確認するためにＮベストアルゴリズムを適用し、
差に対する第１のスコアの比が第３の値の範囲内に入っている場合、その発話を除去するステップをさらに含んでいる請求項１記載の方法。
差は第１のスコアと第２のスコアとの間のスコアの変化に対応している請求項１記載の方法。
第１の記憶された単語は、音声認識システムの語彙の中でベストな候補を含み、第２の記憶された単語は音声認識システムの語彙の中で２番目にベストな候補を含んでいる請求項１記載の方法。
第１のスコアは最も近い比較結果を含み、第２のスコアは２番目に最も近い比較結果を含んでいる請求項１記載の方法。
第１のスコアおよび第２のスコアは、線形予測符号化係数を含んでいる請求項１記載の方法。
第１のスコアおよび第２のスコアは、ケプストラム係数を含んでいる請求項１記載の方法。
第１のスコアおよび第２のスコアは、バンドパスフィルタ出力を含んでいる請求項１記載の方法。
第１、第２および第３の値の範囲は、第１のスコアと差との間の線形関係を規定する請求項１記載の方法。
差は、最も近い比較結果と２番目に近い比較結果との間の差を含んでいる請求項１記載の方法。
発話のデジタル化されたスピーチサンプルからスピーチパラメータを抽出するように構成された音響プロセッサと、
この音響プロセッサに結合されたプロセッサとを具備しており、
前記プロセッサは、
第１のスコアを生成するために発話を第１の記憶された単語と比較し、
第２のスコアを生成するために発話を第２の記憶された単語と比較し、
第１のスコアと第２のスコアとの間の差を決定し、
その差に対する第１のスコアの比を決定し、
その関係に基づいて発話を処理するように構成されている音声認識システム。
プロセッサはさらに、
差に対する第１のスコアの比が第１の値の範囲内に入っている場合、その発話を受入れ、
差に対する第１のスコアの比が第２の値の範囲内に入っている場合、その発話を確認するためにＮベストアルゴリズムを適用し、
差に対する第１のスコアの比が第３の値の範囲内に入っている場合、その発話を除去するように構成されている請求項１１記載の音声認識システム。
差は第１のスコアと第２のスコアとの間のスコアの変化に対応している請求項１１記載の音声認識システム。
第１の記憶された単語は音声認識システムの語彙の中でベストな候補を含み、第２の記憶された単語は音声認識システムの語彙の中で２番目にベストな候補を含んでいる請求項１１記載の音声認識システム。
第１のスコアは最も近い比較結果を含み、第２のスコアは２番目に最も近い比較結果を含んでいる請求項１１記載の音声認識システム。
第１および第２のスコアは、線形予測符号化係数を含んでいる請求項１１記載の音声認識システム。
第１のスコアおよび第２のスコアは、ケプストラム係数を含んでいる請求項１１記載の音声認識システム。
第１のスコアおよび第２のスコアは、バンドパスフィルタ出力を含んでいる請求項１１記載の音声認識システム。
第１、第２および第３の値の範囲は、第１のスコアと差との間の線形関係を規定する請求項１２記載の音声認識システム。
差は、最も近い比較結果と２番目に最も近い比較結果との間の差を含んでいる請求項１１記載の音声認識システム。
第１のスコアを生成するために発話を第１の記憶された単語と比較する手段と、
第２のスコアを生成するために発話を第２の記憶された単語と比較する手段と、
第１のスコアと第２のスコアとの間の差を決定する手段と、
その差に対する第１のスコアの比を決定する手段と、
その関係に基づいて発話を処理する手段とを具備している音声認識システム。
さらに、差に対する第１のスコアの比が第１の値の範囲内に入っている場合、その発話を受入れる手段と、
差に対する第１のスコアの比が第２の値の範囲内に入っている場合、その発話を確認するためにＮベストアルゴリズムを適用する手段と、
差に対する第１のスコアの比が第３の値の範囲内に入っている場合、その発話を除去する手段を含んでいる請求項２１記載の音声認識システム。
第１、第２および第３の値の範囲は、第１のスコアと差との間の線形関係を規定する請求項２２記載の音声認識システム。
差は、第１のスコアと第２のスコアとの間のスコアの変化に対応している請求項２１記載の音声認識システム。
第１の記憶された単語は音声認識システムの語彙の中でベストな候補を含み、第２の記憶された単語は音声認識システムの語彙の中で２番目にベストな候補を含んでいる請求項２１記載の音声認識システム。
第１のスコアは最も近い比較結果を含み、第２のスコアは２番目に最も近い比較結果を含んでいる請求項２１記載の音声認識システム。
第１のスコアおよび第２のスコアは、線形予測符号化係数を含んでいる請求項２１記載の音声認識システム。
第１のスコアおよび第２のスコアは、ケプストラム係数を含んでいる請求項２１記載の音声認識システム。
第１のスコアおよび第２のスコアは、バンドパスフィルタ出力を含んでいる請求項２１記載の音声認識システム。
差は、最も近い比較結果と２番目に最も近い比較結果との間の差を含んでいる請求項２１記載の音声認識システム。
発話のデジタル化されたスピーチサンプルからスピーチパラメータを抽出する手段と、
第１のスコアを生成するために発話を第１の記憶された単語と比較し、
第２のスコアを生成するために発話を第２の記憶された単語と比較し、
第１のスコアと第２のスコアとの間の差を決定し、
その差に対する第１のスコアの比を決定し、
その関係に基づいて発話を処理する手段とを具備している音声認識システム。
さらに、差に対する第１のスコアの比が第１の値の範囲内に入っている場合、その発話を受入れ、
差に対する第１のスコアの比が第２の値の範囲内に入っている場合、その発話に対してＮベストアルゴリズムを適用し、
差に対する第１のスコアの比が第３の値の範囲内に入っている場合、その発話を除去する手段を含んでいる請求項３１記載の音声認識システム。
差は、最も近い比較結果と２番目に最も近い比較結果との間の差を含んでいる請求項３１記載の音声認識システム。
差は、第１のスコアと第２のスコアとの間のスコアの変化に対応している請求項３１記載の音声認識システム。
第１の記憶された単語は、音声認識システムの語彙の中でベストな候補を含み、第２の記憶された単語は音声認識システムの語彙の中で２番目にベストな候補を含んでいる請求項３１記載の音声認識システム。
第１のスコアは最も近い比較結果を含み、第２のスコアは１以上の２番目に最も近い比較結果を含んでいる請求項３１記載の音声認識システム。
第１のスコアおよび第２のスコアは、線形予測符号化係数を含んでいる請求項３１記載の音声認識システム。
第１のスコアおよび第２のスコアは、ケプストラム係数を含んでいる請求項３１記載の音声認識システム。
第１のスコアおよび第２のスコアは、バンドパスフィルタ出力を含んでいる請求項３１記載の音声認識システム。
第１、第２および第３の値の範囲は、第１のスコアと差との間の線形関係を規定する請求項３２記載の音声認識システム。