JP3032551B2 - 音声標準パターン登録方法 - Google Patents

音声標準パターン登録方法

Info

Publication number
JP3032551B2
JP3032551B2 JP2186571A JP18657190A JP3032551B2 JP 3032551 B2 JP3032551 B2 JP 3032551B2 JP 2186571 A JP2186571 A JP 2186571A JP 18657190 A JP18657190 A JP 18657190A JP 3032551 B2 JP3032551 B2 JP 3032551B2
Authority
JP
Japan
Prior art keywords
pattern
registered
beginning
exist
silent section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2186571A
Other languages
English (en)
Other versions
JPH0473800A (ja
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2186571A priority Critical patent/JP3032551B2/ja
Publication of JPH0473800A publication Critical patent/JPH0473800A/ja
Application granted granted Critical
Publication of JP3032551B2 publication Critical patent/JP3032551B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識における標準パターンの登録方法
に関するものである。
従来技術 音声認識装置には特定話者方法と不特定話者方法があ
り、それぞれ音声の登録が必要なものと、不要なものに
別れる。方言も含めて誰の声でも認識できる不特定話者
音声認識は実現が非常に難しい事、認識の精度が特定話
者方法の方が良い事等から現在では簡単な特定話者単語
音声認識が実用になっているに過ぎない。
特定話者方法では、あらかじめ使用する音声を登録す
る訳であるが、多少の労力は増えても1つの言葉に対し
て複数回登録する方が認識精度が向上する事が知られて
いる。複数回発声した音声を平均して登録する方法とそ
れらを別々に登録しておく方法があるがここでは前者の
方法を用いる場合について述べる。
一方、実際に音声認識装置を使う上で、認識しにくい
原因の多くは、入力されたパターンが正確に作成できな
い事にある。つまり、入力用のマイクの使い方の違いに
よって発声している音声の一部が欠落して必要な情報が
欠損するために、誤認識となる訳である。特にこの現象
は音声の冒頭や末尾に破裂性の子音が付いているような
場合、たとえば、/stop/,/pink/等で起こりやすい。
第7図は、前述の複数回発声した音声をパターンの始
端と終端とを対応づけて線形伸縮する事でパターン長を
一致させ、平均をとる場合の例を説明するための図で、
2つのパターンの平均を取る際、1つのパターン(a)
は正常であっても、他方のパターン(b)の一部が欠落
していると、第2図(c)に示すように平均する事でむ
しろパターンの質を低下させる事になる。
第8図は、上述のごとき問題点に対する対策の一例を
説明するための図で(もし、必要ならば、特願昭62−23
8336号参照)、ここでは例として末尾に誤検出しやすい
子音がつく場合を述べるが、冒頭でも同様に配慮する事
で実行可能である。まず、一方のパターン(a)にのみ
誤検出しやすい子音がついて、他方のパターン(b)で
は欠落しているような場合、標準パターン登録時はこれ
らが同じ音声を発生した時に得られるものである事がわ
かっていることから、冒頭又は末尾の誤検出しやすい子
音/P/をそのまま他方へコピー((b))図の点線)し
ておいてから両者を対応づけ、重ね合わせを行なう
(c)。この結果得られるパターンは異なる音声の平均
を取る事なく、正しい対応づけ、つまりパターンを乱す
事が無い。照合時は次の様にする。
(1)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていて、標準パターンに付いている場
合:対応づく部分同士を対応させて通常通りの照合をす
る。
(2)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていて、標準パターンに付いていない場
合:標準パターンの誤検出しやすい子音を取除いた部分
と未知パターンの照合をする。
(3)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていなくて、標準パターンに付いている
場合:標準パターンの誤検出しやすい子音を取除いた部
分と未知パターンの照合をする。
本出願人は、上述のごときパターン照合方法の開発に
よって、誤検出しやすい子音が付いていても、あるい
は、パターンの冒頭や末尾に小さなノイズがついていて
も正しい照合ができるようにした。しかしながら、パタ
ーンの全長を一定にしてから、始端や終端に誤検出しや
すい子音があるかどうかを調べても、それを取除くとパ
ターンの長さが変ってしまうことから、効果は小さい。
さらに、本出願人は、パターン長を一定にして照合す
る音声パターンマッチング方法において、入力された未
知の音声の冒頭、または、末尾に音声のエネルギーが低
い部分が見出された時、全体のパターンを定められた長
さに変換すると共に、エネルギーが低い部分から先端ま
での部分、あるいは、エネルギーが低い部分から末尾ま
での部分を取除いた残りのパターンを、定められた長さ
に変換して両方を保持しておき、両方を標準パターンと
照合し、類似性の高い方の結果をパターン間の類似性と
定義するようにしたパターンマッチング方法について提
案したが、その際標準パターンを何回かの発声の平均に
よって作る方法には提案されておらず、第7図に示すよ
うな場合、パターンが異常になる問題は解決されていな
かった。
目的 本発明は、上述のごとき従来技術の問題点を改良する
ために為れされたものであり、パターン長を一定にして
照合するような照合方法であって、子音の欠落を考慮し
てマッチング出来るような照合方法において、質のよ
い、平均化標準パターンを作るためのパターン登録方法
を提供することを目的としてなされたものである。
構成 本発明は、上記目的を達成するために、(1)入力さ
れた音声を特徴量に変換して、特徴パターンとなし、こ
れを決められた時間長に正規化する際に、もとのパター
ンの冒頭や、末尾に無音区間が存在するか否かを調べ、
存在しない時には正規化されたパターンをそのまま登録
し、存在する時には、存在しない時と同様の登録後、そ
の無音区間の部分から冒頭に近い部分、或いは、その部
分から末尾に近い部分を取除いた残りのパターンを決め
られた長さにするようなパターン登録法において、パタ
ーンが修正されずに正規化されたものか、無音区間の部
分から冒頭に近い部分を取除いたものか、或いは、その
部分から末尾に近い部分を取除いたものであるかを分類
して登録するようにしたこと、或いは、(2)登録すべ
き言葉を複数回発声し、最初の発声は上記(1)の方法
で登録し、2回目以降の発声では、特徴パターンに変換
した後、その冒頭または末尾近くに無音区間が存在する
か否かを調べ、存在しない時には、決められた長さに正
規化した後、あらかじめ登録されている同じ分類のパタ
ーンと平均を取った上で登録するようにしたこと、或い
は、(3)登録すべき言葉を複数回発声し、最初の発声
は上記(1)の方法で登録し、2回目以降の発声では、
特徴パターンに登録した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在する時には、存
在しない時と同様の正規化パターンを作成後、その無音
区間の部分から冒頭に近い部分、或いは、その部分から
末尾に近い部分を取除いた残りの部分を決められた長さ
に正規化したパターンを作っておき、あらかじめ登録さ
れている同じ分類のパターンと平均を取った上で登録す
るようにしたこと、或いは、(4)登録すべき言葉を複
数回発声し、最初の発声は上記(1)の方法で登録し、
2回目以降の発声では、特徴パターンに変換した後、そ
の冒頭または末尾近くに無音区間が存在するか否かを調
べ、存在しない時には決められた長さに正規化した後、
あらかじめ登録されているパターンが1つの言葉に対し
て複数登録されているかどうかを調べ、複数登録されて
いる場合、あらかじめ登録されているパターンと、今正
規化したパターンとの間で類似性を求め、最大の類似性
が得られたパターンと平均を取った上で複数個のパター
ンとして登録するようにしたこと、或いは、(5)登録
すべき言葉を複数回発声し、最初の発声は上記(1)の
方法で登録し、2回目以降の発声では、特徴パターンに
変換した後、その冒頭または末尾近くに無音区間が存在
するか否かを調べ、存在しない時には、決められた長さ
に正規化した後、あらかじめ登録されているパターンが
1つの言葉に対して複数登録されているかどうかを調
べ、複数登録されている場合、あらかじめ登録されてい
るパターンと、今正規化したパターンとの間で類似性を
求め、得られたうちで最大の類似性が決められた値より
も小なる時、このパターンは平均を取らずに登録するよ
うにしたこと、或いは、(6)登録すべき言葉を複数回
発声し、最初の発声は上記(1)の方法で登録し、2回
目以降の発声では、特徴パターンに変換した後、その冒
頭または末尾近くに無音区間が存在するか否かを調べ、
存在する時には、まず、存在しない時と同様の操作で正
規化パターンを作成後、その無音区間の部分から冒頭に
近い部分、或いは、その部分から末尾に近い部分を取除
いた残りの部分を決められた長さに正規化したパターン
を作っておき、あらかじめ登録されているパターンが1
つの言葉に対して複数登録されているかどうかを調べ、
登録されているパターンが1つの場合、あらかじめ登録
されているパターンと、今正規化した2つのパターンと
の間で類似性を求め、最大の類似性が得られたパターン
と平均を取った上で登録し、平均を取らなかった方のパ
ターンはそのまま登録するようにしたこと、或いは、
(7)前記(4)において、一つのカテゴリーに一定の
数だけのパターンを登録する事とした時、あらたに平均
を取ったパターンの保存の優先順位は末尾を切取った残
りを長さを正規化したもの、冒頭を切取った残りの長さ
を正規化したものの順とすること、或いは、(8)前記
(4)において、あらたに平均を取ったパターンの分類
の優先順位は末尾を切取った残りの長さを正規化したも
の、冒頭を切取った残りの長さを正規化したもの、修正
をしなかったものとし、平均を取らないパターンはその
パターンに施した操作によって分類するようにしたこ
と、或いは、(9)前記(6)において、平均を取らな
いパターンはそのパターンに施した操作によって分類す
るようにしたことを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための構成図
で、図中、1は音声信号入力部、2は音声区間検出部、
3は特徴変換部、4は音声パワー検出部、5は比較部、
6は閾値部、7はレジスタ、8,8′は伸縮部、9は判断
部、10は部分切捨部、11,12はレジスタ、13は平均部
で、本発明は、入力された音声を特徴量に変換して、特
徴パターンとなし、これを決められた時間長に正規化す
る際に、もとのパターンの冒頭や、末尾に無音区間が存
在するか否かを調べ、存在しない時には正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録法において、パターンの全体が修正されずに正規化
して一定長にされたものか、無音区間の部分から冒頭に
近い部分を取除いたものか、或いは、その部分から末尾
に近い部分を取除いたものであるかを分類して登録する
ようにしたものであり、更には、登録すべき言葉を複数
回発声し、最初の発声は上記方法で登録し、2回目以降
の発声では、特徴パターンに変換した後、その冒頭また
は末尾近くに無音区間が存在するか否かを調べ、存在し
ない時には決められた長さに正規化した後、あらかじめ
登録されているパターンと平均を取った上で登録するよ
うにし、存在する時には、存在しない時と同様の正規化
パターンを作成した後、その無音区間の部分から冒頭に
近い部分、或いは、その部分から末尾に近い部分を取り
除いた残りの部分を決められた長さに正規化したパター
ンを作っておき、あらかじめ登録されている同じ分類の
パターンと平均を取った上で登録するようにしたもので
ある。以下、本発明の実施例について図面に基いて説明
すると、第1図において、音声は入力部1から入力され
るが、この入力部1はマイクロフォンとマイクアンプで
構成されている。入力された信号の中から音声に係るも
のが音声区間検出部2で検出される。音声区間検出の方
法はいくつか提案されていてその中のどれを用いても実
行可能であるが、音声のパワーが閾値を越えたかどうか
で始端を見つけ、再び閾値より下がるまでを音声区間と
する方法を用いるとよい。
次に、特徴変換部3で特徴量に変換され、特徴パター
ンを形成する。特徴量としては、音声のスペクトラムを
使う事が多いがこれに限定するものではなく、線形予測
分析をしても良いし、ケプトストラム分析でもその他ど
の様なものでも良い。パワー検出部4では入力された音
声の大きさを求めてあらかじめ設定されている閾値6と
比較する。この閾値よりもパワーが小さい時には音声の
休止区間、即ち無音区間が発生したものとする。この時
の閾値は音声が入力されない時のパワーの定数をかけて
決定すれば良い。一方、レジスタ7には検出された音声
が格納され、伸縮部8で全体を一定の長さに伸縮したも
のをレジスタ11へ入れる。この時、他の種類のパターン
とレジスタを分けて格納しても良いし、パターンにパタ
ーン全体をそのまま伸縮したことを表わすマークをつけ
てレジスタに入れても良い。ここではマークとして
‘ ’を付けて登録する事にする。また、比較部5で比
較されて検出されて検出された無音区間が判断部9で音
声区間の冒頭や末尾近くに存在すると判断された場合に
は、レジスタ7の内容から無音区間から冒頭まで、ある
いは無音区間から末尾までを部分切捨部10で切捨てて残
りを再び伸縮部8′にて一定値に伸縮してレジスタ11に
先のパターンと一緒に登録しておく。ここで無音区間か
ら冒頭まで切捨てて作ったパターンには‘A'のマーク
を、無音区間から末尾までを切捨てて作ったパターンに
は‘S'のマークを付けておく事にする。冒頭や、末尾の
近くとは端点から100ms〜200ms程度の時間を言う。続い
て平均部13でレジスタ11と12の内容を平均し、その結果
をレジスタ12の中に保存しておく。1回目の発声の時
は、先にレジスタ12の中には何も入っていないので、レ
ジスタ11の内容がレジスタ12にコピーされることにな
る。2回目以降の発声では、レジスタ12と11が平均され
てレジスタ12に上書きされる。ただし、1つの単語の登
録が終った時には、レジスタ12の内容はクリアされるべ
きである。平均をとる際には、あらかじめ登録されてい
るパターンが全体パターン、つまり、マーク‘ ’の付
いたもの1つだけであるか、部分的に切捨てて2つのパ
ターンがあるのかを調べて、レジスタ11と12の中の同じ
マークの付いたもの同士を平均するようにする。これに
よって複数回発声したパターンの平均がとれ、標準パタ
ーンとしての質を向上させる事ができる。
しかしながら、入力された時にすでにパターンの冒頭
が検出できなかった場合、冒頭が欠落したパターンに
‘ ’のマークを付けてしまう事となり、この結果、平
均を取るべきパターンがちがって、欠落したパターンと
しないパターンの平均を取ってしまうような事となる。
したがって、パターンの質が劣化することになる。
第2図は、上述のごとき問題点を解決した実施例を説
明するための図で、この実施例では、登録すべき言葉を
複数回発声し、最初の発声は上記方法で登録し、2回目
以降の発声では、特徴パターンに変換した後、その冒頭
または末尾近くに無音区間が存在するか否かを調べ、存
在しない時にはこれを決められた長さに正規化すると共
に、さきに登録されているパターンが1つの言葉に対し
て複数登録されているかどうかを調べる。今回の発声か
ら作ったパターンか、先に登録されているパターンのど
ちらかが複数ある場合、それらの間で類似性を求め、最
大の類似性が得られたパターンと平均を取った上で複数
個のパターンとして登録するようにしている。
以下、本実施例について第2図に基いて説明するが、
第2図中、第1図に示した実施例と同様の作用をする部
分には、第1図の場合と同一の参照番号を付し、その説
明は省略する。この実施例においては、第1図に示した
実施例と同様、マークを付けてレジスタ11へ登録してか
ら、レジスタ11とレジスタ12の内容の類似度を類似度判
断部14でとる。この様子を第3図に示す。仮に、レジス
タ12にはパターンが1つ、レジスタ11には2つ入ってい
るものとする。たとえば、「stop」という単語の1回目
の発声時に/p/の検出ミスがあり、「sto」が入っている
とし、2回目の発声は正確に「stop」と入力されたとす
る。この時、2回目の発声は/p/の前に無音区間ができ
る事から、まず、「stop」全体のパターンが‘ ’のマ
ークを付けて保存され、このパターンから末尾の/p/の
部分を取除いた残り、「stop」のパターンを作り、‘s'
のマークを付けて保存する。この後に、レジスタ12のパ
ターンとレジスタ11の中にある2つのパターン間の類似
度を計算する。通常、類似度は類似度2の方が大きいか
ら、第4図に示すように、レジスタ12の内容は、‘s'の
ついたマークを優先させて、レジスタ11の‘s'マークが
ついたパターンと平均を取る事になる。レジスタ11の
‘ ’のマークのパターンはそのままでレジスタ12に格
納される。この例からも分かるように類似度を取る事
で、マークに頼っていて起こす誤りをなくす事ができ
る。
類似度だけに頼ると悪影響が発生する事も有り得るの
で、その防止策として、第5図に示すように、登録すべ
き言葉を複数回発声し、最初の発声は上記方法で登録
し、2回目以降の発声では、特徴パターンに変換した
後、その冒頭または末尾近くに無音区間が存在するか否
かを調べ、存在しない時には決められた長さに正規化し
た後、あらかじめ登録されているパターンが1つの言葉
に対して複数登録されているかどうかを調べ、複数登録
されている場合、あらかじめ登録されているパターン
と、今正規化したパターンとの間で類似性を求め、得ら
れたうちで最大の類似性が決められた値よりも小なる
時、このパターンは平均を取らずに登録するようにし
た。
すなわち、第5図において、得られた類似度を比較部
5′で閾値15と比較し、得られた類似度のうちで最大の
類似度が閾値15によって決められた値よりも小なる時
は、平均をとらずにレジスタ12へ登録するようにした。
この時、判断部9′は、第6図に示すように、‘ ’、
‘A'、‘S'を判断してレジスタ12に登録する。しかし、
‘ ’、‘A'、‘S'の全ての種類のパターンを保存して
おくと、レジスタの容量が大きくなる事から、1つの言
葉に対して持てるパターン数を、例えば2つのように制
限する事が考えられるので、その場合には、一つのカテ
ゴリーに一定の数だけのパターンを登録する事とした
時、あらたに平均を取ったパターンの保存の優先順位
は、末尾を切取った残りの長さを正規化したもの、冒頭
を切取った残りの長さを正規化したものの順とするよう
にした。
一般に発声の最初はエネルギーを集中するのに対し
て、音声の末尾はエネルギーが小さい事が多いことか
ら、冒頭が欠落する単語に比べて末尾が欠落する単語が
多い。したがって、平均を取る際に、第6図に示すよう
に、‘ ’、‘A'、‘S'の3種類のパターンが存在する
場合には、まず、‘ ’を登録し、‘S'を‘A'に優先し
て登録する。この場合‘A'のパターンはレジスタ12から
末梢される。
効果 以上の説明から明らかなように、本発明によると、パ
ターン長を一定にして照合するような照合方法で子音の
欠落を考慮してマッチング出来るようなものにおいて、
質のよい、平均化標準パターンを作ることが可能になっ
た。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための図、第2
図及び第3図は、本発明の他の実施例を説明するための
図、第4図、第5図及び第6図は、それぞれ本発明の他
の実施例を説明するための図、第7図は、誤検出しやす
い子音が欠落する事で生じる不具合を説明するための
図、第8図は、誤検出しやすい子音が欠落する事で生じ
る不具合の対策法を説明するための図である。 1……音声信号入力部、2……音声区間検出部、3……
特徴変換部、4……音声パワー検出部、5……比較部、
6……閾値部、7……レジスタ、8,8′……伸縮部、9
……判断部、10……部分切捨部、11,12……レジスタ、1
3……平均部、14……類似度判断部、15……閾値部。

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、パターンが修正されずに正規化され
    たものか、無音区間の部分から冒頭に近い部分を取除い
    たものか、或いは、その部分から末尾に近い部分を取除
    いたものであるかを分類して登録するようにしたことを
    特徴とする音声標準パターン登録方法。
  2. 【請求項2】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、登録すべき言葉を複数回発声し、最
    初の発声は上記方法で登録し、2回目以降の発声では、
    特徴パターンに変換した後、その冒頭または末尾近くに
    無音区間が存在するか否かを調べ、存在しない時には、
    決められた長さに正規化した後、あらかじめ登録されて
    いる同じ分類のパターンと平均を取った上で登録するよ
    うにしたことを特徴とした音声標準パターン登録方法。
  3. 【請求項3】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、登録すべき言葉を複数回発声し、最
    初の発声は上記方法で登録し、2回目以降の発声では、
    特徴パターンに変換した後、その冒頭または末尾近くに
    無音区間が存在するか否かを調べ、存在する時には、存
    在しない時と同様の正規化パターンを作成後、その無音
    区間の部分から冒頭に近い部分、或いは、その部分から
    末尾に近い部分を取除いた残りの部分を決められた長さ
    に正規化したパターンを作っておき、あらかじめ登録さ
    れている同じ分類のパターンと平均を取った上で登録す
    るようにしたことを特徴とする音声標準パターン登録方
    法。
  4. 【請求項4】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、登録すべき言葉を複数回発声し、最
    初の発声は上記方法で登録し、2回目以降の発声では、
    特徴パターンに変換した後、その冒頭または末尾近くに
    無音区間が存在するか否かを調べ、存在しない時には、
    決められた長さに正規化した後、あらかじめ登録されて
    いるパターンが1つの言葉に対して複数登録されている
    かどうかを調べ、複数登録されている場合、あらかじめ
    登録されているパターンと、今正規化したパターンとの
    間で類似性を求め、最大の類似性が得られたパターンと
    平均を取った上で複数個のパターンとして登録するよう
    にしたことを特徴とする音声標準パターン登録方法。
  5. 【請求項5】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、登録すべき言葉を複数回発声し、最
    初の発声は上記方法で登録し、2回目以降の発声では、
    特徴パターンに変換した後、その冒頭または末尾近くに
    無音区間が存在するか否かを調べ、存在しない時には、
    決められた長さに正規化した後、あらかじめ登録されて
    いるパターンが1つの言葉に対して複数登録されている
    かどうかを調べ、複数登録されている場合、あらかじめ
    登録されているパターンと、今正規化したパターンとの
    間で類似性を求め、得られたうちで最大の類似性が決め
    られた値よりも小なる時、このパターンは平均を取らず
    に登録するようにしたことを特徴とする音声標準パター
    ン登録方法。
  6. 【請求項6】入力された音声を特徴量に変換して、特徴
    パターンとなし、これを決められた時間長に正規化する
    際に、もとのパターンの冒頭や、末尾に無音区間が存在
    するか否かを調べ、存在しない時には、正規化されたパ
    ターンをそのまま登録し、存在する時には、存在しない
    時と同様の登録後、その無音区間の部分から冒頭に近い
    部分、或いは、その部分から末尾に近い部分を取除いた
    残りのパターンを決められた長さにするようなパターン
    登録方法において、登録すべき言葉を複数回発声し、最
    初の発声は上記方法で登録し、2回目以降の発声では、
    特徴パターンに変換した後、その冒頭または末尾近くに
    無音区間が存在するか否かを調べ、存在する時には、ま
    ず、存在しない時と同様の操作で正規化パターンを作成
    後、その無音区間の部分から冒頭に近い部分、或いは、
    その部分から末尾に近い部分を取除いた残りの部分を決
    められた長さに正規化したパターンを作っておき、あら
    かじめ登録されているパターンが1つの言葉に対して複
    数登録されているかどうかを調べ、登録されているパタ
    ーンが1つの場合、あらかじめ登録されているパターン
    と、今正規化した2つのパターンとの間で類似性を求
    め、最大の類似性が得られたパターンと平均を取った上
    で登録し、平均を取らなかった方のパターンはそのまま
    登録するようにした音声標準パターン登録方法。
JP2186571A 1990-07-13 1990-07-13 音声標準パターン登録方法 Expired - Fee Related JP3032551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2186571A JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2186571A JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Publications (2)

Publication Number Publication Date
JPH0473800A JPH0473800A (ja) 1992-03-09
JP3032551B2 true JP3032551B2 (ja) 2000-04-17

Family

ID=16190864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2186571A Expired - Fee Related JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Country Status (1)

Country Link
JP (1) JP3032551B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014112905A1 (de) 2014-09-08 2016-03-10 Ringo Thieme Veränderbare Feuerwerksbatterie

Also Published As

Publication number Publication date
JPH0473800A (ja) 1992-03-09

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
EP0077194B1 (en) Speech recognition system
US20090313016A1 (en) System and Method for Detecting Repeated Patterns in Dialog Systems
US7818174B1 (en) Speech-recognition grammar analysis
US8731925B2 (en) Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack
JPS62217295A (ja) 音声認識方式
JP3069531B2 (ja) 音声認識方法
GB2196460A (en) Voice recognition
JP3032551B2 (ja) 音声標準パターン登録方法
JP3119510B2 (ja) 音声認識装置
JP3020999B2 (ja) パターン登録方法
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JP2838848B2 (ja) 標準パターン登録方式
JPS60114900A (ja) 有音・無音判定法
JP2002516419A (ja) 発声言語における少なくとも1つのキーワードを計算器により認識する方法および認識装置
JP2882791B2 (ja) パターン比較方式
JP2997007B2 (ja) 音声パターンマッチング方法
JP2882792B2 (ja) 標準パターン作成方式
JP4391031B2 (ja) 音声認識装置
JPH0376471B2 (ja)
JP2666296B2 (ja) 音声認識装置
JP3125928B2 (ja) 音声認識装置
JP2534243B2 (ja) 標準パタ―ン作成方法
JPS59170894A (ja) 音声区間の切り出し方式
JP2534244B2 (ja) 標準パタ―ン作成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees