JP3032551B2

JP3032551B2 - 音声標準パターン登録方法

Info

Publication number: JP3032551B2
Application number: JP2186571A
Authority: JP
Inventors: 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-07-13
Filing date: 1990-07-13
Publication date: 2000-04-17
Anticipated expiration: 2015-04-17
Also published as: JPH0473800A

Description

【発明の詳細な説明】技術分野本発明は、音声認識における標準パターンの登録方法
に関するものである。

従来技術音声認識装置には特定話者方法と不特定話者方法があ
り、それぞれ音声の登録が必要なものと、不要なものに
別れる。方言も含めて誰の声でも認識できる不特定話者
音声認識は実現が非常に難しい事、認識の精度が特定話
者方法の方が良い事等から現在では簡単な特定話者単語
音声認識が実用になっているに過ぎない。

特定話者方法では、あらかじめ使用する音声を登録す
る訳であるが、多少の労力は増えても１つの言葉に対し
て複数回登録する方が認識精度が向上する事が知られて
いる。複数回発声した音声を平均して登録する方法とそ
れらを別々に登録しておく方法があるがここでは前者の
方法を用いる場合について述べる。

一方、実際に音声認識装置を使う上で、認識しにくい
原因の多くは、入力されたパターンが正確に作成できな
い事にある。つまり、入力用のマイクの使い方の違いに
よって発声している音声の一部が欠落して必要な情報が
欠損するために、誤認識となる訳である。特にこの現象
は音声の冒頭や末尾に破裂性の子音が付いているような
場合、たとえば、/stop/,/pink/等で起こりやすい。

第７図は、前述の複数回発声した音声をパターンの始
端と終端とを対応づけて線形伸縮する事でパターン長を
一致させ、平均をとる場合の例を説明するための図で、
２つのパターンの平均を取る際、１つのパターン（ａ）
は正常であっても、他方のパターン（ｂ）の一部が欠落
していると、第２図（ｃ）に示すように平均する事でむ
しろパターンの質を低下させる事になる。

第８図は、上述のごとき問題点に対する対策の一例を
説明するための図で（もし、必要ならば、特願昭62−23
8336号参照）、ここでは例として末尾に誤検出しやすい
子音がつく場合を述べるが、冒頭でも同様に配慮する事
で実行可能である。まず、一方のパターン（ａ）にのみ
誤検出しやすい子音がついて、他方のパターン（ｂ）で
は欠落しているような場合、標準パターン登録時はこれ
らが同じ音声を発生した時に得られるものである事がわ
かっていることから、冒頭又は末尾の誤検出しやすい子
音/P/をそのまま他方へコピー（（ｂ））図の点線）し
ておいてから両者を対応づけ、重ね合わせを行なう
（ｃ）。この結果得られるパターンは異なる音声の平均
を取る事なく、正しい対応づけ、つまりパターンを乱す
事が無い。照合時は次の様にする。

（１）未知のパターンの冒頭（又は末尾）に誤検出しや
すい子音がついていて、標準パターンに付いている場
合：対応づく部分同士を対応させて通常通りの照合をす
る。

（２）未知のパターンの冒頭（又は末尾）に誤検出しや
すい子音がついていて、標準パターンに付いていない場
合：標準パターンの誤検出しやすい子音を取除いた部分
と未知パターンの照合をする。

（３）未知のパターンの冒頭（又は末尾）に誤検出しや
すい子音がついていなくて、標準パターンに付いている
場合：標準パターンの誤検出しやすい子音を取除いた部
分と未知パターンの照合をする。

本出願人は、上述のごときパターン照合方法の開発に
よって、誤検出しやすい子音が付いていても、あるい
は、パターンの冒頭や末尾に小さなノイズがついていて
も正しい照合ができるようにした。しかしながら、パタ
ーンの全長を一定にしてから、始端や終端に誤検出しや
すい子音があるかどうかを調べても、それを取除くとパ
ターンの長さが変ってしまうことから、効果は小さい。

さらに、本出願人は、パターン長を一定にして照合す
る音声パターンマッチング方法において、入力された未
知の音声の冒頭、または、末尾に音声のエネルギーが低
い部分が見出された時、全体のパターンを定められた長
さに変換すると共に、エネルギーが低い部分から先端ま
での部分、あるいは、エネルギーが低い部分から末尾ま
での部分を取除いた残りのパターンを、定められた長さ
に変換して両方を保持しておき、両方を標準パターンと
照合し、類似性の高い方の結果をパターン間の類似性と
定義するようにしたパターンマッチング方法について提
案したが、その際標準パターンを何回かの発声の平均に
よって作る方法には提案されておらず、第７図に示すよ
うな場合、パターンが異常になる問題は解決されていな
かった。

目的本発明は、上述のごとき従来技術の問題点を改良する
ために為れされたものであり、パターン長を一定にして
照合するような照合方法であって、子音の欠落を考慮し
てマッチング出来るような照合方法において、質のよ
い、平均化標準パターンを作るためのパターン登録方法
を提供することを目的としてなされたものである。

構成本発明は、上記目的を達成するために、（１）入力さ
れた音声を特徴量に変換して、特徴パターンとなし、こ
れを決められた時間長に正規化する際に、もとのパター
ンの冒頭や、末尾に無音区間が存在するか否かを調べ、
存在しない時には正規化されたパターンをそのまま登録
し、存在する時には、存在しない時と同様の登録後、そ
の無音区間の部分から冒頭に近い部分、或いは、その部
分から末尾に近い部分を取除いた残りのパターンを決め
られた長さにするようなパターン登録法において、パタ
ーンが修正されずに正規化されたものか、無音区間の部
分から冒頭に近い部分を取除いたものか、或いは、その
部分から末尾に近い部分を取除いたものであるかを分類
して登録するようにしたこと、或いは、（２）登録すべ
き言葉を複数回発声し、最初の発声は上記（１）の方法
で登録し、２回目以降の発声では、特徴パターンに変換
した後、その冒頭または末尾近くに無音区間が存在する
か否かを調べ、存在しない時には、決められた長さに正
規化した後、あらかじめ登録されている同じ分類のパタ
ーンと平均を取った上で登録するようにしたこと、或い
は、（３）登録すべき言葉を複数回発声し、最初の発声
は上記（１）の方法で登録し、２回目以降の発声では、
特徴パターンに登録した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在する時には、存
在しない時と同様の正規化パターンを作成後、その無音
区間の部分から冒頭に近い部分、或いは、その部分から
末尾に近い部分を取除いた残りの部分を決められた長さ
に正規化したパターンを作っておき、あらかじめ登録さ
れている同じ分類のパターンと平均を取った上で登録す
るようにしたこと、或いは、（４）登録すべき言葉を複
数回発声し、最初の発声は上記（１）の方法で登録し、
２回目以降の発声では、特徴パターンに変換した後、そ
の冒頭または末尾近くに無音区間が存在するか否かを調
べ、存在しない時には決められた長さに正規化した後、
あらかじめ登録されているパターンが１つの言葉に対し
て複数登録されているかどうかを調べ、複数登録されて
いる場合、あらかじめ登録されているパターンと、今正
規化したパターンとの間で類似性を求め、最大の類似性
が得られたパターンと平均を取った上で複数個のパター
ンとして登録するようにしたこと、或いは、（５）登録
すべき言葉を複数回発声し、最初の発声は上記（１）の
方法で登録し、２回目以降の発声では、特徴パターンに
変換した後、その冒頭または末尾近くに無音区間が存在
するか否かを調べ、存在しない時には、決められた長さ
に正規化した後、あらかじめ登録されているパターンが
１つの言葉に対して複数登録されているかどうかを調
べ、複数登録されている場合、あらかじめ登録されてい
るパターンと、今正規化したパターンとの間で類似性を
求め、得られたうちで最大の類似性が決められた値より
も小なる時、このパターンは平均を取らずに登録するよ
うにしたこと、或いは、（６）登録すべき言葉を複数回
発声し、最初の発声は上記（１）の方法で登録し、２回
目以降の発声では、特徴パターンに変換した後、その冒
頭または末尾近くに無音区間が存在するか否かを調べ、
存在する時には、まず、存在しない時と同様の操作で正
規化パターンを作成後、その無音区間の部分から冒頭に
近い部分、或いは、その部分から末尾に近い部分を取除
いた残りの部分を決められた長さに正規化したパターン
を作っておき、あらかじめ登録されているパターンが１
つの言葉に対して複数登録されているかどうかを調べ、
登録されているパターンが１つの場合、あらかじめ登録
されているパターンと、今正規化した２つのパターンと
の間で類似性を求め、最大の類似性が得られたパターン
と平均を取った上で登録し、平均を取らなかった方のパ
ターンはそのまま登録するようにしたこと、或いは、
（７）前記（４）において、一つのカテゴリーに一定の
数だけのパターンを登録する事とした時、あらたに平均
を取ったパターンの保存の優先順位は末尾を切取った残
りを長さを正規化したもの、冒頭を切取った残りの長さ
を正規化したものの順とすること、或いは、（８）前記
（４）において、あらたに平均を取ったパターンの分類
の優先順位は末尾を切取った残りの長さを正規化したも
の、冒頭を切取った残りの長さを正規化したもの、修正
をしなかったものとし、平均を取らないパターンはその
パターンに施した操作によって分類するようにしたこ
と、或いは、（９）前記（６）において、平均を取らな
いパターンはそのパターンに施した操作によって分類す
るようにしたことを特徴としたものである。以下、本発
明の実施例に基づいて説明する。

第１図は、本発明の一実施例を説明するための構成図
で、図中、１は音声信号入力部、２は音声区間検出部、
３は特徴変換部、４は音声パワー検出部、５は比較部、
６は閾値部、７はレジスタ、8,8′は伸縮部、９は判断
部、10は部分切捨部、11,12はレジスタ、13は平均部
で、本発明は、入力された音声を特徴量に変換して、特
徴パターンとなし、これを決められた時間長に正規化す
る際に、もとのパターンの冒頭や、末尾に無音区間が存
在するか否かを調べ、存在しない時には正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録法において、パターンの全体が修正されずに正規化
して一定長にされたものか、無音区間の部分から冒頭に
近い部分を取除いたものか、或いは、その部分から末尾
に近い部分を取除いたものであるかを分類して登録する
ようにしたものであり、更には、登録すべき言葉を複数
回発声し、最初の発声は上記方法で登録し、２回目以降
の発声では、特徴パターンに変換した後、その冒頭また
は末尾近くに無音区間が存在するか否かを調べ、存在し
ない時には決められた長さに正規化した後、あらかじめ
登録されているパターンと平均を取った上で登録するよ
うにし、存在する時には、存在しない時と同様の正規化
パターンを作成した後、その無音区間の部分から冒頭に
近い部分、或いは、その部分から末尾に近い部分を取り
除いた残りの部分を決められた長さに正規化したパター
ンを作っておき、あらかじめ登録されている同じ分類の
パターンと平均を取った上で登録するようにしたもので
ある。以下、本発明の実施例について図面に基いて説明
すると、第１図において、音声は入力部１から入力され
るが、この入力部１はマイクロフォンとマイクアンプで
構成されている。入力された信号の中から音声に係るも
のが音声区間検出部２で検出される。音声区間検出の方
法はいくつか提案されていてその中のどれを用いても実
行可能であるが、音声のパワーが閾値を越えたかどうか
で始端を見つけ、再び閾値より下がるまでを音声区間と
する方法を用いるとよい。

次に、特徴変換部３で特徴量に変換され、特徴パター
ンを形成する。特徴量としては、音声のスペクトラムを
使う事が多いがこれに限定するものではなく、線形予測
分析をしても良いし、ケプトストラム分析でもその他ど
の様なものでも良い。パワー検出部４では入力された音
声の大きさを求めてあらかじめ設定されている閾値６と
比較する。この閾値よりもパワーが小さい時には音声の
休止区間、即ち無音区間が発生したものとする。この時
の閾値は音声が入力されない時のパワーの定数をかけて
決定すれば良い。一方、レジスタ７には検出された音声
が格納され、伸縮部８で全体を一定の長さに伸縮したも
のをレジスタ11へ入れる。この時、他の種類のパターン
とレジスタを分けて格納しても良いし、パターンにパタ
ーン全体をそのまま伸縮したことを表わすマークをつけ
てレジスタに入れても良い。ここではマークとして
‘ ’を付けて登録する事にする。また、比較部５で比
較されて検出されて検出された無音区間が判断部９で音
声区間の冒頭や末尾近くに存在すると判断された場合に
は、レジスタ７の内容から無音区間から冒頭まで、ある
いは無音区間から末尾までを部分切捨部10で切捨てて残
りを再び伸縮部８′にて一定値に伸縮してレジスタ11に
先のパターンと一緒に登録しておく。ここで無音区間か
ら冒頭まで切捨てて作ったパターンには‘A'のマーク
を、無音区間から末尾までを切捨てて作ったパターンに
は‘S'のマークを付けておく事にする。冒頭や、末尾の
近くとは端点から100ms〜200ms程度の時間を言う。続い
て平均部13でレジスタ11と12の内容を平均し、その結果
をレジスタ12の中に保存しておく。１回目の発声の時
は、先にレジスタ12の中には何も入っていないので、レ
ジスタ11の内容がレジスタ12にコピーされることにな
る。２回目以降の発声では、レジスタ12と11が平均され
てレジスタ12に上書きされる。ただし、１つの単語の登
録が終った時には、レジスタ12の内容はクリアされるべ
きである。平均をとる際には、あらかじめ登録されてい
るパターンが全体パターン、つまり、マーク‘ ’の付
いたもの１つだけであるか、部分的に切捨てて２つのパ
ターンがあるのかを調べて、レジスタ11と12の中の同じ
マークの付いたもの同士を平均するようにする。これに
よって複数回発声したパターンの平均がとれ、標準パタ
ーンとしての質を向上させる事ができる。

しかしながら、入力された時にすでにパターンの冒頭
が検出できなかった場合、冒頭が欠落したパターンに
‘ ’のマークを付けてしまう事となり、この結果、平
均を取るべきパターンがちがって、欠落したパターンと
しないパターンの平均を取ってしまうような事となる。
したがって、パターンの質が劣化することになる。

第２図は、上述のごとき問題点を解決した実施例を説
明するための図で、この実施例では、登録すべき言葉を
複数回発声し、最初の発声は上記方法で登録し、２回目
以降の発声では、特徴パターンに変換した後、その冒頭
または末尾近くに無音区間が存在するか否かを調べ、存
在しない時にはこれを決められた長さに正規化すると共
に、さきに登録されているパターンが１つの言葉に対し
て複数登録されているかどうかを調べる。今回の発声か
ら作ったパターンか、先に登録されているパターンのど
ちらかが複数ある場合、それらの間で類似性を求め、最
大の類似性が得られたパターンと平均を取った上で複数
個のパターンとして登録するようにしている。

以下、本実施例について第２図に基いて説明するが、
第２図中、第１図に示した実施例と同様の作用をする部
分には、第１図の場合と同一の参照番号を付し、その説
明は省略する。この実施例においては、第１図に示した
実施例と同様、マークを付けてレジスタ11へ登録してか
ら、レジスタ11とレジスタ12の内容の類似度を類似度判
断部14でとる。この様子を第３図に示す。仮に、レジス
タ12にはパターンが１つ、レジスタ11には２つ入ってい
るものとする。たとえば、「stop」という単語の１回目
の発声時に/p/の検出ミスがあり、「sto」が入っている
とし、２回目の発声は正確に「stop」と入力されたとす
る。この時、２回目の発声は/p/の前に無音区間ができ
る事から、まず、「stop」全体のパターンが‘ ’のマ
ークを付けて保存され、このパターンから末尾の/p/の
部分を取除いた残り、「stop」のパターンを作り、‘s'
のマークを付けて保存する。この後に、レジスタ12のパ
ターンとレジスタ11の中にある２つのパターン間の類似
度を計算する。通常、類似度は類似度２の方が大きいか
ら、第４図に示すように、レジスタ12の内容は、‘s'の
ついたマークを優先させて、レジスタ11の‘s'マークが
ついたパターンと平均を取る事になる。レジスタ11の
‘ ’のマークのパターンはそのままでレジスタ12に格
納される。この例からも分かるように類似度を取る事
で、マークに頼っていて起こす誤りをなくす事ができ
る。

類似度だけに頼ると悪影響が発生する事も有り得るの
で、その防止策として、第５図に示すように、登録すべ
き言葉を複数回発声し、最初の発声は上記方法で登録
し、２回目以降の発声では、特徴パターンに変換した
後、その冒頭または末尾近くに無音区間が存在するか否
かを調べ、存在しない時には決められた長さに正規化し
た後、あらかじめ登録されているパターンが１つの言葉
に対して複数登録されているかどうかを調べ、複数登録
されている場合、あらかじめ登録されているパターン
と、今正規化したパターンとの間で類似性を求め、得ら
れたうちで最大の類似性が決められた値よりも小なる
時、このパターンは平均を取らずに登録するようにし
た。

すなわち、第５図において、得られた類似度を比較部
５′で閾値15と比較し、得られた類似度のうちで最大の
類似度が閾値15によって決められた値よりも小なる時
は、平均をとらずにレジスタ12へ登録するようにした。
この時、判断部９′は、第６図に示すように、‘ ’、
‘A'、‘S'を判断してレジスタ12に登録する。しかし、
‘ ’、‘A'、‘S'の全ての種類のパターンを保存して
おくと、レジスタの容量が大きくなる事から、１つの言
葉に対して持てるパターン数を、例えば２つのように制
限する事が考えられるので、その場合には、一つのカテ
ゴリーに一定の数だけのパターンを登録する事とした
時、あらたに平均を取ったパターンの保存の優先順位
は、末尾を切取った残りの長さを正規化したもの、冒頭
を切取った残りの長さを正規化したものの順とするよう
にした。

一般に発声の最初はエネルギーを集中するのに対し
て、音声の末尾はエネルギーが小さい事が多いことか
ら、冒頭が欠落する単語に比べて末尾が欠落する単語が
多い。したがって、平均を取る際に、第６図に示すよう
に、‘ ’、‘A'、‘S'の３種類のパターンが存在する
場合には、まず、‘ ’を登録し、‘S'を‘A'に優先し
て登録する。この場合‘A'のパターンはレジスタ12から
末梢される。

効果以上の説明から明らかなように、本発明によると、パ
ターン長を一定にして照合するような照合方法で子音の
欠落を考慮してマッチング出来るようなものにおいて、
質のよい、平均化標準パターンを作ることが可能になっ
た。

【図面の簡単な説明】

第１図は、本発明の一実施例を説明するための図、第２
図及び第３図は、本発明の他の実施例を説明するための
図、第４図、第５図及び第６図は、それぞれ本発明の他
の実施例を説明するための図、第７図は、誤検出しやす
い子音が欠落する事で生じる不具合を説明するための
図、第８図は、誤検出しやすい子音が欠落する事で生じ
る不具合の対策法を説明するための図である。１……音声信号入力部、２……音声区間検出部、３……
特徴変換部、４……音声パワー検出部、５……比較部、
６……閾値部、７……レジスタ、8,8′……伸縮部、９
……判断部、10……部分切捨部、11,12……レジスタ、1
3……平均部、14……類似度判断部、15……閾値部。

Claims

(57)【特許請求の範囲】

【請求項１】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、パターンが修正されずに正規化され
たものか、無音区間の部分から冒頭に近い部分を取除い
たものか、或いは、その部分から末尾に近い部分を取除
いたものであるかを分類して登録するようにしたことを
特徴とする音声標準パターン登録方法。
【請求項２】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、登録すべき言葉を複数回発声し、最
初の発声は上記方法で登録し、２回目以降の発声では、
特徴パターンに変換した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在しない時には、
決められた長さに正規化した後、あらかじめ登録されて
いる同じ分類のパターンと平均を取った上で登録するよ
うにしたことを特徴とした音声標準パターン登録方法。
【請求項３】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、登録すべき言葉を複数回発声し、最
初の発声は上記方法で登録し、２回目以降の発声では、
特徴パターンに変換した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在する時には、存
在しない時と同様の正規化パターンを作成後、その無音
区間の部分から冒頭に近い部分、或いは、その部分から
末尾に近い部分を取除いた残りの部分を決められた長さ
に正規化したパターンを作っておき、あらかじめ登録さ
れている同じ分類のパターンと平均を取った上で登録す
るようにしたことを特徴とする音声標準パターン登録方
法。
【請求項４】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、登録すべき言葉を複数回発声し、最
初の発声は上記方法で登録し、２回目以降の発声では、
特徴パターンに変換した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在しない時には、
決められた長さに正規化した後、あらかじめ登録されて
いるパターンが１つの言葉に対して複数登録されている
かどうかを調べ、複数登録されている場合、あらかじめ
登録されているパターンと、今正規化したパターンとの
間で類似性を求め、最大の類似性が得られたパターンと
平均を取った上で複数個のパターンとして登録するよう
にしたことを特徴とする音声標準パターン登録方法。
【請求項５】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、登録すべき言葉を複数回発声し、最
初の発声は上記方法で登録し、２回目以降の発声では、
特徴パターンに変換した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在しない時には、
決められた長さに正規化した後、あらかじめ登録されて
いるパターンが１つの言葉に対して複数登録されている
かどうかを調べ、複数登録されている場合、あらかじめ
登録されているパターンと、今正規化したパターンとの
間で類似性を求め、得られたうちで最大の類似性が決め
られた値よりも小なる時、このパターンは平均を取らず
に登録するようにしたことを特徴とする音声標準パター
ン登録方法。
【請求項６】入力された音声を特徴量に変換して、特徴
パターンとなし、これを決められた時間長に正規化する
際に、もとのパターンの冒頭や、末尾に無音区間が存在
するか否かを調べ、存在しない時には、正規化されたパ
ターンをそのまま登録し、存在する時には、存在しない
時と同様の登録後、その無音区間の部分から冒頭に近い
部分、或いは、その部分から末尾に近い部分を取除いた
残りのパターンを決められた長さにするようなパターン
登録方法において、登録すべき言葉を複数回発声し、最
初の発声は上記方法で登録し、２回目以降の発声では、
特徴パターンに変換した後、その冒頭または末尾近くに
無音区間が存在するか否かを調べ、存在する時には、ま
ず、存在しない時と同様の操作で正規化パターンを作成
後、その無音区間の部分から冒頭に近い部分、或いは、
その部分から末尾に近い部分を取除いた残りの部分を決
められた長さに正規化したパターンを作っておき、あら
かじめ登録されているパターンが１つの言葉に対して複
数登録されているかどうかを調べ、登録されているパタ
ーンが１つの場合、あらかじめ登録されているパターン
と、今正規化した２つのパターンとの間で類似性を求
め、最大の類似性が得られたパターンと平均を取った上
で登録し、平均を取らなかった方のパターンはそのまま
登録するようにした音声標準パターン登録方法。