JPS63226691A

JPS63226691A - 標準パターン作成方式

Info

Publication number: JPS63226691A
Application number: JP62238510A
Authority: JP
Inventors: 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1986-10-03
Filing date: 1987-09-22
Publication date: 1988-09-21
Anticipated expiration: 2014-04-12
Also published as: JP2882792B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】五亙光互本発明は、標準パターン作成方式、より詳細には、パタ
ーン認識における標準パターンの作成方式に関する。

従】」１桁パターン認識方式の中で最も一般的なものはパターンマ
ツチングを利用する方式である。この方式は、あらかじ
め標準パターンを登録しておき、新たに入力された未知
のパターンが登録されたパターンのうちのどのパターン
に最も類似しているかを求めて認識するものである。こ
の場合、あらかじめ登録されている標準パターンの質が
性能を左右することは言うまでもなく、いかに質の高い
標準パターンを形成するかが重要なポイントとなる。こ
こで音声認識におけるパターンマツチングを例にとると
、音声認識には特定話者方式と不特定話者方式があり、
不特定話者方式は標準パターンをあらかじめメーカー側
で作成してすでに搭載しており、誰の声でも認識できる
もので、この場合は、標準パターン作成のためのデータ
が正常であるか否かを確認して使用できる。一方、特定
話者方式の場合、使用者があらかじめ使用する言葉を登
録し、認識装置のトレーニングをしてがら使用する。こ
のため、登録する音声のパターンが正常であるかどうか
の確認ができず標準パターンの質が悪くなる可能性があ
る。登録の際に質を劣化するパターンの原因は音声区間
だけが正確に抽出されていない場合が圧倒的に多く、発
声する際の・口の開閉音、周囲の突発的雑音が発声直前
、直後に生じた場合、音声のパターンとこれらの雑音が
区別できず一緒に音声としてとり込んでしまう。

又、音声の一部がとり込めず欠落してしまうこともあり
、これらによって標準パターンの質の低下を招くことに
なる。また、１つの標準パターンを作成するのに同じ言
葉について何回か発声したパターン平均化する方法があ
る。而して、この方法によると、発声の変動の統計的情
報も含めることができるが、１つのパターン作成に複数
回の発声が必要となるため、そのうちの１回の発声にで
も音声区間検出不良があると標準パターンの質が悪くな
ってしまう。

第１１図は、上述のごとき音声区間不良が発生する例を
説明するための図で、同図は、音声の冒頭に雑音が添付
された例を示す図で、（ａ）は雑音のついたパターン、
（ｂ）は正常なパターンで、Ａは雑音、Ｂは音声である
。正常なパターン（ｂ）と雑音がついたパターン（ａ）
の平均をとる際に通常は音声の始端同士、終端同士を対
応づけて平均化するため、音声パターンＢの冒頭に雑音
パターンＡが加算されてしまい、その結果、平均化され
たパターンが不良となってしまう欠点がある。

特に、特定話者方式の場合、ツメターンの登録が正常に
行われたかどうかによって認識能力が左右される。そこ
で、音声の中で弱い音が冒頭や末尾につく単語音声等で
はそれが欠落しやすいので、あらかじめ登録の際に、正
常なパターンから欠落しやすい部分を強制的に欠落させ
たパターンを登録しておくものが提案された。これなら
ば、誤って単語の検出をしてしまい、パターンの一部が
欠落したとしてもあらかじめ欠落させておいたパターン
との類似性が高くなり、正しい認識が行なえる。しかし
、例えば、英単語のｈｉｓとｉｓのように弱い／ｈ／の
音を落としてしまうと同じ音となり、むしろ誤り易いこ
とがある。

また、特定話者方式は装置の使用者があらかじめ音声を
登録するが、この登録の仕方には１回だけ発声するもの
、複数回発声してその平均をとるものなどがある。

第１２図は、複数回発声してその平均をとるパターンマ
ツチング法の１つである２値ＴＳＰ（Ｂｉｎａｒｙ　　
　Ｔｉｍｅ　　　ＳｐｅｃｔｒｕｍＰａ　ｔ　ｔ　ｅ　
ｒｎ＝ＢＴＳＰ）法の一例を説明するための構成図で１
図中、５１はマイク等の集音装置、５２はフィルタバン
ク、５３は最小２乗による補正部、５４は２値化部、５
５はＢＴＳＰの作成部、５６は線形伸縮による１回発声
パターンの加算部、５７は辞書部、５８はピークパター
ン作成部、５９は線形伸縮によるパターン長合わせ部、
６０は類似度算出部、６１は結果表示部で、マイクから
入力された音声は、バンドパス・フィルタ一群等を利用
して周波数分析され、周波数とその時間変化をパターン
（ＴＳＰ）として表される。更にこれを周波数上のピー
クを中心として「１」。

他を「Ｏ」として２値化して２値のＴＳＰ（ＢＴＳＰ）
に変換し、複数回発声して得られたＢＴＳＰを重ねて標
準パターンとして登録しておく。未知の音声が入力され
た際、この音声も標準パターン作成時と同様な過程でＢ
ＴＳＰをつくり、あらかじめ登録しである標準パターン
と照合して各標準パターンとの類似度を求める。類似度
は未知音声のＢＴＳＰと標準パターンとを重ねた時の「
１」のエレメントの重なり具合からもとめる。通常、誰
の声でも認識できる不特定話者音声認識装置のためには
、一つの登録すべき音声について複数個の標準パターン
を作成するなど演算量を増やす手段を用いるが、この方
法では標準パターンをうまく作れば、たいした演算量の
増加もなく不特定話者用の音声認識装置の実現が容易で
あるというメリットを有している。

このような方法で、標準パターンを作成する場合、平均
をとる全てのパターンは完全であると考えている。しか
し、実際には必ずしもそうではなく、例えばｆｉｖｅの
語尾の／Ｖ／の音やｆｕｌｌの語頭の／ｆ／のような音
はエネルギーが非常に小さいため、これを正確に検出す
ることが難しい、従って、正常なパターンが得にくく、
ひいては標準パターンの質を劣化させるという欠点があ
った。

目　　　　　的本発明は、上述のごとき実情に鑑みてなされたもので、
特に、パターン認識における標準パターンの質の劣化を
防ぐこと、欠落しやすい音声の一部が欠落しても比較的
圧しい認識ができるようなパターンマツチング用テンプ
レートを登録できるようにすること、更には、高品質な
標準パターンを作成する方法を提供すること等を目的と
してなされたものである。

構　　　成本発明は、上記目的を達成するために、複数の音声パタ
ーンを平均化することで行う標準パターン作成方法にお
いて、各音声パターン中に、音声生成上の不安定成分を
、該音声パターン平均化の際の必然的要素として存在さ
せたこと、或いは、複数の音声パターンを平均化するこ
とで行う標準パターン作成方法において、複数の音声パ
ターン中に存在する音声生成上の不安定成分を持つパタ
ーンと持たないパターンについて、不安定成分を持たな
いパターンに不安定成分を持つパターンの不安定成分を
付加した後、両者の平均化を行うこと、或いは、複数の
音声パターンを平均化することで行う標準パターン作成
方法において、複数の音声パターン中に存在する音声生
成上の不安定成分を持つパターンについて、不安定成分
の一部を残し、残部を削除したパターンを平均化するこ
と、或いは、複数の音声パターンを平均化することで行
う標準パターン作成方法において、複数の音声パターン
中に存在する音声生成上の不安定成分を持つ複数のパタ
ーンについて、各パターンを不安定成分と安定成分に分
離し、それぞれの成分毎に対応させて平均化した後、両
者を併合することを特徴とすることを特徴としたもので
ある。以下、本発明の実施例に基いて説明する。

第１図は、本発明の一実施例を説明するための構成図で
、この実施例は、登録すべき一種の項目に対して複数の
パターンを作成し、それらを平均化又は独立に登録して
作成する標準パターン作成方式において、前記複数のパ
ターンの始端又は終端から一定長内にエネルギーの極小
が存在するか否かを調べ、存在しないパターンがある場
合、極小を持つパターンの始端又は終端から極小までの
部分を、極小を持たないパターンの定められた位置に添
加して標準パターンとすることを特徴としたものである
。

第１図において、１は音声入力部、２はパワー測定部、
３は特徴量変換部、４は無音位置計測部、５は無音位置
（冒頭）判定部、６はマーク付加部、７はパターン格納
部、８はマーク判定部、９は冒頭パターン添加部、１０
は重ね合せ平均処理部で、まず、マイクロフォン等によ
り音声を入力して電気信号に変換した後、音声パワーを
測定し、又、特徴量に変換する。特徴量としてはパワー
スペクトル、ＬＰＧ係数、ケプストラム等が広く使われ
ているが、ここではこれらに限定するものではない。測
定したパワーから無音区間が存在するか否かを判定し、
それが存在する場合は、その位置を計測する。その無音
区間の位置が冒頭から一定位置以内に存在するかどうか
を調べ、それによって特徴変換して作られたパターンに
マークを添加する。ここでは一定値の例として冒頭から
１００＋ｍｓ以内に無音があるかどうかによって１例え
ば、あれば−１，なければ＋１のごときマークを付加し
てパターンを格納しておく。次に、発声された同じ音声
をこの格納されたパターンに重ね合わせて、平均化する
。この際、先のパターンと同様にマークを付加し、格納
されたパターンと同じマークであるか否かを調べ、マー
クが同じ場合には通常通りの方法であらかじめ格納され
たパターンと入力されたパターンの平均処理をしてパタ
ーンを再度格納する。一方、マークが異なる場合は、一
方のパターンには無音区間があり他方にはそれがないこ
とから口唇の開閉によるノイズ等がついていると考えら
れる。そこで無音区間がない方のパターン（第２図（ｂ
））の先頭に無音区間を有するパターンの先頭から無音
区間までを添加し、パターン（ｃ）のようにしてからあ
らかじめ格納されているパターン（ａ）と対応づけて平
均をとる。このようにして必要回数だけ重ね合わせた後
にこれを標準パターンとして保持するようにする。この
ため、従来、音声信号の部分と、雑音が重ね合わされて
平均化されていたものが、雑音部と信号部が分離して平
均化できるようになり、信号部の質的劣化が防げるよう
になった。なお５以上に説明した実施例は、音声の冒頭
に発生するノイズによる質劣化の対策であるが、この方
法は音声冒頭のノイズの対策だけでなく音声終端信号の
欠落対策をも可能にする。例えば、ストップのごとき音
声終端近くに促音を持つ単語の場合、促音以後が音声区
間検出部で検出できず欠落してしまう場合が少なくない
。これも欠落するものと完全に検出できるものとが混在
する場合、冒頭のノイズと同様の結果になってしまう。

つまり、第３図に示すととく／ｐ／音を完備したパター
ン（ａ）と／　ｐ　／が欠落したパターン（ｂ）を平均
化すると、パターン（ａ）の／　ｐ　／音はパターン（
ｂ）の／　ｏ　／と平均化されてしまうことになる。

第４図は、上述のごとき質の劣化を防止するようにした
パターン比較方式の一実施例を説明するための図で、図
中、１１は無音位置（末尾）判定部、１２は末尾パター
ン添加部で、その他、第１図に示した実施例と同様の作
用をする部分には、第１図の場合と同一の参照番号が付
しである。而して、この実施例においては、無音区間の
位置が音声末尾Ｌｏｏｍｓ以内かどうかを計測し、その
結果に従って前記実施例と同様のマークを付加すれば良
い。一方、同じパターンを平均化する際には、２つのパ
ターンが同じマークの時は、どちらも第３図（ａ）の状
態であるため、そのまま音声の始端、終端を対応づけて
平均化すれば良く、又、マークが異なる場合は、第３図
におけるパターン（ａ）と（ｂ）の関係にあることがわ
かる。パターン（ｂ）には／　ｐ　／のパターンが失な
われているため、無音区間から末尾までのパターン（ａ
）をそのままパターン（ｂ）に添加した後、両パターン
の平均化を行なうことになる。こうして、平均化された
パターンの質の劣化を防ぐことができる。なお、本実施
例において、音声入力部はマイクを用いて実現でき、パ
ワー測定部は音声帯域通過フィルターの出力を測定する
ことで実現できる。

又、無音位置計測部は音声が入力されない状態で環境ノ
イズを測定しておき、音声が入力された時に先に計測し
たレベルより小なるパワーの時ここを無音区間と設定す
れば良い。通常、音声は１０ｍ５程度の間隔でサンプリ
ングされるため１０サンプル以内に無音が発生するか、
或いは、無音が発生して１０サンプル以内に音声終端が
あるかどうかの確認によってマークの決定をすれば良い
。なお１以上には音声パターンを例にして本発明を説明
したが、本発明は音声認識に限定するものではない、ま
た、冒頭のノイズ処理、末尾のノイズ処理は独立に使用
しても良く、両方を同時に使用しても良いことは言うま
でもない。更に、音声の冒頭、末尾の定義は必ずしもＬ
ｏｏｍｓにする必要はないことは容易に理解できよう。

以上の説明から明らかなように、この実施例によると、
突発性のノイズの直後に発声された音声や、音声の末尾
が欠落したパターンから正常な音声信号のみを平均化し
て標準パターンを作成することができる。

第５図は、本発明の他の実施例を説明するための構成図
で、この実施例は、音声を特徴バラメー夕に変換して登
録するパターン登録方式において、入力信号を周波数分
析し、低域周波数成分と高域周波数成分の大きさを比較
する手段、及び、音声の区間を検出する手段を有し、音
声の始端又は終端において高域成分が低域成分に比して
大なる時、この状態の継続長を測定し、該高域成分が強
い部分を本来の長さより短かくしたパターンを登録する
ようにしたことを特徴としたものである。

第５図において、２１はマイクロフォン、２２は音声区
間検出回路、２３はフィルタバンクで、２３ａは低域領
域フィルタ、２３ｂは高域領域フィルタ、２４は乗算部
、２５は比較部、２６はレジスタ、２７はタイムカウン
ト、２８は乗算部、２９は始端移動部で１例えば　１１
　ｈｉ　ｓＩ＋のような単語を登録することを考える。

まず、マイクからｈｉｓの音声を入力すると音声区間検
出部で単語音声に係るものだけをとり出し、フィルタバ
ンクへ転送する。ここでは便宜上音声区間検出部の次に
フィルタバンクがあるが、これは逆配置であっても差し
支えない。音声区間の検出方法は音声が入力される前の
マイクから信号を測定しておき。

それより大きなエネルギーが検出された部分を音声区間
とするようなものが知られているが、その他どのような
方法であっても問題ない。ただし。

音声検出のズ値をあまり低く設定゛するとわ・ずかな雑
音でも音声と判断してしまう。しかし、これをあまり高
く設定すると、語頭、語尾の小さい音を落してしまうこ
ととなる。又、ここでは周波数分析の方法としてフィル
タバンクを用いているが。

ＦＦＴ等の方法によっても良いことは言うまでもない、
このフィルタバンクの高域の出力と低域の出力を比較す
るが、通常の音声分析に必要な帯域とされている２００
〜６００ｏ七中の２０００〜６０００Ｈｚあたりを高域
、それ以下を低域としている。しかも特に高域が強い音
を検出するため。

低域の２倍より高域のパワーの方が大なる部分が音声区
間の始端又は終端にある時、その部分の長さを計測する
。この場合、音声始端から高域の強い部分の長さを計測
するのは容易であるが、終端での長さを計測するのは始
端程容易ではない。そのため、第６図に示すように高域
大を示す信号（ａ）と音声区間を示す信号（ｂ）を伴せ
て検出しながら高域信号（ａ）が立ち上ると共にカウン
タをスタート（Ｔ、）Ｌ、高域信号の立下りと共にカウ
ンタを止めて（Ｔ２）クリアする。これをくり返し、音
声終了信号時に得られている値を終端高域継続長（Ｔ、
）であるとする。ここではそれらの継続長を１７３にし
たパターンを新たに作り、これを登録するようにした。

この関係を第７図に示す。而して、従来は強制的に／ｎ
／の部分を捨てて登録していたが、これではｉｓと区分
がつかない。そこでｈとｉのわたりの部分も含めて登録
しておくことにより、テンプレートの段階でｈｉｓとｉ
ｓの区分ができるようにした。区間検出部で切り落とす
場合にはエネルギーの小さな／ｈ／の部分は落しやすい
が、エネルギーの大きな母音部／ｉ／を落とすことはな
い。このため／ｈ／から／　ｉ　／へのわたりの部分を
落とすことはまれである。つまりテンプレートのパター
ン長が／ｈ／を欠落した時とほぼ同じ長さにし、／ｎ／
の情報をわずかながら残しておくことで認識精度が向上
することになる。

従って、この実施例によると、音声パターンの一部が欠
落しても正しい認識ができるようなテンプレートが登録
できる。

第８図は、本発明の他の実施例を説明するためのフロー
チャート、第９図は、第８図に示した実施例の実施に使
用して好適な電気−路の一例を示すブロック図で、この
実施例は、音声を集音する機能と、それを特微量に分析
する手段を有し、登録すべき一つの音声について複数回
発声して得られた各特微量（特徴パターン）を処理して
作成するパターン作成方式において、特徴パターンの先
頭又は末尾に周波数の高い成分を有するパターンと該高
周波数成分を有さないものが存在する時、該高周波数成
分の部分をとり除いたパターンを処理し、処理した結果
に高周波数成分の部分を添附して作成するようにしたこ
とを特徴とするものである。

第９図において、３１はマイクロフォン、３２は音声区
間検出部、３３ａは高域フィルタ、３３ｂは低域フィル
タ、３４は比較部、３５ａ、３５ｂはレジスタ、３６ａ
、３６ｂは平均化部、３７は加算部、３８はパターンレ
ジスタで、以下、第８図に示したフローチャートを参照
しながら説明する。まず、パターンを作成すべき音声を
入力し。

その音声の語頭か語尾に高い周波数成分が含まれている
かどうかを調べる。あればその部分だけを別に分け、１
つの言葉について何回か発声した音声を各々分けた部分
について平均化し、最終的に両者を結合してパターンを
作成する。つまり、この何回かの発声中にこの高周波成
分を含む部分が欠落しても両者を別々に平均化して最後
に結合するため、欠落が補える。今、第９図において、
マイクから入力された音声は高域と低域の帯域フィルタ
を通り両者の比較によって高周波成分を持つか否かが決
定される。マイクから入力された信号の中から音声区間
だけを検出し、その区間の冒頭か末尾に高域成分がある
かどうかを見る。ある場合はスイッチＳがレジスタ３５
ｂ側へ倒され、ない場合はレジスタ３５ａと接触してい
る。つまり冒頭、末尾の高周波数成分がレジスタ３５ｂ
へ、その他がレジスタ３５ａに格納されることになる。

例えば１つの言葉を３回発声するとするなら、３回分が
レジスタ内に貯えられたところで各々のレジスタ内のパ
ターンを平均化し、つなぎ合わせる。

この場合、レジスタ３５ｂの内容が音声区間の冒頭につ
くものならば平均化されたレジスタ３５ａの先頭にレジ
スタ３５ｂの内容をっけ、末尾のデータがレジスタ３５
ｂに入っている時には末尾につける。この時音声区間の
検出はいくつかの方法が知られているが、入力の信号の
エネルギーの変化を見て、エネルギーの大きい部分を音
声区間とする方法が一般的であるが、これはどのような
方法に従っても良い、又、平均化の方法は特にそれ以後
のパターンの使用目的によっても異なるが。

ここでは例として次のような方法を示しておく。

三つのパターンの平均をとる際に、一番短かいパターン
にパターン長を合わせて均等にデータを取って加え合わ
せる。このようにして出来たパターンは欠落しやすい部
分を完備した質の良い標準パターンとなっている。

第１０図は、本発明の他の実施例を説明するための電気
的ブロック図で、この実施例は、特徴パターンの先頭又
は末尾に周波数の高い成分を有するパターンと該高周波
数成分を有さないものが存在する時、該高周波成分を有
さないパターンに有するものの該当する部分を添付して
から処理するようにしたものである。

第１０図において、４１はマイクロフォン、４２は音声
区間検出部、４３ａは高域フィルタ。

４３ｂは低域フィルタ、４４は比較部、４５はレジスタ
、４６はフラグチェック部、４７はパターンつなぎ部、
４８は加算部、４９はパターンレジスタで、マイクから
の信号に高域があるかどうかのチェックをするまでは、
第８図及び第９図に示した実施例と同様であるので、そ
れ以後について説明をする。まず、冒頭、末尾に高周波
数成分があるかないかでフラグを立ててフラグと共にレ
ジスタに格納する。全ての発声が終ったところでそれら
の発声の中でフラグが他と異なるものが存在するかどう
かのチェックをする。この時、全発声にフラグがあるか
全てにない時、そのまま平均を求め、そうでないときは
フラグがないパターンの先頭、又は末尾にフラグがある
パターンの高域成分の部分をつけ加えた後、平均してパ
ターンレジスタへ登録する。このようにして得られたパ
ターンは欠落部が補われて質の高いものとなっている。

従って、この実施例によると、パターンの欠落があって
も正常な質の高い標準パターンが作成できる。

効　　　果以上の説明から明らかなように、本発明によると、突発
性のノイズの直後に発声された音声や、音声の末尾が欠
落したパターンから正常な音声信号のみを平均化して標
準パターンを作成することができる。又、音声パターン
の一部が欠落しても正しい認識ができるようなテンプレ
ートが登録できる。更には、パターンの欠落があっても
、正常な質の高い標準パターンが作成できる等の利点が
ある。

【図面の簡単な説明】

第１図は、本発明の一実施例を説明するためのブロック
線図、第２図は、第１図に示した実施例を説明するため
のパターン図、第３図は、本発明の他の実施例を説明す
るためのパターン図、第４図は、第３図に示した実施例
を実施するためのブロック線図、第５図は、本発明の他
の実施例を説明するためのブロック線図、第６図及び第
７図は、第５図に示した実施例の動作説明をするための
図。第８図は、本発明の他の実施例を説明するためのフロー
チャート、第９図は、第８図に示した実施例の実施に使
用する電気回路の一例を示すブロック図、第１０図は、
本発明の他の実施例を説明するためのブロック図、第１
１図乃至第１３図は、本発明の技術背景を説明するため
の図で、第１１図は、音声パターン図、第１２図は、Ｂ
ＴＳＰ説明図、第１３図は、パターン図である。１・・・音声入力部、２・・・パワー測定部、３・・・
特徴量変換部、４・・・無音位置計測部、５・・・無音
位置（冒頭）判定部、６・・・マーク付加部、７・・・
パターン格納部、８・・・マーク判定部、９・・・冒頭
パターン添加部、１０・・・重ね合わせ平均処理部、１
１・・・無音位置（末尾）判定部、１２・・・末尾パタ
ーン添加部、２１・・・マイクロフォン、２２・・・音
声区間検出回路、２３・・・フィルタバンク、２３ａ・
・・低域領域フィルタ、２３ｂ・・・高域領域フィルタ
、２４・・・乗算部、２５・・・比較部、２６・・・レ
ジスタ、２７・・・タイムカウント、２８・・・乗算部
、２９・・・始終端移動部、３１・・・マイクロフォン
、３２・・・音声区間検出部、３３ａ・・・高域フィル
タ、３３ｂ・・・低域フィルタ、３４・・・比較部、３
５ａ、３５ｂ・・・レジスタ、３６ａ、３６ｂ・・・平
均化部、３７・・・加算部、３８・・・パターンレジス
タ、４１・・・マイクロフォン、４２・・・音声区間検
出部、４３ａ・・・高域フィルタ、４３ｂ・・・低域フ
ィルタ、４４・・・比較部、４５・・・レジスタ、４６
・・・フラグチェック部、４７由パターンつなぎ部、４
８・・・加算部、４９・・・パターンレジスタ。藁　Ｉ　図！　２　図第３図ｇ　４　図第５図第６図第７図第８図第９図

Claims

【特許請求の範囲】

（１）複数の音声パターンを平均化することで行う標準
パターン作成方法において、各音声パターン中に、音声
生成上の不安定成分を、該音声パターン平均化の際の必
然的要素として存在させたことを特徴とする標準パター
ン作成方式。
（２）複数の音声パターンを平均化することで行う標準
パターン作成方法において、複数の音声パターン中に存
在する音声生成上の不安定成分を持つパターンと持たな
いパターンについて、不安定成分を持たないパターンに
不安定成分を持つパターンの不安定成分を付加した後、
両者の平均化を行うことを特徴とする標準パターン作成
方式。
（３）複数の音声パターンを平均化することで行う標準
パターン作成方法において、複数の音声パターン中に存
在する音声生成上の不安定成分を持つパターンについて
、不安定成分の一部を残し、残部を削除したパターンを
平均化することを特徴とする標準パターン作成方式。
（４）複数の音声パターンを平均化することで行う標準
パターン作成方法において、複数の音声パターン中に存
在する音声生成上の不安定成分を持つ複数のパターンに
ついて、各パターンを不安定成分と安定成分に分離し、
それぞれの成分毎に対応させて平均化した後、両者を併
合することを特徴とする標準パターン作成方式。