JPS5895399A

JPS5895399A - 音声メッセージ識別方法

Info

Publication number: JPS5895399A
Application number: JP56193556A
Authority: JP
Inventors: 湯浅　啓義; 大村　皓一
Original assignee: Matsushita Electric Works Ltd
Current assignee: Panasonic Electric Works Co Ltd
Priority date: 1981-11-30
Filing date: 1981-11-30
Publication date: 1983-06-06
Also published as: JPS6331798B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は被制御機器を音声メツセージによって操作する
ための音声メ・シセージ識別方式に関するものである。

第１図は本発明者らが開発した従来の音声メツセージ識
別装置の概略構成を示すものであり九同図において先ず
音声はマイクｆｌ）から入リープリア７　′ｊ＋２１で
高域強調され、ＬＯＧアンプ（３）で対数変換されてデ
シベル値に比例する出力になり、ＡＣアシプ（４）で交
流成分のみが増幅される０次に低周波用フィルタバンク
１５）で低周波成分（ＩＫＨｚ以下）？とり出し、高周
波用フィルタバンク（６）で高周波成分（５ＫＨｚ−１
２ＫＨｚ）ｔとり出す０フイルタパンク＋５１１６１は
各帯域毎に帯域フィルタ（Ｆｌ）（ｌｈ）　。

整流回路（ＤＩＸＤｔ）　、積分回路よりなる平均化回
路（Ｍｌ）（Ｍりで構成されている。低周波用フィルタ
バンクの積分回路（Ｍｌ）は時定数５・〜ｌ　Ｏｍ８ｅ
Ｃ程度、高周波フィルタバンクの積分回路（Ｍ２）は時
定数１〜２ｍ５ｅｃ程度ＶＣ設定されている０両フィル
タバンク＋５１　ｉｌｌの各出力は差動アンプ（７）ニ
入力され、その出力すなわち高周波成分と低周波成分の
差が時定数２［ｍ　ｓｅｅ程度の積分回路よりなる平均
化回路（８）で平均化される。

この平均化回路（８）から出力されるアナ０夕信号波形
ｙ　ｆｔ）は入力音声中に含まれる有声音Ｖと無声音Ｕ
の比率を表わしている。第２図（ａ）　（ｂ）は当社の
音声制御式あんま椅子の音声入力例「もみ下げセット」
に対するアナロク信号波形Ｙ　（ｔ）　’ｉｉ示したも
のであり、本実施例では有声音Ｖはつラス、無声音Ｕは
マイナスの値をとっている。この信号電圧ｙ　（ｔ）　
ｋ　Ｖ判定回路＋９１オヨびＵ判定回路１ｌｌ）　Ｋ加
え、クロック発生回路（１１）からのりＤツクＣＫによ
りて一定周期毎にサンプリンクする。両判定回路１９）
　１ｌｏｌにはそれぞれ基準電圧ＲＶおよびＲｕが加え
られ、サンプリンタ時にアナＤり信号電圧がウラス側の
基準電圧Ｒｖ以上であれば有声音Ｖ１マイナス側の基準
電圧ＲＵ以下であれば無声音Ｕ、ＲｖとＲＵとの間の値
であれば無音Ｓと判定する。第２図（ａ）　（ｂ）　［
おいて、ｚ（ｔ）は信号処理回路（１乃から得られるＶ
Ｕ判定出力信号を示しており、無声音Ｕに対しては−１
、無音Ｓに対してけ０、有声音に対しては＋１の値をと
るようになっている。なお謳２図（ａ）はＬＯＧアンウ
（３）？使用した場合を、談た同図（ｂ）はＬ０Ｇアン
プ（３）全除去した場合をそれぞれ示しており、両者？
比較すれば明らかなように、入力音声をフィルタバンク
ｔｉｌｌ　ｆ６＋の前でＬＯＧ変換しておくと、有声音
Ｖと無声音Ｕの識別全確実に行なえるものである〇次にＬＯＧアン″ｊ＋３１　’ｉ通す前のプリアンプ（
２１の出力は、例えば１．５ＫＨｚ〜２．５ＫＨｚ　　
の帯域フィルタ（Ｆｓ）、整流回路（Ｄｌ）、平均化回
路（Ｍｍ）からなるフィルタバンクα″４と、Ｌ５ＫＨ
ｚ−＆５ＫＨｚの帯域フィルタ（Ｆ４）、整流回路（Ｄ
４）　、平均化回路（Ｍ４）から成るフィルタハシ９０
蜀によって各周波数領域の特性成分會抽出される０フイ
ルタＪ３ンク晴の出力である低域前■Ｌと、フィルタバ
ンク（１４）の出力である高域音ＶＨとは差動アンプθ
５）Ｋより比較され、平均化回路θ［９により平均化さ
れる。平均化回路−の出力はクロックＣＫに同期して動
作する■Ｌ判定回路（１７）およびｖＨ判定回路Ｑ〜に
それぞれ入力され、平均化回路０櫛の出力電圧が基準電
圧Ｒｔ、よりも低いとｖＬ酸成分判定され、また基準電
圧ＲＨよりも高いと■Ｈ酸成分判定され、ＲＬ　（！：
　ＲＨＯ間であれば中域音ｖＭと判定される。信号処理
回路（Ｉ鴫はＶＨ、ＶＬ　、およびｖＭ〕各成各成分上
れぞれ＋１．０、−１の出力に８値化するものである〇信号処理回路（１２１（１９）の各出力はＩｌｏ　　ボ
ートーケ介してＣＰＵ（２１）に読み込まれるものであ
り、読み込まれたデータＦｉ−１人カパターンメ℃す（
ロ）に格納され、標準パターンメｆ、　ＩＪ（ハ）に記
憶されている複数個の標準パターンのうちどれに一番近
いかを照合判定されて・その照合判定結果に基いて被制
御機器（２）４Ｉヲ制御するようになっている。これら
の照合判定動作等はＣＰＵｔ２１）とプ０タラムＲＯＭ
岡、およびワー＋ンタＲＡＭ（ハ）を有するマイク０］
ンヒユータ闘により行なっているものである。

しかるにかかる従来例においては、人力式ターンと照合
判定される標準パターンが１通りしかない次めに、音声
メツセージの発声音が異なる場合や、あるいは同一の発
声音においても発声速度を変えたり発声の態様を変えた
りした場合には、音声メ゛ソセージを正しく認識するこ
とができなくなるという問題があった０そこで従来、ａ
！数の発声者の声を登録し次り、あるいは同一の発声者
について複数回の発声を登録したりして同一の音声メツ
セージについて複数通りの標準パターンを用意して１人
カバターンがいずれか１つの標準パターンと一致したと
きにはその一致出力に応じて被制御機器を制御するよう
にした音声メツセージ識別方式が提案されているが、発
声者の性別や年齢差、あるいは方Ｈによる訛りなども考
慮に入れて様々な標準パターンを用意しておくものとす
ると、標準パターンメｔり關の容量が著しく大きくなる
という問題があった。

本発明は従来例のこのような問題点を解決するために為
されたものであり、音声メツし一ジの発声の態様が様々
な変化を示しても確実に音声メツセージを認識すること
ができ、しかも所要メ七り容量をできるだけ少なく抑え
ることができるようにした音声メツセージ識別方式を提
供することを目的とするものである・以下本発明の構成？図示実施例について説明する。第８
図は不発明による音声メツセージ識別装置のブロック図
を示すものであり、同図に示すように音声メッセー、；
識別装置！ｉ＃ｉ音響処理部？樽と、周波数分析部端と
、符号化処理部−と、照合判定部１３１）とから構成さ
れている。このうち音響処理部Ｉ２８１と周波数分析部
１２９）については、従来例の装置と同様の構成を有し
ており、フィルタバンク＋５１　Ｉｓ）およびフィルタ
バンクｔ１３）（１４）の後段に接続された判定回路ｃ
＋ａ　＋ｇ３１Ｖｉ第１図における差動アンづ＋７１　
（１５＋から信号処理回路θ２）（１９１までの回Ｍに
よって構成されている。たたし、帯域フィルタ（ｐり（
Ｆ４）の通過周波数帯域は後述のようにそれぞれθ〜５
００Ｈｚ　　および５００Ｈｚ〜ｌＫＨ２ＫＰＩ定され
ている。これらのＩｌｏ　　ホード−よりも前段の回路
はアナ０ジＩＣによって構成され、Ｉ１０ボート−より
も後段の回ＦｊｌＩＶｉマイクロコンピュータにより構
成されている。符号化処理部（３０）において、（財）
は無音区間を検出するためのＳカリンクであり、有声音
ｖま７’（ｉｊ無声音Ｕが検出されるとリセットされて
音声入力動作を開始させ、その後無音Ｓが一定時間（約
０．２秒）以上続くとカウントアツプして音声入力動作
を停止するようになっている。音声入力動作Ｆ′１５〜
２０ｍ５ｅｃのサンプリング周期（実施例で＃″１５ｍ
５ｅｃの周期）に従って行なわれ、一方の判定回路０４
からは有声音Ｖ、無声音Ｕ、および無音Ｓの各符号とそ
の継続時間とが入力されてメ七りに格納され、また他方
の判定回路−からは高域音ＶＨ、中域音ｖＭ、および低
域音■Ｌの各符号とその継続時間とが入力されてメ七り
に格納されるようになっている。このようにしてメ七り
に一旦格納された信号は波形整形処理部州側により整形
処理される。

第４図（ａ）は波形整形処理部Ｃｆ９において波形整形
される前の信号波形倉示しており、また第４図（ｂ）は
波形整形処理された後の信号波形を示している。波形整
形処理は第４図（ａ）の矢印ａ、［示すように、有声音
■または無声音Ｕの継続時間の短いものを無音Ｓとする
第１の処理と、第４図（ａ）の矢印ａｍ〜ａ６に示すよ
うに、有声音■または無声音Ｕの継続時間が比較的長い
ものの次に来る無音Ｓの期間が短く飄かつ無音Ｓに続く
次の符号が無音Ｓの前の符号と同じであれば、無音Ｓを
消すようにする第２の処理とから構成されているもので
ある。第６図はかかる波形整形処理部−における波形整
形処理の手順を示すフローチャートである。

このフローチセートは、符号Ｖ　、Ｕ　、Ｓとその継続
時間とのリスト形式によりメ七りに格納されたデータを
演算処理して析たなリスト形式のデータ全作成し１ｐ４
びメｔりに格納するための″ｊＯタラムを示している。

まず整形前のリストはその最初の符号がＳであるか否か
を判定し、最初の符号がＳでなければその継続時間が基
準値Ｔ１よりも大きいかどうかを判定される。継続時間
が基準１ｉｉ　Ｔ　＋よりも大きくなければ、その符号
ＶまｆｃはＵ？符符号圧変換して符号Ｓとその継続時間
全整形後のリストとしてメｔりに書き込む０また継続時
間が基準値Ｔ１よりも大きければ、その符号ＶまたはＵ
とその継続時間とを整形後のリストとしてそのまま転写
する。そして次の符号Ｓの継続時間が基準値Ｔ！よりも
短いかどうかを判定し、基準値Ｔｓよりも短かければ、
その符号Ｓの次の符号は符号Ｓの前の符号と同じである
かどうかを判定する。同じでなければ符号Ｓとその継続
時間とをそのまま整形後のりストに転写する０また同じ
であれば符号Ｓを前後の符号ＵまたＶｉＶＫ変えて、そ
の変えた後の符号とその継続時間とを整形後のリストと
してメ七りＫＷき込む。さらに次の符号Ｓについてその
継続時間が基準値゛ｒ２よりも短いが否が會再び判定す
る。以上の演算処理動作は整形前のすべてのリストが変
換処理されるまで続けられるものであり、変換処理が終
了すると整形後のリストの最後の符号がＳであるかどう
かを判定し、最後の符号がＳであればその符号ｓｌ整形
後のリストから除去して、再び最後の符号がＳであるか
どうが全判定する０しかして最後の符号がＳでなくなれ
ば一連の波形整形処理動作を終了するものであり、この
と＠にメｔりには、第４図（ｂ）に示すような波形整形
処理された信号が符号Ｕ　、Ｖ　、Ｓとその継続時間と
のリスト形式で格納されていること罠なる０また他方の
波形整形処理部−においても同様の演纂処理１作が行な
われるものであり、■符号ＶＨおよび符号ＶＬのうち継
続時間の短いものを符号ＶＭＫ変換する動作と、■符号
■Ｈと符号ｖＨとの間に挾まれた継続時間の短い符号ｖ
Ｍｖ＋−符号ＶＨに変換する動作と・■符号Ｖｔと符号
Ｖｔ、との間に挾まれｆｃ継続時間の短い符号ＶＭ　ｋ
符号Ｖｔに変換する１作と？行なうものである。

次に第６図は上記波形整形処理部−例により形成されｆ
ｃ２系統のリストを１系統のリストにまとめるためのコ
ンポジット符号化処理部のηの処理動作を示すフＯ−チ
セートである。その動作について説明すると、まず波形
整形処理部間によって形成された符号Ｕ、Ｖ、Ｓとその
継続時間のリストを調べて、最初の符号がＵまたｈｓで
あるかどうかを判定する。最初の符号がＵまたはＳであ
れば、その符号ＵまたはＳとその継続時間とがコンポジ
ット符号リストとしてメｔりにそのまま転写される。ま
た最初の符号がＵまたはＳではなくてＶであるときには
、波形整形処理部＠鴎によって形成された符号ｙＨ，Ｖ
、　、”ｖＬとその継続時間のリスト？調べて・符号Ｖ
の継続時間中にまず符号ｖＨが含まれているかどうかｔ
判定して含まれている場合にＩｄ、符号ＶＨとその継続
時間と金コシポジット符号リストとしてメｔりに転写す
る。また符号ｖＭおよびＶＬにりいても、符号Ｖの継続
時間中に含まれている場合には符号ＶＭ、ＶＬとその継
続時間とがそれぞれコンポジット符号リストとしてメｔ
りに転写される。

以上のようにして］ンボジット符号リストが得られるも
のであるが、本実施例のように、符号Ｖ＋Ｕ＋Ｓの系統
と、符号ＶＨ，ＶＭ、　ＶＬ　（７）系統とについて別
々に波形整形処理？行なってから、コンポジット符号化
する方法（第７図（ａ）参照）の他に、纂７図（ｂ）に
示すように先にコンポジット符号化を行なってから波形
整形処理を行なう方法もあり得るものである。この場合
には符号Ｕ　、　Ｖ　、ＶＨ，ＶＬの各論理値に基いて
第１表に示すような論理演算？行なうことによりコンポ
ジット符号化全行なう第　　１　　表次Ｖ′Ｃ第８図は、階層化処理部−の処理動作を示すフ
０−チＰ−トである。階層化処理部１３８１は後段の照
合判定部叫ＩＫおけるパターン照合ケ音声の構造に合わ
せて段階的に行ない得るよう罠するためにコンポジット
符号リストから第１階層リストと第２階層リストと？作
成するものである。このうち第１階層リストについては
、符号Ｕ、Ｖ、Ｓとその継続時間のみからなる符号リス
トと圏−であるので、波形整形処理部（ハ）の出力リス
ト？そのまま転写するか、あるいはコンポジット符号リ
ストにおける符号ＶＨ，Ｖｍ＋Ｖｔ’ｒすべて符号ｖに
置き換えることによって容易に得られるものである０次
にｍ２階層リストについてはコンポジット符号リストの
うち−続きの符号ＶＨ、Ｖｔ　、　ＶＭとその継続時間
からなる符号リストを転写することによって得られるも
のである。したがって第１階層リストの中に符号Ｖがｎ
個含まれているものとすると、第２階層リストもまたｎ
個得られるようになっている０さらに第９図は、上述のようにして得られ次第１階層リ
ストと第２階層リストについて符号の継続時間ケ正規化
するための正規化処理部−の処理動作倉示すフ０−チＰ
−トである正規化処理部−は符号Ｕ　、Ｖ　、Ｓとその
継続時間からなる第１階層リストと、符号ＶＨ、ＶＭ　
＊　ＶＬとその継続時間からなるｎ個の第２階層リスト
についてその継続時間の総和が一定になるように時間軸
上の正規化を行なうものである。第２表は第１階層リス
ト罠ついて、符号Ｖ、Ｕ、Ｓとその継続時間ＴＫおよび
正規化された継続時間Ｔｓの関係？示したものであり、
継続時間ＴＫはサシづル個数に対応している。

第　　２　　表かかる正規化処理動作を第９図のフＯ−チＰ−トにより
て説明すれば、まず符号Ｕ、Ｓ、Ｖの全継続時間ＴＫの
総和ΣＴｈ（＝１６６２８）２求めて、これから正規化
係数Ｐｓ−１０００／ΣＴＫ　ｋ求める。

次に各符号Ｕ、Ｖ、Ｓについてその継続時間Ｔｘｌ）に
正規化係数Ｐｓｉ乗算して正規化された継続時間Ｔｓ（
ｊ）　ｋ順に求めて行くものである。以上のようにして
第１階層リストについての継続時間の正規化１１作が完
了すると、ｎ個の第２階層リストについてそれぞれ同様
の操作により継続時間の正規化処理を行なうものである
。第８表（ａ）〜（ｄ）　Ｖｉ、第１階層リスト（第２
表参照）に含まれる４個の符号■について作成された第
２階層リストとその正規化されｆＣ継続時間とをそれぞ
れ示したものである０第　８　嵌　（ａ）第８表（ｂ）第　８　表　（ｃ）第８表ｆｄ）第８表（ａ）は第２表に示す第１階層リストの最初の符
号Ｖ（継続時間８４１５）Ｋ対応する＠２階層リストＶ
１を示しており、以下順に第８表（ｂ）〜（ｄ）は継続
時間Ｘ）Ｅ８６２１．１４８７．１８７１７）各符号Ｖ
に対応する第２階層リストｖ２〜Ｖ４ｉ示している。以
上のようにして継続時間の正規化を行なうと、発声速度
の影ｆ＃を受は罠くくなるので、認識率？高めることが
できるものである。なお第２表及び第８表に示した継続
時間ＴＫのデータは音声メツセージ「せなかをさすれ。

」を５０μｓｅｃのサンプリンタパルスを用いて分析し
た場合のシミュレーションデータであって、５ｍ５ｅｃ
のサンプリングパルス？用いて分析を行なう場合にＦ′
ｉ継続時間（すなわちサシプリンタ個数）は衣の値の１
００分の１になるものである。

以上のようにして正規化されｆｃ第１階層リストの符号
Ｕ　、Ｖ　、Ｓ　、および概２階層リストの符号ＶＨ，
ＶＭ、ＶＬ　Ｖｉ、　８　ｆｔ！符号化処ｍａｎ（ＩＩ
Ｃオイテ＋　１．０、−１の８値符号に変換されるもの
である。

すなわち、まず第１階層リストにおける符号ｖＦ′ｉ＋
１．符号ＵＶ１−１．符号ＳはＯＫそれぞれ対応させ、
また第２階ｊ−リストにおける符号Ｖｎ　Ｆｉ＋ｌ　＋
符号ｖＭｔ−ｔｏ、符号ｖＬは−１にそれぞれ対応させ
るものであるａこのようにすれば、距離計算照合部（４
１）において標準パターンメ七り（偵の内容と第１階層
リストおよび第２階ｊ−リストの内容と倉照合するとき
に計算速度全署しく高速化することができるものである
。すなわち距離計算照合部（４１）は標準ハターンメモ
リしＪＫ記憶された＋１．０、−１の８値化きれたデー
タと８値打号化処理部明から出力されるデータとの相互
相関係数會求めるようになっているものであるが、デー
タが＋１．０．−１の８通りしかないために、数値の乗
算全必要とせず、単なる調理演算と加減算とによってき
わめて蔦速度で相互相関係数を計算することかできるも
のである０各標準パターンについてそれぞれ計算された
相互相関係数は１次階Ｍ識別部（ハ）と２次階層識別部
（旬に記憶され、判定処理部Ｔ４１１９において大小関
係を比較され、相互相関係数が太きいものほど似／こパ
ターンであると判定されるものである。

ここて相互相関係数とは、時間ｔの変化に対する標準パ
ターンの値の変化１ｋｔＩ（ｔ）とし、１次階層リスト
や２次階層リストのような入カバターンの値の変化１ｆ
ｄｔ）としたと＠に次式で与えられるものであるＤｆｌ２（τ）　”　ｆ　　ｆｌ（ｔ）　ｆｌ（ｔ−τ）
ｄｔ第１０図（ａ）　（ｂ）は時間ｔの変化に対する標
準パターンの値の変化ｆｔ（ｔ）と、入カバターンの値
の変化ｆ２（ｔ）と？それぞれ示すものであり、同図に
示すようにｆ＋（ｔ）とｆｚ（ｔ）とは＋１．０．−１
の８通りの値しかとらないので、両者の槓ｆ＋（ｔ）　
ｆ　＊（ｔ）の値も＋１，０゜−１のいずれかの値しか
とらないことになり、このために相互相関係数の計算は
非常に容易になるものである。かかる相互相関係数ｆ＋
＊　（τ）はマイクロコンビュータケ用いて計算する場
合には、実用上は次式のような数値演算により充分に計
算できるものである。

ところで相互相関係数ｆｓｘ（τ）は互いに乗算される
標準パターンｆｘ（ｔ）と入カバターンｆ雪（を−τ）
との位相差τの関数となっており、ある特定の位相差τ
において最大の値をとるようになっている。

そこで距離計算照合部圓においてはこの相互相関係数ｈ
　＊（τ）が最大になる点を求めて、その最大値に！標
準パターンについて計算し、１次および２次階層識別部
（ハ）に）にそれぞれ記憶させ、最後に判定処理部（州
においてその大小関係を比較して入カバターンに最も近
い標準パターンを判定しているものである。

ところで、本発明においては音声メツセージから抽出し
た符号パターンを標準パターンと照合する際に、符号１
１ターンを１次階層リストと２次階層リストと罠分離し
て、１次階層リストに関する照合を行なった後に、２次
階ｊ−リストに関する照合？行なうようにして、照合処
理を段階的罠行なりているが、これは音声の巨視的な構
造に対応する特徴を先に抽出し次後で、次に音声の微視
的な特徴に対応する特＆を抽出するようにした方が、音
声の認識を効率的に、かつ確実知行なうことができるか
らである。第１１図は音声の特徴を階層化して表わした
ものであり、音声はまず声帯振動を伴う有声音Ｖと、声
帯振動ヲ洋わない無声音Ｕとに大きく分類され、有声音
Ｖは顎の開きの広い有声音／ａ／グループと、顎の開き
の狭い有声音／ｉ／ジルーウとに分類される。顎の開き
の広い有声音は上述の高域音ＶＨＩＣ対応し、音声の第
１ホルマシトの周波数が比較的高く、その周波数帯域は
５００Ｈｚ＝ＩＫＨ２に多く分布している、ま次顎の開
きの狭い有声音は上述の低域音ｖＬに対応し、音声の第
１ホルマントの周波数が比較的低く、その周波数帯域は
θ〜５００ＨｚＫ多く分布している。

顎の開きの広い有声音には、母音／ａ／　、／り７７／
ε／などがあり、また顎の開きの狭い有声音には、母音
／ｉ〆／ｅ／１０．／；　／ｕ／や、鼻子音や、その他
の有声子音などがある。また無声音Ｕには定常的な無声
音すなわち無声摩擦音ＵＰと、過渡的な無声音すなわち
無声破裂音ＵＢとがある０しかして、音声メツセージ’ｋ　１　語１　＠＃４Ｈに
認識しようとすれば、これらの音声の各特＆をすべて識
別する必要があるが、照明器具や自動扉、あるいはあん
ま椅子などを音声メツセージを用いて制御する場合には
、すべての子音および母音を完全に識別する必要はなく
、もう少し巨視的な特徴を抽出するだけでも充分に実用
になるものである０このような音声の特Ｉｔヲ巨視的な
特徴から順に列挙して行くと次のようになるＯ１）有声音Ｖであるか無声音Ｕであるか０かかる特徴は
音声の周波数スペクトルの中に低域成分（ＩＫＨｚ以下
）が多いか、高域取分（５ＫＨｚ　〜ｔｇＫＨｚ）が多
いかによって判定できる。

２）有声音■であれば、顎の開きの広い有声音ＶＨ（／
ａ／グループ）であるか、顎の開きの狭い有声ｉｔ　Ｖ
ｔ、　（／ｉ／クルー″ｊ）であるか。かかる％欲は有
声音の周波数スペクトルの中に高域音Ｖｕ　（５００Ｈ
ｚ〜１ＫＨｚ）か多いか、低域音ＶＬ（０〜５００Ｈｚ
）か多いかによって判定できる。

８）無声音Ｕであれば、無声摩擦音ＵＰであるか、無声
破裂音ＵＢ′ｔ１″あるか。かかる特徴は無声音が定常
的であるか、過渡的であるかによって判定できる。すな
わち無声音Ｕの継続時間が長いが短いかによって判定で
きる。

４）音声メツセージの中で、各特徴ＶＨ，ＶＬＩＵＢ、
ＵＦ吟の占める時間、または音声メツセージの継続時間
の中で占める割合。かかる特Ｉ！＆は上述の第１階層リ
ストや第２階層リストにおける継続時間全参照すれば判
定できる。

その他にも、音声の第２ホルマシトが高いか低いかによ
りて前古の母音（／ｉ〆Ａ／に対応）と高舌の母音（／
ｕｌ　１０／に対応）とを識別することができるが、そ
こまで微視的な特徴全抽出しなくても、機器を制御する
ための音声メツセージは充分に認識できるものである。

例えば第１２図は、あんま椅子用の音声入力／５ｅｎａ
ｋａｏｓａｓｕｒｅ／の周波数スペクトルの例であり、
音声入力を２０ＫＨｚでサシプリンタしたものを２００
サシプル（１０ｍ５ｅｃ）ｋｌフＬ＋−ムとして、２０
次のＬＰＧ分析を行なったものであるが、無声音／８／
は５ＫＨｚ以上にパワーが集中しており、また有声音は
ＩＫＨｚ以下にパワーの山があることがわかる。さらに
有声性では／ａ％　１０／のパワー１５００Ｈｚ〜１Ｋ
Ｈｚに集中し、／ｎ〆／Ｖは０〜５０．ＯＨｚにパワー
が寒中していることがわかる。さらに有声音は、同一の
スペクトルが各音素に対応して数個（数十ｍ５ｅＣ）続
いていることがわかる０ ′１ｆｃ第１３図（ａ）は上記と同じ音声入力に対する
有声音成分Ｖと無声音成分Ｕとの変化を示しており、第
１８図（ｂ）は有声音のなかの烏賊成分ＶＨと低域成分
ｖＬとの変化ケ示しているものであるが、まず第１８図
（ａ）においては無声音／８／／に／に対応する部分が
Ｕｉ示し、／ｎ　ａ％　／ａ　ｏ〆／ａ／／ｕ　ｒ　ｅ
／に対応する部分が明確にｖｌ示している。また第１３
図（ｂ）においてＶｉ１０／　／ｓ　ａ／ＶＣ対応する
部分がＶｔ、で、／ａ／／ａｏ〆／ｅ／　に対応する部
分か■ＨＶＣなっているｏしたがって、上述したように
有声音■、無声音Ｕ、無音Ｓに対応する１次階層リスト
と、有声音のなかの高域音ｖＨ２中城音ＶＭ　ｒ　Ｕｋ
域音ｖＬに対応する２次階層リストを予め記憶された標
準へターンと照合すれば、大抵の音声メツセー、；は識
別できるものである。

ｔころが以上のことはあくまでも一般論であって、音声
メツセージの発声者が異なる場合や、あるいは同一の発
声者においても発声速度を変えたり発声の態様音度えた
りし次場合ＶＣは、音節中の無声破裂音音検出できなか
りたり、あるいは音節中の無声音に挾まれた有声音が無
声音化したりするような現象が生じるために、音声メツ
セージの様々な発声態様にすべて対応できるような標準
パターンを作成する必要がある０不発Ｆ！Ａはこのよう
な微妙な発声の変化による入カバターンの変動があって
も音声メッセー、；ヲ正しく認識できるようにするもの
である。すなわち本発明においては、標準パターンとし
て例えば第１４図に示すように符号Ｃ＋　、　Ｃ２、Ｃ
ｍ　、　Ｃ４、Ｃｓ　、　Ｃｓの時系列からなる基本パ
ターンの他に、符号Ｃ２４，符号Ｃ４＆のような分岐パ
ターン？付加して、入カバターシ會符号Ｃ８゜Ｃｓ４＋
　Ｃｓ　、　Ｃｓの時系列からなる第１の派生パターン
や）符号Ｃｒ　＋Ｃｔ、Ｃｓ、Ｃ４ｓ　、Ｃａの時系列
からなる第２の派生パターンと照合することも可能とし
て、音声メツセージの認識率ケ高めたものである以下具
体的な例金挙げながら、本発明における標準パターンを
構成する基本パターンと分岐パターン、および派生パタ
ーンの概念について説明する。

音声の入カバターンが変動する最も典型的な例としては
、まず第１に無声破裂音／Ｐ／、／ｌ／／に／の欠落現
象が挙げられる。すなわち第１８図（ａ）　’ｆｒ：参
照すればわかるように、無声破裂音／に／は過渡的な無
声音であるためにその継続時間が短く、非常に検出しに
くいものである０これに比べると無声摩擦音／ｓ／は定
常的な無声音であるために第１８図（ａ）　Ｋ示すよう
にその継続時間が長く、その検出が容易である。このた
めにサンプリンタ周期を若干長くすると、無声摩擦音／
Ｓ／は検出できても無声破裂音／に／　Ｖｉ検出できな
い場合が生じ得る。第１５図はこの点を考慮に入れて上
記音声人力／８ｅｎａｋａｏｓａｓｕｒｅ／の第１階層
リストに対する標準パターンを構成したものであり、符
号Ｕ、Ｓ、Ｖ＋、　Ｓ　、Ｕ　、Ｓ　、ｖｔ、Ｓ　、Ｕ
、　Ｓ　、Ｖｓ、Ｓ　、Ｕ、Ｓ、Ｖ４の時系列からなる
基本パターンの他に、符号ＶｌとＶｌとで挾まれる符号
Ｓ、Ｕ、５ｏｆｉ続時間に等しい符号Ｓからなる分岐パ
ターンを設けたものである。したがって、音声の符号化
された入カバターンは、上記基本パターンと照合される
のみならず、分岐バター、７によって生じる符号Ｕ。

Ｓ　、Ｖ＋、Ｓ　、Ｖ２．Ｓ　、Ｕ、Ｓ　、Ｖｓ、　Ｓ
　、Ｕ　、Ｓ　。

■４からなる派生パターンとも照合されるものであり、
したがって無声破裂音Ａ／が入カフ’ｌターシから欠落
するようなことがあっても音声メツセージを正しく認識
することができるものである。なお第１５図中に記載し
た数字■、■け同一の話者の５回の発声バター９を分析
した結果、基本パターンに一致した場合が４回、派生パ
ターンに一致した場合が１回あったということを示すも
のである。以上のように構成することにより、無声破裂
音／ｌ　／ｌ／　／に／　を聞き落とすような事態全防
止できるものである。

次に第１６図（ａ）　〜（Ｃ）は音声入力／５ｅｎａｋ
ａｏａａｓｕｒｅ／に含まれる４個の有声音ｖ１〜ｖ４
　　について、それぞれの２次階層リストに対する標準
パターンを作成した例を示している０このうち第１番目
の有声音Ｖ＋にりいて説明すると、その基本パターンは
符号ＶＭ、　ＶＬＩ　ＶＭ、　ＶＨ，ＶＭ、　ＶＬ　ノ
Ｒ系列カラ構成されており、さらに符号ｖＭからなる８
個の分岐パターンを有しているｏしたがってこの場合に
ｔｉ−符号ｖＭ−■Ｌ、ｖＭ、ｖＬノ時系列からなるＭ
ｌ’）派生７Ｓ　ター　：／　（！ニー、符号ＶＭ　ｒ
　Ｖｔ、　、　ＶＭ　＊　Ｖｔ、　、ＶＭ　）時系列か
らなる第２の派生パターンと、符号ｖ、、　ｌ　Ｖｔ　
。

ｖＭ　、　ｖ、　、　ｖＭの時系列からなる第８の派生
パターンとが形成されるものである。第１６図（ａ）に
記載された数字■、■、■などは前と同様に分岐の回数
を示している。なお各分岐パターンの継続時間は、分岐
パターンに入らずに基本パターンをそのまま進んだ場合
の継続時間と等しくなっている。以上のように標準パタ
ーンを構成することにより、第２階層リストにおける符
号ＶＨ、ＶＭ　、　Ｖｔ、が少々変動しても確実に音声
メツセージのあ織ができるようになっている。

ところでこのような第２階層リストにおける符号Ｖ■、
　ＶＭ　、　ＶＬの変動の仕方は多種多様であり、−例
を挙げると（イ）　ＶＬ−ＶＨ系列がｖＬ−ｖＭ系列に
なる場合（例、／５ｅｎａｋａ／の／ｎａ／）、（１）
）　ＶＬ−ＶＭ系列がＶｔ−Ｖｔ系列になる場合（例、
／５ａｓｕｒｅ／の／　ｒ　ｅ　／　）、（ハ）　ＶＬ
−ＶＭ系列カｖＬ−■Ｈ系列になる場合（例、／ｌｏｍ
ａｒｅ／の／ｒｅ／）、（＝）　ＶＨＶｔ、系列がｖＨ
−ｖＭ系列になる場合（例、／５ｅｎａｋａ／の／ａｋ
／）、（ホ）符号ＶＨがｖＬ−ｖ、系列になる場合（例
、／ｓａ／）、（へ）符号ｖＨがＶＬ−ＶＨ−ｖＬ系列
になる場合（例／ｋａｔａ／の／　ｋ　ａ　ｔ　／　）
などの例７５Ｅアル０これらの符号ＶＨ、ＶＭ　、　Ｖ
ｔの変動の規則全整理すると大体次の２つの場合に分類
される。

１）前後の音韻の相互作用により、符号ＶＨとｖＭおよ
び符号ｖＬとｖＭの相互の入れ代わりが生じること。す
なわち、ｖＨ−ｖＬ系列がＶＨ−ＶＭ系列まｆｃはｖＭ
−ｖ系列になり得ること、および■Ｌ−ｖＨ系列がＬＶＬ　ＶＭ系列ま次はｖＭＶＨ系列罠なり得ること。

２）符号ｖＨが前後の無声音の影豐を受けて、符号ｖＨ
の前まｆＣは後あるいは前後双方に符号ｖＬが付加され
ること。すなわち、符号ＶＨが、ＶＬ　ＶＨ系列、ｖＨ
−ｖＬ系列、まｆｃ　ｔｄ　Ｖｔ、−ＶＨ−ｖＬ系列に
入れ代わること０音声の入カバターンが変動する他の例としては、母音の
無声化現象が挙げられる。例えば日本人の場合、「私（
ワタクシ）」という言葉＠　／　Ｗ　ａｔａｋｕｓｉ／
と正確て発音する人よりはむしろ、母音／ｕ／　ｋ飛ば
して／ｗａｔａｋｓｉ／と発音する人の方が多いもので
ある０これは母音／／Ｕ／が無声破裂音Ａ／と無声摩擦
音／８／に挾まれているからであり、一般に■無声破裂
音ＵＢと無声破裂音ＵＢ罠挾まれｉ１個の母音（例えば
／ｋｉＱｐｕ／の／ｌ／）や、■無声破裂音ＵＢと無声
摩擦音ＵＰとに挾まれた１個の母音（例えば／ｗａｔａ
ｓｃｕｓｉ／の／Ｕ／）、および■無声音と有声子音に
挾まれた１個の母音などは無声化する傾向が非常に強い
０その他にも無声音Ｕと無音Ｓの間に挾ま／″した１個
の母音（例えは、／ｄｏｕｓａ／の／ａ／）も無音化す
る傾向が若干ある。そこで、一般に無声音と無声音の間
、および無声音と無音の間、ならびに無声音と有声子音
の間に挾まれた１個の母音については、その母音の部分
を有声１ｖとする基本パターンの他に、その母音の部分
を無声音Ｕとする分岐パターンを標準パターンに付加し
ておき、上記特定の母音が有声音Ｖとして明瞭に発音さ
れた場合ておいては基本パターンにより照合判定するこ
とができ、また上記特定の母音があたかも無声音Ｕであ
るかのように不明瞭に発音された場合においては派生パ
ターンにより照合判定できるようにしておけば、音声メ
ツセージの認識率を高くすることができるものである。

次にこのような基本パターンおよび分岐パターンを有す
る標準パターンを作成する方法について説明する。標準
パターン全作成する方法には大別して２つの方法があり
、ｌりは音声メツセージ全構成する個々の音素符号およ
びその継続時間勿十−ボード等から入力し、分岐処理つ
０ジラムにより基本パターンおよび分岐パターンを目動
的に作成する方法であり、もうｌりは同一の音声メツセ
ージ全発声の仕方ケ変えたりあるいけ発声者を変えたり
しなから複数回登録し、共通する性質を基本パターンと
し、共通しない特異な性質を分岐パターンとして登録す
る学習登録方式であり、前者は演紳法的なものであり後
者Ｖ１１ｆ６納法的なものであるＯまず前者の方法は、例えば第１７図足示すように十−ボ
ードφ０）から／ｓ／／ｅ〆／ｎ／／ａｌ　／に％　／
ａ／　。

／ａ／／ｓ〆／Ｊ　／Ｉｌ／／ｕｌ　／ｒ〆／ｅ／など
の各音素符号とその継続時間と全順次入力して行く力失
であり、まず各音素符号が有声音Ｖであるか否か？判定
し、有声音■であれば母音／ａ／については符号ｖＨ全
割り当て、母音／Ｉ／と有声子音〜／Ｖにりいては符号
ＶＬｋ割り当て、その他の有声子音？母音／ｅｉ　／ｕ
ｉ　１０／にりいてけ、符号ＶＨ、ＶＭ　・ｖｌ、のい
ずれにもなり得るものとして分岐パターンを作成する。

また無声音には符号Ｕを、さらに無音′に−け符号Ｓを
そのまま割り当てるようにする。次に継続時間を入力し
て継続時間の短い無声音、すなわち無声破裂音について
は符号Ｕからなる基本パターンの他罠、符号Ｓからなる
分岐バター、７を付加する。さらに符号系列を入力して
、無声音と無音または無声音あるいは有声子音とに挾ま
れた単母音には、符号Ｖからなる基本パターンの他に符
号Ｕからなる分岐パターンを付加するものである０以上
のようにすれば、音声メツセージの認識率？高めるよう
な分岐パターンを基本パターンに付加した標準パターン
？自動的に作成することができるものである〇次に学習登録方式について説明する。第１８図（ａ）〜
（Ｃ）は第２階層リストに対応する符号ｖＨＩ　ＶＭ　
。

ＶＬからなる標準パターン全作成する場合を示しており
、第１９図はその作成手順を示すフローチセートである
０まず第１８図（ａ）に示すように同一の言葉全複数回
登録し、正規化された時間ｋｌＯの領域に分割し、同じ
時間領域で符号が変化しない部分を核パターンとし、同
じ時間領域で符号が変化する部分ｋ　ＶＭとする。この
時点で第１８図（ｂ）に示すような学習基本パターンが
作成される０次に同じ時間領域でＶＭかｖＬになる部分
にはＶＬの分岐パターン全付加する。ま７′ｃ四じ時間
領域でｖＭかＶＨになる部分にはＶＨの分岐パターンを
作成する。さらに同じ時間領域でＶＨにもｖＬにもなる
部分はｖＭのままｒこしておく。この時点で第１８図（
Ｃ）に示すような分岐パターンを有する学習標準パター
ンが形成される。こうして得られ次学習標準パターンは
標準パターンメモリ（６）に登録記憶されるようになっ
ているものである。

しかして本発明においては、かかる学習登録方式と非学
習登録方式とｔ折衷した登録処理部（４１ｔｌ−設けて
おり、纂２０図にその）Ｏ−チャートを示す。まず登録
処理郁鴎に入力されたデータは第１階層リストの内に、
５−Ｕ−Ｖ系列またはＳ−■系列があるか否かを判定さ
れ、もしあれば５−Ｕ−Ｖ系列とＳ−■系列のいずれの
符号系列ｔも含むような標準パターンが形成される０次
に第２階層リストについては上述の第１９図に示すよう
な学習モードにより標準パターンを作成する場合と非学
習七−ドにより標準パターンを作成する場合と會切り換
え得るようになっており、一方のモードでうまく行かな
いときＫは他方のｔ−ド會使用できるようになっている
。しかして学習モードの動作については第１９図の７０
−チャートによりすでに説明したので、非学１ｉｔ−ド
によって第２階層リストに対する標準パターンを作成す
る場合の動作について、第２１図のフ０−チセートによ
り説明する。まず第８階層リストの最初の符号がＶｔ、
であれば、基本パターン５Ｔ−Ｖｔ、と派生パターン５
Ｔ−ｖ、、と金含む標準パターンを作成する。筐た最初
の符号がＶＨであれば基本パターンＳ　Ｔ　−Ｖｔ　−
ＶＨの他に、２りの派生バ９−　ｙ　ＳＴ−ＶＭ−ＶＨ
（！：　５Ｔ−Ｖｔ、　−ｖＭとを含む標準パターン？
作成する。さらに最初の符号がＶＭであれば基本パター
ン５Ｔ−ｖ、、のみの標準パターンを作成する０次に最
後の符号か■Ｈｒ　ＶＬ　＊　ＶＭのうちいずれである
か、および最初の符号と最後の符号との間に含まれる各
符号がＶＬ　ＶＨ系列か、ＶＨ−ＶＬ系列かに応じてそ
れぞれ、第２１図の７０−チャートに記載したような分
岐パターン付きの標準パターンが自動的に形成されるも
のである。

ところでこのようにして第２階層リストに対する標準パ
ターン？作成する場合には、符号ＶＨと符号ＶＬの識別
ケ正しく行なう必要がある０上述のように符号Ｖｎｉｉ
高域有声音（／ａ／グループ）Ｋ対応し、符号ｖＬは低
域有声音（／ｉ／ジルー″”）”）ＶＣ対応するもので
あるが、本発明にありては、第２２図に示すようにＶＨ
分析系とＶｔ分析糸の出力のバランスを調節するバラン
ス脚部用の可変抵抗ＶＲ＋とオフセット調節用の可変抵
抗Ｖ　Ｒｓと上膜けて、母音／ａ／會発声したときＶｃ
Ｆｉ必ず符号■Ｈが検出され、母音／Ｖ’を発声したと
きには必ず符号Ｖｔが検出されるようにしているもので
ある０ところが厳密にＶｉ話者の個性によってこのバラ
ンスの最適値は異なることがある。そこで本発明者らは
、母音／ｅ／を自然に発生したと１！にＶＨ／ＶＬ差信
号がぜ０になるようにノＳランス１ｔ１４Ｉ！−すれば
よいことを見出したものである。第２８図はその賭理會
示すものであり、同図に示すように母音／ａ／の第１ホ
ルマントは５００Ｈｚ−ＩＫＨ２に分布し、母音／ｉ／
の第１ホルマントはθ〜５００Ｈ２に分布しているもの
であるが１母音／ｅ／の第１ホルマシトは大体その中間
に位置している。したがって母音／ｅ／？基準にしてｖ
ＨとｖＬのバランス調整を行なうとバランスの最適値が
得られるものである。

最後に２次階層リストについて各符号ＶＨ，ＶＭ。

ｖＬの継続時間等を考慮に入れた照合の方法について説
明する。菖２４図Ｖｉ２次階層リストの３通りの照合識
別方式會示すフＯ−チＰ−トであり、最も適当ないずれ
か１つの方法を選択して使用するものである０まず第１
の万ｆＩＫは１つの音声メツセージに含まれる複数個の
有声ｆＶ１〜Ｖｎについて、その中罠含丈れている符号
で穀も多いものはｖＨであるかｖＭであるかｖＬである
かを照合するものであり、また第２の方法は各有声音ｖ
１〜Ｖｎに含埜れているＶＨの割合が入カバターンと標
準パターンとで一致するか否か全照合するものであり、
さらに第８の方法は入カバターシにおけるＶＭが標準バ
タ−ンのｖＨまたは■Ｌに合致するものの数と、標準パ
ターンにおけるｖＭが入カバターンのｖＨまたはｖＬＶ
ｃ合致するものの数とｔリストアツブして照合するもの
である。しかして音声メツセージ中のすべての有声音Ｖ
＋〜ＶｎｌＣついて、上記８種類の照合方法のうち最も
適当ないずれかｌりの照合方法を用いて入カバターンと
複数の標準パターンとを照合し、最もよく特徴の一致す
る標準パターンを判定するようにしているものである。

なお本発明においては入カバターンと照合される標準パ
ターンとして、基本パターンの他に基本パターンから分
岐する分岐パターンを設けて、複数の派生パターン全形
成できるようにし、基本パターンまたは複数の派生パタ
ーンのうちのいずれかが入カバターンに一致するか否か
？判定できるようにしているが、これとは反対に、入カ
バターンの方を様々に変化させるようにすれば、標準パ
ターンは一意的なものとすることも可能である。

すなわち入カバターンから欠落した無声破裂音？補なり
たり、無声化された母音を元に戻したりするような操作
を行なって、１つの入カバターンから複数の派生入カバ
ターン？作成し、これ’ｋ１通りの標準パターンと照合
するように構成すれば標準パターンケ変動させる場合と
同様に認識率ケ高くすることができるものである。

本発明の音声メツセージ認識方式は以上のように構成さ
れており、音声入力から異なる周波数成分を取り出すフ
ィルタの差信号出力のレベルの大小に応じて、音声メツ
セージを第１　、第２．第８の各符号の時系列からなる
入力パターンに変換し、この入カバターンを予め記録さ
れている複数種の標準パターンと照合して入力メツセー
ジを識別する方式において、同一の音声メツセージを異
なる態様で複数回入力したときに最も高い確率で生じる
入カバターンを基本パターンとし、基本パターンよりも
低い確率で生じる入カバターシ？派生パターンとし、こ
の派生パターンと上記基本パターンとのパターンが一致
しない部分を基本パターンから分岐する分岐パターンと
して予め記録し、入カバｉ−ンを基本パターンと照合し
て符合しないときには基本パターンと分岐パターンとの
組合せによって生じる派生バターｙｋ人カバターシと照
合するような分岐照合処理の可能な標準パターンを設け
るようｒこしたものであるから、発声者の性別や年齢尭
９発声速度差、あるいは万ｄＶｃよる訛などによって入
力される音声メツセージの特徴が微妙に変動しても、基
本パターンと分岐パターンとの組合せによって生じる様
々な派生パターンと照合することによって基本パターン
と若干異なる入カバターンでも充分に認識することがで
きるという利点があり、また本発明においては最も筒い
確率で生じる入カバターシを基本パターンとし、基本パ
ターンよりも低い確率で生じる派生パターン？基本パタ
ーンから分岐する分岐パターンの形式で記録するように
したものであるから、非常に多くの派生パターンをきわ
めて少ないメ七り容置で記録しておくことができ、した
がりてきわめて高い認識率を有しながらしかも安価な音
声メツセージ識別方式を実現することができるという利
点ケ有するものである。

また特許請求の範囲第９項記載の併合発明にありては、
標準パターンの記録動作時に同一の音声メッセー！；を
異なる態様で複数回入力することにより形成される複数
個の入カバターンをそれぞれ一定時間間隔ごとに時分割
して、各時分割された区間のうち、符号が変動しない区
間については当該変動しない符号を核パターンとして割
り当て、符号が変動する区間についてはすべて第８の符
号全開り当てて、この第８の符号と核パターンとにより
基本パターンを作成し、符号が変動する区間のうち、符
号が第１の符号になり得ない区間については、第２の符
号からなる分岐パターン？基本パターンに付加し、符号
が第２の符号になり得ない区間については、第１の符号
からなる分岐パターン？基本パターンに付加し、基本パ
ターンと分岐パターンとを標準パターンとして予め記録
しておくようにしたものであるから、同一の音声メッセ
ージケ発声者を変えながら複数回登録したり、あるいは
同一の発声者が発声の態様を変えながら同一の音声メツ
セージを複数回登録したりすることにより、各音声メツ
セージに共通する性質を基本パターンとして自動的に抽
出することができ、筐た各音声メツセージに共通しない
特異な性質全分岐パターンとして自動的に基本パターン
に付加することができ、分岐照合処理を行なう標準ｌ＼
ターンの作成作業を着しく容易にすることができるとい
う利点を有するものである０なお上記音声メツセージ識別方式において、第１、第２
．および第８の符号として有声音、無声音、および無音
に対応する符号を使用したり、高域有声音、低域有声音
、および中域有声音に対応する符号を使用したりするよ
うにすれば、音声の構造に応じ次照合動作を行なうこと
ができるので認識率？著しく高めることができるもので
ある。

【図面の簡単な説明】

第１図は従来例のブロック図、第２図（ａ）　（ｂ）は
同上の動作波形図、第８図は本発明の一実施例の全体構
成を示すブロック図、第４１囚（ａ）　（ｂ）　Ｆｉ同
上の波形整形処理部の動作を示す波形図、第５図は同上
の波形整形処理部の納作會示す流れ図、第６図は同上の
コンポジット符号化処理部の動作ケ示すフ０−チＰ−ト
、第７図（ａ）　（ｂ）は同上の符号化処理部のブロッ
ク図、第８図は同上の階層化処理部の動作を示す流れ図
、第９図は同上の正規化処理部の動作全示す流れ図、第
１θ図（ａ）　（ｂ）は距離計算照合部の動作を示す波
形図、第１１図は音声の特Ｉ７を階層化して示した図、
第１２図は音声の周波数スペクトルを示す図、第１８図
（ａ）　（ｂ）は音声から抽出した信号の波形図、第１
４図は本発明の分岐照合処理の原理を示す図、第１５図
は音声の第１階層リストを示す図、第１６図（ａ）〜（
ｄ）は音声の再２階層リストを示す図、第１７図は音声
の標準へターンを作成する装置の動作を示す流れ図、第
１８図（ａ）　（ｂ）（ｃ）は学習登録方式の原理を示
す図、第１９図は学習登録方式の動作を示す図、第２０
図は本発明における登録処理部の動作？示す流れ図、第
２１図は同上の非学習登録処理の動作？示す流れ図、第
２２図は同上の音声分析部の回路図、第２３図は母音／
ａ〆／ｉ〆／ｅ／の第１ホルマントの周波数分布？示す
図、第２４図は本発明の判定処理部の動作を示す流れ図
である。＋５１　＋６１　ＨＨはフィルタバンクＡ輔り
け柳準バターシメ七り、（４ｅけ登録欠を連部である。代理人　弁理士　　石　１）長　七第１７図 −７０６− 第２２図０　　　　　　　　　５００Ｈｚ　　　　　　　　　Ｉ
ＫＨｚ第２４ｘ手続補正書（自発）昭和５６年１２月２８日１、事件の表示昭和５６年特許願第１９３５５６号２、発　明の名称音声メツセージ識別方式３、補正をする者　事件との関係　特許出願人件　　所
　　大阪府門真市太字門真１０４８番地名　称　（５８
３）松下電工株式会社代表者神　前　善　− ４、代理人郵便番号　５３０５、補正命令の日付自　　　　　発訂　　　　　正　　　　　書出願番号　特許１召５６−１９３５５６Ｊｉ３′１、本
顯明Ｍ書第２８頁第１５行目の全文を次のように訂正致
します。［きるものである。第２５図（ａ）は母音／　ａ　／、
／　ｉ　／、／ｕ／、／　ｅ　／、１０／の調音点を示
しており、同図（ｂ）は母音の第１ホルマントと第２ポ
ルマントの周波数分布を示している（電子通信学会（三
浦博士監修）「新版聴覚と音声」のｐ３６３〜ｐ３６４
より引用）。また第２６図は日本語の母音の第１ホルマ
ントお裏び第２ホルマントの分布を男声および女声の場
合について各別に示したものである。第２５図（ｂ）お
工び第２６図に示された第２ホルマシトの分布を見れば
明らかなように約０．８〜１．８　ＫＨｚの帯域フィル
タと約１．８〜３゜２　ＫＨｚの帯域フィルタの出力と
を分析すれば、第２ホルマントの位置を検出することが
でき、これによって舌の位置の前後に対応した特徴をも
抽出することができるものである。もっともそこまで微
視的な特徴を抽出しなくてもＪ２、　１ｒｉＪ　ｌ第４３頁第９行目の「ものである。」の後に次の文全挿入致します。［さらに入力パターンと標準パターンとの一致度合を各
サンプルごとに対応する点数＋１．　０、−１で評価し
、合計点数でヤＪ定することも可能である。第４表はか
かる点数付けの方法を示すものであり、その基本的な考
え方は上述の３値化された符号同士の相互相関＆数６計
算する場合とほとんど同じである。しかして第４表の規
則に従って点数付けを行ない、各サシづル毎に計算した
点数の総計が予め定められた所定値以上であるときには
一致すると判定し、所定値以下であるときに＃−ｔ一致
しないと判定するものである。したがってサンプルの合
計が１０００であるとすると、パターンが完全に一致し
たときには点数の合計は１０００となるものである。第４表」３、同上第４９負第１行目の［である。］の前に「、第
２５図（ａ）は母音の調音点を示す図、同図（ｂ）およ
び第２６図は第１ホルマントおよび第２ポルマントの周
波数分布を示す図」を挿入致し捷す。４、添付図面中、第２５図および第２６図を別紙のよう
に追加致します。代理人　弁理士　　石　１）長　七（４）第２５図（ｂ）＋１ホルマ斗第２６図１本ルマシト　　（ＫＨｚ）

Claims

【特許請求の範囲】ｉｌ＋　　音声入力から異なる周波数成分を取り出すフ
ィルタの差信号出力が第１の基準値以上のときには第１
の符号？、第２の基準値以下のときには第２の符号を、
第１の基準値以下でかつ第２の基準値以上のときにＦｉ
第８の符号？それぞれ割り当てることにより、入力され
た音声メツセージに対して第１　、第２　、第８の各符
号の時系列からなる入力パターンケ作成し、この人カバ
ターシを予め記録されている複数種の標準パターンと照
合して入カバターシとの距離が最小となる標準パターン
を入力メツセージとして識別する方式において、同一の
音声メツセージを異なる態様で複数回入力したときに最
も高い確率で生じる入カバターンを基本パターンとし、
基本パターンよりも低い確率で生じる入カバターンを派
生パターンとし、この派生パターンと上記基本パターン
とのパターンが一致しない部分を基本パターンから分岐
する分岐パターンとして予め記録し、入力バター：、Ｉ
を基本パターンと照合して符合しないときには基本パタ
ーンと分岐パターンとの組合せによって生じる派生パタ
ーンを人カバターンと照合するような分岐照合処理の可
能な標準バター、７を設けて成ることを特徴とする音声
メツセージ識別方式。（２１有声音のエネルギが集中するｌＫＨ２以下の低周
波成分を抽出するフィルタと、無声音のエネルギが集中
する２　ＫＨｚ　”　１２ＫＨｚの高周波成分を抽出す
るフィルタとの差信号出力により、有声音。無声音、および無音の８也の符号の時系列からなる入カ
バターンを作成して、標準パターンと照合するようにし
て成ることを特徴とする特許請求の範囲第１項記載の音
声メツセージ識別方式。（３）有声音の区間においては、母音／ａ／のような高
域有声音のエネルギが集中する５００Ｈｚ〜ｌＫＨ２の
成分を抽出するフィルタと、母音／ｉ／のような低域有
声音のエネル手が集中する５００Ｈｚ以下の成分を抽出
するフィルタの差信号出力により、高域有声音、低域有
声音、および中域有声音の８種の符号の時系列からなる
入カバターンを作成して、標準パターンと照合するよう
にして成ることを特徴とする特許請求の範囲第２項記載
の音声メツセージ識別方式。（４）基本パターンを構成する有声音、無声音。および無音の時系列の中に、継続時間の短い無声音が含
まれている場合には、当該無声音の部分全無音に置き換
える分岐パターン全基本パターンに付加して成ること全
特徴とする特許請求の範囲第２項記載の音声メツセージ
識別方式。（１１）有声音区間の基本パターン？構成する高域有声
音、低域有声音、および中域有声音の時系列の中に、高
域有声音から低域有声音に遷移する時系列がある場合に
は、当該時系列を高域有声音から中域有声音に遷移する
時系列および中域有声音から低域有声音に遷移する時系
列のいずれにも置換し得るような分岐パターン全基本パ
ターンに付加して成ることを特徴とする特許請求の範囲
第８項記載の音声メツセージ識別方式。（６）有声音区間の基本パターン？構成する高域有声音
、低域有声音、および中域有声音の時系列の中に、低域
有声音から高域有声音に遷移する時系列がある場合には
、当該時系列を低域有声音から中域有声音に遷移する時
系列および中域有声音から高域有声音に遷移する時系列
のいずれにも置換し得るような分岐パターンを基本パタ
ーシに付加して成ることを特徴とする特許請求の範囲第
８項記載の音声メツセージ識別方式。（７）有声音区間の基本パターンを構成する高域有声音
、低域有声音、および中域有声音の時系列の中に高域有
声音が含まれている場合には、低域有声音を上記高域有
声音の前、後、および前後双方のうちいずれかに付加し
た時系列を作成するような分岐パターシを基本パターン
に付加して成ることを特徴とする特許請求の範囲第８項
記載の音声メツセージ識別方式。（８）基本パターン？構成する有声音、無声音。および無音の時系列の中に、無声音と無声音に挾まれた
短い有声音がある場合、および無声音と無音に挾まれた
短い有声音がある場合には、当該有声音の部分を無声音
に置き換える分岐パターンを基本パターンに付加して成
ることを特徴とする特許請求の範囲第２項記載の音声メ
ツセージ識別方式０（９）　　音声入力から異なる周波数成分を取り出すフ
ィルタの差信号出力が第１の基準値以上のときには第１
の符号を、第２の基準値以下のときには第２の符号を、
第１の基準値以下でかつ第２の基準値以上のときには第
８の符号をそれぞれ割り当てることにより、入力された
音声メツセー、；に対して第１．第２．第８の各符号の
時系列からなる入力バター：／に作成し、この入カバタ
ーンを予め記録されている複数種の標準パターンと照合
して入カバターンとの距離が最小となる標準パターンを
入カメ・リセージとして識別する方式において、標準パ
ターンの記録動作時に同一の音声メツセージを異なる態
様で複数回入力することにより形成される複数個の入カ
バターンをそれぞれ一定時間間隔ごとに時分割して、各
時分割された区間のうち、符号が変動しない区間につい
ては当該変動しない符号を核パターンとして割り当て、
符号が変動する区間についてはすべて第３の符号を割り
当てて、この第８の符号と核パターンとにより基本パタ
ーンを作成し、符号が変動する区間のうち、符号が第１
の符号になり得ない区間については、第２の符号からな
る分岐パターンを基本パターシに付加し、符号が第２の
符号になり得ない区間については、第１の符号からなる
分岐パターン全基本パターシに付加し、基本バターシと
分岐パターンとを標準バターシとして予め記録して、入
カバターンを基本パターンと照合して符合しない場合に
は基本パターンと分岐パターシとの組合せによって生じ
る派生パターンを人カバターンと照合するような分岐照
合処理を行なうようにして成ることを特徴とする音声メ
ツセージ識別方式。