JPS59174899A

JPS59174899A - 音声過渡点検出方法

Info

Publication number: JPS59174899A
Application number: JP58049766A
Authority: JP
Inventors: 曜一郎佐古; 雅男渡; 誠赤羽; 平岩　篤信
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1983-03-25
Filing date: 1983-03-25
Publication date: 1984-10-03
Also published as: JPH0552511B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声認識に使用して好適な音声過渡点検出方法
に関する。

背景技術とその問題点音声認識においては、特定話者に対する単語認識による
ものがすでに実用化されている。これは認識対象とする
全ての単語について特定話者にこれらを発音させ、パン
トノやスフィルタパンク等によりその音響・！ラメータ
を検出して記憶（登録）しておく。そして特定話者が発
声したときその音響・ぐラメータを検出し、登録された
各単語の音響・ぐラメータと比較し、これらが一致した
ときその単語であるとの、認識を行う。

このような装置において、話者の発声の時間軸が登録時
と異なっている場合には、一定時間（５〜２０　ｍ５ｅ
ｃ　）毎に抽出される音響ノクラメータの時系列を伸縮
して時間軸を整合させる。これによって発声速度の変動
に対処させるようにしている。

ところがこの装置の場合、認識対象とする全ての単語に
ついてその単語の全体の音響・セラメータをあらかじめ
登録格納しておかなければならず、膨大な記憶容量と演
算を必要とする。このだめ認識語い数に限界があった。

一方音韻（日本語でいえばローマ字表記したときのＡ、
Ｉ　、Ｕ、Ｅ、０．に、Ｓ、Ｔ等）あるいは音節（ＫＡ
、ＫＩ　、ＫＵ等）単位での認識を行うことが提案され
ている。

しかし、各音節ごとに離散的に発音された音声を登録し
、離散的に発声された音声を単語認識と同様に時間軸整
合させて認識を行っておシ、特殊寿発声を行うために限
定された用途でしか利用できなかった。

さらに不特定話者を認識対象とし２だ場合には、音響・
ぐラメータに個人差による大きな分散があり、上述のよ
うに時間軸の整合だけでは認識を行うこ□とができない
。そこで例えば一つの単語について複数の音響・セラ′
メータを登録して近似の音響・ぞラメータを認識する方
法や、単語全体を固定次元の・ぞラメータに変換し、識
別函数によって判別する方法が提案されているが、いず
れも膨大な記憶容量を必要としたシ、演算量が多く、４
識語い数が極めて少くな゛らてしまう。

これに対して本願発明者は先に、不特定話者に対しても
、容易かつ確実に音声認識を行えるようにした新規な音
声認識方法を提案した。以下にまずその一例について説
明しよう。

ところで、音韻の発声現象を観察すると、母音や摩擦音
（８，Ｈ等）等の音韻は長く伸して発声することができ
る。例えば゛はい″という発声を「無音→Ｈ−＋Ａ→■
→無音」に変化する。これに対して同じ゛はい″の灸、
声を第１図Ｂのように行うこともできる。ここでＨ，Ａ
、Ｉの準定常部の長さは発声ごとに変化し、これによっ
て時間軸の変動を生じる。ところがこの場合に、各音韻
間の過渡部（斜線で示す）は比較的時間軸の変動が少い
ことが判明した。

そこで第２図において、マイクロフォン（１）に供給さ
れた音声信号がマイクアンプ（２３５，５ｋＨｚ以下の
ローパスフィルタ（３）を通じてＡＤ変換回路（４）に
９１８給される。まだクロック発生器（５）からの１２
．５ｋｌ−（ｚ　（８０μｓｅｃ間隔）のサンプリング
クロックがＡＩ）変換回路（４）に供給され、このタイ
ミングで音声（ｊ号がそれぞれ所定ビット数（＝１ワー
ド）のデノタル信号に変換される。この変換された音声
信号が５×６４ワードのレジスタ（６）に供給される。

１だクロック発生器（５）からの５．１２　ｍ５ｅｃ間
隔のフレームクロックが５進カウンタ（力に供給され、
このカウント値がレジスタ（６）に供給されて音声信号
が６４ワードずつシフトされ、シフトされた４×６４ワ
ードの信号がレジスタ（６）から取り出される。

このレジスタ（６）から取り出された４Ｘ６４　＝　２
５６ワードの信号が高速フーリエ変換（ＦＥＴ）回路（
８）に供給される。ここでこのＦＥＴ回路（８）におい
て、例えばＴの時間長に含まれるｎ（個のサンブリング
データによって表される波形函数をＵ　ｎ　（ｔ（ｆ）　　　　　　　　　　　　　・・・
・・・・・・・・・・・・（１）としたとき、これをフ
ーリエ変換して、＝　Ｕ　ｘｎ　ｆｔ（ｆ）十ｊ　Ｕｚ
ｎ　（ｔ（ｆ）　　　　・・・・・・・・・・・・・・
・（２）の信号が得られる。

さらにこのＦＢ／Ｔ回路（８）からの信号がパワースペ
クトルの検出回路（９）に供給され、ｌ　Ｕ　２１　＝　ｔｙ？ｎ　ｆｔ（ｆ）　＋　Ｕｒｎ
　ｆｔ（ｆ）　　　　−−−−−−（３）のノセワース
ペクトル信号が取り出される。ここでフーリエ変換され
た信号は周波数軸上で対称になっているので、フーリエ
変換によって取シ出されるｎ（個のデータの半分は冗長
データである。そこで半分のデータを排除して−ｚｎ（
個のデータが取り出される。すなわち上述のＦＥＴ回路
（８）Ｋ供給された２５６ワードの信号が変換されて１
２８ワードの／４’ワースベクトル信号が取り出される
。　　゛この／４’ソースベクトル信号がエンファシス
回路（Ｉｏｌに供給されて聴感上の補正を行うだめの重
み付けが行われる。ここで、重み付けとしては、例えば
周波数の高域成分を増強する補正が行われる。

この重み付けされた信号が帯域分割回路αＮ）に供給さ
れ、聴′感特性に合せた周波数メルスケールに応じて例
えば３２の帯域に分割される。ここでツクワース被りト
ルの分割点と異なる場合にはその信号が各帯域に按分さ
れてそれぞれの帯域の信号の量に応じた信号が取シ出さ
れる。これによって上述の１２８ワードの・ぐワースベ
クトル信号が、音響的特徴を保存したまま３２ワードに
圧縮される。

この信号が対数回路０２１に供給され、各信号の対数値
に変換される。これによって上述のエンファシス回路（
１０）での重み付は等による冗長度が排除される。ここ
でこの対数／ぞワースベクトル”ｇ　Ｉ　Ｕｎｌｒ（ｆ
）　Ｉ　　　　　　　　　　　・・・・・・・・・・・
・・・・（４）をスペクトルパラメータｘに）（ｉ＝ｏ
、ｔ・・・３１）と称する。

このスペクトルパラメータＸ（ｉ）が離散的フーリエ変
換（ＤＦＴ）回路（１３１に供給される。ここで、この
ＤＦＴ回路０階において、例えば分割された帯域の数を
Ｍとすると、このＭ次元スペクトル・ぐラメータｘ（Ｈ
）　（ｉ　＝　０　、１−Ｍ−１）を２Ｍ点ノ′寿数対
称−８う７−タとみなしてＤＦＴを行う。従って、但し
、釦Δ＝ｅ１３“２０１９Ｍｍ　＝　Ｑ　、　ｌ　、−・、　２Ｍ−１となる。さら
にこのＤＦＴを行う函数は偶函数と仏なされるためＷ呪＝邸（上枝りとなシ、これらよシとなる。このＤ　Ｆ　Ｔにょ９スペクトルの包絡特性を
表現する音・讐パラメータが抽出される。

このようンｃして１）　Ｆ　Ｔされたスペクトラム・？
ラメータＸ（ｉ）について、０−Ｐ−１（例えばＰ−８
）次までのＰ次元の値を取シ出し、これをローカル・セ
ラメータＬ（ｐ＋−（ｐ　＝　ｏ、　１．・・・、ｐ−
１）とすると・・・・・・・・・・・・・・・（力となシ、ここでスペクトルパラメータが対称であること
を考慮してＸ（ｉ）　”　Ｘ　（２トｉ−１）　　　　　　　　　
・曲・曲回・（８）とおくと、ローカル・リメータＬω
）はＬω）＝１蛋。Ｘ（ｉ）（ａｘ−□十−澄〜ｘ、町
（９）但し、ｐ＝ｏ、１．・・・、Ｐ−１となる。このようＫして３２ワードの信号がＰ（例えば
８）ワードに圧縮される。

このローカルノ母うメータＬω）がメモリ装置Ｏａに供
給される。このメモリ装置（Ｉ４）は１行Ｐワードの記
憶部が例えば１６行マ）　リクス状に配されたもので、
ローカル・リメータＬ（ｐ）が各次元ごとに順次記憶さ
れると共に、上述のクロック発生器（５）からの５．１
２ｍ　ｓ　ｅ　ｃ間隔のフレームクロックが供給されて
、各行のノやラメータが順次横方向ヘシフトされる。こ
れＫよってメモリ装置（１４１には５．１２　ｍ５ｅｃ
間隔のＰ次元のローカルノやラメータＬ（ｐ）が１６フ
レーム（８１，９２ｍ５ｅ（）分記憶され、フレームク
ロックごトＫ　＄　次新しい・ぐラメータ例更新される
。

さらに例えばエン７アシス回路ａＯＩがらの信号が音声
過渡点検出回路（イ）に供給されて音韻間の過渡点が検
出される。

この過渡点検出信号ＴＩ　ｔ）がメモリ装置（１４）に
供給され、この検出信号のタイミングに相当するローカ
ルノｅラメータＬ（１）が８番目の行にシフトされた時
点でメモリ装置ミルの読み出しが行われる。ζこでメモ
リ装置０４）の読み出しは、各次元Ｐごとに１６フレ一
ム分の信号が横方向に読み出される。そして読み出され
た信号がＩ）　Ｆ’　Ｔ回路０５）に供給される。

この回路（１つにおいて上述と同様にＤＦＴが行われ、
音響パラメータの時系列変化の包絡特性が抽出される。

このＤＦＴされた信号の内から０〜Ｑ−１（例えばＱ＝
３）次までのＱ次元の値を取り出す。このＤＦＴを各次
元Ｐごとに行い、全体でＰｘＱ（＝２４）ワードの過渡
点パラメータＫ（ｐ、ｑ）　（ｐ＝ｏ　、　１　。

・・・、Ｐ−ｔ　）（ｑ＝ｏｅ　Ｉｔ・・・、Ｑ−１）
が形成される。

ここで、Ｋ（０，０）は定数なので、ｐ−０のときにｑ
＝１〜Ｑとしてもよい。

すなわち第３図において、Ａのような入力音声信号（Ｉ
ＡＩ）に対してＢのような過渡点が検出されている場合
に、この信号の全体のノンワース被りトルはＣのように
なっている。そして、例えば「Ｈ→Ａ」の過渡点のパワ
ース被りトルがＤのようであったとすると、この信号か
エンファシスされてＥのようになり、メルスケールで圧
縮されてＦのようになる。この信号がＩ）　Ｆ　Ｔされ
てＧのようになシ、Ｈのように前後の１６フレ一ム分が
マトリックされ、この信号が順次時間軸を方向にＤＦＴ
されて過渡点パラメータＫ（ｐ、ｑ）が形成される。

この過渡点ノセラメータＫ（ｐ、ｑ）がマノ・マノビス
距離算出回路０Ｑに供給されると共に、メモリ装置ＣＤ
からのクラスタ係数が回路（１６）に供給されて各クラ
スタ係数とのマノ・マノビス距離が算出される。ここで
クラスタ係数は複数の話者の発音から上述と同様に過渡
点・ぐラメータを抽出し、これを音韻の内容に応じて分
類し統計解析して得られたものである。

そしてこの算出されたマノ・マノビス距離が判定回路α
砂に供給され、検出された過渡点が、何の音韻から何の
音韻への過渡点であるかが判定され、出力端子０９に取
り出される。

すなわち例えば゛はい゛いいえ”０（ゼロ）”〜゛９（
キュウ）ｎの１２単語について、あらかじめ多数（百Å
以上）の話者の音声を前述の装置に供給し、過渡点を検
出し過渡点・２ラメータを抽出する。この過渡点・やラ
メータを例えば第４図に示すようなテーブルに分類し、
この分類（クラスタ）ごとに統計解析する。図中＊は無
音を示す。

これらの過渡点・ぞラメータについて、任意のす（ａ）ンゾルＲｒ、。（ｒ＝１．１−１２４）（ａはクラスタ
指標で例えばａ　＝　１は＊　−＋　Ｉ−１、ａ　＝　
２はＨ−＋Ａに対応する。ｎは話者番号）として、共分
散マトリクスＡｒ、５＝　Ｅ　（Ｒｒ（？）ｎ−研）　（Ｒ，”、、
−ｐ）　−−−−−−＝＝　（１５１−回但し、町　−Ｅ（ａｒ（ａｌｎ）Ｅはアンサンプル平均を計数し、この逆マトリクスＢｒＬプ’　−（Ａｔ、ｕ　）ｒ、Ｓ　　　　　　　・
・・・・・・・・・・・・・・（１６）を求める。

ここで任意の過渡点・セラメータに、とクラスタａとの
距離が、マハラノビスの距離で求められる。

従って、メモリ装置０７）に上述のＢｒ、ｓ及びｐを（
ω 求めて記憶しておくことにより、マハラノビス距離算出
回路（ＩＥ９にて入力音声の過渡点・セラメータとのマ
ハラノビス距離が算出される。

これによって回路０Ｑから入力音声の過渡点ごとに各ク
ラスタとの最小距離と過渡点の１１ｈ位が取り出される
。これらが判定回路０８）に供給され、入力音声が無声
になった時点において認識判定を行う。

例えば各単語ごとに、各過渡点パラメータとクラスタと
の最小距離の平方根の平均値による単語距離を求める。

なお過渡点の一部脱落を考慮して各単語は脱落を想定し
た複数のタイプについて単語距離を求める。ただし過渡
点の順位関係がテーブルと異なっているものはリジェク
トする。そしてこの単語距離が最小になる単語を認識判
定する。

従ってこの装置によれば音声の過渡点の音韻の変化を検
出しているので、時間軸の変動がなく、不特定話者につ
いて良好な認識を行うことができる。

また過渡点において上述のようなノセラメータの抽出を
行ったと、とにより、一つの過渡点を例えば２４次元で
認識することができ、認識を極めて容易かつ正確に行う
ことができる。

なお上述の装置において１２０名の話者にて学習を行い
、この１２０名以外の話者にて上述１２単語について実
験を行った結果、９８．２％の平均認識率が得られた。

さらに上述の例で“はい”の「Ｈ−＋ＡＪと”８（ハチ
）＃の「Ｈ→Ａ」は同じクラスタに分類可能である。従
って、認識すべき言語の音韻数をαとしてαＰ２個のク
ラスタをあらかじめ計算してクラスタ係数をメモリ装置
（１７）に記憶させておけば、種々の単語の認識に適用
でき、多くの語いの認識を容易に行うことができる。

本発明は、このような装置において、検出回路（１）に
使用して好適な音声過渡点検出方法に関する。

ところで、従来の過渡点検出としては例えば音響ノラメ
ータＬ（ｐ）の変化量の総和を用いる方法がある。すな
わちフレームごとにＰ次の・２ラメータが抽出されてい
る場合に、ＧフレームのパラメータをＬ（ｐ）（’ｌ（
ｐ＝ｏ　、　ｌ・・・・・・Ｐ−１）としたときのよう
な差分量の絶対値の総和を利用して検出を行う。

ここで、例えばＰ＝１次元のときには、第５図Ａ、Ｂに
示すように・ぞラメータＬ（ｐ）（Ｇ）の変化において
ノセラメータＴ（Ｇ）のピークが得られる。

尚、上述の説明ではＬ（１）◎を連続量としたが、実際
にはこの／４’ラメータＬ（ｐ）０は離散量である。し
かし、−１このような音声捻識装置にあっては所定のＭ
フレームずつの分析で１次元・ぐラメータにおとしてお
υ急峻な変化にパラメータの値がついていけず、無音か
ら口腔内の閉鎖部に空気流を吹き付けて生ずる破裂性子
音への過渡点の検出はほとんど不可能であった。

発明の目的本発明はかかる点に鑑み、無音から破裂性子音への過渡
点の検出を良好に行なえるようにした音声過渡点検出方
法を提供せんとするものである。

発明の概要本発明音声過渡点検出方法は、入力音声信号を人間の聴
覚特性に応じて等しく重み付けして音響・セラメータを
抽出する手段と、この音響・セラメータのレベルに対し
て正規化を行う手段とを有し、この正規化された音卿・
セラメータを所定の検数フレームの組を複数組に亘って
監視し、上記音響・ぐラメータのピークを検出するよう
にしたもので、無音から破裂性子音への過渡点を良好に
検出できるようにしたものである。

実施例以下、第６図を参照じ−で本発明音声認識装置の一実施
例について説明しよう。この第６図において、第２図に
対応する部分には同一符号を付しそれらの詳細な説明は
省略する。

第６図において、第２図のエンファシス回路ｌＩＣ１）
からの重み付けされた信号が帯域分割回路ｔ２υに供給
され、上述と同様にメルスクールに応じてＮ（例え〈２
０）の帯域に分割され、それぞれの帯域の信号の量に応
じた信号Ｖω）（ｎ、＝ｏ、Ｉ・・・Ｎ−１）が取シ出
される。この信号がバイアス付き対数回路Ｃ２に供給さ
れてＶ’（ｎ）＝　ｌｏｇ　（Ｖ（ｎ）十Ｂ　）　　　　　
　　　＝・曲回面１１（Ｊｌが形成される。また信号Ｖ
（ｎ）が累積回路（ハに供給されてて τ’ａ＝　ｌｏｇ　（Ｖ２＋Ｂ　）　　　　　　　　・
・・・・・・・・四・・０υが形成される。そして、・
これらの信号が演算回路０（イ）に供給されて υ（ｎ）　＝τ′２−υ’（ｒｌ）　　　　　　　　　
　　　　・・・・・川・・・・・・・＋１２）が形成さ
れる。

ここで、上述のような信号Ｖ（。）を用いることにより
、この信号は音韻から音韻への変化に対して各法（ｎ−
Ｏｒ　１・・・・・・Ｎ−１）の変化が同程度となり、
音韻のｒ上類による変化量のばらつきを回避できる。

才だ対数をとり演算を行って正規化・２ラメータυ（ｎ
）を形成したことによシ、入力音声のレベルの変化によ
るパラメータｖｏ）の変動が排除される。さらにバイア
スＢを加算して演算を行ったことにより、仮りにＢ−＋
ωとするとノぐラメータτω）→０となることから明ら
かなように、入力音声の微少成分（ノイズ等）に対する
感度を下げることができる。

この・ξラメ−タラ（ｎ）がメモリ装置（２９に供給さ
れて２ｗ＋１　（ｗ＝４として、例えば９）フレーム分
が記憶される。この記憶された信号が演算回路（淘に供
給されて、Ｙｎ、　ｔ＝　　ｍｉｎ　　（ｔ＋（ｎ）　（Ｉ　）　
）　　　　　−−ｆ１３）６ＧＦＮ但し、ＧＦＮ＝　（Ｉ　；　−ｗ＋　ｔ≦■≦ｗ＋ｔ）
が形成され、この信号と・ぞラメータυ（ｎ）が演算回
路（２′Ｄに供給されて、が形成される。このＴＩ（ｔ）が、第１の過渡点検出・
ぞラメータであって、この第１の過渡点検出パラメータ
Ｔｘ（ｔ）が第１のピーク検出回路（２８）に供給され
て、入力音声信号の所定の音韻の過渡点の過渡魚信もが
加算回路に供給される。

また、・ぞラメータτω）がメモリ装置ｉ？＃、（２５
’）にも供給されて２（ｗ−ａ）＋１（例えばＯ（ａ　
＝　２として５）フレーム分が記憶される。この記憶−
された信号が演算回路（２６’）に供給されて、Ｙｎ、ｔ＝ｍｉｎ（ｖ（ｎ）（Ｉ））　　　　−＝曲・
・−＜１３つ！（三〇ＦＮ但し、ＧＦＮ−（Ｉ　；−（ｗ−ａ）十ｔ≦■≦（ｗ−
ａ）＋ｔ）が形成され、この信号と・セラメータυ（ｎ
）が演算回路（２７’）に供給されて、・・・−・・・・・・・・（１４’）が形成される。こと・で、ａの大きさは無音がら破裂性
子音への過渡点についても急峻に／セラメータの値が変
化して、・ぞラメータの値から過渡点が検出できるよう
な大きさとする。このＴ２（ｔ）が、第２の赤渡点検出
・セラメータであって、このＴ２（ｔ）が第２のピーク
検出回路（２８’）に供給されて、入力音声信号の例え
ば無音から破裂音への急峻な変化に係る過渡点が検出さ
れて、スイッチ回路器がオンのときには加算回路側に過
渡点が検出されたことを伝達する過渡点信号を加算回路
［有］に供給するようにする。ここで、スイッチ回路（
２９１は、次なるとき”ＯＮ″となるようにする。即ち
、演算回路（２７’）からの第２の過渡点検出・ぞラメ
ータＴ２（ｔ）がレベル検出回Ｆ！６１３υにおいて設
定しである所定の閾値を越えタトキ、モノマルチバイブ
レータ（３２よシ所定長（例えば５フレ一ム分の長さ）
の制御・千ルスを発生するようにし、この所定長の制御
ｉｊルスがスイッチ回路（２！１に供給されている間ス
イッチ回路（２ωのスイッチをオンとするようにする。

そして、第２の過渡点検出パラメータＴ２（ｔ）が所定
の閾値を越え、スイッチ回路器が−ＯＮ”となっている
間に第２のピーク検出回路（２８’）から過渡点信号が
スイッチ回路（ハ）に供給されたときには、かかる過渡
点信号が加算回路■にそのまま供給されることになる。

それゆえ第１のピーク検出回路（２印から過渡点信隻が
通常良好に発生しない、無音から破裂性子音への過渡点
についても、第２のピーク検出回路（２８’）からの過
渡点信号が加算回路□□□を経て出力端子間から取り出
されることになる。

尚、他の部分は第２図と同様の構成を採るものとする。

このように構成された本実施例に依れば、音響パラメー
タを所定の複数フレームの組に亘って複数組監視して、
第１及び第２の過渡点検出・２ラメータＴＩ（ｔ）及び
Ｔ２（ｔ）を得だ上でそれらのレベルより過渡点信号を
得るようにしたので、無音から破裂性子音への過渡点に
ついては第２のピーク検出回路（２８’）よシの過渡点
信号が出力端子（至）に供給され、無音から破裂性子音
への過渡点の検出を良好に行なえるようにできる利益が
ある。

尚、本発明は上述実施例に限らず本発明の要旨を逸脱す
ることなくその他種々の構成とできることは勿論である
。

発明の効果以上述べたように本発明音声過渡点検出方法によれば、
音響・セラメータを所定の複数フレームの組に亘って複
数組監視するようにしたので無音から破裂性子音への過
渡点の検出を良好に行なえる利益がある。

【図面の簡単な説明】

第１図〜第４図は音声認識装置の訣明のだめの図、第５
図は過渡点検出の説明のための図、第６図は本発明音声
過渡点検出方法の一例の系統図である。（１）はマイクロフオｙ、（３１はローパスフィルタ、
（４）けＡＤ変換回路、（５）はクロック発生器、（６
）はレジスタ、（７）はカウンタ、（８）は高速フーリ
エ変換回路、（９）は・ぞワースベクトル検出回路、０
■はエンファシス回路、、　（２１＋は帯域分割回路、
（２渇は対数回路、（２３１゜（２旬、いｒ　、　ＱＴ
、は演算回路、（２５）はメモリ装置、Ｃ樽、（２８つ
はピーク検出回路、（２湧はスイッチ回路、（：！Ａは
加算回路、Ｇυはレベル検出回路、Ｇｚはモノマルチ・
ぐイブレータ、（至）は出力端子である。第４凶手続補正書昭和５８年９　月　２７１：１１６′許庁長官若杉和夫殿（午４−１）午ハ′審１男Ｌ（殿）１、事ｆ′１の表小昭和５８年特許願第　４９７６６　　号２°発明Ｆ）　
名称　　　音声過渡点検出方法３、袖−正をする名。事件との関係　　　’４１’　ｉ！’ｌ出ＩＭｒｉ　人
ｆ、ｉ、ｒすｉ　東京部品用区北品用６丁１，１７番３
５号名称（２］８ｉ　　ソニー（末式会イｊ代表取締没
　大　賀　典　）１１゜５、袖止命分の１１イ・］　　　昭ｆＩＪ　　　年　　
月　　１１６、袖正により増加する発明の故７、袖　止　の　月　撃　　明細書の発明の詳細な説明
の欄。！　　Ｉ−ＩＱ　　Ｏ−、ｒ　　１（ＩＩ　　明細書中、第７頁第９行から第１０行Ｋかけ
て、「２Ｍ点の実数対称パラメータとみなしてＤＦＴを
行う。」とあるをｒ２Ｍ−１点の実数対称パラメータと
みなして２Ｍ−２点のＤＦＴを行う。」に訂正する。（２）同、第７頁第１１行において、とあるを、に訂正する。（３）　　同、第７頁第１２行を削除する。（４）同、第７頁第１３行から第１４行にかけて、ｍ＝
ｏ、ｌ、・−・、ｚＭ−１」とあるなｍ＝０．１．・ｈ、２Ｍ−３Ｊに訂正する。（５）同、第８頁第１行ないし第２行において、とある
を、に訂正する。（６）同、第８頁第４行において、とあるな、に訂正する。（７）同、第８頁第１１行において、とあるを、に訂正する。（８）同、第８頁第１２行及び第１３行を削除する。（９）　　同、第９頁第２行において、「ｘ（１）＝　
ｘ　（ｚＭ−ｉ−ｔ）　　　Ｊとあるを、「Ｘ（ｉ）＝
　Ｘ　（２Ｍ−ｉ−２）　　　Ｊに訂正する。０■　同、第９頁第４行において、・・・・・（９）」とあるを、 π’ｐ、、。十Ｘ（Ｍ−１）ＣＱＳ　−−−（９ｒＭ−Ｉ　　　　　　Ｊに訂正する。（ｉｌｌ　　同、第１０頁第１７行において、「定数な
の匂−とあるな、「音声波形の〕（ワーを表現している
のでパワー正規化のため」に訂正する。Ｏ２同、第１１頁第７行から第８行にかけて、「マトリ
ックされ」とあるな、「マトリックスされ」に訂正する
。（＋３１　　同、第１４頁第１７行において、「αＰ２
個のクラスタ」とあるを、「αＰ２個程度のクラスタ」
に訂正する。Ｏ４１同、第１９頁第１行において、とあるを、に訂正する。０９　同、第１９頁第１５行において、とあるを、に訂正する。以上

Claims

【特許請求の範囲】

入力音声信号を人間の聴覚特性に応じて等しく重み付け
して音響・９２メ一ぞを抽出する手段と、この音響パラ
メータのレベルに対して正規化を行う手段とを有し、こ
の正規化された音響・そラメータを所定の複数フレーム
の組を複数組に亘って監視し、上記音響・ぐラメータの
ピークを検出するようにした音声過渡点検出方法。