JPH0477798A - 周波数包絡線成分の特徴量抽出方法 - Google Patents

周波数包絡線成分の特徴量抽出方法

Info

Publication number
JPH0477798A
JPH0477798A JP2191424A JP19142490A JPH0477798A JP H0477798 A JPH0477798 A JP H0477798A JP 2191424 A JP2191424 A JP 2191424A JP 19142490 A JP19142490 A JP 19142490A JP H0477798 A JPH0477798 A JP H0477798A
Authority
JP
Japan
Prior art keywords
order
signal
error signal
frequency envelope
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2191424A
Other languages
English (en)
Inventor
Satoshi Shimizu
聡 清水
Kiyohito Tokuda
清仁 徳田
Atsushi Fukazawa
深沢 敦司
Yumi Takizawa
滝沢 由美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2191424A priority Critical patent/JPH0477798A/ja
Publication of JPH0477798A publication Critical patent/JPH0477798A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力音声の特徴を抽出してその意味内容を認
識する音声認識や機械振動の特徴抽出等に利用され、そ
れら音響信号の周波数包絡線成分が持つ特徴量を抽出す
る周波数包絡線成分の特徴量抽出方法に関するものであ
る。
(従来の技術) 従来、この種の分野の技術としては、中講高好著、「信
号解析のシステム同定」初版(1988−3−25>コ
ロナ社、P、193−207に記載されるものがあった
第2図は、音声や機械の振動音等の模擬信号発生過程を
示す図である。
ピッチ信号発生部10は、周期的な繰返し波形であるピ
ッチ信号S1を発生させる機能を有し、そのピッチ信号
S1のスペクトル構造は、零周波数を原点として基本周
波数の整数倍の位置にのみエネルギーを有する線スペク
トル構造を持つ。音声の場合、ピッチ信号S1は声帯波
に相当する。
周波数包絡線フィルタ11は、ピッチ信号S1により励
振して音響信号Viを発生する機能を有する。音声では
声帯に相当する部分である。
周波数包絡線フィルタ11より発生された音響信号Vi
の周波数包路線成分を分析する際に、線形予測分析を用
いた場合、予測次数を決定しなければならない。なお、
求められた次数は、周波数包絡線成分が持つ特徴量の1
つとなり、この次数を決定する尺度の1つとしてFPE
 (F i na IPrediction  Err
or)やAIC(Akaisi  Infomatio
n  Cr1terion)がある。FPEは、 FPE (M)−σ2M・ (1+M/N)/(1−M
/N) 但し、N;データ数 M;次数 のように定義される。FPE (M)を最小にするMが
最適次数として選ばれる。AICは、AIC(M>=N
1og (2yrσ 2)十N+2(M+1> のように定義される。AIC(M)を最小にするMが最
適次数として選ばれる。
(発明が解決しようとする課題) しかしながら、上記の周波数包絡線成分の特徴量抽出方
法では、次のような課題があった。
(1)FPEは予測誤差信号が白色雑音となることを仮
定している。ところが、第2図に示す模擬信号発生過程
において発生した音声信号や機械の振動音等の音響信号
Viを予測分析した場合、予測誤差信号はそのピッチ成
分となり、仮定した条件を満たさない。従って、音声信
号や機械の振動音等の音響信号Viを分析する際にFP
Eを用いて次数を決定を行うことは、音響信号Viの分
析結果の信頼性を損うことになる。
(2)AICは、Kullback情報量を用いている
が、音声信号のような非定常な信号を短時間のデータか
ら分析する場合、その統計的性質は必ずしも信頼できる
ものではない。
前記(1)、(2)に示した問題点により、周波数包絡
線成分における正確な特徴量の抽出ができないという課
題があり、これを解決することが困難であった。
本発明は前記従来技術の持っていた課題として、正確な
特徴量の抽出ができないという点について解決した周波
数包絡線成分の特徴量抽出方法を提供するものである。
(課題を解決するための手段) 本発明は、前記課題を解決するために、線形予測法を用
いて予測次数を算出し、該予測次数に基づき音響信号の
周波数包絡線成分の特徴1を抽出する周波数包絡線成分
の特徴量抽出方法において、次のような手段を講じたも
のである。
所定の前記予測次数を用いて前記周波数包絡線成分を算
出し、前記音響信号から前記周波数包絡線成分を差引い
て予測誤差信号を生成し、前記予測誤差信号がピッチ信
号であるか否かを、前記予測誤差信号に対して前記線形
予測分析による分析を行って算出される情報エントロピ
ーの変化状態で判定するようにしたものである。
また、前記線形予測法として、最大エントロピー法を用
いてしよい。
(作用) 本発明は、以上のように周波数包絡線成分の特徴量抽出
方法を構成したので、入力される音響信号の周波数包絡
線成分を所定の次数で線形分析し、さらに、予測誤差信
号を生成する。その後、予測誤差信号を線形分析し、そ
の予測誤差信号から算出される情報エントロピーが次数
の十分である場合と不十分である場合とで急激に変化す
る性質を用いて、最適な予測次数を算出する。これによ
り、周波数包絡線成分における正確な特徴量の抽出が可
能となる。したがって、前記課題を解決できるのである
(実施例) 第1図は、本発明の実施例を示す周波数包絡線成分の特
徴量抽出方法を実施するための特徴抽出装置の機能ブロ
ック図であり、第2図と共通の要素には共通の符号が付
されている。
この特徴抽出装置は、例えば第2図に示された模擬信号
発生過程の出力である模擬信号viの特徴星を抽出する
装置であり、コンピュータの一部である第1段MEM分
析部21、包絡線成分分析部22、第2段MEM分析部
23、ピッチ周波数算出部24、及び最適次数判定部2
5で構成されている。
第1段MEM分析部21は、入力される音響信号Viの
周波数包絡線成分を最適次数判定部25より与えられた
次数iで最大エン!・ロビー法(以下、MEMという〉
により推定し、予測係数82を包絡線成分分析部22へ
出力すると共に、逆フィルタリングを行い得られた予測
誤差信号S3を第2段MEM分析部23へ出力する機能
を有している。最大エントロピー法は、1つの情報メツ
セージ当たりの平均の情報嶽であるエントロピーを最大
にするスペクI・小密度を決定する方法である。
包絡線成分分析部22は、第1段MEM分析部21より
送られた最適次数の場合の予測係数から周波数包絡線ス
ペクトルを算出する機能を有する。
また、第2段MEM分析部23は、第1段MEM分析部
21より送られた予測誤差信号S3を、さらにMEM分
析し、その予測誤差信号S3から算出される情報エント
ロピーS4を最適次数判定部25へ送ると共に、最適次
数判定部25より送られた第2段MEM分析部23の最
適次数85の予測係数86をピッチ周波数算出部24へ
送る機能を有している。さらに、最適次数判定部25は
、第2段MEM分析部23の情報エントロピーS4を基
に、第1段MEM分析部21及び第2段MEM分析部2
3に最適な次数を算出する機能を有している。ここで、
最適次数とは、音の発生過程を再現できる必要最小限の
次数である。
次に、以上のように構成される特徴抽出装置において、
最適次数判定部25における最適次数の算出方法の内、
第1段MEM分析部21に対する分析次数に関する動作
を第3図(a)、(b)を参照しつつ説明する。
例えば、第1段MEM分析部21の次数iが最適次数未
満である場合、その予測誤差信号S3にはピッチ信号S
1以外に、十分数り除くことができなかった周波数包絡
線成分が残留してしまう。
その予測誤差信号S3を第2段MEM分析部23におい
て次数を上げながら情報エンミルロビーを調べた結果を
第3図(a)に示す。この第3図(a)が示すように、
周波数包絡線成分の残留成分が予測されるため、低次で
急激な減少が観測される。
第1段MEM分析部21の次数が最適次数以上である場
合、その予測誤差信号S3にはピッチ信号S1のみが含
まれている。その予測誤差信号S3を第2段MEM分析
部23において次数を上げながら情報エントロピーS4
を調べた結果を第3図(b)に示す。この第3図(b)
が示すように、ピッチ周期に相当する次数未満まで高い
値を示し、それより高次では激減する。
したがって、第1段MEM分析部21の次数を上げてい
く際、第2段MEM分析部22の情報エントロピーS4
の変化が第3図(a)から第3図(b)に変化した時、
その時の次数が第1段MEM分析部21の最適次数とな
る。
具体的に、上記の内容を実現するための処理を、第4図
における第1段MEM分析部の最適次数算出を示すフロ
ーチャー1・を用いて説明する。
第4図において、第1段MEM分析部21の次数iを初
期値の“1′に設定する(ステップ31)。入力音響信
号Viに対して次数iによるMEM分析を行い、その予
測誤差信号S3を第2段MEM分析部23へ送出する(
ステップ32)。第2段MEM分析部23では、送られ
てきた予測誤差信号S3をさらに次数0〜jmaxの範
囲でMEM分析し、情報エントロピーS4を算出する。
その各次数の情報エントロピーを0次の値で除した結果
を正規化エントロピーとする。次数iの値を判定し、2
次以上の場合のみステップ35へ進む。
第1段MEM分析部21の次数変化による正規化エント
ロピーの変化の和を算出する(ステップ35)。これは
、上記の第3図(a)から第3図(b)への変化を検出
するためのものである。
第1段MEM分析部21において、第1段分析次数iが
分析範囲内であるかを判定する(ステップ36)。なお
、ステップ36中の数式において、iは第1段MEM分
析次数、imaxはiの上限、jは第2段MEM分析次
数、jmaxはjの上限、p(i、j)は次数が各々i
、jの時の第2段MEMの正規化エントロピーである。
ステップ36の判定結果が分析範囲内の場合は、次数i
に1加算し、ステップ32〜ステツプ36の処理を繰り
返す。ステップ35において、算出された値の内、最大
値をとるときの次数iを最適次数として出力する。これ
は、第3図(a)で示される状態が第3図(b)の状態
に変化した次数に相当する。
本実施例は、次のような利点を有している。
(1)第2図に示した模擬信号発生過程により音響信号
Viを発生させるピッチ信号S1を、第5図に示す波形
とし、周波数包絡線フィルタ11は極の位置を(角度、
半径)−(1/3π、0.98>、(−1/3π、0.
98>、(2/3π。
0.98)、  (−2/3π、0.98)とすると、
周波数包絡線フィルタ11の周波数特性は第6図に示す
ようになり、この時、発生する音響信号■iは第7図に
示すようになり、音響信号Viの周波数スペクトルは第
8図に示すようになる。この音響信号Viを分析した場
合、第1段MEIVI分析部21における最適次数は、
周波数包絡線フィルタ11の極の数と同一の4′′とな
る必要がある。
ところが、従来技術のFPE及びAICにより算出した
最適次数は、共に“10°°となり、上記の極の数II
 4 I+とは異なる結果となる。
これに対して、第1段MEM分析部21の次数を10以
下の範囲として、本発明の特徴量抽出方法を用いて、音
響信号Viを分析した場合、第1段MEM分析部21の
最適次数は周波数包絡線フィルタ11の極の数と同一の
“4′°となり、周波数包絡線成分は第9図に示すよう
になり、抽出されたピッチ信号は第10図に示すように
なる。
このように、本発明の特徴量抽出方法は、音響信号Vi
の発生過程を逆にたどることにより、音響信号Viの特
徴量を求めるものであるため、ピッチ信号S1及び周波
数包絡線フィルタの周波数特性をほぼ元どうりの波形と
して抽出することができる。
なお、本発明は、図示の実施例に限定されず、種々の変
形が可能である。その変形例として、例えば、次のよう
なものがある。
(イ)上記実施例では、線形分析法としてMEMを用い
たが、これに限定されず、例えばPARCOR分析法や
自己相関法等を用いてもよい。
(ロ)上記実施例では、情報エントロピーの変化状態と
して第3図(a>、(b)に示すような変化を用いたが
、本発明の趣旨に沿ったものであれば、これに限定され
ず、他の変化状態でもよい。
(発明の効果) 以上詳細に説明したように、本発明によれば、所定の予
測次数を用いて周波数包絡線成分を算出し、音響信号か
ら周波数包絡線成分を差引いて予測誤差信号を生成する
。さらに、その予測誤差信号がピッチ信号であるか否か
を、情報エントロピーの変化で判定し、音響信号の発生
過程を逆にたどることにより、音響信号の特徴量を求め
るようにした。そのため、ピッチ信号をほぼ元通りの波
形として抽出することができ、正確な周波数包絡線成分
の特徴量の抽出を行うことができる。
また、線形予測法として最大エントロピー法を用いれば
、スペクトル推定において周波数分解能の点で優れた効
果が期待できる。
【図面の簡単な説明】
第1図は本発明の実施例を示す特徴量抽出方法を実施す
るための特徴量抽出装置の機能ブロック図、第2図は模
擬信号発生過程を示す図、第3図(a)、(b)は情報
エントロピーの変化を示す図、第4図は第1段MEM分
析部の最適次数算出を示すフローチャート、第5図はピ
ッチ信号を示す図、第6図は周波数包絡線フィルタの周
波数特性図、第7図は模擬音響信号を示す図、第8図は
模擬音響信号の周波数特性図、第9図は周波数包絡線成
分を示す図、第10図はピッチ信号を示す図である。 10・・・・・・ピッチ信号発生部、]1・・・・・・
周波数包絡線フィルタ、21・・・・・・第1段MEM
分析部、22・・・・・・包絡線成分分析部、23・・
・・・・第2段MEM分析部、24・・・・・・ピッチ
周波数算出部、25・・・・・・最適次数判定部、1・
・・・・・次数、Sl・・・・・七ツチ信号、Vi・・
・・・・音響信号、S2.S6・・・・・・予測係数、
S3・・・・・・予測誤差信号、S4・・・・・・情報
エントロピー、S5・・・・・・最適次数。

Claims (1)

  1. 【特許請求の範囲】 1、線形予測法を用いて予測次数を算出し、該予測次数
    に基づき音響信号の周波数包絡線成分の特徴量を抽出す
    る周波数包絡線成分の特徴量抽出方法において、 所定の前記予測次数を用いて前記周波数包絡線成分を算
    出し、 前記音響信号から前記周波数包絡線成分を差引いて予測
    誤差信号を生成し、 前記予測誤差信号がピッチ信号であるか否かを、前記予
    測誤差信号に対して前記線形予測分析による分析を行っ
    て算出される情報エントロピーの変化状態で判定するこ
    とを特徴とする周波数包絡線成分の特徴量抽出方法。 2、請求項1記載の周波数包絡線成分の特徴量抽出方法
    において、 前記線形予測法を、 最大エントロピー法とした周波数包絡線成分の特徴量抽
    出方法。
JP2191424A 1990-07-19 1990-07-19 周波数包絡線成分の特徴量抽出方法 Pending JPH0477798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2191424A JPH0477798A (ja) 1990-07-19 1990-07-19 周波数包絡線成分の特徴量抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2191424A JPH0477798A (ja) 1990-07-19 1990-07-19 周波数包絡線成分の特徴量抽出方法

Publications (1)

Publication Number Publication Date
JPH0477798A true JPH0477798A (ja) 1992-03-11

Family

ID=16274385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2191424A Pending JPH0477798A (ja) 1990-07-19 1990-07-19 周波数包絡線成分の特徴量抽出方法

Country Status (1)

Country Link
JP (1) JPH0477798A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217722A (zh) * 2014-08-22 2014-12-17 哈尔滨工程大学 一种海豚哨声信号时频谱轮廓提取方法
WO2019163701A1 (ja) 2018-02-21 2019-08-29 日本電気株式会社 システム同定装置、システム同定方法及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217722A (zh) * 2014-08-22 2014-12-17 哈尔滨工程大学 一种海豚哨声信号时频谱轮廓提取方法
WO2019163701A1 (ja) 2018-02-21 2019-08-29 日本電気株式会社 システム同定装置、システム同定方法及び記録媒体
JPWO2019163701A1 (ja) * 2018-02-21 2021-02-04 日本電気株式会社 システム同定装置、システム同定方法及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP3277398B2 (ja) 有声音判別方法
US6349277B1 (en) Method and system for analyzing voices
US10621969B2 (en) Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
US7272551B2 (en) Computational effectiveness enhancement of frequency domain pitch estimators
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
KR100552693B1 (ko) 피치검출방법 및 장치
CN1142274A (zh) 说话者辨认和确认系统
KR20060044629A (ko) 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템
Mittal et al. Study of characteristics of aperiodicity in Noh voices
US4081605A (en) Speech signal fundamental period extractor
US7643988B2 (en) Method for analyzing fundamental frequency information and voice conversion method and system implementing said analysis method
US20140200889A1 (en) System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
US6470311B1 (en) Method and apparatus for determining pitch synchronous frames
KR100766170B1 (ko) 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법
JPH0477798A (ja) 周波数包絡線成分の特徴量抽出方法
Reddy et al. Inverse filter based excitation model for HMM‐based speech synthesis system
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
Andrews et al. Robust pitch determination via SVD based cepstral methods
McCree et al. Implementation and evaluation of a 2400 bit/s mixed excitation LPC vocoder
Arroabarren et al. Glottal spectrum based inverse filtering.
Park et al. Improving pitch detection through emphasized harmonics in time-domain
Ramalho et al. New speech enhancement techniques using the pitch mode modulation model