JPH02157800A - 特徴抽出方式 - Google Patents

特徴抽出方式

Info

Publication number
JPH02157800A
JPH02157800A JP63310205A JP31020588A JPH02157800A JP H02157800 A JPH02157800 A JP H02157800A JP 63310205 A JP63310205 A JP 63310205A JP 31020588 A JP31020588 A JP 31020588A JP H02157800 A JPH02157800 A JP H02157800A
Authority
JP
Japan
Prior art keywords
order
stage
prediction error
entropy
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63310205A
Other languages
English (en)
Other versions
JP2625998B2 (ja
Inventor
Kiyohito Tokuda
清仁 徳田
Atsushi Fukazawa
深沢 敦司
Satoshi Shimizu
聡 清水
Yumi Takizawa
滝沢 由美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63310205A priority Critical patent/JP2625998B2/ja
Priority to US07/447,667 priority patent/US5142581A/en
Publication of JPH02157800A publication Critical patent/JPH02157800A/ja
Priority to US07/870,883 priority patent/US5243686A/en
Application granted granted Critical
Publication of JP2625998B2 publication Critical patent/JP2625998B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は入力信号を自己回帰モデルにより線形予測分析
を行い、最適な次数を入力信号の特徴量として抽出する
特徴抽出方式に関するものである。
(従来の技術) 従来、この種の第1の方式として、例えば安居、中島共
著「コンピュータ音声処理」秋葉出版、P2S5−16
7に開示されるものがあり、入力音声信号の特徴量とし
ては、PARCOR係数線形予測係数、零交叉回数、エ
ネルギー、自己相関関数等が用いられている。
また、入力信号の特徴量として自己回帰(AR)モデル
の次数(即ち、係数の数)を用いる第2の方式について
は、例えばステイツフ エム ケイ(Steven M
、 Kay)他「スペクトル分析−現代展望(Spec
trum Analysis −A Modern P
erspective)JIEEE記要(Procee
ding of the IEEE)、Vol、 69
゜No、11 、198111月、P1380−141
9に開示されるものがあり、その次数の決定方法として
は次のようなものである。
サンプルされたN個の入力データに次数M=1.2.・
・・、 PARモデルにあてはめ、予測誤差の2乗平均
値(パワー) a p2の最尤推定値σ1゜σ2−・・
・、σ、′が得られた時、 i)最終予測誤差(FPE: Final Predi
ction Error)ii)赤池情報基準 (AI
C;Akaike InformationCrite
rion) AIC(p)=1n(ap)  + 2(p+1)/N
     =・・=(2)iii)自己回帰伝達基準 
(CAT; CriterionAutoregres
sive Transfer function)のい
ずれかの情報量基準を用いて情報量基準が最小値をとっ
た時の次数を入力データの最適次数とする。
(発明が解決しようとする課題) しかしながら、以上述べたいずれの方式も、入力信号の
定常性が成立たない短かい入力時系列データに対しては
望ましい特徴量が得られないという問題点がある。
即ち、第1の方式では、入力信号の特徴量として、PA
RCOR係数、線形予測係数、自己相関関数を用いるた
めには、信号の定常性が要求されるが、短い時系列デー
タは非定常ランダムデータとみなされるので正しい特徴
量が得られない。また、零交叉回数、エネルギーも統計
的分散が太き(なり、技術的に満足できる特徴量が得ら
れない。
第2の方式でも、従来の次数算出方法では、例えば、次
数の値として実際の次数の値よりも太き(なり、そのた
め、この値を用いたスペクトル解析で余計な多(のにせ
のスペクトルが入りこんでしまうことなどである。即ち
、従来の次数決定方法は平均対数尤度推定法をペースと
しており、この尤度推定法は収束する正確値の存在を仮
定しているが実際の入力信号では何ら保証されない。例
えば(2)式で示されるAICの場合について考えると
、次数に比例する第2項の値が尤度に対応する第1項よ
り大きすぎるため、著しく推定精度を劣化させている。
本発明は以上述べた問題点を解決し、入力時系列データ
が短かくて定常性が保証されない場合にも正確に次数を
決定することが可能な特徴抽出方式を提供することを目
的とする。
(課題を解決するための手段) 本発明は前記問題点を解決するために、入力信号を自己
回帰モデルにより線形予測分析を行い、最適な次数を入
力信号の特徴量として抽出する特徴抽出方式において、
(a)設定される第1段次数について入力信号の予測誤
差を最小にする線形予測係数を算出する係数算出手段、
(b)前記係数算出手段からの線形予測係数に基づいて
入力信号の予測誤差信号を出力する予測誤差フィルタ、
(C)設定される第2段次数について前記予測誤差フィ
ルタの出力信号の予測誤差を最小とする予測誤差パワー
を算出するパワー算出手段、(d)前記パワー算出手段
からの予測誤差パワーに基づいて0次の予測誤差パワー
で規格化されたエントロピー値を算出するエントロピー
算出手段、(e)前記エントロピー算出手段からのエン
トロピー値に基づいて前記予測誤差信号の白色度を評価
し、白色化されたときの第2段次数を基準次数として出
力する白色度評価手段、(f)前記白色度評価手段から
の基準次数について前記エントロピー算出手段からのエ
ントロピー値が飽和しはじめる第1段次数を最適次数と
して前記係数算出手段に設定すると共に特徴量として出
力する第1段次数決定手段、及び(g)前記第1段次数
決定手段により最適次数が設定されたときに、前記エン
トロピー算出手段からのエントロピー値の変化量が所定
の閾値より大きい1又は複数の第2段次数を特徴量とし
て出力すると共にパワー算出手段に設定する第2段次数
決定手段を具備するものである。
(作用) 本発明の技術的手段は次のように作用する。第1段次数
決定手段は、予測誤差フィルタの出力信号(予測誤差信
号)の予測誤差パワーから算出されたエントロピー値(
モデルの適合度)に基づ(予測誤差信号の白色度の評価
結果及びエントロピー値の飽和特性により、最適な第1
段次数を決定し、第2段次数決定手段は最適な第1段次
数が設定されたときのエントロピー値の変化量に基づい
て1又は複数の最適な第2段次数を決定している。従っ
て、定常性の保証されない短かい入力信号の場合にも正
確に次数を決定し、決定した次数を入力信号の特徴量と
して抽出することができる。
(実施例) 以下、第1図乃至第5図を参照して本発明の詳細な説明
する。
第1図は本発明の実施例を示すブロック図である。同図
において、1は入力信号の線形予測分析を行って予測誤
差信号を出力すると共に最適な第1段予測次数(丁)を
決定して特徴量として出力する第1構造(主構造)分析
部、2は予測誤差信号の線形予測分析を行って得られた
予測誤差パワーから情報エントロピーを算出して第1構
造分析部1へ出力すると共に算出した情報エントロピー
より最適な第2段予測次数(石)を決定して特徴量とし
て出力する第2構造(残差構造)分析部である。
第1構造分析部1は、設定される第1段次数について入
力信号xkの予測誤差を最小にする予測係数a 、 ”
’を算出する第1段予測係数算出部11、算出された予
測係数(正確には線形予測係数、以下同様に予測係数と
いう)に基づいて入力信号x3の予測誤差信号e (p
、k)を出力するp次子側誤差フィルタ部12、第2構
造分析部2からの情報エントロピーh、、、に基づいて
予測誤差信号e (p、k)の白色度を評価し、白色化
されたときの第2段次数を基準次数q0として出力する
予測誤差白色度評価部13、及び基準次数q0と情報エ
ントロピーhs1qに基づいて最適な第1段次数(π)
を決定して第1段予測係数算出部11に設定すると共に
特徴量として出力する第1段次数決定部14を備える。
第2構造分析部2は、設定される第2段次数qについて
予測誤差信号e (p、k)の予測誤差を最小にする予
測係数a k+q’及び予測誤差パワーσq2を算出し
て出力する第2段予測係数算出部21、予測係数a t
+ ”’に基づいて予測誤差信号e (q、k)を出力
するq次子側誤差フィルタ部22、予測誤差パワーσq
′に基づいて情報エントロピーhN、Qを算出する情報
エントロピー算出部23、及び情報エントロピーhN、
qに基づいて最適な第2段次数石(q+ 、Q* 、・
・・)を決定して第2段予測係数算出部21に設定する
と共に特徴量として出力する第2段次数決定部24を備
える。
なお、本実施例では、第1構造分析部1及び第2構造分
析部2の2段構成のため、第2段予測係数算出部21の
予測係数算出機能と、q次子側誤差フィルタ部22とは
実際には不要であり、これらは3段以上に拡張する場合
に必要となるものである。
次に本実施例の動作を説明する。
ここでは、入力(時系列)信号Xkは入力アナログ信号
x (t)を周波数t、でサンプリングした1フレーム
当りN個のブロックデータとして考える。
まず、第1段予測係数算出部11では入力信号xkにp
次の自己回帰モデル: AR(p)、即ちルゴリズム)
と略称する。このLDアルゴリズムを用いると、 p次子側誤差フィルタの予測係数は、再帰式但し、ek
;ガウス性白色雑音、 E[e、l = O E[ek−en] = a ”δに1 E[・1 が成り立つと仮定し、次のニール・ウォーカ(Yull
−Walker)方程式(以下Y−W方程式と略称する
) 但し、γA+p;p次の平均反射係数 で算出され、p次の自己相関関数r、は、を満足するp
次子側誤差フィルタの予測係数a、%pl (k= 1
 、2.・・・、p)を算出する。
Y−W方程式の解法としてはレビンソン・ダービン(L
evinson−Durvin)アルゴリズム(以下L
Dアとして算出される。予測係数aklplを算出する
ために必要なp次の平均反射係数γ、、2は、例えば最
大エントロピー法(MEM)を用いたときには、p次の
予測誤差フィルタがZ領域で、 Ap(Z−’M+(a+ CD−”+ T p ap−
1”−目) z −1+ 、 、 、 。
”(ap−+ ”−” +γpa+ ”−” )Z−”
−”” T pZ−” ” (8)で表わされるとする
と、このp次子側誤差フィルタAp(Z−’)に定常な
入力信号X5を通過させたときの2乗平均値、即ち予測
誤差の2乗平均値を最小にするように決定する。
今、(pal)個のデータ列が(N−p)個とすると、
即ちデータ列を (xrh (1) + Xm (2) 、・・・+ X
+a (pal) ) + (m=1 + 2+ ”・
* N−p)とすると、前向きに信号を予測誤差フィル
タに通したときの予測誤差の2乗平均値工、は、+p−
11 +(a、   +γpap−1)x、(p)+x、(p
al)p−11 十ap−1Xp(N))+(ap−+  X、、(2)
l・・十at Cp−”x+m(p)”xjp”l))
となる。前方予測誤差f !1!Illを・・・・・・
(9) fp+M=all−1xm(2)十・ p−11 一+3.   xffi(p)+x、(pal)とし、
後方予測誤差b 、、、、を bp、m”XJl)+alx、、(2)+・・・+ap
−t  x、(p)・・・・・・(10b) とすると、予測誤差の2乗平均値工、は、となる。入力
信号X3の定常性が保証されているときに、後向きに信
号を予測誤差フィルタに通したときの予測誤差の2乗平
均値I2は、となる。また、定常性が成り立たなければ
工1←11であるから、■、と工2の平均 工あ・(1,+Iり/2を考え、IAを最小にするp次
の平均反射係数γ、9.は、 aIAlaγえ9.=0 とすると、 ・・・・・・(10a) となる。
(6)式、(7b)式及び(13)式より予測係数a 
、 + pが算出されて、p次子側誤差フィルタ部12
へ送られる。
次にp次子側誤差フィルタ部12では、第1段予測係数
算出部11で同時に算出されたp次の予測誤差フィルタ
の予測係数a%pl (k= 1 、2.・・・p)を
有する予測誤差フィルタとN個の入力信号Xkを再度畳
込み予測誤差信号e (p、k)を算出する。即ち、(
4)式を変形した次式より算出され、第2段予測係数算
出部21及びq次子側誤差フィルタ部22へ送られる。
q次の予測誤差フィルタ部22では、p次の予測誤差フ
ィルタ部12と同様にして予測誤差信号e (q、k)
を出力する。
次に情報エントロピー算出部23では、第2段予測係数
算出部21からの予測誤差パワーa q2に基づいて各
次数での情報エントロピーを算出する。
今、q次の予測誤差フィルタで推定した予測誤差信号e
 (p、k)のバフ−スペクトルを5Q(f)、ナイキ
スト周波数をf、4=fs/2とすると、エントロピー
密度h a + qは、 第2段予測係数算出部21では、第1段予測係数算出部
11と同様にしてq次の予測係数b k”’を算出する
と共に、同様にして得られたq次の平均反射係数γA+
Qと次式の再帰式よりq次の予測誤差パワーσ、′を算
出する。
σq2=σ、−、2(1−γえ、q′)・・・・・(1
5)となる。また(15)式は と表わされ、この(17)式よりエントロピー密度り0
9.は ・・・・・(18) であるから、定数項を除去し、更に、0次の予測誤差パ
ワーσ。′で規格化したエントロピー密度より情報エン
ロトピー密度hs+qは hN+q”hlllq−−ノn(ao”/2fN)で算
出され、予測誤差白色度評価部13、第1段次数決定部
14及び第2段次数決定部24へ送られる。
予測誤差白色度評価部13では、第1段次数p(即ち第
1段予測係数算出部11の次数p)をパラメータとして
第2段次数q(即ち第2段予測係数算出部21の次数q
)に対する情報エントロピー算出部23の出力である情
報エントロピー値り、、qを評価し、その情報エントロ
ピー値に急激な変化がなくなった次数をもって白色化さ
れたとみなす。このときの第2段次数qを第1段予測係
数算出部11の次数(即ち最適次数百)を決定するため
基準次数q0とし、これを第1段次数決定部14へ送る
第1段次数決定部14では、基準次数q0について、第
1段次数pを順次1づつ増していったときの情報エント
ロピー算出部23の出力値(即ち情報エントロピーh、
t、、)を評価し、情報エントロピー値が飽和しはじめ
る次数をもって第1段予測係数算出部11の最適次数〒
とし、これを第1段予測係数算出部11へ送ると共に特
徴量として出力する。この結果、第1段予測係数部11
により最適次数iについての予測係数ak”が算出され
、p次子側誤差フィルタ部12で3次の予測誤差フィル
タが構成されて予測誤差信号e(〒、k)が出力される
。更に、この予測誤差信号e (p、k)について、第
2段予測係数算出部21で予測誤差パワーσQ′が算出
され、情報エントロピー算出部23で情報エントロピー
h N、Qが算出されて第2段次数決定部24へ送られ
る。
第2段次数決定部24では、情報エントロピー値hN+
qの変化に着目して、その変化量Δh s + qがあ
る閾値T rl+Qを越えたものから最適次数Q (q
+ 、 q2 、  ・・・)を決定し、これを特徴量
として出力すると共に、そのうち1つを選択して第2段
予測係数算出部21へ送って設定する。
次に具体例で本実施例の動作を説明する。
予測誤差白色度評価部の動作説明するグラフを第2図に
示す。横軸は第2段予測係数算出部21の次数q、縦軸
は、情報エントロピー値を示しており、第1段予測係数
算出部11の次数pをp=lからp=10まで変化させ
て表示しである。図から明らかなように、どんなpの値
に対してもq=10〜q=100までの間には、C1=
O−(1=9までの情報エントロピーh8,9の変化に
比べて急激な変化はない。従って、同図ではq=10以
上で白色化されたとみなし、基準次数なq。=10とす
る。
第1段次数決定部14の動作を説明するグラフを第3図
に示す。同図は、いくつかの入力データに対して第2段
予測係数算出部21の次数q=loとした時、横軸を第
1段予測係数算出部11の次数p、縦軸を情報エントロ
ピー値h NIqとして表示しである。同図かられかる
ように、どんな入力データでも、情報エントロピー値が
−0,05以上で次数pに無関係に飽和しており、飽和
する次数をもって第1段予測係数算出部14の最適次数
iとする。従って、最適次数を例えば石=6とする。
第2段次数決定部24の動作を説明するグラフを第4図
に示す。横軸は第2段予測係数算出部の次数q、縦軸は
、情報エントロピーの変化量Δh N+ Q ” h 
N+ Q −h N+ 11−1を示している。ここで
、h NIq + 1”1N1q−1は各々、第2段予
測係数算出部24の次数がq、(1−1次の時の情報エ
ントロピー値である。また、Δh NI4の平均値Δh
、、0、標準偏差σ7.9を求め、ΔhH,q−σ。、
9の値を閾値T h + qとして表示しである。本デ
ータの場合、ΔhN、q=−3.22 Xl0−3  
σゎ、9=3.91X 10−”、Th、9=−7,1
3Xl0−3となっている。従って、情報エントロピー
の変化量Δh、4+qが閾値T h + Qを越えたと
きの第2段次数qを最適次数τ(q+ 、 C12、・
・・)として出力される。同図では、最高次数はq+ 
= 10. q a = 17.・・・である。
第5図に入力信号x3の解析結果(即ち特徴量の抽出結
果)を示す。同図(a)は入力信号の時間変化、同図(
b)は第1段次数pの時間変化、同図(c)は第2段次
数qの時間変化を夫々示す。各図とも横軸は時間[se
c ] 、縦軸は同図(a)では、入力電圧[V]、同
図(b)では第1段次数p、同図(C)では、第2段次
数qを示している。図から明らかなように入力信号の過
渡的変化に対応して予測次数が変化している。
以上のように、本実施例によれば次のような効果が得ら
れる。
(イ)次数決定に用いる情報量基準をエントロピー値と
したので、入力時系列信号に成る次数のモデルを仮定し
た時の適合度(あいまいさ)が正確に評価できる。
(ロ)(イ)のエントロピー値は、0次の予測誤差パワ
ーσ。′で規格化した値なので、入力時系列信号のレベ
ルに依存せず、入力時系列信号の周波数構造を反映した
次数決定ができる。
(ハ)算出された次数とエントロピー差のみに注目して
次数を決定する方法なので、入力信号の統計的性質が定
常・非定常にかかわらず、信号の次数が決定できる。
(ニ)入力信号を主構造と残差構造に分けて分析したの
で、主構造からは、伝播路特性、音声入力の場合の声道
特性が評価でき、残差構造からは、音源の基本周波数、
高調波特性等が評価できる。
(ネ)主構造及び残差構造の分析結果を信号パターンと
して、用いることにより、音源の識別が可能である。
(発明の効果) 以上詳細に説明したように本発明によれば、予測誤差信
号の予測誤差パワーより算出されるエントロピー値に基
づいて、第1段次数及び第2段次数を決定しているので
、定常性が成立たない短かい入力信号に対しても正確に
次数を決定することができる。
従って、入力信号が音声信号の場合に決定した第1段次
数及び第2段次数を特徴量として用いることにより、正
確に音声認識を行うことが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を示を構成図、第2図は予測
誤差白色度評価部の動作説明図、第3図は第1段次数決
定部の動作説明図、第4図は第2段次数決定部の動作説
明図、第5図は本実施例の特徴量の抽出結果の具体例を
示す図である。 1・・・第1構造分析部、2・・・第2構造分析部、1
1・・・第1段予測係数算出部、12・・・p次子側誤
差フィルタ部、13・・・予測誤差白色度評価部、14
・・・第1段次数決定部、21・・・第2段予測係数算
出部、22・・・q次子側誤差フィルタ部、23・・・
情報エントロピー算出部、24・・・第2段次数決定部
。 特許出願人   沖電気工業株式会社 特許出願代理人 弁理士 山本恵− 第2段予測係数算土部次数q 予測誤差白色3 第 2 図 次数pに対する情報エントロピーの飽和特性(b) F!!間[5ec) (C) 特徴】の抽出71!i果を示す図 第5図 第2段予測係数算出部次数q fiqに対する情報エントロピーの変化型の特恒第4図 手  続  補  正  書  く自  発)平成元年
4月10日

Claims (1)

  1. 【特許請求の範囲】 入力信号を自己回帰モデルにより線形予測分析を行い、
    最適な次数を入力信号の特徴量として抽出する特徴抽出
    方式において、 (a)設定される第1段次数について入力信号の予測誤
    差を最小にする線形予測係数を算出する係数算出手段、 (b)前記係数算出手段からの線形予測係数に基づいて
    入力信号の予測誤差信号を出力する予測誤差フィルタ、 (c)設定される第2段次数について前記予測誤差フィ
    ルタの出力信号の予測誤差を最小とする予測誤差パワー
    を算出するパワー算出手段、 (d)前記パワー算出手段からの予測誤差パワーに基づ
    いて0次の予測誤差パワーで規格化されたエントロピー
    値を算出するエントロピー算出手段、 (e)前記エントロピー算出手段からのエントロピー値
    に基づいて前記予測誤差信号の白色度を評価し、白色化
    されたときの第2段次数を基準次数として出力する白色
    度評価手段、 (f)前記白色度評価手段からの基準次数について前記
    エントロピー算出手段からのエントロピー値が飽和しは
    じめる第1段次数を最適次数として前記係数算出手段に
    設定すると共に特徴量として出力する第1段次数決定手
    段、 (g)前記第1段次数決定手段により最適次数が設定さ
    れたときに、前記エントロピー算出手段からのエントロ
    ピー値の変化量が所定の閾値より大きい1又は複数の第
    2段次数を特徴量として出力すると共にパワー算出手段
    に設定する第2段次数決定手段、 とを具備することを特徴とする特徴抽出方式。
JP63310205A 1988-12-09 1988-12-09 特徴抽出方式 Expired - Fee Related JP2625998B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63310205A JP2625998B2 (ja) 1988-12-09 1988-12-09 特徴抽出方式
US07/447,667 US5142581A (en) 1988-12-09 1989-12-08 Multi-stage linear predictive analysis circuit
US07/870,883 US5243686A (en) 1988-12-09 1992-04-20 Multi-stage linear predictive analysis method for feature extraction from acoustic signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63310205A JP2625998B2 (ja) 1988-12-09 1988-12-09 特徴抽出方式

Publications (2)

Publication Number Publication Date
JPH02157800A true JPH02157800A (ja) 1990-06-18
JP2625998B2 JP2625998B2 (ja) 1997-07-02

Family

ID=18002451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63310205A Expired - Fee Related JP2625998B2 (ja) 1988-12-09 1988-12-09 特徴抽出方式

Country Status (2)

Country Link
US (1) US5142581A (ja)
JP (1) JP2625998B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09258795A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> ディジタルフィルタおよび音響符号化/復号化装置
JP2009025497A (ja) * 2007-07-18 2009-02-05 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体
JP2009025496A (ja) * 2007-07-18 2009-02-05 Nippon Telegr & Teleph Corp <Ntt> 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
US6032113A (en) * 1996-10-02 2000-02-29 Aura Systems, Inc. N-stage predictive feedback-based compression and decompression of spectra of stochastic data using convergent incomplete autoregressive models
SG99314A1 (en) * 2000-07-19 2003-10-27 Ct For Signal Proc Nanyang Tec Method and apparatus for the prediction of audio signals
WO2002067246A1 (en) * 2001-02-16 2002-08-29 Centre For Signal Processing, Nanyang Technological University Method for determining optimum linear prediction coefficients
WO2011118977A2 (ko) * 2010-03-23 2011-09-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US9583115B2 (en) 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS5853358B2 (ja) * 1980-03-31 1983-11-29 株式会社東芝 音声分析装置
US4378469A (en) * 1981-05-26 1983-03-29 Motorola Inc. Human voice analyzing apparatus
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
US4847906A (en) * 1986-03-28 1989-07-11 American Telephone And Telegraph Company, At&T Bell Laboratories Linear predictive speech coding arrangement
US4961160A (en) * 1987-04-30 1990-10-02 Oki Electric Industry Co., Ltd. Linear predictive coding analysing apparatus and bandlimiting circuit therefor

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09258795A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> ディジタルフィルタおよび音響符号化/復号化装置
JP2009025497A (ja) * 2007-07-18 2009-02-05 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体
JP2009025496A (ja) * 2007-07-18 2009-02-05 Nippon Telegr & Teleph Corp <Ntt> 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体

Also Published As

Publication number Publication date
JP2625998B2 (ja) 1997-07-02
US5142581A (en) 1992-08-25

Similar Documents

Publication Publication Date Title
Hossan et al. A novel approach for MFCC feature extraction
US7016833B2 (en) Speaker verification system using acoustic data and non-acoustic data
US4908865A (en) Speaker independent speech recognition method and system
RU2731372C2 (ru) Способ и система для разложения акустического сигнала на звуковые объекты, а также звуковой объект и его использование
Ali et al. Automatic speech recognition technique for Bangla words
Singh et al. Vector quantization approach for speaker recognition using MFCC and inverted MFCC
US5651094A (en) Acoustic category mean value calculating apparatus and adaptation apparatus
US8831942B1 (en) System and method for pitch based gender identification with suspicious speaker detection
JPH0990974A (ja) 信号処理方法
US5907826A (en) Speaker-independent speech recognition using vowel/consonant segmentation based on pitch intensity values
JPH02157800A (ja) 特徴抽出方式
Gamit et al. Isolated words recognition using mfcc lpc and neural network
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
Badran et al. Speaker recognition using artificial neural networks based on vowel phonemes
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
JP4362072B2 (ja) 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体
JP2001083978A (ja) 音声認識装置
EP0190489B1 (en) Speaker-independent speech recognition method and system
Upadhyay et al. Analysis of different classifier using feature extraction in speaker identification and verification under adverse acoustic condition for different scenario
JPH01302300A (ja) 自己回帰モデル自動次数決定方法
Buza et al. Algorithm for detection of voice signal periodicity
KR100721558B1 (ko) 신호 처리 방법과, 그를 이용한 성대신호 특징추출 장치 및그 방법
JPH0477799A (ja) ピッチ信号の特徴量抽出方法
Smith et al. Speech Modelling: Models, Parameter Estimation and Its Application to Speech Enhancement
JPH06324696A (ja) 音声認識装置及び方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees