JP2707577B2 - ホルマント抽出装置 - Google Patents

ホルマント抽出装置

Info

Publication number
JP2707577B2
JP2707577B2 JP63053902A JP5390288A JP2707577B2 JP 2707577 B2 JP2707577 B2 JP 2707577B2 JP 63053902 A JP63053902 A JP 63053902A JP 5390288 A JP5390288 A JP 5390288A JP 2707577 B2 JP2707577 B2 JP 2707577B2
Authority
JP
Japan
Prior art keywords
formant
spectrum
frequency
trajectory
formants
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63053902A
Other languages
English (en)
Other versions
JPH01227200A (ja
Inventor
晋太 木村
徹 真田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63053902A priority Critical patent/JP2707577B2/ja
Publication of JPH01227200A publication Critical patent/JPH01227200A/ja
Application granted granted Critical
Publication of JP2707577B2 publication Critical patent/JP2707577B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
〔目次〕 概要 産業上の利用分野 従来の技術と発明が解決しようとする課題 課題を解決するための手段 作用 実施例 発明の効果 〔概要〕 連続音声におけるホルマントを追跡して周波数,及び
時間に関するホルマント軌跡を求めるホルマント抽出装
置に関し、 ホルマント軌跡の時間的連続性を保証し、安定に正し
いホルマント軌跡を抽出することができるホルマント抽
出装置を構成することを目的とし、n個のホルマントを
抽出するとき、該連続音声データを時間軸方向に複数の
フレームに分割し、各フレームの音声データからスペク
トル包絡を求めて、該スペクトル包絡の周波数をn次元
の超平面の座標に順序付けて割り当て、更に得られた超
平面を時間軸方向に並べてn+1次元の超立方体を構成
する手段と、上記超平面の各n次元座標点におけるホル
マント評価値を、スペクトルのピーク性,各ホルマント
の存在範囲,及び各ホルマントの位置関係を用いて求め
る手段とを設けて、上記超立方体を構成している上記複
数個の超平面上に求めた上記ホルマント評価値の大きい
点を動的計画法によって追跡し、得られた各次元の周波
数軌跡をそれぞれの次元のホルマント周波数軌跡とする
ように構成する。 〔産業上の利用分野〕 本発明は、連続音声におけるホルマントを追跡して周
波数,及び時間に関するホルマント軌跡を求めるホルマ
ント抽出装置に関する。 従来から、音声による仕分け作業,音声による残高照
会,音声ワードプロセッサ等の分野において、各種の音
声認識技術が用いられているが、例えば、予め、複数個
の単語のスペクトル時系列を登録しておいて、発声され
た単語音声のスペクトル時系列とパターンマッチングに
よって認識する方式では、伝送系等において重畳される
雑音,或いは、該伝送系の周波数特性に影響される問題
があることから、該伝送系等で重畳される雑音とか、該
伝送系の周波数特性に余り影響されない音声の特徴パラ
メータであるホルマント周波数軌跡の照合によって正し
い単語を認識する音声認識方式が望まれる。 この場合,該連続音声の特徴パラメータであるホルマ
ント周波数軌跡を正確に抽出できることが必要とされ
る。 〔従来の技術と発明が解決しようとする課題〕 第6図は従来のホルマント抽出装置の構成例を示した
図である。 先ず、マイクロホンから連続音声のアナログ電気信
号がアナログディジタル変換部(以下、AD変換部と云
う)に入力されると、毎秒8K Hzから20K Hz程度で標
本化され、その振幅が8ビットから16ビット程度に量子
化される。 該AD変換部の出力は{Xnn=0,N-1と云う時系列デ
ータとして記述できる。該時系列データが次の自己相関
分析部に入力されることにより、数msから数十ms毎
に、数十ms程度の分析区間内の音声データの自己相関関
数{σi=0,M-1が式Iによって計算される。 ここで、Mは自己相関の最大次数 iは自己相関の次数 上記の式Iで、{ωk=0,L-1は分析区間切り出し時
の影響を取り除く窓関数であって、例えば、ハニング窓
や、ハミング窓等が用いられる。 又、Lは該分析区間内の音声サンプル数であり、上記
AD変換部でのサンプリング周波数がfs Hz,区間長をτ
秒とした場合、式IIの関係が成り立つ。 L=τ・fs ……(式II) のLPC分析部では、上記自己相関関数である
{σi=0,pより、音声波形の線形予測係数(LPC)
{αi=1,pを式IIIを用いて計算する。 該式IIIの計算は、例えば、公知のレビンソン(Levin
son)法を用いると効率的に行うことができる。尚、該
式IIIでpはLPC分析の次数であり、上記AD変換部での
標本化周波数fsが10k Hzの場合、該pは12程度が用いら
れる。 はスペクトル包絡分析部であって、LPC分析部で
計算した{αi=0,pよりスペクトル包絡{Ε
k=0,Rを式IVを用いて計算する。但し、α=1,R(L/
2)+1である。 上記の式IV中で、‖は虚数単位で‖=−1である。
第7図は上記のようにして求めた一般のスペクトル包絡
の例を示した図である。 ピーク抽出部においては、上記スペクトル包絡のピ
ークを検出し、その位置をホルマント周波数として出力
する。上記第7図に示したスペクトル包絡において、ピ
ークの周波数の低い方から第1ホルマント,第2ホルマ
ント,第3ホルマント,・・と呼ばれる。 第8図は従来技術でのホルマント抽出例を示した図で
ある。 上記連続音声は、前述した短区間LPCスペクトル包絡
の時系列(フレーム列)として表現できるが、該スペク
トル包絡の時系列からホルマントを上記ピークを検出し
て抽出すると、その時間的な連続性が保証されず、本来
滑らかな軌跡を描くべきホルマントが不連続な線として
抽出されてしまうと言う問題があった。 又、雑音などの影響で本来のホルマントではないスペ
クトル上に現れたピークをホルマントとして抽出してし
まう問題があった。 上記問題点を解決する方法の一つとして、例えば、本
願出願者は、特願昭56-178021号において、連続音声に
ついて、LPC分析を用いて音声波のスペクトル包絡を算
出した場合、該ホルマントが周波数軸方向に移動すると
きは、そのバンド幅が広くなり、又移動しない時は、そ
のバンド幅が狭くなることに着目し、該ホルマントの連
続性を仮定して、時間的に過去から未来方向に(又は、
その逆に)ホルマント軌跡を追跡する方式を開示してい
るが、安定に正しいホルマント軌跡が抽出できる完全な
方式が開発されていないのが現状である。 本発明は上記従来の欠点に鑑み、連続音声におけるホ
ルマントを追跡して周波数,及び時間に関するホルマン
ト軌跡を求めるホルマント抽出装置において、ホルマン
ト軌跡の時間的連続性を保証し、安定に正しいホルマン
ト軌跡を抽出することができるホルマント抽出装置を提
供することを目的とするものである。 〔課題を解決するための手段〕 第1図は本発明のホルマント抽出装置の原理構成図で
ある。 上記の問題点は下記の如くに構成されたホルマント抽
出装置によって解決される。 (1)連続音声におけるホルマントを追跡して周波数,
及び時間に関するホルマント軌跡を求めるホルマント抽
出装置であって、 n個のホルマントを抽出するとき、該連続音声を時間
軸方向に複数のフレームに分割し、各フレームの音声デ
ータからスペクトル包絡を求めて、該スペクトル包絡の
周波数をn次元の超平面の座標に順序付けて割り当て、
更に得られた超平面を時間軸方向に並べてn+1次元の
超立方体を構成する手段〜,〜と、 上記超平面の各n次元座標点におけるホルマント評価
値を、スペクトルのピーク性,各ホルマントの存在範
囲,及び各ホルマントの位置関係を用いて求める手段
,とを設けて、 上記超立方体を構成している上記複数個の超平面上の
各n次元座標点上に求めた上記スペクトル値のピーク値
を動的計画法によって追跡し、得られた各次元の周波
数軌跡をそれぞれの次元のホルマント周波数軌跡とする
ように構成する。 (2)上記各ホルマントのスペクトル上でのピーク性の
評価尺度として、該スペクトルの2次差分,又は該2次
差分と該2次差分を求めたスペクトル値との和を用いる
ように構成する。 (3)上記各ホルマントの存在範囲,及び各ホルマント
の位置関係を評価する値として、該ホルマントの存在域
を表す重み関数と、各ホルマント間の周波数差を表す重
み関数とを用意し、これらの全重み関数の積,又は和を
用いるように構成する。 (4)上記連続音声のスペクトルを分析する手段とし
て、線形予測係数(LPC)スペクトル包絡分析,又は離
散的フーリエ変換スペクトル分析を用いるように構成す
る。 〔作用〕 即ち、本発明によれば、連続音声におけるホルマント
を追跡して周波数,及び時間に関するホルマント軌跡を
求めるホルマント抽出装置において、音声スペクトル上
に引かれ得る全ての滑らかな曲線の中から、ホルマント
軌跡としての条件、例えば、スペクトルのピーク性(2
次差分値),各ホルマントの存在する周波数範囲,他の
ホルマントとの相対関係等を評価した上で、最も評価の
高い複数個の曲線のセットを選び出し、それをホルマン
ト軌跡とするようにしたものである。 具体的には、連続音声のスペクトル包絡の時系列(フ
レーム列)のそれぞれをn次元の超平面(例えば、3次
元)に拡張し、それらを時間軸方向に並べてn+1次元
(即ち、4次元)の超立方体を構成する。 そして、上記3次元の超平面の各3次元座標点におけ
るホルマント評価値を、スペクトルのピーク性(2次差
分),各ホルマントの存在範囲,及び各ホルマントの位
置関係を用いて求める。 上記超立方体を構成している上記複数個の3次元の超
平面の各3次元座標点上に求めた上記ホルマント評価値
の最も大きな点を動的計画法によって追跡し、得られた
各次元(X軸,Y軸,Z軸)の周波数軌跡をそれぞれの次元
のホルマント(第1,2,3ホルマント)周波数軌跡とする
ようにしたものであるので、実現可能な計算量で、安定
で正確なホルマント軌跡を求めることができる効果があ
る。 〔実施例〕 以下本発明の実施例を図面によって詳述する。 前述の第1図が本発明のホルマント抽出装置の原理構
成図であり、第2図は本発明のホルマント軌跡抽出部の
構成例を示した図であり、第3図は本発明の重み関数の
例を示した図であり、第4図は本発明によって抽出した
ホルマント抽出例であり、第5図は本発明の他の実施例
を示した図であって、第1図におけるスペクトル包絡記
憶部,ピーク性抽出部,超立方体構成部,ホルマ
ント軌跡抽出部が本発明を実施するのに必要な手段で
ある。尚、全図を通して同じ符号は同じ対象物を示して
いる。 以下、第1図〜第4図によって本発明のホルマント抽
出装置の1つの構成例と、そのホルマント抽出動作を説
明する。 本実施例においては、第1ホルマント,第2ホルマン
ト,第3ホルマントの3つのホルマントを抽出する場合
を例にして説明するが、4個以上のホルマントを抽出で
きるように拡張するのは、前述のn+1次元の超立方体
を構成しているn次元の超平面の次数をn=4以上とす
ることで容易に求めることができる。 前述のように、本発明は、動的計画法によりホルマン
ト周波数軌跡を求めるものであって、即ち、連続音声の
スペクトル包絡の時系列(フレーム列)のそれぞれをn
次元(本例では、3次元)の超平面に拡張し、それらを
時間軸方向に並べてn+1次元(本例では、4次元)の
超立方体を構成し、上記3次元の超平面の各3次元座標
点におけるホルマント評価値を、スペクトルのピーク
性,各ホルマントの存在範囲,及び各ホルマントの位置
関係を用いて、1つ前の超平面のホルマント評価値と、
現在の超平面のホルマント評価値とを累積しながら最大
値を示す該超平面の位置(周波数で示した3次元座標
点)を求めておき、上記超立方体を構成している上記全
ての超平面上に求めた上記各超平面の位置を、最終の超
平面からバックトラックで追跡し、得られた各次元の周
波数軌跡をそれぞれの次元のホルマント周波数軌跡とす
るものである。 以下、具体的に説明する。 第1図の原理図において、〜の各部は従来例と同
じであるので省略し、のスペクトル包絡記憶部での処
理から説明する。 該スペクトル包絡記憶部においては、スペクトル包
絡分析部において、数ms〜数十ms毎のフレーム(分析
区間)毎に得られるスペクトル包絡を一時的に記憶す
る。 即ち、第h番目のフレームのスペクトル包絡{ΕL h
L=0,Rを式Vに従って{DLhL=0,R h=1,Hに記憶する。
ここで、Hはフレーム数の最大級であり、入力された音
声全体がHフレームからなっているものとする。 DLh=ΕL hL=0,R h=1,H) ……(式V) 次のピーク性抽出部においては、上記スペクトル包
絡{DLhL=0,R h=1,Hを、そのピーク性を表す
{FL,hL=0,R h=1,Hに式VIに従って変換する。具体的
には2次差分を求める。 超立方体構成部では、上記ピーク性抽出部で得ら
れた{FL,h}より式VI′を用いて{Bi,j,k,h}を算出
する。 ここで、0<i≦R、i<j≦R、j<k≦R、1≦
h≦Hである。 Bi,j,k,h=(Fi,h+Fj,h+Fk,h) ×Wi,j,k ……(式VI′) 但し、{Wi,j,k}はホルマントの存在範囲に関する
事前情報(重み関数)を記憶する配列である。又、iは
第1ホルマントのポインタ,jは第2ホルマントのポイン
タ,kは第3ホルマントのポインタ,hはフレームのポイン
タである。 該超立方体構成部の詳細な内部構成の例を第2−1
図に示す。ここで、 はピーク性記憶部であって、前述の{Fi,h},
{Fj,h},{Fk,h}を記憶する。 は加算部であって、上記ピーク性記憶部から読み
出されたFi,h,Fj,h及びFk,hを加え合わせる。 は乗算部であって、加算部での結果に重み記憶部
で記憶している重み関数{Wi,j,k}を掛ける。 該{Wi,j,k}の例を第3図に示す。 本図において、各ホルマント毎に、 β:第1ホルマントの存在範囲を規定 γ:第2ホルマントの存在範囲を規定 ε:第3ホルマントの存在範囲を規定 したものを用意し、 又、各ホルマント間の周波数差を表す重み関数を各ホ
ルマント対毎に、 θj-i:第1ホルマントと第2ホルマントの相対関係を
規定 λk-j:第2ホルマントと第3ホルマントの相対関係を
規定 ξk-i:第1ホルマントと第3ホルマントの相対関係を
規定 したものを用意し、 上記重み関数Wi,j,kとして、上記の全重みの積を用
いるようにする。即ち、 Wi,j,k=β×γ×ε×θj-i×λk-j×ξk-i……
(式XI) は次に説明するホルマント軌跡抽出部の中にある
制御部そのものであって、ピーク性記憶部,及び重
み記憶部の動作に必要なアドレス情報(i,j,k,h)を
生成し分配する。 次のはホルマント軌跡抽出部であって、上記超立方
体に対して以下の処理を順次実行する。 但し、該処理中において、 は作業領域であり、i≦0,又はj≦i,又はk≦j,又はi
>R,又はj>R,又はk>Rの場合、上記Ai,j,k,h=−
∞とする。 又、 は、ある超平面上の点(i,j,k)が1つ前のフレームに
おいて参照しているホルマント評価値が最大値をとる点
の座標(周波数)を記憶する部分軌跡一時記憶領域であ
る。
【処理1.1】 式VIIの漸化式をh=1からh=Hまでの全てのi,j,k
(但し、0≦i<R,i≦j<R,j≦k<R)について実行
する。 但し、h=0,且つi>0,且つj>i,且つk>jのとき
はAi,j,k,h=0とし、 i≦0,又はj≦i,又はk≦jのときはAi,j,k,h=−
∞とする。 又、X0,X1,Y0,Y1,Z0,Z1はそれぞれ正の整数であり、
−X0〜X1は1フレーム間に第1ホルマントが変化できる
周波数範囲を示しており、−Y0〜Y1,−Z0〜Z1はそれぞ
れ第2,第3ホルマントが1フレーム間に変化できる周波
数範囲を示している。
【処理1.2】 処理1.1と同時に、上記(式VII)で、各i,j,k,h(但
し、0≦i<R,i≦j<R,j≦k<R,0<h≦H)におい
て、 [Ai+X,j+Y,k+Z,h-1]が最大値を与えるX,Y,Zを、そ
れぞれXmax,Ymax,Zmaxとして、式VIIIを実行し、
max,Ymax,Zmaxの部分軌跡として一時記憶する。 但し、−X0≦Xmax≦X1,−Y0≦Ymax≦Y1,−Z0≦Z
max≦Z1である
【処理2.1】 下記の式IXによって、最適ホルマント軌跡の終端を検
出する。 上式は、それぞれ[Ai,j,k,H]が最大値をとるとき
のi,又はj,又はkの値の求める関数を示している。
【処理2.2】 次に、式Xに従って、h=H〜2迄の最適ホルマント
軌跡を抽出する。この処理をホルマント軌跡のバックト
ラックと呼ぶ。 上記
【処理1.1】〜
【処理2.2】迄の処理を実行
するホルマント軌跡抽出部の詳細な内部構成の例を第
2−2図に示す。 上記
【処理1.1】の式VIIは本図の〜,及び
において実行される。 先ず、制御部において、以下の各部の動作に必要な
アドレス情報(i,j,k,h)が生成され、分配される。 作業領域初期設定部においては、 (1)h=0,且つi>0,且つj>i,且つk>jのとき、
i,j,k,h=0 (2)i≦0,又はj≦i,又はk≦jのときは、A
i,j,k,h=−∞ の初期値設定を行う。 上記超立方体構成部で得られた{Bi,j,k,h}と作
業領域記憶部に記憶されている配列{Ai,j,k,h
(式VIIの左辺)から読み出されたホルマント評価値の
累積値の最大値を最大値選択部で選択して加算部で
足し合わせる。 作業領域書込制御部においては、上記加算部の結
果を作業領域記憶部に書き込みを行う場合(式VIIの
代入)のアドレス管理を行う。 この書き込み処理において、作業領域書き込みバッフ
ァで、該作業領域記憶部に書き込むデータ(式VII
の右辺)を一時的に記憶する。 この結果、該作業領域記憶部には、配列{A
i,j,k,h}(式VIIの左辺)が記憶される。 上記作業領域記憶部から、上記式VIIのmax関数の引
数が作業領域読出制御部のアドレス管理の元に、作業
領域読出バッファに読み出され、一時記憶される。そ
して、最大値選択部において、該作業領域読出バッフ
ァの内容の最大値選択(即ち、該max関数の動作その
もの)が行われ、上記加算部に入力されることによ
り、のループ処理で、各フレー
ムh毎に上記式VIIが実行される。 次に、上記
【処理1.2】の式VIIIは、本図の部分軌
跡一時記憶部で実行される。即ち、
【処理1.1】と
同時に、上記最大値選択部で得られたXmax,Ymax,Z
maxを式VIIIに従って、配列{Ti,j,k,h,q}に格納す
る。 上記
【処理2.1】の式IXは、本図の最終フレーム最
大値検出部で実行される。即ち、式VIIの演算が全て
終了した時点で、該式IXの演算を行う。 上記
【処理2.2】の式Xは、本図のホルマント軌跡
バックトラック部で実行され、最適ホルマント周波数
軌跡を求める。 このようにして求めたホルマント軌跡の抽出例を示し
たものが第4図であり、本発明を実施してホルマント軌
跡を求めることにより、図示されている如くに、正し
く,且つ安定に、ホルマント軌跡を求めることができ
る。 上記の実施例においては、ピーク性抽出部で求める
{FL,h}を、上記式VIで求める例で説明したが、 とすると、ν=2のとき、上記式VIで示した実施例と
同じになる。 該式X IIにおいて、ν>2のときには、ピーク性と同
時に該ピークの振幅の大きさも同時に評価できることに
なる。一般に、振幅の小さなピークはホルマントと認め
難いので、上記のようなピーク性を算出することによ
り、より信頼性の高いホルマント軌跡の抽出が実現でき
ることになる。通常、該ν≒3が適当である。 又、上記の実施例において、ホルマントの存在する周
波数の範囲,及びホルマントの位置関係を評価する為の
重み関数として、式X Iの代わりに、式X IIIを用いても
良いことは云う迄もないことである。 Wi,j,k=β+γ+ε+θj-i+λk-j+ξk-i……
(式X III) 上記の実施例においては、連続音声のスペクトルを分
析する手段として、線形予測係数(LPC)スペクトル包
絡分析手段を用いて求めたスペクトル包絡に対してピー
ク性を検出する方法で説明したが、第5図に示した他の
実施例においては、スペクトル包絡を求めることなく離
散的フーリェ変換(式X IV)で求めたスペクトルデータ
をその代わりに用いるものである。 本図において、はスペクトル分析部であって、以下
の計算式によってスペクトル配列{Ε}を求める。 上記の式X IVは高速フーリェ変換(FFT)手段を用い
ることにより高速にスペクトルを求めることができる。
次のが該スペクトルを記憶するスペクトル記憶部であ
って、機能的には前述のスペクトル包絡記憶部と等価
である。 尚、本図においては、説明の便宜上、超立方体構成部
は省略してある。 このように、本発明は、音声スペクトル包絡の時系列
(フレーム列)上に引かれる全ての滑らかな曲線の中か
ら、ホルマント軌跡としての事前知識、例えば、スペク
トルのピーク性,各ホルマントの存在周波数範囲、他の
ホルマントとの相対関係等を評価した上で、最も評価の
高い複数の曲線セットを選択しホルマント軌跡とするの
に、上記フレーム列を形成しているスペクトル包絡の周
波数をn次元の超平面の座標に順序付けて割り当て、上
記n次元の超平面を時間軸方向に並べてn+1次元の超
立方体を構成し、上記複数個の超平面上の各n次元座標
点上でのホルマント評価値を、1つ前迄の超平面のホル
マント評価値の累積値と累積して求めておき、最後の超
平面のホルマント評価値の累積値の最大値を示す位置
(周波数で示した3次元座標点)からバックトラックで
追跡し、得られた各次元の周波数軌跡をホルマント軌跡
とするようにした所に特徴がある。 〔発明の効果〕 以上、詳細に説明したように、本発明のホルマント抽
出装置は、連続音声のスペクトル包絡の時系列(フレー
ム列)のそれぞれをn次元の超平面に拡張し、それらを
上記時間軸方向に並べてn+1次元の超立方体を構成す
る手段と、上記超平面の各n次元座標点におけるスペク
トル値のホルマント評価値を、スペクトルのピーク性,
各ホルマントの存在範囲,及び各ホルマントの位置関係
を用いて求める手段とを設けて、上記超立方体を構成し
ている上記複数個の超平面上に求めた上記スペクトル値
のホルマント評価値の大きい点を動的計画法によって追
跡し、得られた各次元の周波数軌跡をそれぞれの次元の
ホルマント周波数軌跡とするようにしたものであるの
で、実現可能な計算量で、安定に、且つ正確なホルマン
ト軌跡を求めることができる効果がある。
【図面の簡単な説明】
第1図は本発明のホルマント抽出装置の原理構成図, 第2−1図は本発明の超立方体構成部の構成例を示した
図, 第2−2図は本発明のホルマント軌跡抽出部の構成例を
示した図, 第3図は本発明の重み関数の例を示した図, 第4図は本発明によって抽出したホルマント抽出例, 第5図は本発明の他の実施例を示した図, 第6図は従来のホルマント抽出装置の構成例を示した
図, 第7図は一般のペクトル包絡の例を示した図, 第8図は従来技術でのホルマント抽出例を示した図, である。 図面において、 はマイクロホン,はアナログディジタル変換部(AD
変換部),は自己相関分析部,はLPC分析部,は
スペクトル包絡分析部,はピーク性抽出部,は超立
方体構成部,はホルマント軌跡抽出部,はピーク性
記憶部,,は加算部,は乗算部,は重み記憶
部,は最大値選択部,は部分軌跡一時記憶部,は
最終フレーム最大値検出部,はホルマント軌跡バック
トラック部,は作業領域初期値設定部,は制御部,
はスペクトル分析部,をそれぞれ示す。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】連続音声におけるホルマントを追跡して周
    波数,及び時間に関するホルマント周波数軌跡を求める
    ホルマント抽出装置であって、 n個のホルマントを抽出するとき、該連続音声データを
    時間軸方向に複数のフレームに分割し、各フレームの音
    声データからスペクトル包絡を求めて、該スペクトル包
    絡の周波数をn次元の超平面の座標に順序付けて割り当
    て、更に得られた超平面を時間軸方向に並べてn+1次
    元の超立方体を構成する手段と、 上記超平面の各n次元座標点におけるホルマント評価値
    を、スペクトルのピーク性,各ホルマントの存在範囲,
    及び各ホルマントの位置関係を用いて求める手段を設け
    て、 上記求められたホルマント評価値の最も大きい点を動的
    計画法によって追跡し、該追跡によって得られた各次元
    の周波数軌跡をそれぞれの次元のホルマント周波数軌跡
    とすることを特徴とするホルマント抽出装置。
  2. 【請求項2】上記各ホルマントのスペクトルのピーク性
    の評価尺度として、該スペクトルの2次差分,又は該2
    次差分と該2次差分を求めたスペクトル値との和を用い
    ることを特徴とする請求項1のホルマント抽出装置。
  3. 【請求項3】上記各ホルマントの存在範囲,及び各ホル
    マントの位置関係を評価する値として、該ホルマントの
    存在域を表す重み関数と、各ホルマント間の周波数差を
    表す重み関数とを用意し、これらの重み関数の積,又は
    和を用いることを特徴とする請求項1のホルマント抽出
    装置。
  4. 【請求項4】上記連続音声のスペクトルを分析する手段
    として、線形予測係数スペクトル包絡分析,又は離散的
    フーリエ変換スペクトル分析を用いることを特徴とする
    請求項1のホルマント抽出装置。
JP63053902A 1988-03-07 1988-03-07 ホルマント抽出装置 Expired - Fee Related JP2707577B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63053902A JP2707577B2 (ja) 1988-03-07 1988-03-07 ホルマント抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63053902A JP2707577B2 (ja) 1988-03-07 1988-03-07 ホルマント抽出装置

Publications (2)

Publication Number Publication Date
JPH01227200A JPH01227200A (ja) 1989-09-11
JP2707577B2 true JP2707577B2 (ja) 1998-01-28

Family

ID=12955649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63053902A Expired - Fee Related JP2707577B2 (ja) 1988-03-07 1988-03-07 ホルマント抽出装置

Country Status (1)

Country Link
JP (1) JP2707577B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3360046B2 (ja) * 1999-09-28 2002-12-24 松下電器産業株式会社 音声符号化装置、音声復号化装置及び音声符復号化方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS551600B2 (ja) * 1973-10-05 1980-01-16
JPS6042799A (ja) * 1983-08-17 1985-03-07 富士通株式会社 ホルマントピ−ク抽出装置

Also Published As

Publication number Publication date
JPH01227200A (ja) 1989-09-11

Similar Documents

Publication Publication Date Title
EP0219712B1 (en) Method of and system for speech recognition
JP3114975B2 (ja) 音素推定を用いた音声認識回路
EP0686965B1 (en) Speech recognition apparatus with speaker adaptation using acoustic category mean value calculus
EP3121814A1 (en) A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use
GB2153127A (en) Phoneme transition recognition
US4677673A (en) Continuous speech recognition apparatus
CN104103280A (zh) 基于动态时间归整算法的离线语音端点检测的方法和装置
Patel et al. Optimize approach to voice recognition using iot
JP3004023B2 (ja) 音声認識装置
JP2707577B2 (ja) ホルマント抽出装置
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法
JPS6129518B2 (ja)
JPS6312312B2 (ja)
Maka Audio content analysis based on density of peaks in amplitude envelope
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JP2005115386A (ja) 誤認識予測方法
JP2856429B2 (ja) 音声認識方式
JPH0731504B2 (ja) ピツチ抽出装置
Jain et al. Emotion Analysis from Human Voice Using Various Prosodic Features and Text Analysis
Hameed Design A Dependent Voice Commands Selective System
JPS58224394A (ja) 連続単語音声認識装置
JPS6053998A (ja) 音声認識装置
JPH05313695A (ja) 音声分析装置
JPS59127098A (ja) 連続単語音声認識装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees