JPS60238900A - 基本周波数パタン抽出方式 - Google Patents

基本周波数パタン抽出方式

Info

Publication number
JPS60238900A
JPS60238900A JP59094266A JP9426684A JPS60238900A JP S60238900 A JPS60238900 A JP S60238900A JP 59094266 A JP59094266 A JP 59094266A JP 9426684 A JP9426684 A JP 9426684A JP S60238900 A JPS60238900 A JP S60238900A
Authority
JP
Japan
Prior art keywords
maximum value
calculation
autocorrelation coefficient
frame
fundamental frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59094266A
Other languages
English (en)
Inventor
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59094266A priority Critical patent/JPS60238900A/ja
Publication of JPS60238900A publication Critical patent/JPS60238900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Radar Systems Or Details Thereof (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声信号の基本周波数バタン抽出方式%式% 係数という)よシ基本周波数バタンを抽出する場合にお
いて、前の分析区間(以下分析フレームと称する)での
自己相関係数の最大値の大きさ及びその遅れ時間によっ
て次の分析フレームの自己相関係数の演算範囲を可変に
設定することにより少ない演算量で高速に基本周波数パ
タ一ンを抽出できるようにしたものである。
〔従来技術と問題点〕
音声における基本周波数は声帯の振動のピッチ周期の逆
数であり、声帯に関する重要な情報である。例えば第1
図に示す如き音声波形があるとき。
そのピッチ周期Tの逆数つまりその繰シ返し周波数が基
本周波数である。この基本周波数は男声で100〜15
0 Hz 、女声で250〜400H2位であり。
音声合成の重要なパラメータとして、またアクセント、
イントネーションをめる手段として、連続音声認識にお
けるセグメンテーション情報として用いられている。
ところでこの基本周波数を抽出する方式には多くの提案
があるが、もつとも一般的な手法として自己相関係数を
用いた基本周波数抽出法がある。
この自己相関係数をめる場合9周知のように例えば第2
図に示す如く、音声波形を一定の大きさのフレームW、
 、 W、・・・で音声信号を切シ出し、各フレーム内
でサンプリングデータSl、S、・・・SNをめる。そ
して の如く、サンプリングデータの積をめて0次の自己相関
係′数へ。2,1次の自己相関係数ψ、1.・・・・・
・(N−1)次の自己相関係数ψ。−1)をめ、そのう
ち一定の範囲における次数内におけるもつとも大きな値
ψm@Xの相関係数の次数によシ前記ピッチ周期をめて
いる。
ところでこのような従来の手法により自己相関係数をめ
る場合、各フレームW、 、 W2・・・毎にそのフレ
ーム内のサンプリングデータS、、S2・・・を順次乗
算することが必要なためその演算量が非常に犬となシャ
シだがって基本周波数バタンをめる場合に非常に長時間
かかるという欠点がある。
〔発明の目的〕
本発明の目的は、前記の欠点を改善するために。
自己相関係数より基本周波数パタンを抽出する場合にお
いて、前分析フレームでの自己相関係数の最大値の大き
さ及びその遅れ時間つまり次数によって次の分析フレー
ムでの自己相関係数の演算範囲を可変に設定することに
よシ演算量を少なくシ。
その結果高速に基本周波数パタンを抽出する方式を提供
することである。
〔発明の構成〕
前記目的を達成するため1本発明の基本周波数バタン抽
出方式では、音声信号の短区間自己相関)。
係数をめ、予め定められた遅延時間内における自己相関
係数の最大値を検出し基本周波数パタンを抽出する装置
において、自己相関係数を演算するときその演算範囲が
限定可能な自己相関演算回路と、自己相関係数の最大値
を検出する最大値検出回路と、基本周波数を算出する基
本周波数算出回路と、演算範囲を設定する演算範囲設定
回路を備え、前の分析区間における前記自己相関係数の
最大値の存在する遅れ時間およびその最大値に応じて次
の分析区間の前記自己相関演算回路の演算範囲を可変に
設定するようにしたことを特徴とする。
〔発明の実施例〕
本発明を一実施例にもとづき詳述するに先立ちその概略
を説明する。音声信号においては予測性をある程度仮定
できる。したがって前分析フレームで自己相関係数の最
大値の大きさ及びその遅れ時間がわかれば次の分析フレ
ームでの自己相関係数の最大値の大きさ及びその遅れ時
間もある程度予測できるので、前分析フレームでの自己
相関係数の最大値の大きさ及びその遅れ時間がわかれば
その最大値の自己相関の次数を中心としてその演算範囲
を限定しても自己相関係数を正確に算出することができ
る。このようにして前回のフレームの演算結果にもとづ
き次フレームの演算量を限定することができるので、高
速に基本周波数パタンを抽出することができる。
次に本発明を具体的に説明する。
■、自己相関係数の算出 本発明では前分析フレームの自己相関係数の最大値の大
きさ及びその遅れ時間(次数)により次分析フレームで
の演算範囲を可変にするものであるため、先ず最初の分
析フレームにおいては従来通りの手法によシ自己相関係
数の最大値を持つ次数を算出する。
いま音声波形信号の時系列を X = X+ 、 X2 、 Xs・= Xnとする。
このXの時刻t == lから始まるN個のザンブルに
時間窓をかけて切シ出しだ時系列を Y’ ”” ”l + Xl+1+ Xl+2°1°0
1Xl+N−+ = Y+ r Y2 + Y3°9−
yNとする。この時間窓で切り出さ゛れた時系列Yの自
己相関係数は次式で定義される。
ここでN’=N−m mは自己相関の次数 0≦m<N−1 である。
そして前記(1)式で演算された自己相関係数の最大値
を持つ次数mm8xを次式で検出する。
ここでm、 、 mlは各々予め定められた次数(遅れ
時間)であって2例えば男声の場合にはこれより得られ
る基本周波数fが100〜150 Hzの範囲内になる
ように定められたものである。そしてこのようにして得
られたml、、1.から次式により基本周波数fをめる
ことができる。
この上記シーケンスにより基本周波数が算出される。
L 基本周波数バタンの抽出 次に本発明における基本周波数パタンの抽出について説
明する。
音声信号の時系列を 入”” XI+ X2+ x3 ”””Xnとする。
ここで時刻1から始まるN個のサンプルに時間窓をかけ
て切り出された時系列を X、:x、、x、、、、、、、X。
とする。そしてこの分析区間の名前を、第3図に示す如
く、第1フレームとする。
次に分析フレーム周期をPとして1時系列Xの時刻1か
らPサンプル経過後の時刻から始まるN個のサンプルに
時間窓をかけて切り出された時系列を L= Xp、 XP+1 、−− XP+N−1= X
’s 、 X′2.−・・・x′Nとする・j′−fP
の値は医≦PNO範囲の値をと 、るものとする。また
この分析区間を第2フレームという。前記Pの範囲よシ
明らかなように、第1フレームの後半のT以下の部分が
第2フレームとオーバラップしている。
(al 第1フレームの自己相関係数の算出まず前記第
1フレームの自己相関係数ψ1(niを前記(1)式を
用いて計算する。したがってとのψ1゜は次式により得
られる。
(N’=N−m、O≦m<N−1) このようにして得られた自己相関係数ψ1.□、の最大
値mV、及び最大値をもつ次数mO,(遅れ時間)を検
出する。
mV、 = MaxV (ψ1゜) ・・・叩・・・・
・・・・+51(m = m、 −m2 ) m O,= Max O(ψI(ml ) −−叩・・
−+61(m二m、〜m2) ここでflll 、 m2は各々予め定められた次数(
遅れ時間)であって検出範囲を示すものであり9例えば
男声の場合と女声の場合とでは異なる検出範囲をもつ。
(b) 第1フレームにおける基本周波数の算出および
第2フレームでの自己相関係数の演算範囲前記(6)式
によシ得られた次数mQ1により第1フレームの基本周
波数f、を次式によりめる。
そしてこの第1フレームで得られた自己相関係数ψI 
fm)の最大値及びその最大値をもつ次数より。
この次数を中心に第2フレームでの自己相関係数の演算
範囲を決定する。この演算範囲を決定する場合9例えば
実験的に自己相関係数の最大値と次フレームにおける自
己相関の演算範囲幅との関係を予じめめておき、その対
応を示す関数をg tl)として定義する。この関数g
 (llの一例を第4図に示す。
自己相関係数の最大値が、第4図の1max以上の場合
には次フレームではその次数を中心に一意の前後演算範
囲幅Δml。を決定する。また自己相関係数の最大値が
11m1n以下の場合には次フレームでは演算幅△□8
xを決定する。自己相関係数の最大値が前記1.n□〜
A!minの範囲の場合には、前フレームにおける最大
値の自己相関係数を有する次数を中心として前後を第4
図の関数g (llで示される演算範囲Δが決定される
したがって前記(6)式で得られた次数を中心として、
第1フレームで得られた自己相関係数の最大値m V、
によりこの関数g (Al1を用いて次の第2フレーム
での自己相関演算の演算範囲幅△スを決定する。
△l二g (mVl ) ・・・・・・・・・・・・・
・・+8) ・この演算範囲幅に従って第2フレームの
自己相関係数の算出演算を行う。この結果、第2フレー
ム目の自己相関係数ψ2(mlは次式で計算される。
(N’=N −m 、 m Os−ΔH≦m≦mO+Δ
、)前式における演算では、演算すべき自己相関の次数
が前記mQを中心にして前後がΔlの幅に限定されるの
で演算量を大幅に削減できる。
この演算により第2フレームにおける自己相関係数ψ2
゜の最大値m V2およびその最大値を持つ次数mQ2
を検出する。
m V2= Max V (ψ2い、) ・・・・・・
・・・・・・・・・ OQm=(mVl−△l)〜(m
■2+△l)m 02= Max O(ψ2゜) ・・
・・・・・・・・・・・・・(11)m = (m V
l −△I ) 〜(m V+ + △1)そして第2
フレーム目の基本周波数f2はによ請求めることができ
る。
次の第3フレームの自己相関係数ψ3゜を演算するとき
、この第2フレーム目の前記次数mQ2を中心として、
前記最大値m■2により得られる前記関数g(m′v2
)によシ定められる自己相関の演算範囲△2を演算すれ
ばよい。
同様にして第1フレームの自己相関係数ψI0はその1
つ前の第(i−1)フレームの自己相関係数ψl−Hm
)の最大値及びその最大値を持つ次数の値に依存した形
で計算され、その自己相関係数ψlい、を基に第1フレ
ームの基本周波数f、が抽出される。 □この方式によ
り前フレームでの演算結果にょシ次のフレームでの自己
相関演算の演算範囲を限定できることにより演算量を減
少することができ、高速に基本周波数パタンを抽出する
ことが可能である。
■、実施例 本発明の一実施例構成を第5図により説明する。
第5図において1はマイクロホンであって音声を電気信
号に変換するもの、2はアナログ−ディジタル変換器で
あってマイクロホン1から伝達された音声信号をサンプ
リングしてこれをテイジタル信号に変換するもの、3は
データメモリであってディジタル信号化された音声信号
が格納されるもの、4はデータ切出回路であって予め定
められた分析フレーム長く時間窓)、分析フレーム周期
に従ってデータを順次切出すもの、5は自己相関演算回
路であって自己相関係数を計算するもの。
6は最大値検出回路であって前記自己相関演算回路5に
よシ演算された自己相関係数の最大の値を検出するもの
、7は基本周波数算出回路であって前記最大値検出回路
6によシ検出された最大の自己相関係数を有する次数に
もとづき基本周波数を算出するもの、8は時系列バッフ
ァ・メモリであって前記基本周波数算出回路7から出力
された各フレーム毎の基本周波数の値を一時保持するも
の。
9は演算範囲設定回路であって前記関数g (llが格
納されており前フレームでの自己相関係数の最大値及び
その時の遅れ時間(自己相関係数の最大値を有する次数
)から算出される演算範囲内で自己相関演算を行うもの
である。
第5図に示す本発明の一実施例構成回路の動作について
説明する。
発声された音声はマイクロホン1から入力されてアナロ
グ−ディジタル変換器2によシアナログーデイジタル変
換され、このディジタルの音声データがデータ・メモリ
3に格納される。
このデータ・メモリ3に格納された音声データはデータ
切出回路4により、予め定められた分析フレーム長2分
析フレーム周期に従い順次切出される。この切出された
音声データに関して前記(4)式にもとづき自己相関演
算回路5により自己相関係数を計算する。このとき第1
フレーム目の演算に関しては自己相関係数の演算範囲は
あらかじめ指定された範囲(例えば男声に対しては10
0〜150H2に対応する範囲)のその全次数を演算す
るという最大の値に設定される。この!うにして自己相
関係数4回路5によシ演算された自己相関係数のもつと
も大きい値とこの最大値を有する次数が最大値検出回路
6で検出される。そしてこの次数と最大値が演算範囲設
定回路9に伝達される。これによシ演算範囲設定回路9
は前記関数g (71にもとづき次フレーム演算範囲幅
△と第1フレームにおける自己相関係数の最大値を有す
る次数を自己相関演算回路5に送出して次の演算範囲を
前記最大値を有する次数を中心に前後△の幅だけに設定
する。しだがって第2フレーム以後の各フレームの音声
データに関してはその演算範囲が前記設定範囲に限定さ
れ、その演算範囲内での自己相関係数の最大値及びその
時の遅れ時間(次数)を最大値検出回路6が抽出するこ
とになり、これにもとづき次フレームの演算範囲が設定
されることになる。このようなととが繰返されて順次演
算が行われる。ところで最大値検出回路6は前記各フレ
ームにおける自己相関係数の最大値をもつ次数(遅れ時
間)から前記(7)式、02式等により各基本周波数を
順次抽出する。この基本周波数の値は、各フレーム毎、
順次時系列バッファ・メモリ8に格納され、これらによ
り基本周波数バタンか構成されることになる。また基本
周波数算出回路7における前記基本周波数送出信号はデ
ータ切出回路4にも伝達されて各フレームにおける演算
終了報告となり、これにより次フレームが切出され次の
演算が開始されることになる。
〔発明の効果〕
本発明によれば基本周波数バタンを抽出するとき前分析
フレームでの自己相関係数の最大値の大きさ及びその遅
れ時間によって次の分析フレームの自己相関係数の演算
範囲を可変、縮小して設定することによシ自己相関演算
の計算量を削減することができる。したがってその結果
、高速に基本周波数バタンを抽出することが可能になる
【図面の簡単な説明】
第1図は基本周波数の説明図、第2図は従来の自己相関
係数の算出方式の説明図、第3図は本発明におけるフレ
ームの説明図、第4図は次フレームにおける演算範囲幅
決定の関数の1例、第5図は本発明の一実施例構成図で
ある。 図中、1はマイクロホン、2はアナログ−ディジタル変
換器、3はデータ・メモリ、4はデータ切出回路、5は
自己相関演算回路、6は最大値検出回路、7は基本周波
数算出回路、8は時系列バッファ・メモリ、9は演算範
囲設定回路を示す。 特許出願人 富士通株式会社 代理人弁理士 山 谷 皓 榮 第3図 z、)〜”P+N−1’−

Claims (1)

    【特許請求の範囲】
  1. 音声信号の短区間自己相関係数をめ、予め定められた遅
    延時間内における自己相関係数の最大値を検出し基本周
    波数バタンを抽出する装置において、自己相関係数を演
    算するときその演算範囲が限定可能な自己相関演算回路
    と、自己相関係数の最大値を検出する最大値検出回路と
    、基本周波数を算出する基本周波数算出回路と、演算範
    囲を設定する演算範囲設定回路を備え、前の分析区間に
    おける前記自己相関係数の最大値の存在する遅れ時間お
    よびその最大値に応じて次の分析区間の前記自己相関演
    算回路の演算範囲を可変に設定するようにしたことを特
    徴とする基本周波数バタン抽出方式。
JP59094266A 1984-05-11 1984-05-11 基本周波数パタン抽出方式 Pending JPS60238900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59094266A JPS60238900A (ja) 1984-05-11 1984-05-11 基本周波数パタン抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59094266A JPS60238900A (ja) 1984-05-11 1984-05-11 基本周波数パタン抽出方式

Publications (1)

Publication Number Publication Date
JPS60238900A true JPS60238900A (ja) 1985-11-27

Family

ID=14105473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59094266A Pending JPS60238900A (ja) 1984-05-11 1984-05-11 基本周波数パタン抽出方式

Country Status (1)

Country Link
JP (1) JPS60238900A (ja)

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
CN101030374B (zh) 基音周期提取方法及装置
JPS60238900A (ja) 基本周波数パタン抽出方式
Strik et al. A dynamic programming algorithm for time-aligning and averaging physiological signals related to speech
JPH0362280B2 (ja)
JP2585214B2 (ja) ピッチ抽出方法
JPS6220560B2 (ja)
JPS61128300A (ja) ピツチ抽出装置
JPS6152478B2 (ja)
JPH0114599B2 (ja)
KR0180651B1 (ko) 음성인식장치
US20210166722A1 (en) A system for determining an emotional state of a subject
JP2638829B2 (ja) 音声ピッチ抽出装置
JPH0588478B2 (ja)
JPS62299899A (ja) よう音・直音言い分け評価方式
JPS6155700A (ja) ピッチ抽出処理方式
Turner et al. Linear prediction applied to time varying all pole signals
JPH05241596A (ja) 音声の基本周波数抽出システム
JPS63124100A (ja) 基本周波数分析装置
JPS62115498A (ja) 無声破裂子音識別方式
JPH0754438B2 (ja) 音声処理装置
JPS597399A (ja) 単音節音声認識装置
JPS63223696A (ja) 音声パタ−ン作成方式
JPS62238599A (ja) 音声区間検出方法
JPS58195893A (ja) 音声認識装置における前処理方法