JPS62194298A - ピツチ抽出方式 - Google Patents

ピツチ抽出方式

Info

Publication number
JPS62194298A
JPS62194298A JP61035149A JP3514986A JPS62194298A JP S62194298 A JPS62194298 A JP S62194298A JP 61035149 A JP61035149 A JP 61035149A JP 3514986 A JP3514986 A JP 3514986A JP S62194298 A JPS62194298 A JP S62194298A
Authority
JP
Japan
Prior art keywords
value
pitch
time delay
pitch period
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61035149A
Other languages
English (en)
Inventor
浅川 吉章
市川 熹
武田 昌一
宮本 宜則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61035149A priority Critical patent/JPS62194298A/ja
Publication of JPS62194298A publication Critical patent/JPS62194298A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Extraction Or Liquid Replacement (AREA)
  • Liquid Crystal Substances (AREA)
  • Working-Up Tar And Pitch (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声の分析に係り、特に高精度に音声のピッチ
周期を抽出するに好適なピッチ抽出方式の改良に関する
〔従来の技術〕
音声を分析してそのパラメータを伝送もしくは蓄積して
、そのパラメータから音声を合成する高能率行用符号化
では、ピッチ情報がデータの圧縮や合成音声の品質に対
して重要なパラメータになっており、高精度なピッチ抽
出が必要子or欠である。
音声のピッチ周波数は男女、子供を考慮すると、70〜
500Hz(周期にして2〜15 m s )の範囲に
わたり1通常、音声波形の自己相関係数を2〜15m5
の時間遅れに対して求め、その相関係数のピーク値から
ピッチ周期を求める方法(自己相関法)が一般的である
。またホルマントの影響を除去するために音声波形を線
形予測分析しで得られる残差波形の自己相関係数を用い
る場合もある。ピッチ周期は0.1  ms[度の分解
能が必要であるため、上記方法では自己相関係数の算出
に多数回の積演算が必要であり、演算時間がかかるとい
う欠点を有している。
これに対し平均振幅差関数(Average Magn
itudeDifferential Functio
n、以下AMOFと呼ぶ)法は自己相関法における積演
算を差の絶対値演算で置換えることによって演算時間の
削減を図ったものであり、AMOFとしては種々の変形
はあるが、最も単純には次式g(τ)で示される。
g (τ) =Σ I xr  x++rl     
  −11)1:1 ここにxIは時刻iの音声波形の振幅、では時間遅れを
意味する。A M D ト’法は演算時間は短くて済む
反面ピッチ周期の誤抽出、特に正しいピッチ周期の整数
倍への誤抽出がかなり多いことが知られている0例えば
、特開昭60−165700にはAMOF法の上記欠点
を改善する技術が記載されている。以下図面を用いて上
記従来技術を説明する。
第2図は上記従来技術のブロック図である。
AMOF算出部において一定時長の音声データからAM
DF値を算出し、最小値検出部2でその最小値を与える
時間遅れ1里とAMDF値g(τ1)を検出し。
整数分ので1検出部3においてて2=τl/2゜τ3=
τ1/3.・・・に対応するAMりF値g (τ2)。
g(K+1)*・・・を検出し、ピッチ周期選択部4に
おいてg(τ1)、g(τ2)、・・・を評価し、τ1
.τ2゜・・・のうち最も適切なものをピッチ周期とし
て選択する。ピッチ周期選択部4における評価法は。
g(τt)/g(τ1)〈k      ・・・(2)
ここに、j=2.3.・・・、には閾値を満たすτ1の
中でiが最大のもの、すなわちτLの値が最小の時間遅
れをもってピッチ周期にするというものである。
〔発明が解決しようとする問題点〕
上記従来技術はピッチ周期の選択において、AM11F
値だけ昏用いているため、評価判定方式を種種工夫して
も、正しいピッチ周期の整数倍が選ばれたり、逆に正し
いピッチ周期の整数分の−が選ばれるという問題があっ
た。
本発明の目的は、演算社の大幅な増加を伴うことなく、
より高精度のピッチ抽出方式を提供することにある。
〔問題点を解決するための手段〕
上記目的は、ピッチ周期の選択に際し、候補となる時間
遅れτ1.τ2.・・・に対応するAMDF値g(τx
)tg(τ2)、・・・を評価すると同時に。
τ1.τ2.・・・に対応する相関値を算出し、評価す
ることにより達成される。
〔作用〕
AMDF値を(2)値に従って評価する場合、確実に整
数倍のピッチ周期が選ばれないようにするためには、閾
値にの値を太き目に設定せざるを得ない、ところがこの
ようにすると音声の調波成分の影響で、逆に正しいピッ
チ周期の整数分の一の値が選ばれる率が高くなる。これ
に対し正しいピッチ周期の整数分の−に対応する相関値
は相対的に小さな値となり、これを評価することによっ
て。
整数分の−への誤りを防止することができる。ここで相
関値はフレーム内の全データに対して算出する必要はな
く、周期性の判定を行うのに最も適した部分(例えば振
幅の大きな部分)の所定数のデータを用いれば良い。相
関法の場合、データ数が少ないと信頼性が低下するが、
本方法ではAMDF値により候補となる時間遅れが既知
であるため、時間方向に対する信頼性の問題は回避でき
る。むしろフレーム内の平均的な相関値ではなく、評価
しようとする時間遅れに対する相関値を感度良く求める
ことができる。
相関値は音声信号を線形予測分析して得られる残差波形
信号データを用いて算出することもできる。残差波形は
音声波形からホルマントの影響を大部分取り除いたもの
であり、正しいピッチ周期の整数分の−に対する相関値
が大きくなることはほとんどないので1本発明の目的に
適している6(実施例〕 以下、本発明の一実施例を図面を用いて説明する。
第1図は本発明を用いたピッチ抽出装置のブロック図で
ある。第1図において、所定のサンプリング周期でディ
ジタル化された音声データが1フレ一ム分バッファメモ
リ11に格納される。ここでサンプリング周期は125
μ5(8k)−1zサンプリング)、1フレームは30
m5 (240サンプル)とする。バッファメモリ11
から読み出された音声波形データ12を用いてAMDF
算出部13において、次式に従ってAMDF値が算出さ
れる。
g(τ)=□ ・・・(3) ここにQは1フレームのデータ数である。A合計値は式
(1)によって算出しても良いが、式(3)によればフ
レーム内の全データを使用するため、より安定なピッチ
周期が抽出される。τはピッチ周期の探索範囲(2〜1
5m5)に対応する時間遅れであり16〜120である
。算出されたAMDF値14 (g (τ))は最小値
検出部15に入力され、最小値に対応する時間遅れ16
(値をτlとする)が判定部21に入力される。一方、
線形予測分析部17では、音声データ12から線形予測
係数18を算出する。!l形予i11+I係数18は逆
フィルタ19の係数として用いられ、逆フィルタ19に
音声データ12を入力すると、残差信号20が出力され
ろ。線形予測分析部】7および逆フィルタ】9の処理内
容は公知(中田「音声」 (コロナ社、!977)第3
章、あるいは安居院、中島「コンピュータ音声処理J 
(産報出版、 1980)第2章参照)なので詳しい説
明は省略する。ピッチ周期判定部21はτ1とg(τ)
および残差信号2oを用いてピッチ周期21(T)を抽
出する。
次に判定部21の処理を第3図を用いて詳細に説明する
。まず判定部21にデータ14,1.6゜20が入力さ
れると、初期設定としてピッチ周期候補用のメモリ36
に16の値τ1が書き込まれる。次に整数分の一算出部
30における除数nに初期値1が設定される。また閾値
決定部33において閾値θ1が次式によって算出される
Or =min (g (τx)十へ〇、θO)  −
(4)ここでg(τ1)はピッチ探索範囲におけるAM
I)F値の最小値であり、Δ0およびθ0は予め定めた
正の定数値である。一方、基準区間決定部34では残差
相関を算出するための基準区間が残差信号20に対し次
の手順で決められる。まず残差信号Z+(i=1〜ρ)
の振幅の絶対値が最大となるものを検出する(そのアド
レスをioとすする)。次にZIoを含む連続したm個
の残差の中で、振幅の絶対値和 が最大となるようなアドレスに=koを決定する。
ここでmは予め定めた残差数であり、−例としてτmi
n  (ピッチ周期の探索範囲の最小値)とすれば良い
。このようにして基準区間(ここではその先頭アドレス
)を決めることにより、フレーム内の周期性を検証する
上で最も適切な区間が選ばれる。なお(5)式のかわり
にパワ に++m−1 p (k) =Σ  ZJ”         ・・・
(5)′を用いても良い。
以−ヒの初期設定が完了すると、以下の処理をくり返す
ステップ1: 整数の一算出部においてnに1−が加算され、τ0=τ
z/ncn≧2)         ・・・(6)が算
出される。
ステップ2: τ。は比較判定部31においてτmtnと比較され、τ
1くτstnなる時はピッチ周期候補メモリ36に格納
されている値をピッチ周期22として出力し、当フレー
ムの処理を終了する。τ。≧τ1゜なる時はステップ3
以下の処理を行う。
ステップ3: 極小値検出部32において、τnの近傍(τ。
−Δτ≦τ≦τ。+Δτ)でg(τ)の極小値g(τn
’  1)<g(τn’)<g(τn’+1)   ・
・・(7)となり、かつ g (τ。′ )≦01              
・・・(8)を満たすτ。′を検出する。ここで極小値
を検出するのは、ピッチ周期に対応するAMDF値は一
般に極小値を示し、g(τn)が単に閾値以下の値とな
ったとしても必ずしもピッチ周期(又はその整数倍)で
はない可能性があるためである。なおΔτは2a度でよ
い。式(7)、(8)を満たすτ。′が無い場合にはス
テップ1へ戻る。τ。′が検出された場合はステップ4
へ進む。
ステップ4: 相関算出部35において、 τ7′に対応する残差相関
値りが次式で算出される。
ここに (9)式および(10)式において積和回数は171回
としているが、これはτ。′によらず一定回数としても
かまわない。またkoの値によっては、(9)式のかわ
りに としても良い、hと残差相関値に対する閾値θゎを比較
し、h≧θhのときにはピッチ周期候補メモリ36の内
容をτ。′に書き換える。ステップ1へ戻る。
以上の処理を終了した時点で、ピッチ周期候補メモリ3
6には、式(7)、(8)、(9)又は(9)′を満た
すもののうち周期が最小のものが格納されており、これ
がピッチ周期22として出力される。上記手順を第4図
に示す。
第5図はあるフレームにおけるAMDF値と残差相関値
の例を示している。この例ではピッチ周期1゛としてで
2′ が抽出される。第6図は女性が発声した/ od
avarauN ’ yu /という単語のピッチ抽出
結果であり、X印は従来のAMDF’法によって誤抽出
した結果、実線が本発明による結果であり、整数倍のピ
ッチへの誤りが無くなっている1女男声のデータ(各々
数百フレーム)に対しピッチ抽出を行ったところ、従来
方式では誤抽出が約10%あったが本発明では約1%に
減少した。
なお上記実施例においては、相関は残差波形を用いてい
るが、音声波形を用いても上に準じた効果があることが
実験的に確認されている。この場合、分析部17.逆フ
ィルタ19は不要であり、判定部21へは残差20のか
わりに音声信号12が入力される。
〔発明の効果〕
本発明によれば、AM叶法によるピッチ抽出で頻繁に発
生する整数倍のピッチ周期への誤抽出が防止出来るので
、非常に高い精度で音声のピッチ周期を抽出することが
出来る。
【図面の簡単な説明】
第1図は本発明の一実施例のピッチ抽出装置のブロック
図、第2図は従来のピッチ抽出装置のブロック図、第3
図は本発明のピッチ抽出装置のピッチ判定部のブロック
図、第4図は判定部における処理の流れを示す図、第5
図はAMDF値と残差相関値の一例を示す図、第6図は
ピッチ抽出結果を示す図である。 13・・・^阿叶′算出部、】−5・・・最小値検出部
、17・・・線形予測分析部、19・・・逆フィルタ、
21・・・ピッ′41 因 77  #lJ?!予看1介拉部 第 2 図 メ 3 図 32才蚤小4直矛更上5↑  36 ビプチg11削碇
冬亀’f(す¥I4− 目

Claims (1)

    【特許請求の範囲】
  1. 1、ディジタル化された一定時間長の音声信号データの
    平均振幅差関数値を算出する手段と、該関数値の最小値
    及び対応する時間遅れ値(τ_1)を検出する手段と、
    該時間遅れ値の整数分の一の時間遅れ値近傍の平均振幅
    差関数値の極小値及び対応する時間遅れ値(τ_n)を
    検出する手段と、該時間遅れ値(τ_n)に対する相関
    値を算出する手段と、上記平均振幅差関数値及び相関値
    に対する一定の評価基準によつて時間遅れ値τ_1ない
    しτ_nの中から最適なものをピッチ周期として選択す
    る手段とを具備することを特徴とするピッチ周期抽出方
    式。
JP61035149A 1986-02-21 1986-02-21 ピツチ抽出方式 Pending JPS62194298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61035149A JPS62194298A (ja) 1986-02-21 1986-02-21 ピツチ抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61035149A JPS62194298A (ja) 1986-02-21 1986-02-21 ピツチ抽出方式

Publications (1)

Publication Number Publication Date
JPS62194298A true JPS62194298A (ja) 1987-08-26

Family

ID=12433842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61035149A Pending JPS62194298A (ja) 1986-02-21 1986-02-21 ピツチ抽出方式

Country Status (1)

Country Link
JP (1) JPS62194298A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012019927A (ja) * 2010-07-14 2012-02-02 Nippon Telegr & Teleph Corp <Ntt> 周期推定装置、周期推定方法、及びプログラム
JP2021157180A (ja) * 2016-05-20 2021-10-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012019927A (ja) * 2010-07-14 2012-02-02 Nippon Telegr & Teleph Corp <Ntt> 周期推定装置、周期推定方法、及びプログラム
JP2021157180A (ja) * 2016-05-20 2021-10-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
KR101942521B1 (ko) 음성 엔드포인팅
KR0134158B1 (ko) 음성인식장치
JP5229234B2 (ja) 非音声区間検出方法及び非音声区間検出装置
JPS58140798A (ja) 音声ピツチ抽出方法
CA2162407C (en) A robust pitch estimation method and device for telephone speech
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
CN101030374B (zh) 基音周期提取方法及装置
JPS62194298A (ja) ピツチ抽出方式
CN110600010B (zh) 一种语料提取方法及装置
CN106920558A (zh) 关键词识别方法及装置
JP2585214B2 (ja) ピッチ抽出方法
JPS61128300A (ja) ピツチ抽出装置
JPS60129796A (ja) 音声入力装置
JPS6220560B2 (ja)
KR100388488B1 (ko) 유성음 구간에서의 고속 피치 탐색 방법
JPH0122639B2 (ja)
JPH0567040B2 (ja)
JPH0772899A (ja) 音声認識装置
JPH01310400A (ja) 音声ピッチ抽出装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPH0448239B2 (ja)
JPS62194299A (ja) 有声無声判定方式
JPS5911920B2 (ja) 音声波形自動切り出し装置
JP2000206984A (ja) 音声認識装置
JPS60165700A (ja) 音声ピツチ抽出装置