JPH0636159B2 - ピツチ検出器 - Google Patents

ピツチ検出器

Info

Publication number
JPH0636159B2
JPH0636159B2 JP61299895A JP29989586A JPH0636159B2 JP H0636159 B2 JPH0636159 B2 JP H0636159B2 JP 61299895 A JP61299895 A JP 61299895A JP 29989586 A JP29989586 A JP 29989586A JP H0636159 B2 JPH0636159 B2 JP H0636159B2
Authority
JP
Japan
Prior art keywords
residual
calculation
pitch
voice
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61299895A
Other languages
English (en)
Other versions
JPS62229200A (ja
Inventor
智 安永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Publication of JPS62229200A publication Critical patent/JPS62229200A/ja
Publication of JPH0636159B2 publication Critical patent/JPH0636159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声の基本ピッチ周波数を求めるピッチ検出
器に関し、特に、音声のスペクトル情報・基本ピッチ周
波数情報等を伝送パラメータとする音声分析合成装置の
ピッチ検出器に関するものである。
〔従来の技術〕
デジタル伝送系統で音声伝送を行なう場合に、情報量の
圧縮または秘話を行なうために、線形予測符号化方式な
どのように、音声信号のスペクトル情報・音声無音情報
・基本ピッチ周波数・音声振幅情報等の音声を形成して
いる基本パラメータのみを一定時間毎に抽出し、量子化
伝送し、受信側で再生する方法が知られている。たとえ
ば、音声信号を“2400”ビット毎秒のデジタル信号
に帯域圧縮する場合に基本パラメータを抽出する単位で
あるフレーム時間を“20”ミリ秒に設定すると、
“1”フレーム当たりのビット割当ては“48”ビット
になる。
スペクトル情報とは、線形予測符号化方式の場合は予測
係数、偏自己相関方式の場合はパコール係数、また線ス
ペクトル対分析方式の場合はLSP係数と呼ばれ、音声
の音韻情報をそれぞれ表現したものである。有声無声情
報とは、分析フレームが有音声フレームか無音声フレー
ムかで、音声合成時に音源を選択するために用いる情報
である。基本ピッチ周波数とは、有音声フレームに求め
られる音声の基本周波数であり、合成時には有音声源の
パルス間隔になる。また振幅情報とは、入力音声の電力
を表わす情報で、通常、入力音声の平均振幅およびスペ
クトル情報抽出時の予測残差振幅の積で示される。
上述した従来の音声分析合成装置に用いられるピッチ検
出器は、入力音声波形または入力音声より逆フィルタで
求めた残差波形の自己相関関数の最大値または平均振幅
差関数(AMDF)の最少値によりピッチを検出してい
た。特に、残差波形を用いる方法は、入力音声のスペク
トルオンベロープを取り除き、音帯駆動波形のインパル
スが第3図(b)に示すように顕著に現れるため、入力音
声波形から直接求める方法に比べ性能が優れている。第
3図(a)は原波形であり、第3図(a),(b)の横軸の時間
目盛りは1目盛り4msである。
〔発明が解決しようとする問題点〕
しかしながら、入力音声波形が逆フィルタの利得が非常
に高くなる正弦波のような波形である場合、第4図(b)
に示すように残差波形は白色雑音的になり、顕著なイン
パルスは見られず、自己相関等の手段を用いてもピッチ
を検出することは困難になるという欠点があった。第4
図(a)は原波形であり、第4図(a),(b)の横軸の時間目
盛りは1目盛り4msである。
〔問題点を解決するための手段〕
このような欠点を除去するために本発明は、次数制御さ
れたスペクトル情報を係数とする逆フィルタにより入力
音声の残差を求める残差算出手段と、この残差算出手段
の出力の自己相関係数を求める相関演算手段と、この相
関演算手段の出力の最大値を検出し,これを基に入力音
声のピッチを出力する基本ピッチ算出手段と、入力音声
のスペクトル情報を抽出し,これから求まる平均予測残
差により逆フィルタの次数を制御する制御手段とを設け
るようにしたものである。
また別発明として、音声データを入力し,スペクトル情
報の抽出を行ない,平均予測残差を計算し,この平均予
測残差が予め設定された値より小さくなるまで逐次繰返
し計算を行ない,予め設定された値より小さくなった時
の逐次繰返し計算の回数を出力する制御手段と、前記回
数をパラメータとして音声データに対する逆フィルタ計
算を行ない残差を算出する残差算出手段と、残差の自己
相関係数を求める相関演算手段と、自己相関係数により
音声の基本ピッチを求める基本ピッチ算出手段とを設け
るようにしたものである。
〔作用〕
本発明においては、求められたスペクトルパラメータの
平均予測残差によって、逆フィルタに使用されるスペク
トルパラメータ次数が制限される。
〔実施例〕
本発明に係わるピッチ検出器の一実施例を第1図に示
す。第1図において、1は音声入力端子、2は入力音声
のスペクトル情報を抽出する抽出手段としてのスペクト
ル抽出回路、3は平均予測残差を算出する予測残差算出
回路、4はスペクトル情報から求まる平均予測残差によ
り逆フィルタの次数を制御する次数制御回路、5は次数
制御されたスペクトル情報を係数とする逆フィルタによ
り入力音声の残差を求める残差算出手段としての逆フィ
ルタ、6は相関演算回路、7は残差の相関関数により入
力音声の基本ピッチを求める基本ピッチ算出手段として
の最大検出回路、8はピッチ出力端子である。
次に、このように構成されたピッチ検出器の動作につい
て説明する。音声入力端子1より入力された音声は、パ
コール分析器のようなスペクトル抽出回路2に入力され
る。予測残差算出回路3において、スペクトルパラメー
タよりこのパラメータ群の持つ平均予測残差が計算さ
れ、次数制御回路4の制御入力信号となる。次数制御回
路4において、制御入力信号である平均予測残差が小さ
い場合、逆フィルタの利得が大きくなるため、スペクト
ルパラメータの次数は小さくなるように制御される。逆
フィルタ5においては、次数制限されたスペクトルパラ
メータを係数とする逆フィルタにより残差が求められ
る。相関演算回路6において残差の自己相関演算を行な
った後、最大検出回路7においてピッチ決定が行なわれ
る。求められた基本ピッチ周波数はピッチ出力端子8よ
り出力される。
第2図は第1図に示すピッチ検出器をマイクロプロセッ
サで実施した実施例のフローチャートである。上記マイ
クロブロセッサの動作を第2図を用いて説明する。まず
ステップ11において、音声データx(0),・・・,x
(N-1)がマイクロプロセッサに入力される。入力データ
x(1),・・・,x(N-1)を用い、ダービン(Durbin)法に
よってパコール係数の計算が行なわれる。すなわちステ
ップ12において自己相関関数(R,・・・,R
が求められる。以下ステップ13〜ステップ19から成
る一連の計算をインデックスnの値を逐次増加しながら
繰返し演算を行ない、各回毎に平均予測残差Eを算出
する。
ステップ16において平均予測残差EとEすなわち
との比E/Eが、予めゼロと1の間の値たとえ
ば0.1に設定される閾値Ethと比較され、E/E
がEthより小さいならばループを出て、ステップ20
の計算へ移行する。E/EがEthより小さくなら
ないときはステップ17でn=Pのときにループから出
てステップ20へ移行する。ステップ20においては、
ステップ16あるいはステップ17から出たときのnの
値を最大次数Pとする。
上記ステップ12〜ステップ20までの一連の動作によ
り第1図のスペクトル抽出回路2,予測残差算出回路3
および次数制御回路4の行なう動作を1つの処理で行な
う。
次にステップ21において、上記のPをパラメータと
して入力データx(1),・・・,x(N-1)に対する逆フィ
ルタ計算を行ない、残差y(m)(1≦m≦N−1)を算
出する。この機能は第1図の逆フィルタ5の機能に対応
する。
次にステップ22において、y(m)の自己相関計算を行
ない、相関係数r(1≦i≦imax)を計算する。
この機能は第1図の相関演算回路6の機能に対応する。
次にステップ23において、rの最大値ripを検出
する。この最大値ripの添字iPがピッチとしてマイ
クロプロセッサの出力となる。この機能は第1図の最大
検出回路7の機能に対応する。
〔発明の効果〕
以上説明したように本発明は、ステップ情報から求まる
平均予測残差により逆フィルタの次数を制御する制御手
段を設けることにより、求められたスペクトルパラメー
タの平均予測残差によって逆フィルタに使用されるスペ
クトルパラメータ次数を制限することができ、正弦波の
ように非常に予測利得の高い入力信号においても、安定
して基本ピッチを検出できる効果がある。
【図面の簡単な説明】
第1図は本発明に係わるピッチ検出器の一実施例を示す
系統図、第2図は第1図のピッチ検出器をマイクロプロ
セッサで実施した実施例のフローチャート、第3図およ
び第4図は従来のピッチ検出器における信号波形を説明
するための波形図である。 1…音声入力端子、2…スペクトル抽出回路、3…予測
残差算出回路、4…次数制御回路、5…逆フィルタ、6
…相関演算回路、7…最大検出回路、8…ピッチ出力端
子。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】次数制御されたスペクトル情報を係数とす
    る逆フィルタにより入力音声の残差を求める残差算出手
    段と、この残差算出手段の出力の自己相関係数を求める
    相関演算手段と、この相関演算手段の出力の最大値を検
    出し,これを基に前記入力音声のピッチを出力する基本
    ピッチ算出手段と、前記入力音声のスペクトル情報を抽
    出し,これから求まる平均予測残差により前記逆フィル
    タの次数を制御する制御手段とを備えたことを特徴とす
    るピッチ検出器。
  2. 【請求項2】制御手段は、入力音声のスペクトル情報を
    抽出するスペクトル抽出回路と、このスペクトル抽出回
    路の出力に基づき平均予測残差を求める予測残差算出回
    路と、前記スペクトル抽出回路と前記予測残差算出回路
    の出力とに基づき前記逆フィルタの次数を制御する信号
    を発生する次数制御回路とから成ることを特徴とする特
    許請求の範囲第1項記載のピッチ検出器。
  3. 【請求項3】音声データを入力し,スペクトル情報の抽
    出を行ない,平均予測残差を計算し,この平均予測残差
    が予め設定された値より小さくなるまで逐次繰返し計算
    を行ない,予め設定された値より小さくなった時の逐次
    繰返し計算の回数を出力する制御手段と、前記回数をパ
    ラメータとして前記音声データに対する逆フィルタ計算
    を行ない残差を算出する残差算出手段と、前記残差の自
    己相関係数を求める相関演算手段と、前記自己相関係数
    により前記音声の基本ピッチを求める基本ピッチ算出手
    段とを備えたことを特徴とするピッチ検出器。
  4. 【請求項4】スペクトル情報はパコール係数であること
    を特徴とする特許請求の範囲第3項記載のピッチ検出
    器。
JP61299895A 1985-12-18 1986-12-18 ピツチ検出器 Expired - Lifetime JPH0636159B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP28306685 1985-12-18
JP60-283066 1985-12-18

Publications (2)

Publication Number Publication Date
JPS62229200A JPS62229200A (ja) 1987-10-07
JPH0636159B2 true JPH0636159B2 (ja) 1994-05-11

Family

ID=17660759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61299895A Expired - Lifetime JPH0636159B2 (ja) 1985-12-18 1986-12-18 ピツチ検出器

Country Status (2)

Country Link
US (1) US4845753A (ja)
JP (1) JPH0636159B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
DE69231266T2 (de) * 1991-08-09 2001-03-15 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
DE69228211T2 (de) * 1991-08-09 1999-07-08 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
JP3248981B2 (ja) * 1992-06-02 2002-01-21 松下電器産業株式会社 計算機
US5933801A (en) * 1994-11-25 1999-08-03 Fink; Flemming K. Method for transforming a speech signal using a pitch manipulator
KR100217372B1 (ko) * 1996-06-24 1999-09-01 윤종용 음성처리장치의 피치 추출방법
DK1326479T4 (en) * 1997-04-16 2018-09-03 Semiconductor Components Ind Llc Method and apparatus for noise reduction, especially in hearing aids.
KR100440973B1 (ko) * 2002-08-01 2004-07-21 삼성전자주식회사 신호간 상관계수 결정 장치 및 방법과 이를 이용한 신호피치 결정 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5918717B2 (ja) * 1979-02-28 1984-04-28 ケイディディ株式会社 適応形ピツチ抽出方式
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement

Also Published As

Publication number Publication date
US4845753A (en) 1989-07-04
JPS62229200A (ja) 1987-10-07

Similar Documents

Publication Publication Date Title
US4912764A (en) Digital speech coder with different excitation types
US4081605A (en) Speech signal fundamental period extractor
EP0459363B1 (en) Voice signal coding system
US4890328A (en) Voice synthesis utilizing multi-level filter excitation
JPH0636159B2 (ja) ピツチ検出器
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
EP0333121A2 (en) Voice coding apparatus
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US6061648A (en) Speech coding apparatus and speech decoding apparatus
US4873723A (en) Method and apparatus for multi-pulse speech coding
JPH0844395A (ja) 音声ピッチ検出装置
JPH03119398A (ja) 音声分析合成方法
EP0162585B1 (en) Encoder capable of removing interaction between adjacent frames
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JPH0229234B2 (ja)
GB2205469A (en) Multi-pulse type coding system
JPH1020886A (ja) 波形データに存在する調和波形成分の検出方式
JPH0675598A (ja) 音声符号化方法及び音声合成方法
JPH06208398A (ja) 音源波形生成方法
JPS5941597B2 (ja) 音声分析合成装置
JPH06118997A (ja) 音声符号化器
JPS58203499A (ja) 可変長フレ−ム型線形予測ボコ−ダ
JPH11249697A (ja) ピッチ位置抽出方法及びピッチ位置抽出装置