JPH0679238B2 - ピツチ抽出装置 - Google Patents

ピツチ抽出装置

Info

Publication number
JPH0679238B2
JPH0679238B2 JP59250204A JP25020484A JPH0679238B2 JP H0679238 B2 JPH0679238 B2 JP H0679238B2 JP 59250204 A JP59250204 A JP 59250204A JP 25020484 A JP25020484 A JP 25020484A JP H0679238 B2 JPH0679238 B2 JP H0679238B2
Authority
JP
Japan
Prior art keywords
sequence
pitch
maximum value
cross
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59250204A
Other languages
English (en)
Other versions
JPS61128300A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59250204A priority Critical patent/JPH0679238B2/ja
Publication of JPS61128300A publication Critical patent/JPS61128300A/ja
Publication of JPH0679238B2 publication Critical patent/JPH0679238B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はピッチ抽出装置に関し、特に入力音声のピッチ
抽出処理の安定化を図ったピッチ抽出装置に関する。
〔従来の技術〕
ピッチ情報は音声の分析、合成あるいは認識処理等にお
いて極めて重要な情報であり、入力音声信号からのピッ
チ周期の抽出は音声情報処理における基幹的技術と言え
る。
ピッチ抽出におけるポイントはフォルマントの影響の除
去にあり、従来のこの種のピッチ抽出装置は入力音声の
LPC(Linear Prediction Coding,線形予測係数)分析に
よつて求めた音源情報の微細構造を示す残差波形の直接
的な自己相関をとることによって行われていた。これ
は、入力音声が周期的であれば入力音声のピッチ周期と
同じ遅れ時間における自己相関係数が最大値をとるとい
う原理にもとづくもので公知かつ一般的によく利用され
ている手法である。
〔発明が解決しようとする問題点〕
しかしながら上述した従来のピッチ抽出手法は、ピッチ
抽出における要点としてのフォルマントの影響の除去も
達成され多くの利用状態においても有効であるが、なお
次のような欠点を有する。
すなわち、アルファベットのN、M等の如き鼻音では残
差電力が極端に小さくなるため安定したピッチ抽出がで
きなくなってしまうほか、周囲雑音が入力音声に印加さ
れた場合には入力音声よりもさらにS/N(Signal to Noi
se)比が低下しピッチ抽出が不安定となってしまうとい
う欠点がある。本発明の目的も上述した欠点を除去した
ピッチ抽出装置を提供することにある。
〔問題点を解決するための手段〕
本発明の装置は、入力音声のピッチ周期を抽出するピッ
チ抽出装置において、LPC分析手段と、このLPC分析手段
で抽出したLPC係数で定義される音声合成フィルタのイ
ンパルス応答を算出するインパルス応答算出手段と、ス
ペクトル包絡に対応する周波数重み付けを施した前記入
力音声と前記インパルス応答との相互相関係数列を算出
する相互相関係数列算出手段と、前記インパルス応答の
自己相関係数列を算出する自己相関系列算出手段と、前
記相互相関係数列の最大値を検索するとともにこの最大
値にもとづき前記相互相関係数列と前記自己相関係数列
で補正しつつ相互相関係数の最大値系列を検索しマルチ
パルスとして出力する相互相関最大値系列検索手段と、
前記マルチパルスの自己相関係数の最大値の時間位置も
しくは前記マルチパルスの自己差分の絶対値和を最小と
する時間位置を検索することによって周期を求めるピッ
チ抽出手段とを備えた構成を有する。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。第1図は
本発明の第1の実施例のピッチ抽出装置の構成を示すブ
ロック図である。
第1図に示す第1の実施例は聴感重み付器1、LPC分析
器2、相互相関係数算出器3、インパルス応答算出器
4、最大値系列検索器5、自己相関係数算出器6、自己
相関係数算出器7および最大値検索器8等を備えて構成
される。
聴感重み付器1は、後述する最大値系列検索器5の出力
として得られるマルチパルスの符号化における量子化ノ
イズの聴音的重み付け、いわゆるノイズシェーピング
(noise Shaping)を入力音声に対して実施するもので
あり、次の(1)式による特性W(Z)の重み付フィル
タを有する。
(1)式において、akはLPC分析器1から供給されるLPC
係数、pはその次数、γは重み付係数、Zは全極型ディ
ジタルフィルタのZ変換表示における伝達関数H(Z-1)の
Zに対応する。
上述したノイズシェーピングを入力音声に対して実施す
ることは、入力音声のスペクトル包絡に対応した周波数
重み付けの付与を確保するものである。
LPC分析器2は入力音声を分析フレームごとに、予め設
定したビット数のディジタル量として量子化したうえこ
れをLPC分析してp次のαパラメータak(k=1〜p)
を抽出し、αパラメータを聴感重み付器に供給するとと
もにインパルス応答算出器4にも供給する。なお、ノイ
ズシェーピングを行わないときには聴感重み付器1は不
要となる。
LPC分析器2によって分析、抽出されるαパラメータは
また減衰係数重み付けを施したものとして出力される
が、この重み付けは次の(2)式の内容で示されるよう
に分析されたp次のαパラメータαに次の(2)式の
処理を施したものである ak=αγ、 ……………(2) (2)式において減衰係数γは、0<γ1.0でありノ
イズシェーピングによる聴覚的最適化により適切な値が
経験的に選択され本実施例ではγ=0.8としている。
さて、インパルス応答算出器4は次の(3)式で示す伝
達関数を有する全極型ディジタルフィルタのインパルス
応答を算出し、これを相互相関係数算出器3と自己相関
係数算出器6とに供給する。
相互相関係数算出器3は聴感重み付器3による聴感重み
付け入力音声とインパルス応答との相互相関をとり、そ
の相互相関係数列を最大値系列検索器5に供給する。
自己相関係数算出器6はインパルス応答の自己相関をと
り、その自己相関係数列を最大値系列検索器5に供給す
る。
最大値系列検索器5は入力した相互相関係数列の最大値
を検索し、検索された最大値によって相互相関係数列を
自己相関係数列で補正しつマルチパルスとしての相互相
関最大値系列を検索するものであり、いわゆる相関領域
評価にもとづくマルチパルス検索を実施するものであ
る。
(4)式はこのようなマルチパルス検索の関係式であ
る。
……………(4) (4)式において、miは分析フレーム内のi番目の音源
パルスのフレーム端から時間位置、giはその振幅、φhx
(mi)は時間遅れmiにおける相互相関係数、glは分析フ
レーム内l番目のパルス振幅、Rhh(|ml−mi|)はイン
パルスレスポンスの自己相関係数である。(4)式から
も明らかな如く、振幅gi(mi)は相互相関係数列とインパ
ルスレスポンスの自己相関係数との差を求めることによ
って得られ、また時間位置miにおいてこのようなパルス
を発生するとgi(mi)が最適なものとして得られる。すな
わち、相互相関係数列を自己相関係数列との類似度を尺
度として補正しつつ相互相関係数列を検索することによ
って決定しうる。換言すれば、ある音源パルスに着目し
種種の時間位置で(4)式によってその振幅を計算し絶
対値を最大とするものが最も音源パルスと近似したパル
スとして得られ、この操作を繰返して複数個の音源パル
スすなわちマルチパルスを得るのである。
最大値系列検索器5からこうして出力されたマルチパル
ス列は次に自己相関係数算出器6においてその自己相関
係数を算出したのちこれを最大値検索器8に供給する。
最大値検索器8はマルチパルスの自己相関係数列を検索
して得られる最大値の時間位置からマルチパルスの周
期、すなわち音源パルスのピッチ周期データを得る。
第2図は本発明のピッチ抽出装置の第2の実施例の構成
を示すブロック図である。
第2図において記号番号1〜6は第1図における同記号
番号と全く同一内容のものでありこれらに関する詳細な
説明は省略する。一点鎖線で示す差分絶対値和算出回路
9と最小値検索器10とが第1の自己相関係数算出器7お
よび8と置換して配置され、最大値系列検索器5から出
力されるマルチパルスを利用してピッチを抽出する部分
である。
差分絶対値和算出器9はマルチパルス相互間の差分の絶
対値をとりその和を算出し最小値検索器10に供給する。
最小検索器10は差分絶対値和が最小であるものを検索し
これにもとづき最大値の時間位置情報すなわちピッチ周
期データを得る。
上述したピッチ周期データの取得を、さらに詳述すれば
次のとおりである。すなわち、検索したマルチパルス列
に対して同じマルチパルス列をシフトさせつつ差分の絶
対値をとり、その和を算出していくと、ピッチ周期を有
する周期的信号ではピッチ周期の時間位置で2つのマル
チパルス列がほぼ合致し、2つのマルチパルスの差分、
つまりマルチパルスの自己差分の絶対値和が最小とな
り、この観点にもとづいてピッチ周期が確保できる。
第3図は本発明のピッチ抽出装置の第3の実施例の構成
を示すブロック図である。
第3図に示す第3の実施例のピッチ抽出装置は、一点鎖
線で示す相互積和算出器11と自己積和算出器12が第1図
に示す第1の実施例に追加された点のみ異なり他の同記
号番号のものはすべて第1図の構成内容と同じであるの
でこれらに関する詳細な説明は省略する。
第3図に示す第3の実施例のピッチ抽出装置は類似度演
算にもとづくマルチパルス決定アルゴリズムを利用する
ものであり、その詳細は特願昭58-149007「マルチパル
ス型ボコーダ」に詳述されている。
この決定アルゴリズムはマルチパルス符号化効率の向
上、すなわち同一マルチパルス数でのS/N比の向上を考
慮して実施するものであり、第1、2図に示すマルチパ
ルス検索と異る点は次のような内容である。
すなわち最大値系列検索器5は第1および第2図に示す
第1および第2の実施例の場合と異なり一点鎖線で示す
相互積和算出器11および自己積和算出器12の出力を利用
するマルチパルス検索を行う。
相互積和算出器11は、相互相関係数算出器3から供給さ
れる相互相関係数列と自己相関係数算出器12から供給さ
れる自己相関係数列との相互積和を算出し、この相互積
和を上記両相関係数間の類似度列として利用する。
最大値系列検索器5は前記相互積和の最大値を検索しこ
の最大値とパルス位置が一致するとともにこの最大値振
幅をもつパルスを、マルチパルスを構成する第i番目の
パルスとして決定する。こうして決定されるi番目(i
=1,2,………)番目のパルスと自己積和算出器12から供
給される自己積和列とを用いて前記相互積和列を修正す
る。自己積和算出器12は自己相関係数算出器6から供給
された自己相関係数列からその自己積和を算出し最大値
系列検索器5に供給する。
さて、最大値系列検索器5は、修正された相互積和列の
絶対値をとりその最大値を検索し、この最大値き位置と
パルス位置が一致しかつこの最大値を振幅とするパルス
を第i+1番目のパルスとして決定、あとはこれを繰返
して必要なパルス数のマルチパルス列を得てこれを自己
相関係数算出器7に供給する。
自己相関係数算出器7と最大値検索器8とによるピッチ
周期データの抽出は第1図に示す第1の実施例と同じで
ありその詳細な説明は省略する。
このようにして第3の実施例においては相互相関係数列
と自己相関係数列との類似度列としてのこれら両係数列
の相互積和列の絶対値の最大値を検索してマルチパルス
を決定する点が第1の実施例との基本的相違点であり、
この手法によってマルチパルス検索処理が第1および第
2の実施例の場合に比して非常に改善されたものとな
る。
第4図は本発明の第4の実施例の構成を示すブロック図
である。この第4の実施例は第3図に示す第3の実施例
ではマルチパルス列からピッチ周期データを抽出する場
合に自己相関係数算出器7と最大値検索器8とを利用し
ているが第4図の実施例ではこれを差分絶対値和算出器
9と最小値検索器10とによって実施している点のみ異な
るものであり、これらは第2図の第2の実施例における
ものと全く同一であるので詳細な説明は省略する。
また、第1および第2図に示す第1および第2の実施例
におけるピッチ周期抽出において、ピッチ検索範囲を入
力音声のピッチ分布範囲のみを対象として処理しさらに
ピッチ周期抽出処理を容易にした第5の実施例のほか、
第3および第4図に示す第3および第4の実施例におけ
るピッチ周期抽出におけるピッチ検索範囲を入力音声の
ピッチ分布範囲のみを対象として処理する第6の実施例
があるがこれらはいずれもピッチ検索範囲をピッチ分布
範囲に限定するものであり、分析フレームごとに抽出す
べきピッチ周期の検索範囲を声帯音源のピッチ周波数の
分布を考慮し、分析フレーム全体を対象とせず数mSEC〜
10数mSEC(秒)のピッチ分布範囲のみを対象とし、これ
をピッチ抽出目的等に対応して予め設定した設定範囲に
限定して処理するものであり、これは第1図から第4図
までの第1から第4の実施例においてマルチパルス列か
らピッチ周期を検出する際の処理を上記周期範囲に限定
して実行しさえすればよく、これは容易に実施しうるこ
とは明らかで図示による詳細な説明は省略する。
上述した第1〜第6の実施例は、いずれもいわゆる相関
領域処理にもとづいて決定したマルチパルス列からピッ
チ周期を抽出するものであり、このため残差電力レベル
が極端に小さい場合や高い周囲雑音が存在する場合でも
本質的に安定したマルチパルス決定、従ってピッチ周期
決定が可能となる。
なお、第3図および第4図に示す実施例において類似度
列として利用している、相互相関係数列と自己相関係数
列との積和列は、これと同等な他の類似度数列で置換し
てもよい。
〔発明の効果〕
以上説明した如く本発明によれば、入力音声のピッチ周
期を抽出するピッチ抽出装置において、入力信号とLPC
合成フィルタのインパルス応答との相互相関係数列、も
しくは相互相関係数列とインパルス応答の自己相関係数
列との相互積和列いずれかに関する最大値系列の検索を
介して求めたマルチパルス列における繰返し性を追求し
つつピッチ周期を求める手段を備えることにより、入力
音声が鼻音等で極めて残差電力が小さい場合や入力音声
に周囲雑音が印加された場合等においてもピッチ抽出が
極めて安定した状態で実施できるピッチ抽出装置が実現
できるという効果がある。
【図面の簡単な説明】
第1図は本発明のピッチ抽出装置の第1実施例の構成を
示すブロック図、第2図は第2の実施例の構成を示すブ
ロック図、第3図は第3の実施例の構成を示すブロック
図、第4図は第4の実施例の構成を示すブロック図であ
る。 1……聴感重み付器、2……LPC分析器、3……相互相
関係数算出器、4……インパルス応答算出器、5……最
大値系列検索器、6,7……自己相関係数算出器、8……
最大値検索器、9……差分絶対和算出器、10……最小値
検索器、11……相互積和算出器、12……自己積和算出
器。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】入力音声のピッチ周期を抽出するピッチ抽
    出装置において、LPC分析手段と、このLPC分析手段で抽
    出したLPC係数で定義される音声合成フィルタのインパ
    ルス応答を算出するインパルス応答算出手段と、スペク
    トル包絡に対応する周波数重み付けを施した前記入力音
    声と前記インパルス応答との相互相関係数列を算出する
    相互相関係数列算出手段と、前記インパルス応答の自己
    相関係数列を算出する自己相関系列算出手段と、前記相
    互相関係数列の最大値を検索するとともにこの最大値に
    もとづき前記相互相関係数列と前記自己相関係数列で補
    正しつつ相互相関係数の最大値系列を検索しマルチパル
    スとして出力する相互相関最大値系列検索手段と、前記
    マルチパルスの自己相関係数の最大値の時間位置もしく
    は前記マルチパルスの自己差分の絶対値和を最小とする
    時間位置を検索することによって周期を求めるピッチ抽
    出手段とを備えてピッチ抽出を行なうことを特徴とする
    ピッチ抽出装置。
  2. 【請求項2】前記相互相関係数列と前記自己相関数列と
    の類似度列としての相互積和列ならびに前記自己相関係
    数列の自己積和列を算出したうえ前記相互積和列の最大
    値を検出するとともにこの最大値ともとづき前記相互積
    和列を前記自己積和列で補正しつつ前記相互積和列の最
    大値系列を検索してマルチパルスとして出力する相互積
    和列最大値系列検索手段を前記相互相関最大値系列検索
    手段に代えて実施してピッチ抽出を行うことを特徴とす
    る特許請求の範囲第(1)項記載のピッチ抽出装置。
  3. 【請求項3】ピッチ検索範囲がピッチ分布範囲に限定さ
    れたものであること特徴とする特許請求の範囲第(1)
    項記載のピッチ抽出装置。
  4. 【請求項4】ピッチ検索範囲がピッチ分布範囲に限定さ
    れたものであることを特徴とする特許請求の範囲第
    (2)項記載のピッチ抽出装置。
JP59250204A 1984-11-27 1984-11-27 ピツチ抽出装置 Expired - Lifetime JPH0679238B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59250204A JPH0679238B2 (ja) 1984-11-27 1984-11-27 ピツチ抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59250204A JPH0679238B2 (ja) 1984-11-27 1984-11-27 ピツチ抽出装置

Publications (2)

Publication Number Publication Date
JPS61128300A JPS61128300A (ja) 1986-06-16
JPH0679238B2 true JPH0679238B2 (ja) 1994-10-05

Family

ID=17204366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59250204A Expired - Lifetime JPH0679238B2 (ja) 1984-11-27 1984-11-27 ピツチ抽出装置

Country Status (1)

Country Link
JP (1) JPH0679238B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0690638B2 (ja) * 1986-06-25 1994-11-14 松下電工株式会社 音声分析方式
JP2629762B2 (ja) * 1988-01-11 1997-07-16 日本電気株式会社 ピッチ抽出装置
JP3089967B2 (ja) * 1995-01-17 2000-09-18 日本電気株式会社 音声符号化装置
JP4065314B2 (ja) 2006-01-12 2008-03-26 松下電器産業株式会社 対象音分析装置、対象音分析方法および対象音分析プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT374440B (de) * 1981-04-16 1984-04-25 Ruthner Industrieanlagen Ag Verfahren zur gleichzeitigen reinigung bzw. entgiftung von cr-(vi)-haeltigen abwaessern oder loesungen und nox-haeltigen abwaessern oder abgasen (x=0,5 bis 2,0)

Also Published As

Publication number Publication date
JPS61128300A (ja) 1986-06-16

Similar Documents

Publication Publication Date Title
KR0134158B1 (ko) 음성인식장치
Talkin et al. A robust algorithm for pitch tracking (RAPT)
US10410623B2 (en) Method and system for generating advanced feature discrimination vectors for use in speech recognition
US5091948A (en) Speaker recognition with glottal pulse-shapes
US4827516A (en) Method of analyzing input speech and speech analysis apparatus therefor
JP2778567B2 (ja) 信号符号化装置及び方法
EP0342687B1 (en) Coded speech communication system having code books for synthesizing small-amplitude components
EP0773533B1 (en) Method of synthesizing a block of a speech signal in a CELP-type coder
EP0784846B1 (en) A multi-pulse analysis speech processing system and method
US4720865A (en) Multi-pulse type vocoder
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
Schroeter et al. Speech parameter estimation using a vocal tract/cord model
Prasad et al. Speech features extraction techniques for robust emotional speech analysis/recognition
US8219391B2 (en) Speech analyzing system with speech codebook
US5845092A (en) Endpoint detection in a stand-alone real-time voice recognition system
JPH0679238B2 (ja) ピツチ抽出装置
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
JPH0782360B2 (ja) 音声分析合成方法
Wong On understanding the quality problems of LPC speech
JP3471542B2 (ja) 音声符号化装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
Mittal et al. A sparse representation of the excitation source characteristics of nonnormal speech sounds
Hacioglu et al. Pulse-by-pulse reoptimization of the synthesis filter in pulse-based coders
JPH04342298A (ja) 瞬時ピッチ分析方法及び有声・無声判定方法
JPS60250399A (ja) 音声メツセ−ジ識別方式