JPS62183500A - 音声のピツチ抽出装置 - Google Patents

音声のピツチ抽出装置

Info

Publication number
JPS62183500A
JPS62183500A JP61026378A JP2637886A JPS62183500A JP S62183500 A JPS62183500 A JP S62183500A JP 61026378 A JP61026378 A JP 61026378A JP 2637886 A JP2637886 A JP 2637886A JP S62183500 A JPS62183500 A JP S62183500A
Authority
JP
Japan
Prior art keywords
normalized autocorrelation
autocorrelation coefficient
pitch
maximum value
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61026378A
Other languages
English (en)
Inventor
幸伸 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61026378A priority Critical patent/JPS62183500A/ja
Publication of JPS62183500A publication Critical patent/JPS62183500A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electronic Switches (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Working-Up Tar And Pitch (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声分析装置並びに音声情報伝達装置に関す
るものであり、音声のピッチ(基本周期)を正確にかつ
簡単に求める方式に関するものである。
従来の技術 従来、音声のピッチを求める方式の1つとして自己相関
方式がある。これを第6図に基づいて説明する。
音声信号1を前処理部2において、低域3波。
サンプリング、プリエンファシスによる高域強調などの
前処理を行った後、データフレーム制御部3においてフ
レーム単位に分割する。以後のデータ処理はフレーム単
位で行う。データフレーム制御部3では、音声データを
20〜30m5程度の時間要分とり込む。また、データ
とり込み開始点を制御することによシ、フレームシフト
を自由に設定することが可能である。フレームに切り出
されたデータから、正規化自己相関係数演算部4におい
て正規化自己相関係数を求める。正規化自己相関係数は
以下に示すようにして求めることができる。
フレーム内のデータ系列をy 、y ・・−・・、7H
と1    2+ すると、正規化自己相関係数rj(i=φ置、n;n 
< N )は次式で求まる。
N−j Σ yi”Yi+j i=1 ”・=  N(i=#・°″°・°2 ・・・・・・(1) 前記正規化自己相関係数は、データの相関の度合を表わ
しており、値が1に近いほど相関が高いことを示してい
る。適当な範囲の正規化自己相関係数列(rj ) (
1=”1 + ”1 +’ + ”’ + n2 ;O
<nl <n2<N)を求めた後、最大値検出部5にお
いて(r、)の最大値r7 を求める。ただし、r o
 (== 1)は対象から除外する。次に、比較部7に
おいて最大値検出部5で得られた正規化自己相関係数の
最大値r7  としきい値設定部6で設定したしきい値
rthとを比較し、その結果に基づいてピッチ決定部1
゜において、ピンチを決定する。ピッチ決定部1゜にお
いては、以下のようにしてピンチを決定する。
t、、〈rthのとき、そのフレームは周期性の低い無
声部であると判定する。r ? r th  のとき、
周期性の高い有声部と判定して、ピッチを計算する。
音声データのサンプリング周波数をfKH2とすると、
ピッチTを T=τ/f  ms          ・・・・・・
(2)として求める。
発明が解決しようとする問題点 従来の自己相関方式やその改良方式においては、正規化
自己相関係数の最大値だけを用いて、音声のピッチを決
定していた。そのため、これらの方法では無声部である
にもかかわらず、正規化自己相関係数の最大値がしきい
値よりも大きい場合に有声部と判定してピッチを求めて
しまい、無声有声誤りを生じていた。第2図によってさ
らに詳しく説明する。第2図は人間のピッチの範囲(2
ms〜20m5程度)に相当する範囲の正規化自己相関
係数の分布を示している。第2図C1第2図すは有声音
の代表的な分布、第2図C1第2図d1第2図θ、第2
図fは無声音の代表的な分布を示す。前記正規化自己相
関係数の最大値のみを用いてピッチを抽出する方式では
、無声音であっても第2図c −fに示すようにしきい
値を超えていれば、有声音と誤って判定されてしまう。
また、このような誤りをしきい値を高くすることによっ
て避けようとしても、今度は有声音でありながら無声音
と誤って判定してしまうという問題が生じる。
すなわち、正規化自己相関係数の最大値としきい値だけ
で正確なピッチ抽出を行うことは困難である。
本発明は、前記従来方式の欠点を除去し、ピッチ抽出誤
りを軽減した音声のピッチ抽出装置を提供することを目
的とする。
問題点を解決するための手段 本発明は、音声信号の正規化自己相関係数を得る正規化
自己相関係数演算手段と、この正規化自己相関係数演算
手段により得られた正規化自己相関係数列から最大値お
よび最大値をとる位置を検出する最大値検出手段と、前
記正規化自己相関係数演算手段により得られた正規化自
己相関係数列から極大点・極小点を抽出する極大極小点
抽出手段と、前記正規化自己相関係数の最大値および最
大値をとる位置、並びに正規化自己相関係数の極大点・
極小点に関する情報をもとにピッチを決定するピッチ決
定手段とを備えた音声のピッチ抽出装置である。
作  用 本発明は、正規化自己相関係数の最大値およびその位置
情報に加えて、正規化自己相関係数の極大点・極小点に
関する情報を用いることにより、有声無声判定誤り、無
声有声判定誤りを軽減することが可能になり、正確なピ
ッチ抽出を行うことができる。
実施例 以下、図面に基づき、本発明について更に詳しく説明す
る。
第1図は本発明にかかる音声のピッチ抽出装置の構成を
示す。
2は音声信号1を低域ろ波した後サンプリングを行い、
さらにプリエンファシスによる高域強調など、前処理を
行う前処理部である。3は前処理部2で前処理を行った
音声データをフレーム単位に分割するデータフレーム制
御部、4はフレーム単位に分割した音声データから正規
化自己相関係数 数を得る正規化自己相関係数演算部、5は正規化自己相
関数の最大値を得る最大値検出部、了は最大値検出部5
で得た正規化自己相関係数の最大値としきい値設定部6
で設定したしきい値との比較を行う比較部、8は正規化
自己相関係数演算部4で得た正規化自己相関係数列に差
分演算を施す差分演算部、9は差分演算部8で得た正規
化自己相関係数列の差分データ列の零交叉位置を検出す
ることによって正規化自己相関係数分布の極大点・極小
点の検出を行う零交叉検出部、そして10は比較部7の
結果と、差分演算部8、零交叉検出部9による正規化自
己相関係数分布の極大点・極小点に関する情報とによっ
てピッチを決定するピッチ決定部である。
以上のように構成された本実施例における音声のピッチ
抽出装置について、以下その動作を説明する。
音声信号1を前処理部2において低域ろ波、サンプリン
グ、プリエンファシスによる高域強調などの前処理を行
った後、データフレーム制御部3においてフレーム単位
に分割する。以降の音声データ処理はフレームごとに行
う。データフレーム制御部3では、フレームとして音声
データを20〜3 Q m B程度の時間要分とり込む
。さらに、データとり込み開始点を制御することにより
、任意の時間長のフレームシフトを行うことが可能であ
る。フレームシフトは、音声の特性変化に追従するため
に5〜20m5程度に設定する。フレーム単位に切り出
しだ音声データから、正規化自己相関数演算部4におい
て正規化自己相関係数列を得る。フレーム内の音声デー
タ系列を71,72+・・・。
7Nとした時、正規化自己相関係数列r 、 (j=n
1゜−・−、n2: O< nl(n2<N )を(1
)式の演算によって得る。この正規化自己相関係数列(
ri)は人間のピッチの範囲(2mg〜20m5  程
度)をカバーできる範囲で求める。例えばサンプリング
周波数10 k)h 、フレーム長30m5の時、フレ
ーム内の音声データ数Nは300であり、ピッチ抽出範
囲2mg〜20 m sの正規化自己相m列は(r2゜
r21.・・・+r2゜。)である。上記のような範囲
で得た正規化自己相関係数列(r、)より、最大値検出
部5において正規化自己相関係数の最大値rr(nlく
τくn2)を求め、比較部6においてしきい値設定部6
で設定したしきい値rthと比較する。この比較結果及
び、最大となる位置τがピッチ決定部に入力される。一
方、正規化自己相関係数演算部4で得た正規化自己相関
係数列(r、’) < +=n1+  ・n1+1.・
・・、n2;○< nl< n 2 <N )から、差
分演算部8において、正規化自己相関係数列の差分デー
タ列を得、さらに零交叉検出部9によって前記差分デー
タ列の零交叉位置を得る。零交叉検出部9によって零交
叉位置を検出する際には、前記差分データ列が負値から
正値に変化して零交叉する場合と、正値から負値に変化
して零交叉する場合とを区別する。例えば、負値から正
値に変化して零交叉する零交叉位置には−1の値を持た
せ、正値から負値に変化して零交叉する零交叉位置には
+1の値を持たせることにより区別できる。第2図に示
す分布をもつ正規化自己相関係数列に上記差分演算部8
、零交叉検出部9における処理を施した結果を第3図に
示す。第2図aが第3図qに、第2図すが第3図りに、
第2図Cが第3図iに、第2図d、fが第3図jのよう
になる。すなわち、差分演算部8、零交叉検出部9にお
ける処理によって、正規化自己相関係数分布の極大点・
極小点を明確化させる。
以上のようにし上書た正規化自己相関係数の最大値1τ
とその位置τ、および正規化自己相関係数列に差分演算
部8、零交叉検出部9の処理を施して得た正規化自己相
関係数分布の極太点・極小点の情報によシ、ピッチ決定
部においてピッチを求める。
第4図にピッチ決定部1oにおけるピッチ決定処理の流
れを示す。まず、比較部アにおける正規化自己相関係数
の最大値rfとしきい値設定部6で設定されたrthと
の比較結果がr 、(r th  の時にはピッチT 
=oとする。ここで、しきい値rthは従来の自己相関
法におけるしきい値よりも低くしておく方が良い。すな
わち、この段階では明らかな無声部だけをピッチT=o
とするようにしきい値設定をする。r7≧rthの時に
は以下の処理を行う。極大点および極小点の有無を見、
極大点・極小点が存在しない場合にはピッチT=oとす
る。
すなわち、この段階では正規化自己相関係数列が第2図
d、e 、fのような分布をする場合に、有声音と誤判
定しピッチを求めることを回避する。
極大点・極小点が存在する場合には、正規化自己相関係
数が最大値をとる位置τの他に、2τまたはτ/2近傍
における、正規化自己相関係数分布の極大点の有無を調
べる。すなわち、倍ピッチ或いは半ピツチの情報を利用
する。2τまたはτ/2近傍に極大点が存在する場合に
はピッチTをサンプリング周波数’KH2とするとT=
τ/ f msとする。2τまたは%τ近傍に正規化自
己相関係数分布の極大点が存在しない場合において、他
の極大点が存在しない場合、すなわち正規化自己相関係
数が最大となる位置でのみ極大となる時には、ピッチT
=τ/fmsとする。2τまたはτ/2近傍に極大点が
存在せず、他の位置に極大点が存在する時にはピッチT
=oとする。
上記ピッチ抽出装置により、第2図c −fにみられる
ような、従来の方式では無声音として分離できなかった
ものを分離することが可能になり、ピッチ抽出を正確に
行える。
本実施例では、正規化自己相関係数分布の極大点・極小
点を明確化する手段として、差分演算部8、零交叉極出
部9を用いることにより、極大点・極小点の情報を複雑
な操作なく簡単に行うことができる。
発明の詳細 な説明したように本発明によれば、音声信号処理におい
て、有声部を無声部と誤判定、あるいは無声部を有声部
と誤判定する誤りを軽減し、簡単で正確なピッチ抽出が
可能である。
また本発明を音声分析合成装置に用いて正確なピッチ抽
出を行うことにより、従来のピッチ情報の誤りを修正す
るという作業を軽減し、かつ正確なピッチ情報による明
瞭な合成音声を得ることができる。
【図面の簡単な説明】
第1図は本発明にかかるピッチ抽出装置の一実施例を示
すブロック図、第2図は各種音声の正規化自己相関係数
の分布図、第3図は正規化自己相関係分布の極大点・極
小点の抽出動作の説明図、第4図は本発明にかかる実施
例のピッチ決定部における処理のフローチャート、第5
図は従来装置のブロック図である。 1・・・・・・音声信号、2・・・・・・前処理部、3
・・・・・・データフレーム制御部、4・・・・・・正
規化自己相関係数演算部、6・・・・・・最大値検出部
、6・・・・・・しきい値設定部、7・・・・・・比較
部、8・・・・・・差分演算部、9・・・・・・零交叉
検出部、10・・・・・・ピッチ決定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第3図 第4図 ンp 浴           壊

Claims (1)

    【特許請求の範囲】
  1. 音声信号の正規化自己相関係数を得る正規化自己相関係
    数演算手段と、この正規化自己相関係数演算手段により
    得られた正規化自己相関数列から最大値および最大値を
    とる位置を検出する最大値検出手段と、前記正規化自己
    相関係数演算手段により得られた正規化自己相関係数列
    から極大点・極小点を抽出する極大極小点抽出手段と、
    前記正規化自己相関係数の最大値および最大値をとる位
    置、並びに正規化自己相関係数の極大点・極小点に関す
    る情報をもとにピッチを決定するピッチ決定手段とを備
    えた音声のピッチ抽出装置。
JP61026378A 1986-02-07 1986-02-07 音声のピツチ抽出装置 Pending JPS62183500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61026378A JPS62183500A (ja) 1986-02-07 1986-02-07 音声のピツチ抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61026378A JPS62183500A (ja) 1986-02-07 1986-02-07 音声のピツチ抽出装置

Publications (1)

Publication Number Publication Date
JPS62183500A true JPS62183500A (ja) 1987-08-11

Family

ID=12191854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61026378A Pending JPS62183500A (ja) 1986-02-07 1986-02-07 音声のピツチ抽出装置

Country Status (1)

Country Link
JP (1) JPS62183500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014145863A (ja) * 2013-01-28 2014-08-14 Shinano Kenshi Co Ltd 音声データ再生速度変換方法および音声データ再生速度変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014145863A (ja) * 2013-01-28 2014-08-14 Shinano Kenshi Co Ltd 音声データ再生速度変換方法および音声データ再生速度変換装置
US9361905B2 (en) 2013-01-28 2016-06-07 Shinano Kenshi Kabushiki Kaisha Voice data playback speed conversion method and voice data playback speed conversion device

Similar Documents

Publication Publication Date Title
CN107045870B (zh) 一种基于特征值编码的语音信号端点检测方法
JPS58143394A (ja) 音声区間の検出・分類方式
JPS62217295A (ja) 音声認識方式
JPH03501657A (ja) パターン認識エラー低減装置
JPS62183500A (ja) 音声のピツチ抽出装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JP3031081B2 (ja) 音声認識装置
US20220199074A1 (en) A dialog detector
JPS5925240B2 (ja) 音声区間の語頭検出方式
JP2744622B2 (ja) 破裂子音識別方式
JP2557497B2 (ja) 男女声の識別方法
JPH0398098A (ja) 音声認識装置
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS59102296A (ja) ピツチ抽出方法
JPS63155196A (ja) 無声音検出方法
JP2844592B2 (ja) 離散単語音声認識装置
JP2891259B2 (ja) 音声区間検出装置
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPS63226691A (ja) 標準パターン作成方式
JPS63155197A (ja) 無声音検出方法
JPS63217399A (ja) 音声区間検出装置
JPS5925238B2 (ja) 音声分析合成方式の音声区間判定方法
JPS59223498A (ja) 音素判別法
JPH0443277B2 (ja)
JPH01170998A (ja) 音韻区間情報形成装置