JPS62270000A - 音声のピツチ周波数検出方法 - Google Patents

音声のピツチ周波数検出方法

Info

Publication number
JPS62270000A
JPS62270000A JP61112517A JP11251786A JPS62270000A JP S62270000 A JPS62270000 A JP S62270000A JP 61112517 A JP61112517 A JP 61112517A JP 11251786 A JP11251786 A JP 11251786A JP S62270000 A JPS62270000 A JP S62270000A
Authority
JP
Japan
Prior art keywords
pitch frequency
circuit
time difference
autocorrelation function
frequency detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61112517A
Other languages
English (en)
Inventor
八木 真介
章 浦野
石津 達雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP61112517A priority Critical patent/JPS62270000A/ja
Publication of JPS62270000A publication Critical patent/JPS62270000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 (産業上の利用分野) 音声を低ビツトレートでディジタル符号化する符号化方
式としてボコーダ方式がよく知られている。この方法は
音声を5〜20m5毎に区切り、その各区間における波
形を特徴づけるパラメータを分析して伝送するのである
が、−gには音声が有声音か無声音かの判別結果と、有
声音の場合はピッチ周波数およびスペクトラム情報の3
種のパラメータで表し、ディジタル符号化して伝送する
。本発明はこれらのうちピンチ周波数の検出方法に関す
るものである。また本発明はピッチ周波数の検出が必要
な音声認識1話者識別等への適用も可能である。
(従来の技術) 第1図は、ボコーダ(VOCODER)方式の符号化回
路の構成原理図である。この図はディジタル演算処理に
よって分析処理を行う例を示している。図中8は音声入
力でAD変換器lにおいてディジタル符号に変換される
。2はスペクトラム分析回路、3は符号器で分析結果を
伝送する情報の形に符号化する。4は信号の前処理回路
、5は検出回路(PD)でピッチ周波数の検出と、有声
音か無声音かの識別を行う、6はPD5における分析結
果を符号化する符号器、7は2つの符号器3と6の出力
を多重化して伝送データ9とするマルチプレクサである
。なおこのようなボコーダ方式の符号化回路については
多数の文献が知られている。
第2図は第1図中のピンチ周波数検出回路(PD)5の
構成側図で、信号の前処理回路4よりの音声17の標本
値は10と11のメモリに蓄積される。12は両メモリ
の出力を乗算し累積する乗算累積回路(MUL)、13
はMUL12の出力の最大値を検出する検出回路(DE
T)、14はメモリアドレスを発生するカウンタ(CT
 R)、15はアドレスシフト回路(S HF)、16
は制御回路(CNT)である。
PD5すなわち第2図の回路は基本的には音声波形をデ
ィジタル化した後必要な前処理を行ったものを適当な間
隔で区切り自己相関関数を計算しその自己相関関数が最
大となる時間差を求め得られた時間差の逆数をピッチ周
波数として検出するピッチ周波数検出回路である。まず
入力17はメモ1月Oと11に分析に使用する区間骨だ
け蓄積される。
第3図はメモリの人、出力波形を示す図であるが、後に
説明するように第3図のaはメモ1月Oの入力波形(実
際はディジタル符号化されているがこの波形はその符号
の表す電圧を示している。)の−例で連続して入力する
音声サンプルから所定の区間Nサンプル分の波形がメモ
リに記憶されるゆいまTはAD変換器のサンプリング間
隔、nは分析区間内のサンプル番号、mは時間差に対応
するサンプル数、Nは分析区間内のサンプル数とすれば
自己相関関数は信号をS (nT)、自己相関関数をa
 (mT)とすれば次式で表される。
a(mT) =Σ5(nT)S ((n+m)T)従っ
である時間差1llTにおける自己相関関数を求めるに
は2つのメモリ10.11の続出しアドレスを互いにm
だけずらして順に読み出し両者をMUL12において乗
算して累積すればよい。第3図はこのようにして2つの
メモリから読み出される波形の例を示し、aとbはそれ
ぞれメモリ10とメモリ11の出力で図から明らかなよ
うにbはaを遅延させた波形になっている。ピッチ周波
数の検出ではこのような計算を分析区間ごとに所定の範
囲についてmの値を変えながら計算を繰返して自己相関
関数を求め、各mの値における自己相関関数の値を比較
し、最大となった時のmの値を求める。そのmの値がピ
ッチ周期(ピッチ周波数の逆数)である。有声音と無声
音の判別はこの自己相関関数の最大値と信号電力の比を
適当なスレショルド値と比較して行う。
説明が後になったが、制御回路16は第2図にて行われ
る各処理のシーケンスをし制御するためカウンタ14の
リセントパルスとカウント用クロックパルス、アドレス
シフト回路15のアドレスシフト数1乗算累積回路12
のシフトレジスフ用クロック。
検出回路13の検出用パルスなどを供給する。
さてメモリ10と11には前記のように同じ波形が蓄積
されるが、蓄積された波形は制御回路16からの制御に
よって繰返して読み出される。カウンタ14はそのアド
レスを発生するカウンタでその出力はメモリ10のアド
レスになっている。
アドレスシフト回路5HF15はカウンタCTR14の
出力から遅延時間に対応するサンプル数mを減算する減
算回路で、その出力がメモリ11のアドレスとして使わ
れる。このためメモリ10.11から読み出される波形
は第3図に示すようにmサンプルだけずれた波形になり
この百出力はMUL12で乗算され、1分析区間分の音
声サンプルについて累積される。検出回路13は遅延サ
ンプル数mの所定の範囲についてMUL12において計
算された自己相関関数の最大値を検出し、そのときのm
の値を記憶する。またその最大値を信号電力と比較し有
声音か無声音かの判定を行う、なお信号電力としてはm
=oの時の自己相関関数の値を使えばよい。
第4図は処理の手順を示すタイムチャートであって、メ
モリへの書込みと自己相関関数の計算および判定は並行
して行われる。図中のCはメモリへの書込み、dは計算
と判定を示しており、Cとdは1区間の音声サンプルを
メモリする間に自己相関の計算および判定が並行して行
われることを示している。従って実際はメモリの書込み
と読出しを時分割で行うかまたはメモリを2つ使って書
込みと読出しを切替えて処理するなどの方法が用いられ
る。
自己相関関数の計算および判定は分析の1区間分の音声
サンプルをメモリしている間に前の区間にメモリされた
音声サンプルについて行われる。
計算はまず信号電力を求めるためアドレスシフト回路1
5のアドレスシフト量mをゼロとしてa (0)を計算
し、検出回路13内のレジスタにメモリする。
その後アドレスシフト量mがmlからmkまでのa (
mT)を順に計算し、その最大値を検出する。ここでm
、、mkはピッチ周波数の検出範囲の最大と最小に対応
するサンプル間隔である。
(発明の具体的な目的) 音声のピッチ周波数は男性の声で80〜270Hz 。
女性の声で100〜400 Hzの範囲にあるといわれ
ている。従って一般のボコーダではピッチ周波数の検出
範囲は80〜400Hzとする必要があり、極めて広い
範囲の検出が要求される。音声波形はピッチ周波数の高
周波の合成波であるばかホルマントの影響も受けるため
自己相関関数の計算出力では時間差がピッチ周期くピッ
チ周波数の逆数)に等しいところで相関関数が大きくな
るばかりでなく、その整数分の−の時間差(すなわちピ
ッチ周期の整数分の−)およびその他の点においても大
きくなる。
通常はピッチ周期に一致したときの値が最大であるが、
その他の点の方が大きくなることがあって、これによる
ピッチ周波数の検出誤りが音声を復元した時の音質劣化
の要因の1つになっている。これは第3図から明らかな
ように第2図のピッチ周波数検出回路では時間差が大き
いほど自己相関関数の計算における累積サンプル数が少
なくなるため低い周波数はど検出し難いことも原因にな
っている。
本発明はこのような欠点を除くため時間差によって相関
関数に重みづけをし、時間差の小さい部分の相関関数を
小さくし、時間差の大きい部分の相関関数を大きくした
後比較することによりピッチ周期の長い(すなわちピッ
チ周波数の低い)場合においても検出を容易にするもの
である。
(発明の構成) 第5図は本発明によるピッチ周波数検出回路の構成側図
である。図中の10〜1日はそれぞれ第2図の同記号と
共通である。また19は乗算器で累積乗算器12からの
自己相関関数の計算入力に時間差に応じた重みづけを行
う。20はその重みづけを行う関数を発生するROM(
リードオンリメモリ)テーブルで、そのアドレスはアド
レスシフト回路(SHF)15に対するシフト入力と同
じである。
5HF15のアドレスシフト量(すなわち自己相関関数
の時間差)とROMテーブル20のアドレス入力は同一
であるから乗算器19の入力では同じ遅延時間に対する
自己相関関数と重みづけ関数が同時に得られ、これらの
乗算を行うことによって重みづけが行われ検出回路13
へ入力する。検出回路13の動作は第2図の従来のもの
と同様である。またこれらの回路はすべてディジタル演
算回路で構成されているので処理シーケンスを制御する
シーケンス制御回路、演算、比較2判定等を共通の回路
で実行する演算回路およびメモリで構成し、プログラム
によって処理を実現するいわゆるプロセンサによって前
記の検出回路を実現することもできる。
(発明の動作) 第5図の回路において乗算累積回路12の出力をa (
mT)と表し、同じ時間差mに対するROMテーブル2
0の出力をw (mT)とすると乗算器19の出力はa
 (mT) w (mT)となる。このW (OI?)
にmの値とともに増加する関数を使用すればmが小さい
ときのa (mT) w (mT)はa (mT)に比
べて小さく、mが大きいときのa、(mT) w (m
T)はa (mT)に比べて大きくすることができる。
この出力を検出回路13に入カレ、第2図と同様の方法
により最大となる時間差mを検出する。
第6図は本発明による重みづけすなわち時間差mに対す
る各関数の値の例で、図中のeは自己相関関数a (m
T)のとり得る最大値、fは重みづけ関数w (mT)
の例、gは積a (mT) w (mT)のとり得る最
大値の例である。eはmとともに直線的に減少するがw
 (mT)を適当に選ぶことによって積のgではその減
少の傾きを任意に変えることができる。
実際には重みづけ関数w (mT)は経験的に最適な値
に設定されるが、これによって前記の欠点のないピッチ
周波数検出回路が実現できる。
(発明の効果) 本発明によう広いピッチ周波数範囲のピッチ周波数検出
回路においても検出誤りの少ない正確な検出が可能とな
り、復元した音声の明瞭度、自然性が良好であるという
効果がある。また音声認識や話者識別等においても正し
い検出に大きな効果がある。
【図面の簡単な説明】
第1図はボコーダ方式の符号化回路の構成原理図、第2
図は従来の第1図中のピッチ周波数検出回路の構成例図
、第3図は第2図回路内メモリの人、出力波形図、第4
図はピッチ周波数検出回路のタイムチャート、第5図は
本発明によるピッチ周波数検出回路の構成例図、第6図
は本発明による重みづけの一例図である。 1・・・AD変換器、2・・・スペクトラム分析回路、
3.6・・・符号器、4・・・信号の前処理回路、5・
・・検出回路、7・・・マルチプレクサ、10、11・
・・メモリ、12・・・累積乗算回路、13・・・検出
回路、14・・・カウンタ、15・・・アドレスシフト
回路、16・・・制御回路、19・・・乗算器、20・
・・ROMテーブル。

Claims (1)

    【特許請求の範囲】
  1. ディジタル符号化した後前処理を施した音声信号を適当
    な間隔で区切り自己相関関数を計算してその自己相関関
    数が最大となる時間差を求め、得られた時間差の逆数を
    ピッチ周波数として検知するピッチ周波数検出回路にお
    いて、自己相関関数の計算結果に前記時間差とともに増
    加する関数を乗算する回路を付加して前記乗算後に最大
    となる時間差を検出することを特徴とする音声のピッチ
    周波数検出方法。
JP61112517A 1986-05-19 1986-05-19 音声のピツチ周波数検出方法 Pending JPS62270000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61112517A JPS62270000A (ja) 1986-05-19 1986-05-19 音声のピツチ周波数検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61112517A JPS62270000A (ja) 1986-05-19 1986-05-19 音声のピツチ周波数検出方法

Publications (1)

Publication Number Publication Date
JPS62270000A true JPS62270000A (ja) 1987-11-24

Family

ID=14588624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61112517A Pending JPS62270000A (ja) 1986-05-19 1986-05-19 音声のピツチ周波数検出方法

Country Status (1)

Country Link
JP (1) JPS62270000A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56102900A (en) * 1980-01-21 1981-08-17 Kokusai Denshin Denwa Co Ltd Voice pitch extracting system
JPS5850358A (ja) * 1981-09-17 1983-03-24 Sanyo Electric Co Ltd ピストン装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56102900A (en) * 1980-01-21 1981-08-17 Kokusai Denshin Denwa Co Ltd Voice pitch extracting system
JPS5850358A (ja) * 1981-09-17 1983-03-24 Sanyo Electric Co Ltd ピストン装置

Similar Documents

Publication Publication Date Title
US4486900A (en) Real time pitch detection by stream processing
US4633748A (en) Electronic musical instrument
KR970001166B1 (ko) 언어 처리 방법 및 장치
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
US5293450A (en) Voice signal coding system
CA1061906A (en) Speech signal fundamental period extractor
CA1124404A (en) Autocorrelation function factor generating method and circuitry therefor
JP3068196B2 (ja) マルチパルス分析音声処理システムおよび方法
US7305337B2 (en) Method and apparatus for speech coding and decoding
Samad et al. Pitch detection of speech signals using the cross-correlation technique
Maksym Real-time pitch extraction by adaptive prediction of the speech waveform
JPS62229200A (ja) ピツチ検出器
JPS62270000A (ja) 音声のピツチ周波数検出方法
EP0545403A2 (en) Speech signal encoding system capable of transmitting a speech signal at a low bit rate
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
US6590946B1 (en) Method and apparatus for time-warping a digitized waveform to have an approximately fixed period
JPH0122639B2 (ja)
JP3112462B2 (ja) 音声符号化装置
JP2583854B2 (ja) 有声無声判定方法
JPS6220560B2 (ja)
JPH0736119B2 (ja) 区分的最適関数近似方法
JPH05241597A (ja) ピッチ周期抽出方法
JPH1020886A (ja) 波形データに存在する調和波形成分の検出方式
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JPS6068000A (ja) ピッチ抽出装置