JPS62269200A - 音声ピツチ抽出方式 - Google Patents

音声ピツチ抽出方式

Info

Publication number
JPS62269200A
JPS62269200A JP61113398A JP11339886A JPS62269200A JP S62269200 A JPS62269200 A JP S62269200A JP 61113398 A JP61113398 A JP 61113398A JP 11339886 A JP11339886 A JP 11339886A JP S62269200 A JPS62269200 A JP S62269200A
Authority
JP
Japan
Prior art keywords
waveform
pitch
correlation
extraction
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61113398A
Other languages
English (en)
Inventor
鈴木 龍司
大橋 秀紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP61113398A priority Critical patent/JPS62269200A/ja
Publication of JPS62269200A publication Critical patent/JPS62269200A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声におけるピ・7千周期を抽出する装置に関
するものである。
〔従来技術〕
音声信号に含まれる冗長性を除去し、音声を特徴パラメ
ータで高能率符号化する分析法及びこの符号をもとに音
声を合成する合成法が開発されている。これらの分析で
得る音声の特徴パラメータの一つに音声のピンチ周期(
声帯の基本振動層M)がある。ピッチ周期は合成音声の
音質を決定する重要なパラメータであり、従来より、ピ
ッチ抽出の誤り率の低減をめざし、数々の方法が検討さ
れている。これらの方法は主に音声信号の相関値による
方法、音声信号から声道のパラメータを抽出した後の波
形(残差波形)の相関値による方法、音声信号のフーリ
エ変換の対数の逆フーリエ変換によるケプストラム法な
どに大別される。これらの方法はその演算の複雑さによ
り、多くの演算時間を必要とするため音声の実時間分析
には適さず、もっばらコンピュータによるオフラインの
分析に使用されてきた。音声分析の応用としては音声を
入力とする各種のコントロール装置、音声の記録再生装
置が考えられるが、全て実時間による処理が必要とされ
る。このために実時間で音声分析する方法、中でも音声
のピンチ抽出をより高精度に短時間で行えるピッチ抽出
法の開発が待たれている。
従来のピッチ抽出法として一般的なものに波形の自己相
関関数によりピンチ周期を求める方法がある。今、音声
波形をサンプリングした場合、波形の自己相関関数は(
1)式であら゛わされる。
ここでXtはサンプリングされた離散的波形値、Nは1
分析フレーム周期内の波形サンプル総数、τは任意の時
間間隔、ρτはτ時間間隔離れた波形の自己相関関数値
である。当然τはサンプリング周期をΔT (=1/f
、 、f、:サンプリング周波数)とすれば(2)式の
ような離散値をとる。
τ=nΔT    ・・・(2) (nは1,2.3・・・N、整数値) 周知のごとく、波形の自己相関関数は波形の線形の関連
の度合いを示す尺度であり、波形が周期関数である場合
には波形と同じ周期をもつ。今、第7図に示される音声
波形の自己相関関数とてとの関係を図示すると第8図の
ごとく、音声波形のピッチ周期とその整数倍の位置に極
値をもち、その最大値をとるτの値が音声波形のピッチ
周期を表す。以上が自己相関関数によるピンチ抽出の概
要である。この方式ではfl1式に示されるごとく、τ
に関する1つの自己相関関数値を求めるためにはN−τ
回の積和演算が必要となる。一般に積演算は和演算に比
べ4〜5倍の時間を要する。
この積演算を削除するために、波形の極性相関によるピ
ッチ抽出法が考えられている。これは(1)式において
、XL 、Xt*rを波形の極性(正負の符号)のみ、
即ち波形の振幅情報を含まないものに置き換え、xl 
・X t* rの演算を極性の一致に置き換えたもので
ある。極性一致をとる演算は簡略なワイヤードロジック
に置きかえることが可能であるため、通常の相関に比べ
積演算の分だけ演算時間を短縮できる。しかし、この極
性相関によるピッチ抽出はその抽出精度が低く、特に男
性の声の場合、ピッチ周期抽出誤りが多い。この理由は
ピッチ抽出に用いるサンプルデータ値は極性のみであり
、振幅情報を含んでいないためである。
〔発明が解決しようとする問題点〕
上述の欠点をなくしたものに特公昭58−57758号
の音声ピンチ周期抽出装置がある。これは音声波形をm
値(m≧3)に分類符号化し、この信号の相関関数より
ピッチを抽出する方式であるが、m値分[(m≧3)の
ためのハードウェア、ソフトウェアがやはり複雑である
という問題点があった。
c問題点を解決するための手段〕 本発明はこのような従来技術の問題点を解消し、ハード
ウェア、ソフトウェア共に簡単なピッチ周期抽出方式を
提供することを目的とする。
本発明に係る音声ピッチ抽出方式は、人力音声をしきい
値が相異る2組の2値化回路にて符号化し、符号化され
た2組の音声データを用いて相関演算を行い入力音声信
号のピッチ周期を抽出することを特徴とする。
〔作用〕
入力信号Xをしきい値A、Bにて2値化してXA(XA
6. *p、、・・・XA、、、 XB (XBo、 
’XBt・・・XB、)を得たとするとXA、XBに対
する相関係数V(■。、Vl ・・・V、)は例えば V、=XAO・xtto+x^+’XB++・・・+X
An−XB、lV 1 = XAo ’ XBI + 
XAI ・XB2+・・−+ XAn−、−XBllV
m=XAo ・ XL  +XA+  ’  X8m+
1+”’ +XA+5−1ll’  XB+sと得られ
る。この■のピーク値に対応してピンチ周期を求めるこ
とができる。
〔実施例〕
以下本発明をその実施例を示す図面に基づいて具体的に
説明する。
第1図は本発明方式を実施するための装置の構成を略示
するブロック図である。図示しないマイクロホン等にて
入力された音声信号Xは相異るしきい値A、Bを有する
2値化回路1.2に入力され、2値化された信号XA、
XBを得る。これらの信号は夫々にデ、−タメモリ3.
4に一旦記憶され、次いで相関回路5に入力されて2値
化回路1゜2から直接入力される後のサンプリング値と
で相関係数Vが算出される。相関係数Vはピンチ抽出回
路6へ与えられ、ここでピッチ周期が求められる。しき
い値A、Bは可変としても固定としてもよい。
第2図は入力された音声信号Xとしきい値A。
Bとの関係及び2値化回路1.2にて得た信号XAXB
を示している(但ししきい値A > Lきい値Bの場合
)。
2値化回路出力XA、XBをXA  (XA、、 XA
I・・・XA、l) 、  XB  (XBo、  X
B+・・・XB、)とすると相関回路5ではその相関係
数V (V。、■よ・・・V、)は下記(3)、 +4
>式から求められる。
・・・(3) このようにして算出された相関係数を用いて得られる相
関関数は第3図に示すようにピー/7値を有し、最大値
をとるnΔTの値(ここではPで表す)が入力音声のピ
ッ・チ周朋となる。
第4図は本発明の他の実施例を示している。この実施例
においては人力音声信号はA/Dコンバータ7にてディ
ジタル信号に変換され、このディジタル信号はデータパ
フファメモリ8に一旦記憶され、これが満たされるとデ
ータメモリ9に記憶される。そしてデータメモリ9のデ
ータを正規化回路10において、絶対値の最大値にて除
算する等、の正規化処理をして再度データメモリ9に記
憶させる。そしてこの正規化されたデータメモリ9の内
容を入力に応じて時系列的に読出して2つの2値化回路
1.2へ与える。
2値化した信号XA、XBを一旦データメモリ3.4に
記憶させ、その後これを読出して前同様相関回路5にて
相関係数■を算出し、これをピ・7チ抽出回路6に与え
てピッチ周期を求めるのは先の実施例と同様である。
なお相関回路5にて式(31,(4)の演算を行うに際
してはXAとXBとの乗算を第1表のように行うことが
効果的である。
第1表 注:しきい値A>Lきい値BとしたのでXA =0、X
B=1は存在しない。
以上のように各1ビツトの2値化データ2組にて実質的
に(00)z、 (01)2.(10)zの3値化が可
能なのである。
〔効果〕
本発明の効果を特公昭58−57758号に示された3
値化方式と比較して説明する。3値化方式においては入
力音声データは符号ビットと振幅ビットとの2ビツトで
表わされるのに対し、本願発明では各2値化回路出力の
1ビツト×2=2ビツトであるから、これらを記憶する
ためのメモリ容量は同様である。
ところが相関係数の演算についてみると本発明では第1
表に示す演算を行えばよいから1ビツトの加算器50で
足りるのに対し3値化方式では第6図に示すように3値
化回路61出力と、先にサンプリングされて記憶されて
いるデータメモリ62内データの各2ビツトのデータの
乗算を必要とするから2×2ビット乗算器を要する。
この対比から明らかな如く本発明による場合はハードウ
ェア更にはソフトウェアの簡略化が可能となり、簡略な
装置にて高精度のピッチ周期抽出を実時間で行うことが
できる。
【図面の簡単な説明】
第1図は本発明方式を実施するための装置の構成を略示
するブロック図、第2図はその動作説明図、第3図はピ
ンチ周期の決定方法の説明図、第4図は本発明方式を実
施するための装置の他の構成を示すブロック図、第5.
6図は本発明の詳細な説明するためのブロック図、第7
.8図は従来方式の説明図である。 1、 2・・・2値化回路 3.4・・・データメモリ
5・・・相関回路 6・・・ピンチ抽出回路時 許 出
願人  三洋電機株式会社 代理人 弁理士  河 野  登 夫 第 1 図 に42  図 第3図 音15イ8 第4図 第5図 第6図 一ヒ°7+周期工P 篤 ’7[2] 第8図

Claims (1)

    【特許請求の範囲】
  1. 1、入力音声をしきい値が相異る2組の2値化回路にて
    符号化し、符号化された2組の音声データを用いて相関
    演算を行い入力音声信号のピッチ周期を抽出することを
    特徴とする音声ピッチ抽出方式。
JP61113398A 1986-05-16 1986-05-16 音声ピツチ抽出方式 Pending JPS62269200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113398A JPS62269200A (ja) 1986-05-16 1986-05-16 音声ピツチ抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113398A JPS62269200A (ja) 1986-05-16 1986-05-16 音声ピツチ抽出方式

Publications (1)

Publication Number Publication Date
JPS62269200A true JPS62269200A (ja) 1987-11-21

Family

ID=14611287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113398A Pending JPS62269200A (ja) 1986-05-16 1986-05-16 音声ピツチ抽出方式

Country Status (1)

Country Link
JP (1) JPS62269200A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158312A (ja) * 2006-12-25 2008-07-10 Oki Electric Ind Co Ltd ピッチ推定器及びピッチ推定方法、並びに、自己相関演算器及び自己相関演算方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158312A (ja) * 2006-12-25 2008-07-10 Oki Electric Ind Co Ltd ピッチ推定器及びピッチ推定方法、並びに、自己相関演算器及び自己相関演算方法

Similar Documents

Publication Publication Date Title
EP0266620A1 (en) Method of and device for speech signal coding and decoding by parameter extraction and vector quantization techniques
JPH0361959B2 (ja)
EP0657873A2 (en) Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method
US4081605A (en) Speech signal fundamental period extractor
KR19990024267A (ko) 포만트 유사도 측정에 의한 피솔라를 이용한 음성 파형 부호화방식
EP0004759B1 (en) Methods and apparatus for encoding and constructing signals
US4388491A (en) Speech pitch period extraction apparatus
US5231397A (en) Extreme waveform coding
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
EP2244261A2 (en) Bit depth upscaling of digital audio data
JPS62269200A (ja) 音声ピツチ抽出方式
Maksym Real-time pitch extraction by adaptive prediction of the speech waveform
US5696875A (en) Method and system for compressing a speech signal using nonlinear prediction
WO2002013180A1 (fr) Traitement de signaux numeriques, systeme d'apprentissage appareil a cet effet et support de stockage de programmes
WO2020044362A2 (en) Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope
JPH07199996A (ja) 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
JPS62229200A (ja) ピツチ検出器
WO2002013182A1 (fr) Procede de traitement de signaux numeriques, procede d'apprentissage, appareil associe et support de stockage de programmes
Sankar Pitch extraction algorithm for voice recognition applications
JP2002049395A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JPS605000A (ja) ピツチ抽出装置
JPH1020886A (ja) 波形データに存在する調和波形成分の検出方式
KR20020084201A (ko) 오디오 또는 음성 신호를 인코딩하기 위한 파라메트릭인코더 및 방법
JPS63124100A (ja) 基本周波数分析装置
JPS6037658B2 (ja) 時系列波形符号化装置