JPH0225518B2 - - Google Patents

Info

Publication number
JPH0225518B2
JPH0225518B2 JP55042924A JP4292480A JPH0225518B2 JP H0225518 B2 JPH0225518 B2 JP H0225518B2 JP 55042924 A JP55042924 A JP 55042924A JP 4292480 A JP4292480 A JP 4292480A JP H0225518 B2 JPH0225518 B2 JP H0225518B2
Authority
JP
Japan
Prior art keywords
coefficients
formant
combination
pole
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP55042924A
Other languages
English (en)
Other versions
JPS55166700A (en
Inventor
Furanshisukasu Biremusu Reonarudosu
Ranberutasu Maria Fuoguten Reonarudosu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JPS55166700A publication Critical patent/JPS55166700A/ja
Publication of JPH0225518B2 publication Critical patent/JPH0225518B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Description

【発明の詳細な説明】 本発明は、サンプリング周期Tを有する予定の
レートでサンプリングされた音声信号の、特定の
持続時間の順次のセグメントから次数2nの巡回
型デジタル全極フイルタの2n個の係数aj(ここに
j=1、2、……、2nである)を取出す音声分
析方式を用いた音声合成装置で前記の全極フイル
タの極を制御するホルマントパラメータを決定す
るホルマントパラメータ決定法に関するものであ
る。
文献IEEE Transaction on Acoustics、
Speech and Signal Processing、Vol.ASSP−
22、No.2、Apr、1974、PP.135−141には、ホル
マントを抽出する方法が記載されており、この方
法によればフイルタの伝達関数の分母を零に設定
することにより極を取出することができる。
文献Journal of the Acoustic Society of
America、Vol.63、No.5、May 1978、PP.1638
−1640には、全極フイルタは一次と二次との数個
の全極フイルタの縦続接続体とみなしうるという
ことが記載されている。第1図はこの文献に基づ
いて偶数個の極に対して構成した既知の音声合成
装置を示す。この音声合成装置は、パルス発生器
1と、雑音発生器2と、有声−無声スイツチ3
と、増幅器4と、二次全極フイルタ5,6,7お
よび8の縦続接続体とから成る。
パルス発生器1はピツチパラメータF0により
制御される。スイツチ3は有声−無声情報V/U
により制御される。振幅パラメータAは増幅器4
を制御する。フイルタ5,6,7および8はホル
マント周波数Fと帯域幅Bとを規定するホルマン
トパラメータF1,B1;F2,B2;F3,B3および
F4,B4により制御される。
高次のデジタルフイルタのフイルタ係数を計算
する方法は、1968年8月に東京で開催された音響
学に関する会議で用いられた文献Proceedings
of the International Congress on Acoustics、
C−5−5、から既知である(J.L.Flanagan著、
Speech Analysis Synthesis and Perception、
第2版、第364〜367頁参照)。この方法では音声
の短時間自動相関関数が用いられている。
全極フイルタの極対を決定する場合、実数の係
数を有する代数方程式の複素根を解くベアストウ
(Bairstow)法を用いることができる。この方法
は1965年に発行された本、Introduction to
Numerical Analysis(C.E.Frobdrg、Addison、
Wesley著)に記載されている。
ホルマント抽出を行なう場合、極対は、これら
の極対をあるホルマント領域に簡単に割当てうる
ようになる順序で常に生じないという問題や、実
数の極が生じるおそれがあり、これらの実数の極
はホルマントとみなすことができないという問題
が生じる。
ホルマント、すなわち中心ホルマント周波数や
帯域幅は極対から計算でき、これらのデータは周
波数が増大する順序で配列しうる。しかし、この
ようにすることによつては、中心周波数が関連し
ない実数の極に対しては何等解決を行なえない。
本発明の目的は、前述した方法における極対の
順序化を、音声合成装置のそれぞれの全極フイル
タ区分が正しいホルマントパラメータにより制御
されるように達成することにある。
本発明は、サンプリング周期Tを有する予定の
レートでサンプリングされた音声信号の、特定の
持続時間の順次のセグメントから次数2nの巡回
型デジタル全極フイルタの2n個の係数aj(ここに
j=1、2、……、2nである)を取出す音声分
析方式を用いた音声合成装置で前記の全極フイル
タの極を制御するホルマントパラメータを決定す
るに当り、Z-1=exp(−sT)とし、s=α+jω
を複素周波数とした前記の全極フイルタの伝達関
数Hの式 に応じて前記の伝達関数をn個の二次伝達関数
Hi(ここにi=1、2、……、nである)に分割
して、前記の全極フイルタのn個の二次区分の係
数の組合せ(pi、qi)を決定する工程と、前記の
係数の組合せ(pi、qi)を式 に応じて前記の係数の組合せ(pi、qi)を係数ci
およびriに変換する工程と、係数ciおよびriの値
を、値c=−2、c=+2、r=−1およびr=
0によつて制限された領域内にある値に限定する
工程と、これにより限定された係数ciおよびri
組合せ(ci、ri)をciの値が増大する順序に配列す
る工程と、FiおよびBiをそれぞれ前記の二次区分
のホルマント周波数および帯域幅とした際に、前
記の工程で配列された係数の組合せ(ci、ri)か
ら、式 ci=−2cos(2πFiT) ri=e-BiT を用いて前記の全極フイルタのn個のそれぞれの
二次区分の極を制御するホルマントパラメータ
(Fi、Bi)を決定する工程とを具えることを特徴
とする。
実数の極は上述したように係数ciおよびriを制
限することにより複素数となる為、ホルマントを
簡単に決定することができる。係数を上述したよ
うに制限することによつては最終的な合成音声
に、聞きとりうるような悪影響を及ぼさない。
中心ホルマント周波数Fiおよび帯域幅Biは式 ri=e-BiT ci=2cos(2πFiT) に応じて、上述した範囲にある係数ciおよびri
ら計算することができる。
この結果、フイルタ伝達関数に実数の極が生じ
る為に空間が生じないようなホルマントデータ
(F、B)の順序列が得られる。換言すれば、第
1図による音声合成装置に対しては中断なく且つ
適切な順序で、制御信号が供給され、しかもこれ
ら制御信号は適切なフイルタに対して供給され
る。
図面につき本発明を説明する。
第2図につき説明する本発明による音声分析方
式においては、25ミリ秒の持続時間を有するセグ
メントを音声信号から分離する。この機能を、25
msを付したブロツク9によつて表わす。次の機
能はハミング窓による音声信号セグメントの乗算
であり、この機能を、WNDWを付したブロツク
10によつて表わす。
サンプリング周波数は例えば8000Hzとする為、
25ミリ秒の音声信号セグメントは200個のサンプ
ルを有する。ハミング窓による乗算の結果、信号
サンプルsj(j=1、…、200)が得られる。その
後に、ブロツク11で示すようにこれらの信号サ
ンプルから自動相関係数rk(k=1、…、8)を
計算する。次にブロツク12によつて示すように
8つの一次方程式の群により上記の係数rkからフ
イルタ係数aj(j=1、…、8)を計算する。
フイルタ係数ajは次式(1)の伝達関数を有する全
極フイルタの係数である。
伝達関数Hはベアストウアルゴリズムによつて
次式(2)に示すように4つの二次伝達関数Hiに分
割される。
この演算をブロツク13で示す。この演算の結
果、係数の組合せ(pi、qi)(ここにi=1、…、
4である)が4つとなる。
可能な係数の組合せ(pi、qi)は第3図におい
てp、q面に示す3角形内に位置する。複素数の
極に相当する係数の組合せは放物線P2−4q=0
の上側に位置し、実数の極に相当する係数の組合
せは三角形中で上記の放物線の下側で斜線を付し
た部分内に位置する。
係数の組合せ(pi、qi)は次式(3)に応じてホル
マント周波数Fiおよび帯域幅Biと関連する。
pi=−2e-BiT・cos(2πFiT) qi=e-2BiT …(3) ここにTはサンプリング周期を示す。
第3図においては、係数の組合せ(p、q)の
1個を点1に示し、この点1と関連するホルマン
トよりも高い周波数を有し、このホルマントと同
じ帯域幅を有するホルマントに相当する係数の組
合せ(p、q)を点2に示す。点1と関連するホ
ルマントの帯域幅が、ホルマント周波数の変化が
なく増大すると、対応する点は放物線に沿つて1
から1′に移動する。点2から点2′への移動はホル
マント帯域幅が変化せずにホルマント周波数が減
少した場合に相当する。
ホルマント周波数が上昇するのに応じて係数の
組合せ(p、q)を順序良く配列するのは簡単で
なく、ホルマントと関連する明確に規定された領
域をp、q面に示すのは不可能である。点1から
点1′への、また点2から点2′へのホルマントの移
動はある条件の下で示した。実数の極(点3)を
斜線領域から順序よく配列するのも実際には困難
である。
上述したところまでの音声分析方式は通常の構
成のものであり、従来技術に属するものである。
次に本発明による新規な特徴につき説明する。
本発明による音声分析方式においては、座標
p、qを座標c、rに座標変換するのを次式(4)に
応じて行なう。
この演算をブロツク14によつて示す。この座
標変換により第3図の三角形は第4図に示すc、
r面中の図に変換される。この第4図は第3図の
点1および1′と2および2′とをも示してある。第
3図の放物線1−1′は第4図において直線とな
る。
この座標変換の結果得られた係数の組合せ
(ci、ri)を次に係数ciの上昇値に応じて配列する。
極対の順序化のこの演算を、RDRを付したブロ
ツク15で示す。
第4図の斜線領域内に位置し、実数の極に相当
する係数の組合せ(ci、ri)は、値c=−2、c
=+2、r=1およびr=0によつて画成され複
素数の極が位置する矩形領域に移動させる。この
移動は係数ciおよびriの値を制限することにより
行なう。この機能をブロツク16によつて示す。
ciに対する限界値は例えば−1.99および+1.99と
し、riに対する限界値は例えば0.3および0.99とす
る。
上述において最後に記載した演算により、全極
フイルタの伝達関数の実数極の複素数化を達成す
ることができる。この演算の結果、点3で示す実
数の極が点3′に移動され、点4で表わす実数の極
は点4′に移動される。従つて、座標変換により、
ホルマントを簡単に実数の極に割当てることを可
能にする。換言すれば、ブロツク16の演算によ
り、ホルマントに相当する係数の組合せ(ci、ri
(ここにi=1、…、4である)を常に生ぜしめ
る。点3の実数の極は第3図にも示されている
が、この第3図からはホルマントをいかにしてこ
の極に割当てることができるかが明瞭でない。
ブロツク16から取出される係数の組合せ
(ci、ri)は次式(5)に応じてホルマント周波数Fi
よび帯域幅Biと関連する。
ci=−2cos(2πFiT) ri=e-BiT …(5) 上記の式(5)は式(3)および(4)から以下のようにし
て導出することができる。式(3)によれば、 pi=−2e-BiT・cos(2πFiT) qi=e-2BiT であり、qiに対する後者の式から sign(qi)=1 |qi|=e-2BiT が得られ、従つて、 √|i|=√{-2BiT}=e-BiT が得られる。式(4)によれば、係数の組合せ(ci
ri)は によつて規定される。これらの式にsign(qi)お
よび√|i|に対する前記の式およびpiに対する
前記の式を代入すると、 が得られる。
組合せ(Fi、Bi)(ここにi=1、…、4であ
る)は式(5)により計算することができる。この演
算をブロツク17で示す。
本例の音声分析方式によれば、順序化された4
つの組合せ(Fi、Bi)の群が得られ、これにより
第1図に示す音声合成装置の4つのフイルタ5〜
8を制御して音声を再生させることができる。本
例の音声分析方式によれば4つの組合せ(Fi
Bi)を常に適正な順序で発生する為、フイルタ5
〜8のいずれかが制御情報を受けており、これら
フイルタのいずれも隣接フイルタの情報を受けな
い。
第2図の流れ図は、標準のマイクロプロセツサ
ハードウエアと、データおよびプログラム記憶用
の標準のメモリとを以つて構成することができ
る。第2図の流れ図によるマイクロコンピユータ
のプログラミングは当該技術分野以外の範囲のも
のである。
【図面の簡単な説明】
第1図は既知の音声合成装置の一例を示すブロ
ツク線図、第2図は本発明による音声分析方式の
一例に対する作動順序を示す流れ図、第3図は二
次デジタルフイルタの極の位置を示す線図、第4
図は二次フイルタ区分の極を示す変換座標を示す
線図である。 1……パルス発生器、2……雑音発生器、3…
…有声−無声スイツチ、4……増幅器、5,6,
7,8……二次全極フイルタ。

Claims (1)

  1. 【特許請求の範囲】 1 サンプリング周期Tを有する予定のレートで
    サンプリングされた音声信号の、特定の持続時間
    の順次のセグメントから次数2nの巡回型デジタ
    ル全極フイルタの2n個の係数aj(ここにj=1、
    2、…、2nである)を取出す音声分析方式を用
    いた音声合成装置で前記の全極フイルタの極を制
    御するホルマントパラメータを決定するに当り、 Z-1=exp(−sT)とし、s=α+jωを複素周
    波数とした前記の全極フイルタの伝達関数Hの式 に応じて前記の伝達関数をn個の二次伝達関数
    Hi(ここにi=1、2、…、nである)に分割し
    て、前記の全極フイルタのn個の二次区分の係数
    の組合せ(pi、qi)を決定する工程と、 前記の係数の組合せ(pi、qi)を式 に応じて前記の係数の組合せ(pi、qi)を係数ci
    およびriに変換する工程と、 係数ciおよびriの値を、値c=−2、c=+2、
    r=−1およびr=0によつて制限された領域内
    にある値に限定する工程と、 これにより限定された係数ciおよびriの組合せ
    (ci、ri)をciの値が増大する順序に配列する工程
    と、 FiおよびBiをそれぞれ前記の二次区分のホルマ
    ント周波数および帯域幅とした際に、前記の工程
    で配列された係数の組合せ(ci、ri)から、式 ci=−2cos(2πFiT) ri=e-BiT を用いて前記の全極フイルタのn個のそれぞれの
    二次区分の極を制御するホルマントパラメータ
    (Fi、Bi)を決定する工程と を具えることを特徴とするホルマントパラメータ
    決定法。
JP4292480A 1979-04-04 1980-04-03 Voice analysis method Granted JPS55166700A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
NLAANVRAGE7902631,A NL188189C (nl) 1979-04-04 1979-04-04 Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.

Publications (2)

Publication Number Publication Date
JPS55166700A JPS55166700A (en) 1980-12-25
JPH0225518B2 true JPH0225518B2 (ja) 1990-06-04

Family

ID=19832925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4292480A Granted JPS55166700A (en) 1979-04-04 1980-04-03 Voice analysis method

Country Status (6)

Country Link
US (1) US4346262A (ja)
JP (1) JPS55166700A (ja)
DE (1) DE3012771A1 (ja)
FR (1) FR2453459A1 (ja)
GB (1) GB2047055B (ja)
NL (1) NL188189C (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146539A (en) * 1984-11-30 1992-09-08 Texas Instruments Incorporated Method for utilizing formant frequencies in speech recognition
CA1250368A (en) * 1985-05-28 1989-02-21 Tetsu Taguchi Formant extractor
US4922539A (en) * 1985-06-10 1990-05-01 Texas Instruments Incorporated Method of encoding speech signals involving the extraction of speech formant candidates in real time
JPH0738114B2 (ja) * 1985-07-03 1995-04-26 日本電気株式会社 フオルマント型パタンマツチングボコ−ダ
US4882758A (en) * 1986-10-23 1989-11-21 Matsushita Electric Industrial Co., Ltd. Method for extracting formant frequencies
NL8603163A (nl) * 1986-12-12 1988-07-01 Philips Nv Werkwijze en inrichting voor het afleiden van formantfrekwenties uit een gedeelte van een spraaksignaal.
DE4111131C2 (de) * 1991-04-06 2001-08-23 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen digitalisierter Tonsignale
US5434947A (en) * 1993-02-23 1995-07-18 Motorola Method for generating a spectral noise weighting filter for use in a speech coder
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US6700958B2 (en) 1995-04-10 2004-03-02 Starguide Digital Networks, Inc. Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth
EP0820624A1 (en) * 1995-04-10 1998-01-28 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US6094671A (en) * 1996-10-09 2000-07-25 Starguide Digital Networks, Inc. Aggregate information production and display system
US6208959B1 (en) 1997-12-15 2001-03-27 Telefonaktibolaget Lm Ericsson (Publ) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel
US7194757B1 (en) * 1998-03-06 2007-03-20 Starguide Digital Network, Inc. Method and apparatus for push and pull distribution of multimedia
US8284774B2 (en) 1998-04-03 2012-10-09 Megawave Audio Llc Ethernet digital storage (EDS) card and satellite transmission system
US6160797A (en) 1998-04-03 2000-12-12 Starguide Digital Networks, Inc. Satellite receiver/router, system, and method of use
FR2805183B1 (fr) * 2000-02-23 2002-12-27 Oreal Pompe comportant une membrane formant ressort et recipient ainsi equipe
US6920424B2 (en) * 2000-04-20 2005-07-19 International Business Machines Corporation Determination and use of spectral peak information and incremental information in pattern recognition
US8311812B2 (en) * 2009-12-01 2012-11-13 Eliza Corporation Fast and accurate extraction of formants for speech recognition using a plurality of complex filters in parallel
US9311929B2 (en) * 2009-12-01 2016-04-12 Eliza Corporation Digital processor based complex acoustic resonance digital speech analysis system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4045616A (en) * 1975-05-23 1977-08-30 Time Data Corporation Vocoder system
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system

Also Published As

Publication number Publication date
FR2453459B1 (ja) 1984-09-21
NL188189C (nl) 1992-04-16
DE3012771C2 (ja) 1988-09-01
FR2453459A1 (fr) 1980-10-31
JPS55166700A (en) 1980-12-25
DE3012771A1 (de) 1980-10-16
GB2047055A (en) 1980-11-19
US4346262A (en) 1982-08-24
GB2047055B (en) 1983-09-14
NL188189B (nl) 1991-11-18
NL7902631A (nl) 1980-10-07

Similar Documents

Publication Publication Date Title
JPH0225518B2 (ja)
Rao et al. On decomposing speech into modulated components
Stevens Toward a model for speech recognition
US4754485A (en) Digital processor for use in a text to speech system
JPH02239293A (ja) 音声処理方法
WO1993018505A1 (en) Voice transformation system
EP0182989B1 (en) Normalization of speech signals
Scarr Zero crossings as a means of obtaining spectral information in speech analysis
US5715363A (en) Method and apparatus for processing speech
EP0191531B1 (en) A method and an arrangement for the segmentation of speech
Christensen et al. A comparison of three methods of extracting resonance information from predictor-coefficient coded speech
Niederjohn et al. An experimental investigation of the perceptual effects of altering the zero-crossings of a speech signal
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JPH05127668A (ja) 自動採譜装置
JP3019603B2 (ja) 音声の基本周波数の抽出装置
JPS63195700A (ja) ホルマント抽出装置
JPH0670753B2 (ja) 極零分析装置
JP2707577B2 (ja) ホルマント抽出装置
JPH06301399A (ja) 音声認識装置
Levitt Digital processing of the speech of deaf children
JPH0731504B2 (ja) ピツチ抽出装置
JPH04261592A (ja) 自動採譜装置
JPH0117599B2 (ja)
Sarma et al. Cascade realization of digital inverse filter for extracting speaker dependent features
JPS5948397B2 (ja) 韻律要素の抽出方式