NL7902631A - Spraakanalysesysteem. - Google Patents

Spraakanalysesysteem. Download PDF

Info

Publication number
NL7902631A
NL7902631A NL7902631A NL7902631A NL7902631A NL 7902631 A NL7902631 A NL 7902631A NL 7902631 A NL7902631 A NL 7902631A NL 7902631 A NL7902631 A NL 7902631A NL 7902631 A NL7902631 A NL 7902631A
Authority
NL
Netherlands
Prior art keywords
coefficients
filter
poles
speech
values
Prior art date
Application number
NL7902631A
Other languages
English (en)
Other versions
NL188189C (nl
NL188189B (nl
Original Assignee
Philips Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Nv filed Critical Philips Nv
Priority to NLAANVRAGE7902631,A priority Critical patent/NL188189C/nl
Priority to US06/135,963 priority patent/US4346262A/en
Priority to FR8007195A priority patent/FR2453459A1/fr
Priority to GB8010869A priority patent/GB2047055B/en
Priority to DE19803012771 priority patent/DE3012771A1/de
Priority to JP4292480A priority patent/JPS55166700A/ja
Publication of NL7902631A publication Critical patent/NL7902631A/nl
Publication of NL188189B publication Critical patent/NL188189B/nl
Application granted granted Critical
Publication of NL188189C publication Critical patent/NL188189C/nl

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Solid State Image Pick-Up Elements (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Description

> N.V. Philips’ Gloeilampenfabrieken te Eindhoven. Λ/ν^ 3_4_1979 1 Sn OQ&cÈoJl
Spraakanalys e sys teem.
A, Achtergrond van de uitvinding.
Afl), Gebied van de uitvinding.
De uitvinding . heeft betrekking op een spraakana-lysesysteem waarin een recursief digitaal filter met louter 5 polen wordt bepaald, zodanig dat een van het filter afgeleide functie een van de spraak afgeleide functie zo goed mogehjk benadert.
Dit hogere orde recursieve digitale louter-polen filter (all-pole-filter) kan gebruikt worden in een spraak- ^ syntheseinrichting voor het reproduceren van de spraak.
A(2) Beschrijving van de stand van de techniek.
Er is op gewezen in een artikel in de IEEE
Transactions on Acoustics, Speech and Signal Processing,
Vol. ASSP-22, No. 2, April 1974, pp 135-141 dat het voor 15 de hand ligt om voor het extraheren van de formanten de polen te bepalen door de noemer van de overdrachtsfunctie van het filter gelijk aan nul te stellen.
In een artikel in de Journal of the Acoustic Society of America, Vol. 63, No. 5» May, 1978 pp l638-l640 20 is opgemerkt, dat een uit louter polen bestaand filter opgevat kan worden als een cascade van verschillende eerste orde en tweede orde louter-polen filters. Het schema van een hierop gebaseerde spraaksynth.eseinrichting voor een even aantal polen is weergegeven in Fig. 1. Deze bestaat 790 2 6 31 3-4-1979 2 ΡΗΝ 9401
V
uit een pulsgenerator 1, een ruisgenerator 2, een stemhebbend- niet stemhebbend schakelaar 3, een versterker 4 en een cascade van tweede orde louter-polen filters 5, 6, 7 en 8.
S De pulsgenerator 1 wordt bestuurd door de toon hoogte (pitch) parameter Fo. De schakelaar 3 wordt bestuurd door de stemhebbend/nietstemhebbend informatie V/U. De amplitudeparameter A bestuurt de versterker 4. De filters 5» 6, 7 en 8 worden bestuurd door de formant para-10 meters F^, J F^, B^J F^, B^ en F^, B^ welke de formant-frequentie (f) en de bandbreedte (b) specificeren.
Een methode voor het berekenen van de filterco-efficienten van het hogere orde digitale filter is bekend uit Proceedings of the International Congres on Acoustics, 15 C-5-5, Tokyo, Japan, August 1968 (zie referentie in het boek Speech Analysis Synthesis and Perception second edition van J.L. Flanagan, pp 364-367, Springer-Verlag, 1972), Hierbij wordt gebruik gemaakt van de kort-tijd autocorrelatie functie van de spraak.
20
Voor het bepalen van de poolparen van het louter- polen filter kan gebruik gemaakt worden van de methode van
Bairstow voor het bepalen van de complexe wortels van een algebraïsche vergelijking met reële coëfficiënten. Deze methode is beschreven in het boek Introduction to Numerical 25
Analysis van C.E, Fröberg, Addison, Wesley, 1965.
Een probleem bij de formantextractie is, dat de poolparen niet in een zodanige ordening voorkomen dat zij eenvoudig aan bepaalde formantgebieden kunnen worden 2Q toegekend en dat reële polen kunnen voorkomen die niet in aanmerking komen om formanten genoemd te worden.
Uit de poolparen kunnen de formanten i.e. de centrale formantfrequentie en de bandbreedte berekend worden en deze gegevens kunnen naar toenemende frequentie 35 gerangschikt worden. Dit geeft echter geen oplossing voor de reële polen waar geen centrale frequentie bijhoort.
B. Samenvatting van de uitvinding.
De uitvinding beoogt in een spraakanalysesysteem van het onderhavige type op eenvoudige wijze een ordening 7902831 4 3-4-1979 3 PHN 9401 van de poolparen te bewerkstelligen.
Dit doel wordt in. het onderhavige spraakanalyse-systeem gerealiseerd door de werkwijze omvattende de stappen : 5 - het transformeren van de coëfficiënten p. en ri q^ van de n tweede orde secties van het filter, met de overdrachtsfuncties ^ 2 t “1, n 10 1 + P±z" + 9±ζ' waarin z”^ * exp (-sT) en s de complexe frequentie s = o< + jw en T de bemonsterperiode voorstelt, naar de coëfficiënten c. en r.
volgens de betrekkingen 15 °i pi N iqii' r± s sign(qi) * \j |q±| ‘ 20 - de waarden van de coëfficiënten c. en r. worden x x begrensd tot waarden dié liggen in een gebied dat begrensd wordt door de waarden c = -2, c=+2, r = 1 en r = 0.
- de coëfficiënten combinaties (c., r.) worden \ x» 25 gerangschikt volgens toenemende waarden van c. .
x
Door het begrenzen van de coëfficiënten c^ en r^ zoals hierboven is aangegeven worden de reële polen complex gemaakt, zodat op eenvoudige wijze formanten be-30 paald kunnen worden. Het blijkt dat deze begrenzing van de coëfficiënten geen hoorbaar effect heeft op de uiteindelijke gesynthetiseerde spraak.
Uit de coëfficiënten c. en r. welke in het ge- xx noemde gebied liggen kunnen de centrale formantfrequenties 35 en de bandbreedtesberekend worden volgens de betrekkingen : 790 2 6 3 1 *i Η· 3-4-1979 k PHN 9^01
-77B.T
r. = e i 1 c± = -2 cos (277F/T) 5 Het resultaat is dat een geordende reeks for mant gegevens (F, b) wordt verkregen waarin geen gaten voorkomen als het gevolg van het optreden van reële polen in de filter overdrachtsfuncties. Anders gezegd, er zijn voor de spraaksyntheseinrichting volgens Fig. 1 10 steeds zonder onderbreking en in de juiste volgorde en voor het juiste filter stuurinformaties beschikbaar.
C. Korte beschrijving van de figuren.
Fig. 1 is het principe schema van een bekende spraaksyntheseinrichting.
15
Fig. 2 is een stroomschema illustrerende de opeenvolging van operaties overeenkomstig het spraakanalysesysteem volgens de uitvinding.
Fig. 3 is een diagram voor het weergeven van de 20 posities van de polen van een tweede orde digitaal filter.
Fig, k is een tweede diagram met getransformeerde coördinaten voor het weergeven van de polen van een tweede orde filtersectie.
25 , .
In het onderhavige spraakanalysesysteem (Fig. 2) worden van een spraaksignaal segmenten afgescheiden met een duur van 25 >ns, Deze functie wordt gerepresenteerd door blok 9 met de inscriptie 25 ms, De volgende bewerking is het vermenigvuldigen van het spraaksignaalsegment met 30 een "Hamming window", welke functie wordt gerepresenteerd door blok 10 met de inscriptie WNDW.
De bemonsterfrequentie bedraagt bijvoorbeeld 8000 Hz, zódat een segment van 25 ms 200 monsters omvat.
jg Het resultaat van de "window"-vermenigvuldiging zijn de signaalmonsters s. , j =1, ...... 200. Vervolgens worden
J
uit deze signaalmonsters de autocorrelatie coëfficiënten r^ , k = 1, ..... , 8 berekend, zoals gerepresenteerd door 7902631 3-4-1979 5 PHN 9401 blok 11. Uit deze coëfficiënten r. worden de filtercoëffi- k cienten a., j = 1, ......, 8 berekend, met behulp van een
J
groep van acht lineaire vergelijkingen, zoals gerepresenteerd door blok 12.
5 De filtercoëfficienten a . zijn de coëfficiënten
J
van het 3outer-polen filter met de overdrachtsfunctie : H = - (l) 8 1 + . Σ _ a . z ^ 10 j = 1 j
Met behulp van het Bairstow-algoritme wordt de overdrachtsfunctie H gesplitst in vier tweede orde overdrachtsfuncties H. .
x H = _i_ = Jt- (2) 4 -1 _a i = iHi i = l (l + piz‘L + qiz^)
Deze laatste operatie wordt gerepresenteerd door blok 13. Het resultaat van deze operatie zijn de vier coëffi- cientencombinatie (p^, q_^ ), i = l, ......... , 4.
De mogelijke combinaties (p^, q^) liggen binnen de in Fig. 3 weergegeven driehoek in het p, q-vlak. De com-2g binaties welke corresponderen met complexe polen liggen boven de parabool p - 4 q = 0; de combinaties die corresponderen met de reële polen liggen onder de parabool in het gearceerde deel van de driehoek.
Een combinatie (p^, q^) hangt samen met de formant 3Q frequentie F^ en de bandbreedte B^ volgens de betrekkingen ρ± = -2e _T,BiT . cos 2T1F. T (3)
-2TIB. T
q± = e x , waarin T de bemonsterperiode voorstelt.
In Fig. 3 is bij punt 1 een (p, q) combinatie weergegeven en is bij punt 2 een (p, q) combinatie weergegeven 7902631 35 3-4-1979 6 PHN 9401 corresponderende met een formant met een hogere frequentie en dezelfde bandbreedte als de bij punt 1 behorende formant. Wanneer van de bij punt 1 behorende formant de bandbreedte bij gelijkblijvende formantfrequentie toeneemt, dan beweegt 5 het corresponderende punt van 1 naar 1* langs een parabool.
Een beweging van punt 2 naar punt 2' correspondeert met een afnemende formantfrequentie bij gelijkblijvende formant bandbreedte .
Het ordenen van de (p, q) combinaties naar opklimmende formantfrequenties is niet eenvoudig omdat in het p, q-vlak niet duidelijk gebieden zijn aan te wijzen welke bij de formanten behoren. De bewegingen van de formanten van punt 1 naar punt 1’ en van punt 2 naar punt 2' onder bepaalde omstandigheden illustreren dat. Het bij deze ordening in aanmerking nemen van de reële polen (punt 3) uit het gearceerde gebied is praktisch moeilijk te realiseren.
Het spraakanalysesysteem zoals dusver beschreven is conventioneel van ophouw en behoort tot de stand van de 20 techniek. De nieuwe trekken overeenkomstig de onderhavige aanvrage zullen nu beschreven worden.
In het spraakanalysesysteem dat overeenkomstig de uitvinding is ingericht wordt een coördinatentransfor-mantie toegepast van de coördinaten p, q naar de coördinaten 25 c, r volgens de betrekkingen j c = P / l/ fqT _ (4) r = sign (q) £ \J [qj1
Deze operatie wordt gerepresenteerd door blok 14. Door deze transformantie wordt de driehoek uit Fig. 3 ge-30 transformeerd naar de figuur in het c, r-vlak, welke is weergegeven in Fig. 4. De punten 1 en 1’ en 2 en 2' uit Fig.
3 zijn weer aangegeven in Fig* 4. De parabool 1-1' uit Fig. 3 is in Fig.4 een rechte lijn.
De coördinatentransformatie levert als resultaat 35 de coëfficientencombinaties (c^, r^), welke vervolgens naar opklimmende waarden van de coëfficiënten c^ worden gerangschikt. Deze elementaire operatie van het ordenen van de poolparen wordt gerepresenteerd door blok 15 met de inscrip- 790 2 6 3 1 3-4-1979 7 PHN9401 «> tie RDR.
De combinaties (c^, r^) welke in het gearceerde gebied van Fig. 4 liggen en welke corresponderen met reële polen worden verschoven naar het rechthoekige gebied dat be-5 grensd wordt door de waarden c = -2, c = +2, r = 1 en r = 0, waarbinnen de complexe polen liggen. Dit geschiedt door de waarden van de coëfficiënten c_^ en r_^ te begrenzen. Deze functie wordt gerepresenteerd door blok 16. De grenswaarden voor c. zijn bijvoorbeeld -1,99 en +1,99 en voor r. bijvoor-10 1 1 beeld 0,3 en 0,99·
De laatstgenoemde operatie kan genoemd worden het complex maken van de reële polen van de overdrachtsfunctie van het louter-polen filter. Door deze operatie wordt een reële pool welke gerepresenteerd wordt door punt 3 verschoven naar punt 3’ en wordt een reële pool welke wordt gerepresenteerd door punt 4 verschoven naar punt 4’. De coördinatentransformatie maakt het op eenvoudige wijze mogelijk aan de reële polen formanten toe te kennen. Anders gezegd: de 2Q operatie van blok 16 levert altijd combinaties (c^, r^), i = l, ....... 4, waarmede formanten corresponderen. De reële pool van punt 3 is ook weergegeven in Fig. 3, waaruit minder duidelijk is hoe aan deze pool een formant toegekend kan worden.
2g De coëfficientencombinatie (c^, r^) welke afkom stig is van blok 16 hangt samen met de formantfrequentie F^ en de bandbreedte Ik volgens de betrekking : c. a -2 cos (277F. T) (5) 1 -77B.T 1 r. a e x x 30
Met behulp van de betrekkingen (5) kunnen de combinaties (F^, B^), i = 1, ...... , 4 berekend worden. Deze functie wordt gerepresenteerd door blok 17.
Het resultaat van het spraakanalysesysteem is een 35 groep van vier geordende (F^, B_^) combinaties, waarmede de vier filters 5 tot 8 van de spraaksynthese inrichting volgens Fig. 1 bestuurd kunnen worden voor het reproduceren van de spraak. Het onderhavige spraakanalysesysteem levert altijd 78Γ0 2 β 3 1 3-4-1979 8 ΡΗΝ 94οι vier (i^, B_^) combinaties in de juiste volgorde, zodat geen van de filters 5 tot 8 geen besturingsinformatie ontvangt of de informatie ontvangt van een naburig filter.
5 10 15 20 25 30 790 2 6 3 1 35

Claims (2)

  1. 3-4-1979 9 PHN 9^01 CONCLUSIE.
  2. 1. In een spraakanalysesysteem waarin een recursief digitaal louter-polen filter wordt bepaald zodanig dat een van bet filter afgeleide functie een van de spraak afgeleide functie zo goed mogelijk benadert, de werkwijze omvattende 5 de stappen : - het transformeren van de coëfficiënten p. en q. van de n tweede orde secties van het digitale louter-polen filter met de overdrachtsfuncties: 10 „ 1 Hi p i = 1 * .···, n 1. p.z X + q.z^ ,waarin z“1 = exp (-sT), met s de complexe frequentie s = o<+ jw en T de bemonsterperiode, jg naar de coëfficiënten c^ en r_^ volgens de betrekkingen : ci * pi/1/ hil' ri = si^· (q±) ï . VT^T 20 — de waarden van de coëfficiënten c. en r. worden x x begrensd tot waarden die liggen in een gebied dat begrensd wordt door de waarden c = — 2, c = +2, r = 1 en r s 0. 7902631 v . ·*ν- 3-4-1979 10 ΡΗΝ 9^01 - de coëfficiënten combinaties (c. , r.) worden gerangschikt volgens toenemende waarden van c. . x 5 i 15 20 25 30 35 7902631
NLAANVRAGE7902631,A 1979-04-04 1979-04-04 Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting. NL188189C (nl)

Priority Applications (6)

Application Number Priority Date Filing Date Title
NLAANVRAGE7902631,A NL188189C (nl) 1979-04-04 1979-04-04 Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
US06/135,963 US4346262A (en) 1979-04-04 1980-03-31 Speech analysis system
FR8007195A FR2453459A1 (fr) 1979-04-04 1980-03-31 Systeme d'analyse de la parole
GB8010869A GB2047055B (en) 1979-04-04 1980-04-01 Speech analysis system
DE19803012771 DE3012771A1 (de) 1979-04-04 1980-04-02 Verfahren fuer ein sprachanalysensystem
JP4292480A JPS55166700A (en) 1979-04-04 1980-04-03 Voice analysis method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NLAANVRAGE7902631,A NL188189C (nl) 1979-04-04 1979-04-04 Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
NL7902631 1979-04-04

Publications (3)

Publication Number Publication Date
NL7902631A true NL7902631A (nl) 1980-10-07
NL188189B NL188189B (nl) 1991-11-18
NL188189C NL188189C (nl) 1992-04-16

Family

ID=19832925

Family Applications (1)

Application Number Title Priority Date Filing Date
NLAANVRAGE7902631,A NL188189C (nl) 1979-04-04 1979-04-04 Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.

Country Status (6)

Country Link
US (1) US4346262A (nl)
JP (1) JPS55166700A (nl)
DE (1) DE3012771A1 (nl)
FR (1) FR2453459A1 (nl)
GB (1) GB2047055B (nl)
NL (1) NL188189C (nl)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146539A (en) * 1984-11-30 1992-09-08 Texas Instruments Incorporated Method for utilizing formant frequencies in speech recognition
CA1250368A (en) * 1985-05-28 1989-02-21 Tetsu Taguchi Formant extractor
US4922539A (en) * 1985-06-10 1990-05-01 Texas Instruments Incorporated Method of encoding speech signals involving the extraction of speech formant candidates in real time
JPH0738114B2 (ja) * 1985-07-03 1995-04-26 日本電気株式会社 フオルマント型パタンマツチングボコ−ダ
US4882758A (en) * 1986-10-23 1989-11-21 Matsushita Electric Industrial Co., Ltd. Method for extracting formant frequencies
NL8603163A (nl) * 1986-12-12 1988-07-01 Philips Nv Werkwijze en inrichting voor het afleiden van formantfrekwenties uit een gedeelte van een spraaksignaal.
DE4111131C2 (de) * 1991-04-06 2001-08-23 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen digitalisierter Tonsignale
US5434947A (en) * 1993-02-23 1995-07-18 Motorola Method for generating a spectral noise weighting filter for use in a speech coder
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US6700958B2 (en) 1995-04-10 2004-03-02 Starguide Digital Networks, Inc. Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth
EP1004082A2 (en) * 1996-10-09 2000-05-31 Starguide Digital Networks Aggregate information production and display system
US6208959B1 (en) * 1997-12-15 2001-03-27 Telefonaktibolaget Lm Ericsson (Publ) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel
US7194757B1 (en) * 1998-03-06 2007-03-20 Starguide Digital Network, Inc. Method and apparatus for push and pull distribution of multimedia
US6160797A (en) * 1998-04-03 2000-12-12 Starguide Digital Networks, Inc. Satellite receiver/router, system, and method of use
US8284774B2 (en) 1998-04-03 2012-10-09 Megawave Audio Llc Ethernet digital storage (EDS) card and satellite transmission system
FR2805183B1 (fr) * 2000-02-23 2002-12-27 Oreal Pompe comportant une membrane formant ressort et recipient ainsi equipe
US6920424B2 (en) * 2000-04-20 2005-07-19 International Business Machines Corporation Determination and use of spectral peak information and incremental information in pattern recognition
US9311929B2 (en) * 2009-12-01 2016-04-12 Eliza Corporation Digital processor based complex acoustic resonance digital speech analysis system
US8311812B2 (en) * 2009-12-01 2012-11-13 Eliza Corporation Fast and accurate extraction of formants for speech recognition using a plurality of complex filters in parallel

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4045616A (en) * 1975-05-23 1977-08-30 Time Data Corporation Vocoder system
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system

Also Published As

Publication number Publication date
GB2047055A (en) 1980-11-19
JPS55166700A (en) 1980-12-25
JPH0225518B2 (nl) 1990-06-04
DE3012771A1 (de) 1980-10-16
NL188189C (nl) 1992-04-16
DE3012771C2 (nl) 1988-09-01
FR2453459A1 (fr) 1980-10-31
US4346262A (en) 1982-08-24
GB2047055B (en) 1983-09-14
FR2453459B1 (nl) 1984-09-21
NL188189B (nl) 1991-11-18

Similar Documents

Publication Publication Date Title
NL7902631A (nl) Spraakanalysesysteem.
Smith et al. PARSHL: An analysis/synthesis program for non-harmonic sounds based on a sinusoidal representation
Slaney Auditory toolbox
US8320583B2 (en) Noise reducing device and noise determining method
AU2010219353B2 (en) Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
Fitz et al. A unified theory of time-frequency reassignment
Deepak et al. Epoch extraction using zero band filtering from speech signal
Jackson et al. Linear prediction in cascade form
US3947638A (en) Pitch analyzer using log-tapped delay line
Lee et al. Musical onset detection based on adaptive linear prediction
Niederjohn et al. A zero-crossing consistency method for formant tracking of voiced speech in high noise levels
JPH0573093A (ja) 信号特徴点の抽出方法
Alsteris et al. Iterative reconstruction of speech from short-time Fourier transform phase and magnitude spectra
Zeng et al. Modified AMDF pitch detection algorithm
Chang et al. Pitch estimation of speech signal based on adaptive lattice notch filter
Schafer Homomorphic systems and cepstrum analysis of speech
Pfitzinger DFW-based spectral smoothing for concatenative speech synthesis.
Srivastava Fundamentals of linear prediction
Rahman et al. Formant frequency estimation of high-pitched speech by homomorphic prediction
Riley Time-frequency representations for speech signals
Daido et al. A Fast and Accurate Fundamental Frequency Estimator Using Recursive Moving Average Filters.
von dem Knesebeck et al. High quality time-domain pitch shifting using PSOLA and transient preservation
Hsiao et al. A new approach to formant estimation and modification based on pole interaction
Kalimoldayev et al. Methods for applying VAD in Kazakh speech recognition systems
Tohidypour et al. New features for speech enhancement using bivariate shrinkage based on redundant wavelet filter-banks

Legal Events

Date Code Title Description
A1B A search report has been drawn up
A85 Still pending on 85-01-01
BC A request for examination has been filed
V1 Lapsed because of non-payment of the annual fee

Effective date: 19951101