SE438386B - Sett och anordning for alstring av en artificiell talsignal - Google Patents

Sett och anordning for alstring av en artificiell talsignal

Info

Publication number
SE438386B
SE438386B SE7806822A SE7806822A SE438386B SE 438386 B SE438386 B SE 438386B SE 7806822 A SE7806822 A SE 7806822A SE 7806822 A SE7806822 A SE 7806822A SE 438386 B SE438386 B SE 438386B
Authority
SE
Sweden
Prior art keywords
signal
filter
excitation
speech
amplitudes
Prior art date
Application number
SE7806822A
Other languages
English (en)
Other versions
SE7806822L (sv
Inventor
G Modena
S Sandri
C Scagliola
Original Assignee
Cselt Centro Studi Lab Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cselt Centro Studi Lab Telecom filed Critical Cselt Centro Studi Lab Telecom
Publication of SE7806822L publication Critical patent/SE7806822L/sv
Publication of SE438386B publication Critical patent/SE438386B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Description

10 15 20 25 30 35 40 7806822-s 2 struerade signalen. Detta signal/brus-förhållande erhålles som för- hållandet mellan insignaleffekten och felsignaleffekten, där fel- signalen definieras som skillnaden mellan in- och utsignalerna. Ju större förhållandet är¿ desto bättre är systemets kvalitet.
De vanligen använda insignalerna utgöres av sinusformade sig- naler av olika frekvenser inom omrâdet mellan 800 och 1000 Hz eller av vitt brus av Gauss- eller Laplacetyp, eftersom dessa signaler är lätta att behandla och därför är speciellt gynnsamma för tester ge- nomförda medelst simuleringsmetoder.
Användning av dylika signaler, vilkas spektral- och amplitud- egenskaper ej överensstämmer med motsvarande egenskaper hos talsig- naler, kan dock leda till avsevärda skillnader mellan objektiva och subjektiva utvärderingar, varvid med subjektiv utvärdering avses mätningar utförda med en verklig lyssnare som åhör verkliga talsig- naler. I Skillnaden mellan objektiva och subjektiva mätningar är ännu större i digitala överföringssystem; under senaste tiden företagna undersökningar har givit vid handen att det vanliga signallbrus- -förhållandet inte är en meningsfull parameter i digitala system, utan att det är nödvändigt att skilja åtminstone mellan kvantise- ringsbrusets inverkan och distorsion förorsakad av amplitudöver- styrning (eller överstyrning med avseende på kurvlutningen i diffe- rentiellt arbetande system), varvid man även måste beakta dessa bå- da faktorers relativa storlek. Till följd av sina statistiska egen- skaper tillåter dock varken vitt brus eller sinusformade signaler en exakt särskiljning mellan de båda nyssnämnda störkomponenterna, vilket är lätt att visa och vilket även verifierats experimentellt. Å andra sidan är det vid kvalitetstester inte lämpligt att an- vända en artificiell signal erhâllen genom talsyntesisering, efter- som denna artificiella signal skulle medföra samma olägenheter som en verklig talsignal; dvs. den skulle bero inte bara på syntetise- ringsmetoden utan även på talaren, texten och språket. Dessutom är talsyntetisering en mycket komplicerad och känslig process.
De problem som är förknippade med användningen av en artificiell signal vid kvalitetstester löses genom föreliggande uppfinning, som möjliggör alstring av en artificiell signal med samma statistiska egenskaper som en gnomsnittlig mänsklig röst. Detta möjliggör upp- nåendet av en god korrelation mellan subjektiva och objektiva kvalitetsmätníngar.
Ett ändamål med föreliggande uppfinning är att åstadkomma en 10 15 20 25 30 35 40 7806822-8 metod för alstring av en artificiell signal, vars tids- och spektral- egenskaper i huvudsak simulerar motsvarande egenskaper hos den mänsk- liga rösten. Detta uppnås genom att sättet uppvisar de i patentkravet 1 angivna kännetecknen. Alstring sker således av en kurvform som si~ mulerar egenskaperna hos stämbandsljudalstringen. Denna kurvform, som används som källsígnal, filtreras en första gång för kompensering av amplitudspektrat utan distorsion av signalens fas, varvid ett ampli- tudspektrum med flat frekvenskurva erhålles. Detta amplitudspektrum filtreras därefter åter för att man skall erhålla en approximering av talorganens genomsnittliga överföringsfunktion.
En anordning för genomförande av detta sätt uppvisar de i pa- tentkravet 3 angivna kännetecknen. Anordningen innefattar således en generator som kan alstra en kurvform som simulerar egenskaperna hos stämbandsljudalstringen och som används som källsignal. I anord- ningen ingår vidare ett första digitalt filter av linjärfastyp för utflatning av signalens amplitudspektrum, samt ett andra digitalt filter för filtrering av det första fíltrets utsignal så att en ap- proximering erhålles av talorganens genomsnittliga överföringsfunk- tion. Detta filter kommer härigenom att vid sin utgång avge en arti- ficiell talsignal.
Föredragna utföringsformer i övrigt framgår av underkraven.
Uppfinningen beskrivas närmare nedan i form av ett utförings- exempel och med hänvisning till bifogade ritning, där fig. 1 är ett blockschema för en i enlighet med uppfinningen utförd anordning, fig. 2 representerar en signal som simulerar stämbandsljudalstringen, och fig. 3 och H visar två tänkbara exempel på en artificiell signal erhållen från kurvformen i fig. 2.
Innan själva beskrivningen av uppfinningen påbörjas, mäste någ- ra teoretiska principer genomgås. _ Det är välbekant att talalstringen påverkas av olika parametrar, av vilka kan nämnas: den typ av ljud som alstras av ljudaktiverings- källan (stämbanden), variationer i tid och rum av talorganen (dvs. de olikformiga akustiska håligheterna och förträngningarna mellan stäm- bandens ljudspringa och mun- och näsöppningarna, exciteringarnas olikformiga varaktighet, samt det faktum att näshålan kan vara mer eller mindre benägen att överföra ljud.
Rent schematiskt kan en anordning för alstring av talsignaler anses bestå av en ljudkälla (som simulerar stämbanden) och av ett överföringssystem, som simulerar övriga talorgan och fungerar som ett filter vars resonansegenskaper verkar på de av ljudkällan alstrade ljudvågorna. 10 15 20 25 30 35 HO 7806822-8 Under antagande av att ömsesidig växelverkan mellan ljudkäl- lan och överföringssystemet kan negligeras (vilket kan ske utan att resonemanget förlorar alltför mycket av sin generalitet), är det möj- ligt att realisera ljudkällan medelst en generator, som alstrar en sig- nal svarande mot vitt brus, och ett filter som koncentrerar signalen så att denna kommer att motsvara de spektralfördelningar som beror på den av stämbanden alstrade kurvformen, på ljudets fortplantning genom talorganen och på själva ljudutstrålningen.
En enligt uppfinningen utförd anordning som uppfyller nyssnämnda fordringar återges i fig. 1.
I denna figur betecknar EG en generator som kan alstra en period- isk vågfbrm som simulerar den verkliga stämbandsljudalstíngen, exem- pelvis kurvformen un i fig. 2. Såsom framgår av denna figur har denna kurvform amplituden A0 och periodtiden T och består av tre distinkta delar: en stigande del med varaktigheten T1, en fallande del med var- aktigheten T2 och en del med konstant nivå. Generatorn EG måste kunna alstra dessa tre delar helt oberoende av varandra så att signalen un om så erfordras lätt kan ändras med avseende på såväl form som varak- tighet.
Hänvisningsbeteckningen F1 avser ett linjärfasfilter av digital typ med en överföringsfunktion som i huvudsak utgör inversen till den periodiska signalens un amplitudspektrum, vaför man vid utgången er- håller en funktion med en spektralfördelning som är flat med avseende på amplituden. Ett andra digitalt filter F2 är utfört så att det kan approximera talorganens genomsnittliga överföringsfunktion. Vid filt- rets P2 utgång erhålles således den önskade artificiella signalen sn.
Sättet varpå överföringsfunktionen kan fastställas är välkänt för fackmannen och beskrives därför ej i detalj här; exempelvis kan över- föringsfunktionen bestämmas genom linjära prediktionsmetoder, där de ljud som skall simuleras av denna signal utgöres av ljudsignaler (dvs. tonande ljud) och icke-nasala ljud. Filtret P2 kan utgöras av ett enbart poler uppvisande filter med konstanta parametrar. Denna be- gränsning medför inte att uppfinningen förlorar sin generalitet i någon större grad, eftersom dessa ljud utgör en mycket stor andel av talets ljudinnehåll. Å andra sidan möjliggör detta att en signal med fasta spektralegenskaper används. Denna förenkling rättfärdigas även av det faktum, att många talbehandlings- och vokalsignalredun- dansreduceringsanläggningar arbetar med adaptiv kvantisering av in- signalkurvformerna och således är relativt okänsliga för spektral- variationer. 10 15 20 25 30 35 7806822-8 Beaktas, såsom tidigare nämnts, att den signal som alstras måste användas för testapparatur ingående i en telefonianläggning, väljes filtrets P2 överföringsfunktion företrädesvis på sådant sätt att reproducering sker av medelspektrat av talamplituden i frekvens- omrâdet mellan 0 och 4 kHz.
Den beskrivna anordningen alstrar en periodisk signal av det slag som visas i fig. 3. Till följd av sin periodiska struktur är denna signals parametrar i viss grad fixa; om detta ej är önskvärt, kan en varierbarhet införas i signalen, vilket tillåter bättre approximering av talegenskaperna.
En dylik varierbarhet kan erhållas medelst en pseudoslumpgene- rator PS (fig. 1), som med hjälp av en strömställare C inkopplas mel- lan generatorn EG och filtret F1 och som förmår åstadkomma en pseu- doslumpvariation av sígnalens un amplitud och/eller periodtíd.
Företrädesvis är generatorn PS utförd så, att den under en viss period kan ändra den variabla signalens sn amplitud på basis dels av denna signals sn amplitud i föregående period, dels av den periodiska signalens un amplitud. Variationslagen kan exempelvis vara av föl- jande slag: An = C - An_1 + (1 - C) - A0 (1 + P - wn) där An = den önskade signalens sn amplitud i den nzte perioden; An-1 = signalens sn amplitud i den (n-1):te perioden; AO = den periodiska signalens un amplitud; C = en mellan 0 och 1 liggande koefficient som ger ett mått på amplitudkovariansen, dvs. den möjliga ampli- tudvariationen mellan tvâ på varandra följande perioder hos signalen; P = den största relativa variationen med avseende på AO; värdet på P väljes så att spektralvariationerna med avseende på un är mycket begränsade för att filtreríngen i filtret P1 fortfarande skall vara verksam; och wn = en okorrelerad slumpvariabel (dvs. dess värde i ett visst ögonblick är inte korrelerat till värdet under ettföregåendeögonblick; denna variabel kan antaga värden som är likformigt fördelade i området mellan -1 och +1.
Den regel som gäller för periodvariationen kan exempelvis vara av typen Tn=fr(1+ynÉTÉ_) 10 15 20 25 7806822-8 6 där Tn = kurvformens önskade nzte period; T "= periodtiden för signalen un; ¿lT = den största tidsvariationen av T; och yn = en okorrelerad slumpvariabel analog med wn.
För att underlätta realiserandet av pseudoslumpgeneratorn PS kan variabeln yn sammanfalla med variabeln wn vid varje tidsögon- blick.
Pig. H återger den artificiella signal som erhålles med den enligt uppfinningen utförda anordningen med pseudoslumpvariation av amplituden och/eller perioden.
Den beskrivna anordningens arbetssätt kan lätt härledas med utgångspunkt från vad som ovan nämnts om de enskilda blockens funktion: den periodiska signalen un (fig. 1), som alstrats i generatorn EG och som eventuellt genomgår en pseudoslumpvariation med avseende på sin amplitud och periodtid i pseudoslumpgeneratorn PS, filtreras först i filtret P1. Eftersom detta filters överfö- ringsfunktion, såsom nämnts, i huvudsak utgör inversen till sig- nalens un amplitudspektrum, erhålles efter filtreringen en signal med flat amplitudspektrumkurva. Den sålunda erhållna signalen filtreras därefter i filtret P2 så att en signal erhålles, vars spektrala medelegenskaper motsvarar de som råder under ett tele- fonsamtal. Den vid filtrets F2 utgång erhållna signalen, av vilken två exempel visas i fig. 3 och 4, matas därefter som insignal till den apparatur som skall testas (ej visad på ritningen).

Claims (7)

  1. 78068 22- 8 Patentkrav l. Sätt att genom filtrering av en periodisk exciterings~ signal alstra en simulerad talsignal för genomförande av mät~ ningar på talsignalöverföringsutrustning, k ä n n e t e c k n a t av att exciteríngssignalen utgöres av en digitalt alstrad kurv- form, vars frekvenskomponenter i huvudsak motsvarar de som inom ett förutbestämt frekvensområde alstras genom stämbandsexcitering av talorganen, samtatt_filtreringen sker digitalt och innefattar två på varandra följande steg, där under det första steget exciterings- signalen omvandlas till en mellansignal,i vilken frekvenskomponen- ternas amplituder är i huvudsak utjämnade utan att fasdistorsion _ införts i exciteringssignalen, under det att mellansignalen under ...__..____-___.___._.._..:._._.. . det andra filtreringssteget omvandlas till en digital utsignal, vars frekvenskomponenter till sina amplituder motsvara amplituderna hos det genomsnittliga talspektret inom nämnda förutbestämda fre- kvensområde.
  2. 2. Sätt enligt kravet l, k ä n n e t e c k n a t av att åtminstone den ena av exciteringssignalens båda parametrar amplitud och periodtid påtvingas en pseudoslumpvariation innan denna signal omvandlas till mellansignalen.
  3. 3. Anordning för genomförande av sättet enligt kravet l eller 2, vilken anordning innefattar en exciteringssignalkälla och en filtreringsanordning inrättad att omvandla exciteringssignalen till en signal som inom ett förutbestämt frekvensområde motsvarar det genomsnittliga talspektret, k ä n n e t e c k n a d av att nämnda signalkälla utgöres av en digital generator (EG), som avger en periodisk kurvform (un) med frekvenskomponenter i huvudsak sva- rande mot de som inom nämnda frekvensområde alstras genom stämbands- excitering av talorganen, samt att filtreringsanordningen innefattar två kaskadkopplade digitala filter (Fl, F2), av vilka det första (Fl) är av linjärfastyp och anslutet för att tillföras den periodiska kurvformen (un) i och för omvandling av denna till en mellansignal, i vilken frekvenskomponenternas amplituder är i huvudsak utjämnade utan att fasdistorsion införts i exciteringssignalen (un), under det att det andra filtret (F2) är anslutet för att tillföras denna mel- lansignal i och för omvandling av densamma till en digital utsignal (sn), i vilken frekvenskomponenternas amplituder i huvudsak motsvarar amplituderna hos det genomsnittliga talspektret inom nämnda förutbe- stämda frekvensområde. 7806822-8 8 N.
  4. Anordning enligt kravet 3, k ä n n e t e c k n a d av att det första filtrets (Fl) överföringsfunktíon i huvudsak utgör ínversen till den periodiska kurvformens (un) amplitudspektrum, samt att det andra filtrets (F2) överföringsfunktion approximerar överföringsfunktionen hos de genomsnittliga talorganen.
  5. 5. Anordning enligt kravet U, k ä n n e t e c k n a d av att det andra filtret (F2) inom det approximativa frekvensområdet 0-U kHz uppvisar såväl konstanta parametrar som poler men saknar nollställen.
  6. 6. Anordning enligt kravet 3, k ä n n e t e c k n a d av att exciteringskurvformen inom varje period innefattar såväl ett väsentligen sinusformat parti som ett parti med konstant nivå, varvid den digitala generatorn (EG) är inrättad att alstra det sinusformade partiets stigande och fallande delar jämte partiet med konstant nivå oberoende av varandra.
  7. 7. Anordning enligt något av kraven 3-6, k ä n n e t e c k- -n a d av att den även innefattar en pseudoslumpsignalalstrande generator (PS), som är inkopplingsbar mellan nämnda digitala gene- rator (EG) och det första filtret (Fl) i och för införande av pseu- doslumpvariationer i åtminstone den ena av den periodiska kurv- formens båda parametrar amplitud och periodtid.
SE7806822A 1977-06-20 1978-06-13 Sett och anordning for alstring av en artificiell talsignal SE438386B (sv)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT68420/77A IT1083533B (it) 1977-06-20 1977-06-20 Procedimento e dispositivo per la generazione di un segnale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di sistemi di trasmissione di segnali vocali

Publications (2)

Publication Number Publication Date
SE7806822L SE7806822L (sv) 1978-12-21
SE438386B true SE438386B (sv) 1985-04-15

Family

ID=11309347

Family Applications (1)

Application Number Title Priority Date Filing Date
SE7806822A SE438386B (sv) 1977-06-20 1978-06-13 Sett och anordning for alstring av en artificiell talsignal

Country Status (9)

Country Link
US (1) US4187397A (sv)
JP (1) JPS5950075B2 (sv)
CH (1) CH629051A5 (sv)
DE (1) DE2826818C2 (sv)
FR (1) FR2395564A1 (sv)
GB (1) GB2000303B (sv)
IT (1) IT1083533B (sv)
NL (1) NL181152C (sv)
SE (1) SE438386B (sv)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7902238A (nl) * 1978-04-27 1979-10-30 Kawai Musical Instr Mfg Co Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument.
US4374482A (en) * 1980-12-23 1983-02-22 Norlin Industries, Inc. Vocal effect for musical instrument
US4449231A (en) * 1981-09-25 1984-05-15 Northern Telecom Limited Test signal generator for simulated speech
GB2121549B (en) * 1982-06-01 1985-08-29 Standard Telephones Cables Ltd Apparatus for determining the loudness rating of a telephone system
JPS61152800A (ja) * 1984-12-27 1986-07-11 日華化学株式会社 ドライクリ−ニング用洗浄剤
US5832431A (en) * 1990-09-26 1998-11-03 Severson; Frederick E. Non-looped continuous sound by random sequencing of digital sound records
JP3167259B2 (ja) * 1994-05-06 2001-05-21 三菱電機株式会社 音響再生装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB937434A (en) * 1959-02-24 1963-09-18 Nippon Electric Co A vowel synthesizer
US3280266A (en) * 1963-05-15 1966-10-18 Bell Telephone Labor Inc Synthesis of artificial speech
GB1175740A (en) * 1966-05-18 1969-12-23 Tesla Np Method and device for Measuring the Reference Equivalent or Articulation of Telephone Sets
US3549807A (en) * 1967-09-18 1970-12-22 Bell Telephone Labor Inc Voiced fricative synthesizer
FR2045207A5 (sv) * 1969-06-20 1971-02-26 Anvar
DE2028005A1 (de) * 1970-06-08 1971-12-23 Sotscheck J Verfahren zur Bestimmung der Sprachqualität einer Übertragungsstrecke
CA1005913A (en) * 1971-03-01 1977-02-22 Richard T. Gagnon Voice synthesizer
DE2263579A1 (de) * 1972-12-27 1974-07-04 Philips Patentverwaltung Schaltungsanordnung zur elektrischen nachbildung von kehlkopfimpulsen
CH581878A5 (sv) * 1974-07-22 1976-11-15 Gretag Ag

Also Published As

Publication number Publication date
DE2826818A1 (de) 1979-02-08
CH629051A5 (it) 1982-03-31
IT1083533B (it) 1985-05-21
NL181152B (nl) 1987-01-16
FR2395564B1 (sv) 1984-04-27
GB2000303A (en) 1979-01-04
JPS547805A (en) 1979-01-20
NL7806508A (nl) 1978-12-22
NL181152C (nl) 1987-06-16
JPS5950075B2 (ja) 1984-12-06
DE2826818C2 (de) 1983-02-17
GB2000303B (en) 1982-01-27
US4187397A (en) 1980-02-05
FR2395564A1 (fr) 1979-01-19
SE7806822L (sv) 1978-12-21

Similar Documents

Publication Publication Date Title
Dudley Remaking speech
Holmes The influence of glottal waveform on the naturalness of speech from a parallel formant synthesizer
Steeneken et al. A physical method for measuring speech‐transmission quality
US2098956A (en) Signaling system
van Noorden Temporal coherence in the perception of tone sequences
US5621854A (en) Method and apparatus for objective speech quality measurements of telecommunication equipment
EP0647375B1 (en) Method and apparatus for objective speech quality measurements of telecommunication equipment
Howell et al. Susceptibility to the effects of delayed auditory feedback
US2243527A (en) Production of artificial speech
EP1612770A1 (en) Voice processing apparatus and program
US3102928A (en) Vocoder excitation generator
SE438386B (sv) Sett och anordning for alstring av en artificiell talsignal
US2121142A (en) System for the artificial production of vocal or other sounds
Fyk Vocal pitch-matching ability in children as a function of sound duration
Saitou et al. Extraction of F0 dynamic characteristics and development of F0 control model in singing voice
US3078345A (en) Speech compression systems
JPH04116700A (ja) 音声分析・合成装置
Peterson et al. Objectives and techniques of speech synthesis
SU792247A1 (ru) Устройство дл ввода и вывода речевой информации
US3346695A (en) Vocoder system
SU120658A1 (ru) Способ анализа и синтеза речи формантного или вокадерного типа
RU2284584C1 (ru) Способ передачи слушателю акустического сигнала и устройство для его осуществления
Demany et al. The perception of frequency peaks and troughs in wide frequency modulations. IV. Effects of modulation waveform
Edwards et al. Better vocoders are coming
JP4267954B2 (ja) 概周期信号生成方法、装置、それを用いた音声合成方法、装置、音声合成プログラムおよびその記録媒体

Legal Events

Date Code Title Description
NUG Patent has lapsed

Ref document number: 7806822-8

Effective date: 19880318

Format of ref document f/p: F