CH629051A5 - Procedimento e dispositivo per la generazione di un segnale artificiale tipo voce. - Google Patents

Procedimento e dispositivo per la generazione di un segnale artificiale tipo voce. Download PDF

Info

Publication number
CH629051A5
CH629051A5 CH666778A CH666778A CH629051A5 CH 629051 A5 CH629051 A5 CH 629051A5 CH 666778 A CH666778 A CH 666778A CH 666778 A CH666778 A CH 666778A CH 629051 A5 CH629051 A5 CH 629051A5
Authority
CH
Switzerland
Prior art keywords
signal
amplitude
filter
voice
transfer function
Prior art date
Application number
CH666778A
Other languages
English (en)
Inventor
Giulio Modena
Stefano Sandri
Carlo Scagliola
Original Assignee
Cselt Centro Studi Lab Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cselt Centro Studi Lab Telecom filed Critical Cselt Centro Studi Lab Telecom
Publication of CH629051A5 publication Critical patent/CH629051A5/it

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Stereophonic System (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Description

La presente invenzione si riferisce a un procedimento e un dispositivo per la generazione di un segnale artificiale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di impianti di trasmissione di segnali vocali, in particolare impianti di trasmissione telefonica.
Come è noto, per misurare le prestazioni di apparecchiature impiegate per la trasmissione di segnali vocali, si ricorre per quanto possibile all'effettuazione di misure oggettive,
cioè eseguite senza intervento di parlatori e/o ascoltatori fisici.
Ciò è dovuto al fatto che i risultati delle misure soggettive, cioè eseguite con l'intervento di parlatori e/o ascoltatori reali, sono troppo legati al tipo di voce, al parlatore e/o ascoltatore e anche al testo utilizzato per la prova: risultati sufficientemente attendibili potrebbero essere ottenuti solo utilizzando un gran numero di parlatori e/o ascoltatori e testi di una certa lunghezza, cosicché le prove stesse diventerebbero lunghe e quindi molto onerose dal punto di vista economico.
Per l'effettuazione di misure oggettive in generale si invia nell'apparecchiatura da provare un opportuno segnale di ingresso, e all'uscita dell'apparecchiatura si determina per il segnale ricevuto o ricostruito il rapporto segnale/rumore, valutato come rapporto tra la potenza del segnale di ingresso e la potenza del segnale errore (che può essere, ad esempio, definito come differenza tra il segnale di uscita ed il se-5 gnale di ingresso). Quanto più è elevato detto rapporto, tanto migliore è considerata la qualità del sistema.
Come segnali di ingresso si utilizzano generalmente dei segnali sinusoidali a frequenza dell'ordine di 800 1000 Hz, oppure rumore bianco gaussiano o laplaciano, in quanto io questi tipi di segnale sono trattabili in modo particolarmente semplice e quindi si prestano bene per prove effettuate mediante tecniche di simulazione.
Tuttavia l'uso di segnali di questo tipo, che non presentano le caratteristiche di ampiezza e/o spettro dei segnali vois cali, può portare a indicazioni oggettive di qualità che differiscono sensibilmente dalle indicazioni soggettive, cioè quelle che potrebbero essere fornite da un ascoltatore reale a cui giungano segnali vocali reali.
Il divario tra indicazioni oggettive e soggettive è poi par-20 ticolarmente sensibile quando il sistema di trasmissione è di tipo numerico: studi recenti hanno infatti dimostrato che in questi casi il semplice rapporto segnale/rumore non. è più un parametro sufficientemente indicativo, bensì occorre distinguere almeno tra gli effetti del rumore di quantizzazione 25 e quelli della distorsione dovuta al sovraccarico di ampiezza (o di pendenza nel caso di sistemi differenziali) tenendo conto per di più delle proporzioni relative di questi due fattori. Invece, proprio per le loro caratteristiche statistiche, il rumore bianco o un segnale sinusoidale non permettono di di-ìo stinguere con esattezza tra le due componenti di rumore sunnominate, come è facilmente dimostrabile e come è stato verificato sperimentalmente.
D'altra parte, non è pensabile di usare per le prove di qualità un segnale artificiale ottenuto per sintesi della voce, 35 in quanto questo presenterebbe tutti gli inconvenienti connessi all'uso di un segnale reale, cioè sarebbe dipendente dal parlatore, dal testo, dalla lingua, oltre che dal metodo di sintesi; inoltre la generazione di un segnale mediante sintesi della voce è un'operazione molto delicata e complessa.
40
Questi problemi connessi con l'uso di un segnale artificiale per le prove di qualità sono risolti con il procedimento e dispositivo oggetto dell'invenzione, che permettono di ottenere in modo semplice un segnale artificiale con le caratteristiche statistiche di una voce media, e quindi permettono di ottenere una buona corrispondenza tra le indicazioni di qualità oggettive e soggettive.
È particolare oggetto della presente invenzione un procedimento per la generazione di un segnale artificiale le cui so caratteristiche temporali e spettrali riproducono sostanzialmente le caratteristiche medie della voce umana, in. cui si genera un segnale di sorgente che riproduce le caratteristiche dell'eccitazione glottica, si filtra detto segnale in modo da compensare lo spettro di ampiezza senza distorcere la fase, 55 ottenendo un segnale con spettro di ampiezza piatto, e si sottopone detto segnale con spettro di ampiezza piatto ad un ulteriore filtraggio simulante la funzione di trasferimento media del tratto vocale.
È anche oggetto della presente invenzione un dispositivo 60 per realizzare detto procedimento, costituito da un generatore atto a generare un segnale di sorgente simulante l'eccitazione glottica, da un primo filtro numerico, a fase lineare, atto a realizzare l'appiattimento dello spettro di ampiezza di detto segnale di sorgente, e da un secondo filtro numerico simu-65 lante la funzione di trasferimento media del tratto vocale e atto a filtrare il segnale a spettro di ampiezza piatto uscente dal primo filtro per fornire in uscita il segnale artificiale tipo voce.
3
629051
A maggior chiarimento si fa riferimento ai disegni allegati, in cui:
la fig. 1 è uno schema a blocchi del dispositivo oggetto dell'invenzione;
la fig. 2 rappresenta il segnale che riproduce l'eccitazione glottica;
le figg. 3-4 sono due possibili esempi di segnale artificiale ottenibile dalla forma d'onda di fig. 2.
Prima di descrivere il dispositivo oggetto dell'invenzione, è opportuno premettere alcune considerazioni teoriche.
Ê noto che il processo di emissione della voce è influenzato da molti parametri: tra questi si possono citare il tipo di suono prodotto dalla sorgente di eccitazione sonora, la variabilità nel tempo e nello spazio delle configurazioni del «tratto vocale» (cioè del tubo acustico non uniforme compreso fra l'apertura glottica e le labbra), la durata non uniforme delle eccitazioni ed il fatto che le cavità nasali siano più o meno interessate nella trasmissione del suono.
In generale, comunque, un dispositivo di generazione di un segnale tipo voce può essere schematizzato da una sorgente sonora, che simula le corde vocali, e da un sistema di trasmissione, che simula il tratto vocale ed opera come un filtro che impone le sue caratteristiche di risonanza sulle onde acustiche generate dalla sorgente.
Supponendo, come si può fare senza eccessiva perdita di generalità, di poter trascurare le interazioni mutue tra la sorgente sonora ed il sistema di trasmissione, si può realizzare la sorgente in modo che generi un segnale con spettro bianco, ed il filtro in modo da concentrare in esso i contributi spettrali dovuti all'onda glottica, all'irradiazione ed alla trasmissione.
II dispositivo secondo l'invenzione, che permette di realizzare queste condizioni, è rappresentato in fig. 1.
In tale figura, con EG è indicato un generatore di forme d'onda periodiche, atto a produrre una forma d'onda simulante l'eccitazione glottica, per esempio la forma d'onda un di fig. 2. Come si vede, tale forma d'onda, di ampiezza A0 e periodo T, è costituita da un tratto ascendente di durata TI, da un tratto discendente di durata T2, e da un tratto costante: il generatore EG deve essere atto a generare le tre parti in modo completamente indipendente l'una dall'altra, in modo da consentire una agevole variazione, se necessario, sia dell'ampiezza che del periodo del segnale un.
Con FI si è indicato un filtro numerico a fase lineare, avente una funzione di trasferimento che è sostanzialmente l'inverso dello spettro di ampiezza del segnale periodico un; in questo modo si ottiene in uscita una funzione a spettro di ampiezza piatto.
Con F2 è indicato un secondo filtro numerico, atto ad approssimare la funzione di trasferimento media del tratto vocale; in uscita da F2 si ha quindi il segnale artificiale desiderato. Il modo con cui si può determinare la funzione di trasferimento è ben noto ai tecnici del ramo, e pertanto non sarà descritto in dettaglio; p. es. la funzione di trasferimento può essere determinata mediante tecniche di predizione lineare.
Nel caso in cui i suoni che si intendono riprodurre con tale segnale siano suoni sonori (vocalizzati) e non nasali, il filtro F2 può essere costituito da un filtro a soli poli ed a parametri costanti. Questa limitazione non toglie eccessiva generalità all'invenzione, in quanto tali suoni costituiscono una notevole percentuale di quelli che compaiono in una conversazione e, d'altra parte, consente di avere un segnale con caratteristiche spettrali fisse. Questa semplificazione è giustificata anche dal fatto che molti sistemi di trattamento della voce e di riduzione della ridondanza dei segnali vocali operano con quantizzazione adattitiva delle forme d'onda di ingresso e quindi, come è noto, sono poco sensibili alle variazioni spettrali.
Tenuto conto, come si è detto, che il segnale da generare deve essere impiegato per la prova di apparecchiature inserite in un sistema telefonico, la funzione di trasferimento del filtro F2 è preferibilmente scelta in modo da riprodurre lo spettro medio di ampiezza della voce nella banda di frequenze da 0 a 4 kHz.
Con il dispositivo descritto si ottiene un segnale periodico come quello di fig. 3. Per la sua natura periodica, questo segnale presenta una certa rigidità di parametri; nel caso in cui questa rigidità non sia desiderata, si può introdurre nel segnale una variabilità che meglio permette di approssimare le caratteristiche della voce.
Tale variabilità può essere ottenuta mediante un generatore pseudocasuale PS (fig. 1) inserito, tramite un commutatore C, tra EG e FI e atto a provocare una variazione pseudocasuale dell'ampiezza e/o del periodo del segnale un.
Vantaggiosamente, PS può essere atto a far variare l'ampiezza del segnale, in un determinato periodo, sulla base dell'ampiezza assunta nel periodo precedente e dell'ampiezza del segnale periodico un. Per esempio la legge di variazione può essere del tipo:
An = C . A,,., + (1 - C). A0 (1 + P . wn)
dove:
An è l'ampiezza del segnale desiderato nel periodo n;
An_! è l'ampiezza del segnale nel periodo n-1;
A0 è l'ampiezza del segnale periodico un;
C è un coefficiente, compreso fra 0 e 1, che stima la covarianza dell'ampiezza, cioè la possibile variazione di ampiezza tra periodi successivi del segnale;
P è la massima variazione percentuale ammissibile rispetto al valore A0; il valore di P è scelto in modo che le variazioni delle caratteristiche di spettro rispetto al segnale un siano molto limitate, in modo che il filtraggio in FI sia ancora efficace;
wn è una variabile casuale indipendente (cioè tale che il valore ad un certo istante non dipende dal valore all'istante precedente) che può assumere valori uniformemente distribuiti tra — 1 e +1.
La legge di variazione del periodo può essere per esempio del tipo
AT
Tn = T(1 + yn )
T
dove:
T„ è il periodo n-esimo desiderato per la forma d'onda;
T è il periodo del segnale un;
A,T è la massima variazione temporale attorno a T;
yn è una variabile casuale indipendente analoga a wn.
Per semplicità di realizzazione del generatore pseudocasuale PS, la variabile yn può coincidere, istante per istante, con wn.
Il segnale artificiale ottenuto dal dispositivo secondo l'invenzione, con variazione pseudocasuale dell'ampiezza e/o del periodo è rappresentato in fig. 4.
Il funzionamento del dispositivo descritto è facilmente deducibile da quanto detto in precedenza sulle funzioni dei singoli blocchi: il segnale periodico u„ (fig. 1) generato in EG ed eventualmente sottoposto alla variazione pseudo5
10
15
20
25
30
35
40
45
50
55
60
65
629051
4
casuale di ampiezza e periodo in PS viene filtrato una prima volta in FI. Poiché come si è detto la funzione di trasferimento di FI è sostanzialmente l'inverso dello spettro di ampiezza di un, come risultato del filtraggio si ottiene un segnale a spettro di ampiezza piatto che viene poi filtrato in
F2 per assumere le caratteristiche spettrali medie della voce telefonica. Il segnale, ottenuto in uscita da F2, di cui si sono rappresentati due esempi nelle figg. 3, 4, viene poi inviato come segnale di ingresso all'apparecchiatura da provare, 5 non rappresentata nei disegni.
v
2 fogli disegni

Claims (5)

629051
1. Procedimento per la generazione di un segnale artificiale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di impianti di trasmissione di segnali vocali, in particolare impianti di trasmissione telefonica, caratterizzato da ciò che si genera un segnale di sorgente che riproduce le caratteristiche della eccitazione glottica; si sottopone detto segnale ad una prima operazione di filtraggio in modo da compensare lo spettro di ampiezza senza distorcere la fase di detto segnale di sorgente, ottenendo un segnale con spettro di ampiezza piatto, e si sottopone detto segnale con spettro di ampiezza piatto ad un ulteriore filtraggio simulante la funzione di trasferimento media del tratto vocale.
2. Procedimento secondo la rivendicazione 1, caratterizzato da ciò che detto segnale di sorgente è una forma d'onda periodica, in cui si provoca una variazione pseudocasuale dell'ampiezza e/o del periodo.
2
RIVENDICAZIONI
3. Dispositivo per la realizzazione del procedimento secondo le rivendicazioni 1 e 2, caratterizzato da ciò che esso comprende:
— un generatore (EG) atto a generare un segnale di sorgente (u„) simulante l'eccitazione glottica;
— un primo filtro numerico (FI), a fase lineare, atto ad appiattire lo spettro di ampiezza di detto segnale di sorgente (u„);
— un secondo filtro numerico (F2), simulante la funzione di trasferimento media del tratto vocale, atto a filtrare il segnale a spettro di ampiezza piatto uscente da detto primo filtro (FI) per fornire in uscita il segnale artificiale tipo voce (V-
4. Dispositivo secondo la rivendicazione 3, caratterizzato da ciò che detto generatore (EG) è un generatore di forme d'onda periodiche, e da ciò che sono previsti mezzi (PS) atti a provocare una variazione pseudocasuale dell'ampiezza e/o del periodo della forma d'onda periodica.
5. Dispositivo secondo la rivendicazione 3, caratterizzato da ciò che detto secondo filtro è un filtro con funzione di trasferimento a soli poli e parametri costanti, tale da riprodurre lo spettro medio di ampiezza della voce nella banda di frequenze fra 0 e 4 kHz.
CH666778A 1977-06-20 1978-06-19 Procedimento e dispositivo per la generazione di un segnale artificiale tipo voce. CH629051A5 (it)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT68420/77A IT1083533B (it) 1977-06-20 1977-06-20 Procedimento e dispositivo per la generazione di un segnale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di sistemi di trasmissione di segnali vocali

Publications (1)

Publication Number Publication Date
CH629051A5 true CH629051A5 (it) 1982-03-31

Family

ID=11309347

Family Applications (1)

Application Number Title Priority Date Filing Date
CH666778A CH629051A5 (it) 1977-06-20 1978-06-19 Procedimento e dispositivo per la generazione di un segnale artificiale tipo voce.

Country Status (9)

Country Link
US (1) US4187397A (it)
JP (1) JPS5950075B2 (it)
CH (1) CH629051A5 (it)
DE (1) DE2826818C2 (it)
FR (1) FR2395564A1 (it)
GB (1) GB2000303B (it)
IT (1) IT1083533B (it)
NL (1) NL181152C (it)
SE (1) SE438386B (it)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7902238A (nl) * 1978-04-27 1979-10-30 Kawai Musical Instr Mfg Co Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument.
US4374482A (en) * 1980-12-23 1983-02-22 Norlin Industries, Inc. Vocal effect for musical instrument
US4449231A (en) * 1981-09-25 1984-05-15 Northern Telecom Limited Test signal generator for simulated speech
GB2121549B (en) * 1982-06-01 1985-08-29 Standard Telephones Cables Ltd Apparatus for determining the loudness rating of a telephone system
JPS61152800A (ja) * 1984-12-27 1986-07-11 日華化学株式会社 ドライクリ−ニング用洗浄剤
US5832431A (en) * 1990-09-26 1998-11-03 Severson; Frederick E. Non-looped continuous sound by random sequencing of digital sound records
JP3167259B2 (ja) * 1994-05-06 2001-05-21 三菱電機株式会社 音響再生装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB937434A (en) * 1959-02-24 1963-09-18 Nippon Electric Co A vowel synthesizer
US3280266A (en) * 1963-05-15 1966-10-18 Bell Telephone Labor Inc Synthesis of artificial speech
GB1175740A (en) * 1966-05-18 1969-12-23 Tesla Np Method and device for Measuring the Reference Equivalent or Articulation of Telephone Sets
US3549807A (en) * 1967-09-18 1970-12-22 Bell Telephone Labor Inc Voiced fricative synthesizer
FR2045207A5 (it) * 1969-06-20 1971-02-26 Anvar
DE2028005A1 (de) * 1970-06-08 1971-12-23 Sotscheck J Verfahren zur Bestimmung der Sprachqualität einer Übertragungsstrecke
CA1005913A (en) * 1971-03-01 1977-02-22 Richard T. Gagnon Voice synthesizer
DE2263579A1 (de) * 1972-12-27 1974-07-04 Philips Patentverwaltung Schaltungsanordnung zur elektrischen nachbildung von kehlkopfimpulsen
CH581878A5 (it) * 1974-07-22 1976-11-15 Gretag Ag

Also Published As

Publication number Publication date
FR2395564B1 (it) 1984-04-27
JPS547805A (en) 1979-01-20
NL181152B (nl) 1987-01-16
GB2000303A (en) 1979-01-04
US4187397A (en) 1980-02-05
DE2826818A1 (de) 1979-02-08
NL181152C (nl) 1987-06-16
DE2826818C2 (de) 1983-02-17
SE438386B (sv) 1985-04-15
FR2395564A1 (fr) 1979-01-19
JPS5950075B2 (ja) 1984-12-06
GB2000303B (en) 1982-01-27
SE7806822L (sv) 1978-12-21
IT1083533B (it) 1985-05-21
NL7806508A (nl) 1978-12-22

Similar Documents

Publication Publication Date Title
Dudley Remaking speech
Holmes The JSRU channel vocoder
Holmes The influence of glottal waveform on the naturalness of speech from a parallel formant synthesizer
Meddis et al. A computational algorithm for computing nonlinear auditory frequency selectivity
US2098956A (en) Signaling system
AU670950B2 (en) Method and apparatus for objective speech quality measurements of telecommunication equipment
Gold et al. The channel vocoder
US3786188A (en) Synthesis of pure speech from a reverberant signal
US20210297791A1 (en) System and Method for Aiding Hearing
CH629051A5 (it) Procedimento e dispositivo per la generazione di un segnale artificiale tipo voce.
Halsey et al. Analysis-synthesis telephony, with special reference to the vocoder
Flanagan et al. Binaural unmasking of complex signals
Møller Use of pseudorandom noise in studies of frequency selectivity: The periphery of the auditory system
US3109070A (en) Pitch synchronous autocorrelation vocoder
JPH04116700A (ja) 音声分析・合成装置
Campanella A survey of speech bandwidth compression techniques
RU27259U1 (ru) Устройство для измерения разборчивости речи
Holmes A survey of methods for digitally encoding speech signals
Dal Santo et al. Flutter Echo Modeling
RU2284584C1 (ru) Способ передачи слушателю акустического сигнала и устройство для его осуществления
Shi et al. Power spectral density based channel equalization of large speech database for concatenative TTS system
Kelly Speech and vocoders
US3555191A (en) Pitch detector
Ohmura et al. Evaluation of a speech synthesis method for nonlinear modeling of vocal folds vibration effect
SU792247A1 (ru) Устройство дл ввода и вывода речевой информации

Legal Events

Date Code Title Description
PL Patent ceased