DE60315544T2 - Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung - Google Patents

Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung Download PDF

Info

Publication number
DE60315544T2
DE60315544T2 DE60315544T DE60315544T DE60315544T2 DE 60315544 T2 DE60315544 T2 DE 60315544T2 DE 60315544 T DE60315544 T DE 60315544T DE 60315544 T DE60315544 T DE 60315544T DE 60315544 T2 DE60315544 T2 DE 60315544T2
Authority
DE
Germany
Prior art keywords
terminal
parameters
facilities
voice
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60315544T
Other languages
English (en)
Other versions
DE60315544D1 (de
Inventor
Pierre Bonnard
Ivan Bourmeyster
Xavier Fourquin
Pierre Ladouce
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCT Mobile Ltd
Original Assignee
TCT Mobile Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCT Mobile Ltd filed Critical TCT Mobile Ltd
Application granted granted Critical
Publication of DE60315544D1 publication Critical patent/DE60315544D1/de
Publication of DE60315544T2 publication Critical patent/DE60315544T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung, das insbesondere für ein Mobilfunksystem geeignet ist.
  • Auch wenn die Sprachübertragung das wichtigste Element im Mobilfunk bleibt, so bleibt doch die Tatsache bestehen, dass die Hersteller bestrebt sind, ihre Produkte zu differenzieren, indem sie neue attraktive und abwechslungsreiche Dienstleistungen für den Verbraucher anbieten. Die Spiele, die mit der Spracherkennung verbundenen Dienste oder die Vervielfachung der Klingeltöne sind Beispiele dafür.
  • Diese neuen Dienstleistungen verursachen zusätzliche Kosten für das Telefon aufgrund der Ergänzung von Software- und Hardwareelementen.
  • Mit der vorliegenden Erfindung soll ein Telekommunikationsendgerät geliefert werden, mit dem das übertragene Sprachsignal von dem Benutzer des Endgerätes während einer Fernsprechverbindung verändert werden kann. Es handelt sich dabei um eine attraktive und abwechslungsreiche Dienstleistung, die auf einfache und wirtschaftliche Weise umgesetzt werden kann.
  • In dem Dokument WO 98/35340 wird ein System zur Sprachumwandlung beschrieben, bei dem ein Ausgangssignal (die Stimme des ersten Benutzers) in ein Zielsignal (die Stimme des zweiten Benutzers) umgewandelt werden muss. Bei diesem System wird das Prinzip des Codebook verwendet, d.h. voreingestellte Bibliotheken von Phonemen für jeden möglichen Benutzer (Lernphase) mit einer eindeutigen Übereinstimmung zwischen der Bibliothek von Phonemen, die mit dem ersten Benutzer verbunden ist, und der Bibliothek von Phonemen, die dem zweiten Benutzer entspricht.
  • In dem Dokument US 5,956,685 wird ein System beschrieben, mit dem insbesondere ein Sprachsignal in ein anderes Signal verwandelt werden kann, das für eine veränderte Stimme repräsentativ ist. Dieses System beruht auf der Verarbeitung von Sprachdaten, die den Aufteilungen des digitalisierten Ausgangssprachsignals in Abhängigkeit von der Interpunktion entspricht.
  • Mit der vorliegenden Erfindung wird ein Telekommunikationsendgerät vorgeschlagen, wie es in Anspruch 1 definiert wird.
  • Dank der Erfindung erfolgt der Einsatz einer Dienstleistung zur Veränderung der durch ein Mobiltelefon übertragenen Stimme auf einfache und wirtschaftliche Art und Weise, indem ein Vocoder verwendet wird, der zur Verschlüsselung der Stimme bereits in dem Telephon vorhanden ist. Die Rekonstruktionsparameter sind repräsentativ für die zu übertragende Stimme und ihre Veränderung erlaubt es, direkt auf den Klang der übertragenen Stimme zu wirken.
  • Vorteilhafterweise besitzen die Einrichtungen zur Veränderung der Rekonstruktionsparameter Elemente, um die Grundfrequenz der Stimme zu verändern.
  • Nach einer Ausführungsart der Erfindung handelt es sich bei der Verschlüsselung der Quelle des Sprachsignals um eine RPE-LTP-Verschlüsselung (Regular Pulse Excitation Long Term Prediction).
  • Vorteilhafterweise besitzen die Einrichtungen zur Veränderung der Rekonstruktionsparameter Elemente, um die Parameter des Kurzzeit-Filters des Vocoders zu verändern.
  • Bei den Parametern des Kurzzeit-Filters handelt es sich beispielsweise um die Reflexionskoeffizienten, die sogenannten LAR [Log Area Ratio] – Koeffizienten, die während einer RPE-LTP-Verschlüsselung bestimmt werden.
  • Nach einer Variante besitzen die Einrichtungen zur Veränderung der Rekonstruktionsparameter Elemente, um die Parameter des Langzeit-Filters des Vocoders zu verändern.
  • Ein Parameter des Langzeit-Filters ist beispielsweise die Grundfrequenz, die mit einem pitch (Tonhöhe) verbunden ist, der während einer RPE-LTP-Verschlüsselung festgelegt wurde.
  • Vorteilhafterweise besitzen die Einrichtungen zur Veränderung der Rekonstruktionsparameter Elemente zur Veränderung der Parameter, die mit Erregungsgrößen des Vocoders verbunden sind.
  • Ein Parameter, der mit einer Erregungsgröße verbunden ist, kann beispielsweise ein Parameter sein, der das Erregungs-Impulssignal definiert, das während einer RPE-LTP-Verschlüsselung bestimmt wird.
  • Nach einer Ausführungsart besitzen die Einrichtungen zur Veränderung der Rekonstruktionsparameter Elemente zur Veränderung der Parameter in Abhängigkeit von verschlüsselten Daten, die repräsentativ sind für eine Gesamtheit von Tönen, die durch ihre jeweiligen Frequenzen und ihre jeweilige Dauer definiert werden.
  • Vorteilhafterweise besitzt das Endgerät Einrichtungen zur Auswahl einer Art der Veränderung für die zu übertragende Stimme.
  • Vorteilhafterweise besitzt das Endgerät Einrichtungen zur manuellen Konfiguration der Veränderungen der Rekonstruktionsparameter des Sprachsignals.
  • Nach einer Ausführungsart besitzt das Endgerät Einrichtungen zur Durchführung der Änderungen in einem Testmodus.
  • Vorteilhafterweise handelt es sich bei dem Endgerät um ein Mobiltelephon.
  • Weitere Merkmale und Vorteile der vorliegenden Erfindung werden in der nachfolgenden Beschreibung einer Ausführungsart der Erfindung erläutert, die lediglich der Veranschaulichung dient und in keiner Weise einschränkend zu verstehen ist.
  • In den Figuren zeigen:
  • 1 eine schematische Darstellung eines Telekommunikationsendgerätes gemäß der Erfindung,
  • 2 eine schematische Darstellung der Verschlüsselungseinrichtungen und Einrichtungen zur Veränderung der Stimme, die in einem erfindungsgemäßen Telekommunikationsendgerät verwendet werden, wobei eine RPE-LTP-Verschlüsselung gemäß der Norm GSM 06.10 Verwendung findet.
  • In allen Figuren tragen die gleichen Elemente die gleichen Bezugsziffern.
  • 1 zeigt ein Telekommunikationsendgerät 8 gemäß der Erfindung, wie beispielsweise ein Mobiltelephon.
  • Das Endgerät 8 besitzt ein Mikrophon 9, einen Analog-Digital-Umsetzer ADU 10, einen Vocoder 11, einen Datenformatierer 12, Einrichtungen 13 zur Veränderung der Rekonstruktionsparameter der Stimme, Einrichtungen 14 zur Auswahl einer Art der Veränderung für die zu übertragende Stimme, Einrichtungen 15 zur manuellen Konfiguration der Änderungen der Rekonstruktionsparameter des Sprachsignals und Einrichtungen 16 zur Durchführung der Änderungen in einem Testmodus.
  • Der Vocoder 11, der Datenformatierer 12 und die Einrichtungen 13 zur Veränderung der Rekonstruktionsparameter der Stimme werden nachstehend unter Bezugnahme auf 2 beschrieben.
  • 2 zeigt einen Vocoder 11 zur Durchführung einer RPE-LTP-Verschlüsselung gemäß der Norm GSM 06.10, einen Datenfluss-Formatierer 12 und Einrichtungen 13 zur Veränderung der Rekonstruktionsparameter des Sprachsignals. Bei dem Vocoder 11, dem Formatierer 12 und den Einrichtungen 13 handelt es sich um Software-Elemente, die von einem nicht gezeigten, programmierbaren Prozessor ausgeführt werden.
  • Der Vocoder 11 besitzt Einrichtungen 2 zur Bestimmung von Reflexionskoeffizienten LAR, Einrichtungen 3 zur Bestimmung einer Grundfrequenz der Stimme und Einrichtungen 4 zur Bestimmung eines Erregungs-Impulssignals, ausgehend von einem abgetasteten Signal S.
  • Das Verschlüsselungsprinzip RPE-LTP besteht darin, das Sprachsignal wie einen linearen Filter darzustellen, dessen Parameter sich über die Zeit weiterentwickeln, wobei der lineare Filter durch ein Impulssignal erregt wird. Somit besteht die Zielsetzung. dieser Verschlüsselung darin, das Erregungs-Impulssignal, die verschiedenen Parameter, die den linearen Filter definieren, und die Grundfrequenz der zu übertragenden Stimme zu bestimmen. Diese Art der Sprachverschlüsselung funktioniert auf Datenübertragungsblöcken von 20 ms auf dem Band [300-3400 Hz]. Der lineare Filter besteht aus zwei Teilen: einem ersten Teil, der die Kurzzeit- Korrelationen des Sprachsignals berücksichtigt und einem zweiten Teil, der die Langzeit-Korrelationen des Sprachsignals berücksichtigt. Nachfolgend wird von Kurzzeit-Filter und Langzeit-Filter die Rede sein.
  • Das Signal S besteht aus einem Sprach-Datenübertragungsblock von 20 ms, der mit 8 kHz abgetastet wird.
  • Die Einrichtungen 2 ermöglichen die Bestimmung der Reflexionskoeffizienten LAR des Kurzzeit-Filters. Dazu wird der Durbin-Algorithmus verwendet, der auf das gefilterte Signal angewendet wird, um daraus eine lineare Vorhersage zu erhalten. Der Durbin-Algorithmus erzeugt zehn Reflexionskoeffizienten, die sogenannten LAR-Koeffizienten, zwischen – 1 und 1, die auf der logarithmischen Skala LAR (Log Area Ratio) ausgedrückt werden.
  • Die Einrichtungen 3 zur Bestimmung einer Grundfrequenz der Stimme verwenden ein Vorhersageverfahren, das mit dem Langzeit-Filter auf den Datenübertragungsblöcken von 5 ms verbunden ist, und sie ermöglichen es, die Grundfrequenz zu reproduzieren, die mit einer Tonhöhe (pitch) P zwischen 56 und 444 Hz verbunden ist, und die Charakteristik des Sprechers sowie die Verstärkung, die mit dieser Frequenz verbunden ist.
  • Die Einrichtungen 4 ermöglichen die Bestimmung des Erregungs-Impulssignals I.
  • Die Gesamtheit der Daten, die von den Einrichtungen 2, 3 und 4 für einen Datenübertragungsblock von 20 ms geliefert werden, wird in dem Datenfluss-Formatierer 12 formatiert, der ein verschlüsseltes Sprachsignal C erzeugt.
  • Wenn diese Parameter definiert sind, kann man verschiedene Wirkungen auf die Stimme erzeugen, indem man die Parameter LAR, P und I verändert. Die Einrichtungen zur Veränderung 13 ermöglichen die Veränderung dieser verschiedenen Parameter.
  • So können die Einrichtungen zur Veränderung 13 nur den Wert der Tonhöhe (pitch) verändern, der mit der Grundfrequenz verbunden ist, so dass eine männliche Stimme in eine weibliche Stimme verwandelt wird. Dazu wird der Wert der Tonhöhe (pitch) P jedes Datenübertragungsblockes in einen Wert Min (P + Peffet, Max (P)) verändert, wobei Peffet ein vorher festgelegter Wert ist, beispielsweise 90 Hz, und Max (P) der maximale Tonhöhenwert ist, der von dem Standardsystem akzeptiert wird. Eine männliche Stimme hat nämlich einen Tonhöhenwert von ungefähr 120 Hz, während eine weibliche Stimme einen Tonhöhenwert von ungefähr 210 Hz besitzt.
  • Mit den Einrichtungen zur Veränderung 13 kann in ähnlicher Form vorgegangen werden, um eine weibliche Stimme in eine männliche Stimme zu verwandeln. Dazu wird der Tonhöhenwert P jedes Datenübertragungsblockes in einen Wert Max (P – Peffet, Min (P)) verändert, wobei Peffet ein vorher festgelegter Wert von 90 Hz ist, und Min (P) der minimale Tonhöhenwert ist, der von dem Standardsystem akzeptiert wird.
  • Man kann auch einen Flüstereffekt erzielen, wenn die Tonhöhe und die Verstärkung durch die Einrichtungen 13 verändert wird. Dazu wird die Tonhöhe durch die Einrichtungen zur Veränderung 13 angehoben und die Verstärkung wird verringert, so dass der Signalausgang des Langzeit-Filters wesentlich verändert wird, indem die Wirkung der Vibrationen der Stimmbänder verringert wird. Die LAR-Parameter bleiben unverändert.
  • Man kann auch einen Roboterstimm-Effekt erzielen, wenn die Parameter des Langzeit-Filters durch die Einrichtungen 13 verändert werden. Dazu wird die Tonhöhe (pitch) auf einen relativ hohen Wert festgelegt. Wie für den Flüstereffekt, wird die Prosodie, d.h. die Gesamtheit der phonischen Elemente, die die gesprochene Sprache charakterisieren, vollständig verändert und in einen monotonen Ton verwandelt, der eine einzige Grundfrequenz und unveränderte LAR-Parameter besitzt.
  • Eine weitere bemerkenswerte Eigenschaft der Parameter der Stimmencodierer betrifft die Tatsache, dass die LAR-Parameter den vokalen Weg und den nasalen Weg repräsentieren, der mit der Erzeugung von Sprache verbunden ist, wobei diese beiden Wege durch Resonanzfilter des Typs Allpolfilter dargestellt werden, und jeder Pol eine Resonanzfrequenz repräsentiert. Da durch die Erzeugung von Sprache der vokale Weg und der nasale Weg zum Einsatz gebracht werden, können diese Parameter folglich durch die Einrichtungen 13 verändert werden, so dass die Vokale wie die einer Person mit verstopfter Nase nachklingen.
  • Der vokale Weg und der nasale Weg können jeweils durch einen Allpolfilter dargestellt werden, aber die Summe dieser beiden Filter ist nicht "Allpol". Um die Kombination dieser beiden Wege in Form eines Allpolfilters darzustellen, muss ein Nullwert konstruiert werden, indem man zwei Pole nebeneinander platziert. Dieser Nullwert repräsentiert den Anteil des nasalen Resonators auf dem vokalen Resonator.
  • Durch Annäherung dieser beiden Pole nebeneinander verringern die Einrichtungen zur Veränderung 13 den Anteil des nasalen Resonators und verleihen der Stimme somit einen "verschnupften" Effekt.
  • Die Parameter können auch in Abhängigkeit von verschlüsselten Daten verändert werden, die repräsentativ sind für eine Gesamtheit von Tönen, die durch ihre jeweiligen Frequenzen und ihre jeweilige Dauer definiert werden. So kann die modifizierte Stimme einer Partitur folgen, die in einem Verschlüsselungsformat definiert wird, das eine Gesamtheit von Paaren (Frequenz, Dauer) bestimmt und so einen gesungenen Effekt haben. Eine Partitur wird den Einrichtungen zur Veränderung 13 der Rekonstruktionsparameter geliefert. Diese Partitur kann ein Musikverschlüsselungsformat MIDI, SMAF von Yamaha®, EMR R5 polyphon, IrDA iMelody von IrMC (Infrared Mobile Communications) oder ein anderes Format vektorieller Beschreibung der Musik besitzen. In einer Vorbearbeitungsphase wird die Partitur ggfs. automatisch umgeschrieben, damit die Frequenzen der Töne in dem Intervall [56 Hz, 444 Hz] liegen.
  • Die Töne werden in Dauer und Frequenz interpretiert, wobei jede Note einem Beginn, einem Ende und einer Frequenz entspricht. Die Sprach-Datenübertragungsblöcke von 5 ms werden durch die Einrichtungen 12 verändert, so dass die Tonhöhe gleich der Frequenz des Tons im gleichen Augenblick ist.
  • Die Veränderungen der Parameter erfolgen im allgemeinen über den Austausch zwischen dem Datenfluss-Formatierer und den Einrichtungen 13 zur Veränderung der Parameter. Dennoch kann man auch Veränderungen der Parameter erwägen, die direkt am Vocoder 11 vorgenommen werden.
  • In 1 hat der Benutzer die Möglichkeit, die Art der an der zu übertragenden Stimme gewünschten Effekte über die Einrichtungen 14 zur Auswahl einer Veränderungsart zu wählen. Er kann die Veränderungen der Rekonstruktionsparameter des Sprachsignals über die Einrichtungen 15 auch manuell konfigurieren. So kann er beispielsweise den bei Min (P+ Peffet, Max (P)) veränderten Tonhöhenwert im Falle einer Umwandlung der männlichen Stimme in eine weibliche Stimme beeinflussen, indem er selbst den Wert von Peffet festlegt. Den erhaltenen Effekt kann er auch über die Einrichtungen 16 testen, die es ihm erlauben, die Art der ausgewählten Veränderung mit den Parametern, wie er sie festgelegt hat, auszuführen.
  • Bei einer Mobilfunkkommunikation wird die Stimme des Benutzers durch die Einrichtungen 9 zunächst abgetastet und digitalisiert. Im Anschluss daran wird sie durch den Vocoder 11 verschlüsselt, der die Phase 7 ausführt, wie in Verbindung mit 1 beschrieben.
  • Die verschlüsselte Stimme wird anschließend durch den Formatierer 12 formatiert, und zwar in Form von Rekonstruktionsparametern der Stimme, die man dank des Vocoders 11 erhalten hat.
  • Die Einrichtungen 13, die durch die Einrichtungen 14, 15 und 16 gesteuert werden, verändern nun die formatierten Rekonstruktionsparameter der Stimme, so dass man die von dem Benutzer gewünschten Effekte erhält. Die veränderten Parameter werden anschließend wieder zu den Einrichtungen 12 zurückübertragen und sodann über das Fernmeldenetz an den Gesprächspartner gesendet oder im Testmodus für den Benutzer ausgeführt.
  • Man kann auch eine Veränderung der Rekonstruktionsparameter direkt an den Einrichtungen 11 durch die Einrichtungen 13 erwägen.
  • Selbstverständlich ist die Erfindung nicht auf die Ausführungsart beschränkt, die soeben beschrieben worden ist.
  • Die Ausführungsart erstreckt sich insbesondere auf eine RPE-LTP-Verschlüsselung der Quelle, aber man kann auch jede andere Verschlüsselung der Quelle in Betracht ziehen, wie beispielsweise ETS 300 726 GSM EFF (Enhanced Full Rate) und 3GPP TS 26.071 AM (Adaptive Multirate).

Claims (9)

  1. Telekommunikationsendgerät (8) mit Eingangselementen (9) für den Benutzer des Endgerätes für ein analoges Sprachsignal, Einrichtungen (10) zur Umwandlung des analogen Sprachsignals in ein numerisches Sprachsignal (S), einem Vocoder (11) zur Durchführung einer Verschlüsselung der Quelle des numerischen Sprachsignals (S), wobei der Vocoder (11) Einrichtungen (2, 3, 4) besitzt, um Rekonstruktionsparameter (LAR, P I) des numerischen Sprachsignals abzufragen bzw. zu extrahieren, und einen Daten-Formatierer (12), der ein verschlüsseltes Sprachsignal (C) in Abhängigkeit von den abgefragten bzw. extrahierten Rekonstruktionsparametern liefert, dadurch gekennzeichnet, dass das Endgerät (8) Einrichtungen (13) besitzt, um während einer Fernsprechverbindung mindestens einen der Rekonstruktionsparameter zu verändern, so dass die mit dem verschlüsselten Sprachsignal (C) übertragene Stimme verändert wird, wobei die Einrichtungen durch Auswahleinrichtungen (14) gesteuert werden, so dass der Benutzer eine Änderungsart für die zu übertragende Stimme auswählen kann, und/oder durch Einrichtungen (15) zur manuellen Konfiguration der Änderungen der Rekonstruktionsparameter für die Sprache gesteuert werden.
  2. Endgerät (8) nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass die Einrichtungen (13) zur Veränderung der Rekonstruktionsparameter Elemente besitzen, um einen repräsentativen Parameter der Grundfrequenz der Stimme zu verändern.
  3. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass es sich bei der Verschlüsselung der Quelle des Sprachsignals um eine RPE-LTP-Verschlüsselung handelt.
  4. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Einrichtungen (13) zur Veränderung der Rekonstruktionsparameter Elemente besitzen, um die Parameter des Kurzzeit-Filters des Vocoders zu verändern.
  5. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Einrichtungen (13) zur Veränderung der Rekonstruktionsparameter Elemente besitzen, um die Parameter, die mit den Erregungsgrößen verbunden sind, zu verändern.
  6. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Einrichtungen (13) zur Veränderungen der Rekonstruktionsparameter Elemente besitzen, um die Parameter des Langzeit-Filters des Vocoders zu verändern.
  7. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Einrichtungen (13) zur Veränderung der Rekonstruktionsparameter Elemente besitzen, um die Parameter in Abhängigkeit von den verschlüsselten Daten zu verändern, die repräsentativ sind für eine Gesamtheit von Tönen, die durch ihre jeweiligen Frequenzen und ihre jeweilige Dauer definiert werden.
  8. Endgerät (8) nach einem der vorhergehenden Ansprüche, das Einrichtungen (16) zur Durchführung der Änderungen in einem Testmodus besitzt.
  9. Endgerät (8) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass es sich bei dem Endgerät um ein Mobiltelephon handelt.
DE60315544T 2002-05-16 2003-05-06 Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung Expired - Lifetime DE60315544T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0206035A FR2839836B1 (fr) 2002-05-16 2002-05-16 Terminal de telecommunication permettant de modifier la voix transmise lors d'une communication telephonique
FR0206035 2002-05-16

Publications (2)

Publication Number Publication Date
DE60315544D1 DE60315544D1 (de) 2007-09-27
DE60315544T2 true DE60315544T2 (de) 2008-05-15

Family

ID=29266109

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60315544T Expired - Lifetime DE60315544T2 (de) 2002-05-16 2003-05-06 Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung

Country Status (8)

Country Link
US (1) US7796748B2 (de)
EP (1) EP1363272B1 (de)
CN (2) CN101668271B (de)
AT (1) ATE370496T1 (de)
DE (1) DE60315544T2 (de)
ES (1) ES2292919T3 (de)
FR (1) FR2839836B1 (de)
PT (1) PT1363272E (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2852778B1 (fr) 2003-03-21 2005-07-22 Cit Alcatel Terminal de telecommunication
JP2006333057A (ja) * 2005-05-26 2006-12-07 Nec Corp ボイスチェンジャ付電話機およびその制御方法並びに制御プログラム
JP4445536B2 (ja) * 2007-09-21 2010-04-07 株式会社東芝 移動無線端末装置、音声変換方法およびプログラム
EP2345352A1 (de) * 2010-01-19 2011-07-20 Nestec S.A. Verfahren zur Bereitstellung von Information für einen Benutzer von einer Kapsel zur Herstellung eines Getränks unter Verwendung eines Codes
CN103903627B (zh) * 2012-12-27 2018-06-19 中兴通讯股份有限公司 一种语音数据的传输方法及装置
US20140195222A1 (en) * 2013-01-07 2014-07-10 Microsoft Corporation Speech Modification for Distributed Story Reading
US9613620B2 (en) * 2014-07-03 2017-04-04 Google Inc. Methods and systems for voice conversion
CN110503965B (zh) * 2019-08-29 2021-09-14 珠海格力电器股份有限公司 一种调制解调器语音编解码器的选择方法和存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823380A (en) * 1987-03-27 1989-04-18 Chaim Kohen Voice changer
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5526464A (en) * 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
US5956685A (en) * 1994-09-12 1999-09-21 Arcadia, Inc. Sound characteristic converter, sound-label association apparatus and method therefor
US5567901A (en) * 1995-01-18 1996-10-22 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JPH10153998A (ja) * 1996-09-24 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
AU6044298A (en) * 1997-01-27 1998-08-26 Entropic Research Laboratory, Inc. Voice conversion system and methodology
SE516595C2 (sv) * 1998-03-13 2002-02-05 Ericsson Telefon Ab L M Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden
JPH11289361A (ja) * 1998-04-03 1999-10-19 Nec Corp 携帯電話装置
FI981508A (fi) * 1998-06-30 1999-12-31 Nokia Mobile Phones Ltd Menetelmä, laite ja järjestelmä käyttäjän tilan arvioimiseksi
US6463128B1 (en) * 1999-09-29 2002-10-08 Denso Corporation Adjustable coding detection in a portable telephone
KR20010065803A (ko) * 1999-12-30 2001-07-11 윤종용 휴대 전화 단말 장치의 통화중 음색 변환 방법
US20030028380A1 (en) * 2000-02-02 2003-02-06 Freeland Warwick Peter Speech system
US7006787B1 (en) * 2000-02-14 2006-02-28 Lucent Technologies Inc. Mobile to mobile digital wireless connection having enhanced voice quality
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer

Also Published As

Publication number Publication date
DE60315544D1 (de) 2007-09-27
CN101668271B (zh) 2012-06-13
US7796748B2 (en) 2010-09-14
FR2839836A1 (fr) 2003-11-21
ATE370496T1 (de) 2007-09-15
FR2839836B1 (fr) 2004-09-10
CN101668271A (zh) 2010-03-10
CN1474622A (zh) 2004-02-11
EP1363272A1 (de) 2003-11-19
PT1363272E (pt) 2007-11-05
ES2292919T3 (es) 2008-03-16
EP1363272B1 (de) 2007-08-15
US20030215085A1 (en) 2003-11-20

Similar Documents

Publication Publication Date Title
DE60120734T2 (de) Vorrichtung zur erweiterung der bandbreite eines audiosignals
DE2115258C3 (de) Verfahren und Anordnung zur Sprachsynthese aus Darstellungen von individuell gesprochenen Wörtern
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE69631728T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69735097T2 (de) Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern
DE69932593T2 (de) Dekodierungsverfahren und system mit einem adaptiven postfilter
DE602005001995T2 (de) Basisband-Modem und Verfahren zur Spracherkennung und verwendendes Mobilkommunikationsendgerät
DE2736082A1 (de) Elektronisches geraet zur phonetischen synthetisierung menschlicher sprache (sprach-synthesizer)
WO2007073949A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
DE2626793A1 (de) Verfahren zur bewertung stimmhafter und stimmloser zustaende eines sprachsignals
DE112004000187T5 (de) Verfahren und Vorrichtung der prosodischen Simulations-Synthese
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE69635141T2 (de) Verfahren zur Erzeugung von Sprachmerkmalsignalen und Vorrichtung zu seiner Durchführung
DE60315544T2 (de) Telekommunikationsendgerät zur Veränderung eines übertragenen Sprachsignals bei einer bestehenden Fernsprechverbindung
DE69629485T2 (de) Kompressionsystem für sich wiederholende töne
DE4033350B4 (de) Verfahren und Vorrichtung für die Sprachverarbeitung
WO2008009429A1 (de) Verfahren, sprachdialogsystem und telekommunikationsendgerät zur multilingualen sprachausgabe
EP1282897A1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
EP0658874B1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
EP0058130B1 (de) Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und Schaltungsanordnung zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
8364 No opposition during term of opposition