DE102004063290A1 - Verfahren zur Anpassung von Comfort Noise Generation Parametern - Google Patents

Verfahren zur Anpassung von Comfort Noise Generation Parametern Download PDF

Info

Publication number
DE102004063290A1
DE102004063290A1 DE102004063290A DE102004063290A DE102004063290A1 DE 102004063290 A1 DE102004063290 A1 DE 102004063290A1 DE 102004063290 A DE102004063290 A DE 102004063290A DE 102004063290 A DE102004063290 A DE 102004063290A DE 102004063290 A1 DE102004063290 A1 DE 102004063290A1
Authority
DE
Germany
Prior art keywords
cng
parameters
cnp
qrc
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102004063290A
Other languages
English (en)
Inventor
Nitin Arora
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks GmbH and Co KG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102004063290A priority Critical patent/DE102004063290A1/de
Priority to EP05111976A priority patent/EP1677286A1/de
Priority to US11/321,482 priority patent/US20060143001A1/en
Priority to CNA2005101074003A priority patent/CN1801327A/zh
Publication of DE102004063290A1 publication Critical patent/DE102004063290A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Zur Anpassung von Comfort Noise Generation(CNG)-Parametern CNP, die zur Erzeugung eines Hintergrundrauschsignals in einem Telekommunikationssystem 1, bestehend aus einem paketorientierten Telekommunikationsnetzwerk 4 und zumindest einem ersten und zweiten daran angeschlossenen Kommunikationsgerät 2, 3, vorgesehen sind, werden zunächst die CNG-Parameter CNP in zumindest dem ersten Kommunikationsgerät 2 erzeugt und eingefügt in zumindest einem Silence Insertion Descriptor(SID)-Übertragungsrahmen SID über das paketorientierte Telekommunikationsnetzwerk 4 an das zweite Kommunikaitonsgerät 3 übertragen. Die übertragenen CNG-Parameter CNP werden mit einem vorgegebenen CNG-Parameter-Format CNPF verglichen und bei einem Abweichen von dem vorgegebenen CNG-Parameter-Format CNPF an das vorgegebene CNG-Parameter-Format CNPF dadurch angepasst, dass einzelne CNG-Parameter CNP entfernt und/oder fehlerbehaftete, fehlende oder inkompatible CNG-Parameter CNP durch vorgegebene Soll-CNG-Parameter SCNP ersetzt werden.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur Anpassung von Comfort Noise Generation (CNG) Parametern, die zur Erzeugung eines Hintergrundrauschsignals in einem Telekommunikationssystem bestehend aus einem paket-orientierten Telekommunikationsnetzwerk und zumindest einem ersten und zweiten daran angeschlossenen Kommunikationsgerät vorgesehen sind. Die CNG-Parameter werden in dem ersten Kommunikationsgerät erzeugt und eingefügt in zumindest einen Silence Insertion Descriptor (SID) Übertragungsrahmen über das paketorientierte Telekommunikationsnetzwerk an das zweite Kommunikationsgeräts übertragen.
  • Aufgrund einer zunehmenden globalen Ausrichtung von Unternehmen nimmt die Nutzung von Telekommunikationsdiensten zur Übermittlung von Sprache und Daten ständig zu. Dies hat zur Folge, dass die durch die Telekommunikationsdienste verursachten Kosten ständig steigen und zu einem erheblichen Kostenfaktor für Unternehmen werden, die Möglichkeiten zur Reduzierung dieser Kosten suchen. Eine Möglichkeit Daten, insbesondere Sprachdaten kostengünstig und weltweit übermitteln zu können, bieten globale und lokale Computernetze, wie beispielsweise ein Intranet oder das Internet. Hierbei werden auch vermehrt echtzeit-kritische Daten, beispielsweise Sprach- und Videodaten über lokale und globale paketorientierte Telekommunikationssysteme übermittelt.
  • In derartigen, insbesondere gemäß der Voice Over Internet Protocol (IP) – Technologie oder Code Division Multiple Access (CDMA)-Technologie realisierten Telekommunikationssystemen können die beispielsweise bei einem IP-Telefongespräch auftretenden Gesprächspausen bzw. die Zuhörphasen eines Gesprächspartners vorteilhaft dazu verwendet werden, das zu ü bertragende Datenvolumen innerhalb des Telekommunikationssystems zu reduzieren. Hierzu werden beispielsweise bei Sprachpausen eines Gesprächspartners anstelle eines realen Hintergrundgeräusches lediglich mehrere das Hintergrundgeräusch beschreibende Parameter in einem hierfür vorgesehen Übertragungsrahmen übertragen, aus denen in der Empfangsstation ein künstliches angenehmes Hintergrundrauschsignal („Comfort Noise Signal") erzeugt wird, so das dem aktuell sprechenden Gesprächspartner der Eindruck vermittelt wird, dass die Telekommunikationsverbindung auch in Gegenrichtung weiterhin besteht.
  • Diese Parameter beschreiben somit die Rauschsignalstärke sowie dessen spektrale Eigenschaften und werden in der Literatur als "Silence Insertion Descriptor (SID) Informationen" oder „Comfort Noise Generation (CNG) Parameter" bezeichnet. In der Empfangseinheit werden die CNG-Parameter zur Erzeugung eines künstlichen angenehmen Hintergrundgeräusches („Comfort Noise Generation") verwendet. Hierbei sind viele unterschiedliche Verfahren zur Erzeugung von CNG-Parameter und der folgenden Widerherstellung des Hintergrundgeräusches („Comfort Noise Generation") bekannt, die sowohl in der Empfangseinheit als auch in der Sendeeinheit implementierte und vordefinierte sowie zumindest teilweise standardisierte Protokolle für den Austausch von CNG-Parameter erfordern.
  • Eine unverbindliche Definition derartiger CNG-Parameter im Hinblick auf den zu verwendenden Übertragungsrahmen bzw. die in einem Datenpaket übertragene „Comfort Noise Payload" erfolgt im Standard G.711 Appendix II der ITU Telecommunication Standardization Section (ITU-T), die bereits festlegt, dass die „Comfort Noise Payload" einen die Rauschsignallautstärkepegel angebenden Parameter sowie mehrere die Spektraleigenschaften des Hintergrundrauschens in Form von Filterkoeffizienten angebende Parameter umfassen kann. Jedoch werden durch den ITU-T Standard G.711 Appendix II für „Interworking Scenarios" bei beispielsweise mehreren unterschiedlichen Ga teway-Computersystemen keine verbindlichen Randbedingungen in Hinblick auf den Aufbau und die Verwendung des SID-Übertragungsrahmens gesetzt, so dass unterschiedliche Ausgestaltungen des verwendeten SID-Übertragungsrahmens sowie der darin enthaltenen CNG-Parameter innerhalb der unterschiedlichen Telekommunikationssysteme vorliegen können.
  • Insbesondere bei den gemäß der Voice Over IP – oder CDMA – Technologie arbeitenden Telekommunikationssystemen werden beispielsweise in einem derartigen SID-Übertragungsrahmen entweder ausschließlich die Lautstärkeparameter („Quantized Energy Level") oder zusätzlich die Spektralparameter in Form von Filterkoeffizienten („Quantized Reflection Coefficients") übertragen, wobei hierbei die Anzahl der Filterkoeffizienten von Anwendungsfall zu Anwendungsfall deutlich variieren kann. Dies führt zu SID-Übertragungsrahmen mit unterschiedlicher Länge zwischen 1 Byte und 15 Bytes. Auch wird durch den ITU-T Standard G.711 Appendix II keine explizite Anleitung für die Ermittlung der Größenordnung der Parameter vorgegeben, so dass auch die in den SID-Übertragungsrahmen enthaltenen Parameter bzgl. der von Ihnen angenommenen Werte in einem breiten Umfang streuen können. Derartig unterschiedlich ausgestaltete CNG-Parametersätze führen zu einer deutlichen Verschlechterung des erzeugten Hintergrundgeräusches, welches beispielsweise in Extremfällen einen derartig hohen Lautstärkepegel annehmen kann, dass das eigentliche Sprachsignal übertönt wird, zumindest jedoch gestört wird.
  • Aufgabe der vorliegenden Erfindung ist es somit, ein Verfahren zur Anpassung von in zumindest einem SID-Übertragungsrahmen übertragenen CNG-Parametern zur Erzeugung eines Hintergrundrauschsignals in einem paket-orientieren Telekommunikationssystem anzugeben, bei dem CNG-Parameter unterschiedlichster Ausgestaltung bzw. Verfahren zu Erzeugung derartiger CNG-Parametersätze unterstützt werden und jeweils ein annähernd gleich gute Signaleigenschaften aufweisendes Hintergrundrauschsignal erzeugt wird.
  • Die Aufgabe wird ausgehen von dem Oberbegriff des Patentanspruches 1 durch dessen kennzeichnende Merkmale gelöst.
  • Der wesentliche Vorteil des erfindungsgemäßen Verfahrens ist darin zu sehen, dass die übertragenen CNG-Parameter mit einem vorgegebenen CNG-Parameter-Format verglichen werden und bei einem Abweichen von dem vorgegebenen CNG-Parameter-Format an das vorgegebene CNG-Parameter-Format dadurch angepasst werden, das einzelne CNG-Parameter entfernt und/oder fehlerbehaftete, fehlende oder inkompatible CNG-Parameter durch vorgegebene Soll-CNG-Parameter ersetzt werden. Vorteilhaft können durch das Aussondern von überzähligen und/oder das Ersetzen von fehlenden oder fehlerbehafteten CNG-Parametern durch Default-Parameter hohe Lautstärkepegel des Hintergrundrauschsignals, die das eigentliche Sprachsignal übertönen oder stören, vermieden werden. Das Verfahren ist insbesondere auch für den Einsatz innerhalb unterschiedlicher Gateway-Computersysteme mit unterschiedlichen „Interworking Scenarios" geeignet.
  • Weiterhin vorteilhaft wird durch das vorgegebene CNG-Parameter-Format die Anzahl der übertragenen CNG-Parameter auf höchstens 11 Parameter beschränkt, die einen QEL-Parameter und 10 QRC-Koeffizienten umfassen. Die Beschränkung der Parameteranzahl auf höchstens 11 Parameter, wovon 10 als Spektralparameter ausgebildet sind, ermöglicht den Einsatz von handelsüblichen Filtereinheiten und reduziert sowohl den hardwaretechnischen Implementierungsaufwand als auch den Rechenaufwand innerhalb des Telekommunikationssystems.
  • Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
  • Ein Ausführungsbeispiel der Erfindung wird im Folgenden anhand von schematischen Blockdarstellungen näher erläutert.
  • Dabei zeigen:
  • 1 beispielhaft ein Telekommunikationssystem, insbesondere zur Übertragung von Sprachdatensignalen;
  • 2 beispielhaft das den Lautstärkepegel angebende erste Byte eines SID-Übertragungsrahmens;
  • 3 beispielhaft die Comfort Noise Payload eines SID-Übertragungsrahmens und
  • 4 beispielhaft in einem Ablaufdiagramm die einzelnen Verfahrensschritte zur Anpassung der CNG-Parameter.
  • In 1 ist beispielhaft anhand eines schematischen Strukturbildes ein Telekommunikationssystem 1, insbesondere ein paket-orientiertes Telekommunikationssystem dargestellt, dass ein erstes Kommunikationsgerät 2 und ein zweites Kommunikationsgerät 3 aufweist, die beispielsweise über ein paketorientiertes bzw. IP-orientieres Kommunikationsnetzwerk 4 miteinander verbunden sind. Die Datenübertragung über das IPorientiere Kommunikationsnetzwerk 4 erfolgt hierbei mittels Datenpakete. Beispielsweise können das erste und zweite Kommunikationsgerät 2, 3 als Gateway-Computersysteme ausgestaltet sein, die unterschiedlicher technischer Struktur sind und an die wiederum Kommunikationsendgeräte wie beispielsweise ein IP Telefon oder Client-Computersysteme etc. angeschlossen sind (in den Figuren nicht dargestellt). Ferner ist in dem ersten Kommunikationsgerät 2 beispielhaft eine Sendeeinheit 5 und in dem zweiten Kommunikationsgerät 3 eine Empfangseinheit 6 vorgesehen, die zur Übertragung der Datenpakete über das IP-orientiere Kommunikationsnetzwerk 4 beispielsweise gemäß dem Übertragungsstandard G.711 der ITU ausgebildet sind. Alternativ kann auch der Übertragungsstandard G.726 der ITU Verwendung finden.
  • Um die Übertragungsrate innerhalb des IP-orientierten Kommunikationsnetzwerks 4 zu reduzieren weist die Sendeeinheit 5 eine „Voice Activity Detection (VAD)" Einheit 7 auf, die über eine Verbindungsleitung mit beispielsweise einem Eingang I2 des ersten Kommunikationsgerätes 2 verbunden ist und die die sogenannte „Voice Activity Detection (VAD)" Funktionalität unterstützt. Ein am Eingang I2 empfangenes Datensignal bzw. Sprachdatensignal wird an die VAD-Einheit 7 übertragen und dort ein Fehlen von zu sendenden Sprachdaten in dem Datensignal bzw. das alleinige Vorliegen von Hintergrundrauschen erkannt. Liegen keine Sprachdaten vor, so wird durch die VAD-Einheit 7 ein sogenannter „Silence Insertion Descriptor" (SID) Übertragungsrahmen erzeugt, der in der Sendeeinheit 5 weiterverarbeitet und anschließend an die Empfangseinheit 6 des zweiten Kommunikationsgerätes 3 übermittelt wird. Dieser Vorgang wird solange fortgesetzt bis erneut Sprachdaten in der Sendeeinheit 5 zur Verfügung stehen.
  • Ferner ist in der Sendeeinheit 5 eine „Discontinuous Transmission" (DTX) Einheit 8 vorgesehen, die ebenfalls über Verbindungsleitungen mit dem Eingang I2 des ersten Kommunikationsgerätes 2 und der VAD-Einheit 7 verbunden ist. Mit Hilfe der DTX-Einheit 8 werden die erzeugten SID-Übertragungsrahmen SID während einer zusammenhängenden Sprachpause gezählt und somit die Häufigkeit der Erzeugung bzw. der Übertragung der SID-Übertragungsrahmen SID während der Sprachpausen ermittelt.
  • Darüber hinaus ist die VAD-Einheit 7 über eine Verbindungsleitung mit einer ersten „Comfort Noise Generation" (CNG)-Einheit 9 verbunden, die ebenfalls über eine weitere Verbindungsleitung mit dem Eingang I2 verbunden ist. An die erste CNG-Einheit 9 wird der in VAD-Einheit 7 erzeugte SID-Übertragungsrahmen SID vor der Übermittlung an das zweite Kommunikationsendgerät 3 zur Weiterverarbeitung übergeben. In der ersten CNG-Einheit 9 wird das in der Sprachpause vorliegende Hintergrundrauschen anhand von „Comfort Noise Generation"-Parametern CNP erfasst, die insbesondere die Lautstärke des Hintergrundrauschens anhand eines „Quantized Energy Level" Parameters QEP und gegebenenfalls die spektralen Eigenschaften des Hintergrundrauschens anhand von mehreren „Quan tized Reflection Coefficients" Koeffizienten QRC wiedergeben. Die ermittelten Comfort Noise Generation Parameter CNP bzw. der „Quantized Energy Level" Parameters QEP und die „Quantized Reflection Coefficients" Koeffizienten QRC werden in den SID-Übertragungsrahmen SID eingefügt.
  • Ferner werden in der Sendeeinheit 5 beispielsweise übermittelte Sprachdaten in einem Nutzdatenübertragungsrahmen VP – in der Literatur häufig als „voice frames" bezeichnet – gepackt, die wiederum in – nicht dargestellte Datenpakete eingefügt über das IP-orientierte Telekommunikationsnetzwerk 4 übermittelt werden. Hierzu ist in der Sendeeinheit 5 des ersten Kommunikationsgerätes 2 eine erste Sprachsignaleinheit 10 vorgesehen, die mit dem Eingang I2 des ersten Telekommunikationsgerätes 2 verbunden ist. Über die erste Sprachsignaleinheit 10 wird ein über den Eingang I2 empfangenes Sprachdatensignal kodiert und in einen Nutzdatenübertragungsrahmen VP eingefügt. Wie in der 1 angedeutet werden anschließend die erzeugten Nutzdatenübertragungsrahmen VP und die erzeugten SID-Übertragungsrahmen SID in – nicht dargestellte – Datenpakete eingefügt und über das IP-orientierte Telekommunikationsnetzwerk 4 übermittelt.
  • An die erste Sprachsignaleinheit 10 und die erste CNG-Einheit 9 ist über Verbindungsleitungen eine Multiplexeinheit 11 angeschlossen, die den Nutzdatenübertragungsrahmen VP oder den SID-Übertragungsrahmen SID hierzu in zumindest ein Datenpaket verpackt und an den Ausgang E2 des ersten Kommunikationsgerätes 2 zur Übertragung über das IP-orientierte Telekommunikationsnetzwerk 4 steuert.
  • Am einem Eingang I3 des zweiten Kommunikationsgerätes 3 ist eine Demultiplexereinheit 12 angeschlossen, die die in den empfangen Datenpaketen enthaltenen Übertragungsrahmen VP bzw. SID ausliest und entweder an eine angeschlossene zweite Sprachsignaleinheit 13 oder an eine zweite „Comfort Noise Generation" (CNG)- Einheit 14 weiterleitet.
  • Anhand der zweiten CNG-Einheit 14 werden die im SID-Übertragungsrahmen SID enthaltenen Informationen ausgelesen und zur Erzeugung eines Hintergrundgeräusches ausgewertet. Ferner sind in der Empfangseinheit 6 beispielhaft eine Steuereinheit 15 sowie eine Speichereinheit 16 vorgesehen, die zur Steuerung der CNG-Einheit 14 und der zweite Sprachsignaleinheit 13 sowie zur Speicherung von Daten, insbesondere der zuletzt empfangenen „Comfort Noise Generation"-Parametern CNP vorgesehen sind.
  • In 2 ist beispielhaft das die „Quantized Energy Level" Parameter QEP angebende erste Byte innerhalb des SID-Übertragungsrahmens SID dargestellt. Der Rauschsignalpegel wird hierbei in -dBov angegeben, wobei Werte von 0 bis 127 sowie von 0 bis –127 dBov abgebildet werden können. Zur Darstellung des genannten Wertebereiches des „Quantized Energy Level" Parameters QEP werden 8 Bits vorgesehen, die dem ersten Byte des SID-Übertragungsrahmens SID entsprechen. Hierbei ist das die nullte Bitposition aufweisende Bit pauschal mit dem Wert 0 belegt und das verbleibenden erste bis siebte Bit geben den eigentlichen Rauschsignalpegelwert wieder, wobei an erster Bitposition das „Most Significant Bit" (MSB) vorgesehen ist.
  • Die „Quantized Reflection Coefficients" Koeffizienten QRC werden anhand der zweiten bis M+1-ten Bytes innerhalb des SID-Übertragungsrahmens SID übertragen, wobei anhand des zweiten Bytes der erste QRC-Koeffizient N1, anhand des zweiten Bytes der zweite QRC-Koeffizient N2 usw. übertragen wird. Der M-te QRC-Koeffizient NM wird schließlich zuletzt übertragen, wobei hierbei durch die Anzahl M der QRC-Koeffizienten QRC die Ordnung des digitale Filters bestimmt wird, über welches das Hintergrundrauschen aus einem gaussförmigen Zufallssignal bzw. stochastischen Zufallsrauschsignal gebildet wird. Überlicherweise werden digitale Filter, insbesondere Synthesefilter der Ordnung M = 10 bis 15 verwendet.
  • Im Folgenden wird anhand des in 4 dargestellten Ablaufdiagramms das Verfahren zur Anpassung von in zumindest einem SID-Übertragungsrahmen SID übertragenen „Comfort Noise Generation" Parametern CNP zur Erzeugung eines verbesserten Hintergrundrauschens näher erläutert.
  • Wird durch die zweite CNG-Einheit 14 ein SID-Übertragungsrahmen SID mit darin enthaltenen „Comfort Noise Generation" Parametern CNP empfangen, so werden in einem ersten Schritt 17 diese aus dem SID-Übertragungsrahmen SID entnommen. Sind im SID-Übertragungsrahmen SID keine neuen „Comfort Noise Generation" Parametern CNP enthalten, so werden die zuletzt in der Speichereinheit 16 abgelegten „Comfort Noise Generation" Parameter CNP für die Erzeugung der Hintergrundrauschens verwendet.
  • In einem zweiten Schritt 18 werden die entnommenen CNG-Parameter CNP einer Analyse unterzogen, und zwar derart, dass zunächst diese in den „Quantized Energy Level" Parameter QEP und die „Quantized Reflection Coefficients" Koeffizienten QRC aufgespalten werden und hierbei die Anzahl M der übertragenen QRC-Koeffizienten N1 – NM bestimmt wird. Darüber hinaus werden byteweise die Parameterwerte dahingehend überprüft, ob diese innerhalb eines vorgegebenen Bereiches liegen, der durch ein vorgegebenes CNG-Parameter-Format CNPF bzw. eine vorgegebene Anzahl von Bytes übersteigen. Somit ist durch das vorgegebene CNG-Parameter-Format CNPF eine vorgegebene Anzahl von Filterkoeffizienten, im vorliegenden Ausführungsbeispiel M = 10 QRC-Koeffizienten N1 – N10 festgelegt. Untersuchungen haben ergeben, dass bei Verwendung von M = 10 Filterkoeffizienten die besten Ergebnisse im Hinblick auf Übertragungsrate und Qualität des erzeugten Hintergrundrauschens erzielt werden. Somit werden lediglich diejenigen aus dem SID-Übertragungsrahmen ausgelesenen CNG-Parameter CNP, die diese Anforderungen erfüllen, ohne Anpassung unmittelbar zur Filterung verwendet.
  • Alle verbleibenden, d.h. nicht den Vorgaben entsprechenden CNG-Parameter CNP werden in einem dritten Schritt 19 zunächst an das vorgegebene CNG-Parameter-Format CNPF angepasst. Hierzu werden zunächst überzählige Filterkoeffizienten, d.h die die Anzahl von 11 Bytes (QEL-Parameter QEP = erste Byte; QRC-Koeffizienten N1 – N10 = zweites bis elftes Byte) übersteigenden 12 bis N-ten Bytes des empfangenen SID-Übertragungsrahmens SID abgeschnitten und somit entfernt. Vorteilhaft können hierdurch Standardfilter für die Erzeugung des Hintergrundrauschsignals verwendet werden, wodurch der die Anpassung der Filterordnung der in den unterschiedlichen Sende-und Empfangseinheiten vorgesehen Filter entfällt.
  • In einem vierten Schritt 20 werden die nunmehr aus maximal elf Bytes bestehenden CNG-Parameter CNP inhaltlich überprüft, d.h. die QEL -Parameter QEP und die verbleibenden QRC-Koeffizienten QRC werden genauer analysiert und beispielsweise fehlende oder unvollständige oder fehlerbehaftete oder inkompatible durch Soll-CNG-Parameter SCNP ersetzt. Die Soll-CNG-Parameter SCNP werden einem „Set of Golden Parameters" SGP entnommen, welcher in der Speichereinheit 16 gespeichert ist.
  • Das „Set of Golden Parameters" SGP umfasst in einer bevorzugten Ausführungsform einen goldenen QEL-Parameter GQEP und zehn goldene QRC-Koeffizienten GQRC, die durch umfangreiche Analysen zahlreicher Testfiles mit standardisierten oder im Versuchsfeld gewonnen Sprachproben ermittelt wurden. Hierzu wurde eine Spektralanalyse der Sprachproben erstellt, nachdem diese einer Hochpassfilterung, einer Fensterfilterung sowie mit einer Autokorrelationsfunktion und dem Levison-Durbin-Algorithmus beaufschlagt wurden, wobei das „Set of Golden Parameters" SGP derart gewählt ist, dass das erzeugte Hintergrundrauschen in einem einheitlichen Frequenzbereich zwischen 900 bis 3400 Hz zu liegen kommt. Hierbei wird die empfangen Signalenergie auf den genannten Frequenzbereich annähernd gleichmäßig zwischen 900 bis 3400 Hz verteilt. Insbesondere wurde darauf geachtet, dass nur wenige Frequenzanteile in den bei dem menschlichen Gehör einen lauteren Eindruck hervorrufenden Frequenzbereich von 300–900 Hz fallen.
  • Die derart angepassten CNG-Parameter CNP* werden anschließend in einem fünften Schritt 21 im Hinblick auf den durch diesen erzeugbaren Signalpegel des Hintergrundrauschens geglättet. Dies wird beispielsweise analog zu dem im ITU-Standard G.711 Appendix II defirtierten Verfahren durchgeführt.
  • Im einem weiteren sechsten Schritt 22 werden die angepassten QRC-Koeffizienten QRC* unter Verwendung des Levison Durbin Algorithmus in „Linear Prediction Coefficient (LPC)"-Koeffizienten LPC umgesetzt. Hierbei können resourcenschonend bereits für die goldenen QRC-Koeffizienten GQRC berechnete goldene LPC-Koeffizienten LPC, welche ebenfalls in der Speichereinheit 16 abgespeichert sind, unmittelbar verwendet werden, d.h. es entfällt eine rechenintensive Ermittlung der zugehörigen LPC-Koeffizienten LPC für die aus dem „Set of Golden Parameters" SGP entnommenen QRC-Koeffizienten QRC*.
  • In einem siebten Schritt 23 wird ein gaussförmiges Zufallssignal erzeugt, welches einer Kalibrierung unterzogen wird. Schließlich wird in einem achten Schritt 24 das erzeugte gaussförmige Zufallssignal durch eine Filterung bzw. eine Synthesefilterung über eine mit den ermittelten LPC-Koeffizienten LPC beaufschlagten Filtereinheit durchgeführt und hierdurch das Hintergrundrauschsignal erzeugt, welches dem Sprachdatensignal überlagert wird.
  • Die Erfindung wurde voranstehend anhand mehrerer Ausführungsbeispiele beschrieben. Es versteht sich, dass zahlreiche Modifikationen sowie Abwandlungen möglich sind, ohne dass dadurch der der Erfindung zugrunde liegende Erfindungsgedanke verlassen wird.

Claims (10)

  1. Verfahren zur Anpassung von Comfort Noise Generation (CNG) Parametern (CNP), die zur Erzeugung eines Hintergrundrauschsignals in einem Telekommunikationssystem (1) bestehend aus einem paket-orientierten Telekommunikationsnetzwerk (4) und zumindest einem ersten und zweiten daran angeschlossenen Kommunikationsgerät (2, 3) vorgesehen sind, bei dem die CNG-Parameter (CNP) in zumindest dem ersten Kommunikationsgeräts (2) erzeugt werden und eingefügt in zumindest einem Silence Insertion Descriptor (SID) Übertragungsrahmen (SID) über das paket-orientierte Telekommunikationsnetzwerk (4) an das zweite Kommunikationsgeräts (3) übertragen werden, dadurch gekennzeichnet – dass die übertragenen CNG-Parameter (CNP) mit einem vorgegebenen CNG-Parameter-Format (CNPF) verglichen werden, – dass die übertragenen CNG-Parameter (CNP) bei einem Abweichen von dem vorgegebenen CNG-Parameter-Format (CNPF) an das vorgegebene CNG-Parameter-Format (CNPF) dadurch angepasst werden, das einzelne CNG-Parameter (CNP) entfernt und/oder fehlerbehaftete, fehlende oder inkompatible CNG-Parameter (CNP) durch vorgegebene Soll-CNG-Parameter (SCNP) ersetzt werden.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die übertragenen CNG-Parameter (CNP) zumindest einen „Quantized Energy Level" (QEL)-Parameter (QEP) und mehrere „Quantized Reflection Coefficients (QRC)" Koeffizienten (QRC) umfassen.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die vorgegebenen Soll-CNG-Parameter (SCNP) aus einem dem vorgegebenen CNG-Parameter-Format (CNPF) entsprechenden „Set of Golden Parameters" (SGP) ausgewählt werden.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die im „Set of Golden Parameters" (SGP) enthaltenen Soll-CNG-Parameter (SCNP) derart ausgewählt werden, dass die Signalenergie des mittels der Soll-CNG-Parameter (SCNP) erzeugten Hintergrundrauschsignals nahezu gleichmäßig über den Frequenzbereich von 900 bis 3400 Hz verteilt ist.
  5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass zur Anpassung der übertragenen CNG-Parameter (CNP) an das vorgegebene CNG-Parameter-Format (CNPF) mindestens einer der „Quantized Reflection Coefficients (QRC)" Koeffizienten (QRC) entfernt wird.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass durch das vorgegebene CNG-Parameter-Format (CNPF) die Anzahl der übertragenen CNG-Parameter (CNP) auf höchstens 11 Parameter beschränkt wird, die einen QEL-Parameter (QEP) und 10 QRC-Koeffizienten (QRC) umfassen.
  7. Verfahren nach einem der Ansprüche 2 bis 6, dadurch gekennzeichnet, dass über die QEL-Parameter (QEP) der Pegel des zu erzeugenden Hintergrundrauschsignals und über die QRC-Koeffizienten (QRC) die Verteilung der spektralen Signalenergie des zu erzeugenden Hintergrundrauschsignals übermittelt wird.
  8. Verfahren nach einem der Ansprüche 3 bis 7, dadurch gekennzeichnet, dass die im „Set of Golden Parameters" (SGP) enthaltenen Soll-CNG-Parameter (SCNP) mittels Spektralanalysen von Testdatensignalen ermittelt werden, wobei die Testdatensignale Frequenzen im Bereich von 300 bis 3400 Hz, insbesondere im Bereich von 900 bis 3400 Hz aufweisen.
  9. Verfahren nach einem der Ansprüche 2 bis 6, dadurch gekennzeichnet, dass zur Erzeugung des Hintergrundrauschsignals ein gaussförmiges Zufallssignal empfangsseitig erzeugt wird, welches mittels einer Filtereinheit, insbesondere einer Synthesefiltereinheit zur Erzeugung des Hintergrundrauschsignals gefiltert wird.
  10. Verfahren nach einem der Ansprüche 9, dadurch gekennzeichnet, dass die angepassten QRC-Koeffizienten (QRC*) unter Verwendung des Levison Durbin Algorithmus in Linear Prediction Coefficient (LPC)-Koeffizienten (LPC) umgesetzt werden und die Filtereinheit, insbesondere die Synthesefiltereinheit mit diesen LPC-Koeffizienten (LPC) beaufschlagt wird.
DE102004063290A 2004-12-29 2004-12-29 Verfahren zur Anpassung von Comfort Noise Generation Parametern Ceased DE102004063290A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102004063290A DE102004063290A1 (de) 2004-12-29 2004-12-29 Verfahren zur Anpassung von Comfort Noise Generation Parametern
EP05111976A EP1677286A1 (de) 2004-12-29 2005-12-12 Verfahren zur Anpassung von Comfort Noise Generation Parametern
US11/321,482 US20060143001A1 (en) 2004-12-29 2005-12-29 Method for the adaptation of comfort noise generation parameters
CNA2005101074003A CN1801327A (zh) 2004-12-29 2005-12-29 舒适噪声产生参数的匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102004063290A DE102004063290A1 (de) 2004-12-29 2004-12-29 Verfahren zur Anpassung von Comfort Noise Generation Parametern

Publications (1)

Publication Number Publication Date
DE102004063290A1 true DE102004063290A1 (de) 2006-07-13

Family

ID=36084186

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102004063290A Ceased DE102004063290A1 (de) 2004-12-29 2004-12-29 Verfahren zur Anpassung von Comfort Noise Generation Parametern

Country Status (4)

Country Link
US (1) US20060143001A1 (de)
EP (1) EP1677286A1 (de)
CN (1) CN1801327A (de)
DE (1) DE102004063290A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7688810B2 (en) * 2006-12-28 2010-03-30 Verizon Services Organization Inc. Method and system for inserting comfort signal in reaction to events
US7613175B2 (en) * 2006-12-28 2009-11-03 Verizon Services Organization Inc. Method and system for inserting user defined comfort signal
US7715372B2 (en) * 2006-12-28 2010-05-11 Verizon Services Organization Inc. Method and system for inserting selected comfort signal
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN104156509A (zh) * 2014-07-24 2014-11-19 西北工业大学 一种噪声合成方法
EP2980801A1 (de) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Schätzung des Rauschens in einem Audiosignal, Rauschschätzer, Audiocodierer, Audiodecodierer und System zur Übertragung von Audiosignalen

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
DE69724739T2 (de) * 1996-11-15 2004-07-22 Nokia Corp. Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
DE69724739T2 (de) * 1996-11-15 2004-07-22 Nokia Corp. Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung

Also Published As

Publication number Publication date
CN1801327A (zh) 2006-07-12
US20060143001A1 (en) 2006-06-29
EP1677286A1 (de) 2006-07-05

Similar Documents

Publication Publication Date Title
EP2245621B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE69913262T2 (de) Vorrichtung und verfahren zur anpassung der rauschschwelle zur sprachaktivitätsdetektion in einer nichtstationären geräuschumgebung
DE60012860T2 (de) Verfahren zur Verarbeitung mehrerer digitaler Audiodatenströme
DE60129327T2 (de) Anordnung und verfahren in bezug auf die vermittlung von sprache
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
EP1388147B1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
EP1386307B1 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE602005001048T2 (de) Erweiterung der Bandbreite eines schmalbandigen Sprachsignals
DE69425808T2 (de) Vorrichtung zur Kompression und Expansion der Bandbreite eines Sprachsignals, Verfahren zur Übertragung eines komprimierten Sprachsignals sowie Verfahren zu dessen Wiedergabe
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
EP0980064A1 (de) Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
EP1677286A1 (de) Verfahren zur Anpassung von Comfort Noise Generation Parametern
WO1998023130A1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
DE69616724T2 (de) Verfahren und System für die Spracherkennung
DE60222770T2 (de) Verbessertes verfahren zur ermittlung der qualität eines sprachsignals
EP2245620B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE60225505T2 (de) Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern
DE112016006762T5 (de) Vorrichtung und Verfahren zur Ausgleichung einer Klangfarbe eines Ohrhörersets
WO2008006905A2 (de) Verfahren und system zur reduzierung des empfangs unerwünschter nachrichten
WO2009103609A1 (de) Verfahren und mittel zur dekodierung von hintergrundrauschinformationen
DE60210597T2 (de) Vorrichtung zur adpcdm sprachkodierung mit spezifischer anpassung der schrittwerte
EP1433166B1 (de) Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO.KG, 81541 MUE, DE

8131 Rejection