DE69827545T2 - Vorrichtung zur Erzeugung von Hintergrundrauschen - Google Patents

Vorrichtung zur Erzeugung von Hintergrundrauschen Download PDF

Info

Publication number
DE69827545T2
DE69827545T2 DE69827545T DE69827545T DE69827545T2 DE 69827545 T2 DE69827545 T2 DE 69827545T2 DE 69827545 T DE69827545 T DE 69827545T DE 69827545 T DE69827545 T DE 69827545T DE 69827545 T2 DE69827545 T2 DE 69827545T2
Authority
DE
Germany
Prior art keywords
circuit
noise
power
raster
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69827545T
Other languages
English (en)
Other versions
DE69827545D1 (de
Inventor
Cyrille Morel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE69827545D1 publication Critical patent/DE69827545D1/de
Application granted granted Critical
Publication of DE69827545T2 publication Critical patent/DE69827545T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Diese Erfindung betrifft eine Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere eine Schaltung zur Bestimmung der Energie des laufenden Rasters und eine Schaltung zur Bestimmung der Umhüllung dieses Rasters per so genannter LPC-Analyse beinhaltet.
  • Wenn man Sprachsignale in Netzwerktypen überträgt, die auch andere Daten als solche Signale befördern, ist es oft nützlich, sich zu versichern, dass Sie nicht die gesamte Bandbreite einnehmen und den gleichzeitigen Durchgang dieser anderen Daten zulassen, was der Optimierung ihres Datenflusses gleichkommt. Dann ist vor der Übertragung ein Detektor der Sprachaktivität vorgesehen, der in den Eingangssignalen dort, wo Sprachsignale mit Rauschen und stillen Momenten vermischt sind, das Auffinden derjenigen Zeiträume ermöglicht, in denen die Sprachsignale anwesend sind.
  • Wenn die Anwesenheit von Sprachsignalen erkannt wird, überträgt der nachfolgende Sprachkodierer regelmäßig (alle Raster) einen digitalen Datenstrom, der es einem entfernten Gesprächspartner ermöglicht, diese Sprachsignale später wiederherzustellen. Wenn man dagegen keine Sprachsignale mehr erkennt, schickt man keine kodierten Raster mehr ins Netz, um hierin den Datenfluss einzusparen. Für den entfernten Gesprächspartner kann man dann während dieser sprachlosen Zeiträume die Signalmuster auf Null erzwingen. Diese Lösung ist für die Verringerung des Datenflusses effizient, kann jedoch für den Gesprächspartner zu unangenehmen Effekten führen. Denn in der Mehrheit der Fälle gibt es keine vollkommene Stille an den Orten, an denen das Gespräch stattfindet, sondern eher eine Umgebungsrauschen. Wenn folglich im Zeitpunkt der Sprache/Stille-Übertragungen die Eingangssignalmuster auf Null gezwungen werden, hat der Gesprächspartner den Eindruck einer Diskontinuität des Gesprächs oder selbst einer Unterbrechung der Leitung.
  • Das Ziel dieser Erfindung ist die Bereitstellung einer Vorrichtung zur Erzeugung von Komfortrauschen, die diese Nachteile behebt.
  • Die Erfindung betrifft zu diesem Zweck eine Vorrichtung zur Erzeugung von Komfortrauschen entsprechend der Definition im einleitenden Absatz der Beschreibung, die außerdem dadurch gekennzeichnet ist, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen Rauschens, ein Untersystem aus zwei Stimmen zur parallelen Leistungsdefinition und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird, wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung, deren Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter und einen Multiplizierer mit einem Wägungskoeffizienten α enthält, und der zweite Leistungsdefinitionsweg einen Multiplizierer mit dem zusätzlichen Wägungskoeffizienten (L – α) enthält.
  • Diese Vorrichtung ermöglicht es, dem entfernten Gesprächspartner eine Meldung besserer Qualität wiederzugeben. Denn mit der Übertragung während den Ruhezeiten von einigen Rastern, welche die grundsätzlichen Merkmale des Umgebungsrauschens enthalten, beseitigt man diesen unangenehmen Eindruck der Leitungsunterbrechung im Falle völliger Ruhe. Die Kodierung dieser paar Rauschraster ist sehr wenig kostspielig im Datenfluss, da man nur die Frequenz- und Energiemerkmale des Rauschsignals senden muss, die ausreichen, um dem Gesprächspartner ein weitgehend äquivalentes Rauschen wiederzugeben. Vorrichtungen für die Erzeugung von Komfortrauschen sind bereits in Sprachkodierern enthalten, beschrieben z. B. in US-A-55 37509 von C. B. Southcottetal: "voice control of the pan-european digital mobile radio system", Communications technology for the 1990's and beyond, Dallas, 27.–30. Nov. 1989, Band 2 von 3, 27.11.1989, Institute of electrical and electronics engineers, Seiten 1070–1074, oder aus dem Empfehlungsprojekt, das kürzlich von der Internationalen Telekommunikations-Union (ITU) veröffentlicht wurde, "Draft Recommendation G.723Dual rate speech coder for multimedia telecommunication transmitting at 5.3 and 6.3 kbits/s", ITU, Study Group 15, 1995, 10. "LBC Meeting", Newton, Ma., USA, mit dem Ziel, eine Norm für einen Sprachkodierer zu definieren. Dazu muss man allerdings bemerken, das im Falle dieser bestehenden Ausführungen der Vorgang für die Erzeugung von Komfortrauschen sehr stark in den Sprachkodierer impliziert ist. Im vorliegenden Falle dagegen ist die Erzeugung nicht vom Kodierer abhängig. Denn man bedient sich nicht mehr der Wellenformdiktionäre, die traditionsgemäß in den Sprachkodierern enthalten waren, sondern der Addition des gefilterten Rauschens mit einem gaußschen Rauschen, das besonders interessant ist, wenn das Umgebungsrauschen sehr schwach ist.
  • Die Besonderheiten der Erfindung treten jetzt anhand der folgenden Beschreibung und der beigefügten Zeichnung (1) detaillierter in Erscheinung, die als nicht erschöpfendes Beispiel gegeben werden und ein Ausführungsbeispiel einer Vorrichtung zur Erzeugung von Rauschen nach der Erfindung veranschaulichen.
  • Auf 1 sind die Eingangssignale im Kodierteil in der Form von aufeinanderfolgenden Rastern TRn–1, TRn, ... vorbestimmter Dauer verfügbar. Dieser Kodierteil enthält zuerst wie auf der Figur vermerkt eine Schaltung 11 zur Bestimmung der Energie des laufenden Rasters, auch als Leistungsanalyse bezeichnet, sowie eine Schaltung 12 zur Bestimmung der Umhüllung dieser Raster (vom Standpunkt der Frequenz) mit einer unter dem Namen LPC (in Englisch: linear predictive coding) bekannten Analyse, welche eine Bewertung der linearen Voraussagekoeffizienten ermöglicht. Diese Merkmale der Eingangssignale werden quantifiziert, kodiert und übertragen.
  • Bei der Dekodierung, wo man ein so genanntes Komfortrauschen für den entfernten Gesprächspartner wiederherstellen möchte, enthält die Vorrichtung zur Erzeugung von Rauschen nach der Erfindung zuerst eine Schaltung 21 zur Erzeugung eines gaußschen Rauschens. Diese Schaltung ist kein Wellenformdiktionär und erfordert demnach keinen Speicher. Die Berechnung zur Ermöglichung dieser Erzeugung ist eine in Echtzeit gebildete Summe von Pseudozufallszahlen (man erhält ein gaußsches Signal, wenn die Anzahl an Iterationen ausreichend groß ist, weniger als zehn reichen generell aus). Dieses Rauschen wird parallel über zwei Leistungsdefinitionswege 30 und 40 gesendet, von denen der erste in Serie eine Leistungsschaltung 31 (diese Leistung wird von der Energie des betreffenden laufenden Rasters bestimmt, die übertragen wurde), einen Filter 32 (dessen ebenfalls übertragenen LPC-Koeffizienten wie hiervor aufgezeigt bewertet wurden) und einen Multiplizierer 33 aufweist. Der Ausgang dieses Multiplizierers 33 und und der eines ähnlichen Multiplizierers 43, welche den anderen Weg 40 (diese Multiplizierer ermöglichen Wägungen mit den jeweiligen Koeffizienten a und 1 – a) bilden, bilden die Eingänge eines Addierers 25, an dessen Ausgang das wiederhergestellte Komfortrauschraster TBC beim Ausbleiben von Sprachsignalen kommt.
  • Man hat folglich im Kodierteil die Energie des betreffenden Rasters bestimmt und quantifiziert, um die Leistung einer der Leistungsdefinitionswege festzulegen, und auch die Koeffizienten des Filters dieses selben Leistungsdefinitionswegs bewertet und quantifiziert, anhand eines gaußschen Rauschens (das man einer Filterung unterzieht) ein Rauschen mit praktisch den selben spektralen Merkmalen wie das Originalrauschen zu regenerieren. Beim Anhören ist dieses wiederhergestellte Rauschen nicht genau dasselbe wie das Originalrauschen, doch die Qualität wird deutlich verbessert, da die brutalen Übergänge zwischen Sprache und völliger Ruhe nunmehr vermieden werden.
  • Selbstverständlich ist in diese Erfindung nicht auf dieses Ausführungsbeispiel beschränkt, anhand dessen Varianten vorgesehen werden können. Für die Dekodierung kann man z. B. die Tatsache berücksichtigen, dass man den Datenflusses reduziert hat, indem man nicht jedes Mal ein kodiertes Raster überträgt: Um die abrupten Übergänge zu verringern ist es dann möglich, eine Interpolation mit den vorhergehenden Rastern zu machen, was die Energie und die Filterkoeffizienten betrifft. Auch kann man die Qualität verbessern, indem man zur Kodierung auch eine Interpretation der vorhergehenden Raster vorsieht.
    encoding = Kodierung
    decoding = Dekodierung

Claims (1)

  1. Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere eine Schaltung zur Bestimmung der Energie (11) des laufenden Rasters und eine Schaltung zur Bestimmung der Umhüllung (12) dieses Rasters per so genannter LPC-Analyse beinhaltet, dadurch gekennzeichnet, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen Rauschens (21), ein Untersystem aus zwei Stimmen (30, 40) zur parallelen Leistungsdefinition und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird, wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung (31), deren Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter (32) und einen Multiplizierer (33) mit einem Wägungskoeffizienten enthält, und der zweite Leistungsdefinitionsweg einen Multiplizierer (43) mit dem zusätzlichen Wägungskoeffizienten (L – α) enthält.
DE69827545T 1997-03-25 1998-03-10 Vorrichtung zur Erzeugung von Hintergrundrauschen Expired - Fee Related DE69827545T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9703617A FR2761512A1 (fr) 1997-03-25 1997-03-25 Dispositif de generation de bruit de confort et codeur de parole incluant un tel dispositif
FR9703617 1997-03-25

Publications (2)

Publication Number Publication Date
DE69827545D1 DE69827545D1 (de) 2004-12-23
DE69827545T2 true DE69827545T2 (de) 2005-12-15

Family

ID=9505153

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69827545T Expired - Fee Related DE69827545T2 (de) 1997-03-25 1998-03-10 Vorrichtung zur Erzeugung von Hintergrundrauschen

Country Status (6)

Country Link
US (1) US6108623A (de)
EP (1) EP0869476B1 (de)
JP (1) JPH10340097A (de)
CN (1) CN1132327C (de)
DE (1) DE69827545T2 (de)
FR (1) FR2761512A1 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240383B1 (en) * 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
US6621834B1 (en) * 1999-11-05 2003-09-16 Raindance Communications, Inc. System and method for voice transmission over network protocols
GB2356538A (en) 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
US7243065B2 (en) * 2003-04-08 2007-07-10 Freescale Semiconductor, Inc Low-complexity comfort noise generator
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US8589153B2 (en) 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
JPWO2014034697A1 (ja) * 2012-08-29 2016-08-08 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
CN104978970B (zh) 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
GB2532041B (en) 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
CN109841222B (zh) * 2017-11-29 2022-07-01 腾讯科技(深圳)有限公司 音频通信方法、通信设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63124636A (ja) * 1986-11-14 1988-05-28 Kokusai Denshin Denwa Co Ltd <Kdd> 音声伝送システムの疑似信号挿入方式
CA2021514C (en) * 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
US5327457A (en) * 1991-09-13 1994-07-05 Motorola, Inc. Operation indicative background noise in a digital receiver
US5828997A (en) * 1995-06-07 1998-10-27 Sensimetrics Corporation Content analyzer mixing inverse-direction-probability-weighted noise to input signal
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
US5864799A (en) * 1996-08-08 1999-01-26 Motorola Inc. Apparatus and method for generating noise in a digital receiver

Also Published As

Publication number Publication date
DE69827545D1 (de) 2004-12-23
JPH10340097A (ja) 1998-12-22
EP0869476A1 (de) 1998-10-07
EP0869476B1 (de) 2004-11-17
FR2761512A1 (fr) 1998-10-02
CN1132327C (zh) 2003-12-24
CN1194507A (zh) 1998-09-30
US6108623A (en) 2000-08-22

Similar Documents

Publication Publication Date Title
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE69226500T2 (de) Verfahren und Gerät zur Sprachsignalübertragung
DE19609170B4 (de) Verfahren zur Durchführung einer &#34;Tiefe-Zuerst&#34;-Suche in einem Codebuch zur Codierung eines Geräusch- bzw. Klangsignales, Vorrichtung zur Durchführung dieses Verfahrens sowie zellulares Kommunikationssystem mit einer derartigen Vorrichtung
DE69116476T2 (de) Digitaler Signalverschlüssler
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69624383T2 (de) Verfahren zum kodieren und dekodieren von audiosignalen
EP2047669B1 (de) Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE60012860T2 (de) Verfahren zur Verarbeitung mehrerer digitaler Audiodatenströme
DE69827545T2 (de) Vorrichtung zur Erzeugung von Hintergrundrauschen
DE69018989T2 (de) Polyphonische kodierung.
DE19742655C2 (de) Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
DE3736193C2 (de)
DE2740945A1 (de) Verfahren zum uebertragen von bildsignalen mit hilfe der differenz-puls- code-modulation (dpcm) und gesteuertem quantisierer
DE69738476T2 (de) Verfahren und Gerät für Anrufregistrierung in einem Speicher
DE2522491A1 (de) Echoloeschvorrichtung fuer eine fernsprechleitung
DE19715126A1 (de) Sprachsignal-Codiervorrichtung
DE69527470T2 (de) Mobilfunkübertragungssystem mit einem Ton- oder Sprachaktivitätsdetektor und Faltungskodierung
DE2826662A1 (de) Schaltungsanordnung fuer schnelle sprachwiedergabe ueber digitale delta -modulation
DE4494736C2 (de) Verfahren zur Spektralanalyse eines Eingangssignals sowie Spektral-Analysator zum Ausführen einer Spektralanalyse
EP0135229B1 (de) Verfahren und Schaltungsanordnung zur Herstellung von Konferenzverbindungen in einem Vermittlungssystem
WO2008011901A1 (de) Verfahren zum durchführen einer sprachkonferenz und sprachkonferenzsystem
DE69922582T2 (de) Sende- und Empfangsvorrichtung zur Auswahl eines Quellenkodierers und Verfahren dazu
DE69928682T2 (de) Audiocodierer, der Paketabschnitte wiederholt sendet
DE3650163T2 (de) Integrierte digitale Schaltung zur Verarbeitung von Sprachsignalen.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee