DE60220307T2

DE60220307T2 - Verfahren zur übertragung breitbandiger tonsignale über einen übertragungskanal mit verminderter bandbreite

Info

Publication number: DE60220307T2
Application number: DE60220307T
Authority: DE
Inventors: Rakesh Taori; Andreas J. Gerrits; Robert J. Sluijter
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-10-25
Filing date: 2002-10-10
Publication date: 2008-02-07
Anticipated expiration: 2022-10-11
Also published as: JP2005506584A; EP1446797A1; KR20040048978A; US20030088327A1; DE60220307D1; CN1575492A; EP1446797B1; WO2003036624A1; CN1288626C; BR0206194A; ATE363121T1

Description

Die Erfindung betrifft ein Verfahren zum Verarbeiten eines breitbandigen Audiosignals zu einem schmalbandigen Audiosignal, das im Wesentlichen dieselben Informationen wie das breitbandige Audiosignal umfasst, wobei ein erster Spektralanteil des breitbandigen Audiosignals im Wesentlichen unverändert im schmalbandigen Audiosignal beibehalten wird und Wiederherstellungsinformationen, die zum Wiederherstellen der übrigen Spektralanteile des breitbandigen Audiosignals verwendbar sind, in den ersten Spektralanteil als ein Wasserzeichen eingebettet sind, das die Wiederherstellungsinformationen als Nutzdaten transportiert. Durch ein derartiges Verarbeiten von breitbandigen Audiosignalen werden schmalbandige Audiosignale bereitgestellt, die zur Übertragung über schmalbandige Infrastruktur wie z.B. Telefonnetze geeignet sind.
Die Erfindung betrifft auch einen Codierer zum Codieren eines breitbandigen Audiosignals in ein schmalbandigen Audiosignal, das im Wesentlichen dieselben Informationen wie das breitbandige Audiosignal umfasst, mit: einem Filter zum Extrahieren eines ersten Spektralanteils aus dem breitbandigen Audiosignal; einer Informationsgenerierungsschaltung zum Extrahieren von Wiederherstellungsinformationen aus dem breitbandigen Audiosignal oder aus übrigen Spektralanteilen des breitbandigen Audiosignals, wobei die Informationen zum Wiederherstellen der übrigen Spektralanteile des breitbandigen Audiosignals verwendbar sind; einem Embedder zum Einbetten der Wiederherstellungsinformationen in dem ersten Spektralanteil in der Form eines Wasserzeichen, das die Wiederherstellungsinformationen als Nutzdaten transportiert, für die Erlangung des schmalbandigen Audiosignals.
Ferner betrifft die Erfindung einen Decodierer zum Decodieren eines schmalbandigen Audiosignals, das Wiederherstellungsinformationen enthält, die zum Verarbeiten des Signals zu einem entsprechenden breitbandigen Audiosignal verwendbar sind, mit: einem Extraktor zum Extrahieren der Wiederherstellungsinformationen, einer Wiederherstellungsschaltung zum Wiederherstellen eines oder mehrerer Audiosignal- Spektralanteile unter Verwendung der Wiederherstellungsinformationen und Mischen der Audiosignal-Spektralanteile mit dem schmalbandigen Audiosignal zur Erlangung des entsprechenden breitbandigen Audiosignals,
Ein derartiges Verfahren, ein derartiger Codierer und ein derartiger Decodierer sind aus der deutschen Patentanmeldung Nr. DE 34 18 297 bekannt.
Das breitbandige Audiosignal wird in ein unteres Frequenzband und ein oberes Frequenzband geteilt. Das obere Frequenzband wird in eine Anzahl Teilbänder geteilt, und der momentane Signalleistungswert wird für jedes der Teilbänder bestimmt. Informationen zur momentanen Signalleistungsverteilung über diese Teilbänder werden in der Form eines Multiplikationsfaktors bereitgestellt, der den Betrag des Größten der Leistungswerte sowie die relativen Signalleistungswerte des Restes der Teilbänder identifiziert. Diese Informationen werden in ein digitales Datenwort umgewandelt, das gemeinsam mit dem unteren Frequenzband über einen gewöhnlichen schmalbandigen Übertragungskanal übertragen wird, wobei die Informationen in das Signal des unteren Frequenzbandes in der Form eines Pilotsignals eingebettet sind, das auf oder unter einem niedrigsten wahrnehmbaren Schallpegel liegt.
Ein Nachteil dieses Verfahrens ist, dass das Pilotsignal, das die Informationen des oberen Frequenzbandes enthält, insofern nicht auf einer wirklich eindeutigen Basis eingerichtet ist, als das Pilotsignal nur auf Basis einer Signalleistungsverteilung bereitgestellt ist. Daher wird sehr wahrscheinlich das beschriebene Verfahren gelegentlich dasselbe Ausgangssignal für unterschiedliche Eingangssignale und somit falsche ergänzende Spektralkomponenten bereitstellen, was in derartigen Fällen zu einer Verschlechterung des schmalbandigen Signals statt einer Verbesserung führt.
Aus dem Konferenzschriftstück C. McElroy et al.: „Wideband Speech Coding in 7.2 kb/s", 1993 IEEE international Conference an Acoustics, Speech, and Signal Processing, 27.-30. April 1993 (ICASSP-93), Minneapolis, Minnesota (USA), ist ein Verfahren zum Codieren eines breitbandigen Sprachsignals in ein Signal mittlerer Bitrate bekannt.
Wieder wird das breitbandige Signal in ein unteres Frequenzband und ein oberes Frequenzband geteilt. Diese Bänder werden mithilfe ihrer jeweiligen Codierer in ihre jeweiligen Bitströme codiert; das untere Frequenzband wird mithilfe eines bekannten CELP-Codierers (Code Excited Linear Prediction) codiert, und das obere Frequenzband wird mithilfe eines linearen Prädiktors zweiter Ordnung und eines Gain-Shape-Vektorquantisierers sehr niedriger Bitrate codiert.
Die zwei Bitströme werden dann mithilfe einer speziellen Syntax gemischt; das Ergebnis ist ein Digitalsignal, das eine Bitrate von 7,2 kbit/s aufweist. Die Syntax muss am entfernten Ende zum Teilen des Bitstroms in einen Bitstrom des oberen Bandes und einen Bitstrom des unteren Bandes verwendet werden, bevor die Bitströme in ein Audiosignal des oberen Bandes bzw. des unteren Bandes decodiert und dann zum gewünschten breitbandigen Sprachsignal gemischt werden.
Ein Nachteil dieses Verfahrens ist, dass der resultierende Bitstrom nicht geeignet ist, um durch vorhandene schmalbandige Netze wie z.B. Telefonkabel oder – leitungen oder Telefonvermittlungen übertragen zu werden.
Aus dem Europäischen Patent Nr. 658.874 ist ein Verfahren und eine Schaltung zum Verbreitern der Bandbreite eines schmalbandigen Audiosignals bekannt.
In diesem Patent wird ein schmalbandiges Audiosignal mittels Kurzzeitspektralanalyse analysiert; das resultierende Spektrum wird mit gespeicherten Spektren verglichen; und das resultierende Spektrum wird mit Spektalkomponenten ergänzt, die nicht im resultierenden Spektrum enthalten sind.
Sowohl die resultierenden als auch die gespeicherten Spektren werden in einer linearen prädiktiven Art und Weise codiert (LPC; linear-prädiktive Codierung). Die gespeicherten Spektren sind breitbandig und werden direkt verwendet, um die Spektalkomponenten zu bestimmen, die als Ergänzungen zum schmalbandigen Signal zu verwenden sind. Die Amplitude der gespeicherten Spektren wird derart justiert, dass ein Maximum an Übereinstimmung zwischen den gespeicherten Spektren im schmalen Frequenzband und dem schmalbandigen Audiosignal erreicht wird.
Ein Nachteil des Verfahrens und der Schaltung ist es, dass die Spektalkomponenten, die aus den gespeicherten Spektren erlangt und dem schmalbandigen Signal hinzugefügt werden, insofern nicht auf einer wirklich eindeutigen Basis eingerichtet sind, als die hinzuzufügenden Spektalkomponenten nur aus dem Vergleichen des analysierten Spektrums mit einer endlichen Anzahl von Spektren bestimmt werden. Daher wird sehr wahrscheinlich das beschriebene Verfahren und die Schaltung gelegentlich unkorrekte ergänzende Spektalkomponenten bereitstellen, was zu einer Verschlechterung des schmalbandigen Signals statt einer Verbesserung führt.
Aus dem Tagungsschriftstück Michiel van der Veen et al.: „Robust, Multi-Functional and High-Quality Audio Watermarking Technology", Audio Engineering Society, 110. Tagung 12.-15. Mai 2001, Amsterdam (NL), sind Verfahren zum Einbetten eines Wasserzeichens, das Nutzdaten in ein Audiosignal transportiert, und zur Detektion des Vorhandenseins und Extrahieren der Nutzdaten solcher Wasserzeichen bekannt.
In dem Papier wird, basierend auf vorhandener Technologie, die bei Bild- und Video-Wasserzeichen verwendet wird, eine robuste und multifunktionale Audio-Wasserzeichen-Technik hoher Qualität präsentiert. Der Einbettungsalgorithmus arbeitet im Frequenzbereich, wobei die Beträge der Fourier-Koeffizienten geringfügig modifiziert werden. Die Wasserzeichendetektion stütz sich auf Kreuzkorrelationstechniken, bei denen nicht nur das Vorhandensein eines Wasserzeichens, sondern auch seine Nutzdaten detektiert werden.
Experimente zeigten, dass bei einem bestimmten Wasserzeichen, das in dem Papier beschrieben ist, objektive und subjektive Audioqualitätsmessungen ziemlich gut korrelieren. Kombinierte Analysen der wahrgenommenen Audioqualität und der Robustheit wiesen darauf hin, dass spezifische Wasserzeichenparameter für unterschiedliche Anwendungen optimiert werden können. Diese reichen vom Kopiemanagement (begrenzte Informationskapazität, hohe Robustheit und sehr hohe Audioqualität) bis zur Rundsendungsüberwachung (mittlere bis große Informationskapazität, mittlere Robustheit, mittlere bis hohe Audioqualität).
Es ist eine Aufgabe der Erfindung, Codierung hoher Qualität von breitbandigen Audiosignalen in schmalbandige Audiosignale und entsprechende Decodierung sowie diesbezügliche Anlagen wie z.B. Ausrüstungen zum Durchführen notwendiger Prozesse zu schaffen.
Hierzu ist das Verfahren gemäß der Erfindung dadurch gekennzeichnet, dass das Wasserzeichen in den ersten Spektralanteil eingebettet ist durch: Bereitstellen des ersten Spektralanteils und der übrigen Spektralanteile in digitaler Form; Organisieren des ersten Spektralanteils in Rahmen; Fourier-Transformieren des Rahmens; Modifizieren der Fourier-Koeffizienten in Abhängigkeit vom Wasserzeichen und inverses Fourier-Transformieren der modifizierten Fourier-Koeffizienten zur Erlangung eines Zeitbereichs-Rahmens mit Wasserzeichen.
Experimente mit Signalen gemäß Ausführungsformen der Erfindung haben gezeigt, dass die Informationen, die in einem breitbandigen Audiosignal außerhalb der Bandbreite eines entsprechenden schmalbandigen Audiosignals enthalten sind, in recht kleine Verzerrungen des schmalbandigen Audiosignals eingebettet werden können.
Experimente haben ferner gezeigt, dass zuverlässige Extraktion von Informationen, die in einem schmalbandigen Audiosignal als Verzerrungen eingebettet sind, durch Kreuzkorrelationsverfahren auf zuverlässige Weise möglich sind.
Vorzugsweise ist das codierte schmalbandige Audiosignal mit vorhandener schmalbandiger Ausrüstung und Infrastruktur kompatibel, sodass u.a. 1) das schmalbandige Audiosignal ohne Qualitätsverschlechterung oder Verlust breitbandiger Informationen durch vorhandene schmalbandige Infrastruktur übertragbar und mittels vorhandener schmalbandiger Ausrüstung aufzeichenbar und/oder speicherbar sein muss und 2) das schmalbandige Audiosignal in schmalbandiger Form ohne wesentliche Qualitätsverschlechterung der schmalbandigen Inhalte des Signals durch vorhandene schmalbandige Ausrüstung empfangbar und reproduzierbar sein muss.
Ein so verzerrtes schmalbandiges Audiosignal kann mit einer schmalbandigen Signalinfrastruktur wie z.B. Telefonverbindungen kompatibel gemacht werden, da Verzerrungen innerhalb der Bandbreite des schmalbandigen Audiosignals die Infrastruktur unbeeinflusst durchlaufen.
Wenn ein schmalbandiges Audiosignal auf einem Speichermedium gespeichert ist, belegt es einen kleineren Platz als ein entsprechendes breitbandiges Audiosignal und erscheint daher als eine komprimierte Version des breitbandigen Audiosignals, wobei Speicherplatz gespart wird.
Es ist ein Vorteil, dass ein derartiges gespeichertes komprimiertes Signal durch herkömmliche schmalbandige Ausrüstung leicht lesbar gemacht werden kann, womit Rückwärtskompatibilität sichergestellt ist, wenn z.B. neue Speichermedien für Audiosignale eingeführt werden.
Die Informationen sind in das schmalbandige Audiosignal als Wasserzeichen eingebettet, vorzugsweise in von der Wahrnehmung her unhörbarer Weise. Hierdurch können verfügbare Schaltungen und Verfahren zum Versehen von Audiosignalen mit Wasserzeichen genutzt werden, wenn das schmalbandige Audiosignal erzeugt wird.
Im Wesentlichen können die vollständigen Audioinformationsinhalte eines breitbandigen Audiosignals im schmalbandigen Audiosignal beinhaltet sein.
Experimente haben ferner gezeigt, dass erkennbare Verzerrungen, die nahezu unhörbar oder von der Wahrnehmung her unhörbar sind, dazu gebracht werden können, ausreichende Mengen an Informationen zu enthalten, um zuverlässige Rekonstruktion hoher Qualität der übrigen Spektralanteile des breitbandigen Audiosignals zu ermöglichen.
Es hat sich erwiesen, dass die Verwendung dieses Wasserzeicheneinbettungsschemas ein robustes Wasserzeichen bereitstellt, das zum Transportieren der gewünschten Nutzdaten fähig ist, die die Wiederherstellungsinformationen enthalten.
In einer bevorzugten Ausführungsform wird das schmalbandige Audiosignal nach Übertragen des schmalbandigen Audiosignals durch einen Übertragungskanal hindurch oder Speichern desselben auf einem Speichermedium wieder zu einem breitbandigen Audiosignal aufbereitet.
Auf diese Weise wird insofern gesteigerter Nutzen aus der Erfindung gezogen, als Audiosignale hoher Qualität leicht über vorhandene schmalbandige Infrastruktur übertragen werden können, ohne dass irgendwelche Zusätze an der Infrastruktur notwendig sind.
In einem Codierer zum Codieren eines breitbandigen Audiosignals in ein schmalbandiges Audiosignal, das im Wesentlichen dieselben Informationen wie das breitbandige Audiosignal umfasst, wird die Aufgabe der Erfindung insofern gelöst, als der Codierer des oben erwähnten Typs umfasst:

– einen Extrapolator zum Extrapolieren des ersten Spektralanteils in ein extrapoliertes Audiosignal, das Frequenzgrenzen aufweist, die im Wesentlichen jenen des breitbandigen Audiosignals entsprechen; und
– einen Komparator zum Vergleichen des extrapolierten Audiosignals mit dem breitbandigen Audiosignal und Bereitstellen der Wiederherstellungsinformationen in Abhängigkeit vom Vergleich.

Auf diese Weise wird der extrahierte erste Spektralanteil mittels einer ziemlich primitiven Form von Signalverarbeitung wieder zu einem breitbandigen Audiosignal aufbereitet. Somit entspricht das bereitgestellte extrapolierte (breitbandige) Audiosignal nicht dem gewünschte Qualitätsniveau, wird aber mithilfe eines maßvollen Betrags an Signalverarbeitungsleistung bereitgestellt.
Da dieses extrapolierte Audiosignal relativ zum ursprünglichen breitbandigen Audiosignal deterministisch ist, braucht es nicht zusammen mit dem schmalbandigen Audiosignal übertragen werden, und es braucht nur die Differenz zwischen dem breitbandigen Audiosignal und dem extrapolierten Audiosignal in den ersten Spektralanteil eingebettet zu werden. Auf diese Weise können die Verarbeitungsleistungs-Anforderungen an den Embedder vermindert werden.
In einem Decodierer zum Decodieren eines schmalbandigen Audiosignals, das Wiederherstellungsinformationen enthält, die zum Verarbeiten des Signals zu einem entsprechenden breitbandigen Audiosignal verwendbar sind, wird die Aufgabe der Erfindung durch den Decodierer des oben erwähnten Typs gelöst, der umfasst:

– einen Extrapolator zum Extrapolieren des schmalbandigen Audiosignals in ein extrapoliertes Audiosignal, das Frequenzgrenzen aufweist, die im Wesentlichen jenen des entsprechenden breitbandigen Audiosignals entsprechen; und
– einen Korrektor zum Modifizieren von Charakteristika des Extrapolators in Abhängigkeit von den Wiederherstellungsinformationen, wobei der Korrektor vorzugsweise in den Extrapolator integriert ist.

Auf diese Weise stellt die Extrapolation einen wesentlichen Teil der übrigen Spektralanteile des ursprünglichen breitbandigen Audiosignals mithilfe eines maßvollen Betrags an Signalverarbeitungsleistung bereit. Somit braucht nur die Differenz zwischen dem breitbandigen Audiosignal und dem extrapolierten Audiosignal aus den erkennbaren Verzerrungen wiederhergestellt zu werden, die in den ersten Spektralanteil eingebettet sind. Auf diese Weise können die Verarbeitungsleistungs-Anforderungen an den Extraktor vermindert werden.
In einem System zum Übertragen eines breitbandigen Audiosignals durch einen schmalbandigen Übertragungskanal hindurch wird die Aufgabe der Erfindung durch das System erfüllt, das einen Codierer gemäß der Erfindung am Sendeende zum Verarbeiten des breitbandigen Audiosignals zu einem schmalbandigen Audiosignal und einen Decodierer gemäß der Erfindung am Empfangsende zum Wiederaufbereiten des schmalbandigen Audiosignals zu einem breitbandigen Audiosignal umfasst.
Durch diese Maßnahmen ist ein vollständiges System zum Übertragenen breitbandiger Audiosignale ohne die Notwendigkeit geschaffen, den eigentlichen Übertragungskanal von schmalbandigem in breitbandigen Zustand nachzurüsten. Somit müssen neue Systeme nur an den Sende- und den Empfangsenden des gesamten Übertragungskanals installiert werden.
Gemäß Ausführungsformen der Erfindung können derartige neue Installationen vorzugsweise insofern nicht von Dauer sein, als sie zum Zwecke einer oder weniger Übertragungen installiert sein können, wie z.B. zur Übertragung von Rundfunkprogrammen in hoher Qualität über Telefonleitungen, oder sie können in Vorrichtungen wie z.B. Telefongeräte oder Mobiltelefone integriert sein, die mit dem öffentlichen Telefonnetz verbunden sind, wodurch Teilnehmern verbesserte Übertragungsqualität bereitgestellt wird, wenn sie mit entfernten Vorrichtungen verbunden sind, die dieselben Anlagen aufweisen.
Da ein schmalbandiges Audiosignal einen kleineren Speicherplatz als ein breitbandiges Audiosignal im Speichermedium belegt, wird die effektive Kapazität jedwedes Speichermediums zur Speicherung von Audiosignalen erheblich gesteigert.
Natürlich muss ein System gemäß einer Ausführungsform der Erfindung zur Speicherung und zum Abruf bereitgestellt sein, wenn ein derartiges Speichermedium verwendet wird, da aber ungeachtet der Kapazität des Speichermediums nur ein derartiges System bereitgestellt zu sein braucht, ist der wirtschaftliche Nutzen bei Speichermedien groß, die größere Kapazitäten aufweisen.
Es liegt innerhalb des Rahmens der Erfindung und der Ansprüche, für Speicherungszwecke andere Frequenzgrenzen für das schmalbandige Audiosignal bzw. den ersten Spektralanteil als für Übertragungszwecke zu verwenden.
Für Übertragungszwecke werden dem schmalbandigen Audiosignal vorzugsweise dieselben Frequenzgrenzen wie dem Übertragungskanal gegeben, womit die Menge an Informationen verringert wird, die in den ersten Spektralanteil einzubetten sind.
Für Speicherungszwecke sind jedoch Frequenzgrenzen des schmalbandigen Audiosignals der Erfindung, die bei einem gewünschten Niveau der Wiedergabequalität das größte Kompressionsverhältnis bei Verwendung des Speichersystems der Erfindung bereitstellen, nicht zwangsläufig dieselben wie die bevorzugten Frequenzgrenzen für Übertragungszwecke.
Unten wird die Erfindung detaillierter mittels Ausführungsbeispielen und unter Bezug auf die Zeichnungen erläutert, wobei
1 das Prinzip eines Codierers gemäß einer Ausführungsform der Erfindung darstellt;
2 das Prinzip eines Decodierers gemäß einer Ausführungsform der Erfindung darstellt;
3 ein Blockschaltbild einer bevorzugten Ausführungsform des Codierers in 1 zeigt und
4 ein Blockschaltbild einer bevorzugten Ausführugsform des Decodierers in 2 zeigt.
In 1 liegt an einem Eingangsanschluss ein breitbandiges Audiosignal 1 vor. Das Signal wird zu den Eingängen zweier Filter transportiert, eines Bandpasses 2 und einer Bandsperre 3. Der Bandpass 2 lässt einen ersten Spektralanteil des breitbandigen Audiosignals durch, und dieser Anteil bildet ein schmalbandiges Audiosignal 4. Die Frequenzgrenzen oder Grenzfrequenzen des Bandpasses 2 können z.B. 300 Hz bzw. 3,4 kHz sein. Das schmalbandige Audiosignal 4 weist Frequenzgrenzen auf, die den Frequenzgrenzen des Filters 2 entsprechen.
Vorzugsweise entsprechen die Frequenzgrenzen oder Grenzfrequenzen der Bandsperre 3 jenen des Bandpasses 2. Hierdurch lässt die Bandsperre 3 die übrigen Spektralanteile 5 des breitbandigen Audiosignals 1 durch, die nicht im schmalbandigen Audiosignal 4 enthalten sind.
Das breitbandige Audiosignal 1 kann z.B. ein vollbandiges Audiosignal sein, das von 20 oder 100 Hz bis 10 oder 20 kHz reicht. In jenem Fall würde die Bandsperre 3 dieselben Grenzfrequenzen wie der Bandpass 2 aufweisen, z.B. 300 Hz und 3,4 kHz. Die übrigen Spektralanteile 5 würden dann durch die Frequenzbänder von 20 oder 100 Hz bis 300 Hz und von 3,4 kHz bis 10 oder 20 kHz gebildet.
Das breitbandige Audiosignal 1 könnte ebenso ein mittelbandiges Sprachsignal sein, das Frequenzen von, nehmen wir einmal an, 300 Hz bis 8 kHz enthält; in jenem Fall sind die übrigen Spektralanteile 5 das Frequenzband von 3,4 kHz bis 8 kHz, und die Bandsperre 3 würde durch einen 3,4-kHz-Hochpass ersetzt.
Die übrigen Spektralanteile 5 werden durch einen Informationsgenerator oder eine Informationsgenerierungsschaltung 6 verarbeitet. Diese Schaltung 6 liefert Informationen 7 über die Inhalte der übrigen Spektralanteile 5 in einem geeigneten Format an einen Embedder 8. Gemäß der Erfindung sind die Informationen 7 als Grundlage zum Wiederherstellen der übrigen Spektralanteile 5 geeignet, bilden aber vorzugsweise eine kleinere Menge an Informationen als die übrigen Spektralanteile 5 selbst.
Der Embedder 8 bettet die Informationen 7 in den ersten Spektralanteil 4, ohne den Frequenzbereich des Anteils 4 zu vergrößern, und vorzugsweise in einer von der Wahrnehmung her unhörbaren Weise ein, und die Ausgabe vom Embedder 8 bildet somit ein schmalbandiges Audiosignal 9, das Frequenzgrenzen aufweist, die den Grenzfrequenzen des Bandpasses 2 entsprechen.
Für derartiges Einbetten existieren mehrere verwendbare Verfahren, wobei Versehen mit Wasserzeichen ein bevorzugtes Verfahren ist, wobei die Informationen 7 vorzugsweise als die „Nutzdaten" eines Wasserzeichens eingebettet werden.
Eine Aufgabe des Codierers in 1 ist es, dafür zu sorgen, dass die Informationen 7 in einer derartigen Weise in den ersten Spektralanteil eingebettet werden, dass die vollständigen Informationen 7 eindeutig aus dem Signal 9 wiederherstellbar sind und dass gleichzeitig sichergestellt ist, dass diese eingebetteten Informationen im schmalbandigen Audiosignal 9 nicht gehört werden können oder zumindest eine Person nicht wesentlich stören, die das schmalbandige Audiosignal 9 hört.
Da das schmalbandige Audiosignal 9 keine Frequenzen außerhalb der Frequenzgrenzen des Bandpasses 2 enthält, ist es leicht durch jedwede Infrastruktur verarbeitbar oder übertragbar, die ausgelegt ist, mit schmalbandigen Audiosignalen umzugehen. Im erwähnten Fall, in dem die Frequenzgrenzen des Bandpasses 2 und daher des schmalbandigen Audiosignals 9 300 Hz bzw. 3,4 kHz waren, kann das schmalbandige Audiosignal 9 über z.B. das öffentliche Telefonsystem ohne wesentliche spektrale Verschlechterung übertragen werden.
Uns jetzt 2 zuwendend, liegt an einem Eingangsanschluss ein codiertes schmalbandiges Audiosignal 20 wie z.B. das Signal 9 in 1 vor. Das schmalbandige Audiosignal 20 wird zu einem Extraktor 21 transportiert, wo eingebetteten Informationen 22 aus dem Signal extrahiert werden. Diese Informationen entsprechen z.B. den Informationen 7 in 1 und liegen vorzugsweise im Signal 20 als Wasserzeichen vor. Verfahren und Ausrüstung sind per se für derartige Extraktion eingebetteter Informationen bekannt.
Auf Basis dieser Informationen 22 werden übrige Spektralanteile 24 durch einen Wiederhersteller 23 wiederhergestellt. Diese Spektralanteile werden in einer Mischschaltung 26 mit dem schmalbandigen Audiosignal 20 gemischt, um ein breitbandiges Audiosignal 27 zu erlangen. Dieses Signal 27 entspricht z.B. dem breitbandigen Audiosignal 1 in 1.
Der Codierer nach 1 und der Decodierer nach 2 werden z.B. und vorzugsweise an einem Sendeende bzw. einem Empfangsende eines schmalbandigen Übertragungskanals wie z.B. einer Telefonleitung zur Wirkung gebracht.
Nun kann in dem Maße, in dem ein derartiger Übertragungskanal die Qualität eines übertragenen schmalbandigen Audiosignals aufrechterhält, und in dem Maße, in dem die Informationsgeneration (6) und die Einbettung (7) in 1, gefolgt vom Extrahieren (21) und der Wiederherstellung (23) in 2, die Qualität der übrigen Spektralanteile des breitbandigen Audiosignals 1 aufrechterhalten, dieses breitbandige Signal jetzt über einen schmalbandigen Übertragungskanal übertragen und wieder, wie beschrieben, ohne wesentlichen Verlust an Qualität, insbesondere Spektralqualität, wiederhergestellt werden.
Die Wahl von Modulation- und Demodulationsprinzipien, die in einem derartigen Übertragungskanal verwendet werden, beeinflusst die Übertragbarkeit der schmalbandigen Audiosignale der Erfindung nicht.
Derartige Modulation kann z.B. Verwendung des GSM-Mobiltelefonnetzes oder eines herkömmlichen analogen Telefonnetzes sein. In ersterem Fall kann der Modulator das GSM-Mobiltelefon am Sendeende sein, und der Demodulator kann das GSM-Mobiltelefon am Empfangsende sein. Entlang des Übertragungskanals können jetzt mehrere Modulationstypen verwendet werden.
Beispielsweise kann die Verbindung zwischen dem GSM-Netz, das das Mobiltelefon am Sendeende bedient, mit dem GSM-Netz, das das Mobiltelefon am Empfangsende bedient, über ein herkömmliches analoges Ferngesprächs-Telefonnetz verbunden sein, das herkömmliche Formen analoger Modulation verwendet.
Es ist offensichtlich, dass derartige Übertragung von breitbandigen Audiosignalen über vorhandene schmalbandige Infrastruktur große wirtschaftliche Vorteile bereitstellt. Das öffentliche Telefonsystem stellt ein nahezu universell verteiltes Übertragungssystem für standardisierte schmalbandige Audiosignale bereit. Die Verwendung dieses Systems für jedwede Übertragung breitbandiger Audiosignale erbringt spezialisierte Übertragungsdienste für breitbandige Audiosignale, die unter der überwiegenden Mehrzahl von Umständen verzichtbar sind, und spart daher Investitionen.
Es ist ein klarer Vorteil der Erfindung, dass das codierte schmalbandige Audiosignal 9, 20 direkt mit vorhandenen, herkömmlichen Verarbeitungsverfahren und Ausrüstungen für schmalbandige Audiosignale kompatibel ist. Wie erwähnt, sind die eingebetteten Informationen in den schmalbandigen Audiosignalen 9, 20 der Erfindung vorzugsweise unhörbar oder mindestens nahezu unhörbar oder von der Wahrnehmung her unhörbar.
Dies bedeutet, dass das schmalbandige Audiosignal 9 leicht über vorhandene schmalbandige Endgeräte wiedergebbar oder empfangbar ist, das heißt, jedwede von früher bekannte Endausrüstung, die mit einer vorhandenen schmalbandigen Infrastruktur gekoppelt ist. In derartigen Ausrüstungen werden schmalbandige Audiosignale der Erfindung erkannt und als herkömmliche Signale behandelt. Die eingebetteten Informationen sind für derartige Ausrüstungen von keinerlei Nutzen, werden allerdings aber auch keinerlei Störung auslösen; sollten sie hörbar sein, treten sie als Rauschen in Erscheinung.
Eine viel versprechende Nutzung des Codierers und des Decodierers der Erfindung, die oben beschrieben sind, wären Telefonvorrichtungen einschließlich Telefongeräten und Mobiltelefonen. Wenn Codierer und Decodierer der Erfindung in derartige Telefone eingebaut sind, sind breitbandige Sprachverbindungen leicht möglich, wenn derartige Ausrüstungen mit dem öffentlichen Telefonnetz gekoppelt sind.
Wenn zwischen einem derartigen Telefon und einem herkömmlichen Telefon eine Telefonverbindung aufgebaut ist, ist die Verbindung natürlich schmalbandig. Das herkömmliche Telefon gibt die eingebetteten Informationen möglicherweise als sehr leichtes Rauschen wieder, und das Telefon der Erfindung gibt einfach das schmalbandige Audiosignal vom herkömmlichen Telefon wieder, da keine Informationen 22 (2) vorliegen und somit keine übrigen Spektralanteile 24 in das schmalbandige Audiosignal gemischt werden, aber die Verbindung wird problemlos gelingen.
Wann immer zwei Telefone gemäß der Erfindung miteinander gekoppelt sind, hat dies jedoch eine breitbandige Telefonverbindung zur Folge, und infolgedessen wird von den Telefonteilnehmern eine viel höhere Signalqualität wahrgenommen. Eine derartige verbesserte Verbindungsqualität könnte sich als wichtiger Wettbewerbsparameter z.B. auf dem noch wachsenden Mobiltelefonmarkt erweisen.
Spezialisierte Endgeräteausüstungen wie z.B. zum Verbinden von Rundfunkstudios beim Übertragen von Sprecher- oder Korrespondenten-Kommentaren können ebenfalls von der Erfindung profitieren. Heute werden derartige Verbindungen am häufigsten über das öffentliche Telefonnetz hergestellt, was recht schlechte Übertragungsqualität zur Folge hat. Die Nutzung der Erfindung in derartigen Ausrüstungen stellt stark verbesserte Rundfunk-Audoqualität bereit.
Eine bevorzugte Ausführungsform eines Codierers der Erfindung ist in 3 gezeigt. Ein analoges breitbandiges Audiosignal 40 wird in einem A/D-Wandler 41 in ein digitales breitbandiges Audiosignal umgewandelt und darauf folgend in zwei digitalen Filtern 42, 43 gefiltert. Der digitale Filter 43 ist ein Bandpass, der einen ersten Spektralanteil 51 bereitstellt, der ein schmalbandiges Audiosignal bildet, und der digitale Filter 42 kann eine Bandsperre oder ein Hochpass sein, die bzw. der (einen) übrige(n) Spektralanteil(e) 52 des breitbandigen Audiosignal 40 bereitstellt.
Der erste Spektralanteil 51 und die übrigen Spektralanteile 52 werden zu einem Informationsgenerator 55 transportiert. Hier wird der erste Spektralanteil 51 in einem Extrapolator 53 extrapoliert, um ein Pseudosignal 57 zu bilden. Das Pseudosignal 57 kann in einem Komparator 54, der an seinem Ausgang ein Differenzsignal 56 bereitstellt, mit den übrigen Spektralanteilen 52 verglichen werden.
In einer ersten Version der Ausführungsform in 3 umfasst das durch den Extrapolator 53 gelieferte Pseudosignal 57 Frequenzen, die jenen Frequenzen des breitbandigen Audiosignals 40 entsprechen, die nicht im ersten Spektralanteil 51 enthalten sind. Das heißt, das Spektrum des Pseudosignals entspricht jenem der übrigen Spektralanteile 52.
Der Extrapolator ist als vergleichsweise einfache Schaltung zu verstehen. Derartige Schaltungen sind von früher bekannt und wären zur Verbesserung eines schmalbandigen Audiosignals vorgesehen, um ein breitbandiges Audiosignal höherer Qualität zu erlangen, jedoch üblicherweise mit eher mangelhaften Ergebnissen.
Das Pseudosignal 57 wird im Komparator 54 mit den übrigen Spektralanteilen 52 verglichen, und das erwähnte Differenzsignal wird erzeugt.
Es ist die Aufgabe dieser Anordnung, die Menge an Informationen zu verringern, die in den ersten Spektralanteil einzubetten ist. Selbst wenn das Pseudosignal 57. eine mangelhafte Imitation der übrigen Spektralanteile 52 sein kann, kann es sehr wohl so gut sein, dass die Menge an Informationen im Differenzsignal 56 wesentlich kleiner als in den übrigen Spektralanteilen 52 ist.
In einer zweiten Version der Ausführungsform in 3 enthält das durch den Extrapolator 53 gelieferte Pseudosignal 57 das ganze Frequenzspektrum des breitbandigen Audiosignals 40.
In diesem Fall ist das Pseudosignal 57 mit dem eigentlichen breitbandigen Audiosignal 40 zu vergleichen, und daher entfällt der digitale Filter 42. In dieser zweiten Version ist das Differenzsignal 56 nicht zwangsläufig dasselbe wie in der ersten Version, repräsentiert aber nichtsdestotrotz im Allgemeinen die Differenz zwischen den übrigen Spektralanteilen 52 und entsprechenden Spektralanteilen des Pseudosignals 57.
Der erste Spektralanteil 51 wird ebenfalls zu einer Unterteilschaltung oder einem Framer 44 transportiert, der den ersten Spektralanteil in Rahmen segmentiert. Diese Rahmen 46 werden zu einem Embedder 45 weitertransportiert.
Im Embedder 45 wird jeder Rahmen zuerst in einer Schaltung für schnelle Fourier-Transformation 47 aus dem Zeitbereich in den Frequenzbereich transformiert. Die Fourier-Koeffizienten werden zu einem Modifizierer 48 transportiert, wo sie in Abhängigkeit vom Differenzsignal 56 modifiziert werden, womit die Informationen im Differenzsignal 56 in den ersten Spektralanteil im Frequenzbereich eingebettet werden.
Die modifizierten Fourier-Koefflzienten werden zu einer Schaltung für inverse Fourier-Transformation 49 transportiert, wo der modifizierte erste Spektralanteil aus dem Frequenzbereich zurück in den Zeitbereich transformiert wird.
Das resultierende Zeitbereichssignal 50 ist den ersten Spektralanteil 51 abgesehen von den Tatsachen ähnlich, dass es in Rahmen segmentiert ist und dass das Differenzsignal 56 darin eingebettet ist.
Der Schritt des Segmentierens des ersten Spektralanteils in Rahmen ist vor allem zum Zwecke des verwendeten Einbettprinzips in diese Ausführungsform des Decodierers der Erfindung integriert. Jedoch kann Segmentieren des digitalen Audiosignals ebenfalls anderen Zwecken dienen.
In einer dritten Version der Ausführungsform in 3 wird auf den Informationsgenerator verzichtet, und statt des Differenzsignals 56 werden die übrigen Spektralanteile 52 direkt zum Embedder transportiert. Dadurch wird der Codierer einfacher, aber gleichzeitig die Menge an einzubettenden Informationen erheblich vergrößert.
Im Modifizierer 48 werden das Differenzsignal 56 bzw. die übrigen Spektralanteile 52 vorzugsweise in Modifikationen der Fourier-Koeffizienten durch Addieren von Elementen aus einer bekannten Folge von Binärwörtern (einem spezifischen „Wasserzeichen") zu den Absolutwerten der Fourier-Koeffizienten dargestellt. Die Folge umfasst vorzugsweise eine Anzahl von Binärwörtern, die der Anzahl von Signalabtastwerten in jedem Rahmen 46 entspricht.
Die Folge dieser Elemente für jeden Rahmen 46 kann vorzugsweise in Abhängigkeit vom Wert des Differenzsignals 56 bzw. der übrigen Spektralanteile 52 zyklisch verschoben sein, wobei der Wert hierdurch tatsächlich durch den Betrag der Verschiebung der Folge von Wasserzeichen-Elementen dargestellt ist.
Experimente haben gezeigt, dass das Differenzsignal, das in den ersten Spektralanteil eingebettet ist, um das schmalbandige Audiosignal gemäß der Erfindung zu erzielen, das schmalbandige Audiosignal 50 nicht in nennenswertem Umfang verschlechtert, wenn das Signal durch ein Stück herkömmlicher schmalbandiger Ausrüstung wiedergegeben wird.
Eine bevorzugte Ausführungsform eines Decodierers der Erfindung ist in 4 gezeigt. Ein digitales, als Rahmen vorliegendes schmalbandiges Audiosignal 70 gemäß der Erfindung wird an einem Eingangsanschluss empfangen und wird zu einem Extraktor 71 transportiert, wo jedwede eingebetteten Informationen gemäß der Erfindung aus dem schmalbandigen Audiosignal 70 extrahiert werden.
Im Extraktor 71 wird das als Rahmen vorliegende schmalbandige Audiosignal 70 diskreter Fourier-Transformation unterzogen, und die Fourier-Koeffizienten werden zu einer Kreuzkorrelationsschaltung 73 transportiert.
In einer bevorzugten Ausführungsform dieser Schaltung, die der bevorzugten Ausführungsform des Embedders 45 in 3 entspricht, ist die Korrelation zwischen den Fourier-Koeffizienten und dem bekannten Wasserzeichen (dieselbe Folge von Binärwörtern wie in 3) für jeden möglichen Wert der zyklischen Verschiebung des Wasserzeichenwortes eingerichtet, der im Embedder 45 verwendet wird.
Diese Korrelation übernimmt einen signifikanten Wert, wenn die zyklische Verschiebung dieselbe wie die Verschiebung ist, die beim Einbetten verwendet wird, und auf diese Weise kann der eingebettete Wert (die „Nutzdaten") identifiziert und somit extrahiert werden. Diese Extraktion ist durch den Kasten 75 symbolisiert, der in 4 eine Nutzdatenextraktionsschaltung darstellt. Die extrahierten Nutzdaten, die dem Differenzsignal 56 bzw. den übrigen Spektralanteilen 52 entsprechen, erscheinen nun am Anschluss 76 in 4, von wo sie zusammen mit dem schmalbandigen Audiosignal 70 zu einem Wiederhersteller 79 transportiert werden.
Im Wiederhersteller wird das empfangene schmalbandige Audiosignal 70 zum Extrapolator 80 transportiert, der ein extrapoliertes Pseudosignal 74 liefert. Dieses Pseudosignal 74 wird zum Korrektor 81 geliefert, wo es in Abhängigkeit von den extrahierten Nutzdaten 76 ergänzt wird. Wesentlich ist, dass das Pseudosignal 74 dem Pseudosignal 57 in 3 entspricht.
In einer ersten Version der Ausführungsform in 4 umfasst das durch den Extrapolator 80 gelieferte Pseudosignal 74 Frequenzen, die jenen Frequenzen des breitbandigen Audiosignals 40 entsprechen, die nicht im ersten Spektralanteil 51 enthalten sind, in einer Weise, die der ersten Version des Codierers nach 3 entspricht.
In dieser Version bilden die Nutzdaten 76 ein Differenzsignal, das zum Pseudosignal 74 addiert wird, und das Summensignal 82 entspricht den übrigen Spektralanteilen 52. Diese werden nun in einer Mischschaltung 83 mit dem empfangenen schmalbandigen Audiosignal 70 gemischt, und das Ausgangssignal 84 aus der Mischschaltung 83 bildet das wiederhergestellte breitbandige Audiosignal.
In einer zweiten Version der Ausführungsform in 4, die zusammen mit der zweiten Version des Codierers nach 3 zu verwenden ist, enthält das durch den Extrapolator 80 gelieferte Pseudosignal 74 das ganze Frequenzspektrum des ursprünglichen breitbandigen Audiosignals 40.
In jenem Fall repräsentieren die Nutzdaten 76 nichtsdestotrotz im Allgemeinen die Differenz zwischen den übrigen Spektralanteilen 52 und entsprechenden Spektralanteilen des Pseudosignals 74. Addieren dieser Differenz zum Pseudosignal 74 erzielt wiederum ein Summensignal 82, das den übrigen Spektralanteilen 52 entspricht und mit dem empfangenen schmalbandigen Audiosignal 70 gemischt wird, um ein wiederhergestelltes breitbandiges Audiosignal 84 zu erlangen.
In einer dritten Version des Decodierers in 4, die der dritten Version des Codierers in 3 entspricht, entsprechen die Nutzdaten den gesamten übrigen Spektralanteilen 52 und werden direkt zur Mischschaltung 83 transportiert. In diesem Fall entfällt der Wiederhersteller 79.
Die drei Versionen des Codierers nach 3 und die entsprechenden Versionen des Decodierers nach 4 bilden nun drei Ausführungsformen von Codierer-Decodierer-Paaren gemäß der Erfindung zum Übertragen eines breitbandigen Audiosignals entlang einer schmalbandigen Infrastruktur. Das breitbandige Audiosignal wird am Sendeende codiert und am Empfangsende decodiert.
Die schmalbandige Infrastruktur braucht kein Übertragungskanal zu sein, sondern kann jedoch jedwede schmalbandige Struktur wie z.B. ein Speichersystem sein. In jenem Fall kann ein breitbandiges Audiosignal in der Form eines schmalbandigen Audiosignals gemäß der Erfindung gespeichert und beim Abruf aus dem Speicher in breitbandige Form decodiert werden, wie unter Bezug auf 2 und 4 beschrieben. Hierdurch wird eine wirksame Kompression des breitbandigen Audiosignals erlangt. Die Vorzüge, die aus einem derartigen System erlangt werden, sind im ersten Teil der vorliegenden Spezifikation diskutiert worden.
Es liegt innerhalb der Erfindung, Frequenzgrenzen für den ersten Spektralanteil zu entwerfen, die ein höheres Maß an Kompression für irgendein gewünschtes Wiedergabequalitätsniveau bereitstellen.
In ähnlicher Weise kann das schmalbandige Audiosignal der Erfindung irgendeiner anderen Form von Verarbeitung oder Struktur schmalbandiger Audiosignale unterliegen, die entsprechende Vorzüge bereitstellt.
Auch wenn oben auf spezielle Weisen des Einbettens von Wiederherstellungsinformationen in den ersten Spektralanteil einschließlich der Verwendung von Einbettungsverfahren Bezug genommen wird, die vom Versehen mit Wasserzeichen von Signalen bekannt sind, liegt es innerhalb des Rahmens der Erfindung, jedwedes Verfahren für das Einbetten der Wiederherstellungsinformationen in den ersten Spektralanteil und für nachfolgende Extraktion der Informationen zu verwenden.
Auch wenn oben auf breitbandige Audiosignale im Allgemeinen Bezug genommen wird, wird es als besonders vorteilhaft angesehen, die Erfindung auf breitbandige Sprachsignale anzuwenden.
Sprache bildet ein Audiosignal, bei dem die unverzichtbaren Teile des Signals, die zum Verständnis der gesprochenen Mitteilung notwendig sind, in einem wohldefinierten Spektralanteil des Signals enthalten sind, d.h. dem Frequenzband von 300-3.400 Hz. Dieses Band kann bei Verwendung der Erfindung ohne irgendwelche Änderungen übertragen bzw. gespeichert werden, wohingegen die übrigen Spektralanteile nicht notwendigerweise mit derselben Wiedergabetreue wie das Frequenzband von 300-3.400 Hz wiedergegeben werden müssen.
Somit kann das Wiedergeben der übrigen Spektralanteile nach niedrigerem Standard erfolgen, wenn Sprachsignale wiedergegeben werden, als nehmen wir mal an, bei Musik. Auf diese Weise kann die Erfindung benutzt werden, um eine niedrigere, aber noch akzeptable zu benutzende Wiedergabequalität somit Einsparungen an Verarbeitungsleistung auszuwählen.
Es ist anzumerken, dass die oben erwähnten Ausführungsformen die Erfindung veranschaulichen statt sie zu begrenzen und dass der Fachmann in der Lage ist, zahlreiche alternative Ausführungsformen zu entwickeln, ohne den Rahmen der angehängten Ansprüche zu verlassen. In den Ansprüchen sind jedwede Bezugszeichen, die in Klammern gesetzt sind, nicht als die Ansprüche begrenzend aufzufassen. Das Wort „umfassen" (Englisch: „comprising") schließt das Vorhandensein von anderen als den in einem Anspruch aufgeführten Elementen oder Schritten nicht aus. Die Erfindung kann mittels Hardware, die mehrere verschiedene Elemente umfasst, und mittels eines in geeigneter Weise programmierten Computers implementiert werden. In einem Geräteanspruch, der mehrere Mittel aufzählt, können mehrere dieser Einrichtung durch ein und dasselbe Hardware-Element verkörpert sein. Die bloße Tatsache, dass gewisse Maßnahmen in voneinander verschiedenen abhängigen Ansprüchen dargelegt sind, besagt nicht, dass keine Kombination dieser Maßnahmen vorteilhaft verwendet werden kann.
Legende der Zeichnungen

3

41: A/D
47: FFT
49: IFT

4

72: DFT

Claims

Verfahren zum Verarbeiten eines breitbandigen Audiosignals (1; 40) zu einem schmalbandigen Audiosignal (9; 50), das im Wesentlichen dieselben Informationen wie das breitbandige Audiosignal umfasst, wobei ein erster Spektralanteil (4; 51) des breitbandigen Audiosignals im Wesentlichen unverändert im schmalbandigen Audiosignal beibehalten wird und Wiederherstellungsinformationen (7; 56), die zum Wiederherstellen der übrigen Spektralanteile (5; 52) des breitbandigen Audiosignals verwendbar sind, in den ersten Spektralanteil als ein Wasserzeichen eingebettet sind, das die Wiederherstellungsinformationen als Nutzdaten transportiert, dadurch gekennzeichnet, dass das Wasserzeichen in den ersten Spektralanteil eingebettet ist durch: – Bereitstellendes ersten Spektralanteils (51) und der übrigen Spektralanteile (52) in digitaler Form; – Organisieren des ersten Spektralanteils (51) in Rahmen (46); Fourier-Transformieren (47) des Rahmens; – Modifizieren (48) der Fourier-Koeffizienten in Abhängigkeit vom Wasserzeichen und – inverses Fourier-Transformieren (49) der modifizierten Fourier-Koeffizienten zur Erlangung eines Zeitbereichs-Rahmens mit Wasserzeichen.
Verfahren nach Anspruch 1, wobei das schmalbandige Audiosignal nach Übertragen des schmalbandigen Audiosignals durch einen Übertragungskanal hindurch oder Speichern desselben auf einem Speichermedium zu einem breitbandigen Audiosignal wiederaufbereitet wird.
Codierer zum Codieren eines breitbandigen Audiosignals (1; 40) in ein schmalbandiges Audiosignal (9; 50), das im Wesentlichen dieselben Informationen wie das breitbandige Audiosignal umfasst, mit: – einem Filter (2; 43) zum Extrahieren eines ersten Spektralanteils (4; 51) aus dem breitbandigen Audiosignal; – einer Informationsgenerierungsschaltung (6; 55) zum Extrahieren von Wiederherstellungsinformationen (7; 56) aus dem breitbandigen Audiosignal oder aus übrigen Spektralanteilen (5; 52) des breitbandigen Audiosignals, wobei die Informationen zum Wiederherstellen der übrigen Spektralanteile des breitbandigen Audiosignals verwendbar sind; – einem Embedder (8; 45) zum Einbetten der Wiederherstellungsinformationen in dem ersten Spektralanteil in der Form eines Wasserzeichen, das die Wiederherstellungsinformationen als Nutzdaten transportiert, für die Erlangung des schmalbandigen Audiosignals, dadurch gekennzeichnet, dass die Informationsgenerierungsschaltung (55) umfasst: – einen Extrapolator (53) zum Extrapolieren des ersten Spektralanteils (51) in ein extrapoliertes Audiosignal (57), das Frequenzgrenzen aufweist, die im Wesentlichen jenen des breitbandigen Audiosignals entsprechen; und – einen Komparator (54) zum Vergleichen des extrapolierten Audiosignals mit dem breitbandigen Audiosignal (40) oder den übrigen Spektralanteilen (52) und Bereitstellen der Wiederherstellungsinformationen (56) in Abhängigkeit vom Vergleich.
Decodierer zum Decodieren eines schmalbandigen Audiosignals (20; 70), das Wiederherstellungsinformationen enthält, die zum Verarbeiten des Signals zu einem entsprechenden breitbandigen Audiosignal (27; 84) verwendbar sind, mit: – einem Extraktor (21; 71) zum Extrahieren der Wiederherstellungsinformationen (22; 76), – einer Wiederherstellungsschaltung (23; 79) zum Wiederherstellen eines oder mehrerer Audiosignal-Spektralanteile (24; 82) unter Verwendung der Wiederherstellungsinformationen und Mischen (26; 83) der Audiosignal-Spektralanteile mit dem schmalbandigen Audiosignal zur Erlangung des entsprechenden breitbandigen Audiosignals, dadurch gekennzeichnet, dass die Wiederherstellungsschaltung (79) umfasst: – einen Extrapolator (80) zum Extrapolieren des schmalbandigen Audiosignals in ein extrapoliertes Audiosignal (74), das Frequenzgrenzen aufweist, die im Wesentlichen jenen des entsprechenden breitbandigen Audiosignals entsprechen; und – einen Korrektor (81) zum Modifizieren von Charakteristika des extrapolierten Audiosignals in Abhängigkeit von den Wiederherstellungsinformationen.
System zum Übertragen eines breitbandigen Audiosignals durch einen schmalbandigen Übertragungskanal hindurch, gekennzeichnet durch Umfassen eines Codierers nach Anspruch 3 am Sendeende zum Verarbeiten des breitbandigen Audiosignals zu einem schmalbandigen Audiosignal und eines Decodierers nach Anspruch 4 am Empfangsende zum Wiederaufbereiten des schmalbandigen Audiosignals zu einem breitbandigen Audiosignal.
System zum Speichern eines breitbandigen Audiosignals auf einem Speichermedium und Abrufen des breitbandigen Audiosignals aus dem Speicher, gekennzeichnet durch Umfassen eines Codierers nach Anspruch 3 zum Verarbeiten des breitbandigen Audiosignals zu einem schmalbandigen Audiosignal vor der Speicherung und eines Decodierers nach Anspruch 4 zum Wiederaufbereiten des gespeicherten schmalbandigen Audiosignals zu einem breitbandigen Audiosignal nach dem Abruf aus dem Speicher.
Reproduktionsgerät mit einem Decodierer nach Anspruch 4.
Sender mit einem Codierer nach Anspruch 3.