-
Die
Erfindung betrifft ein Verfahren zum Verarbeiten eines breitbandigen
Audiosignals zu einem schmalbandigen Audiosignal, das im Wesentlichen dieselben
Informationen wie das breitbandige Audiosignal umfasst, wobei ein
erster Spektralanteil des breitbandigen Audiosignals im Wesentlichen
unverändert
im schmalbandigen Audiosignal beibehalten wird und Wiederherstellungsinformationen,
die zum Wiederherstellen der übrigen
Spektralanteile des breitbandigen Audiosignals verwendbar sind,
in den ersten Spektralanteil als ein Wasserzeichen eingebettet sind,
das die Wiederherstellungsinformationen als Nutzdaten transportiert.
Durch ein derartiges Verarbeiten von breitbandigen Audiosignalen
werden schmalbandige Audiosignale bereitgestellt, die zur Übertragung über schmalbandige
Infrastruktur wie z.B. Telefonnetze geeignet sind.
-
Die
Erfindung betrifft auch einen Codierer zum Codieren eines breitbandigen
Audiosignals in ein schmalbandigen Audiosignal, das im Wesentlichen
dieselben Informationen wie das breitbandige Audiosignal umfasst,
mit: einem Filter zum Extrahieren eines ersten Spektralanteils aus
dem breitbandigen Audiosignal; einer Informationsgenerierungsschaltung
zum Extrahieren von Wiederherstellungsinformationen aus dem breitbandigen
Audiosignal oder aus übrigen
Spektralanteilen des breitbandigen Audiosignals, wobei die Informationen
zum Wiederherstellen der übrigen
Spektralanteile des breitbandigen Audiosignals verwendbar sind;
einem Embedder zum Einbetten der Wiederherstellungsinformationen in
dem ersten Spektralanteil in der Form eines Wasserzeichen, das die
Wiederherstellungsinformationen als Nutzdaten transportiert, für die Erlangung
des schmalbandigen Audiosignals.
-
Ferner
betrifft die Erfindung einen Decodierer zum Decodieren eines schmalbandigen
Audiosignals, das Wiederherstellungsinformationen enthält, die
zum Verarbeiten des Signals zu einem entsprechenden breitbandigen
Audiosignal verwendbar sind, mit: einem Extraktor zum Extrahieren
der Wiederherstellungsinformationen, einer Wiederherstellungsschaltung
zum Wiederherstellen eines oder mehrerer Audiosignal- Spektralanteile unter
Verwendung der Wiederherstellungsinformationen und Mischen der Audiosignal-Spektralanteile
mit dem schmalbandigen Audiosignal zur Erlangung des entsprechenden breitbandigen
Audiosignals,
-
Ein
derartiges Verfahren, ein derartiger Codierer und ein derartiger
Decodierer sind aus der deutschen Patentanmeldung Nr.
DE 34 18 297 bekannt.
-
Das
breitbandige Audiosignal wird in ein unteres Frequenzband und ein
oberes Frequenzband geteilt. Das obere Frequenzband wird in eine
Anzahl Teilbänder
geteilt, und der momentane Signalleistungswert wird für jedes
der Teilbänder
bestimmt. Informationen zur momentanen Signalleistungsverteilung über diese
Teilbänder
werden in der Form eines Multiplikationsfaktors bereitgestellt,
der den Betrag des Größten der
Leistungswerte sowie die relativen Signalleistungswerte des Restes
der Teilbänder
identifiziert. Diese Informationen werden in ein digitales Datenwort
umgewandelt, das gemeinsam mit dem unteren Frequenzband über einen
gewöhnlichen schmalbandigen Übertragungskanal übertragen wird,
wobei die Informationen in das Signal des unteren Frequenzbandes
in der Form eines Pilotsignals eingebettet sind, das auf oder unter
einem niedrigsten wahrnehmbaren Schallpegel liegt.
-
Ein
Nachteil dieses Verfahrens ist, dass das Pilotsignal, das die Informationen
des oberen Frequenzbandes enthält,
insofern nicht auf einer wirklich eindeutigen Basis eingerichtet
ist, als das Pilotsignal nur auf Basis einer Signalleistungsverteilung
bereitgestellt ist. Daher wird sehr wahrscheinlich das beschriebene
Verfahren gelegentlich dasselbe Ausgangssignal für unterschiedliche Eingangssignale und
somit falsche ergänzende
Spektralkomponenten bereitstellen, was in derartigen Fällen zu
einer Verschlechterung des schmalbandigen Signals statt einer Verbesserung
führt.
-
Aus
dem Konferenzschriftstück
C. McElroy et al.: „Wideband
Speech Coding in 7.2 kb/s",
1993 IEEE international Conference an Acoustics, Speech, and Signal
Processing, 27.-30. April 1993 (ICASSP-93), Minneapolis, Minnesota
(USA), ist ein Verfahren zum Codieren eines breitbandigen Sprachsignals
in ein Signal mittlerer Bitrate bekannt.
-
Wieder
wird das breitbandige Signal in ein unteres Frequenzband und ein
oberes Frequenzband geteilt. Diese Bänder werden mithilfe ihrer
jeweiligen Codierer in ihre jeweiligen Bitströme codiert; das untere Frequenzband
wird mithilfe eines bekannten CELP-Codierers (Code Excited Linear
Prediction) codiert, und das obere Frequenzband wird mithilfe eines
linearen Prädiktors
zweiter Ordnung und eines Gain-Shape-Vektorquantisierers sehr niedriger Bitrate
codiert.
-
Die
zwei Bitströme
werden dann mithilfe einer speziellen Syntax gemischt; das Ergebnis
ist ein Digitalsignal, das eine Bitrate von 7,2 kbit/s aufweist. Die
Syntax muss am entfernten Ende zum Teilen des Bitstroms in einen
Bitstrom des oberen Bandes und einen Bitstrom des unteren Bandes
verwendet werden, bevor die Bitströme in ein Audiosignal des oberen
Bandes bzw. des unteren Bandes decodiert und dann zum gewünschten
breitbandigen Sprachsignal gemischt werden.
-
Ein
Nachteil dieses Verfahrens ist, dass der resultierende Bitstrom
nicht geeignet ist, um durch vorhandene schmalbandige Netze wie
z.B. Telefonkabel oder – leitungen
oder Telefonvermittlungen übertragen
zu werden.
-
Aus
dem
Europäischen Patent Nr. 658.874 ist
ein Verfahren und eine Schaltung zum Verbreitern der Bandbreite
eines schmalbandigen Audiosignals bekannt.
-
In
diesem Patent wird ein schmalbandiges Audiosignal mittels Kurzzeitspektralanalyse
analysiert; das resultierende Spektrum wird mit gespeicherten Spektren
verglichen; und das resultierende Spektrum wird mit Spektalkomponenten
ergänzt,
die nicht im resultierenden Spektrum enthalten sind.
-
Sowohl
die resultierenden als auch die gespeicherten Spektren werden in
einer linearen prädiktiven
Art und Weise codiert (LPC; linear-prädiktive Codierung). Die gespeicherten
Spektren sind breitbandig und werden direkt verwendet, um die Spektalkomponenten
zu bestimmen, die als Ergänzungen zum
schmalbandigen Signal zu verwenden sind. Die Amplitude der gespeicherten
Spektren wird derart justiert, dass ein Maximum an Übereinstimmung
zwischen den gespeicherten Spektren im schmalen Frequenzband und
dem schmalbandigen Audiosignal erreicht wird.
-
Ein
Nachteil des Verfahrens und der Schaltung ist es, dass die Spektalkomponenten,
die aus den gespeicherten Spektren erlangt und dem schmalbandigen
Signal hinzugefügt
werden, insofern nicht auf einer wirklich eindeutigen Basis eingerichtet sind,
als die hinzuzufügenden
Spektalkomponenten nur aus dem Vergleichen des analysierten Spektrums
mit einer endlichen Anzahl von Spektren bestimmt werden. Daher wird
sehr wahrscheinlich das beschriebene Verfahren und die Schaltung
gelegentlich unkorrekte ergänzende
Spektalkomponenten bereitstellen, was zu einer Verschlechterung
des schmalbandigen Signals statt einer Verbesserung führt.
-
Aus
dem Tagungsschriftstück
Michiel van der Veen et al.: „Robust,
Multi-Functional
and High-Quality Audio Watermarking Technology", Audio Engineering Society, 110. Tagung
12.-15. Mai 2001, Amsterdam (NL), sind Verfahren zum Einbetten eines
Wasserzeichens, das Nutzdaten in ein Audiosignal transportiert,
und zur Detektion des Vorhandenseins und Extrahieren der Nutzdaten
solcher Wasserzeichen bekannt.
-
In
dem Papier wird, basierend auf vorhandener Technologie, die bei
Bild- und Video-Wasserzeichen
verwendet wird, eine robuste und multifunktionale Audio-Wasserzeichen-Technik
hoher Qualität präsentiert.
Der Einbettungsalgorithmus arbeitet im Frequenzbereich, wobei die
Beträge
der Fourier-Koeffizienten geringfügig modifiziert werden. Die
Wasserzeichendetektion stütz
sich auf Kreuzkorrelationstechniken, bei denen nicht nur das Vorhandensein
eines Wasserzeichens, sondern auch seine Nutzdaten detektiert werden.
-
Experimente
zeigten, dass bei einem bestimmten Wasserzeichen, das in dem Papier
beschrieben ist, objektive und subjektive Audioqualitätsmessungen
ziemlich gut korrelieren. Kombinierte Analysen der wahrgenommenen
Audioqualität
und der Robustheit wiesen darauf hin, dass spezifische Wasserzeichenparameter
für unterschiedliche
Anwendungen optimiert werden können.
Diese reichen vom Kopiemanagement (begrenzte Informationskapazität, hohe
Robustheit und sehr hohe Audioqualität) bis zur Rundsendungsüberwachung
(mittlere bis große
Informationskapazität,
mittlere Robustheit, mittlere bis hohe Audioqualität).
-
Es
ist eine Aufgabe der Erfindung, Codierung hoher Qualität von breitbandigen
Audiosignalen in schmalbandige Audiosignale und entsprechende Decodierung
sowie diesbezügliche
Anlagen wie z.B. Ausrüstungen
zum Durchführen
notwendiger Prozesse zu schaffen.
-
Hierzu
ist das Verfahren gemäß der Erfindung
dadurch gekennzeichnet, dass das Wasserzeichen in den ersten Spektralanteil
eingebettet ist durch: Bereitstellen des ersten Spektralanteils
und der übrigen
Spektralanteile in digitaler Form; Organisieren des ersten Spektralanteils
in Rahmen; Fourier-Transformieren des Rahmens; Modifizieren der Fourier-Koeffizienten
in Abhängigkeit
vom Wasserzeichen und inverses Fourier-Transformieren der modifizierten Fourier-Koeffizienten
zur Erlangung eines Zeitbereichs-Rahmens
mit Wasserzeichen.
-
Experimente
mit Signalen gemäß Ausführungsformen
der Erfindung haben gezeigt, dass die Informationen, die in einem
breitbandigen Audiosignal außerhalb
der Bandbreite eines entsprechenden schmalbandigen Audiosignals
enthalten sind, in recht kleine Verzerrungen des schmalbandigen
Audiosignals eingebettet werden können.
-
Experimente
haben ferner gezeigt, dass zuverlässige Extraktion von Informationen,
die in einem schmalbandigen Audiosignal als Verzerrungen eingebettet
sind, durch Kreuzkorrelationsverfahren auf zuverlässige Weise
möglich
sind.
-
Vorzugsweise
ist das codierte schmalbandige Audiosignal mit vorhandener schmalbandiger Ausrüstung und
Infrastruktur kompatibel, sodass u.a. 1) das schmalbandige Audiosignal
ohne Qualitätsverschlechterung
oder Verlust breitbandiger Informationen durch vorhandene schmalbandige
Infrastruktur übertragbar
und mittels vorhandener schmalbandiger Ausrüstung aufzeichenbar und/oder
speicherbar sein muss und 2) das schmalbandige Audiosignal in schmalbandiger
Form ohne wesentliche Qualitätsverschlechterung
der schmalbandigen Inhalte des Signals durch vorhandene schmalbandige
Ausrüstung empfangbar
und reproduzierbar sein muss.
-
Ein
so verzerrtes schmalbandiges Audiosignal kann mit einer schmalbandigen
Signalinfrastruktur wie z.B. Telefonverbindungen kompatibel gemacht
werden, da Verzerrungen innerhalb der Bandbreite des schmalbandigen
Audiosignals die Infrastruktur unbeeinflusst durchlaufen.
-
Wenn
ein schmalbandiges Audiosignal auf einem Speichermedium gespeichert
ist, belegt es einen kleineren Platz als ein entsprechendes breitbandiges
Audiosignal und erscheint daher als eine komprimierte Version des
breitbandigen Audiosignals, wobei Speicherplatz gespart wird.
-
Es
ist ein Vorteil, dass ein derartiges gespeichertes komprimiertes
Signal durch herkömmliche schmalbandige
Ausrüstung
leicht lesbar gemacht werden kann, womit Rückwärtskompatibilität sichergestellt
ist, wenn z.B. neue Speichermedien für Audiosignale eingeführt werden.
-
Die
Informationen sind in das schmalbandige Audiosignal als Wasserzeichen
eingebettet, vorzugsweise in von der Wahrnehmung her unhörbarer Weise.
Hierdurch können
verfügbare
Schaltungen und Verfahren zum Versehen von Audiosignalen mit Wasserzeichen
genutzt werden, wenn das schmalbandige Audiosignal erzeugt wird.
-
Im
Wesentlichen können
die vollständigen Audioinformationsinhalte
eines breitbandigen Audiosignals im schmalbandigen Audiosignal beinhaltet sein.
-
Experimente
haben ferner gezeigt, dass erkennbare Verzerrungen, die nahezu unhörbar oder von
der Wahrnehmung her unhörbar
sind, dazu gebracht werden können,
ausreichende Mengen an Informationen zu enthalten, um zuverlässige Rekonstruktion
hoher Qualität
der übrigen
Spektralanteile des breitbandigen Audiosignals zu ermöglichen.
-
Es
hat sich erwiesen, dass die Verwendung dieses Wasserzeicheneinbettungsschemas
ein robustes Wasserzeichen bereitstellt, das zum Transportieren
der gewünschten
Nutzdaten fähig
ist, die die Wiederherstellungsinformationen enthalten.
-
In
einer bevorzugten Ausführungsform
wird das schmalbandige Audiosignal nach Übertragen des schmalbandigen
Audiosignals durch einen Übertragungskanal
hindurch oder Speichern desselben auf einem Speichermedium wieder
zu einem breitbandigen Audiosignal aufbereitet.
-
Auf
diese Weise wird insofern gesteigerter Nutzen aus der Erfindung
gezogen, als Audiosignale hoher Qualität leicht über vorhandene schmalbandige
Infrastruktur übertragen
werden können,
ohne dass irgendwelche Zusätze
an der Infrastruktur notwendig sind.
-
In
einem Codierer zum Codieren eines breitbandigen Audiosignals in
ein schmalbandiges Audiosignal, das im Wesentlichen dieselben Informationen wie
das breitbandige Audiosignal umfasst, wird die Aufgabe der Erfindung
insofern gelöst,
als der Codierer des oben erwähnten
Typs umfasst:
- – einen Extrapolator zum Extrapolieren
des ersten Spektralanteils in ein extrapoliertes Audiosignal, das
Frequenzgrenzen aufweist, die im Wesentlichen jenen des breitbandigen
Audiosignals entsprechen; und
- – einen
Komparator zum Vergleichen des extrapolierten Audiosignals mit dem
breitbandigen Audiosignal und Bereitstellen der Wiederherstellungsinformationen
in Abhängigkeit
vom Vergleich.
-
Auf
diese Weise wird der extrahierte erste Spektralanteil mittels einer
ziemlich primitiven Form von Signalverarbeitung wieder zu einem
breitbandigen Audiosignal aufbereitet. Somit entspricht das bereitgestellte
extrapolierte (breitbandige) Audiosignal nicht dem gewünschte Qualitätsniveau,
wird aber mithilfe eines maßvollen
Betrags an Signalverarbeitungsleistung bereitgestellt.
-
Da
dieses extrapolierte Audiosignal relativ zum ursprünglichen
breitbandigen Audiosignal deterministisch ist, braucht es nicht
zusammen mit dem schmalbandigen Audiosignal übertragen werden, und es braucht
nur die Differenz zwischen dem breitbandigen Audiosignal und dem
extrapolierten Audiosignal in den ersten Spektralanteil eingebettet
zu werden. Auf diese Weise können
die Verarbeitungsleistungs-Anforderungen
an den Embedder vermindert werden.
-
In
einem Decodierer zum Decodieren eines schmalbandigen Audiosignals,
das Wiederherstellungsinformationen enthält, die zum Verarbeiten des Signals
zu einem entsprechenden breitbandigen Audiosignal verwendbar sind,
wird die Aufgabe der Erfindung durch den Decodierer des oben erwähnten Typs
gelöst,
der umfasst:
- – einen Extrapolator zum Extrapolieren
des schmalbandigen Audiosignals in ein extrapoliertes Audiosignal,
das Frequenzgrenzen aufweist, die im Wesentlichen jenen des entsprechenden breitbandigen
Audiosignals entsprechen; und
- – einen
Korrektor zum Modifizieren von Charakteristika des Extrapolators
in Abhängigkeit
von den Wiederherstellungsinformationen, wobei der Korrektor vorzugsweise
in den Extrapolator integriert ist.
-
Auf
diese Weise stellt die Extrapolation einen wesentlichen Teil der übrigen Spektralanteile
des ursprünglichen
breitbandigen Audiosignals mithilfe eines maßvollen Betrags an Signalverarbeitungsleistung
bereit. Somit braucht nur die Differenz zwischen dem breitbandigen
Audiosignal und dem extrapolierten Audiosignal aus den erkennbaren
Verzerrungen wiederhergestellt zu werden, die in den ersten Spektralanteil
eingebettet sind. Auf diese Weise können die Verarbeitungsleistungs-Anforderungen
an den Extraktor vermindert werden.
-
In
einem System zum Übertragen
eines breitbandigen Audiosignals durch einen schmalbandigen Übertragungskanal
hindurch wird die Aufgabe der Erfindung durch das System erfüllt, das
einen Codierer gemäß der Erfindung
am Sendeende zum Verarbeiten des breitbandigen Audiosignals zu einem schmalbandigen
Audiosignal und einen Decodierer gemäß der Erfindung am Empfangsende
zum Wiederaufbereiten des schmalbandigen Audiosignals zu einem breitbandigen
Audiosignal umfasst.
-
Durch
diese Maßnahmen
ist ein vollständiges
System zum Übertragenen
breitbandiger Audiosignale ohne die Notwendigkeit geschaffen, den
eigentlichen Übertragungskanal
von schmalbandigem in breitbandigen Zustand nachzurüsten. Somit müssen neue
Systeme nur an den Sende- und den Empfangsenden des gesamten Übertragungskanals
installiert werden.
-
Gemäß Ausführungsformen
der Erfindung können
derartige neue Installationen vorzugsweise insofern nicht von Dauer
sein, als sie zum Zwecke einer oder weniger Übertragungen installiert sein
können,
wie z.B. zur Übertragung
von Rundfunkprogrammen in hoher Qualität über Telefonleitungen, oder
sie können
in Vorrichtungen wie z.B. Telefongeräte oder Mobiltelefone integriert
sein, die mit dem öffentlichen
Telefonnetz verbunden sind, wodurch Teilnehmern verbesserte Übertragungsqualität bereitgestellt
wird, wenn sie mit entfernten Vorrichtungen verbunden sind, die
dieselben Anlagen aufweisen.
-
Da
ein schmalbandiges Audiosignal einen kleineren Speicherplatz als
ein breitbandiges Audiosignal im Speichermedium belegt, wird die
effektive Kapazität
jedwedes Speichermediums zur Speicherung von Audiosignalen erheblich
gesteigert.
-
Natürlich muss
ein System gemäß einer
Ausführungsform
der Erfindung zur Speicherung und zum Abruf bereitgestellt sein,
wenn ein derartiges Speichermedium verwendet wird, da aber ungeachtet
der Kapazität
des Speichermediums nur ein derartiges System bereitgestellt zu
sein braucht, ist der wirtschaftliche Nutzen bei Speichermedien
groß,
die größere Kapazitäten aufweisen.
-
Es
liegt innerhalb des Rahmens der Erfindung und der Ansprüche, für Speicherungszwecke andere
Frequenzgrenzen für
das schmalbandige Audiosignal bzw. den ersten Spektralanteil als
für Übertragungszwecke
zu verwenden.
-
Für Übertragungszwecke
werden dem schmalbandigen Audiosignal vorzugsweise dieselben Frequenzgrenzen
wie dem Übertragungskanal gegeben,
womit die Menge an Informationen verringert wird, die in den ersten
Spektralanteil einzubetten sind.
-
Für Speicherungszwecke
sind jedoch Frequenzgrenzen des schmalbandigen Audiosignals der Erfindung,
die bei einem gewünschten
Niveau der Wiedergabequalität
das größte Kompressionsverhältnis bei
Verwendung des Speichersystems der Erfindung bereitstellen, nicht
zwangsläufig
dieselben wie die bevorzugten Frequenzgrenzen für Übertragungszwecke.
-
Unten
wird die Erfindung detaillierter mittels Ausführungsbeispielen und unter
Bezug auf die Zeichnungen erläutert,
wobei
-
1 das
Prinzip eines Codierers gemäß einer
Ausführungsform
der Erfindung darstellt;
-
2 das
Prinzip eines Decodierers gemäß einer
Ausführungsform
der Erfindung darstellt;
-
3 ein
Blockschaltbild einer bevorzugten Ausführungsform des Codierers in 1 zeigt
und
-
4 ein
Blockschaltbild einer bevorzugten Ausführugsform des Decodierers in 2 zeigt.
-
In 1 liegt
an einem Eingangsanschluss ein breitbandiges Audiosignal 1 vor.
Das Signal wird zu den Eingängen
zweier Filter transportiert, eines Bandpasses 2 und einer
Bandsperre 3. Der Bandpass 2 lässt einen ersten Spektralanteil
des breitbandigen Audiosignals durch, und dieser Anteil bildet ein schmalbandiges
Audiosignal 4. Die Frequenzgrenzen oder Grenzfrequenzen
des Bandpasses 2 können
z.B. 300 Hz bzw. 3,4 kHz sein. Das schmalbandige Audiosignal 4 weist
Frequenzgrenzen auf, die den Frequenzgrenzen des Filters 2 entsprechen.
-
Vorzugsweise
entsprechen die Frequenzgrenzen oder Grenzfrequenzen der Bandsperre 3 jenen
des Bandpasses 2. Hierdurch lässt die Bandsperre 3 die übrigen Spektralanteile 5 des
breitbandigen Audiosignals 1 durch, die nicht im schmalbandigen
Audiosignal 4 enthalten sind.
-
Das
breitbandige Audiosignal 1 kann z.B. ein vollbandiges Audiosignal
sein, das von 20 oder 100 Hz bis 10 oder 20 kHz reicht. In jenem
Fall würde
die Bandsperre 3 dieselben Grenzfrequenzen wie der Bandpass 2 aufweisen,
z.B. 300 Hz und 3,4 kHz. Die übrigen
Spektralanteile 5 würden
dann durch die Frequenzbänder
von 20 oder 100 Hz bis 300 Hz und von 3,4 kHz bis 10 oder 20 kHz
gebildet.
-
Das
breitbandige Audiosignal 1 könnte ebenso ein mittelbandiges
Sprachsignal sein, das Frequenzen von, nehmen wir einmal an, 300
Hz bis 8 kHz enthält;
in jenem Fall sind die übrigen
Spektralanteile 5 das Frequenzband von 3,4 kHz bis 8 kHz, und
die Bandsperre 3 würde
durch einen 3,4-kHz-Hochpass ersetzt.
-
Die übrigen Spektralanteile 5 werden
durch einen Informationsgenerator oder eine Informationsgenerierungsschaltung 6 verarbeitet.
Diese Schaltung 6 liefert Informationen 7 über die
Inhalte der übrigen
Spektralanteile 5 in einem geeigneten Format an einen Embedder 8.
Gemäß der Erfindung
sind die Informationen 7 als Grundlage zum Wiederherstellen der übrigen Spektralanteile 5 geeignet,
bilden aber vorzugsweise eine kleinere Menge an Informationen als
die übrigen
Spektralanteile 5 selbst.
-
Der
Embedder 8 bettet die Informationen 7 in den ersten
Spektralanteil 4, ohne den Frequenzbereich des Anteils 4 zu
vergrößern, und
vorzugsweise in einer von der Wahrnehmung her unhörbaren Weise
ein, und die Ausgabe vom Embedder 8 bildet somit ein schmalbandiges
Audiosignal 9, das Frequenzgrenzen aufweist, die den Grenzfrequenzen des
Bandpasses 2 entsprechen.
-
Für derartiges
Einbetten existieren mehrere verwendbare Verfahren, wobei Versehen
mit Wasserzeichen ein bevorzugtes Verfahren ist, wobei die Informationen 7 vorzugsweise
als die „Nutzdaten" eines Wasserzeichens
eingebettet werden.
-
Eine
Aufgabe des Codierers in 1 ist es, dafür zu sorgen,
dass die Informationen 7 in einer derartigen Weise in den
ersten Spektralanteil eingebettet werden, dass die vollständigen Informationen 7 eindeutig
aus dem Signal 9 wiederherstellbar sind und dass gleichzeitig
sichergestellt ist, dass diese eingebetteten Informationen im schmalbandigen
Audiosignal 9 nicht gehört
werden können
oder zumindest eine Person nicht wesentlich stören, die das schmalbandige
Audiosignal 9 hört.
-
Da
das schmalbandige Audiosignal 9 keine Frequenzen außerhalb
der Frequenzgrenzen des Bandpasses 2 enthält, ist
es leicht durch jedwede Infrastruktur verarbeitbar oder übertragbar,
die ausgelegt ist, mit schmalbandigen Audiosignalen umzugehen. Im
erwähnten
Fall, in dem die Frequenzgrenzen des Bandpasses 2 und daher
des schmalbandigen Audiosignals 9 300 Hz bzw. 3,4 kHz waren, kann
das schmalbandige Audiosignal 9 über z.B. das öffentliche
Telefonsystem ohne wesentliche spektrale Verschlechterung übertragen
werden.
-
Uns
jetzt 2 zuwendend, liegt an einem Eingangsanschluss
ein codiertes schmalbandiges Audiosignal 20 wie z.B. das
Signal 9 in 1 vor. Das schmalbandige Audiosignal 20 wird
zu einem Extraktor 21 transportiert, wo eingebetteten Informationen 22 aus
dem Signal extrahiert werden. Diese Informationen entsprechen z.B.
den Informationen 7 in 1 und liegen
vorzugsweise im Signal 20 als Wasserzeichen vor. Verfahren
und Ausrüstung
sind per se für
derartige Extraktion eingebetteter Informationen bekannt.
-
Auf
Basis dieser Informationen 22 werden übrige Spektralanteile 24 durch
einen Wiederhersteller 23 wiederhergestellt. Diese Spektralanteile
werden in einer Mischschaltung 26 mit dem schmalbandigen
Audiosignal 20 gemischt, um ein breitbandiges Audiosignal 27 zu
erlangen. Dieses Signal 27 entspricht z.B. dem breitbandigen
Audiosignal 1 in 1.
-
Der
Codierer nach 1 und der Decodierer nach 2 werden
z.B. und vorzugsweise an einem Sendeende bzw. einem Empfangsende
eines schmalbandigen Übertragungskanals
wie z.B. einer Telefonleitung zur Wirkung gebracht.
-
Nun
kann in dem Maße,
in dem ein derartiger Übertragungskanal
die Qualität
eines übertragenen schmalbandigen
Audiosignals aufrechterhält,
und in dem Maße,
in dem die Informationsgeneration (6) und die Einbettung
(7) in 1, gefolgt vom Extrahieren (21)
und der Wiederherstellung (23) in 2, die Qualität der übrigen Spektralanteile
des breitbandigen Audiosignals 1 aufrechterhalten, dieses
breitbandige Signal jetzt über
einen schmalbandigen Übertragungskanal übertragen
und wieder, wie beschrieben, ohne wesentlichen Verlust an Qualität, insbesondere
Spektralqualität,
wiederhergestellt werden.
-
Die
Wahl von Modulation- und Demodulationsprinzipien, die in einem derartigen Übertragungskanal
verwendet werden, beeinflusst die Übertragbarkeit der schmalbandigen
Audiosignale der Erfindung nicht.
-
Derartige
Modulation kann z.B. Verwendung des GSM-Mobiltelefonnetzes oder
eines herkömmlichen
analogen Telefonnetzes sein. In ersterem Fall kann der Modulator
das GSM-Mobiltelefon am Sendeende sein, und der Demodulator kann
das GSM-Mobiltelefon am Empfangsende sein. Entlang des Übertragungskanals
können
jetzt mehrere Modulationstypen verwendet werden.
-
Beispielsweise
kann die Verbindung zwischen dem GSM-Netz, das das Mobiltelefon
am Sendeende bedient, mit dem GSM-Netz, das das Mobiltelefon am
Empfangsende bedient, über
ein herkömmliches
analoges Ferngesprächs-Telefonnetz verbunden
sein, das herkömmliche
Formen analoger Modulation verwendet.
-
Es
ist offensichtlich, dass derartige Übertragung von breitbandigen
Audiosignalen über
vorhandene schmalbandige Infrastruktur große wirtschaftliche Vorteile
bereitstellt. Das öffentliche
Telefonsystem stellt ein nahezu universell verteiltes Übertragungssystem
für standardisierte
schmalbandige Audiosignale bereit. Die Verwendung dieses Systems für jedwede Übertragung
breitbandiger Audiosignale erbringt spezialisierte Übertragungsdienste
für breitbandige
Audiosignale, die unter der überwiegenden Mehrzahl
von Umständen
verzichtbar sind, und spart daher Investitionen.
-
Es
ist ein klarer Vorteil der Erfindung, dass das codierte schmalbandige
Audiosignal 9, 20 direkt mit vorhandenen, herkömmlichen
Verarbeitungsverfahren und Ausrüstungen
für schmalbandige
Audiosignale kompatibel ist. Wie erwähnt, sind die eingebetteten
Informationen in den schmalbandigen Audiosignalen 9, 20 der
Erfindung vorzugsweise unhörbar oder
mindestens nahezu unhörbar
oder von der Wahrnehmung her unhörbar.
-
Dies
bedeutet, dass das schmalbandige Audiosignal 9 leicht über vorhandene
schmalbandige Endgeräte
wiedergebbar oder empfangbar ist, das heißt, jedwede von früher bekannte
Endausrüstung, die
mit einer vorhandenen schmalbandigen Infrastruktur gekoppelt ist.
In derartigen Ausrüstungen werden
schmalbandige Audiosignale der Erfindung erkannt und als herkömmliche
Signale behandelt. Die eingebetteten Informationen sind für derartige Ausrüstungen
von keinerlei Nutzen, werden allerdings aber auch keinerlei Störung auslösen; sollten sie
hörbar
sein, treten sie als Rauschen in Erscheinung.
-
Eine
viel versprechende Nutzung des Codierers und des Decodierers der
Erfindung, die oben beschrieben sind, wären Telefonvorrichtungen einschließlich Telefongeräten und
Mobiltelefonen. Wenn Codierer und Decodierer der Erfindung in derartige Telefone
eingebaut sind, sind breitbandige Sprachverbindungen leicht möglich, wenn
derartige Ausrüstungen
mit dem öffentlichen
Telefonnetz gekoppelt sind.
-
Wenn
zwischen einem derartigen Telefon und einem herkömmlichen Telefon eine Telefonverbindung
aufgebaut ist, ist die Verbindung natürlich schmalbandig. Das herkömmliche
Telefon gibt die eingebetteten Informationen möglicherweise als sehr leichtes
Rauschen wieder, und das Telefon der Erfindung gibt einfach das
schmalbandige Audiosignal vom herkömmlichen Telefon wieder, da
keine Informationen 22 (2) vorliegen
und somit keine übrigen
Spektralanteile 24 in das schmalbandige Audiosignal gemischt
werden, aber die Verbindung wird problemlos gelingen.
-
Wann
immer zwei Telefone gemäß der Erfindung
miteinander gekoppelt sind, hat dies jedoch eine breitbandige Telefonverbindung
zur Folge, und infolgedessen wird von den Telefonteilnehmern eine viel
höhere
Signalqualität
wahrgenommen. Eine derartige verbesserte Verbindungsqualität könnte sich als
wichtiger Wettbewerbsparameter z.B. auf dem noch wachsenden Mobiltelefonmarkt
erweisen.
-
Spezialisierte
Endgeräteausüstungen
wie z.B. zum Verbinden von Rundfunkstudios beim Übertragen von Sprecher- oder
Korrespondenten-Kommentaren können
ebenfalls von der Erfindung profitieren. Heute werden derartige
Verbindungen am häufigsten über das öffentliche
Telefonnetz hergestellt, was recht schlechte Übertragungsqualität zur Folge
hat. Die Nutzung der Erfindung in derartigen Ausrüstungen
stellt stark verbesserte Rundfunk-Audoqualität bereit.
-
Eine
bevorzugte Ausführungsform
eines Codierers der Erfindung ist in 3 gezeigt.
Ein analoges breitbandiges Audiosignal 40 wird in einem A/D-Wandler 41 in
ein digitales breitbandiges Audiosignal umgewandelt und darauf folgend
in zwei digitalen Filtern 42, 43 gefiltert. Der
digitale Filter 43 ist ein Bandpass, der einen ersten Spektralanteil 51 bereitstellt,
der ein schmalbandiges Audiosignal bildet, und der digitale Filter 42 kann
eine Bandsperre oder ein Hochpass sein, die bzw. der (einen) übrige(n) Spektralanteil(e) 52 des
breitbandigen Audiosignal 40 bereitstellt.
-
Der
erste Spektralanteil 51 und die übrigen Spektralanteile 52 werden
zu einem Informationsgenerator 55 transportiert. Hier wird
der erste Spektralanteil 51 in einem Extrapolator 53 extrapoliert,
um ein Pseudosignal 57 zu bilden. Das Pseudosignal 57 kann
in einem Komparator 54, der an seinem Ausgang ein Differenzsignal 56 bereitstellt,
mit den übrigen
Spektralanteilen 52 verglichen werden.
-
In
einer ersten Version der Ausführungsform in 3 umfasst
das durch den Extrapolator 53 gelieferte Pseudosignal 57 Frequenzen,
die jenen Frequenzen des breitbandigen Audiosignals 40 entsprechen,
die nicht im ersten Spektralanteil 51 enthalten sind. Das
heißt,
das Spektrum des Pseudosignals entspricht jenem der übrigen Spektralanteile 52.
-
Der
Extrapolator ist als vergleichsweise einfache Schaltung zu verstehen.
Derartige Schaltungen sind von früher bekannt und wären zur
Verbesserung eines schmalbandigen Audiosignals vorgesehen, um ein
breitbandiges Audiosignal höherer
Qualität
zu erlangen, jedoch üblicherweise
mit eher mangelhaften Ergebnissen.
-
Das
Pseudosignal 57 wird im Komparator 54 mit den übrigen Spektralanteilen 52 verglichen,
und das erwähnte
Differenzsignal wird erzeugt.
-
Es
ist die Aufgabe dieser Anordnung, die Menge an Informationen zu
verringern, die in den ersten Spektralanteil einzubetten ist. Selbst
wenn das Pseudosignal 57. eine mangelhafte Imitation der übrigen Spektralanteile 52 sein
kann, kann es sehr wohl so gut sein, dass die Menge an Informationen im
Differenzsignal 56 wesentlich kleiner als in den übrigen Spektralanteilen 52 ist.
-
In
einer zweiten Version der Ausführungsform
in 3 enthält
das durch den Extrapolator 53 gelieferte Pseudosignal 57 das
ganze Frequenzspektrum des breitbandigen Audiosignals 40.
-
In
diesem Fall ist das Pseudosignal 57 mit dem eigentlichen
breitbandigen Audiosignal 40 zu vergleichen, und daher
entfällt
der digitale Filter 42. In dieser zweiten Version ist das
Differenzsignal 56 nicht zwangsläufig dasselbe wie in der ersten
Version, repräsentiert
aber nichtsdestotrotz im Allgemeinen die Differenz zwischen den übrigen Spektralanteilen 52 und
entsprechenden Spektralanteilen des Pseudosignals 57.
-
Der
erste Spektralanteil 51 wird ebenfalls zu einer Unterteilschaltung
oder einem Framer 44 transportiert, der den ersten Spektralanteil
in Rahmen segmentiert. Diese Rahmen 46 werden zu einem Embedder 45 weitertransportiert.
-
Im
Embedder 45 wird jeder Rahmen zuerst in einer Schaltung
für schnelle
Fourier-Transformation 47 aus dem Zeitbereich in den Frequenzbereich transformiert.
Die Fourier-Koeffizienten werden zu einem Modifizierer 48 transportiert,
wo sie in Abhängigkeit
vom Differenzsignal 56 modifiziert werden, womit die Informationen
im Differenzsignal 56 in den ersten Spektralanteil im Frequenzbereich
eingebettet werden.
-
Die
modifizierten Fourier-Koefflzienten werden zu einer Schaltung für inverse
Fourier-Transformation 49 transportiert, wo der modifizierte
erste Spektralanteil aus dem Frequenzbereich zurück in den Zeitbereich transformiert
wird.
-
Das
resultierende Zeitbereichssignal 50 ist den ersten Spektralanteil 51 abgesehen
von den Tatsachen ähnlich,
dass es in Rahmen segmentiert ist und dass das Differenzsignal 56 darin
eingebettet ist.
-
Der
Schritt des Segmentierens des ersten Spektralanteils in Rahmen ist
vor allem zum Zwecke des verwendeten Einbettprinzips in diese Ausführungsform
des Decodierers der Erfindung integriert. Jedoch kann Segmentieren
des digitalen Audiosignals ebenfalls anderen Zwecken dienen.
-
In
einer dritten Version der Ausführungsform in 3 wird
auf den Informationsgenerator verzichtet, und statt des Differenzsignals 56 werden
die übrigen
Spektralanteile 52 direkt zum Embedder transportiert. Dadurch
wird der Codierer einfacher, aber gleichzeitig die Menge an einzubettenden
Informationen erheblich vergrößert.
-
Im
Modifizierer 48 werden das Differenzsignal 56 bzw.
die übrigen
Spektralanteile 52 vorzugsweise in Modifikationen der Fourier-Koeffizienten durch
Addieren von Elementen aus einer bekannten Folge von Binärwörtern (einem
spezifischen „Wasserzeichen") zu den Absolutwerten
der Fourier-Koeffizienten dargestellt. Die Folge umfasst vorzugsweise eine
Anzahl von Binärwörtern, die
der Anzahl von Signalabtastwerten in jedem Rahmen 46 entspricht.
-
Die
Folge dieser Elemente für
jeden Rahmen 46 kann vorzugsweise in Abhängigkeit
vom Wert des Differenzsignals 56 bzw. der übrigen Spektralanteile 52 zyklisch
verschoben sein, wobei der Wert hierdurch tatsächlich durch den Betrag der
Verschiebung der Folge von Wasserzeichen-Elementen dargestellt ist.
-
Experimente
haben gezeigt, dass das Differenzsignal, das in den ersten Spektralanteil
eingebettet ist, um das schmalbandige Audiosignal gemäß der Erfindung
zu erzielen, das schmalbandige Audiosignal 50 nicht in
nennenswertem Umfang verschlechtert, wenn das Signal durch ein Stück herkömmlicher
schmalbandiger Ausrüstung
wiedergegeben wird.
-
Eine
bevorzugte Ausführungsform
eines Decodierers der Erfindung ist in 4 gezeigt.
Ein digitales, als Rahmen vorliegendes schmalbandiges Audiosignal 70 gemäß der Erfindung
wird an einem Eingangsanschluss empfangen und wird zu einem Extraktor 71 transportiert,
wo jedwede eingebetteten Informationen gemäß der Erfindung aus dem schmalbandigen
Audiosignal 70 extrahiert werden.
-
Im
Extraktor 71 wird das als Rahmen vorliegende schmalbandige
Audiosignal 70 diskreter Fourier-Transformation unterzogen,
und die Fourier-Koeffizienten werden zu einer Kreuzkorrelationsschaltung 73 transportiert.
-
In
einer bevorzugten Ausführungsform
dieser Schaltung, die der bevorzugten Ausführungsform des Embedders 45 in 3 entspricht,
ist die Korrelation zwischen den Fourier-Koeffizienten und dem bekannten
Wasserzeichen (dieselbe Folge von Binärwörtern wie in 3)
für jeden
möglichen
Wert der zyklischen Verschiebung des Wasserzeichenwortes eingerichtet,
der im Embedder 45 verwendet wird.
-
Diese
Korrelation übernimmt
einen signifikanten Wert, wenn die zyklische Verschiebung dieselbe
wie die Verschiebung ist, die beim Einbetten verwendet wird, und
auf diese Weise kann der eingebettete Wert (die „Nutzdaten") identifiziert und somit extrahiert
werden. Diese Extraktion ist durch den Kasten 75 symbolisiert,
der in 4 eine Nutzdatenextraktionsschaltung darstellt.
Die extrahierten Nutzdaten, die dem Differenzsignal 56 bzw.
den übrigen Spektralanteilen 52 entsprechen,
erscheinen nun am Anschluss 76 in 4, von wo
sie zusammen mit dem schmalbandigen Audiosignal 70 zu einem
Wiederhersteller 79 transportiert werden.
-
Im
Wiederhersteller wird das empfangene schmalbandige Audiosignal 70 zum
Extrapolator 80 transportiert, der ein extrapoliertes Pseudosignal 74 liefert.
Dieses Pseudosignal 74 wird zum Korrektor 81 geliefert,
wo es in Abhängigkeit
von den extrahierten Nutzdaten 76 ergänzt wird. Wesentlich ist, dass das
Pseudosignal 74 dem Pseudosignal 57 in 3 entspricht.
-
In
einer ersten Version der Ausführungsform in 4 umfasst
das durch den Extrapolator 80 gelieferte Pseudosignal 74 Frequenzen,
die jenen Frequenzen des breitbandigen Audiosignals 40 entsprechen,
die nicht im ersten Spektralanteil 51 enthalten sind, in
einer Weise, die der ersten Version des Codierers nach 3 entspricht.
-
In
dieser Version bilden die Nutzdaten 76 ein Differenzsignal,
das zum Pseudosignal 74 addiert wird, und das Summensignal 82 entspricht
den übrigen
Spektralanteilen 52. Diese werden nun in einer Mischschaltung 83 mit
dem empfangenen schmalbandigen Audiosignal 70 gemischt,
und das Ausgangssignal 84 aus der Mischschaltung 83 bildet
das wiederhergestellte breitbandige Audiosignal.
-
In
einer zweiten Version der Ausführungsform
in 4, die zusammen mit der zweiten Version des Codierers
nach 3 zu verwenden ist, enthält das durch den Extrapolator 80 gelieferte
Pseudosignal 74 das ganze Frequenzspektrum des ursprünglichen
breitbandigen Audiosignals 40.
-
In
jenem Fall repräsentieren
die Nutzdaten 76 nichtsdestotrotz im Allgemeinen die Differenz
zwischen den übrigen
Spektralanteilen 52 und entsprechenden Spektralanteilen
des Pseudosignals 74. Addieren dieser Differenz zum Pseudosignal 74 erzielt wiederum
ein Summensignal 82, das den übrigen Spektralanteilen 52 entspricht
und mit dem empfangenen schmalbandigen Audiosignal 70 gemischt wird,
um ein wiederhergestelltes breitbandiges Audiosignal 84 zu
erlangen.
-
In
einer dritten Version des Decodierers in 4, die der
dritten Version des Codierers in 3 entspricht,
entsprechen die Nutzdaten den gesamten übrigen Spektralanteilen 52 und
werden direkt zur Mischschaltung 83 transportiert. In diesem
Fall entfällt
der Wiederhersteller 79.
-
Die
drei Versionen des Codierers nach 3 und die
entsprechenden Versionen des Decodierers nach 4 bilden
nun drei Ausführungsformen
von Codierer-Decodierer-Paaren
gemäß der Erfindung zum Übertragen
eines breitbandigen Audiosignals entlang einer schmalbandigen Infrastruktur.
Das breitbandige Audiosignal wird am Sendeende codiert und am Empfangsende
decodiert.
-
Die
schmalbandige Infrastruktur braucht kein Übertragungskanal zu sein, sondern
kann jedoch jedwede schmalbandige Struktur wie z.B. ein Speichersystem
sein. In jenem Fall kann ein breitbandiges Audiosignal in der Form
eines schmalbandigen Audiosignals gemäß der Erfindung gespeichert
und beim Abruf aus dem Speicher in breitbandige Form decodiert werden,
wie unter Bezug auf 2 und 4 beschrieben.
Hierdurch wird eine wirksame Kompression des breitbandigen Audiosignals
erlangt. Die Vorzüge,
die aus einem derartigen System erlangt werden, sind im ersten Teil
der vorliegenden Spezifikation diskutiert worden.
-
Es
liegt innerhalb der Erfindung, Frequenzgrenzen für den ersten Spektralanteil
zu entwerfen, die ein höheres
Maß an
Kompression für
irgendein gewünschtes
Wiedergabequalitätsniveau
bereitstellen.
-
In ähnlicher
Weise kann das schmalbandige Audiosignal der Erfindung irgendeiner
anderen Form von Verarbeitung oder Struktur schmalbandiger Audiosignale
unterliegen, die entsprechende Vorzüge bereitstellt.
-
Auch
wenn oben auf spezielle Weisen des Einbettens von Wiederherstellungsinformationen
in den ersten Spektralanteil einschließlich der Verwendung von Einbettungsverfahren
Bezug genommen wird, die vom Versehen mit Wasserzeichen von Signalen
bekannt sind, liegt es innerhalb des Rahmens der Erfindung, jedwedes
Verfahren für
das Einbetten der Wiederherstellungsinformationen in den ersten Spektralanteil
und für
nachfolgende Extraktion der Informationen zu verwenden.
-
Auch
wenn oben auf breitbandige Audiosignale im Allgemeinen Bezug genommen
wird, wird es als besonders vorteilhaft angesehen, die Erfindung auf
breitbandige Sprachsignale anzuwenden.
-
Sprache
bildet ein Audiosignal, bei dem die unverzichtbaren Teile des Signals,
die zum Verständnis
der gesprochenen Mitteilung notwendig sind, in einem wohldefinierten
Spektralanteil des Signals enthalten sind, d.h. dem Frequenzband
von 300-3.400 Hz.
Dieses Band kann bei Verwendung der Erfindung ohne irgendwelche Änderungen übertragen
bzw. gespeichert werden, wohingegen die übrigen Spektralanteile nicht
notwendigerweise mit derselben Wiedergabetreue wie das Frequenzband
von 300-3.400 Hz
wiedergegeben werden müssen.
-
Somit
kann das Wiedergeben der übrigen Spektralanteile
nach niedrigerem Standard erfolgen, wenn Sprachsignale wiedergegeben
werden, als nehmen wir mal an, bei Musik. Auf diese Weise kann die
Erfindung benutzt werden, um eine niedrigere, aber noch akzeptable
zu benutzende Wiedergabequalität
somit Einsparungen an Verarbeitungsleistung auszuwählen.
-
Es
ist anzumerken, dass die oben erwähnten Ausführungsformen die Erfindung
veranschaulichen statt sie zu begrenzen und dass der Fachmann in
der Lage ist, zahlreiche alternative Ausführungsformen zu entwickeln,
ohne den Rahmen der angehängten Ansprüche zu verlassen.
In den Ansprüchen
sind jedwede Bezugszeichen, die in Klammern gesetzt sind, nicht
als die Ansprüche
begrenzend aufzufassen. Das Wort „umfassen" (Englisch: „comprising") schließt das Vorhandensein
von anderen als den in einem Anspruch aufgeführten Elementen oder Schritten
nicht aus. Die Erfindung kann mittels Hardware, die mehrere verschiedene
Elemente umfasst, und mittels eines in geeigneter Weise programmierten
Computers implementiert werden. In einem Geräteanspruch, der mehrere Mittel
aufzählt,
können mehrere
dieser Einrichtung durch ein und dasselbe Hardware-Element verkörpert sein.
Die bloße
Tatsache, dass gewisse Maßnahmen
in voneinander verschiedenen abhängigen
Ansprüchen
dargelegt sind, besagt nicht, dass keine Kombination dieser Maßnahmen
vorteilhaft verwendet werden kann.
-
Legende der Zeichnungen
-
3
- 41
- A/D
- 47
- FFT
- 49
- IFT
-
4
- 72
- DFT