<Desc/Clms Page number 1>
Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und auf Verfahren zum Einfügen von Kodes in Audiosignale sowie zum Dekodieren solcher Kodes.
Seit vielen Jahren sind Techniken vorgeschlagen worden, um Kodes mit Audiosignalen so zu mischen, dass (1) die Kodes zuverlässig aus den Audiosignalen reproduziert werden können, während (2) die Kodes unhörbar sind, wenn die Audiosignale als Klang bzw. Ton wiedergegeben werden. Die Einhaltung dieser beiden Bedingungen ist fur praktische Anwendungszwecke wesent- lich Beispielsweise würden Rundfunk-Sendeanstalten und Produzenten von Rundfunksendungen wie auch Aufnahmeanstalten von Musik für öffentliche Darbietungen die Hinzufügung von hörbaren Kodes in ihren Programmen bzw. Aufnahmen nicht tolerieren.
Derartigen Techniken zum Kodieren von Audiosignalen sind bereits zu unterschiedlichen Zeit- punkten vorgeschlagen worden und gehen zumindest bis auf das U.S.-Patent No 3,004,104 (Hembrooke, erteilt am 10. Oktober 1961) zurück. In dem genannten Patent wird ein Kodierungs- verfahren gezeigt, bei dem die Energie des Audiosignals innerhalb eines schmalen Frequenz- bandes selektiv entfernt wurde, um das Signal zu kodieren. Ein Problem, das bei dieser Technik auftritt, besteht darin, dass der Kode undeutlich wird, wenn Rauschen oder Signalverzerrungen erneut Energie in dieses schmale Frequenzband einbringen.
Bei einem anderen Verfahren nach dem U.S.-Patent No. 3,845,391 (Crosby) wird vorgeschla- gen, ein schmales Frequenzband aus den Audiosignalen herauszuschneiden und dort einen Kode einzufügen Bei dieser Technik treten offensichtlich die gleichen Probleme wie oben auf, wie auch im U.S.-Patent No. 4,703,476 (Howard) festgestellt, das, wie daraus zu entnehmen ist, vom glei- chen Anmelder wie das Crosby-Patent eingereicht wurde Das Verfahren nach Howard versuchte indessen lediglich, das Verfahren nach Crosby zu verbessern, ohne von dessen grundsätzlicher Vorgehensweise abzuweichen.
Es ist weiterhin vorgeschlagen worden, binäre Signale durch Verteilen der binären Kodes auf Frequenzen, die sich über das gesamte Audioband erstrecken, zu kodieren Ein Problem, das bei diesem Verfahren auftritt, besteht darin, dass die Kodefrequenzen hörbar werden können, wenn keine Audio-Frequenzkomponenten vorhanden sind, die sie verdecken können. Dieses Verfahren beruht daher auf der Voraussetzung, dass die Kodes einen rauschartigen Charakter haben und somit angenommen werden kann, dass ihr Vorhandensein von den Hörern nicht wahrgenommen werden wird. In vielen Fällen stimmt diese Voraussetzung allerdings nicht, beispielsweise dann, wenn im Falle von klassischer Musik Zeitabschnitte mit einem relativ geringen Audiosignalgehalt vorhanden sind, oder während Sprechpausen.
Es ist eine weitere Technik vorgeschlagen worden, bei der Dualton-Multifrequenzkodes (DTMF-Kodes) in ein Audiosignal eingefügt werden. Die DTMF-Kodes werden angeblich auf der Grundlage ihrer Frequenzen und Zeitdauern detektiert. Es können allerdings fälschlicherweise Audiosignalkomponenten für einen oder beide Töne eines jeden DTMF-Kodes genommen werden, so dass entweder das Vorhandensein eines Kodes durch den Detektor nicht erkannt wird oder umgekehrt Signalkomponenten irrtümlicherweise für einen DTMF-Kode gehalten werden. Zusätz- lich wird angemerkt, dass jeder DTMF-Kode einen Ton aufweist, den er mit einem anderen DTMF- Kode gemeinsam hat.
Demgemäss kann sich eine Signalkomponente, die einem Ton eines ande- ren DTMF-Kodes entspricht, mit dem Ton eines DTMF-Kodes, der gleichzeitig in dem Signal vorhanden ist, vereinigen, so dass eine fehlerhafte Erfassung die Folge ist.
Weiters ist aus der US-PS 4,771,455 (Hareyama et al.) ein Sender und ein Empfänger zur gemeinsamen Übertragung eines Hauptsignals und eines verwürfelten Signals durch Zeitverviel- fachung bekanntgeworden Der Empfänger trennt die beiden Signale auf Basis ihrer Zeitmultiplex- Beziehung. Während das verwürfelte Signal nicht zur Übertragung gelangt, wenn das Niveau des Hauptsignals unter ein Niveau VSH fällt, schreibt der Empfänger das empfangene verwürfelte Signal einfach in den Speicher an aufeinanderfolgende Adressen und gibt Daten aus diesem Daten-Pool aus. Eine Zuweisung einer Amplitude an das verwürfelte Signal auf der Basis des Niveaus des
Hauptsignals geht aus der US-PS 4,771,455 nicht hervor.
Vielmehr wird vom Sender kein verwür- feltes Signal in das Hauptsignal eingefügt, wenn das Niveau des Hauptsignals unter einen vorbe- stimmten Wert VSH fällt
Aus der US 5,213,337 ist es bekannt geworden, Informationen in Kodetönen im Audioteil eines TV-Programms zu kodieren und die Kodetöne durch Toneffekte zu maskieren, wobei entweder ein Techniker entscheidet, an welchen Stellen die Kodes für Kodetone eingefügt werden oder diese
<Desc/Clms Page number 2>
automatisch in den Soundtrack mit den Toneffekten eingefügt werden.
Bei der US-PS 4,876,617 wird ein binärer Kode in zwei Frequenzkerben eines Tonsignals ein- gefügt. Best et al. versuchen, die eingefügten Kode durch Einstellen ihrer Amplituden auf der Basis der Hülle eines Teils des Tonsignals in einem Bereich von 1 kHz bis 6 kHz abzudecken. Die Erfas- sung der Kodes erfolgt einfach durch Bandpassfilterung und offensichtlich durch Schwellenwert- Detektion.
Schliesslich zeigt die WO 93/07689 (Arbitron) einen Audiosignal-Kodierer, der vorbestimmte schmale Frequenzbänder eines Audiosignals entweder durch Verringern der Energie in den Fre- quenzbändern auf Null oder durch Erhöhen auf einen vorbestimmten Wert kodiert.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, Vorrichtungen und Verfahren zum Kodieren und Dekodieren bereitzustellen, die die genannten und weitere Nachteile der oben erläuterten, bekannten Techniken überwinden.
Weiterhin besteht die Aufgabe der Erfindung darin, Vorrichtungen und Verfahren zum Einfügen von Kodes in Audiosignalen bereitzustellen, so dass die Kodes als Ton für das menschliche Gehor unhörbar sind, aber durch eine Dekodierungsvorrichtung zuverlässig detektiert werden können. Die Aufgabe der vorliegenden Erfindung besteht schliesslich weiterhin darin, Kodierungsvorrichtungen und-verfahren bereitzustellen, um Kodes, die in Audiosignalen vorhanden sind, zuverlässig wie- derherzustellen
Gemäss einer ersten Ausführungsform der vorliegenden Erfindung umfassen die Vorrichtung und Verfahren zum Einfügen eines Kodes mit wenigstens einer Kodierungs-Frequenzkomponente in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten folgende Schritte bzw.
Mittel zu deren Ausführung : der Eignung eines ersten Satzes aus der Anzahl von Audio- signal-Frequenzkomponenten zum Verdecken der wenigstens einen Kode-Frequenzkomponente gegenüber dem menschlichen Gehör, um eine erste Verdeckungsbewertung zu erzeugen ; ten der Eignung eines zweiten Satzes aus der Anzahl von Audiosignal-Frequenzkomponenten, die sich von deren erstem Satz unterscheiden, um die zumindest eine Kode-Frequenzkomponente gegenüber dem menschlichen Gehör zu verdecken, um eine zweite Verdeckungsbewertung zu erzeugen ; Zuweisen einer Amplitude an die zumindest eine Kode-Frequenzkomponente, die auf einer ausgewählten ersten oder zweiten Verdeckungsbewertung basiert ; Einfügen der zumin- dest einen Kode-Frequenzkomponente in das Audiosignal.
In einer anderen Ausführungsform der Erfindung beinhaltet eine Vorrichtung zum Einfügen ei- nes Kodes mit zumindest einer Kode-Frequenzkomponente in ein Audiosignal mit einer Anzahl von
Audiosignal-Frequenzkomponenten: einen digitalen Computer mit einem Eingang zum Aufnehmen des Audiosignals, wobei der digitale Computer zum Bewerten der jeweiligen Eignungen der ersten und zweiten Sätze der Anzahl von Audiosignal-Frequenzkomponenten im Hinblick darauf, die zumindest eine Kode-Frequenzkomponente gegenüber dem menschlichen Gehör verdecken, programmiert ist, um eine erste und eine zweite Verdeckungsbewertung zu erzeugen, wobei sich der zweite Satz der Anzahl von Audiosignal-Frequenzkomponenten von deren erstem Satz unter- scheidet, und wobei der digitale Computer weiterhin so programmiert ist, dass er eine Amplitude an die wenigstens eine Kode-Frequenzkomponente zuweist,
auf der Grundlage einer ausgewählten ersten oder zweiten Verdeckungsbewertung, sowie Mittel zum Einfügen der wenigstens einen
Kode-Frequenzkomponente in das Audiosignal.
Bei einer weiteren Ausführungsform der Erfindung weisen Vorrichtungen und Verfahren zum
Einfügen eines Kodes mit einer Anzahl von Kode-Frequenzkomponenten in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten, wobei die Anzahl der Kode-Frequenzkom- ponenten eine erste Kode-Frequenzkomponente mit einer ersten Frequenz und eine zweite Kode-
Frequenzkomponente mit einer zweiten, von der ersten Frequenz unterschiedlichen Frequenz beinhaltet, folgende Schritte bzw.
Mittel zu deren Ausführung auf : Bewerten der Eignung von zumindest einer aus der Anzahl von Audiosignal-Frequenzkomponenten zum Verdecken einer
Kode-Frequenzkomponente mit der ersten Frequenz gegenüber dem menschlichen Gehör, um eine erste Verdeckungsbewertung zu erzeugen; Bewerten der Eignung von zumindest einer aus der Anzahl der Audiosignal-Frequenzkomponenten zum Verdecken einer Kode-Frequenzkompo- nente mit der zweiten Frequenz gegenuber dem menschlichen Gehör, um eine zweite Ver- deckungsbewertung durchzuführen, Zuweisen einer Amplitude an die erste Kode-Frequenzkompo- nente auf der Grundlage der ersten Verdeckungsbewertung und Zuweisen einer Amplitude an die
<Desc/Clms Page number 3>
zweite Kode-Frequenzkomponente auf der Grundlage der zweiten Verdeckungsbewertung ;
Einfügen der Anzahl von Kode-Frequenzkomponenten in das Audiosignal.
Gemäss einer weiteren Ausführungsform der Erfindung weisen Vorrichtungen und Verfahren zum Einfügen eines Kodes mit einer Anzahl von Kode-Frequenzkomponenten in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten, wobei die Anzahl der Kode-Frequenz- komponenten eine erste Kode-Frequenzkomponente mit einer ersten Frequenz und eine zweite Kode-Frequenzkomponente mit einer zweiten, von der ersten Frequenz unterschiedlichen Fre- quenz beinhaltet, folgende Schritte bzw.
Mittel zu deren Ausführung auf : digitalen Computer mit einem Eingang zum Aufnehmen eines Audiosignals, wobei der digitale Computer programmiert ist, um die Eignung von zumindest einer aus der Anzahl von Audiosignal-Frequenzkomponenten zum Verdecken einer Kode-Frequenzkomponente mit einer ersten Frequenz gegenuber dem menschlichen Gehör zu bewerten, um eine erste Verdeckungsbewertung durchzuführen, und um die Eignung von zumindest einer aus der Anzahl von Audiosignal-Frequenzkomponenten zum Verdecken einer Kode-Frequenzkomponente mit einer zweiten Frequenz gegenüber dem mensch- lichen Gehör zu bewerten, um eine zweite Verdeckungsbewertung zu erzeugen ;
der digitale Computer weiterhin programmiert ist, um der ersten Kode-Frequenzkomponente eine entspre- chende Amplitude auf der Grundlage der ersten Verdeckungsbewertung zuzuweisen, und der zweiten Kode-Frequenzkomponente eine entsprechende Amplitude auf der Grundlage der zweiten Verdeckungsbewertung zuzuweisen; sowie Mittel zum Einfügen der Anzahl von Kode-Frequenz- komponenten in das Audiosignal.
In einer weiteren Ausführungsform der Erfindung beinhalten Verfahren und Vorrichtungen zum
Einfügen eines Kodes mit wenigstens einer Kode-Frequenzkomponente in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten folgende Schritte bzw. Mittel zu deren Durch- führung : Bewerten der Eignung von zumindest einer aus der Anzahl von Audiosignal-Frequenz- komponenten innerhalb eines ersten Audiosignal-Intervalls auf einer Zeitskala des Audiosignals bei Wiedergabe als Ton während eines entsprechenden ersten Zeitintervalls zum Verdecken der zumindest einen Kode-Frequenzkomponente gegenüber dem menschlichen Gehör, bei Wiederga- be als Ton während eines zweiten Zeitintervalls, das einem zweiten Audiosignalintervall entspricht, das gegenüber dem ersten Audiosignalintervalls versetzt ist, um eine erste Verdeckungsbewertung zu erzeugen;
Zuweisen einer Amplitude an die zumindest eine Kode-Frequenzkomponente auf der Grundlage der ersten Verdeckungsbewertung ; Einfügen der zumindest einen Kode-Frequenz- komponente in einen Abschnitt des Audiosignals innerhalb des zweiten Audiosignalintervalls.
In einer weiteren Ausführungsform der Erfindung beinhaltet eine Vorrichtung zum Einfügen ei- nes Kodes mit zumindest einer Kode-Frequenzkomponente in ein Audiosignal mit einer Anzahl von
Audiosignal-Frequenzkomponenten: einen digitalen Computer mit einem Eingang zum Aufnehmen des Audiosignals, wobei der digitale Computer programmiert ist zum Bewerten der Eignung von zumindest einer aus der Anzahl von Audiosignal-Frequenzkomponenten innerhalb eines ersten
Audiosignalintervalls auf einer Zeitskala des Audiosignals bei Wiedergabe als Ton während eines ersten Zeitintervalls zum Verdecken der wenigstens einen Kode-Frequenzkomponente gegenüber dem menschlichen Gehör bei Wiedergabe als Ton während eines zweiten Zeitintervalls, das einem zweiten Audiosignalintervall entspricht, das gegenüber dem ersten Audiosignalintervall versetzt ist,
um eine erste Verdeckungsbewertung zu erzeugen, wobei der digitale Computer weiterhin pro- grammiert ist zum Zuweisen einer Amplitude an die zumindest eine Kode-Frequenzkomponente auf der Grundlage der ersten Verdeckungsbewertung ; undMittel zum Einfügen der wenigstens einen Kode-Frequenzkomponente in einen Abschnitt des Audiosignals innerhalb des zweiten
Audiosignalintervalls.
Bei einer weiteren Ausführungsform der Erfindung beinhalten Vorrichtungen und Verfahren zum Einfügen eines Kodes mit wenigstens emer Kode-Frequenzkomponente in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten folgende Schritte bzw. die Mittel zu deren
Durchführung : Erzeugen eines ersten Tonsignals, das im wesentlichen eine erste, einzelne aus der
Anzahl der Audiosignal-Frequenzkomponenten darstellt; Bewerten der Eignung der ersten, einzel- nen aus der Anzahl der Audiosignal-Frequenzkomponenten zum Verdecken der wenigstens einen
Kode-Frequenzkomponente gegenüber dem menschlichen Gehör auf der Grundlage des ersten Tonsignals, um eine erste Verdeckungsbewertung zu erzeugen ;
Zuweiseneiner Amplitude an die zumindest eine Kode-Frequenzkomponente auf der Grundlage der ersten Verdeckungsbewertung;
<Desc/Clms Page number 4>
und Einfügen der zumindest einen Kode-Frequenzkomponente in das Audiosignal.
In einer weiteren Ausführungsform der Erfindung beinhaltet eine Vorrichtung zum Einfügen eines Kodes mit wenigstens einer Kode-Frequenzkomponente in ein Audiosignal mit einer Anzahl von Audiosignal-Frequenzkomponenten: einen digitalen Computer mit einem Eingang zum Auf- nehmen des Audiosignals, wobei der digitale Computer programmiert ist, um ein erstes Tonsignal zu erzeugen, das im wesentlichen eine erste, einzelne aus der Anzahl von Audiosignal-Frequenz- komponenten darstellt, und zum Bewerten einer Eignung der ersten, einzelnen aus der Anzahl von Audiosignal-Frequenzkomponenten zum Verdecken der zumindest einen Kode-Frequenzkompo- nente gegenüber dem menschlichen Gehör, auf der Grundlage des ersten Tonsignals, um eine erste Verdeckungsbewertung zu erzeugen ;
der digitale Computer weiterhin programmiert ist zum Zuweisen einer Amplitude an die zumindest eine Kode-Frequenzkomponente auf der Grund- lage der ersten Verdeckungsbewertung ; undMittel zum Einfügen der zumindest einen Kode- Frequenzkomponente in das Audiosignal.
Bei einer weiteren Ausführungsform der Erfindung beinhalten Vorrichtungen und Verfahren zum Detektieren eines Kodes in einem kodierten Audiosignal, wobei das kodierte Audiosignal eine Anzahl von Audiofrequenz-Signalkomponenten und zumindest eine Kode-Frequenzkomponente mit einer Amplitude und einer Audiofrequenz aufweist, ausgewählt zum Verdecken der Kode-
Frequenzkomponente gegenüber dem menschlichen Gehör durch zumindest eine aus der Anzahl der Audiofrequenz-Signalkomponenten, folgende Schritte bzw. Mittel zu deren Durchführung : stellen einer erwarteten Kodeamplitude der zumindest einen Kode-Frequenzkomponente auf der
Grundlage des kodierten Audiosignals; und Detektieren der Kode-Frequenzkomponente in dem kodierten Audiosignal auf der Grundlage von deren erwarteter Kodeamplitude.
Bei einer weiteren Ausführungsform der Erfindung ist ein programmierter digitaler Computer zum Detektieren eines Kodes in einem kodierten Audiosignal vorhanden, wobei das kodierte
Audiosignal eine Anzahl von Audiofrequenz-Signalkomponenten und zumindest eine Kode-
Frequenzkomponente mit einer Amplitude und einer Audiofrequenz, ausgewählt zum Verdecken der Kode-Frequenzkomponente gegenüber dem menschlichen Gehör durch zumindest eine aus der Anzahl der Audiofrequenz-Signalkomponenten beinhaltet, wobei der digitale Computer umfasst: einen Eingang zum Aufnehmen des kodierten Audiosignals;
einen Prozessor, der zum Aufstellen einer erwarteten Kodeamplitude der zumindest einen Kode-Frequenzkomponente auf der Grundla- ge des kodierten Audiosignals programmiert ist, um die Kode-Frequenzkomponente in dem kodier- ten Audiosignal auf der Grundlage der erwarteten Kodeamplitude zu detektieren, und um ein
Kodedetektierungs-Ausgangssignal auf der Grundlage der detektierten Kode-Frequenzkompo- nente zu erzeugen ; einen an den Prozessor angeschlossenen Ausgang zum Abgeben des
Kode-Erfassungs-Ausgangssignals.
Bei einer weiteren Ausführungsform der Erfindung beinhalten Verfahren und Vorrichtungen zur
Erfassung eines Kodes in einem kodierten Audiosignal, wobei das kodierte Audiosignal eine An- zahl von Frequenzkomponenten einschliesslich einer Anzahl von Audiofrequenz-Signalkomponen- ten und zumindest einer Kode-Frequenzkomponente mit einer vorbestimmten Audiofrequenz und einer vorbestimmten Amplitude zum Unterscheiden der zumindest einen Kode-Frequenzkompo- nente von der Anzahl von Audiofrequenz-Signalkomponenten aufweist, folgende Schritte bzw Mit- tel zu deren Durchführung :
einer Amplitude einer Frequenzkomponente des kodierten
Audiosignals innerhalb eines ersten Bereichs von Audiofrequenzen einschliesslich der vorbestimm- ten Audiofrequenz der zumindest einen Kodefrequenz-Komponente, Aufstellen einer Rauschampli- tude für den ersten Bereich von Audiofrequenzen ; Detektieren des Vorhandenseins der zu- mindest einen Kode-Frequenzkomponente in dem ersten Bereich von Audiofrequenzen auf der
Grundlage von deren aufgestellter Rauschamplitude und der bestimmten Amplitude der Frequenz- komponente darin.
Bei einer weiteren Ausführungsform der Erfindung ist ein digitaler Computer zum Detektieren eines Kodes in einem kodierten Audiosignal vorhanden, wobei das kodierte Audiosignal eine
Anzahl von Frequenzkomponenten einschliesslich einer Anzahl von Audiofrequenz-Signalkompo- nenten und zumindest einer Kode-Frequenzkomponente mit einer vorbestimmten Audiofrequenz und einer vorbestimmten Amplitude zum Unterscheiden der zumindest einen Kode-Frequenzkom- ponente von der Anzahl von Audiofrequenz-Signalkomponenten aufweist, mit :
Eingang zum
Aufnehmen des kodierten Audiosignals; einem mit dem Eingang verbundenen Prozessor zum
<Desc/Clms Page number 5>
Aufnehmen des kodierten Audiosignals, der programmiert ist, um eine Amplitude einer Frequenz- komponente des kodierten Audiosignals innerhalb eines ersten Bereichs von Audiofrequenzen einschliesslich der vorbestimmten Audiofrequenz der zumindest einen Kode-Frequenzkomponente zu bestimmen, wobei der Prozessor weiterhin programmiert ist zum Aufstellen einer Rauschampli- tude für den ersten Bereich von Audiofrequenzen und zum Detektieren des Vorhandenseins der zumindest einen Kode-Frequenzkomponente in dem ersten Bereich von Audiofrequenzen, auf der Grundlage von deren aufgestellter Rauschamplitude und der festgelegten Amplitude der Frequenz- komponente darin ;
der Prozessor so arbeitet, dass er ein Kode-Ausgangssignal auf der Grundlage des detektierten Vorhandenseins der zumindest einen Kode-Frequenzkomponente erzeugt ; und mit einem Ausgangsanschluss, der mit dem Prozessor verbunden ist, an dem das Kodesignal bereitgestellt wird.
Bei einer weiteren Ausführungsform der Erfindung beinhalten Vorrichtungen und Verfahren zum Kodieren eines Audiosignals folgende Schritte bzw. Mittel zu deren Durchführung: Erzeugen eines Kodes mit einer Anzahl von Sätzen von Kode-Frequenzkomponenten, wobei jeder der Sätze von Kode-Frequenzkomponenten ein unterschiedliches Kode-Symbol darstellt und eine Anzahl von unterschiedlichen Kode-Frequenzkomponenten beinhaltet, wobei die Kode-Frequenzkomponenten der Sätze von Kode-Frequenzkomponenten Gruppen bilden, die innerhalb des Frequenzbereichs einen gegenseitigen Abstand aufweisen, wobei jede der Komponentengruppen einen vorbestimm- ten Frequenzbereich hat und aus einer Frequenzkomponente von jedem der in ihren jeweiligen vorbestimmten Frequenzbereich fallenden Satz der Kode-Frequenzkomponenten besteht, wobei Komponentengruppen,
die innerhalb des Frequenzbereichs benachbart liegen, durch einen jeweili- gen Frequenzbetrag voneinander getrennt sind, wobei der vorbestimmte Frequenzbereich einer jeden Komponentengruppe kleiner ist als die Frequenzbeträge, die die jeweilige Komponenten- gruppe von ihren benachbarten Komponentengruppen trennen ; Kombinieren des Kodes mit dem Audiosignal.
Bei einer weiteren Ausführungsform der Erfindung ist ein digitaler Computer zum Kodieren ei- nes Audiosignals vorhanden, mit : Eingang zum Aufnehmen des Audiosignals, einem Pro- zessor, der zum Erzeugen eines Kodes mit einer Anzahl von Sätzen von Kode-Frequenzkom- ponenten programmiert ist, wobei jeder Satz der Kode-Frequenzkomponenten ein jeweils unter- schiedliches Kode-Symbol darstellt und eine Anzahl von jeweils unterschiedlichen Kode-Frequenz- komponenten beinhaltet, wobei die Kode-Frequenzkomponenten der Sätze von Kode-Frequenz- komponenten Komponentengruppen bilden, die innerhalb des Frequenzbereichs einen gegenseiti- gen Abstand aufweisen,
wobei jede der Komponentengruppen einen vorbestimmten Frequenzbe- reich hat und aus einer Frequenzkomponente von jedem der in ihren jeweiligen vorbestimmten
Frequenzbereich fallenden Satz der Kode-Frequenzkomponenten besteht, wobei Komponenten- gruppen, die innerhalb des Frequenzbereichs benachbart liegen, durch einen jeweiligen Frequenz- betrag voneinander getrennt sind, wobei der vorbestimmte Frequenzbereich einer jeden Kompo- nentengruppe kleiner ist als die Frequenzbeträge, die die jeweilige Komponentengruppe von ihren benachbarten Komponentengruppen trennen ; Mitteln zum Kombinieren des Kodes mit dem Audiosignal.
Die Erfindung wird nachfolgend anhand bevorzugter Ausführungsbeispiele und unter Bezug- nahme auf eine Zeichnung weiter erläutert. Es zeigt:
Fig. 1 ein Blockdiagramm zur Funktion einer Kodierungsvorrichtung gemäss einem
Aspekt der vorliegenden Erfindung ;
Fig. 2 ein Blockdiagramm zur Funktion einer digitalen Kodierungsvorrichtung nach einer Ausführungsform der vorliegenden Erfindung;
Fig. 3 ein Blockdiagramm eines Kodierungssystems zur Verwendung beim Kodieren von Audiosignalen, die in analoger Form anfallen,
Fig 4 spektrale Darstellungen zur Erläuterung der Frequenzzusammensetzung un- terschiedlicher Datensymbole, wie sie durch die Ausführungsform nach Figur 3 kodiert sind;
Fig. 5 und 6 funktionale Blockdiagramme zur Erläuterung der Arbeitsweise der Ausfuh- rungsform nach Figur 3;
Fig. 7A bis 7C jeweils ein Fliessschema zur Erläuterung eines Software-Programmes, das in der Ausführungsform nach Figur 3 Anwendung findet,
<Desc/Clms Page number 6>
Fig. 7D und 7E jeweils ein Fliessschema zur Erläuterung eines alternativen Software-Program- mes, das in der Ausführungsform nach Figur 3 Anwendung findet;
Fig. 7F eine graphische Darstellung, die eine lineare Näherung einer Einzelton-
Verdeckungsbeziehung zeigt,
Fig. 8 ein Blockdiagramm einer Kodierungsvorrichtung, die eine analoge Schaltungs- technik verwendet;
Fig. 9 ein Blockdiagramm eines Schaltkreises zur Bestimmung eines Gewichtsfak- tors in der Ausführungsform nach Figur 8;
Fig. 10 ein funktionales Blockdiagramm einer Dekodierungsvorrichtung mit bestimm- ten Merkmalen der vorliegenden Erfindung;
Fig. 11 ein Blockdiagramm einer Dekodierungsvorrichtung gemäss einer Ausführungs- form einer vorliegenden Erfindung, wobei digitale Signalverarbeitung Anwen- dung findet;
Fig. 12A und 12B jeweils ein Fliessschema zur Beschreibung der Arbeitsweise der Dekodie- rungsvorrichtung nach Figur 11;
Fig 13 ein funktionales Blockdiagramm eines Dekodierers gemäss bestimmter Ausfüh- rungsformen der vorliegenden Erfindung;
Fig. 14 ein Blockdiagramm einer Ausführungsform eines analogen Dekodierers ge- mäss der vorliegenden Erfindung ;
Fig. 15 ein Blockdiagramm eines Komponentendetektors nach der Ausführungsform nach Figur 14 ; Fig. 16 und 17 jeweils ein Blockdiagramm einer Vorrichtung gemäss einer Ausführungsform der vorliegenden Erfindung mit einem System zum Erzeugen von Schätzwer- ten der Zuhörerschaft für weithin ausgesendete Informationen.
Kodierung
Die vorliegende Erfindung setzt Techniken zum Einfügen von Kodes in Audiosignale ein, um die Wahrscheinlichkeit zu optimieren, dass die Information in den Kodes aus den Signalen akkurat wiedergewonnen wird, wobei sichergestellt wird, dass die Kodes für das menschliche Ohr unhörbar sind, wenn das kodierte Audiosignal als Ton wiedergegeben wird, selbst wenn die Frequenzen der Kodes in den hörbaren Frequenzbereich fallen
Zunächst auf Figur 1 bezugnehmend, ist ein funktionales Blockdiagramm eines Kodierers ge- mäss einem Aspekt der vorliegenden Erfindung erläutert.
Ein zu kodierendes Audiosignal wird an einem Eingangsanschluss 30 aufgenommen. Das Au- diosignal kann beispielsweise ein über das Radio zu sendendes Programm, den Tonbereich einer Fernsehsendung, eine musikalische Komposition oder jegliche andere Art eines in gewisser Weise aufzunehmenden Audiosignals darstellen. Das Audiosignal kann auch eine private Kommunikation, beispielsweise ein Telefongespräch, oder auch irgendeine Art von persönlicher Aufzeichnung sein.
Dies sind selbstverständlich nur Beispiele für die Anwendbarkeit der vorliegenden Erfindung und stellen keinerlei Absicht zur Beschränkung des Schutzbereichs der Erfindung dar.
Wie durch den funktionalen Block 34 in Fig. 1 angegeben, wird die Eignung einer oder mehre- rer Komponenten des empfangenen Audiosignals zum Verdecken von Tönen, die Frequenzen haben, die denen der Kode-Frequenzkomponente oder-komponenten entsprechen, die dem Audiosignal zugefügt werden sollen, bewertet.
Hierbei können mehrere Bewertungen für eine einzelne Kode-Frequenz ausgeführt werden, es kann eine getrennte Bewertung für jede aus einer Anzahl von Kode-Frequenzen ausgeführt werden, es können mehrere Bewertungen für jede aus einer Anzahl von Kode-Frequenzen oder auch eine oder mehrere gemeinsame Bewertungen für mehrere Kode-Frequenzen oder auch schliesslich eine Kombination von mehreren der vorange- henden Möglichkeiten durchgeführt werden Jede Bewertung wird auf der Grundlage der Frequenz von der oder den Kodekomponenten, die verdeckt werden sollen, und der Frequenz oder der Frequenzen der Audiosignalkomponente bzw-komponenten, deren Abdeckungseigenschaften bewertet werden, durchgeführt.
Weiterhin werden, wenn die Kodekomponente und die verdecken- de Audiokomponente bzw.-komponenten nicht in im wesentlichen gleichzeitige Signalintervalle fallen, so dass sie als Töne zu wesentlich unterschiedlichen Zeitintervallen wiedergegeben würden,
<Desc/Clms Page number 7>
die Auswirkungen der Unterschiede in den Signalintervallen zwischen der Kodekomponente oder den-komponenten verdeckt, und die verdeckende Programmkomponente oder die-komponenten werden ebenfalls in Betracht gezogen.
Vorzugsweise werden bei bestimmten Ausführungsformen mehrfache Bewertungen für jede einzelne Kodekomponente durchgeführt, indem die Eignung unterschiedlicher Abschnitte des Audiosignals zum Verdecken einer jeder Kodekomponente getrennt betrachtet wird. In einer Aus- führungsform wird die Eignung einer jeden aus einer Anzahl von im wesentlichen einzelnen Ton- Audiosignalkomponenten zum Verdecken einer Kodekomponente auf der Grundlage der Frequenz der Audiosignalkomponente, ihrer "Amplitude" (wie nachfolgend definiert) und des in bezug auf die Kodekomponente relevanten Timings bewertet, wobei dieses Verdecken nachfolgend als "tonales Verdecken" bezeichnet wird.
Die Bezeichnung "Amplitude" wird hierbei für irgendeinen Signalwert oder für Werte verwendet, die zur Bewertung der Verdeckungseignung verwendet werden können, um die Grösse einer Kode- komponente auszuwählen, um ihr Vorhandensein in einem reproduzierten Signal zu detektieren, oder in sonstiger Weise, einschliesslich für Werte wie beispielsweise Signalenergie, Leistung, Spannung, Stromstärke, Intensität und Druck, unabhängig davon, ob die Messung auf einer abso- luten oder relativen oder auf einer momentanen Sammelwertbasis erfolgt. Je nachdem wie es am günstigsten ist, kann die Amplitude als Fenstermittelwert, arithmetischer Mittelwert, durch Integrati- on, als RMS-Wert (Route-Mean-Square-Mittelwert), als Sammelwert von absoluten oder relativen diskreten Werten oder in sonstiger Weise gemessen werden.
In anderen Ausführungsformen wird zusätzlich oder alternativ zu tonalen Verdeckungsbewer- tungen die Eignung von Audiosignalkomponenten innerhalb eines relativ schmalen Frequenzban- des, das genügend nahe an einer gegebenen Kodekomponente liegt, zum Verdecken der Kompo- nente bewertet (dies wird nachfolgend als Schmalbandverdeckung bezeichnet) In weiteren Aus- führungsformen wird die Eignung mehrfacher Kodekomponenten innerhalb eines relativ breiten Frequenzbandes zum Verdecken der Komponente bewertet. Je nachdem wie es notwendig oder zweckmässig ist, wird die Eignung von Programmaudiokomponenten in Signalintervallen, die einer oder mehreren gegebenen Komponente vorausgehen oder folgen, zum Verdecken dieser Kompo- nenten auf einer nicht simultanen Basis bewertet.
Diese Art der Bewertung ist besonders zweck- mässig, wenn Audiosignalkomponenten in einem gegebenen Signalintervall unzureichend grosse Amplituden aufweisen, um das Einfügen von Kodekomponenten mit genügend grossen Amplituden in dasselbe Signalintervall zu ermöglichen, so dass sie vom Rauschen unterscheidbar sind.
Vorzugsweise wird eine Kombination von zwei oder mehreren tonalen Verdeckungseignungen, von Schmalband-Verdeckungseignungen und von Breitband-Verdeckungseignungen (und, wenn nötig oder zweckmässig, von nicht simultanen Verdeckungseignungen) für mehrfache Kodekompo- nenten bewertet. Wenn Kodekomponenten hinsichtlich ihrer Frequenz genügend nah beieinander liegen, brauchen keine getrennten Bewertungen für jede einzelne ausgeführt werden.
In bestimmten weiteren bevorzugten Ausführungsformen wird eine gleitende tonale Analyse ausgeführt anstelle von getrennten tonalen, Schmalband- und Breitband-Analysen, wobei die Not- wendigkeit entfällt, das Programmaudiosignal als tonal, schmalbandig oder breitbandig zu klassifi- zieren.
Vorzugsweise erzeugt, wenn eine Kombination von Verdeckungseignungen bewertet wird, jede
Bewertung eine maximal zulässige Amplitude für eine oder mehrere Kodekomponenten, so dass durch Vergleich aller Bewertungen, die durchgeführt worden sind und die sich auf eine gegebene
Komponente beziehen, eine maximale Amplitude ausgewählt werden kann, die daher gewährlei- stet, dass jede Komponente durch das Audiosignal verdeckt wird, wenn dieses als Ton wiederge- geben wird, so dass sämtliche Komponenten für das menschliche Gehör unhörbar werden. Durch
Maximieren der Amplitude einer jeden Komponente wird in ähnlicher Weise die Wahrscheinlichkeit maximiert, dass ihr Vorhandensein auf der Basis ihrer Amplitude detektiert wird.
Es ist natürlich nicht wesentlich, dass die maximal mögliche Amplitude verwendet wird, da es beim Dekodieren lediglich nötig ist, dass man in der Lage ist, eine ausreichend grosse Anzahl von Kodekomponenten von Audiosignalkomponenten und anderem Rauschen zu unterscheiden.
Die Ergebnisse der Bewertungen werden ausgegeben, wie in Fig. 1 mit 36 bezeichnet, und einem Kode-Generator 40 zur Verfügung gestellt. Die Kode-Erzeugung kann auf viele unterschied- liche Weisen geschehen. Eine besonders vorteilhafte Technik weist einem jeden aus einer Anzahl
<Desc/Clms Page number 8>
von Datenzuständen oder Symbolen einen eindeutigen Satz von Kode-Frequenzkomponenten zu, so dass wahrend eines gegebenen Zeitintervalls ein entsprechender Datenzustand durch das Vorhandensein seines entsprechenden Satzes von Kode-Frequenzkomponenten dargestellt wird.
In dieser Weise wird eine Interferenz mit der Kode-Erfassung durch Audiosignalkomponenten vermindert, da in einem vorteilhaft hohen Prozentsatz von Signalintervallen eine ausreichend grosse Anzahl von Kodekomponenten trotz einer Interferenz des Programmaudiosignals mit der Detektion weiterer Komponenten detektierbar ist. Darüber hinaus wird der Implementierungsvor- gang der Verdeckungsbewertungen vereinfacht, wenn die Frequenzen der Kodekomponenten bekannt sind, bevor sie erzeugt werden.
Es können auch andere Formen der Codierung eingesetzt werden Beispielsweise konnen Frequenzumtastung (frequency shift keying, FSK), Frequenzmodulation (FM), Frequenzspringen, Kodierung durch Auffächern des Spektrums sowie Kombinationen der vorgenannten Techniken verwendet werden. Weitere Kodierungstechniken, die bei der Ausführung der vorliegenden Erfin- dung eingesetzt werden können, werden aus der vorliegenden Beschreibung deutlich.
Die zu kodierenden Daten werden an einem Eingang 42 des Kode-Erzeugers 40 aufgenom- men, der hierauf durch Erzeugen einer eindeutigen Gruppe von Kode-Frequenzkomponenten und durch Zuweisen einer Amplitude an jede einzelne anspricht, auf der Grundlage der vom Ausgang 36 erhaltenen Bewertungen. Die Kode-Frequenzkomponenten, die auf diese Weise erzeugt wer- den, werden zu einem ersten Eingang einer Summierschaltung 46 gegeben, die das zu kodierende Audiosignal an einem zweiten Eingang erhält. Die Schaltung 46 addiert die Kode-Frequenzkom- ponenten zu dem Audiosignal und gibt ein kodiertes Audiosignal an einen Ausgangsanschluss 50.
Die Schaltung 46 kann entweder eine analoge oder eine digitale Summierschaltung sein, was von der Form der an die Schaltung gelangenden Signale abhängt. Die Summierfunktion kann auch softwaremässig bereitgestellt werden, und wenn dies der Fall ist, kann auch ein digitaler Prozessor, der zur Ausführung der Verdeckungsbewertung und zur Erzeugung des Kodes verwendet wird, auch dazu verwendet werden, den Kode zum Audiosignal zu addieren. In einer anderen Ausfüh- rungsform wird der Kode in Form von Zeitbereichsdaten in digitaler Form bereitgestellt, die dann zu Audio-Zeitbereichsdaten addiert werden.
In einer weiteren Ausführungsform wird das Audiosignal in den Frequenzbereich in digitaler Form gewandelt und zum Kode addiert, der in ähnlicher Weise in Form von digitalen Frequenzbereichsdaten dargestellt ist In den meisten Anwendungen werden dann die summierten Frequenzbereichsdaten in Zeitbereichsdaten umgewandelt.
Aus den folgenden Ausführungen wird deutlich, dass die Verdeckungsbewertung wie auch
Funktionen zum Erzeugen der Kodes entweder durch digitale oder durch analoge Vorgehensweise oder auch durch Kombinationen von digitaler und analoger Vorgehensweise ausgeführt werden können. Weiterhin kann das Audiosignal, obwohl es in analoger Form am Eingangsanschluss 30 aufgenommen und in analoger Form von der Schaltung 46, wie in Fig. 1 dargestellt ist, zu den
Kodekomponenten addiert werden kann, in einer alternativen Ausführungsform in digitale Form umgewandelt werden, wenn es aufgenommen wird, dann zu den Kodekomponenten in digitaler
Form addiert werden und entweder in digitaler oder in analoger Form ausgegeben werden.
Bei- spielsweise kann ein Signal in digitaler Form ausgegeben werden, wenn es auf einer Kompakt-
Disc oder auf einem digitalen Audioband aufgenommen werden soll, während es in analoger Form ausgegeben werden kann, wenn es mit herkömmlichen Rundfunk- oder Fernsehtechniken ausge- strahlt werden soll. Zahlreiche weitere Kombinationen von analoger und digitaler Vorgehensweise können ebenfalls eingesetzt werden.
In bestimmten Ausführungsformen sind die Kodekomponenten von nur einem Kode-Symbol gleichzeitig in dem Audiosignal enthalten. In anderen Ausführungsformen können indessen die
Komponenten von mehrfachen Kode-Symbolen gleichzeitig im Audiosignal enthalten sein. In bestimmten Ausführungsformen belegen beispielsweise die Komponenten eines Symbols ein
Frequenzband und die eines weiteren ein zweites Frequenzband gleichzeitig In einer alternativen
Ausführungsform können sich die Komponenten eines Symbols in dem gleichen Frequenzband wie ein weiteres oder in einem überlappenden Band befinden, solange ihre Komponenten unterscheid- bar sind, beispielsweise indem unterschiedliche Frequenzen oder Frequenzintervalle zugewiesen werden.
Eine Ausführungsform eines digitalen Kodierers ist in Fig. 2 erläutert. In dieser Ausführungs- form hegt ein Audiosignal in analoger Form an einem Eingangsanschluss 60 an und wird durch
<Desc/Clms Page number 9>
einen A/D-Wandler 62 in digitale Form umgewandelt. Das digitale Audiosignal wird zur Verdek- kungsbewertung bereitgestellt, wie funktionell durch den Block 64 angegeben, worauf dann das digitalisierte Audiosignal in Frequenzkomponenten aufgeteilt wird, beispielsweise durch Fast Fourier Transform (FFT), Wellenumformung (wavelet transform) oder eine andere Transformierung vom Zeit- in den Frequenzbereich oder auch durch digitale Filterung.
Anschliessend werden die Verdeckungseignungen von Audiosignal-Frequenzkomponenten innerhalb von interessierenden Frequenzbereichen hinsichtlich ihrer tonalen Verdeckungseignung, ihrer Schmalband-Verdek- kungseignung und Breitband-Verdeckungseignung bewertet (und zusätzlich, falls nötig oder zweckmässig, hinsichtlich der nicht simultanen Verdeckungseignung).
Alternativ werden die Verdek- kungseignungen von Audiosignal-Frequenzkomponenten innerhalb von interessierenden Fre- quenzbereichen mit einer gleitenden tonalen Analyse bewertet
Zu kodierende Daten liegen am Eingangsanschluss 68 an, wobei für jeden Datenzustand, der einem gegebenen Signalintervall entspricht, die jeweilige Gruppe von Kodekomponenten erzeugt wird, wie durch den funktionalen Block 72 zur Signalerzeugung angedeutet, und einer Niveauein- stellung unterworfen wird, wie durch den Block 76 angedeutet, der auch mit den relevanten Ver- deckungsbewertungen versorgt wird. Die Signalerzeugung kann beispielsweise auch durch Spei- cherung einer jeden der Kode-Komponenten in einer Suchtabelle als Zeitbereichsdaten oder durch Interpolation von gespeicherten Daten implementiert werden.
Die Kodekomponenten konnen entweder dauerhaft gespeichert sein oder bei der Initialisierung des Systems nach Fig. 2 erzeugt und dann in einem Speicher gespeichert werden, beispielsweise in einem RAM, um ansprechend auf einen Dateneingang am Anschluss 68 ausgegeben zu werden. Die Werte der Komponenten konnen auch jeweils zu dem Zeitpunkt berechnet werden, in dem sie erzeugt werden.
Die Niveaueinstellung wird für jede der Kodekomponenten auf der Grundlage der relevanten Verdeckungsbewertungen durchgeführt, wie vorstehend erläutert, wobei die Kodekomponenten, deren Amplitude so eingestellt ist, dass gewährleistet ist, dass sie unhörbar sind, zu dem digitalisier- ten Audiosignal addiert werden, wie durch das Summenzeichen 80 angegeben. In Abhängigkeit von der Zeitdauer, die erforderlich ist, um die vorstehend genannten Vorgänge auszuführen, kann es sinnvoll sein, das digitale Audiosignal zu verzögern, wie mit 82 angegeben, indem es zeitweise in einem Speicher zwischengespeichert wird.
Wenn das Audiosignal nicht verzögert wird, werden die hinsichtlich ihrer Amplitude eingestellten Kodekomponenten nach der Ausführung der FFT und einer Verdeckungsbewertung für ein erstes Intervall des Audiosignals zu einem zweiten Intervall des Audiosignals, das auf das erste Intervall folgt, hinzuaddiert.
Wenn das Audiosignal allerdings verzögert wird, können die hinsichtlich ihrer Amplitude eingestellten Kodekomponenten statt des- sen zum ersten Intervall addiert werden, und es kann auf diese Weise eine gleichzeitige Verde- ckungsbewertung eingesetzt werden Wenn der Abschnitt des Audiosignals während des ersten Intervalls eine grössere Verdeckungseignung für eine während des zweiten Intervalls hinzugefügte Kodekomponente besitzt als der Abschnitt des Audiosignals während des zweiten Intervalls bezüg- lich der Kodekomponente während desselben Intervalls besitzen würde, kann darüber hinaus der Kodekomponente eine Amplitude auf der Grundlage der nicht gleichzeitigen Verdeckungseignun- gen des Abschnitts des Audiosignals während des ersten Intervalls zugewiesen werden.
Auf diese Weise können sowohl die gleichzeitige als auch die nicht gleichzeitige Verdeckungseigenschaften bewertet und eine optimale Amplitude einer jeden Kodekomponente auf der Grundlage der günsti- geren Bewertung zugewiesen werden.
Bei bestimmten Anwendungen, beispielsweise beim Rundfunk oder bei analogen Aufzeichnun- gen (beispielsweise auf einer herkömmlichen Bandkassette), wird das kodierte Audiosignal in digitaler Form durch einen Digital/Analog-Wandler (DAC) 84 in analoge Form umgewandelt. Wenn das Signal allerdings in digitaler Form weitergeleitet oder aufgezeichnet werden soll, kann der DAC
84 weggelassen werden.
Die unterschiedlichen, in Fig. 2 erläuterten Funktionen können beispielsweise durch einen digi- talen Signalprozessor oder durch einen Personalcomputer, eine Workstation, einen Grossrechner oder einen sonstigen digitalen Rechner implementiert werden.
Fig. 3 ist ein Blockdiagramm eines Codierungssystems zur Verwendung beim Kodieren von Audiosignalen, die in analoger Form anfallen, beispielsweise in einem herkömmlichen Rundfunk- studio. Im System nach Fig. 3 überwacht ein Hauptrechner 90, der beispielsweise ein Personal- computer sein kann, die Auswahl und die Erzeugung der Information, die zum Einfügen in ein
<Desc/Clms Page number 10>
analoges Audiosignal, das am Eingangsanschluss 94 anliegt, zu kodieren ist. Der Hauptrechner 90 ist an ein Tastenfeld 96 angeschlossen und mit einem Monitor 100, beispielsweise einem CRT- Monitor, verbunden, so dass ein Benutzer eine gewünschte Meldung auswählen kann, die zu kodie- ren ist, wobei er diese aus einem Menü von verfügbaren Meldungen auswählt, welches auf dem Monitor 100 angezeigt wird.
Eine typische, in einem Rundfunk-Audiosignal zu kodierende Meldung wäre beispielsweise eine Stations- oder Kanalkennungsinformation, eine Programm- oder Seg- mentinformation und/oder ein Zeitcode.
Sobald die gewünschte Meldung in den Hauptrechner 90 eingegeben ist, gibt dieser Daten, die die Symbole der Meldung darstellen, an einen digitalen Signalprozessor (DSP) 104 aus, der dann jedes Symbol, das er vom Hauptrechner 90 erhält, in Form eines eindeutigen Satzes von Kode- Signalkomponenten kodiert, wie nachfolgend noch beschrieben wird. In einer Ausführungsform erzeugt der Hauptprozessor einen Datenstrom mit vier Zuständen, d.h. einen Datenstrom, in dem jede Dateneinheit einen von vier unterschiedlichen Datenzuständen annehmen kann, von denen jeder ein eindeutiges Symbol darstellt, einschliesslich zweier Synchronisierungssymbole, die hierbei mit "E" und "S" bezeichnet sind, und zweier Meldungsinformationssymbole "1" und "0", von denen jedes jeweils einen binären Zustand darstellt.
Es kann allerdings eine beliebige Anzahl von unter- schiedlichen Datenzuständen verwendet werden und beispielsweise können anstelle von zwei Meldungsinformationssymbolen drei Datenzustände durch drei eindeutige Symbole dargestellt wer- den, wodurch es möglich ist, mit einem Datenstrom feststehender Grösse eine entsprechend grösse- re Informationsmenge zu transportieren.
Wenn beispielsweise das Programmaterial gesprochene Sprache darstellt, ist es vorteilhaft, ein Symbol während einer relativ längeren Zeitspanne zu übertragen als im Falle eines Programm- audiosignals mit einem wesentlich kontinuierlicheren Energiegehalt, um die natürlichen Pausen bzw. Lücken, die in gesprochener Sprache vorhanden sind, zu ermöglichen. Demgemäss wird die Anzahl der möglichen Meldungsinformationssymbole in vorteilhafter Weise vergrössert, um zu ermöglichen, dass der Informationsdurchsatz in diesem Fall genügend gross ist Für Symbole, die bis zu 5 Bits darstellen, erzeugen Symbolübertragungslängen von 2,3 und 4 Sekunden zuneh- mend grössere Wahrscheinlichkeiten einer korrekten Dekodierung.
In einigen solchen Ausführungs- formen wird ein Anfangssymbol ("E") dekodiert, wenn (i) die Energie in den FFT-Bereichen für dieses Symbol am grössten ist, (li) die durchschnittliche Energie minus der Standardabweichung der Energie für dieses Symbol grösser ist als die durchschnittliche Energie plus der durchschnittli- chen Standardabweichung der Energie für alle anderen Symbole, und (iii) die Form des zeitlichen Verlaufs der Energie für dieses Symbol im ganzen glockenförmig ist und an der zeitlichen Grenze zwischen Symbolen ihr Maximum erreicht.
In der Ausführungsform nach Fig. 3 antwortet der DSP 104, wenn er die Symbole einer gege- benen, zu kodierenden Meldung erhalten hat, durch Erzeugen eines eindeutigen Satzes von Kode- Frequenzkomponenten für jedes Symbol, den er am Ausgang 106 bereitstellt. Für jedes der vier Datensymbole S, E, 0 und 1 des oben beschriebenen, beispielhaften Datensatzes sind unter Bezugnahme auf Fig. 4 spektrale Diagramme angegeben Wie aus Fig. 4 hervorgeht, ist in dieser Ausführungsform das Symbol S durch eine eindeutige Gruppe von 10 Kode-Frequenzkomponen- ten f bis f10 dargestellt, die mit gleichen Frequenzintervallen in einem Bereich angeordnet sind, der sich von einem Frequenzwert von etwas über 2 kHz bis zu einem Frequenzwert etwas unterhalb von 3 kHz erstreckt.
Das Symbol E wird durch eine zweite, eindeutige Gruppe von 10 Kode- Frequenzkomponenten f11 bis f20 dargestellt, die im Frequenzspektrum mit gleichen Intervallen von einem ersten Frequenzwert von etwas über 2 kHz bis zu einem Frequenzwert von etwas weniger als 3 kHz angeordnet sind, wobei jede der Kodekomponenten f11 bis f20 einen eindeutigen Fre- quenzwert hat, der sich von allen anderen in der gleichen Gruppe wie auch von allen Frequenzen f1 bis f10 unterscheidet.
Das Symbol 0 wird durch eine weitere, eindeutige Gruppe von 10 Kode- Frequenzkomponenten f21 bis f30 dargestellt, die ebenfalls mit gleichen Frequenzintervallen von einem Wert etwas oberhalb von 2 kHz bis zu einem Wert von etwas weniger als 3 kHz angeordnet sind und von denen jede einen eindeutigen Frequenzwert hat, der sich von allen anderen in der gleichen Gruppe wie auch von allen Frequenzen f1 bis f20 unterscheidet. Schliesslich wird das Symbol 1 durch eine weitere, eindeutige Gruppe von 10 Kode-Frequenzkomponenten f31 bis f4o dargestellt, die ebenfalls mit gleichen Frequenzintervallen von einem Wert von etwas mehr als 2 kHz bis zu einem Wert von etwas weniger als 3 kHz angeordnet sind, so dass jede der Kompo-
<Desc/Clms Page number 11>
nenten f31 bis f4o einen eindeutigen Frequenzwert hat, der sich von jeder der übrigen Frequenz- komponenten f1 bis f40 unterscheidet.
Durch Verwendung von mehrfachen Kode-Frequenzkom- ponenten für jeden Datenzustand, so dass die Kodekomponenten eines jeden Zustands hinsichtlich der Frequenz im wesentlichen voneinander getrennt sind, ist es weniger wahrscheinlich, dass das Vorhandensein von Rauschen (wie beispielsweise Audiosignalkomponenten, die keine Codierung darstellen, oder anderes Rauschen) in einem gemeinsamen Detektionsband mit einer anderen Kodekomponente eines gegebenen Datenzustands mit der Detektion der übrigen Komponenten dieses Datenzustands interferiert.
In anderen Ausführungsformen ist es vorteilhaft, die Symbole durch mehrfache Frequenzkom- ponenten darzustellen, beispielsweise durch 10 Kode-Töne oder Frequenzkomponenten, die keinen gleichförmigen Abstand in der Frequenz aufweisen und die von Symbol zu Symbol nicht den gleichen Versatz haben. Wenn eine integrale Beziehung zwischen Kode-Frequenzen für ein Symbol durch Gruppieren der Töne vermieden wird, werden die Effekte von Zwischenfrequenz- überlagerungen und Raumauslöschungen, d.h. von Stellen, an denen Echos von Raumwänden mit korrekter Dekodierung interferieren, reduziert.
Die folgenden Sätze von Kodeton-Frequenzkomponenten für die vier Symbole (0,1, S und E) werden zum Vermindern der Effekte von Raumauslöschungen angegeben, wobei f1 bis f10 die jeweiligen Kode-Frequenzkomponenten eines jeden der vier Symbole bedeuten (ausgedrückt in Hertz):
EMI11.1
<tb> "0" <SEP> "1" <SEP> "S" <SEP> "E"
<tb>
<tb> f1 <SEP> 1046,9 <SEP> 1054,7 <SEP> 1062,5 <SEP> 1070,3
<tb>
<tb>
<tb> f2 <SEP> 1195,3 <SEP> 1203,1 <SEP> 1179,7 <SEP> 1187,5
<tb>
<tb>
<tb> f3 <SEP> 1351,6 <SEP> 1343,8 <SEP> 1335,9 <SEP> 1328,1
<tb>
<tb>
<tb> f4 <SEP> 1492,2 <SEP> 1484,4 <SEP> 1507,8 <SEP> 1500,0
<tb>
<tb>
<tb> f5 <SEP> 1656,3 <SEP> 1664,1 <SEP> 1671,9 <SEP> 1679,7
<tb>
<tb>
<tb> f6 <SEP> 1859,4 <SEP> 1867,2 <SEP> 1843,8 <SEP> 1851,6
<tb>
<tb>
<tb> f7 <SEP> 2078,1 <SEP> 2070,3 <SEP> 2062,5 <SEP> 2054,7
<tb>
<tb>
<tb> f8 <SEP> 2296,9 <SEP> 2289,1 <SEP> 2304,
7 <SEP> 2312,5
<tb>
<tb>
<tb> f9 <SEP> 2546,9 <SEP> 2554,7 <SEP> 2562,5 <SEP> 2570,3
<tb>
<tb>
<tb> f10 <SEP> 2859,4 <SEP> 2867,2 <SEP> 2843,8 <SEP> 2851,6
<tb>
Allgemein gesagt, variiert der spektrale Gehalt des Kodes in den oben angegebenen Beispie- len relativ wenig, wenn der DSP 104 seinen Ausgang von einem der Datenzustände S, E, 0 und 1 zu einem anderen hiervon umschaltet. Nach einem Aspekt der vorliegenden Erfindung ist bei bestimmten bevorzugten Ausführungsformen jede Kode-Frequenzkomponente eines jeden Sym- bols mit einer Frequenzkomponente eines jeden anderen Datenzustandes gepaart, so dass der Unterschied zwischen ihnen geringer ist als die kritische Bandbreite dafür.
Für ein beliebiges Paar reiner Töne ist die kritische Bandbreite ein Frequenzbereich, innerhalb dessen der Frequenzunter- schied zwischen den beiden Tönen verändert werden kann, ohne die Lautheit wesentlich zu erhö- hen Da der Frequenzabstand zwischen benachbarten Tönen im Falle eines jeden Datenzustands S, E, 0 und 1 der gleiche ist und da jeder Ton eines jeden Datenzustands S, E, 0 und 1 jeweils mit einem Ton eines jeden anderen davon gepaart ist, so dass der Unterschied der Frequenz dazwi- schen geringer ist als die kritische Bandbreite für dieses Paar, gibt es im wesentlichen keine Ver- änderung in der Lautheit beim Übergang von einem der Datenzustände S, E, 0 und 1 zu irgendei- nem anderen davon,
wenn sie als Ton reproduziert werden Darüberhinaus wird durch Minimieren des Frequenzunterschieds zwischen den Kodekomponenten eines jeden Paars die relative Wahr- scheinlichkeit der Detektierung eines jeden Datenzustands bei seinem Empfang nicht wesentlich durch die Frequenzeigenschaften des Übertragungswegs beeinflusst.
Ein weiterer Nutzen beim Paaren von Komponenten unterschiedlicher Datenzustände, so dass sie in der Frequenz relativ dicht beieinanderliegen, besteht darin, dass eine Verdeckungsbewertung, die für eine Kodekompo- nente eines ersten Datenzustands ausgeführt wird, für eine entsprechende Komponente eines nächsten Datenzustands im wesentlichen genau ist, wenn ein Umschalten der Zustände stattfindet
Alternativ wird aus dem nicht gleichmässigen Kodeton-Abstandsschema zur Minimierung der
<Desc/Clms Page number 12>
Effekte vom Raumauslöschungen deutlich, dass die für jede für der Kode-Frequenzkomponenten f1 bis f10 ausgewählten Frequenzen um eine Frequenz herum gruppiert sind, beispielsweise sind die Frequenzkomponenten für f11 fz und f3 in der Nähe von 1. 055 Hz, 1. 180 Hz und 1. 340 Hz angeord- net.
Insbesondere weisen bei dieser beispielhaften Ausführungsform die Töne einen gegenseitigen Abstand des zweifachen der FFT-Auflösung auf, wobei beispielsweise für eine Auflösung von 4 Hz die Töne im gegenseitigen Abstand von 8 Hz dargestellt sind und so gewählt sind, dass sie sich in der Mitte des Frequenzbereichs eines FFT-Bereichs befinden. Weiterhin wird die Reihenfolge der unterschiedlichen Frequenzen, die den Kode-Frequenzkomponenten f1 bis f10 zum Darstellen der unterschiedlichen Symbole 0,1, S und E zugewiesen sind, in jeder Gruppierung verändert. Bei- spielsweise entsprechen die Frequenzen, die für die Komponenten f1, f2 und f3 gewählt sind, den Symbolen (0,1, S, E), (S, E, 0,1) bzw. (E, S, 1,0) von der niedrigsten zur höchsten Frequenz, d.h (1046,9, 1054,7,1062,5, 1070,3), (1179,7, 1187,5,1195,3, 1203,1), (1328,1,1335,9, 1343,8, 1351,6).
Ein Vorteil dieser Anordnung besteht darin, dass selbst dann, wenn eine Raumauslö- schung auftritt, die mit dem korrekten Empfang einer Kodekomponente interferiert, im allgemeinen der gleiche Ton aus jedem der Symbole eliminiert wird, so dass es leichter ist, ein Symbol von den übrigen Komponenten zu dekodieren. Im Gegensatz dazu ist es schwieriger, das Symbol korrekt zu dekodieren, wenn eine Raumauslöschung eine Komponente von einem Symbol eliminiert, aber nicht von einem anderen Symbol.
In einer alternativen Ausführungsform können entweder mehr oder weniger als vier separate Datenzustände oder Symbole für die Kodierung verwendet werden. Auch kann jeder Datenzustand oder jedes Symbol durch mehr oder weniger als 10 Kodetöne dargestellt werden, und obwohl es bevorzugt wird, dass die gleiche Anzahl von Tönen zur Darstellung eines jeden Datenzustands verwendet wird, ist es nicht in jeder Anwendung wesentlich, dass die Anzahl der Kodetöne, die zur Darstellung eines jeden Datenzustands verwendet werden, die gleiche ist. Vorzugsweise unter- scheidet sich jeder der Kodetöne in seiner Frequenz von allen anderen Kodetönen, um die Wahr- scheinlichkeit zu maximieren, dass jeder der Datenzustände beim Dekodieren unterschieden wer- den kann.
Es ist allerdings nicht in allen Anwendungen wesentlich, dass keine der Frequenzen der Kodetöne bei zwei oder mehr Datenzuständen gleich sind
Fig. 5 ist ein funktionales Blockdiagramm, auf das bei der Erklärung der Kodierungsfunktion, die in der Ausführungsform nach Fig. 3 erfolgt, Bezug genommen wird. Wie oben erwähnt, erhält der DSP 104 Daten vom Hauptprozessor 90, die die Folge von Datenzuständen, die durch den DSP 104 jeweils als Gruppen von Kode-Frequenzkomponenten abzugeben sind, bezeichnen. Vor- zugsweise erzeugt der DSP 104 eine Suchtabelle von Zeitbereichsdarstellungen für jede der Kode- Frequenzkomponenten f1 bis f4o, die er dann in seinem RAM speichert, der durch den Speicher 110 in Fig. 5 dargestellt wird.
Ansprechend auf die vom Hauptrechner 90 erhaltenen Daten erzeugt der DSP 104 eine jeweilige Adresse, die er auf eine Adresseneingabe vom Speicher 110, in Fig. 5 mit
112 bezeichnet, anwendet, um den Speicher 110 zur Ausgabe von Zeitbereichsdaten für jede der
10 Frequenzkomponenten zu veranlassen, die dem zu diesem Zeitpunkt auszugebenden Datenzu- stand entsprechen.
Unter weiterer Bezugnahme auf Fig. 6, die ein funktionales Blockdiagramm zur Erläuterung be- stimmter durch den DSP 104 ausgeführter Operationen zeigt, speichert der Speicher 110 eine
Folge von Zeitbereichswerten für jede der Frequenzkomponenten eines jeden Symbols S, E, 0 und
1. In dieser speziellen Ausführungsform wird eine ausreichend grosse Anzahl von Zeitbereichssig- nalen, da die Kode-Frequenzkomponenten im Bereich von etwa 2 kHz bis hin zu etwa 3 kHz lie- gen, für jede der Frequenzkomponenten f1 bis f40 im Speicher 110 gespeichert, so dass sie mit einer grösseren Geschwindigkeit ausgegeben werden können, als die Nyquist-Frequenz der Kodekom- ponente mit der höchsten Frequenz ist.
Die Zeitbereichs-Kodekomponenten werden mit einer entsprechend grossen Geschwindigkeit aus dem Speicher 110 ausgegeben, der die Zeitbereichs- komponenten für jede der Kode-Frequenzkomponenten, die eine vorbestimmte Zeitdauer darstel- len, speichert, so dass (n) Zeitbereichskomponenten für jede der Kode-Frequenzkomponenten f1 bis f40 für (n) Zeitintervalle t1 bis tn gespeichert werden, wie Fig. 6 zeigt. Wenn beispielsweise das
Symbol S während eines gegebenen Signalintervalls während des ersten Intervalls t1 zu kodieren ist, gibt der Speicher 110 die Zeitbereichskomponenten f1 bis f10. die diesem Intervall entsprechen, aus, so wie sie im Speicher 110 gespeichert sind. Während des nächsten Intervalls werden die
Zeitbereichskomponenten f1 bis f10 für das Intervall t2 vom Speicher 110 ausgegeben.
Dieser
<Desc/Clms Page number 13>
Vorgang setzt sich sequenziell für die Intervalle t3 bis tn und zurück bis t1 fort, bis die Zeitdauer des kodierten Symbols S abgelaufen ist.
Bei bestimmten Ausführungsformen werden anstelle einer Ausgabe aller 10 Kodekomponen- ten, d.h. beispielsweise f1 bis f10. während eines Zeitintervalls nur solche Kodekomponenten aus- gegeben, die innerhalb der kritischen Bandbreite der Töne des Audiosignals liegen. Dies ist eine im allgemeinen konservative Vorgehensweise, um die Unhörbarkeit der Kodekomponenten sicherzu- stellen.
Es sei nochmals auf Fig. 5 Bezug genommen. Der DSP 104 dient auch dazu, die Amplituden der Zeitbereichskomponenten, die vom Speicher 110 ausgegeben werden, einzustellen, so dass die Kode-Frequenzkomponenten, wenn sie als Ton wiedergegeben werden, durch die Komponenten des Audiosignals, in das sie eingefügt sind, verdeckt werden, so dass sie für das menschliche Gehör unhörbar sind. Folglich wird der DSP 104 auch mit dem am Eingangsanschluss 94 anliegen- den Audiosignal versorgt, nachdem dies in geeigneter Weise gefiltert und von der analogen in digitale Form umgewandelt ist.
Insbesondere weist der Kodierer nach Fig. 3 ein analoges Bandfilter 120 auf, welches dazu dient, Audiosignal-Frequenzkomponenten im wesentlichen zu entfernen, die sich ausserhalb eines Bandes befinden, das für die Bewertung der Verdeckungseignung des aufge- nommenen Audiosignals von Interesse ist und das sich in der vorliegenden Ausführungsform von etwa 1,5 kHz bis etwa 3,2 kHz erstreckt. Das Filter 120 dient weiterhin zur Entfernung von Hoch- frequenzkomponenten aus dem Audiosignal, die Bandüberlappungs- bzw. Aliasing-Effekte verur- sachen könnten ; das Signal anschliessend durch einen Analog-Digital-Wandler (A/D) 124 digitalisiert wird, der mit einer ausreichend grossen Abtastfrequenz arbeitet.
Wie aus Fig. 3 hervorgeht, wird das digitalisierte Audiosignal durch den A/D-Wandler 124 zum DSP 104 gegeben, wo das Programmaudiosignal, wie in Fig. 5 mit 130 bezeichnet, einer Fre- quenzbereichstrennung unterworfen wird. In dieser speziellen Ausführungsform wird die Frequenz- bereichstrennung als schnelle Fourier-Transformation (FFT) ausgeführt, die periodisch mit oder ohne zeitweiser Überlappung durchgeführt wird, um aufeinanderfolgende Frequenzbereiche zu erzeugen, die jeweils eine vorbestimmte Frequenzbreite aufweisen. Zur Absonderung der Fre- quenzkomponenten des Audiosignals stehen weitere Techniken zur Verfügung, beispielsweise die Wellentransformation (wavelet-transform), die diskrete Walsh-Hadamard-Transformation, die diskrete Hadamard-Transformation, die diskrete Kosinus-Transformation sowie unterschiedliche digitale Filterungstechniken.
Wenn der DSP 104 die Frequenzkomponenten des digitalisierten Audiosignals in die aufeinan- derfolgenden Frequenzbereiche aufgeteilt hat, wie oben erläutert, kommt er zur Bewertung der Eignung von verschiedenen, im Audiosignal vorhandenen Frequenzkomponenten hinsichtlich der Verdeckung der unterschiedlichen Kodekomponenten, die vom Speicher 110 ausgegeben werden, und zur Erzeugung jeweiliger Amplituden-Einstellfaktoren, die dazu dienen, die Amplituden der unterschiedlichen Kode-Frequenzkomponenten so einzustellen, dass sie durch das Programm- Audiosignal verdeckt werden, wenn sie als Ton wiedergegeben werden, damit sie für das mensch- liche Gehör unhörbar sind. Diese Vorgänge sind in Fig. 5 durch Block 134 dargestellt.
Für Audiosignalkomponenten, die im wesentlichen simultan mit den Kode-Frequenzkompo- nenten sind, die sie verdecken sollen (wobei sie aber den Kode-Frequenzkomponenten um eine kurze Zeitspanne vorausgehen), wird die Verdeckungseignung der Programmaudiokomponenten auf einer tonalen Basis bewertet, wie auch auf einer Schmalband-Verdeckungsbasis und auf einer
Breitband-Verdeckungsbasis, wie nachfolgend beschrieben wird. Für jede Kode-Frequenzkompo- nente, die zu einem gegebenen Zeitpunkt vom Speicher 110 ausgegeben wird, wird eine tonale Verdeckungseignung für jede aus einer Anzahl von Audiosignal-Frequenzkomponenten bewertet, auf der Grundlage des Energieniveaus in jedem der entsprechenden Bereiche, in den diese Kom- ponenten fallen, als auch auf der Grundlage der Frequenzbeziehung eines jeden Bereichs zur jeweiligen Kode-Frequenzkomponente.
Die Bewertung kann in jedem Fall (tonal, schmalbandig und breitbandig) die Form eines Amplitudeneinstellfaktors oder einer sonstigen Massnahme an- nehmen, wodurch es möglich ist, der Kodekomponente eine Amplitude zuzuweisen, so dass die
Kodekomponente durch das Audiosignal verdeckt wird. Alternativ kann die Bewertung eine gleiten- de tonale Analyse sein.
Im Falle der Schmalbandverdeckung wird in dieser Ausfuhrungsform fur jede betreffende
Kode-Frequenzkomponente der Energiegehalt von Frequenzkomponenten unterhalb eines vorbe-
<Desc/Clms Page number 14>
stimmten Niveaus innerhalb eines vorbestimmten Frequenzbands einschliesslich der entsprechen- den Kode-Frequenzkomponente bewertet, um eine separate Bewertung der Verdeckungseignung abzuleiten. Bei bestimmten Ausführungen wird die Möglichkeit der Schmalbandverdeckung auf der Basis des Energiegehalts von denjenigen Audiosignal-Frequenzkomponenten gemessen, die unterhalb des durchschnittlichen Energieniveaus des Bereichs innerhalb des vorbestimmten Fre- quenzbandes liegen.
Bei dieser Ausführung werden die Energieniveaus der Komponenten unter- halb der Energieniveaus der Komponenten, die unterhalb der Durchschnittsenergie des Bereichs (als Komponentenschwelle) liegen, aufsummiert, um ein schmalbandiges Energieniveau zu erzeu- gen, wobei ansprechend hierauf eine entsprechende Schmalband-Verdeckungsbewertung für die jeweilige Kodekomponente identifiziert wird. Stattdessen kann ein unterschiedliches Schmalband- Energieniveau erzeugt werden, indem eine andere Komponentenschwelle als das durchschnittliche Energieniveau ausgewählt wird. In anderen Ausführungsformen wird das durchschnittliche Ener- gieniveau sämtlicher Audiosignalkomponenten innerhalb des vorbestimmten Frequenzbandes als schmalbandiges Energieniveau verwendet, um der jeweiligen Kodekomponente eine Schmalband- Verdeckungsbewertung zuzuweisen.
In noch anderen Ausführungsformen wird stattdessen der gesamte Energiegehalt der Audiosignalkomponenten innerhalb des vorbestimmten Frequenzban- des verwendet, während bei anderen Ausführungsformen ein minimales Komponentenniveau innerhalb des vorbestimmten Frequenzbandes für diesen Zweck verwendet wird
Schliesslich wird bei bestimmten Ausführungsformen der Breitband-Energiegehalt des Audio- signals bestimmt, um die Eignung des Audiosignals zum Verdecken der jeweiligen Kode-Frequenz- komponente auf einer Breitband-Verdeckungsbasis zu bewerten. In dieser Ausführungsform basiert die Breitband-Verdeckungsbewertung auf dem minimalen Schmalband-Energieniveau, das im Verlaufe der oben beschriebenen Schmalband-Verdeckungsbewertungen gefunden wird.
Das heisst, dass wenn vier getrennte vorbestimmte Frequenzbänder im Verlaufe der oben beschriebenen Bewertung der Schmalbandverdeckung untersucht werden, und wenn Breitbandrauschen das minimale Schmalband-Energieniveau unter allen vier vorbestimmten Frequenzbändern (ganz gleich wie diese bestimmt worden sind) beinhaltet, dann wird dieses minimale Schmalband- Energieniveau mit einem Faktor multipliziert, der gleich dem Verhältnis des von allen vier schmalen Bändern aufgespannten Frequenzbereichs zur Bandbreite des vorbestimmten Frequenzbands mit dem minimalen Schmalband-Energieniveau ist. Das resultierende Produkt gibt ein zulässiges, gesamtes Kode-Leistungsniveau an.
Wenn dieses gesamte zulässige Kode-Leistungsniveau mit P bezeichnet wird und der Kode zehn Kodekomponenten beinhaltet, wird jeder ein Amplitudenein- stellfaktor zugewiesen, um ein Komponentenleistungsniveau zu erzielen, das um 10 dB geringer ist als P. In einer alternativen Ausführungsform wird das Breitbandrauschen für ein vorbestimmtes, relativ breites Band, das die Kodekomponenten umfasst, durch Auswählen einer der oben bespro- chenen Techniken zum Abschätzen des Schmalband-Energieniveaus berechnet, wobei aber stattdessen die Audiosignalkomponenten über das vorbestimmte, relativ breite Band hinweg ver- wendet werden. Wenn das Breitbandrauschen in der gewählten Weise bestimmt ist, wird jeder
Kodekomponente eine entsprechende Breitband-Verdeckungsbewertung zugewiesen.
Anschliessend wird der Amplitudeneinstellfaktor für jede Kode-Frequenzkomponente auf der
Grundlage ausgewählt, dass die tonale, die schmalbandige oder die breitbandige Verdeckungsbe- wertung das höchstzulässige Niveau der jeweiligen Komponente ergibt Dies maximiert die Wahr- scheinlichkeit dafür, dass jede Kode-Frequenzkomponente von Rauschen, das kein Audiosignal darstellt, unterschieden werden kann, während gleichzeitig sichergestellt wird, dass die jeweilige
Kode-Frequenzkomponente verdeckt wird, so dass sie durch das menschliche Gehör nicht wahrge- nommen werden kann.
Die Amplitudeneinstellfaktoren werden für jede der tonalen, schmalbandigen und breitbandigen Verdeckung auf der Grundlage der folgenden Faktoren und Umstände ausgewählt. Im Falle der tonalen Verdeckung werden die Faktoren auf der Grundlage der Frequenzen der Audiosignalkom- ponenten zugewiesen, deren Verdeckungseignungen gerade bewertet werden, und der Frequenz bzw. der Frequenzen der zu verdeckenden Kodekomponenten.
Darüber hinaus schafft ein gege- benes Audiosignal über irgendein ausgewähltes Intervall die Möglichkeit, eine gegebene Kode- komponente innerhalb desselben Intervalls (d. h. simultanes Verdecken) mit einem maximalen
Niveau zu verdecken, das grösser ist als das, mit dem das gleiche Audiosignal über dem gewählten
Intervall in der Lage ist, die gleiche Kodekomponente, die vor oder nach dem gewählten Intervall
<Desc/Clms Page number 15>
auftritt (d.h nichtsimultanes Verdecken) zu verdecken. Die Bedingungen, unter denen das kodierte Audiosignal von einer Zuhörerschaft oder einer sonstigen Horergruppe wahrgenommen wird, je nachdem, werden bevorzugt ebenfalls in die Betrachtung eingezogen.
Wenn beispielsweise das Tonsignal einer Fernsehsendung kodiert werden soll, werden vorzugsweise die Verzerrungseffekte einer typischen Hörumgebung in die Betrachtung einbezogen, da in derartigen Umgebungen bestimmte Frequenzen stärker gedämpft werden als andere. Aufnahme- und Wiedergabegeräte (wie beispielsweise graphische Equalizer) können ähnliche Effekte verursachen. Mit der Umge- bung und mit der technischen Ausrüstung zusammenhängende Effekte können dadurch kompen- siert werden, dass Einstellfaktoren mit genügend geringer Amplitude gewählt werden, um zu ge- währleisten, dass ein Verdecken unter den erwarteten Bedingungen stattfindet.
In bestimmten Ausführungsformen wird nur entweder die tonale oder die schmalbandige oder aber die breitbandige Verdeckungseignung bewertet. In anderen Ausführungsformen werden zwei dieser unterschiedlichen Arten der Verdeckungseignung bewertet, wogegen in noch anderen Ausführungsformen alle drei verwendet werden.
In bestimmten Ausführungsformen wird eine gleitende tonale Analyse verwendet, um die Ver- deckungseignung des Audiosignals zu bewerten. Eine gleitende tonale Analyse genügt im allge- meinen den Verdeckungsmassstäben für Schmalbandrauschen, Breitbandrauschen und einzelne Töne, ohne dass eine Klassifizierung des Audiosignals erforderlich ist. Bei der gleitenden tonalen Analyse wird das Audiosignal als Satz diskreter Töne angesehen, die jeweils in einem FFT- Frequenzbereich zentriert sind. Im allgemeinen wird bei der gleitenden tonalen Analyse zunächst die Leistung des Audiosignals in jedem FFT-Bereich berechnet.
Dann werden für jeden Kodie- rungston die Verdeckungswirkungen der diskreten Töne des Audiosignals in jedem FFT-Bereich, der in der Frequenz von solchen Kodierungstönen um nicht mehr als die kritische Bandbreite des Audiotons getrennt ist, auf der Grundlage der Audiosignalleistung in jedem derartigen Bereich bewetet, wobei die Verdeckungsbeziehungen für Einzeltonverdeckung verwendet werden Die Verdeckungswirkungen aller relevanter diskreter Töne des Audiosignals werden für jeden Kodie- rungston aufsummiert und dann entsprechend der Anzahl von Tönen innerhalb der kritischen Bandbreite der Audiosignaltöne und der Komplexität des Audiosignals eingestellt.
Wie nachfolgend beschrieben wird, basiert die Komplexität des Programmmaterials in bestimmten Ausführungsfor- men empirisch auf dem Verhältnis der Leistung in den relevanten Tönen des Audiosignals und der Wurzel aus der Summe der Quadrate der Leistungen in diesen Audiosignaltönen. Die Komplexität dient zur Berücksichtigung der Tatsache, dass das Schmalbandrauschen und das Breitbandrau- schen jeweils wesentlich bessere Verdeckungswirkungen besitzen als man sie aus einer einfachen Addition der Töne erhält, die zur Abbildung des schmalbandigen und breitbandigen Rauschens verwendet werden.
Bei bestimmten Ausführungsformen, bei denen eine gleitende tonale Analyse verwendet wird, wird eine vorbestimmte Anzahl von Abtastwerten des Audiosignals zunächst einer umfangreichen FFT unterworfen, die eine grosse Auflösung bringt, aber eine längere Verarbeitungszeit erfordert Anschliessend werden aufeinanderfolgende Abschnitte der vorbestimmten Anzahl von Abtastwerten einer relativ weniger umfangreichen FFT unterworfen, die schneller ist, aber eine geringere Auflo- sung bringt Die aufgrund der umfangreichen FFT bestimmten Amplitudenfaktoren werden mit denen zusammengeführt, die mit denen aus den weniger umfangreichen FFTs resultieren, was im allgemeinen einer zeitlichen Gewichtung der umfangreichen FFT mit einer höheren "Frequenzge- nauigkeit" durch die grössere "Zeitgenauigkeit" der weniger umfangreichen FFT entspricht.
In der Ausführungsform nach Fig. 5 stellt der DSP 104 die Amplitude einer jeden Kode- Frequenzkomponente entsprechend ein, wie durch den funktionalen Block "Amplitudeneinstellung"
114 angegeben ist, sobald ein geeigneter Amplitudeneinstellfaktor für jede der Kode-Frequenz- komponenten, die vom Speicher 110 ausgegeben werden, ausgewählt worden ist. Bei anderen Ausführungsformen wird jede Kode-Frequenzkomponente anfänglich erzeugt, so dass ihre Amplitu- de dem jeweiligen Einstellfaktor entspricht.
Unter Bezugnahme auch auf Fig. 6 werden bei dem Amplitudeneinstellvorgang des DSP 104 bei dieser Ausführungsform die zehn, die aus den Werten fi bis f40 der Kode-Frequenzkomponenten im Zeitbereich fur das aktuelle Zeitintervall t1 bis tn aus- gewählt sind, mit einem jeweiligen Amplitudeneinstellfaktor GA1 bis GA10 multipliziert, und anschlie- #end addiert der DSP 104 die hinsichtlich ihrer Amplitude eingestellten Zeitbereichskomponenten, um ein zusammengesetztes Kodesignal zu erzeugen, das an seinem Ausgang 106 bereitgestellt
<Desc/Clms Page number 16>
wird. Das zusammengesetzte Kodesignal wird, wobei auf Fig. 3 und 5 Bezug genommen sei, mit einem Digital/Analog-Wandler (DAG) 140 in analoge Form umgewandelt und an einen ersten Eingang einer Summierschaltung 142 gegeben.
Die Summierschaltung 142 erhält das Audiosignal vom Eingangsanschluss 94 an einem zweiten Eingang und addiert das zusammengesetzte, analo- ge Kodesignal zudem analogen Audiosignal und gibt ein kodiertes Audiosignal an einen Ausgang 146.
Bei (Radio-) Rundfunkanwendungen moduliert das kodierte Audiosignal eine Trägerwelle und wird dann abgestrahlt. Bei NTSC-Fernsehsendeanwendungen moduliert die kodierte Audiosignal- frequenz einen Unterträger und wird mit einem zusammengesetzten Videosignal gemischt, so dass das kombinierte Signal zum Modulieren eines Rundfunkträgers für die drahtlose Ausstrahlung verwendet wird. Diese Radio- und Fernsehsignale können selbstverständlich ebenfalls über Kabel (z. B. über herkömmliche oder über optische Faserkabel), über Satelliten oder in sonstiger Weise übertragen werden. Bei anderen Anwendungen kann das kodierte Audiosignal entweder für den Vertrieb in aufgezeichneter Form oder für eine anschliessende Sendung oder sonstige Weiter- verbreitung aufgezeichnet werden. Kodierte Audiosignale können auch für Punkt-zu-Punkt-Über- tragungen verwendet werden.
Es bieten sich hierbei zahlreiche andere Anwendungen sowie Sen- de- und Aufzeichnungstechniken an.
Fig. 7A bis 7C zeigen Ablaufpläne zur Erläuterung eines Softwareprogramms, das vom DSP 104 ausgeführt wird, um die Bewertung der oben beschriebenen tonalen, schmalbandigen und breitbandigen Bewertungsfunktionen zu implementieren. Fig. 7A zeigt eine Hauptschleife des Softwareprogramms des DSP 104. Das Programm wird durch einen Befehl vom Haupt- bzw.
Zentralrechner 90 initiiert (Schritt 150), worauf der DSP 104 seine Hardware-Register initialisiert (Schritt 152) und dann zu Schritt 154 geht, um ungewichtete Kodekomponentendaten im Zeitbe- reich zu berechnen, wie in Fig. 6 dargestellt, die dann im Speicher abgelegt werden, um nach Bedarf ausgelesen zu werden, um die Kodekomponenten im Zeitbereich zu erzeugen, wie oben erläutert. In einer alternativen Ausführungsform kann dieser Schritt weggelassen werden, wenn die Kodekomponenten permanent in einem ROM oder einem sonstigen nicht flüchtigen Speicher abgelegt werden. Es ist auch möglich, die Kodekomponentendaten bei Bedarf zu berechnen, wobei dies allerdings die benötigte Rechenleistung vergrössert.
Eine weitere Alternative besteht darin, ungewichtete Kodekomponenten in analoger Form zu erzeugen und dann die Amplituden der analogen Komponenten mittels Gewichtungsfaktoren einzustellen, die von einem digitalen Rechner erzeugt werden.
Wenn die Zeitbereichsdaten berechnet und gespeichert sind, übermittelt der DSP 104 in Schritt
156 eine Anforderung an den Hauptrechner 90, um eine nächste Meldung zu kodieren. Die Mel- dung besteht aus einer Kette von Zeichen, Integer-Zahlen oder einem sonstigen Satz von Daten- symbolen, die die von dem DSP 104 in einer durch die Meldung vorbestimmten Reihenfolge ab- zugebenden Kodekomponentengruppen eindeutig identifizieren.
In einer anderen Ausführungsform bestimmt der Hauptrechner in Kenntnis der Ausgangsdatenrate des DSP selbst, wann eine näch- ste Meldung an den DSP abzugeben ist, indem ein geeigneter Zeitgeber gesetzt wird und die
Meldung abgegeben wird, sobald ein Zustand eintntt, der einer Zeitüberschreitung entspricht Bei einer weiteren alternativen Ausführungsform wird ein Dekodierer mit dem Ausgang des DSP 104 gekoppelt, um die abgegebenen Kodekomponenten aufzunehmen, diese zu dekodieren und die
Meldung an den Hauptprozessor zurückzuleiten, wie sie vom DSP abgegeben wird, so dass der
Hauptrechner bestimmen kann, wann eine weitere Meldung an den DSP 104 abzugeben ist. In noch anderen Ausführungsformen werden die Funktionen des Hauptprozessors 90 und des DSP
104 von einem einzelnen Prozessor ausgeführt.
Sobald die nächste Meldung vom Hauptrechner empfangen worden ist, anschliessend an
Schritt 156, geht der DSP dazu über, die Kodekomponenten für jedes Symbol der Meldung in der richtigen Reihenfolge zu erzeugen und die kombinierten, gewichteten Kode-Frequenzkomponenten an seinem Ausgang 106 bereitzustellen.
Dieser Vorgang wird durch eine in Fig. 7A mit 160 bezeichnete Schleife dargestellt.
Nach dem Eintreten in die mit 160 bezeichnete Schleife aktiviert der DSP 104 Zeitgeberunter- brechungen 1 und 2 und geht dann in ein Unterprogramm "Berechnen der Gewichtsfaktoren", das in Zusammenhang mit den Ablaufplänen der Fig. 7B und 7C beschrieben wird. Es sei zunächst auf
Fig. 7B Bezug genommen. Nach dem Eintritt in das Unterprogramm 162 zum Berechnen der
<Desc/Clms Page number 17>
Gewichtsfaktoren bestimmt der DSP zunächst, ob eine ausreichende Anzahl von Abtastwerten des Audiosignals gespeichert sind, um zu ermöglichen, dass eine hochauflösende FFT durchgeführt wird, um den spektralen Gehalt des Audiosignals während eines am wenigstens lange zurücklie- genden, vorbestimmten Audiosignalintervalls zu analysieren, wie mit Schritt 163 bezeichnet.
Beim Anlaufen des Verfahrens müssen zunächst eine ausreichende Anzahl von Abtastwerten des Audio- signals angesammelt werden, um die FFT durchführen zu können. Wenn allerdings eine überlap- pende FFT verwendet wird, brauchen während aufeinanderfolgender Durchgänge durch die Schlei- fe entsprechend weniger Datenwerte gespeichert werden, bevor die nächste FFT ausgeführt wird.
Wie aus Fig. 7B hervorgeht, bleibt der DSP in einer kleinen Schleife am Schritt 163 und wartet auf die notwendige Ansammlung der Abtastwerte. Bei jeder Zeitgeberunterbrechung 1 liefert der A/D 124 einen neuen digitalisierten Abtastwert des Programmaudiosignals, das in einem Datenpuf- ferspeicher des DSP 104 angesammelt wird, wie durch das Unterprogramm 164 in Fig. 7A ange- deutet ist.
Sobald eine genügend grosse Anzahl von Datenwerten durch den DSP angesammelt ist, wobei erneut auf Fig. 7B Bezug genommen sei, geht die Verarbeitung weiter zu Schritt 168, wo die oben erwähnte, hochauflösende FFT auf die Abtastwerte der Audiosignaldaten aus dem am wenigsten lange zurückliegenden Audiosignalintervall angewendet wird. Danach wird ein jeweiliger Gewich- tungsfaktor oder Amplitudeneinstellfaktor fur jede der zehn Kode-Frequenzkomponenten in dem Symbol das gerade kodiert wird, berechnet, wie mit 170 bezeichnet In einem weiteren Schritt 172 wird in der oben erläuterten Weise derjenige der durch die hochauflösende FFT (Schritt 168) erzeugten Frequenzbereiche bestimmt, der die Eignung besitzt, das höchste Niveau derjeweiligen Kodekomponente auf einer Einzeltonbasis zu verdecken (die "tonale Dominante").
Unter Bezugnahme auf Fig. 7C wird in einem Schritt 176 der Gewichtungsfaktor für die tonale Dominante bestimmt und für einen Vergleich mit relativen Verdeckungseigenschaften, die die schmalbandige und breitbandige Verdeckung bieten, gespeichert, und wird, wenn es sich heraus- stellt, dass es sich um die effektivste Verdeckung handelt, als Gewichtungsfaktor zum Einstellen der Amplitude der aktuellen Kode-Frequenzkomponente verwendet In einem nachfolgenden Schritt 180 wird in der oben beschriebenen Weise eine Bewertung der schmalbandigen und breitbandigen Verdeckungseignungen ausgeführt.
Danach wird in einem Schritt 182 bestimmt, ob die schmal- bandige Verdeckung die beste Eignung zur Verdeckung der jeweiligen Kodekomponente besitzt, und wenn ja, wird der Gewichtungsfaktor in einem Schritt 184 auf der Grundlage der schmalbandi- gen Verdeckung mit einem Update versehen In einem anschliessenden Schritt 186 wird bestimmt, ob die breitbandige Verdeckung die beste Eignung zum Verdecken der jeweiligen Kode-Fre- quenzkomponente besitzt, und wenn ja, wird in einem Schritt 190 der Gewichtungsfaktor für die jeweilige Kode-Frequenzkomponente auf der Grundlage der breitbandigen Verdeckung eingestellt.
Anschliessend wird in Schritt 192 bestimmt, ob Gewichtsfaktoren für jede einzelne der Kode-
Frequenzkomponenten ausgewählt worden sind, die gegenwärtig auszugeben sind, um das aktuel- le Symbol darzustellen, und wenn nicht, wird die Schleife erneut initiiert, um einen Gewichtungsfak- tor für die nächste Kode-Frequenzkomponente auszuwählen. Wenn allerdings die Gewichtsfakto- ren für sämtliche Komponenten ausgewählt worden sind, wird das Unterprogramm beendet, wie
Schritt 194 angibt.
Bei Auftreten einer Zeitgeberunterbrechung 2 geht der Ablauf zu einem Unterprogramm 200, in dem die in Fig. 6 erläuterten Funktionen ausgeführt werden Das bedeutet, dass im Unterprogramm
200 die Gewichtsfaktoren, die im Verlauf des Unterprogramms 162 berechnet wurden, dazu ver- wendet werden, die jeweiligen Zeitbereichswerte des aktuellen, auszugebenden Symbols zu mul- tiplizieren, wobei die gewichteten Kodekomponentenwerte des Zeitbereichs addiert und als gewich- tetes, zusammengesetztes Kodesignal an den DAC 140 ausgegeben werden. Jedes Kodesymbol wird während einer vorgegebenen Zeitspanne ausgegeben, nach deren Verstreichen der Ablauf vom Schritt 202 zum Schritt 156 zurückkehrt.
Fig. 7D und 7E zeigen Ablaufpläne, die eine Implementierung der gleitenden tonalen Analyse- technik zum Bewerten der Verdeckungswirkungen eines Audiosignals erläutern. Bei Schritt 702 werden Variablen initialisiert, beispielsweise die Grösse hinsichtlich der Datenwerte einer umfang- reichen FFT und einer weniger umfangreichen FFT, die Anzahl der weniger umfangreichen FFTs in einer umfangreichen FFT sowie die Anzahl von Kodetonen je Symbol, beispielsweise 2048,256, 8 und 10.
<Desc/Clms Page number 18>
In den Schritten 704 bis 708 wird eine Anzahl von Abtastwerten analysiert, die einer umfang- reichen FFT entspricht. Bei Schritt 704 werden die Abtastwerte des Audiosignals erhalten. Bei Schritt 706 wird die Leistung im Programmaterial in jedem FFT-Bereich erhalten. Im Schritt 708 wird die zulässige Kodetonleistung in jedem entsprechenden FFT-Bereich für jeden der Töne gewonnen, wobei die Wirkungen aller relevanten Audiosignaltöne innerhalb dieses Bereichs be- rücksichtigt wird. Das Ablaufschema nach Fig. 7E zeigt den Schritt 708 in grösserem Detail.
In den Schritten 710 bis 712 wird eine Anzahl von Abtastwerten analysiert, die einer weniger umfangreichen FFT entspricht, in ähnlicher Weise wie in den Schritten 706 bis 708 im Falle einer umfangreichen FFT. Bei Schritt 714 werden die zulässigen Kodeleistungen, die aufgrund der umfangreichen FFT in Schritt 708 und der weniger umfangreichen FFT in Schritt 712 gefunden worden sind, für den Teil der Abtastwerte zusammengeführt, die einer weniger umfangreichen FFT unterworfen worden waren. Bei Schritt 716 werden die Kodetöne mit dem Audiosignal gemischt, um ein kodiertes Audiosignal zu erzeugen, und bei Schritt 718 wird das kodierte Audiosignal an den DAC 140 weitergegeben.
Bei Schritt 720 wird entschieden, ob die Schritte 710 bis 718 zu wiederholen sind, d.h. ob es Teile von Audio-Abtastwerten gibt, die einer umfangreichen FFT, aber nicht einer weniger umfangreichen FFT unterzogen worden sind. Anschliessend wird in Schritt 722 eine nächste Anzahl von Abtastwerten entsprechend einer umfangreichen FFT analysiert, sofern weitere Audiosignal-Abtastwerte vorhanden sind.
Fig. 7E zeigt Einzelheiten für die Schritte 708 und 712, wobei die zulässige Kodeleistung in je- dem FFT-Bereich berechnet wird. Im allgemeinen bildet diese Vorgehensweise das Audiosignal dahingehend ab, dass es einen Satz von Tönen (siehe nachstehendes Beispiel) umfasst, berechnet den Verdeckungseffekt eines jeden Audiosignaltons für jeden Kodes, summiert die Verdeckungs- wirkungen und nimmt Einstellungen bezüglich der Dichte der Kodetöne und der Komplexität des Audiosignals vor
Bei Schritt 752 wird das interessierende Band festgelegt. Die zum Kodieren verwendete Band- breite sei beispielsweise 800 Hz bis 3200 Hz und die Abtastfrequenz 44100 Werte/Sekunde. Der Startbereich beginnt bei 800 Hz, und der Endbereich endet bei 3200 Hz.
Bei Schritt 754 wird die Verdeckungswirkung von jedem relevanten Audiosignalton für jeden Kode in diesem Bereich bestimmt, indem die Verdeckungskurve für einen einzelnen Ton verwen- det wird, und indem die Breite des FFT-Bereichs des Audiosignals von ungleich Null durch Bestimmen (1) eines ersten Verdeckungswerts basierend auf der Annahme, dass sich die gesamte Audiosignalleistung am oberen Ende des Bereichs befindet, und (2) eines zweiten Verdeckungs- werts basierend auf der Annahme, dass sich die gesamte Audiosignalleistung am unteren Ende des
Bereichs befindet, und anschliessendes Auswählen des kleineren Wertes der genannten ersten und zweiten Verdeckungswerte, kompensiert wird.
Fig. 7F zeigt eine Näherung einer Einzelton-Verdeckungskurve für einen Audiosignalton mit einer Frequenz von fPGM, die in diesem Beispiel etwa 2200 Hz beträgt, gemäss Zwislocki, J. J., "Masking : Experimental and Theoretical Aspects of Simultaneous, Forward, Backward and Central
Masking" ("Verdecken: Experimentelle und theoretische Aspekte von simultanem, Vorwarts-,
Rückwarts- und zentralem Verdecken"), 1978, in Zwicker et al., ed., Psvchoacoustics: Facts and
Models, Seiten 283-316, Springer-Verlag, New York. Die Breite des kritischen Bandes (CB) wird durch Zwislocki wie folgt definiert.
Kritisches Band = 0,002 * fPGM1,5 + 100
Mit den folgenden Definitionen, wobei "Verdeckung" der Audiosignalton sei,
BRKPOINT = 0,3 / +/- 0,3 kritische Bänder/
PEAKFAC = 0,025119/ -16 dB von der Verdeckung/
BEATFAC = 0,002512 / -26 dB von der Verdeckung/ mNEG = 2,40/ -24 dB je kritisches Band/ mPOS =-0,70 / -7 dB je kritisches Band/ cf = Kodefrequenz mf = Verdeckungsfrequenz cband = kritisches Band um fPGM
<Desc/Clms Page number 19>
kann der Verdeckungsfaktor, mFaktor, wie folgt berechnet werden: brkpt = cband + BRKPOINT wenn auf der negativen Steigung der Kurve nach Fig 7F, mfactor = PEAKFAC * 10**(mNEG* mf-brkpt-cf)/cband) wenn auf dem ebenen Teil der Kurve nach Fig. 7F, mfactor = BEATFAC wenn auf der positiven Steigung der Kurve nach Fig. 7F, mfactor = PEAKFAC * 10**(mPOS * cf-brkpt-mf)/cband).
Insbesondere wird ein erster mFaktor berechnet basierend auf der Annahme, dass sich die ge- samte Audiosignalleistung am unteren Ende ihres Bereichs befindet, anschliessend wird ein zweiter mFaktor berechnet, basierend auf der Annahme, dass sich die gesamte Audiosignalleistung am oberen Ende ihres Bereichs befindet, und es wird der kleinere dieser beiden mFaktor-Werte als der durch diesen Audiosignalton für den gewählten Kodeton erzeugte Verdeckungswert gewählt. In Schritt 754 wird dieses Verfahren für jeden relevanten Audiosignalton fur jeden Kodeton durchge- führt.
In Schritt 756 wird jeder Kodeton durch jeden der Verdeckungsfaktoren, die den Audiosignaltö- nen entsprechen, eingestellt
In dieser Ausführungsform wird der Verdeckungsfaktor mit der Audiosignalleistung in dem rele- vanten Bereich multipliziert.
In Schritt 758 wird das Ergebnis der Multiplikation der Verdeckungsfaktoren mit der Audio- signalleistung für jeden Bereich aufsummiert, um eine zulassige Leistung für jeden Kodeton zu erhalten.
In Schritt 760 werden die zulässigen Kodetonleistungen eingestellt, und zwar im Hinblick auf die Kodetöne innerhalb einer kritischen Bandbreite auf beiden Seiten des Kodetons, der gerade bewertet wird, und hinsichtlich der Komplexität des Audiosignals. Die Anzahl der Kodetöne inner- halb des kritischen Bandes, CTSUM, wird gezählt Der Einstellfaktor, ADJFAC, ergibt sich durch: ADJFAC = GLOBAL * (PSUM/PRSS)1.5 /CTSUM wobei GLOBAL ein Abschwächungsfaktor ist, der die Kodierungsungenauigkeit aufgrund von zeitli- chen Verzögerungen bei der FFT-Ausführung berücksichtigt, (PSUM/PRSS)1,5 ein empirischer
Korrekturfaktor für die Komplexität ist, und 1/CTSUM lediglich bedeutet, dass die Audiosignallei- stung auf alle Kodetöne, die sie verdecken soll, aufgeteilt wird.
PSUM ist die Summe der Ver- deckungstonleistungsniveaus, die der Verdeckung desjenigen Kodetons zugeordnet wird, dessen
ADJFAC gerade bestimmt wird. Die Wurzel aus der Summe der Quadrate der Leistungen (PRSS) ergibt sich aus
PRSS = SQRT (I (P,2 ), i = FFT - Bereiche in dem Band
Unter der Annahme, dass eine insgesamt vorhandene Verdeckungstonleistung in einem Band gleichmässig auf beispielsweise einen, zwei und drei Töne verteilt wird, ergibt sich:
<Desc/Clms Page number 20>
EMI20.1
<tb> Anzahl <SEP> Tonleistung <SEP> PSUM <SEP> PRSS
<tb> Töne
<tb>
<tb> 1 <SEP> 10 <SEP> 1*10=10 <SEP> 10
<tb>
<tb>
<tb> 2 <SEP> 5,5 <SEP> 2*5=10 <SEP> SQRT <SEP> (2,52) <SEP> = <SEP> 7,07 <SEP>
<tb>
<tb> 3 <SEP> 3.3. <SEP> 3.3. <SEP> 3.3. <SEP> 3 <SEP> * <SEP> 3,3 <SEP> =10 <SEP> SORT <SEP> (3 <SEP> * <SEP> 3,32) <SEP> = <SEP> 5,77
<tb>
PRSS ist daher ein Mass dafür, ob die Verdeckungsleistung eher in Form eines Spitzenwerts (zunehmende Werte) oder in Form einer breiteren Verteilung (abnehmende Werte) des Program- materials vorliegt.
In Schritt 762 in Fig. 7E wird bestimmt, ob sich noch weitere Bereiche in dem interessierenden Band befinden, und wenn ja, wird wie oben beschrieben vorgegangen.
Nachfolgend werden einige Beispiele für Verdeckungsberechnungen angegeben. Es wird ein Audiosignalsymbol bei 0 dB angenommen, so dass die bereitgestellten Werte die maximalen Kode- tonleistungen in bezug auf die Audiosignalleistung sind. Es sind vier Fälle vorhanden : ein einzelner Ton mit 2500 Hz ; Töne bei 2000,2500 und 3000 Hz; schmalbandiges Rauschen, modelliert als 75 Tone innerhalb des kritischen Bandes und zentriert bei 2600 Hz, d.h. 75 Töne, die gleich- mässig mit 5 Hz beabstandet im Bereich von 2415 bis 2785 Hz liegen ; breitbandiges Rau- schen, modelliert als 351 Töne, die gleichmässig mit 5 Hz beabstandet im Bereich von 1750 Hz bis 3250 Hz liegen.
Für jeden Fall wird ein mittels einer gleitenden tonalen Analyse (sliding tonal analysis, STA) berechnetes Ergebnis mit einem berechneten Ergebnis verglichen, das aus einer Auswahl der besten Analyse unter der Einzelton-, Schmalbandrausch- und Breitbandrauschanaly- se erhalten wird
EMI20.2
<tb> Einzelton <SEP> Mehrfachtöne <SEP> Schmalband- <SEP> Breitband-
<tb>
<tb> rauschen <SEP> rauschen
<tb>
<tb>
<tb> Kodeton <SEP> STA <SEP> Beste <SEP> STA <SEP> Beste <SEP> STA <SEP> Beste <SEP> STA <SEP> Beste <SEP>
<tb>
<tb>
<tb> (Hz) <SEP> (dB) <SEP> von <SEP> 3 <SEP> (dB) <SEP> von <SEP> 3 <SEP> (dB) <SEP> von <SEP> 3 <SEP> (dB) <SEP> von <SEP> 3
<tb>
<tb>
<tb>
<tb> (dB) <SEP> (dB) <SEP> (dB) <SEP> (dB)
<tb>
<tb> 1976-50 <SEP> -49 <SEP> -28-30 <SEP> -19 <SEP> NA <SEP> 14 <SEP> 12 <SEP>
<tb>
<tb>
<tb> 2070-45 <SEP> -45-22 <SEP> -32-14 <SEP> NA <SEP> 13 <SEP> 12 <SEP>
<tb>
<tb>
<tb> 2163-40 <SEP> -39-29 <SEP> -25 <SEP> -9 <SEP> NA <SEP> 13 <SEP> 12
<tb>
<tb>
<tb> 2257-34 <SEP> -33-28 <SEP> -28 <SEP> -3 <SEP> NA <SEP> 12 <SEP> 12
<tb>
<tb>
<tb> 2351-28 <SEP> -27 <SEP> -20 <SEP> - <SEP> 28 <SEP> 1 <SEP> NA <SEP> 12 <SEP> 12 <SEP>
<tb>
<tb>
<tb> 2444-34 <SEP> -34-23 <SEP> -33 <SEP> 2 <SEP> 7 <SEP> 13 <SEP> 12
<tb>
<tb>
<tb> 2538-34 <SEP> -34-24 <SEP> -34 <SEP> 3 <SEP> 7 <SEP> 13 <SEP> 12 <SEP>
<tb>
<tb>
<tb> 2632-24 <SEP> -24-18 <SEP> -24 <SEP> 5 <SEP> 7 <SEP> 14 <SEP> 12 <SEP>
<tb>
<tb>
<tb> 2726 <SEP> -26 <SEP> -26-21 <SEP> -26 <SEP> 5 <SEP> 7 <SEP> 14 <SEP> 12
<tb>
<tb>
<tb> 2819 <SEP> -27 <SEP> -27 <SEP> -22 <SEP> -27 <SEP> 6 <SEP> NA <SEP> 15 <SEP> 12
<tb>
Beispielsweise liegt in der gleitenden tonalen Analyse (STA) für den Einzeltonfall der Verdek- kungston bei 2500 Hz, was einer kritischen Bandbreite von 0,002 * 2500.1,5 + 100 = 350 Hz ent- spricht. Die Übergangspunkte der Kurve in Fig. 7F liegen bei 2500 0,3*350 oder 2395 und 2605 Hz. Die Kodefrequenz von 1976 liegt ersichtlich auf dem Abschnitt mit negativer Steigung der Kurve nach Fig. 7F, so dass der Verdeckungsfaktor wird mfactor = 0,025119 *10-2.4* (2500-105-1976)/350 = 3,364 * 10-5 = -44,7 dB
Da es drei Kodetone innerhalb des kritischen Bandes von 1976 Hz gibt, wird die Verdeckungs- leistung zwischen diesen aufgeteilt:
<Desc/Clms Page number 21>
3,364 *10-5/3 =-49,5 dB
Dieses Ergebnis wird auf die-50 dB gerundet, die im oberen linken Teil der Berechnungstabel- le der Abtastwerte dargestellt sind.
In der "Beste von 3"-Analyse wird eine tonale Verdeckung gemäss dem Einzeltonverfahren be- rechnet, das oben in Zusammenhang mit Fig. 7F erläutert ist.
In der "Beste von 3"-Analyse wird eine Schmalbandrausch-Verdeckung berechnet, indem zu- nachst die mittlere Leistung über ein kritisches Band berechnet wird, das auf der Frequenz des interessierenden Kodetons zentriert ist. Tone mit einer Leistung, die grösser ist als die mittlere Leistung, werden nicht als Teil des Rauschens angesehen, und werden entfernt. Die Summe der verbleibenden Leistung ist die Schmalband-Rauschleistung. Die maximal zulässige Kodetonleis- tung beträgt -6 dB der Schmalband-Rauschleistung für alle Kodetöne innerhalb einer kritischen Bandbreite des interessierenden Kodetons.
In der "Beste von 3"-Analyse wird die Breitbandrausch-Verdeckung berechnet, indem die Schmalband-Rauschleistung für kritische Bänder berechnet wird, die bei 2000 Hz, 2280 Hz, 2600 Hz und 2970 Hz zentriert sind. Die kleinste sich ergebende Schmalband-Rauschleistung wird mit dem Verhältnis der gesamten Bandbreite zu der entsprechenden kritischen Bandbreite multi- pliziert, um die Breitband-Rauschleistung zu finden. Wenn beispielsweise das bei 2600 Hz zentrier- te Band mit einer kritischen Bandbreite von 370 Hz ds Minimum darstellt, wird dessen Schmal- band-Rauschleistung mit 1322 Hz/370 Hz = 3,57 multipliziert, um die Breitband-Rauschleistung zu erhalten. Die zulässige Kodetonleistung beträgt-3 dB der Breitband-Rauschleistung. Wenn zehn Kodetone vorhanden sind, beträgt die maximal zulässige Leistung für jeden 10 dB weniger bzw.
-13 dB der Breitband-Rauschleistung.
Die Berechnungen nach der gleitenden tonalen Analyse entsprechen ersichtlich im allgemei- nen den "Beste von 3"-Berechnungen, was anzeigt, dass die gleitende tonale Analyse ein robustes Verfahren ist. Ausserdem sind die durch die gleitende tonale Analyse im Falle von Mehrfachtonen erzielten Ergebnisse besser, d h. sie lassen grössere Kodetonleistungen zu als im Falle der "Beste von 3"-Analyse, was anzeigt, dass die gleitende tonale Analyse selbst für Fälle geeignet ist, die nicht genau in eine der "Beste von 3"-Berechnungen passen.
Nachfolgen auf Fig. 8 Bezug nehmend, ist eine Ausführungsform eines Kodierers in Blockform dargestellt, bei dem analoge Schaltungen verwendet werden. Der analoge Kodierer erhält ein Audiosignal in analoger Form an einem Eingangsanschluss 210, von dem das Audiosignal als Eingang an N Komponentenerzeugungsschaltungen 2201 bis 200N weitergegeben wird, von denen jede eine Kodekomponente C1 bis CN erzeugt. Aus Gründen der Einfachheit und Klarheit der Darstellung sind lediglich die Komponentenerzeugungsschaltungen 2201 und 220N in Fig. 8 darge- stellt.
Um die Kodekomponenten eines jeweiligen Datensymbols, die in das Audiosignal zur Erzeu- gung eines kodierten Audiosignals eingefügt werden sollen, in steuerbarer Weise zu erzeugen, ist jede Komponentenerzeugungsschaltung mit einem jeweiligen Dateneingangsanschluss 2221 bis 222N versehen, der als Aktivierungseingang für die jeweilige Komponentenerzeugungsschaltung dient. Jedes Symbol wird als Teilmenge der Kodekomponenten C1 bis CN kodiert, indem ein Akti- vierungssignal auswählbar an bestimmte, einzelne Komponentenerzeugungsschaltungen 2201 bis 220N angelegt wird.
Die erzeugten Kodekomponenten, die einem jeden Datensymbol entsprechen, werden als Eingänge an eine Summierschaltung 226 geleitet, die das Eingangsaudiosignal vom Eingangsanschluss 210 an einem weiteren Eingang erhält, und die dazu dient, die Kodekomponen- ten zum Eingangsaudiosignal zu addieren, um das kodierte Audiosignal zu erzeugen, das sie an einem ihrer Ausgänge abgibt.
Die einzelnen Komponentenerzeugungsschaltungen sind in einander ähnlicher Weise aufge- baut und beinhalten jeweils eine Gewichtsfaktorbestimmungsschaltung 2301 bis 230N, einen jewei- ligen Signalgenerator 2321 bis 232N und einen jeweiligen Umschaltkreis 2341 bis 234N Jeder der Signalgeneratoren 2321 bis 232N erzeugt eine jeweils unterschiedliche Kodekompontenfrequenz und leitet die erzeugte Komponente an den jeweiligen Umschaltkreis 2341 bis 234N, von denen jeder mit einem zweiten, an Erde angeschlossenen Eingang sowie einen Ausgang aufweist,
der an einen Eingang einer jeweiligen Multiplizierungsschaltung 2361 bis 236N angeschlossen ist Anspre- chend auf den Erhalt eines Aktivierungseingangs an ihren jeweiligen Dateneingangsanschlüssen 2221 bis 222N koppelt jeder der Umschaltkreise 2341 bis 234N den Ausgang seines jeweiligen
<Desc/Clms Page number 22>
Signalgenerators 2321 bis 232N an den Eingang der jeweils entsprechenden Multiplizierungsschal- tung 2361 bis 236N. In Abwesenheit eines Aktivierungssignals am Dateneingang koppelt dagegen jeder Umschaltkreis 2341 bis 234N seinen Ausgang an den geerdeten Eingang, so dass sich der Ausgang des entsprechenden Multiplizierers 2361 bis 236N auf 0 befindet.
Jede Gesichtsfaktorbestimmungsschaltung 2301 bis 230N dient dazu, die Eignung von Fre- quenzkomponenten des Audiosignals innerhalb eines entsprechenden Frequenzbands davon im Hinblick auf die Abdeckung der Kodekomponente zu bewerten, die von dem entsprechenden Signalerzeuger 2321 bis 232N erzeugt worden ist, um einen Gewichtsfaktor zu erzeugen, den sie als Eingang an die entsprechende Multiplizierungsschaltung 2361 bis 236N weitergibt, um die Amplitude der entsprechenden Kodekomponente einzustellen, damit gewährleistet ist, dass diese durch den Abschnitt des Audiosignals, der durch die Gewichtsfaktorbestimmungsschaltung bewer- tet worden ist, verdeckt wird. Weiterhin auf Fig. 9 Bezug nehmend, ist der Aufbau einer jeden Gewichtsfaktorbestimmungsschaltung 2301 bis 230N in Blockform erläutert, wobei eine beispielhaf- te Schaltung 230 angegeben ist.
Die Schaltung 230 beinhaltet ein Verdeckungsfilter 240, das ein Audiosignal an einem Eingang davon erhält und dazu dient, den Abschnitt des Audiosignals, der zum Erzeugen eines Gewichtsfaktors, der zu dem jeweiligen Multiplizierer 2361 bis 236N geleitet wird, verwendet wird, abzutrennen. Die Eigenschaften des Verdeckungsfilters sind weiterhin so ausgewählt, dass die Amplituden der Audiosignal-Frequenzkomponenten entsprechend ihrer relati- ven Eignungen zum Abdecken der jeweiligen Kodekomponente gewichtet werden
Der vom Verdeckungsfilter 240 gewählte Teil des Audiosignals wird an eine Absolutwertschal- tung 242 gegeben, die ein Ausgangssignal erzeugt,
das einem Absolutwert eines Teils des Signals innerhalb des durch das Verdeckungsfilter 240 hindurchgegangenen Frequenzbands darstellt Der Ausgang der Absolutwertschaltung 242 wird als Eingang an einen Skalierungsverstärker 244 gegeben, dessen Verstärkung so gewählt ist, dass er ein Ausgangssignal erzeugt, das nach Multi- plizierung mit dem Ausgangswert des entsprechenden Schalters 2341 bis 234N eine Kodekompo- nente am Ausgang des entsprechenden Multiplizierers 2361 bis 236N erzeugt, die gewährleistet, dass die multiplizierte Kodekomponente durch den ausgewählten Teil des vom Verdeckungsfilter 240 durchgelassenen Audiosignals verdeckt wird, wenn das kodierte Audiosignal als Ton wieder- gegeben wird.
Jede Gewichtsfaktorbestimmungsschaltung 2301 bis 230N erzeugt daher ein Signal, das eine Bewertung der Eignung des ausgewählten Teils des Audiosignals zum Verdecken der entsprechenden Kodekomponente darstellt.
In anderen Ausführungsformen analoger Kodierer gemäss der vorliegenden Erfindung sind mehrere Gewichtsfaktorbestimmungsschaltungen für jeden Kodekomponentengenerator vorhan- den, und jede der mehrfachen Gewichtsfaktorbestimmungsschaltungen, die einer gegebenen
Kodekomponente entspricht, bewertet die Eignung eines unterschiedlichen Teils des Audiosignals zum Verdecken dieser speziellen Komponente, wenn das kodierte Audiosignal als Ton wiederge- geben wird.
Beispielsweise kann eine Anzahl derartiger Gewichtsfaktorbestimmungsschaltungen vorhanden sein, von denen jede die Eignung eines Teils des Audiosignals zum Verdecken der jeweiligen Kodekomponente, wenn das kodierte Audiosignal als Ton wiedergegeben wird, inner- halb eines relativ schmalen Frequenzbands bewertet (so dass die Audiosignalenergie innerhalb eines solchen Bandes mit grosser Wahrscheinlichkeit aus einer Einzelfrequenzkomponente be- steht). Es kann auch eine weitere Gewichtsfaktorbestimmungsschaltung fur die gleiche jeweilige
Kodekomponente vorgesehen sein, um die Eignung der Audiosignalenergie innerhalb eines kriti- schen Bandes, das die Kodekomponentenfrequenz als mittlere Frequenz hat, zum Verdecken der
Kodekomponente wenn das kodierte Audiosignal als Ton wiedergegeben wird, bewertet werden.
Ausserdem sei angemerkt, obwohl die unterschiedlichen Elemente der Ausführungsform nach
Fig. 8 und 9 mittels analoger Schaltungen implementiert sind, dass die gleichen Funktionen, die durch derartige analoge Schaltungen ausgeführt werden, auch ganz oder teilweise in Form von digitalen Schaltkreisen implementiert sein können.
Dekodieren
Nachfolgend wird auf Dekodierer und Verfahren zum Dekodieren eingegangen, die sich spe- ziell zum Dekodieren von Audiosignalen eignen, die durch die vorstehend beschriebenen Techni- ken gemäss der Erfindung kodiert sind, wie auch allgemein zum Dekodieren von in Audiosignalen
<Desc/Clms Page number 23>
enthaltenen Kodes, so dass die Kodes basierend auf der Amplitude davon unterschieden werden können.
In Übereinstimmung mit bestimmten Merkmalen der vorliegenden Erfindung und unter Bezugnahme auf das funktionale Blockdiagramm nach Fig. 10 wird das Vorhandensein einer oder mehrerer Kodekomponenten in einem kodierten Audiosignal durch Aufstellen einer erwarteten Amplitude bzw. von Amplituden für die eine oder mehrere Kodekomponente (n) ausge- hend von dem Audiosignalniveau und/oder einem Rauschniveau, das kein Audiosignal ist, wie durch den funktionalen Block 250 angegeben. Ein oder mehrere Signale, die eine solche erwartete Amplitude oder Amplituden darstellen, werden bereitgestellt, wie in Fig 10 mit 252 bezeichnet, um das Vorhandensein der Kodekomponente durch Detektieren eines Signals zu bestimmen, welches der erwarteten Amplitude bzw der Amplituden entspricht, wie durch den funktionalen Block 252 angegeben ist.
Dekodierer gemäss der vorliegenden Erfindung eignen sich besonders gut zum Erfassen des Vorhandenseins von Kodekomponenten, die durch andere Komponenten des Audio- signals verdeckt sind, da die Amplitudenbeziehung zwischen den Kodekomponenten und den übrigen Audiosignalkomponenten in einem gewissen Masse vorbestimmt ist.
Fig. 11 ist ein Blockdiagramm eines Dekodierers in Übereinstimmung mit einer Ausführungs- form der vorliegenden Erfindung, wobei digitale Signalverarbeitung zum Extrahieren von Kodes aus kodierten Audiosignalen eingesetzt wird, die von dem Dekodierer in analoger Form erhalten werden Der Dekodierer nach Fig. 11 hat einen Eingangsanschluss 260 zum Aufnehmen des ko- dierten analogen Audiosignals, das beispielsweise ein von einem Mikrophon aufgenommenes Signal oder auch eine Fernseh- oder Radio-Rundfunksendung sein kann, die von einem Empfän- ger als Ton wiedergegeben wird, oder schliesslich auch kodierte analoge Audiosignale, die in Form von elektrischen Signalen unmittelbar von einem derartigen Empfänger kommen. Solche kodierten analogen Audiosignale können auch durch Wiedergabe eines in Form einer Kompakt-Disk oder Bandkassette aufgezeichneten Tons erzeugt werden.
Analoge Konditionierungsschaltungen 262 sind an den Eingang 260 angeschlossen, um das kodierte analoge Audiosignal zu erhalten, und dienen dazu, eine Signalverstärkung, eine automatische Verstärkungsregelung und eine Anti- Aliasing-Tiefpassfilterung vor der Analog/Digital-Wandlung vorzunehmen. Zusätzlich dienen die analogen Konditionierungsschaltungen 262 dazu, einen Bandpass-Filtervorgang auszuführen, um zu gewährleisten, dass die dadurch abgegebenen Signale auf einen Frequenzbereich beschränkt sind, in dem die Kodekomponenten auftreten können.
Die analogen Konditionierungsschaltungen 262 geben die verarbeiteten analogen Audiosignale an einen Analog/Digital-Wandler (A/D) 263 ab, der die erhaltenen Signale in digitale Form wandelt und sie zu einem digitalen Signalprozessor (DSP) 266 weitergibt, der die digitalisierten analogen Signale verarbeitet, um das Vorhandensein von Kodekomponenten zu detektieren, und die Kodesymbole detektiert, die sie darstellen. Der digitale Signalprozessor 266 ist mit einem Speicher 270 verbunden (enthaltend sowohl Programm- als auch Datenspeicherbereiche) und mit Eingabe/Ausgabe-Schaltungen (I/O) 272, um externe Befehle zu erhalten (beispielsweise einen Befehl zum Initiieren des Dekodierens oder einen Befehl zum Ausgeben gespeicherter Kodes) und um dekodierte Meldungen auszugeben.
Nachfolgend wird die Arbeitsweise des digitalen Dekodierers nach Fig. 11 zum Dekodieren von mittels der Vorrichtung nach Fig. 3 kodierten Audiosignalen beschrieben. Die analogen Konditionie- rungsschaltungen 262 dienen zur Bandfilterung der kodierten Audiosignale, wobei sich ein Durch- lassbereich von etwa 1,5 kHz bis 3,1 kHz erstreckt, und der DSP 266 die gefilterten analogen
Signale mit einer entsprechend hohen Frequenz abtastet. Das digitalisierte Audiosignal wird dann durch den DSP 266 durch FFT-Verarbeitung in Frequenzkomponentenbereiche ("bins") aufge- trennt. Insbesondere wird eine überlappende, ausschnittartige (Fenster-) FFT auf eine vorbestimm- te Anzahl von am wenigsten lange zurückliegenden Datenpunkten angewendet, so dass eine neue
FFT periodisch bei Erhalt einer ausreichenden Anzahl von neuen Abtastwerten ausgeführt wird.
Die Daten werden gewichtet, wie nachstehend noch erläutert wird, und die FFT wird zur Erzeugung einer vorbestimmten Anzahl von Frequenzbereichen ausgeführt, die jeweils eine vorbestimmte
Breite haben. Die Energie B (i) eines jeden Frequenzbereichs in einem die Kodekomponentenfre- quenzen umfassenden Bereich wird durch den DSP 266 berechnet
Eine Rauschniveauschätzung wird um jeden Bereich herum ausgeführt, in dem eine Kode- komponente auftreten kann. Wenn der Dekodierer nach Fig. 11 zum Dekodieren von durch die
Ausführungsform nach Fig. 3 kodierten Signalen verwendet wird, sind demnach 40 Frequenzberei- che vorhanden, innerhalb von denen eine Kodekomponente auftreten kann. Für einen jeden
<Desc/Clms Page number 24>
solchen Frequenzbereich wird ein Rauschniveau wie folgt abgeschätzt.
Zunächst wird eine Durch- schnittsenergie E(j) in den Frequenzbereichen innerhalb eines Ausschnitts oder Fensters, der sich in der Frequenz oberhalb und unterhalb des speziell interessierenden Frequenzbereichs j (d. h. des Frequenzbereichs, in dem die Kodekomponente auftreten kann) nach der folgenden Beziehung berechnet :
EMI24.1
wobei i = (j-w) - > (j+w) und w die Erstreckung des Ausschnitts oberhalb und unterhalb des interes- sierenden Bereichs in Anzahlen von Bereichen angibt. Dann wird ein Rauschniveau. NS(j) im Frequenzbereich j nach der folgenden Formel geschätzt.
NS(l)= = (#Bn(1))1(#Ù(1)) wobei Bn(i) gleich B (i) (dem Energieniveau in Bereich i) ist, wenn B (i) < E(J) und B (i) ansonstengleich Null ist, und wobei 5(i) gleich 1, wenn B (i) < E(j) und Ù(i) ansonsten gleich Null ist.
Das bedeutet, dass angenommen wird, dass die Rauschkomponenten diejenigen Komponenten einschliessen, deren Niveau unterhalb des durchschnittlichen Energieniveaus innerhalb des speziel- len Ausschnitts, der den interessierenden Bereich umgibt, liegt, und daher Audiosignalkomponen- ten einschliessen, die unterhalb dieses durchschnittlichen Energieniveaus fallen.
Wenn das Rauschniveau für den interessierenden Bereich abgeschätzt ist, wird ein Sig- nal/Rausch-Verhältnis SNR(j) für diesen Bereich geschätzt, indem das Energieniveau B(j) in dem interessierenden Bereich durch das geschätzte Rauschniveau NS(j) dividiert wird. Die Werte von SNR(j) werden sowohl zum Detektieren des Vorhandenseins und der Zeitfolge (des Timings) der Synchronisationssymbole als auch des Zustands von Datensymbolen, wie nachfolgend erläutert, verwendet. Unterschiedliche Techniken können eingesetzt werden, um Audiosignalkomponenten von der Betrachtung als Kodekomponenten auf einer statistischen Basis zu eliminieren. Beispiels- weise kann angenommen werden, dass der Bereich mit dem höchsten Signal/Rausch-Verhältnis eine Audiosignalkomponente beinhaltet.
Eine weitere Möglichkeit besteht darin, diejenigen Berei- che mit einem SNR(j)-Wert oberhalb eines vorbestimmten Werts auszuschliessen. Eine weitere
Möglichkeit besteht darin, diejenigen Bereiche von der Betrachtung zu eliminieren, die die höch- sten und/oder die niedrigsten SNR(j)-Werte haben.
Wenn sie zum Detektieren des Vorhandenseins von Kodes in mittels der Vorrichtung nach
Fig. 3 kodierten Audiosignalen verwendet wird, sammelt die Vorrichtung nach Fig. 11 Daten an, die das Vorhandensein von Kodekomponenten in jedem der interessierenden Bereiche in wiederholter Weise für wenigstens einen grösseren Teil des vorbestimmten Intervalls, in dem ein Kodesymbol gefunden werden kann, angeben. Das vorstehende Verfahren wird demgemäss mehrere Male wiederholt, und für jeden interessierenden Bereich werden über diesen zeitlichen Rahmen Daten bezüglich des Vorhandenseins von Komponenten angesammelt.
Techniken zum Aufstellen geeigneter Detektionszeitrahmen auf der Grundlage der Verwen- dung von Synchronisierungskodes werden nachfolgend im einzelnen erläutert. Sobald der DSP
266 derartige Daten während des relevanten Zeitrahmens angesammelt hat, bestimmt er in der nachstehend erläuterten Weise, welches der möglichen Kodesignale in dem Audiosignal vorhan- den war. Der DSP 266 speichert dann das detektierte Kodesymbol im Speicher 270 gleichzeitig mit einer Zeitmarke zum Identifizieren der Zeit, zu der das Symbol detektiert wurde, und zwar auf der
Basis eines internen Zeitgebersignals des DSP.
Ansprechend auf einen geeigneten Befehl an den DSP 266, der über den 1/0-Kreis 272 erhal- ten wird, veranlasst der DSP dann den Speicher 270 zur Ausgabe der gespeicherten Kodesymbole und Zeitmarken uber die !/0-Kreise 272.
Die Ablaufpläne der Fig. 12A und 12B erläutern die Folge von Operationen, die der DSP 266 beim Dekodieren eines Symbols ausführt, das in dem analogen Audiosignal, das am Eingangsan- schluss 260 erhalten wird, kodiert ist. Zunächst auf Fig. 12A Bezug nehmend, geht der DSP 266 bei der Initialisierung des Decodierungsvorgangs bei einem Schritt 450 in eine Hauptprogrammschleife hinein, wobei er eine Flagge SYNCH setzt, so dass der DSP 266 zunächst einen Vorgang startet,
<Desc/Clms Page number 25>
um das Vorhandensein der Synchronisierungssymbole E und S in dem Eingangs-Audiosignal in einer vorbestimmten Meldungsreihenfolge zu detektieren.
Nach Ausführung des Schritts 450 ruft der DSP 266 ein Unterprogramm DET auf, das im Ablaufplan nach Fig. 12B erläutert ist, um nach dem Vorhandensein von Kodekomponenten zu suchen, die die Synchronisierungssymbole im Audiosignal darstellen.
Nachfolgend auf Fig. 12B Bezug nehmend, sammelt und speichert der DSP in einem Schntt 454 in wiederholter Weise Abtastwerte des Eingangs-Audiosignals, bis eine ausreichende Anzahl gespeichert ist, um die oben beschriebene FFT auszuführen. Sobald dies ausgeführt ist, werden die gespeicherten Daten einer Gewichtsfunktion unterworfen, beispielsweise einer quadratischen Kosinus-Gewichtsfunktion, einer Kaiser-Besselfunktion, einer Gauss- bzw Poisson-Funktion, einer Hanning-Funktion oder einer sonstigen geeigneten Gewichtsfunktion, wie mit Schritt 456 angege- ben, um einen Datenausschnitt zu bilden. Wenn allerdings die Kodekomponenten ausreichend deutlich sind, ist ein Gewichten nicht erforderlich.
Die ausschnittartigen Daten werden dann einer überlappten FFT unterworfen, wie mit Schritt 460 angegeben
Sobald die FFT ausgeführt ist, wird in einem Schritt 462 die SYNCH-Flagge getestet, um fest- zustellen, ob sie gesetzt ist (in diesem Fall wird ein Synchronisierungssymbol erwartet) oder zu- rückgesetzt ist (in diesem Fall wird ein Datenbitsymbol erwartet).
Da anfangs der DSP die SYNCH- Flagge setzt, um das Vorhandensein von Kodekomponenten zu detektieren, die Synchronisations- symbole darstellen, geht das Programm zu einem Schritt 466, in dem die Frequenzbereichsdaten, die mittels der FFT in Schritt 460 erhalten wurden, ausgewertet werden, um festzustellen, ob diese Daten das Vorhandensein von Komponenten anzeigen, die ein E-Synchronisierungssymbol oder ein S-Synchronisierungssymbol darstellen
Zum Zwecke der Erfassung des Vorhandenseins und des Timings von Synchronisations- symbolen wird zunächst die Summe der Werte von SNR(j) für jedes mögliche Synchromsations- symbol und Datensymbol bestimmt. Zu einem gegebenen Zeitpunkt während des Vorgangs des Detektierens der Synchronisationssymbole wird ein spezielles Symbol erwartet.
Als erster Schritt des Detektierens des erwarteten Symbols wird bestimmt, ob die Summe von dessen entsprechen- den SNR(j)-Werten grösser ist als jeder der anderen. Wenn dies der Fall ist, wird eine Erfassungs- schwelle auf der Basis der Rauschniveaus in den Frequenzbereichen, die Kodekomponenten enthalten können aufgestellt. Das bedeutet, da zu jedem gegebenen Zeitpunkt nur ein Kodesymbol in dem kodierten Audiosignal enthalten ist, dass nur ein Viertel der interessierenden Bereiche Kodekomponenten enthalten. Die übrigen drei Viertel enthalten Rauschen, d.h. Programmaudio- komponenten und/oder Störenergie.
Die Erfassungsschwelle wird als Mittelwert der Werte SNR(j) für alle 40 interessierenden Frequenzbereiche erzeugt, kann aber mit einem Multiplikationsfaktor eingestellt werden, um die Auswirkungen von Umgebungsrauschen zu berücksichtigen und/oder eine beobachtete Fehlerrate zu kompensieren.
Wenn die Erfassungsschwelle in dieser Weise aufgestellt ist, wird die Summe der Werte SNR(j) des erwarteten Synchronisationssymbols mit der Erfassungsschwelle verglichen, um zu bestim- men, ob sie grösser ist als diese Schwelle oder nicht. Wenn dies der Fall ist, wird eine gültige Erfas- sung des erwarteten Synchronisationssymbols festgestellt.
Sobald dies geschehen ist, wie im Schritt 470 angegeben, kehrt das Programm zur Hauptverfahrensschleife nach Fig 12A zum Schritt 472 zurück, wo bestimmt wird (wie nachfolgend erläutert), ob ein Muster der dekodierten Daten vorbestimmte Qualifizierungskriterien erfüllt Wenn nicht, kehrt die Verarbeitung zum Schritt 450 zurück, um die Suche nach dem Vorhandensein eines Synchronisationssymbols in dem Audio- signal erneut zu beginnen; wenn aber diese Kriterien erfüllt sind, wird bestimmt, ob das erwartete Synchronisationsmuster (d.h. die erwartete Folge der Symbole E und S) vollständig erhalten und detektiert worden ist, wie in Schritt 474 angegeben.
Nach dem ersten Durchgang durch das Unterprogramm DET sind allerdings unzureichende Daten gesammelt worden, um festzustellen, ob das Muster die Qualifizierungskriterien erfüllt, so dass vom Schritt 474 die Verarbeitung zum Unterprogramm DET zurückkehrt, um eine weitere FFT und Auswertung hinsichtlich des Vorhandenseins eines Synchronisierungssymbols durchzuführen.
Nachdem das Unterprogramm DET eine vorbestimmte Anzahl von Malen durchlaufen worden ist und wenn die Verarbeitung zum Schritt 472 zurückkehrt, bestimmt der DSP, ob die angesammel- ten Daten die Qualifizierungskriterien für ein Synchronisationsmuster erfüllen.
Das bedeutet, dass wenn DET die vorbestimmte Anzahl von Malen durchlaufen worden ist, eine
<Desc/Clms Page number 26>
entsprechende Anzahl von Bewertungen in Schritt 466 des Unterprogramms DET ausgeführt worden sind. Die Anzahl von Malen, wie oft ein "E"-Symbol gefunden worden ist, wird in einer Ausführungsform als Mass für die Menge der "E"-Symbol-Energie während der entsprechenden Zeitspanne verwendet. Es können allerdings stattdessen auch andere Masse der "E"-Symbol- Energie verwendet werden, wie z.B. die Gesamtheit der "E"-Bereich-SNR's, die die durchschnittli- che Bereichsenergie überschreiten.
Nachdem das Unterprogramm DET erneut aufgerufen ist und eine weitere Bewertung in Schritt 466 ausgeführt ist, wird im Schritt 472 diese am wenigsten lange zurückliegende Bewertung zu denen hinzuaddiert, die während des vorbestimmten Intervalls angesammelt worden sind, und die älteste Bewertung unter diesen, die zuvor angesammelt wor- den sind, wird gelöscht. Dieser Vorgang geht während mehrerer Durchgänge durch das DET- Unterprogramm weiter, und im Schritt 472 wird ein Spitzenwert in der "E"-Symbol-Energie gesucht.
Wenn ein solcher Spitzenwert nicht gefunden wird, führt dies zur Feststellung, dass ein Synchroni- sierungsmuster nicht angetroffen wurde, so dass die Verarbeitung vom Schritt 172 zum Schritt 450 zurückkehrt, um die SYNCH-Flagge erneut zu setzten und die Suche nach einem Synchronisie- rungsmuster erneut zu starten.
Wenn allerdings ein solches Maximum der "E"-Signalenergie gefunden worden ist, geht der in Schritt 472 nach dem Unterprogramm DET 452 durchgeführte Bewertungsprozess weiter, wobei jedes Mal die gleiche Anzahl Bewertungen vom Schritt 466 verwendet werden, wobei aber die älteste Bewertung gelöscht wird und die neueste hinzugefügt wird, so dass ein gleitendes Daten- fenster für diesen Zweck verwendet wird. Wenn dieses Verfahren fortgesetzt wird, wird nach einer vorbestimmten Anzahl von Durchgängen im Schritt 472 bestimmt, ob ein Überkreuzen vom "E"-Symbol zum "S" aufgetreten ist. Dies wird in einer Ausführungsform als der Punkt bestimmt, an dem die Gesamtheit der SNR's des "S"-Bereichs, resultierend vom Schritt 466 innerhalb des glei- tenden Fensters, zuerst die Gesamtheit der SNR's des "E"-Bereichs während des gleichen Inter- valls überschreitet.
Sobald ein solcher Überkreuzungspunkt gefunden worden ist, geht die Verar- beitung in der oben beschriebenen Weise weiter, um nach einem Maximum der "S"-Symbol- Energie zu suchen, das durch die grösste Anzahl von "S"-Erfassungen innerhalb des gleitenden Datenfensters angezeigt wird. Wenn ein solches Maximum nicht gefunden wird, oder ansonsten das Maximum nicht innerhalb eines erwarteten Zeitrahmens nach dem Maximum der "E"-Symbol- Energie auftritt, geht die Verarbeitung vom Schritt 472 zurück zum Schritt 450, um die Suche nach einem Synchronisationsmuster erneut zu starten.
Wenn die vorgenannten Kriterien erfüllt sind, wird das Vorhandensein eines Synchronisations- musters im Schritt 474 festgestellt, und die Verarbeitung geht zum Schritt 480, um die erwarteten Bitintervalle basierend auf den "E"- und "S"-Symbol-Energiemaxima und dem erfassten Überkreu- zungspunkt zu bestimmen. Anstelle des vorstehend beschriebenen Verfahrens zum Detektieren des Vorhandenseins des Synchronisationsmusters können auch andere Strategien eingesetzt werden.
In einer weiteren Ausführungsform kann bei einem Synchronisationsmuster, das Kriterien wie die oben beschriebenen nicht erfüllt, aber das ein qualifizierendes Muster annähernd erreicht (d.h. das detektierte Muster scheidet nicht eindeutig aus), eine Bestimmung, ob das Synchronisati- onsmuster detektiert worden ist oder nicht, aufgeschoben werden, wobei die weitere Analyse auf Bewertungen fusst (wie nachfolgend beschrieben), die ausgeführt werden, um das Vorhandensein von Datenbits in erwarteten Datenintervallen festzustellen, die auf das potentielle Synchronisie- rungsmuster folgen. Auf der Grundlage der Gesamtheit der erfassten Daten, d.h. sowohl während des zweifelhaften Synchronisationsmusterintervalls als auch während des zweifelhaften Bitinter- valls kann eine rückschauende Qualifizierung des möglichen Synchronisationsmusters ausgeführt werden.
Nochmals auf den Ablaufplan nach Fig. 12A Bezug nehmend, wird nach Qualifizierung des Synchronisationsmusters im Schritt 180, wie oben erwähnt, das Bit-Timing auf der Grundlage der beiden Maxima und des Überkreuzpunktes bestimmt. Das bedeutet, dass diese Werte gemittelt werden, um die erwarteten Start- und Endpunkte eines jeden nachfolgenden Datenbitintervalls festzulegen.
Sobald dies erfolgt ist, wird in einem Schritt 483 die SYNCH-Flagge zurückgesetzt, um anzuzeigen, dass der DSP dann nach dem Vorhandensein eines der beiden möglichen Bitzustände sucht Das Unterprogramm DET 452 wird erneut aufgerufen, und unter Bezugnahme auf Fig 12B wird das Unterprogramm in der gleichen Weise wie oben beschrieben bis zum Schritt 462 ausge- führt, indem der Zustand der SYNCH-Flagge anzeigt, dass ein Bitzustand bestimmt werden sollte,
<Desc/Clms Page number 27>
und die Verarbeitung geht dann zum Schritt 486. Im Schritt 486 sucht der DSP nach dem Vorhan- densein von Kodekomponenten, die entweder einen Bitzustand von 0 oder einen Bitzustand von 1 in der oben beschriebenen Weise anzeigen.
Sobald dies erfolgt ist, kehrt die Verarbeitung beim Schritt 470 zur Hauptverfahrensschleife der Fig. 12A in Schritt 490 zurück, wo bestimmt wird, ob genügend Daten erhalten worden sind, um den Bitzustand zu bestimmen. Hierfür müssen mehrere Durchgänge durch das Unterprogramm 452 erfolgen, so dass nach dem ersten Durchgang die Verarbeitung ein Unterprogramm DET 452 zurückkehrt, um eine weitere Auswertung auf der Grundlage einer neuen FFT auszuführen Sobald das Unterprogramm 452 eine vorbestimmte Anzahl von Malen durchlaufen worden ist, werden im Schritt 486 die auf diese Weise gesammelten Daten ausgewertet, um zu bestimmen, ob die erhal- tenen Daten entweder einen Zustand von 0, einen Zustand von 1 oder einen unbestimmten Zu- stand angeben (was unter Verwendung von Paritätsdaten gelöst werden konnte).
Das bedeutet, dass die Gesamtheit der "0"-Bereich-SNR's mit der Gesamtheit der "1"-Bereich-SNR's verglichen wird. Der grössere der beiden Werte bestimmt den Datenzustand, und wenn die Werte gleich sind, ist der Datenzustand unbestimmt Wenn in einem alternativen Fall die Gesamtheiten der "0"-Bereich-SNRs und "1"-Bereich-SNRs nicht gleich sind, sondern ziemlich dicht beieinanderlie- gen, kann ein unbestimmter Datenzustand erklärt werden. Auch wird dann, wenn eine grössere Anzahl von Datensymbolen verwendet wird, das Symbol, für das die höchste SNR-Summierung gefunden worden ist, als das erhaltene Symbol bestimmt.
Wenn die Verarbeitung erneut zum Schritt 490 zurückkehrt, wird die Bestimmung des Bitzu- stands detektiert und die Verarbeitung geht zu einem Schritt 492 weiter, worin der DSP Daten im Speicher 270 ablegt, die den Zustand des jeweiligen Bits zum Zusammensetzen eines Wortes anzeigen, das eine vorbestimmte Anzahl von Symbolen aufweist, die durch die kodierten Kompo- nenten im aufgenommenen Audiosignal dargestellt werden. Danach wird in einem Schritt 496 bestimmt, ob die aufgenommenen Daten sämtliche Bits des kodierten Worts oder der Meldung geliefert haben. Wenn nicht, kehrt die Verarbeitung zum DET-Unterprogramm 452 zurück, um den Bitzustand des als nächstes erwarteten Meldungssymbols zu bestimmen.
Wenn allerdings in Schritt 496 festgestellt wird, dass das letzte Symbol der Meldung aufgenommen worden ist, kehrt die Verarbeitung zum Schritt 450 zurück, um die SYNCH-Flagge zu setzen und nach dem Vorhan- densein einer neuen Meldung zu suchen, indem das Vorhandensein von deren Synchronisations- symbolen detektiert wird, wie sie durch die Kodekomponenten des kodierten Audiosignals darge- stellt werden.
Nunmehr auf Fig. 13 Bezug nehmend, werden in bestimmten Ausführungsformen Audiosignal- komponenten, die keinen Kode darstellen, und/oder anderes Rauschen (in diesem Zusammen- hang gemeinsam als "Rauschen" bezeichnet) verwendet, um einen Vergleichswert wie beispiels- weise eine Schwelle zu erzeugen, wie durch den funktionalen Block 276 angegeben. Ein oder mehrere Teile des kodierten Audiosignals werden mit dem Vergleichswert verglichen, wie durch den funktionalen Block 277 angegeben, um das Vorhandensein von Kodekomponenten zu detek- tieren. Vorzugsweise wird das kodierte Audiosignal zuerst verarbeitet, um Komponenten innerhalb des Frequenzbands oder der -bänder zu isolieren, die Kodekomponenten enthalten können, und diese werden dann während einer Zeitspanne angesammelt, um Rauschen herauszumitteln, wie durch den funktionalen Block 278 angegeben.
Nunmehr auf Fig. 14 Bezug nehmend, ist hierbei eine Ausführungsform eines analogen Deko- dierers in Übereinstimmung mit der vorliegenden Erfindung in Form eines Blockschaltbilds erläu- tert. Der Dekodierer nach Fig. 14 beinhaltet einen Eingangsanschluss 280, der mit vier Gruppen von Komponentendetektoren 282,284, 286 und 288 verbunden ist. Jede Gruppe von Komponentende- tektoren 282 bis 288 dient zur Erfassung des Vorhandenseins von Kodekomponenten in dem Eingangs-Audiosignal, die ein jeweiliges Kodesymbol darstellen. In der Ausführungsform nach Fig. 14 ist die Dekodiervornchtung so eingerichtet, dass sie das Vorhandensein einer beliebigen von 4N Kodekomponenten erfasst, wobei N eine ganze Zahl ist, so dass der Kode aus vier unterschiedli- chen Symbolen besteht, die jeweils durch eine eindeutige Gruppe von N Kodekomponenten dar- gestellt werden.
Demgemäss enthalten die vier Gruppen 282 bis 288 4N Komponentendetektoren
Eine Ausführungsform von einem der 4N Komponentendetektoren der Gruppen 282 bis 288 ist in Form eines Blockschaltbilds in Fig. 15 dargestellt und dort als Komponentendetektor 290 be- zeichnet Der Komponentendetektor 290 weist einen Eingang 292 auf, der mit dem Eingang 280
<Desc/Clms Page number 28>
des Dekodierers nach Fig. 14 verbunden ist, um das kodierte Audiosignal aufzunehmen. Der Kom- ponentendetektor 290 hat einen oberen Schaltungszweig mit einem Rauschschätzfilter 294, das in einer Ausführungsform die Form eines Bandfilters annimmt, das einen relativ weiten Durchlassbe- reich zum Durchlassen von Audiosignalenergie innerhalb eines Bandes aufweist, das auf der Frequenz der jeweiligen Kodekomponente, die zu erfassen ist, zentriert ist.
Alternativ und vorzugs- weise weist das Rauschschätzfilter 294 stattdessen zwei Filter auf, von denen eines einen Durch- lassbereich hat, der sich von oberhalb der Frequenz der jeweiligen Kodekomponente, die zu erfas- sen ist, erstreckt, und ein zweites Filter mit einem Durchlassbereich mit einem oberen Rand unter- halb der Frequenz der zu erfassenden Kodekomponente, so dass die beiden Filter gemeinsam Energie durchlassen, deren Frequenzen oberhalb und unterhalb der Frequenz der zu erfassenden Komponente liegt, wobei die Frequenzen diese Frequenz zwar nicht einschliessen, aber benachbart dazu liegen.
Ein Ausgang des Rauschschätzfilters 294 ist mit einem Eingang einer Absolutwert- schaltung 296 verbunden, die ein Ausgangssignal erzeugt, das den Absolutwert des Ausgangssig- nals des Rauschschätzfilters 294 darstellt und an den Eingang eines Integrators gibt, der die an seinen Eingang gelangenden Signale ansammelt, um einen Ausgangswert zu erzeugen, der die Signalenergie innerhalb von Teilen des Frequenzspektrums benachbart zu, aber nicht einschliess- lich der Frequenz der zu erfassenden Komponente darstellt, und der diesen Wert an einen nicht invertierenden Eingang eines Differenzverstärkers 202 ausgibt, der als logarithmischer Verstärker arbeitet.
Der Komponentendetektor nach Fig. 15 weist weiterhin einen unteren Zweig auf, der ein Sig- nalschätzfilter 306 enthält, welches einen Eingang hat, der mit dem Eingang 292 zum Aufnehmen des kodierten Audiosignals verbunden ist und dazu dient, ein Band von Frequenzen durchzulas- sen, das wesentlich schmaler als das relativ breite Band des Rauschschätzfilters 294 ist, so dass das Signalschätzfilter 206 Signalkomponenten im wesentlichen nur bei der Frequenz der zu erfas- senden Kodesignalkomponente durchlässt. Das Signalschätzfilter 306 hat einen Ausgang, der an einen Eingang eines weiteren Absolutwertkreises 308 angeschlossen ist, der dazu dient, an sei- nem Ausgang ein Signal bereitzustellen, das einen Absolutwert des durch das Signalschätzfilter 306 durchgelassenen Signals darstellt.
Der Ausgang des Absolutwertkreises 308 ist an einen Eingang eines weiteren Integrators 310 angeschlossen. Der Integrator 310 sammelt die vom Kreis 308 ausgegebenen Werte an, um ein Ausgangssignal zu erzeugen, das die Energie innerhalb eines schmalen Durchlassbands des Signalschätzfilters während einer vorbestimmten Zeitspanne darstellt.
Beide Integratoren 300 und 310 haben einen Rücksetzungsanschluss, der zur Aufnahme eines gemeinsamen Rücksetzungssignals angeschlossen ist, das an einem Anschluss 312 angelegt wird.
Das Rücksetzungssignal wird von einer in Fig. 14 erläuterten Steuerschaltung 314 geliefert, die das Rücksetzungssignal regelmässig erzeugt.
Nochmals auf Fig. 15 Bezug nehmend, wird der Ausgang des Integrators 310 an einen invertie- renden Eingang des Verstärkers 302 gegeben, der so wirkt, dass er ein Ausgangssignal erzeugt, das der Differenz zwischen dem Ausgangswert des Integrators 310 und dem des Integrators 300 entspricht. Da der Verstärker 302 ein logarithmischer Verstarker ist, wird der Bereich der möglichen Ausgangswerte zusammengedrückt, um den Dynamikbereich des Ausgangs zu reduzieren, um ihn an einen Fensterkomparator 316 zu geben, um das Vorhandensein oder die Abwesenheit einer Kodekomponente während eines gegebenen Intervalls zu detektieren, welches durch den Steuer- kreis 314 über Abgabe des Rücksetzungssignals bestimmt ist.
Der Fensterkomparator gibt in dem Fall, dass das von dem Verstärker 302 gelieferte Eingangssignal zwischen eine untere Schwelle, die als feststehender Wert an einem Eingangsanschluss des Komparators 316 für die untere Schwelle anliegt, und eine feststehende obere Schwelle fällt, die an einem Eingangsanschluss des Komparators 316 für die obere Schwelle anliegt, ein Kode-Anwesenheitssignal ab
Nochmals auf Fig. 14 Bezug nehmend, gibt jeder der N Komponentendetektoren 290 aus jeder Komponentendetektorgruppe den Ausgang seines jeweiligen Fensterkomparators 316 an einen Eingang einer Kodebestimmungs-Logikschaltung 320.
Die Schaltung 320 sammelt unter der Steu- erung der Steuerschaltung 314 die unterschiedlichen Kode-Anwesenheitssignale von den 4N Kom- ponentendetektorschaltungen 290 für eine mehrfache Anzahl von Rücksetzungszyklen, wie sie durch die Steuerschaltung 314 aufgestellt werden. Nach Beendigung des Intervalls für die Erfas- sung eines gegebenen Symbols, das wie nachfolgend beschrieben aufgestellt wird, bestimmt die
<Desc/Clms Page number 29>
Kodebestimmungs-Logikschaltung 320, welches Kodesymbol erhalten wurde, als das Symbol, für das die grösste Anzahl von Komponenten während des Intervalls erfasst wurden, und gibt ein Signal, das das erfasste Kodesymbol angibt, an einen Ausgangsanschluss 322 ab.
Das Ausgangssignal kann in einem Speicher gespeichert werden, in eine grössere Meldung oder eine Datei eingesetzt werden, gesendet oder in sonstiger Weise genutzt werden (beispielsweise als Steuersignal).
Die Symbolerfassungsintervalle für die oben in Zusammenhang mit den Fig 11,12A, 12B, 14 und 15 beschriebenen Dekodierer können auf der Grundlage des Timings von Synchronisations- symbolen aufgestellt werden, die mit jeder kodierten Meldung übertragen werden und die eine vorbestimmte Zeitdauer und Reihenfolge aufweisen. Beispielsweise kann eine kodierte Meldung, die in einem Audiosignal enthalten ist, aus zwei Datenintervallen des kodierten E-Symbols gefolgt von zwei Datenintervallen des kodierten S-Symbols bestehen, beide wie oben im Zusammenhang mit Fig. 4 beschrieben. Die Dekodierer nach Fig. 11,12A, 12B, 14 und 15 arbeiten anfangs so, dass sie nach dem Vorhandensein des ersten vermuteten Synchronisationssymbols suchen, d.h. nach dem kodierten E-Symbol, das während einer vorbestimmten Zeitspanne übertragen wird, und dessen Übertragungsintervall bestimmen.
Danach suchen die Dekodierer nach dem Vorhanden- sein der Kodekomponenten, die das Symbol S charakterisieren, und bestimmen, sobald dieses detektiert ist, sein Übertragungsintervall. Aus den detektierten Übertragungsintervallen wird der Übergangspunkt vom E-Symbol zum S-Symbol bestimmt, und von diesem Punkt werden die Detektionsintervalle für jedes der Datenbitsymbole gesetzt. Während jedes Detektionsintervalls sammelt der Dekodierer die Kodekomponenten, um das jeweilige Symbol zu bestimmen, das während dieses Intervalls in der oben beschriebenen Weise übertragen wird.
Obwohl verschiedene Elemente der Ausführungsform nach Fig. 14 und 15 mit analogen Schal- tungen implementiert sind, sei angemerkt, dass die gleichen Funktionen, die in diesen Schaltungen ausgeführt werden, ganz oder teilweise mittels digitaler Schaltungen implementiert sein können
Nunmehr auf Fig. 16 und 17 Bezug nehmend, ist ein System zum Erzeugen von Schätzungen der Zuhörerschaft von weithin gesendeten Informationen dargestellt, wie etwa im Falle von Fern- seh- und Radioprogrammen. Fig. 16 ist ein Blockdiagramm einer Rundfunkstation zum drahtlosen Aussenden von Audiosignalen, die kodiert worden sind, um die Station zusammen mit einer Sen- dezeit zu identifizieren. Wenn gewünscht, kann die Identität eines Programms oder eines Seg- ments, das gesendet wird, ebenfalls enthalten sein.
Eine Programmaudioquelle 340, wie beispiels- weise ein Kompakt-Disk-Abspielgerät, ein digitales Tonbandgerät oder auch eine Live-Tonquelle wird vom Stationsleiter mittels einer Steuervorrichtung 342 gesteuert, um die zu sendenden Audio- signale in gesteuerter Weise abzugeben. Ein Ausgang 344 der Programmaudioquelle ist mit einem Eingang eines Kodierers 348 in Übereinstimmung mit der Ausführungsform nach Fig. 3 verbunden, der den DSP 104, das Bandfilter 120, den Analog/Digital-Wandler (A/D) 124, den Digital/Analog- Wandler (DAC) 140 und die Summierschaltung 142 enthält. Die Steuervorrichtung 342 enthält den Hauptprozessor 90, das Tastenfeld 96 und den Monitor 100 der Ausführungsform nach Fig. 3, so dass der Hauptprozessor, der innerhalb der Steuervorrichtung 342 sitzt, mit dem DSP verbunden ist, der im Kodierer 348 nach Fig. 16 enthalten ist.
Der Kodierer 348 arbeitet unter der Steuerung der Steuervorrichtung 342, um eine kodierte Meldung periodisch in das zu sendende Audiosignal einzufügen, wobei die Meldung geeignete Identifizierungsdaten enthält Der Kodierer 348 gibt das kodierte Audiosignal an den Eingang eines Radiosenders 350, der eine Trägerwelle mit dem kodierten Programmaudiosignal moduliert und diese mittels einer Antenne 352 drahtlos aussendet Der in der Steuervorrichtung 342 enthaltene Hauptprozessor wird über die Tastatur programmiert, um den Kodierer anzusteuern, damit er die geeignete kodierte Meldung einschliesslich der Identifi- zierungsdaten der Station abgibt. Der Hauptprozessor erzeugt automatisch die Sendezeitdaten mittels einer darin enthaltenen Referenz-Zeitgeberschaltung.
Nunmehr auch auf Fig. 17 Bezug nehmend, ist eine Personenüberwachungsvornchtung 380 des Systems in einem Gehäuse 382 eingeschlossen, das ausreichend klein bemessen ist, damit es eine Person an sich tragen kann, die Mitglied einer Hörerschaft ist und an einer Übersicht bzw.
Schätzung der Zuhörerschaft teilnimmt. Jedes aus einer Anzahl von Mitgliedern der Zuhörerschaft besitzt eine Personenuberwachungsvorrichtung, wie etwa die Vorrichtung 380, die jede Person, die
Mitglied der Zuhörerschaft ist, während bestimmter Zeiten eines jeden Tages während der Über- wachungsperiode, beispielsweise einer vorbestimmten Zeit von einer Woche, an sich tragen muss.
Die Personenüberwachungsvorrichtung 380 enthält ein in alle Richtungen empfindliches Mikrophon
<Desc/Clms Page number 30>
386, das Geräusche aufnimmt, die das die Vorrichtung 380 tragende Mitglied der Zuhörerschaft vernimmt, einschliesslich Radioprogramme, die vom Lautsprecher eines Radioempfängers, wie beispielsweise des Radioempfängers 390 in Fig. 17, als Schall bzw. Töne wiedergegeben werden.
Die Personenüberwachungsvorrichtung 380 weist weiterhin eine Signalkonditionierungsschal- tung 394 auf, deren Eingang mit einem Ausgang des Mikrophons 386 verbunden ist und dazu dient, dessen Ausgang zu verstärken und diesen einer Bandfilterung zu unterwerfen, sowohl um Frequenzen zu dämpfen, die sich ausserhalb eines Audiofrequenzbands befinden, das die unter- schiedlichen Frequenzkomponenten des in das Programmaudiosignal durch den Kodierer 348 nach Fig. 16 eingefügten Kodes beinhaltet, als auch, um eine Anti-Aliasing-Filterung vor der Ana- log/Digital-Wandlung auszuführen.
Die digitale Schaltung der Personenüberwachungsvorrichtung 380 ist in Fig. 16 in einer funkti- onalen Blockdiagrammform dargestellt, wobei ein Dekodierblock und ein Steuerblock vorhanden sind, die beide beispielsweise mittels eines digitalen Signalprozessors implementiert sein können.
Ein Programm- und ein Datenspeicher 404 ist sowohl mit dem Dekodierer 400 verbunden, um die detektierten Kodes zur Speicherung zu erhalten, als auch mit dem Steuerblock 402, um die Schreib- und Lesevorgänge des Speichers 404 zu steuern. Eine Ein- und Ausgabeschaltung 406 (I/O) ist mit dem Speicher 404 verbunden, um Daten zu erhalten, die von der Personenüberwa- chungsvorrichtung 380 abzugeben sind, und auch um Informationen wie etwa Programmbefehle darin zu speichern. Die 1/0-Schaltung 406 ist weiterhin mit dem Steuerblock 402 verbunden, um die Ein- und Ausgabevorgänge der Vorrichtung 380 zu steuern.
Der Dekodierer 400 arbeitet in Obereinstimmung mit dem Dekodierer von Fig. 11, der oben be- schrieben wurde, und gibt Stationsidentifizierungs- und Zeitkodedaten ab, die im Speicher 404 zu speichern sind. Die Personenüberwachungsvorrichtung 380 weist weiterhin einen Anschluss auf, der schematisch mit 410 bezeichnet ist, um die im Speicher 404 gespeicherten, gesammelten Stationsidentifizierungs- und Zeitkodedaten auszugeben und auch um Befehle von einer externen Vorrichtung zu erhalten.
Die Personenüberwachungsvorrichtung 380 ist vorzugsweise zum Betrieb mit der Andockstati- on in der Lage, die in der US-Patentanmeldung mit der Seriennummer 08/101,558 (eingereicht am 2. August 1993) mit dem Titel "Compliance Incentives for Audience Monitoring/Recording Devices" beschrieben ist, deren Offenbarung hierin durch Bezugnahme aufgenommen ist. Zusätzlich ist die Personenüberwachungsvorrichtung 380 vorzugsweise mit den weiteren Merkmalen der tragbaren Rundfunkexpositionsüberwachungsvornchtung versehen, die ebenfalls in der genannten US-Pa- tentanmeldung beschrieben ist
Die Andockstation kommuniziert mittels eines Modems über Telefonleitungen mit einer zentra- lisierten Datenverarbeitungsanlage, um die Identifizierungs- und Zeitkodedaten dort abzugeben, um Berichte hinsichtlich des Zuschauer- bzw.
Hörergrads der Zuhörerschaft zu erzeugen Die zentralisierte Anlage kann auch Informationen an die Andockstation für deren eigene Verwendung und/oder für die Vorrichtung 380 herunterladen, beispielsweise ausführbare Programminformatio- nen. Die zentralisierte Anlage kann auch Informationen an die Andockstation und/oder die Vornch- tung 380 über einen Radiofrequenzkanal weitergeben, beispielsweise einen vorhandenen FM- Rundfunk, der mit dieser Information nach Art der vorliegenden Erfindung kodiert ist. Die Andock- station und/oder die Vorrichtung 380 ist mit einem FM-Empfänger versehen (aus Zwecken der Einfachheit und Klarheit nicht dargestellt), der den kodierten FM-Rundfunk demoduliert, um ihn an einen Dekodierer in Übereinstimmung mit der vorliegenden Erfindung weiterzuleiten.
Der kodierte FM-Rundfunk kann auch über Kabel oder ein anderes Übertragungsmedium bereitgestellt werden
Zusätzlich zur Überwachung durch Personenüberwachungseinheiten können ortsfeste Einhei- ten verwendet werden, beispielsweise Aufsatzeinheiten. Die Aufsatzeinheiten können zum Auf- nehmen des kodierten Audiosignals in elektrischer Form von einem Empfänger angeschlossen sein, oder sie können ein Mikrophon verwenden, wie etwa das Mikrophon 386 nach Fig. 17. Die Aufsatzeinheiten können dann Kanäle überwachen, die unter Verwendung der vorliegenden Erfin- dung ausgewählt sind, wobei sie zusätzlich wahlweise die Zusammensetzung der Zuhörerschaft überwachen können.
* Es bieten sich weitere Anwendungen für die Kode- und Dekodierungstechniken nach der vor- liegenden Erfindung an. Bei einer Anwendung werden die Tonspuren von Werbespots mit Kodes zur Identifizierung versehen, um eine Überwachung der Werbung zu ermöglichen, damit gewähr-
<Desc/Clms Page number 31>
leistet ist, dass Werbespots durch Fernsehen, Rundfunk oder in sonstiger Form zu vorab vereinbar- ten Zeiten gesendet worden sind.
Bei anderen Anwendungen werden Steuersignale in Form von Kodes übertragen, die gemäss der vorliegenden Erfindung erzeugt sind. Bei einer derartigen Anwendung empfängt ein interakti- ves Spielzeug ein kodiertes Steuersignal, das im Audioteil einer Fernseh-, Rundfunk- oder Tonauf- nahme enthalten ist, und dekodiert dieses, worauf es dann darauf ansprechend eine Aktion vor- nimmt.
In einer anderen Anwendung sind Eltern-Kontrollcodes in den Audioteilen von Fernseh-, Radio- oder Tonaufzeichnungen enthalten, so dass eine Empfangs- oder Wiedergabeeinrichtung durch Dekodieren dieser Kodes eine bestimmte elterliche Kontroll- oder Steuerfunktion ausfuhren kann, um selektiv den Empfang oder die Wiedergabe von Sendungen oder Aufzeichnungen zu verhindern Weiterhin können Kontrollcodes in zellulären Telefonübermittlungen eingefügt werden, um einen nicht autorisierten Zugang zur Benutzung von zellulären Telefon-ID's zu verhindern. Bei anderen Anwendungen werden Kodes in Telefonübermittlungen eingefügt, um Sprach- und Daten- übermittlungen voneinander zu unterscheiden und die Wahl eines Übertragungswegs in geeigneter Weise zu steuern, damit die Zerstorung von übermittelten Daten vermieden wird.
Weiterhin konnen verschiedene Senderidentifikationsfunktionen implementiert werden, um bei- spielsweise die Echtheit von militärischen Übermittlungen oder der Sprachkommunikation mit Luft- fahrzeugen zu gewährleisten. Anwendungen zu Überwachungszwecken bieten sich ebenfalls an In einer derartigen Anwendung tragen Teilnehmer von Marktforschungsstudien persönliche Über- wachungsvorrichtungen, die kodierte Meldungen empfangen, die den an die Öffentlichkeit gerichte- ten Mitteilungen oder ähnlichen Audiosignalen in Einzelhandelsgeschäften oder Kaufhäusern hinzugefügt werden, um die Anwesenheit der Teilnehmer aufzuzeichnen.
In anderen Anwendungs- formen tragen Angestellte Personalüberwachungsvorrichtungen, die Audiosignalen am Arbeitsplatz hinzugefügte kodierte Meldungen empfangen, um die Anwesenheit des Personais an bestimmten Plätzen zu überwachen.
Weiterhin sind sichere Kommunikationen unter Verwendung der Kode- und Dekodierungstech- niken nach der vorliegenden Erfindung durchführbar. Bei einer derartigen Anwendung werden sichere Unterwasserkommunikationen durch Kodieren und Dekodieren nach der vorliegenden Erfindung ausgeführt, indem entweder Kodekomponentenniveaus zugewiesen werden, so dass die Kodes durch die umgebenden Unterwassergeräusche oder durch eine Geräuschquelle, die ihren Ursprung am Ort des Kodesenders hat, verdeckt werden. In anderen Anwendungen werden siche- re Personenrufsendungen durch Einfügen von verdeckten Kodes in andere drahtlose Audiosignal- sendungen durchgeführt, die von einer Personenrufeinrichtung empfangen und dekodiert werden
Die Kode- und Dekodierungstechniken nach der vorliegenden Erfindung können auch dazu verwendet werden, um Sprachsignaturen zu authentifizieren.
Beispielsweise kann in einer Anwen- dung für telefonisch erteilte Aufträge eine gespeicherte Sprachprobe mit einer tatsächlichen Stim- me verglichen werden. In einem anderen Beispiel können Daten wie etwa eine Sicherheitsnummer und/oder die Tageszeit kodiert und mit einer gesprochenen Äusserung kombiniert werden und anschliessend dekodiert werden, wobei die Daten für eine automatisch gesteuerte Verarbeitung der gesprochenen Äusserung verwendet werden.
Die Codierungsvorrichtung kann in diesem Anwen- dungsfall entweder eine Zusatzeinrichtung für ein Telefon oder für ein sonstiges Sprachkommuni- kationsgerät sein, oder es kann sich um eine getrennte, feststehende Einheit handeln, die verwen- det wird, wenn die gesprochene Äusserung unmittelbar gespeichert wird, ohne dass sie über Tele- fonleitungen oder in sonstiger Weise ausgesendet wird Eine weitere Anwendung ist die Bereitstel- lung eines Authentifizierungskodes im Speicher eines tragbaren Telefons, so dass die gesprochene Sprache den Authentifikationskode enthält und dadurch die Detektierung von unautorisierten Übermittlungen ermöglicht.
Es ist ebenfalls möglich, eine bessere Ausnutzung der Bandbreite von Kommunikationskanälen durch die Einfügung von Daten in Sprach- oder sonstigen Audioübermittlungen zu erreichen. Bei einer derartigen Anwendung werden Daten, die Messwerte von Instrumenten von Luftfahrzeugen angeben, den Sprachübertragungen zwischen Luftfahrzeug und Bodenstation eingefügt, um die
Bodenkontrollstellen über die Betriebszustande des Luftfahrzeugs zu informieren, ohne dass getrennte Sprach- und Datenkanale notwendig sind Die Kodeniveaus werden so gewählt, dass die
Kodekomponenten durch die Sprachübertragungen verdeckt werden, so dass eine Interferenz bzw
Störung vermieden wird.
<Desc/Clms Page number 32>
(Magnet-) Bandpiraterie, d.h. das unautorisierte Kopieren von durch Copyright geschützten Werken wie beispielsweise Audio- oder Videoaufzeichnungen und Musik kann ebenfalls durch Kodieren einer eindeutigen Identifizierungsnummer in den Audioteil einer jeden autorisierten Kopie mittels der Codierungstechnik der vorliegenden Erfindung detektiert werden. Wenn die kodierte Identifizierungsnummer auf mehreren Kopien entdeckt wird, ist es offensichtlich, dass ein unautori- siertes Kopieren stattgefunden hat
Bei einer weiteren Anwendung werden die Programme bestimmt, die unter Verwendung eines VCR, enthaltend einen Dekodierer nach der vorliegenden Erfindung, aufgezeichnet worden sind.
Videoprogramme, wie beispielsweise Unterhaltungsprogramme, Werbespots etc., werden gemäss der vorliegenden Erfindung mit einem Identifizierungscode kodiert, der das Programm identifiziert.
Wenn der VCR in Aufnahmemodus gebracht wird, werden die Audioteile der aufzuzeichnenden Signale dem Dekodierer zugeführt, um die darin enthaltenen Identifizierungskodes zu detektieren.
Die detektierten Kodes werden in einem Speicher des VCR zum späteren Gebrauch bei der Erstel- lung eines Berichts über die Aufzeichnungsbenutzung abgelegt.
Daten, die die durch Copyright geschützten Werke angeben, die durch eine Rundfunkstation oder in sonstiger Weise von einem Dienstleistungsunternehmen übertragen werden, können unter Verwendung der vorliegenden Erfindung gesammelt werden, um eine Haftung für Copyrightgebüh- ren sicherzustellen. Die Werke werden mit einem jeweiligen Identifizierungscode kodiert, um sie eindeutig zu identifizieren. Eine Überwachungseinheit, der die über Rundfunk oder in sonstiger Weise gesendeten bzw. übermittelten Signale über eine oder mehrere Stationen oder Dienstleister zugeführt werden, gibt die Audioteile der Signale an einen Dekodierer gemäss der vorliegenden Erfindung, der die darin enthaltenen Identifizierungskodes detektiert. Die detektierten Kodes wer- den in einem Speicher abgelegt, um einen Bericht zu erstellen, der zur Bestimmung der Gebühren bzw.
Lizenzeinnahmen verwendet werden kann.
Dekodierer, die gemäss dem Motion Picture Experts Group (MPEG) 2-Standard vorgeschlagen worden sind, beinhalten bereits einige Elemente der akustischen Erweiterungsverarbeitung, die erforderlich ist, um die nach der vorliegenden Erfindung kodierten Daten zu extrahieren, so dass Techniken zur Aufnahmesperre (um beispielsweise ein unautorisiertes Aufnehmen von durch Copyright geschützten Werken zu verhindern), die Kodes nach der vorliegenden Erfindung ver- wenden, sich gut für MPEG 2-Dekodierer eignen.
Ein geeigneter Dekodierer nach der vorliegenden Erfindung wird in dem Aufzeichnungsgerät oder als Zusatzteil dazu vorgesehen und detektiert das Vorhandensein eines Kopierschutzkodes in einem einer Aufzeichnung zugeleiteten Audiosignal Das Aufzeichnungsgerät spricht auf den so detektierten Sperrkode an, indem es die Aufzeichnung des entsprechenden Audiosignals und eines etwaigen Begleitsignals, beispielsweise eines Video- signals, verhindert. Informationen zum Copyright, die gemäss der vorliegenden Erfindung kodiert werden, liegen innerhalb des Bandes, benötigen keine zusätzliche Synchronisation oder Timing oder begleiten in problemloser Weise das Programmaterial.
Bei weiteren Anwendungen sind in Programmen, die drahtlos, über Kabel oder in sonstiger Weise übertragen werden oder in anderen Programmen, die auf Band, Platte oder in sonstiger Weise aufgezeichnet sind, Audioteile enthalten, die mit Steuersignalen zur Verwendung durch Vorrichtungen kodiert sind, die von einem oder mehreren Zuschauer bzw. Zuhörer bedient werden.
Beispielsweise enthält ein Programm, das den von einem Radfahrer zu fahrenden Weg abbildet, einen Audioteil, der in Übereinstimmung mit der vorliegenden Erfindung mit Steuersignalen kodiert ist, die zur Verwendung mit einem ortsfesten Trainingsfahrrad zum Steuern des Pedalwiderstands oder des Fahrwiderstands entsprechend der Steigung des abgebildeten Wegs dienen. Wenn der Benutzer auf dem ortsfesten Fahrrad in die Pedale tritt, sieht er oder sie das Programm auf einem Bildschirm oder einem sonstigen Monitor, und der Audioteil des Programms wird als Ton wieder- gegeben. Ein Mikrophon an dem ortsfesten Fahrrad überträgt den wiedergegebenen Ton, und ein Dekodierer nach der vorliegenden Erfindung detektiert die darin enthaltenen Steuersignale und gibt diese an eine Steuereinheit für den Pedalwiderstand des Trainingsfahrrads.
Aus den vorstehenden Ausführungen wird deutlich, dass die Techniken nach der vorliegenden
Erfindung ganz oder teilweise unter Verwendung von analogen oder digitalen Schaltungen umge- setzt werden können, und dass alle oder ein Teil der Signalverarbeitungsfunktionen entweder durch festverdrahtete Schaltungen oder durch Verwendung von digitalen Signalprozessoren, Mikropro- zessoren, Mikrocomputern, Mehrfachprozessoren (beispielsweise parallele Prozessoren) oder
<Desc/Clms Page number 33>
ähnlichem ausgeführt werden können.
Die in der vorangehenden Beschreibung, in der Zeichnung sowie in den Ansprüchen offenbar- ten Merkmale der Erfindung können sowohl einzeln als auch in beliebigen Kombinationen fur die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.
PATENTANSPRÜCHE:
1 Vorrichtung zum Einfügen eines Kodes, der wenigstens eine Kode-Frequenzkomponente aufweist, in ein Audiosignal (30), das eine Anzahl von Audiosignal-Frequenzkomponenten aufweist, umfassend: eine erste Einrichtung (34) zum Bewerten der Verdeckungseignung eines ersten Satzes aus der Anzahl von Audiosignal-Frequenzkomponenten, um die wenigstens eine Kode-
Frequenzkomponente gegenüber der menschlichen Hörwahrnehmung zu verdecken, um erste Verdeckungsinformationen zu erzeugen; eine zweite Einrichtung zum Bewerten einer Verdeckungseignung eines zweiten Satzes aus der Anzahl von Audiosignal-Frequenzkomponenten, die sich von deren erstem Satz unterscheiden, um die wenigstens eine Kode-Frequenzkomponente gegenüber der menschlichen Hörwahrnehmung zu verdecken, um zweite Verdeckungsinformationen zu erzeugen;
eine Einrichtung (40) zum Zuweisen einer Amplitude an die wenigstens eine Kode-Fre- quenzkomponente auf der Grundlage einer Verdeckungsbewertung, die unter den ersten und zweiten Verdeckungsinformationen ausgewählt ist, und eine Kode-Einfügungseinrichtung (46) zum Einfügen der wenigstens einen Kode-Fre- quenzkomponente in das Audiosignal (30).