DE69810851T2 - Verfahren für die Kompression der Aufnahmen von Umgebungsgeräuschen, Verfahren für die Erfassung von Programmelementen darin, Vorrichtung und Computer-Programm dafür - Google Patents

Verfahren für die Kompression der Aufnahmen von Umgebungsgeräuschen, Verfahren für die Erfassung von Programmelementen darin, Vorrichtung und Computer-Programm dafür Download PDF

Info

Publication number
DE69810851T2
DE69810851T2 DE69810851T DE69810851T DE69810851T2 DE 69810851 T2 DE69810851 T2 DE 69810851T2 DE 69810851 T DE69810851 T DE 69810851T DE 69810851 T DE69810851 T DE 69810851T DE 69810851 T2 DE69810851 T2 DE 69810851T2
Authority
DE
Germany
Prior art keywords
values
signal
correlation
samples
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69810851T
Other languages
English (en)
Other versions
DE69810851D1 (de
Inventor
Martin Bichsel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liechti AG
Fred Liechti AG
Original Assignee
Liechti AG
Fred Liechti AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liechti AG, Fred Liechti AG filed Critical Liechti AG
Publication of DE69810851D1 publication Critical patent/DE69810851D1/de
Application granted granted Critical
Publication of DE69810851T2 publication Critical patent/DE69810851T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Recording Measured Values (AREA)
  • Electric Clocks (AREA)
  • Force Measurement Appropriate To Specific Purposes (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur Kompression eines elektrischen Audiosignals, welches bei der Aufnahme von Umgebungsgeräuschen mittels eines elektroakustischen Wandlers, insbesondere eines Mikrophons erzeugt wird. Weiterhin betrifft die Erfindung auch eine Vorrichtung zur Durchführung des Verfahrens, ein Computerprogramm zur Durchführung des Verfahrens und einen Datenträger, der ein solches Computerprogramm enthält.
  • Auf dem Gebiet der Zuhörerforschung, welches ebenfalls die akustische Wahrnehmung anderen Medien wie beispielsweise Fernsehen beinhaltet, werden Aufnahmen aus der akustischen Umgebung eines Teilnehmers an einer Untersuchung verwendet, d. h. die sogenannten Hörproben. Das Speichern dieser Hörproben auf tragbaren Bandaufnahmegeräten ist in US 5 023 929 offenbart. Der Nachteil dieses Verfahrens liegt darin, dass das Aufnahmegerät relativ gross ist, obwohl es vom Teilnehmer ständig getragen werden soll.
  • Es wäre daher vorteilhafter, das Aufnahmegerät für die Hörproben bzw. den Monitor in ein Gerät zu integrieren, welches ohnehin getragen wird oder zumindest weniger sichtbar ist. Eine solche Möglichkeit, nämlich die Integration in eine Armbanduhr, ist in EP-A-0 598 682 des Anmelders beschrieben.
  • In der erwähnten Anmeldung ist jedoch nicht angegeben, wie die Hörproben im äusserst engen Raum und mit der sehr beschränkten Energie, welche in einer Armbanduhr oder einem ähnlich unauffälligen Gerät zur Verfügung steht, während einer beträchtlichen Zeitdauer von mindestens einer Woche gespeichert werden können. Obwohl die Notwendigkeit von Kompressionsverfahren in der Beschreibung erwähnt wird, sind nur bekannte Verfahren angegeben.
  • US-4 450 531 offenbart ein Verfahren zum Vergleich eines gesendeten Signals mit Vergleichsproben zur Bestimmung des empfangenen Programms. Aus den Proben des gesendeten Signals, welche beispielsweise von einem Tuner empfangen werden, wird ein Frequenzband herausgefiltert und einer Fouriertransformation unterzogen. Die Vergleichsproben werden in nahezu derselben Weise behandelt, jedoch zusätzlich auf die Leistung der jeweiligen Probe normalisiert und erst danach der Fouriertransformation unterzogen. Die beiden Signale werden einer Korrelationsfunktion und einer inversen Fouriertransformation unterzogen, und die Abstände der Korrelationsspitzen werden bestimmt. Falls diese gleich sind wie die Länge der Vergleichsproben, enthalten die Proben und die Vergleichsproben dasselbe Programm. Weiter ist ein zusätzlicher Test erforderlich, und zwar ein Vergleich der Leistungsverteilung durch Messung der RMS-Leistungswerte der beiden Proben im Zeitpunkt der Korrelation. Dadurch soll nur die Zuverlässigkeit der Korrelation verbessert werden; es erfolgt jedoch keine Reduktion der Datenmenge, und es ist nicht einmal eine Speicherung der Proben vorgesehen. Schliesslich wird ein korrekt empfangenes Signal benötigt. Die Erfassung eines gesendeten Programms in geräuschvoller Umgebung wird nicht erwähnt.
  • DE-A-4 400 683 beschreibt ein Verfahren, worin amplitudenbezogene Werte und Frequenzgewichtungsfaktoren von Hörproben berechnet und für eine spätere Auswertung gespeichert werden. Die Verwendung zweier verschiedener Arten von Werten, welche in Abhängigkeit von eher dynamischen oder statischen momentanen Eigenschaften des Programms mehr oder weniger kennzeichnend für die Bestimmung des empfangenen Programms sind, bedingt zumindest zusätzlichen Aufwand im Korrelationsverfahren und bewirkt einen erhöhten Energieverbrauch für die Berechnung zweier verschiedener Wertereihen.
  • Ein Ziel vorliegender Erfindung besteht deshalb darin, ein Verfahren zur Kompression von Hörproben anzugeben, welches insbesondere eine hohe Kompression mit minimalem Aufwand gestattet, wobei eine sichere Erkennung von Programmteilen im wesentlichen gewährleistet bleibt.
  • Dieses Ziel wird mit einem Verfahren nach Anspruch 1 erreicht. In den weiteren Ansprüchen sind bevorzugte Ausführungen, Vorrichtungen zur Durchführung des Verfahrens (wie in Anspruch 24), ein Computerprogramm zur Durchführung des Verfahrens sowie ein Datenträger, der ein solches Computerprogramm enthält, wie in Anspruch 36 beansprucht angegeben.
  • Nachfolgend wird dieselbe Terminologie wie in EP-A-0 598 682 verwendet. Eine Hörprobe ist grundsätzlich eine Aufnahme der Umgebungsgeräusche beispielsweise über ein Mikrofon. Zur Vereinfachung der Speicherung sowie der Übertragung zum Auswertungszentrum werden jedoch mehrere aufeinanderfolgende, kurze Aufnahmen der Umgebungsgeräusche bzw. Hörproben bevorzugt, die zu bestimmten Zeiten aufgenommen werden. Die Aufnahmen werden vorzugsweise in regelmässigen Abständen von beispielsweise einer Minute durchgeführt und weisen eine gleichbleibende Zeitdauer in der Grössenordnung von beispielweise 4 Sekunden auf, wobei die Informationen über den Zeitpunkt der Aufnahmen zusammen mit der Hörprobe gespeichert werden.
  • Erfindungsgemäss werden die Hörproben schliesslich in digitaler Form in einem elektronischen Speicher gespeichert. Um die zu speichernde Datenmenge zu verringern, wird erfindungsgemäss eine Normalisierung der Hörproben in deren ursprünglicher Form oder in einer davon abgeleiteten Form (gefiltert, auf ausgewählte Frequenzbänder beschränkt, digital oder analog, usw.) auf einen vorbestimmten Bereich D von Werten (z. B. Amplituden) sowie eine nachfolgende nichtlineare Transformation auf einen zweiten Bereich W vorgenommen, deren Resultat, welches auf den Bereich W beschränkt ist, sodann in einem elektronischen Speicher gespeichert wird. Der Bereich W kann kleiner oder gleich D sein, vorzugsweise ist er jedoch wesentlich kleiner.
  • Im wesentlichen dient die nichtlineare Transformation dazu, empfindliche Teile des Bereichs D derart zu verstärken, dass die signifikantere Information eines Signals, dessen Wert in einem solchen Teilbereich von D liegt, im Resultat hervorgehoben wird, d. h. dass dessen Auflösung erhöht wird.
  • Bevorzugte Weiterentwicklungen der Erfindung sind:
    • A: Die nichtlineare Abbildung ist gekennzeichnet durch eine abnehmende Steigung dW/dD für zunehmende Werte D, beispielsweise ähnlich der logarithmischen Funktion. Im wesentlichen wird dadurch der Bereich kleiner Werte in D auf einen vergleichsweise grösseren Bereich in W abgebildet und damit hervorgehoben, während relativ grosse Werte D nur auf einen relativ kleinen Bereich in W abgebildet werden, d. h. deren Signifikanz wird abgeschwächt.
    • B: Die Hörproben werden unmittelbar nach der Aufnahme (z. B. durch ein Mikrofon) und der analogen Verarbeitung (Verstärkung; grobe Filterung zur Vorbereitung der Analog-Digitalwandlung, usw.) digitalisiert, wobei sich eine Folge von numerischen Werten ergibt. Jeder numerische Wert stellt beispielsweise die momentane Lautstärke des Umgebungsgeräuschs zu einem bestimmten Zeitpunkt dar. Weitere Bearbeitungen erfolgen auf der digitalen Ebene durch digitale Schaltungen, programmgesteuerte Prozessoren oder Kombinationen davon.
    • C: die Amplituden- oder Lautstärkewerte werden beispielsweise durch Quadrieren in Energiewerte umgewandelt. Die Energiewerte werden einem Tiefpassfilter zugeführt und anschliessend differenziert, wobei die Differenzierung vorzugsweise durch eine Differenzbildung simuliert wird. Die erhaltenen Energieänderungswerte zeigen die Änderung des Niederfrequenzanteils im Energiegehalt in der Zeit.
    • D: Die Gruppe der Energieänderungswerte einer Hörprobe, oder nur ein Teil davon, wird in Bezug auf den Maximalwert der Werte innerhalb der (Teil-) Gruppe normalisiert. Zu diesem Zweck wird der Maximalwert ermittelt, und alle Werte der Gruppe werden durch diesen Maximalwert geteilt. Gleichzeitig werden die normalisierten Werte auf einen bestimmten Zahlenbereich abgebildet, der dem Bereich D entspricht, beispielsweise die Zahlen zwischen –128 und +127, so dass in den nachfolgenden arithmetischen Operationen nur ganze Zahlen vorkommen. Die Anzahl Werte in den numerischen Bereichen D entspricht deshalb vorzugsweise Zweierpotenzen (im Beispiel: 256 = 28 Werte), welche bei der binären digitalen Verarbeitung besonders vorteilhaft sind. Zur Durchführung dieser Kombination aus Normalisierung und Abbildung werden die Werte einer Gruppe mit einem Faktor multipliziert, der sich aus der Teilung der Grenze des numerischen Bereichs (d. h. im Beispiel 128) durch den Maximalwert innerhalb der Gruppe ergibt.
    • E: Die Resultate aus diesem Schritt werden wiederum auf einen weiteren, kleineren Wertebereich W abgebildet, beispielsweise den numerischen Bereich von 0 bis 15 mit 24 Zahlen. Auf Grund der festen und relativ kleinen Anzahl von Eingabewerten in diesem Schritt kann für diese zweite Abbildung eine so genannte Lookup-Tabelle verwendet werden. Insgesamt folgt aus dem Vorangehenden, dass jeder numerische Wert der Hörproben auf eine relativ kurze binäre Zahl (im Beispiel von 4 Bit) reduziert wird.
    • F: Es kommen weitere Optimierungen zur Anwendung, beispielsweise die Bildung des Mittelwerts einer Anzahl von Werten, wobei nur der Mittelwert weiterverwendet wird. Damit ergibt sich auch eine bedeutende Verringerung der Anzahl zu verarbeitender Werte. Auf der digitalen Ebene wird eine solche Filterung durch eine Faltung simuliert.
    • G: Vor oder nach der Digitalisierung am Eingang wird die Hörprobe in Frequenzbänder oder Bandsignale aufgetrennt. Bekannterweise können digitale Filterungen durch Faltungen erfolgen, und da die bevorzugten Faltungen Tiefpassfilter darstellen, werden vorzugsweise weniger Werte an die nachfolgenden Verarbeitungsschritte weitergegeben als für die Faltung notwendig, vorzugeweise jeweils nur ein Wert.
  • Die Erfindung wird nachfolgend anhand eines Ausführungsbeispiels und von Figuren näher erläutert.
  • 1 zeigt ein Blockschema eines erfindungsgemässen Monitors,
  • 2 zeigt die Auftrennung in Frequenzbänder,
  • 3 zeigt die Umwandlung in Energiewerte und die Differenzierung,
  • 4 zeigt die "normalisierende Quantisierung".
  • 1 zeigt ein Blockschema eines Monitors 1. Dieser kann beispielsweise für die Integration in eine Armbanduhr vorgesehen sein, weshalb der Monitor 1 einen Zeitgeber 2 aufweist, der auch als Zeitbasis für die Signalverarbeitung dient, sowie eine (Flüssigkristall-) Anzeige 3. Ein präzises Taktsignal wird von einem Quarz 4 zusammen mit einer im Zeitgeber 2 integrierten Oszillatorschaltung erzeugt. Da für die Synchronisation der Hörproben zu den Vergleichsproben eine sehr präzise Zeitgebung erforderlich ist, ist zusätzlich eine Temperaturkompensation vorgesehen. Diese umfasst einen Temperatursensor 5, der über eine Interfaceschaltung 6 mit dem Zeitgeber verbunden ist. Die Interfaceschaltung 6 beinhaltet im wesentlichen einen A/D-Wandler.
  • Ein weiteres wichtiges Element für den Betrieb des Monitors ist der Tragedetektor. Dieser kann im wesentlichen aus einer Sensorfläche auf der Armbanduhr bestehen, welche den Kontakt mit der Haut des Trägers feststellt. Im Beispiel ist der Tragesensor 7 über eine Interfaceschaltung 8 mit dem Zeitgeber 2 verbunden, was voraussetzt, dass der Zeitgeber in der Lage ist, die Zeitangaben mit einer zusätzlichen Markierung des Tragesensors zu versehen. Es ist auch möglich, den Tragesensor direkt mit der eigentlichen Monitarschaltung zu verbinden, beispielsweise mit dem digitalen Signalprozessor 9.
  • Die für die Signalverarbeitung benötigten Taktsignale, insbesondere für den Signalprozessor 9, werden über eine PLL-Schaltung (phase locked loop) vom Takt der Zeitbasis abgeleitet, der an einem Anschluss 10 von Quarz 4 abgegriffen wird. Zeit und Datum sowie gegebenenfalls die Markierung des Tragesensors werden vom Zeitgeber 2 über eine serielle Datenverbindung 12 zum digitalen Signalprozessor 9 übertragen.
  • Die Hörproben werden in einem Flash-Speicher gespeichert. Für die vorliegende Anwendung ist es ein grosser Vorteil, dass Flash-Speicher in der Lage sind, Daten nichtflüchtig zu speichern und sie ohne besondere Massnahmen wieder zu löschen. Ein Bus 14, der sowohl Daten als auch Adressen überträgt, dient als Verbindung zwischen dem Flash-Speicher 13 und dem Signalprozessor 9.
  • Ein Multiplexer 16 ist über eine zweite serielle Verbindung angeschlossen. Je nach Betriebszustand verbindet der Multiplexer den Signalprozessor 9 mit der Aufnahmeeinheit für die Hörproben oder mit der Interfaceschaltung 17 zum Datenaustausch mit dem Auswertungszentrum.
  • Die Aufnahmeeinheit besteht aus einem Mikrofon 18 und einer nachfolgenden A/D-Wandlereinheit 19, welche zusätzlich zum eigentlichen A/D-Wandler Verstärker, Filter (Antialiasing-Filter) sowie weitere übliche Vorkehrungen aufweisen kann, um zu gewährleisten, dass das digitale Signal die Mikrofonaufnahme so korrekt wie möglich wiedergibt.
  • Bei der Stromversorgung 20 kann es sich um eine Batterie (Lithiumzelle) oder dergleichen handeln. Ein Akkumulator in Verbindung mit einem kontaktlosen Ladesystem mittels elektromagnetischer Induktion oder eine Photozelle sind ebenfalls möglich.
  • Zur Verbindung nach aussen, insbesondere zur Übertragung von Daten zum Auswertungszentrum, verfügt der Monitor 1 über einen bidirektionalen Datenanschluss 21, einen Reset-Eingang 22, einen Synchronisationseingang 23 und einen Stromversorgungsanschluss 24. Die Anwesenheit einer Stromversorgung am Anschluss 24 bewirkt gleichzeitig den Wechsel des Monitors in den Datenübertragungsmodus. Der Monitor kann beispielsweise an eine Basisstation angeschlossen werden, welche eine Verbindung mit einem Auswertungszentrum herstellt, beispielsweise per Telefon.
  • Eine andere Möglichkeit besteht im Einschicken des Monitors an das Zentrum, wo er mit einer Lesestation verbunden wird. Bei dieser Gelegenheit kann neben der Datenübertragung auch eine Synchronisation des Zeitgebers 2 mit der Zeitbasis des Zentrums durchgeführt werden, wie bereits in EP-A-0 598 682 beschrieben.
  • Wie in der Zeichnung dargestellt, kann die Verarbeitungseinheit für die Hörproben mit dem Signalprozessor 9 und den notwendigen zusätzlichen Komponenten (Multiplexer 16, Speicher 13, Taktgenerator bestehend aus PLL-Schaltung 11 und Quarz 10, usw.) aus diskreten Komponenten aufgebaut sein. Für den Einbau in eine Armbanduhr müssen die Funktionen jedoch in so wenige Komponenten wie möglich integriert sein, was im Extremfall zu einer einzelnen applikationsspezifischen Schaltung 30 führt. Beispielsweise können Signalprozessoren der TMS 320C5x-Serie (Hersteller: Texas Instruments) verwendet werden, in welchen u. a, der Multiplexer 16 bereits enthalten ist, sowie Flash-RAMs des Typs AM29LV800 (Hersteller: Amdahl) mit einer Kapazität von 8 MBit. Bei dieser Speicherkapazität und beim Einsatz des nachfolgend beschriebenen erfindungsgemässen Kompressionsverfahrens für Hörprobendaten kann ein ununterbrochener Betrieb des Monitors während ungefähr 7 Tagen erreicht werden.
  • Im Hinblick auf den Stromverbrauch wird die Verarbeitungseinheit für die Hörproben, insbesondere der Signalprozessor 9, nur periodisch eingeschaltet. Beispielsweise braucht die Stromversorgung des Signalprozessors beim erfindungsgemässen Verarbeitungsverfahren für die Aufnahme einer Hörprobe pro Minute nur während einigen Sekunden eingeschaltet zu sein (weniger als 5, beispielsweise 4 Sekunden). Zu diesem Zweck empfängt die Stromversorgung vom Zeitgeber 2 ein Einschaltsignal 25, während dessen Anwesenheit die Verarbeitungseinheit für die Hörproben mit Strom versorgt wird. Eine weitere Verringerung des Energieverbrauchs wird dadurch erreicht, das der Flash-Speicher 13 nur für kurze Zeit mit dem für den Speichervorgang notwendigen Strom versorgt wird, wobei im Fall des oben erwähnten Typs 3 ms am Ende jeder verarbeiteten Hörprobe genügen. Das dafür notwendige Signal 26 wird vom Signalprozessor 9 erzeugt. Das Programm, welches den Signalprozessor steuert, ist in einem separaten Programmspeicher enthalten, der im Signalprozessor selbst integriert sein kann, so dass die Verarbeitung der Hörproben auch dann möglich ist, wenn der Flash-Speicher 13 ausgeschaltet ist.
  • Nachfolgend wird ein Verfahren zur Verarbeitung der Hörproben beschrieben. Nach der Aufnahme der Umgebungsgeräusche (Mikrofon 18) und deren Analog-Digitalwandlung mittels bekannter Verfahren (A/D-Wandlereinheit 19) wird eine Auftrennung in beispielsweise 6 Frequenzbänder vorgenommen (2), welche in einer hierarchischen Anordnung von Tiefpassfiltern 3035 erfolgt. Der notwendige Hochpass zu jedem Tiefpass wird durch eine Subtraktion 3641 der Ausgangssignale 4247 von den jeweiligen Eingangssignalen 4853 der Tiefpässe realisiert, wobei die Subtraktion durch eine Addition der invertierten Ausgangssignale 4247 der Tiefpässe 3035 erfolgt.
  • Die Tiefpassfilter 30 bis 35 werden durch eine 19-stellige Faltung realisiert:
    Figure 00120001

    worin
    j: Zeitindex
    yj: Ausgangswert der Tiefpassfilterung zum Zeitpunkt j;
    xj: Eingangswert der Tiefpassfilterung zum Zeitpunkt j;
    ai: Koeffizient der Faltungssequenz;
    a0 ... a18: [0,03, 0,0, –0,05, 0,0, 0,06, 0,0, –0, 1, 0,0, 0,32, 0,50, 0,32, 0,0, –0,11, 0,0, 0,06, 0,0, –0,05, 0,0, 0,03]
  • Während der Auftrennung in Frequenzbänder bzw. Bandsignale (54) erfolgt bereits eine erste Datenreduktion, indem aus den Folgen von Ausgangswerten der Hoch- und Tiefpassfilterungen von den Schaltern 55 jeweils nur jeder zweite Wert an die nachfolgende Hoch- bzw. Tiefpassstufe bzw. an die Ausgänge 54 übertragen wird. Insgesamt gestattet dies bereits eine Reduktion der Datenmenge auf 1/8. Bei der Auftrennung in sechs Bänder gemäss dem Beispiel ergibt sich damit eine leichte Überkompensation der Erhöhung der Datenmenge auf das Sechsfache.
  • Als Kriterium bei der Auslegung der Filter gilt, dass ein Band den Inhalt jedes anderen Bands höchstens in deutlich abgeschwächter Form enthalten darf. Eine Reduktion mindestens auf die Hälfte kann als deutlich abgeschwächt betrachtet werden. Im Idealfall enthalten die Bänder nur Restanteile der direkt benachbarten Bänder; Anteile, welche in der Nähe oder sogar unterhalb der Auflösung der digitalen numerischen Darstellung liegen. In der bevorzugten digitalen Ausführung wird dieses Ziel durch Tiefpassfilterung (Faltung) und nachfolgende Subtraktion des gefilterten Anteils vom Eingangssignal des Tiefpassfilters erreicht.
  • Die Behandlung der aus der Auftrennung in Bänder hervorgehenden Bandsignale 54 ist für jedes Band identisch, wobei die 3 und 4 stellvertretend die Verarbeitung eines einzelnen Bands 56 zeigen.
  • Das Eingangssignal 56, welches mit dem Ausgangssignal 54 identisch ist, wird zunächst quadriert, indem es parallel den zwei Eingängen eines Multiplikators 57 zugeführt wird. Bis auf einen Proportionalitätsfaktor entspricht diese Quadrierung einer Berechnung des Energiegehalts des vom Signal 56 dargestellten Teils des Umgebungsgeräuschs. Die Energiewerte 58 werden einer Tiefpassfilterung unterzogen. Diese Filterung wird durch eine Faltung über 48 Werte realisiert:
    Figure 00130001

    worin
    j: Zeitindex der ye- und xe-Werte;
    x e / j: Energiewert 58 zum Zeitpunkt j;
    y e / j: Ausgangssignal des Tiefpassfilters 59 zum Zeitpunkt j;
    b1: die Koeffizienten der Faltungssequenz, wobei b0 = b1 = ... = b47 = 1.00.
  • Von den Ausgangswerten des Tiefpassfilters 59 wird nur jeder 48. Wert vom Schalter 60 an die nachfolgende Differenzierung 61 weitergegeben. Insgesamt ergibt sich hier eine Datenreduktion auf 1/48 des Datenvolumens am Eingang durch die Bildung eines Mittelwerts.
  • Im Differenzierer 61 wird jeder eingehende Wert durch die Verzögerungseinheit 62 um eine Zeiteinheit verzögert. Die Verzögerungseinheit 62 kann beispielsweise eine FIFO-Warteschlange der Länge 1 sein.
  • Im Addierer 63 werden die unverzögerten Werte zu den invertierten, verzögerten Werten addiert, so dass am Ausgang 64 die Werte der Differenzen zwischen je zwei aufeinanderfolgenden Eingangswerten des Differenzierers 61 erscheinen. Die Differenzen beziehen sich auf eine bestimmte, konstante und bekannte Zeitverschiebung, welche durch die Zeiteinheiten gegeben ist, und stellen daher eine Annäherung an die Ableitung nach der Zeit dar.
  • Die Energiedifferenzwerte 64 werden der normalisierten Quantisierung unterzogen. Einerseits wird gemäss 4 in der Absolutwerteinheit 65 der absolute Wert der Energiedifferenzwerte gebildet. Diese Absolutwerte werden einem Spitzenwertdetektor 66 zugeführt, an dessen Ausgang 67 der grössere der an den Eingängen 68 anliegenden Werte erscheint. Da das Ausgangssignal vom Ausgang 67 über eine einstufige Verzögerungsschaltung 69 auf einen der zwei Eingänge 68 zurückgeführt wird, wird am Ausgang 67 der Maximalwert aller der Absolutwerteinheit 65 zugeführten Werte gebildet. Die Maximalwerte gelangen zu einem weiteren Schalter 70, der nur jeden 32. Wert durchlässt, d. h. einen Wert, bei dem es sich um den grössten Wert innerhalb einer Hörprobe handelt (die in dieser Ausführung verwendete Hörprobendauer ergibt 32 Energiedifferenzwerte 64 pro Hörprobe in jedem Frequenzband).
  • In einer Reziprokwert- und Multiplikationseinheit 71 wird die Zahl 128 (= 27) durch den Maximalwert der Hörprobe dividiert, und das Resultat wird einem Eingang 72 eines Multiplikators 73 zugeführt. Dem anderen Eingang des Multiplikators 73 werden daraufhin nacheinander die Energiedifferenzwerte 64 zugeführt, unter welchen der Maximalwert bestimmt wurde. Zu diesem Zweck werden die Differenzwerte 64 in einem FIFO-Puffer 75 zwischengespeichert. Das Resultat der Multiplikation im Multiplikator 73, welches zwischen –128 und +127 liegt, wird vom Konverter 76 in ganze Zahlen im Bereich D zwischen 0 und 255 entsprechend einem Byte mit acht Bits umgewandelt. Diese Zahlen werden als Adressen in einer Look-up-Tabelle (LUT) 77 verwendet, in welcher jedem Eingangswert eine Zahl im Bereich W = 0 bis 15 zugeordnet wird, d. h. eine vierstellige Binärzahl. Die in der LUT 77 durchgeführte diskrete Abbildung von 8-bit-Zahlen auf 4-bit-Zahlen ist nichtlinear und so ausgelegt, dass die Auflösung kleiner Zahlen am Eingang feiner ist als diejenige von grösseren Eingangswerten, d. h. kleinere Eingangswerte werden stärker hervorgehoben. Dies kann als nichtäquidistante Quantisierung bezeichnet werden.
  • Die 4-Bit-Werte am Ausgang 78 werden im Flash-Speicher 13 gespeichert (1).
  • Die beschriebene Einheit zur normalisierten, nichtäquidistanten Quantisierung und Kompression ist gemäss
  • 3 für jedes Band vorgesehen, womit sich pro Verarbeitungszyklus 4-Bit-Werte für insgesamt 32 × 48 × 8 = 12'288 Werte ergeben, welche von A/D-Konverter am Eingang 48 (2) aufgezeichnet werden. Bei einer Abtastrate der A/D-Wandlung von 3000 bis 5000 s–1, welche die zur Zeit erhältlichen A/D-Wandler mit dem niedrigsten Stromverbrauch liefern, ergibt sich eine Hörprobendauer von ungefähr 2,5 bis 4 Sekunden. Bei einer angenommenen Rate von einer Hörprobe pro Minute beträgt die notwendige Speicherkapazität für die Daten 32 × 4 = 768 Bit/min oder 1'105'920 Bit/d. Der erwähnte 8 Mbit-Speicher gestattet somit einen ununterbrochenen Betrieb des Monitors während ungefähr sieben Tagen.
  • Zur Reduktion der notwendigen Rechenleistung werden alle erwähnten Berechnungen mittels ganzzahliger oder Festpunktarithmetik durchgeführt, wenn nichts anderes angegeben ist; insbesondere wird eine exponentielle Darstellung von Fliesskommazahlen vermieden. Die für die Darstellung einer Zahl verwendete Anzahl Bits hängt im wesentlichen vom verwendeten Prozessor und von der in demselben zur Verfügung stehenden Datenlänge ab. Die oben erwähnte Prozessorfamilie TMS320C5x verwendet 16-Bit-Arithmetik. Der Binärpunkt für die Festpunktarithmetik wird so gesetzt, dass die begrenzte Rechengenauigkeit in jedem Bearbeitungsschritt optimal ausgenützt wird, obwohl die Wahrscheinlichkeit eines Datenüberlaufs äusserst gering ist. Daher wird der Binärpunkt in den verschiedenen Verarbeitungsschritten unterschiedlich gesetzt. Bei der bevorzugten Ausführung der Auftrennung in Bänder hat das geringstwertige Bit den Wert 2–16 für die Filterkoeffizienten und den Wert 20 für die Datenwerte. Die Energieumwandlung und -Filterung wird mit ganzzahliger 32-Bit-Arithmetik berechnet, die als Funktion der Standardbibliothek abrufbar ist.
  • Vor der Speicherung im Flash-Speicher, oder aber im Auswertungszentrum, können zudem übliche Kompressionsverfahren zur Anwendung kommen, welche bei der Dekompression die Wiederherstellung der ursprünglichen Daten in identischer Form gestatten.
  • In Vorbereitung der Erkennung von Programmteilen, welche möglicherweise in den Hörproben enthalten sind, werden möglichst gleichzeitig Programmproben aufgenommen, beispielsweise direkt beim Sender, und gespeichert. Vor dem Vergleich werden die Programmproben vorzugsweise dem gleichen Verarbeitungs- und Kompressionsverfahren wie die Hörproben unterzogen. Dies kann vor der Speicherung geschehen oder erst beim Lesen bzw. Abspielen der gespeicherten Programmproben.
  • Für die Erkennung kann eines der üblichen Korrelationsverfahren verwendet werden. Es ist ebenfalls möglich, zunächst eine grobe Korrelation unter Verwendung einer schnellen Rechenmethode anzuwenden und erst dann eine genauere und kompliziertere Korrelation durchzuführen, wenn eine hinreichende Wahrscheinlichkeit festgestellt wurde, dass eine bestimmte Hörprobe vorhanden ist. Insbesondere gestattet eine solche vorgängige grobe Korrelation eine erste grobe Schätzung einer vorhandenen minimalen Zeitverschiebung zwischen der Hörprobe und der beim Sender aufgezeichneten Vergleichsprobe. Im komplexeren Verfahren werden feinere Zeitverschiebungen analysiert, und es kommt ein robusteres Vergleichsverfahren zur Anwendung, bei welchem die statistische Verteilung des Programmsignals und von Störsignalen berücksichtigt wird.
  • Im wesentlichen werden während der Auswertung die gleichzeitig erfassten Proben jedes von jeweils einer stationären Einheit aufgezeichneten Programms mit den Hörproben jedes Monitors verglichen. Ein beispielhaftes Vergleichsverfahren ist im folgenden Pseudocode illustriert, der die Korrelation einer Hörprobe eines Monitors beschreibt:
    Figure 00180001
  • In diesem Verfahren wird nur eines der in AnzahlStationäreEinheiten' eingetragenen Radioprogramme in der Hörprobe eines Monitors bestimmt, und zwar dasjenige, welches die höchste Wahrscheinlichkeit ergibt (Wert der Variable 'OptimumÜbereinstimmung').
  • Insbesondere wird die wahlweise, eindeutig umkehrbare Kompression der erfindungsgemäss bearbeiteten Proben rückgängig gemacht. Darauf folgt die Initialisierung von 'OptimumÜbereinstimmung' auf dem niedrigsten Wert, der gleichzeitig "keine Übereinstimmung" anzeigt, d. h. der Träger des Monitors hat keines der überwachten Programme gehört.
  • Die gleichzeitig mit der gegenwärtigen Hörprobe aufgenommenen Programmproben jeder stationären Einheit (Schleife "For StationäreEinheit := 1 to AnzahlSationäreEinheiten ... EndDo) werden geladen und in derselben Weise wie die Hörprobe verarbeitet. Auf Grund verbleibender kleiner Zeitverschiebungen zwischen den Hörproben und den Programmproben wird der nachfolgende Vergleich für eine bestimmte Anzahl 'MaxZeitverschiebung' angenommener Zeitverschiebungen durchgeführt (Schleife "For Zeitverschiebung := 1 bis MaxZeitverschiebung ... Endfor"). Der Vergleich erfolgt mittels einer Standardkorrelation der Programm- und Hörprobendaten, welche gemäss der Variable 'Zeitschritt' vorwärts oder rückwärts gegeneinander verschoben werden. Um stets eine volle Korrelation über alle Werte der Hörprobe zu ermöglichen, werden die Programmproben deshalb jeweils während einer längeren Zeitdauer aufgezeichnet, wobei der Beginn zusätzlich um die entsprechende maximale Zeitverschiebung zeitlich vorgezogen wird. Dementsprechend wird die Länge der Programmprobe so gewählt, dass die Hörprobe auch dann noch ganz in der Programmprobe enthalten ist, wenn der Beginn der Programmprobe und derjenige der Hörprobe maximal gegeneinander verschoben sind.
  • Die normalisierte Korrelation erfolgt gemäss der folgenden Formel:
    Figure 00200001

    worin
    t: Zeitverschiebungsindex (= 'Zeitverschiebung' im Pseudocode);
    N: Anzahl korrelierter Werte, im allgemeinen gleich der Anzahl Werte in einer Hörprobe; i Zeitindex;
    si: Wert der Hörprobe zum Zeitpunkt i;
    mi_t: Wert der Programmprobe zum Zeitpunkt i, verschoben um t Zeitschritte;
    ct: Korrelationswert für die Zeitverschiebung t: –1 ≤ ct ≤ 1.
  • Die ct-Werte für unterschiedliche t-Werte und Programmproben werden verglichen, und der insgesamt grösste ct-Wert wird zusammen mit den Angaben über die Bedingungen, unter welchen er erhalten wurde, gespeichert. Diese Angaben enthalten die Zeitverschiebung, die stationäre Einheit, d. h. das Programm, sowie den Korrelationswert ct selbst.
  • Wenn der auf diese Weise bestimmte grösste ct-Wert grösser ist als ein vorgegebener Schwellenwert, so wird angenommen, dass das entsprechende Programm in der Hörprobe enthalten ist. Wenn der Schwellenwert nicht erreicht wird, wird angenommen, dass keines der Programme gehört wurde.
  • Da die Korrelation durch den beträchtlichen Umfang der Zeitverschiebungen (t bzw. 'Zeitverschiebung') entsprechend oft durchgeführt werden muss, kann eine vereinfachte Alternative in Betracht gezogen werden, bei welcher die Zeitabstände mit einer gröberen Abstufung behandelt werden. Für die diejenigen ct-Werte, welche einen vorgegebenen Schwellenwert übersteigen, wird die Korrelation mit einem genaueren Verfahren wiederholt, bei welchem alle erfassten Zeitverschiebungen berücksichtigt werden,
  • Eine geeignete robuste Korrelation ist
    Figure 00210001

    worin
    rt: "robuster" Korrelationswert;
    a: Skalierungsfaktor, der die Abschwächung des Programmsignals gegenüber der Hörprobe berücksichtigt;
    die weiteren Symbole entsprechen der Formel (3).
  • Somit werden in dem Verfahren im wesentlichen Absolutwerte sowohl der Abweichungen zwischen der Hörprobe und dem skalierten Programmsignal als auch des Hörprobensignals verwendet. Der Skalierungsfaktor a wird iterativ derart bestimmt, dass der robuste Korrelationswert rt minimal wird. Verglichen mit der normalen Korrelation werden grosse Abweichungen in der robusten Korrelation weniger gewichtet, wodurch die statistische Verteilung der Hörprobenwerte und der Programmsignalwerte berücksichtigt wird und eine bessere Erkennungsgenauigkeit für reale Signale erzielt wird als beim normalen Korrelationswert ct. Insbesondere werden einzelne Hörproben mit grossen Abweichungen weniger gewichtet.
  • Versuche zeigen, dass das beschriebene Verfahren nicht nur bekannte Störeffekte wie Nebengeräusche und Zeitverschiebungen beseitigt oder mindestens stark abschwächt, sondern dass auch die Dämpfung (Lautsprecher, Übertragungsleitungen, allgemeine akustische Bedingungen) und Hall wenig Einfluss auf die Erkennung eines Programms haben. Besonders überraschend war die Feststellung, dass das Programm in der Hörprobe oft sogar dann bestimmt werden konnte, wenn das Programmelement unhörbar war. Die Unterdrückung von Halleffekten wird insbesondere der Bildung eines zeitlichen Mittelwerts (Falter 59) zugeschrieben, besonders wenn die Zeitkonstante grösser gewählt wird als die in normalen Umgebungen anzutreffenden Hallzeiten. Eine typisch frequenzabhängige (akustische) Dämpfung wird kompensiert durch die beschriebene geeignete Kombination einer Auftrennung in Frequenzbänder, einer Normalisierung auf den Maximalwert und der Berücksichtigung der Dämpfung durch den Skalierungsfaktor a bei der Berechnung von rt oder durch die Berechnungsart von ct.
  • Abwandlungen des Ausführungsbeispiels im Umfang der Erfindung sind für den Fachmann ohne weiteres möglich.
  • Je nach der technologischen Entwicklung können andere Komponenten (Signalprozessoren, Speicher usw.) verwendet werden. Alternativen sind insbesondere beim Flash-Speicher möglich, z. B. batteriegestützte: CMOS-Speicher. Die Kriterien, besonders für tragbare Monitoren wie Armbanduhren, sind eine lange ununterbrochene Überwachungsdauer und ein minimaler Energieverbrauch. Unter bestimmten Umständen ist eine schnelle Verarbeitungseinheit mit höherer Leistungsaufnahme zu bevorzugen, falls der gegenüber einer langsameren Einheit höhere Energieverbrauch mehr als kompensiert wird durch nur zeitweisen Betrieb mit dazwischenliegenden inaktiven Pausen. Viele Komponenten wie beispielsweise der TMS320C5xx bieten neben der vollständigen Abschaltung auch spezielle Stromspar-Betriebsarten. Auch die Verringerung der Taktfrequenz einer schnellen Einheit gestattet oft eine beträchtliche Verringerung des Energieverbrauchs.
  • Je nach der verwendeten Technologie kann eine unterschiedliche Genauigkeit bzw. Anzahl Stellen der binären Zahlen zur Anwendung kommen. In Versuchen wurde mit 4-Bit-Endresultaten eine genügend sichere Programmerkennung erzielt. Es ist jedoch auch vorstellbar, eine Reduktion auf 3 Bits vorzunehmen oder eine grössere Anzahl, z. B. 6 Bits oder 8 Bits vorzusehen. Eine grössere Anzahl binärer Stellen ist insbesondere dann möglich, wenn kürzere Tragezeiten in Kauf genommen werden oder wenn Speicher grösserer Kapazität verfügbar werden.
  • Dabei kann eine höhere Anzahl Stellen des Endresultats auch eine Erhöhung der Anzahl Stellen in den vorangehenden Schritten mindestens auf die Anzahl Stellen des Endresultats erforderlich machen.
  • Meist können die genauen Werte für die nichtlineare Abbildung durch die Tabelle 77 und die Schwellenwerte für die Gewichtung der Korrelationswerte nur empirisch ermittelt werden. Obwohl eine Funktion ähnlich einer Logarithmisierung bevorzugt wird, sind auch andere Funktionen möglich. Umgekehrt ist es auch möglich, die grösseren Werte in D hervorzuheben und die kleinen Werte der Energiedifferenzen zu unterdrücken.
  • Die Faktoren und die Anzahl Stellen der Faltungen können ebenfalls anders gewählt werden, und bei der Auftrennung der Hörproben ist auch eine andere Anzahl von Frequenzbändern möglich. Insbesondere kann für veränderte Abtastraten bei der A/D-Wandlung, andere Einstellungen bei der Hall- und/oder Dämpfungskompensation oder eine veränderte Hörprobendauer der Tiefpass 59 angepasst werden, beispielsweise durch eine andere Anzahl Stützstellen bei der Faltung.
  • Es ist ebenfalls möglich, die Analog-Digitalwandlung in einem späteren Stadium der Kompression durchzuführen, insbesondere wenn die entsprechenden analogen Schaltungen hinsichtlich der Verarbeitungsgeschwindigkeit oder des Platzbedarfs im Monitor vorteilhaft sind. Im Extremfall könnte die Digitalisierung erst unmittelbar vor der Speicherung im Speicher erfolgen. Wenn es sich um ein analoges Signal handelt, ist der Begriff "digitaler Wert" in der Beschreibung beispielsweise durch die Grösse oder Amplitude des Signals zu ersetzen.
  • Bei der Korrelation ist es ebenfalls möglich, nur denjenigen Teil der Hörproben zu verwenden, der mit der aktuellen Zeitverschiebung t immer noch innerhalb der entsprechenden Hörprobe liegt, beispielsweise wenn Programm- und Hörproben derselben Länge aufgezeichnet werden.
  • Eine Alternative zum Tragesensor wäre ein handelsüblicher Bewegungssensor. In einer bekannten Ausführungsform weist dieser einen Kontakt auf, der bei Bewegung zwischen dem offenen und dem geschlossenen Zustand wechselt, jedoch im Stillstand in einem der beiden Zustände verbleibt.
  • Glossar
  • Flash-RAM RAM (siehe dort), welches Daten auch bei Stromausfall speichert, jedoch ein schnelleres Speichern und einfacheres Löschen als klassische nichtflüchtige Speicher (PROM/EPROM) gestattet.
    RAM Lesen-Schreiben-Speicher
    Zeitindex Nummer eines digitalen Werts in der Folge von Werten, die vom Digitalisierer (A/D-Wandler) ausgegeben werden, meistens in bezug auf den Anfang einer Hörprobe, deren Bezugswert den Zeitindex 0 hat.

Claims (36)

  1. Verfahren zur Kompression eines elektrischen Audiosignals, welches Hörproben darstellt, wobei die Amplitude der Proben als Ganzes oder in Teilen, bzw. eines davon abgeleiteten digitalen oder analogen Signals, jeweils auf einen ersten Bereich D (65–76) digitaler Werte normalisiert wird, dadurch gekennzeichnet, dass – die Hörproben durch Aufnehmen von Umgebungsgeräuschen mittels eines elektroakustischen Wandlers erzeugt werden; – der genannte Bereich D vorgegeben ist – das genannte normalisierte Signal unter Verwendung einer nichtlinearen Funktion (77) auf einen zweiten festgelegten Bereich digitaler Werte W abgebildet wird, der ein Resultat (78) liefert, wobei die digitale Darstellung der Werte im Bereich W weniger Stellen enthält als die digitale Darstellung der Werte im Bereich D und die nichtlineare Funktion eine Steigung dW/dD aufweist, welche mit steigenden Werten abnimmt, um kleine Werte des genannten ersten Wertebereichs hervorzuheben; und – das Resultat (78) in digitaler Form in einem elektronischen Speicher (13) gespeichert wird, so dass eine Reduktion der als Resultat zu speichernden Datenmenge erzielt wird und das Resultat immer noch die Erkennung von in den Hörproben enthaltenen Programmteilen gestattet, wenn diese mit Programmproben verglichen werden, welche die Programmteile darstellen.
  2. Verfahren nach Anspruch 1, worin das genannte Resultat (78) durch binäre Zahlen mit einer festen Anzahl binärer Stellen von 3 bis 16 Bit dargestellt wird, bevorzugt von 4 bis 8 Bit, und weiter bevorzugt von 4 Bit.
  3. Verfahren nach einem der Ansprüche 1 bis 2, worin das genannte Audiosignal durch Filtern (30–35, 36–41) in mindestens zwei Bandsignale (56) aufgetrennt wird, welche jeweils einen Frequenzbereich des Audiosignals enthalten, und jedes Bandsignal den Inhalt der anderen Bandsignale gar nicht oder nur in deutlich abgeschwächter Form enthält, insbesondere auf höchstens die Hälfte abgeschwächt.
  4. Verfahren nach Anspruch 3, worin 3 bis 15, bevorzugt 4 bis 10, weiter bevorzugt 5 bis 8 und besonders bevorzugt 6 Bandsignale erzeugt werden.
  5. Verfahren nach Anspruch 3 oder 4, worin die genannten Bandsignale jeweils Frequenzbereiche gleicher Breite enthalten und alle Frequenzbereiche im Bereich von 500 Hz bis 10'000 Hz liegen.
  6. Verfahren nach einem der Ansprüche 3 bis 5, worin die Bandsignale durch eine einfache oder kaskadierte mehrfache Auftrennung eines Eingangssignals (49–53), bei welchem es sich um das Audiosignal (48) oder um eines der Ausgangssignale (49–53) handelt, unter Anwendung folgender Schritte erzeugt werden: – erste Tiefpassfilterung (30–35) zur Erzeugung eines ersten Ausgangs-Bandsignals (49–47), – Subtraktion (36–41) des ersten Ausgangs-Bandsignals vom Eingangssignal (48–53) zur Erzeugung eines zweiten Ausgangs-Bandsignals.
  7. Verfahren nach Anspruch 6, worin alle ersten Tiefpassfilterungen (30–35) den gleichen Gütefaktor aufweisen.
  8. Verfahren nach einem der Ansprüche 6 bis 7, worin die Tiefpassfilterung (30–35) durch eine digitale Faltung über 10 bis 30 Werte, vorzugsweise 15 bis 25 Werte und weiter bevorzugt über 19 Werte erfolgt.
  9. Verfahren nach Anspruch 8, worin die digitale Faltung gemäss dem Ausdruck ai*xt–i erfolgt, wobei xt–i der Eingangswert der Faltung zu einem i Zeitperioden vor dem Zeitpunkt t liegenden Zeitpunkt ist und i grösser oder gleich 0 und kleiner oder gleich 18 ist, und wobei die Koeffizienten ai ungefähr {0,03, 0,0, –0,05, 0,0, 0,06, 0,0, –0,11, 0,0, 0,32, 0,50, 0,32, 0,0, –0,11, 0,0, 0,06, 0,0, –0,05, 0,0, 0,03} betragen.
  10. Verfahren nach einem der Ansprüche 6 bis 9, worin das Eingangssignal digitalisiert wird und nur jeder n-te Wert (55) jeder Teilungsstufe (30, 36; 31, 37; 32, 38; ...; 35, 41) zum Bandsignal zugefügt wird, wobei n mindestens 2 oder gleich 2 ist, um die Vergrösserung des Datenvolumens durch die Auftrennung in Bandsignale zu kompensieren.
  11. Verfahren nach einem der Ansprüche 1 bis 10, worin aus dem Audiosignal (48) oder aus einem davon abgeleiteten Signal (54) ein zum Energiegehalt proportionales Energiesignal (58) gewonnen wird.
  12. Verfahren nach Anspruch 11, worin das Energiesignal (58) durch Quadrieren des Audiosignals (48) oder eines davon abgeleiteten Signals (54) erzeugt wird.
  13. Verfahren nach einem der Ansprüche 11 bis 12, worin das Energiesignal (58) einer zweiten Tiefpassfilterung unterzogen wird.
  14. Verfahren nach Anspruch 13, worin die zweite Tiefpassfilterung (59) digital in Form einer Faltung über 20 bis 70 Werte erfolgt, bevorzugt über 40 bis 55 Werte, weiter bevorzugt über 48 Werte.
  15. Verfahren nach Anspruch 19, worin die Koeffizienten der Faltung jeweils im wesentlichen untereinander gleich sind.
  16. Verfahren nach Anspruch 15, worin die Koeffizienten ungefähr 1.0 betragen.
  17. Verfahren nach einem der Ansprüche 14 bis 16, worin auf die zweite Tiefpassfilterung eine Datenreduktion (60) folgt, bei welcher ein Energiewert unter n gefilterten Werten ausgewählt wird, wobei n mindestens gleich 2 und bevorzugt gleich der Anzahl Werte der Faltung der zweiten Tiefpassfilterung (59) ist.
  18. Verfahren nach einem der Ansprüche 11 bis 17, worin eine nachfolgende Differenzierung des Energiesignals nach der Zeit (61) durchgeführt wird, um ein Energiedifferentialsignal (64) zu erhalten.
  19. Verfahren nach Anspruch 18, worin die genannte Differenzierung durch Berechnung der Differenz zwischen je zwei aufeinanderfolgenden Werten des Signals erfolgt.
  20. Verfahren nach einem der Ansprüche 1 bis 19, worin die Normalisierung auf einen Wertebereich D, der definiert ist durch eine Untergrenze Du, vorzugsweise O, und eine Obergrenze Do, erfolgt, indem: – das Maximum (67) des Absolutwerts (68) des Eingangssignals innerhalb der Normalisierungsdauer des Signals ermittelt wird, welche kürzer ist als die Dauer einer Hörprobe oder bevorzugt gleich, – der Kehrwert des Maximums mit (Do – Du + 1) (71) multipliziert wird und – dieses Produkt mit den Werten des Eingangssignals (64) innerhalb der Dauer des normalisierten Signals multipliziert wird.
  21. Verfahren nach Anspruch 20, worin Do – Du gleich 2n – 1 ist, wobei n eine ganze Zahl grösser als 4 und bevorzugt gleich 7 ist.
  22. Verfahren nach einem der Ansprüche 1 bis 21, worin alle Verfahrensschritte mittels Ganzzahl- oder Festpunktarithmetik mit einer festgelegten Anzahl Stellen ausgeführt werden.
  23. Verfahren nach Anspruch 22, worin die Anzahl Stellen die in der verwendeten Recheneinheit (9) zur Verfügung stehende Anzahl Stellen ist.
  24. Vorrichtung (1) mit einem Computerprogrammprodukt zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 23, worin die Vorrichtung eine Hörprobeneinheit mit mindestens einem Signalprozessor (9) aufweist, wobei das Computerprogrammprodukt Instruktionen beinhaltet, welche die Ausführung aller Verfahrensschritte nach einem der Ansprüche 1 bis 7 durch den Signalprozessor auslösen.
  25. Vorrichtung nach Anspruch 24, worin ein nichtflüchtiger Halbleiterspeicher (13) am genannten Prozessor (9) angeschlossen ist, welcher die Resultate (78) des Verfahrens zu speichern gestattet.
  26. Vorrichtung nach Anspruch 24 oder 25, worin an der Stromversorgung (20) der Hörprobeneinheit ein Zeitgeber (2) angeschlossen ist, welcher die Hörprobeneinheit abzuschalten gestattet, wenn zwischen der Verarbeitung zweier Hörproben keine Verarbeitungsaktivität erforderlich ist, um den Energieverbrauch zu verringern.
  27. Vorrichtung nach Anspruch 26, worin die Stromversorgung des nichtflüchtigen Speichers (13) und/oder der Speicher selbst an einem Zeitgeber (2) angeschlossen ist, so dass ein Betrieb des Speichers nur während der Speicherung der Resultate ermöglicht ist, um den Energieverbrauch durch den Speicher zu verringern.
  28. Gerät, welches normalerweise von einer Person getragen wird, dadurch gekennzeichnet, dass es eine Vorrichtung nach einem der Ansprüche 24 bis 27 aufweist, welche genügend klein ist, um von einer Person getragen zu werden.
  29. Gerät nach Anspruch 28, dadurch gekennzeichnet, dass das Gerät eine Armbanduhr ist.
  30. Verfahren zur Auswertung der Resultate aus der Erfassung von Hörproben, beinhaltend: die Durchführung des Verfahrens nach einem der Ansprüche 1 bis 23, die Aufzeichnung von Programmproben überwachter Programme, welche Programmproben mindestens die gleiche Zeitdauer aufweisen wie die Hörproben, die Anwendung der gleichen Bearbeitungsschritte auf die Programmproben wie auf die Hörproben, und die Durchführung der Berechnung einer ersten Korrelation der Hörproben mit den bearbeiteten Programmproben, um eine Übereinstimmung zu finden.
  31. Verfahren nach Anspruch 30, worin die Aufzeichnung der Programmproben vor derjenigen der Hörproben beginnt und länger dauert als diejenige der Hörproben, und worin Zeitverschiebungen zwischen dem Zeitgeber für die Hörproben und dem Zeitgeber für die Programmproben bei der Korrelation durch zeitliche Verschiebung der Hörproben gegenüber den Programmproben kompensiert werden.
  32. Verfahren nach Anspruch 30 oder 31, worin die genannte erste Korrelation eine Standardkorrelation nach der Formel
    Figure 00320001
    ist, mit N: Anzahl Werte der Hörprobe, welche in der Korrelation verwendet werden, t: Zeitverschiebung si: Wert der Hörprobe zum Zeitpunkt i, mi: Wert der Programmprobe zum Zeitpunkt i, ct: Korrelationswert für die Zeitverschiebung t: –1 ≤ ct ≤ 1.
  33. Verfahren nach einem der Ansprüche 30 bis 32, worin der Vergleich der Hörproben mit den Programmproben in zwei Durchgängen erfolgt, wobei die Hörproben im ersten Durchgang jeweils auf alle Arten mit allen Programmproben verglichen werden mit Hilfe der genannten ersten Korrelation, deren Rechenaufwand dadurch verringert wird, dass eine gröbere Abstufung der Zeitverschiebungen angewendet wird, indem Zeitverschiebungswerte übersprungen werden, während im Fall einer Zeitverschiebung, deren Korrelationswerte ct über einer festgelegten Grenze liegen, eine zweite, stabilere Korrelation erfolgt, indem weniger oder bevorzugt keine Zeitverschiebungswerte übersprungen werden, wodurch eine verbesserte Abstufung der Zeitverschiebung erhalten wird, insbesondere eine mindestens doppelt so feine Abstufung als in der ersten Korrelation.
  34. Verfahren nach Anspruch 33, worin die zweite Korrelation derart gewählt ist, dass grosse Abweichungen zwischen der Hörprobe und der Programmprobe einen kleineren Einfluss auf die Korrelationskoeffizienten haben als in der ersten Korrelation.
  35. Verfahren nach einem der Ansprüche 33 bis 34, worin die zweite Korrelation nach der Formel
    Figure 00330001
    berechnet wird, worin N: Anzahl Hörprobenwerte, welche in der Korrelation verwendet werden, t: Zeitverschiebung zwischen der Hörprobe und der Programmprobe, si: Wert der Hörprobe zum Zeitpunkt i, mi: Wert der Programmprobe zum Zeitpunkt i, und a: Skalierfaktor, der die Dämpfung des Programmsignals gegenüber der Hörprobe berücksichtigt; rt: Korrelationswert für die Zeitverschiebung t, 0 (optimale Korrelation) ≤ rt ≤ 1 (keine Korrelation), wobei a derart festgelegt wird, dass rt einen Minimalwert annimmt.
  36. Datenträger mit einem aufgezeichneten Computerprogrammprodukt, bei dessen Ausführung durch einen Signalprozessor das Verfahren nach einem der Ansprüche 1 bis 23 und/oder einem der Ansprüche 30 bis 35 durchgeführt wird.
DE69810851T 1997-06-23 1998-06-19 Verfahren für die Kompression der Aufnahmen von Umgebungsgeräuschen, Verfahren für die Erfassung von Programmelementen darin, Vorrichtung und Computer-Programm dafür Expired - Lifetime DE69810851T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CH152097 1997-06-23
CH152097 1997-06-23

Publications (2)

Publication Number Publication Date
DE69810851D1 DE69810851D1 (de) 2003-02-27
DE69810851T2 true DE69810851T2 (de) 2004-01-22

Family

ID=4212369

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69810851T Expired - Lifetime DE69810851T2 (de) 1997-06-23 1998-06-19 Verfahren für die Kompression der Aufnahmen von Umgebungsgeräuschen, Verfahren für die Erfassung von Programmelementen darin, Vorrichtung und Computer-Programm dafür

Country Status (8)

Country Link
US (2) US6993479B1 (de)
EP (1) EP0887958B1 (de)
AT (1) ATE231666T1 (de)
CA (1) CA2241454C (de)
DE (1) DE69810851T2 (de)
DK (1) DK0887958T3 (de)
ES (1) ES2190578T3 (de)
PT (1) PT887958E (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741093B1 (en) 2021-07-21 2023-08-29 T-Mobile Usa, Inc. Intermediate communication layer to translate a request between a user of a database and the database
US11924711B1 (en) 2021-08-20 2024-03-05 T-Mobile Usa, Inc. Self-mapping listeners for location tracking in wireless personal area networks

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182106A1 (en) * 2002-03-13 2003-09-25 Spectral Design Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
EP1606797B1 (de) 2003-03-17 2010-11-03 Koninklijke Philips Electronics N.V. Verarbeitung von mehrkanalsignalen
US8738763B2 (en) 2004-03-26 2014-05-27 The Nielsen Company (Us), Llc Research data gathering with a portable monitor and a stationary device
WO2006023770A2 (en) 2004-08-18 2006-03-02 Nielsen Media Research, Inc. Methods and apparatus for generating signatures
CN101322344B (zh) 2005-10-21 2013-01-02 尼尔逊媒介研究股份有限公司 用于计量便携式媒体播放器的方法和装置
US20070294132A1 (en) 2005-12-20 2007-12-20 Zhang Jack K Methods and systems for recruiting panelists for a research operation
CA2947649C (en) 2006-03-27 2020-04-14 The Nielsen Company (Us), Llc Methods and systems to meter media content presented on a wireless communication device
CN103400280A (zh) 2006-07-12 2013-11-20 奥比融公司 监控便携式用户设备的使用情况
DE102006032543A1 (de) * 2006-07-13 2008-01-17 Nokia Siemens Networks Gmbh & Co.Kg Verfahren und System zur Reduzierung des Empfangs unerwünschter Nachrichten
US8027437B2 (en) * 2006-12-18 2011-09-27 Nuance Communications, Inc. System and method for improving message delivery in voice systems utilizing microphone and target signal-to-noise ratio
GB2460773B (en) 2007-02-20 2010-10-27 Nielsen Co Methods and apparatus for characterizing media
WO2008137385A2 (en) 2007-05-02 2008-11-13 Nielsen Media Research, Inc. Methods and apparatus for generating signatures
CA2858944C (en) 2007-11-12 2017-08-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8930003B2 (en) 2007-12-31 2015-01-06 The Nielsen Company (Us), Llc Data capture bridge
EP2442465A3 (de) 2007-12-31 2013-05-29 Arbitron Inc. Erfassen von Umfragedaten
US8457951B2 (en) 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
CA2717723C (en) 2008-03-05 2016-10-18 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
EP2209237A1 (de) 2009-01-16 2010-07-21 GfK Telecontrol AG Überwachungsvorrichtung zur Erfassung von Zielgruppenforschungsdaten
EP2209236A1 (de) 2009-01-16 2010-07-21 GfK Telecontrol AG Vorrichtung zum Sammeln von Zuhörererfassungsdaten
US9696336B2 (en) 2011-11-30 2017-07-04 The Nielsen Company (Us), Llc Multiple meter detection and processing using motion data
US8768003B2 (en) 2012-03-26 2014-07-01 The Nielsen Company (Us), Llc Media monitoring using multiple types of signatures
US9992729B2 (en) 2012-10-22 2018-06-05 The Nielsen Company (Us), Llc Systems and methods for wirelessly modifying detection characteristics of portable devices
US9106953B2 (en) 2012-11-28 2015-08-11 The Nielsen Company (Us), Llc Media monitoring based on predictive signature caching
EP2926148B1 (de) 2012-11-30 2019-07-31 The Nielsen Company (US), LLC Erkennung von mehreren messvorrichtungen und verarbeitung unter verwendung von bewegungsdaten
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation
US9195649B2 (en) 2012-12-21 2015-11-24 The Nielsen Company (Us), Llc Audio processing techniques for semantic audio recognition and report generation
US9158760B2 (en) 2012-12-21 2015-10-13 The Nielsen Company (Us), Llc Audio decoding with supplemental semantic audio recognition and report generation
US9325381B2 (en) 2013-03-15 2016-04-26 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to monitor mobile devices
US9496922B2 (en) 2014-04-21 2016-11-15 Sony Corporation Presentation of content on companion display device based on content presented on primary display device
US11308462B2 (en) 2014-05-13 2022-04-19 Clear Token Inc Secure electronic payment
CN110955648A (zh) * 2019-12-18 2020-04-03 重庆大学 一种非等距时间序列监测数据的归一化映射处理方法

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919479A (en) * 1972-09-21 1975-11-11 First National Bank Of Boston Broadcast signal identification system
US4061875A (en) * 1977-02-22 1977-12-06 Stephen Freifeld Audio processor for use in high noise environments
US4450531A (en) * 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
JPS60500472A (ja) * 1983-01-03 1985-04-04 ヘンリツクソン ラリ− キ−ス スピ−チ信号を処理する方法及び装置
US4631746A (en) * 1983-02-14 1986-12-23 Wang Laboratories, Inc. Compression and expansion of digitized voice signals
US4630300A (en) * 1983-10-05 1986-12-16 United States Of America As Represented By The Secretary Of The Navy Front-end processor for narrowband transmission
US4757540A (en) * 1983-10-24 1988-07-12 E-Systems, Inc. Method for audio editing
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) * 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US4933973A (en) * 1988-02-29 1990-06-12 Itt Corporation Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems
US4991213A (en) * 1988-05-26 1991-02-05 Pacific Communication Sciences, Inc. Speech specific adaptive transform coder
US5023929A (en) 1988-09-15 1991-06-11 Npd Research, Inc. Audio frequency based market survey method
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
US5319453A (en) * 1989-06-22 1994-06-07 Airtrax Method and apparatus for video signal encoding, decoding and monitoring
DE69024919T2 (de) * 1989-10-06 1996-10-17 Matsushita Electric Ind Co Ltd Einrichtung und Methode zur Veränderung von Sprechgeschwindigkeit
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5901246A (en) * 1995-06-06 1999-05-04 Hoffberg; Steven M. Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
KR100392475B1 (ko) * 1992-11-16 2003-11-28 아비트론 인코포레이티드 방송또는기록된세그먼트를엔코딩/디코딩하고그러한세그먼트에대한시청자노출을모니터링하기위한방법과장치
CH689662A5 (de) * 1993-01-13 1999-07-30 Sieghard Dr Gall Verfahren zur Erfassung des Probandenverhaltens bezueglich verschiedener gleichzeitig verfuegbarer Programme.
US5379345A (en) * 1993-01-29 1995-01-03 Radio Audit Systems, Inc. Method and apparatus for the processing of encoded data in conjunction with an audio broadcast
PL173718B1 (pl) * 1993-06-30 1998-04-30 Sony Corp Sposób i urządzenie do kodowania sygnałów cyfrowych
JP3175446B2 (ja) * 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
FR2715016B1 (fr) * 1994-01-10 1996-03-15 Sandrine Charlet Dispositif autonome et portatif de mesure d'audience des stations de radiodiffusion et des chaînes de télévision, procédé et système pour sa mise en Óoeuvre.
US5754798A (en) * 1994-02-18 1998-05-19 Kabushiki Kaisha Toshiba Computer system with function for controlling system configuration and power supply status data
US5826230A (en) * 1994-07-18 1998-10-20 Matsushita Electric Industrial Co., Ltd. Speech detection device
US5835851A (en) * 1995-01-19 1998-11-10 Ericsson Inc. Method and apparatus for echo reduction in a hands-free cellular radio using added noise frames
US6175634B1 (en) * 1995-08-28 2001-01-16 Intel Corporation Adaptive noise reduction technique for multi-point communication system
US5872852A (en) * 1995-09-21 1999-02-16 Dougherty; A. Michael Noise estimating system for use with audio reproduction equipment
US5907622A (en) * 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
GB9602700D0 (en) * 1996-02-09 1996-04-10 Canon Kk Pattern matching method and apparatus
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
US5937377A (en) * 1997-02-19 1999-08-10 Sony Corporation Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
US5960091A (en) * 1997-04-25 1999-09-28 White; Stanley A. Adaptive removal of resonance-induced noise
US6233549B1 (en) * 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741093B1 (en) 2021-07-21 2023-08-29 T-Mobile Usa, Inc. Intermediate communication layer to translate a request between a user of a database and the database
US11924711B1 (en) 2021-08-20 2024-03-05 T-Mobile Usa, Inc. Self-mapping listeners for location tracking in wireless personal area networks

Also Published As

Publication number Publication date
CA2241454A1 (en) 1998-12-23
EP0887958B1 (de) 2003-01-22
PT887958E (pt) 2003-06-30
CA2241454C (en) 2007-05-22
US20060074648A1 (en) 2006-04-06
DE69810851D1 (de) 2003-02-27
DK0887958T3 (da) 2003-05-05
US7630888B2 (en) 2009-12-08
EP0887958A1 (de) 1998-12-30
ES2190578T3 (es) 2003-08-01
US6993479B1 (en) 2006-01-31
ATE231666T1 (de) 2003-02-15

Similar Documents

Publication Publication Date Title
DE69810851T2 (de) Verfahren für die Kompression der Aufnahmen von Umgebungsgeräuschen, Verfahren für die Erfassung von Programmelementen darin, Vorrichtung und Computer-Programm dafür
DE69906560T2 (de) Cochlea-kompression modellbasiertes hörhilfegerät
DE69433662T2 (de) Adaptive verstärkung und filterschaltung für tonwiedergabesystem
DE60109749T2 (de) Verfahren zur verbesserung des passens von hörgeräten sowie gerät zur implementierung des verfahrens
DE69535621T2 (de) Erkennungsvorrichtung zur Modulationsgrad
EP0732036B1 (de) Schaltungsanordnung für die automatische regelung von hörhilfsgeräten
DE60018084T2 (de) Audiosignalverarbeitung
DE69830385T2 (de) Vorrichtung zur Unterdrückung von Datenabweichungen, hervorgerufen durch äussere Störungen in in gemessenen Signalen in einem implantierbaren Herzschrittmacher
DE69531828T2 (de) Hörhilfegerät mit signalverarbeitungstechniken
EP1453194B1 (de) Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
DE2838293C2 (de) Schaltung zur Störgeräuschverminderung mittels Signalkompression und -expansion in getrennten Frequenzbereichen
EP0820212B1 (de) Lautheitsgesteuerte Verarbeitung akustischer Signale
CH692884A5 (de) Verfahren zur Verstärkung von Eingangssignalen eines Hörgerätes sowie Schaltung zur Durchführung des Verfahrens.
WO2001020965A2 (de) Verfahren zur bestimmung einer momentanen akustischen umgebungssituation, anwendung des verfharens und ein hörgerät
EP0661905A2 (de) Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
DE4227826A1 (de) Digitales verarbeitungsgeraet fuer akustische signale
DE19825789A1 (de) Verfahren und Vorrichtung zur automatischen Kompensierung der Tonlautstärke
DE19720651C2 (de) Hörgerät mit verschiedenen Baugruppen zur Aufnahme, Weiterverarbeitung sowie Anpassung eines Schallsignals an das Hörvermögen eines Schwerhörigen
EP1307072A2 (de) Verfahren zum Betrieb eines Hörgerätes sowie Hörgerät
DE69836472T2 (de) Tonverarbeitungsverfahren, tonprozessor und aufzeichnungs-/wiedergabevorrichtung
DE10260657A1 (de) Audioverstärker mit Spannungsbegrenzung in Reaktion auf den Spektralgehalt
EP1247425A2 (de) Verfahren zum betrieb eines hörgerätes und ein hörgerät
DE4001747C2 (de) Digitales Audiofrequenz-Signalverarbeitungssystem
EP2200341B1 (de) Verfahren zum Betrieb eines Hörhilfegerätes sowie Hörhilfegerät mit einer Quellentrennungseinrichtung
DE112005003681B4 (de) Hörhilfe mit Rückkopplungssignal-Reduktionsfunktion

Legal Events

Date Code Title Description
8364 No opposition during term of opposition