DE10148351A1 - Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus - Google Patents
Verfahren und Vorrichtung zur Auswahl eines KlangalgorithmusInfo
- Publication number
- DE10148351A1 DE10148351A1 DE10148351A DE10148351A DE10148351A1 DE 10148351 A1 DE10148351 A1 DE 10148351A1 DE 10148351 A DE10148351 A DE 10148351A DE 10148351 A DE10148351 A DE 10148351A DE 10148351 A1 DE10148351 A1 DE 10148351A1
- Authority
- DE
- Germany
- Prior art keywords
- audio signal
- signal
- audio
- music
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000005236 sound signal Effects 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000001228 spectrum Methods 0.000 claims description 24
- 230000003595 spectral effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 238000002156 mixing Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011295 pitch Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Auswahl eines Klangalgorithmus zur Verarbeitung eines Audiosignals. Das Audiosignal wird analysiert und auf Grund der Analyse wird die Art des Audiosignals ermittelt. Es wird eine Klassifizierung des Audiosignals als ein Musiksignal oder ein anderes Signal vorgenommen und in Abhängigkeit der Klassifizierung werden zur Weiterverarbeitung und späteren Ausgabe des Audiosignals unterschiedliche Klangalgorithmen verwendet.
Description
- Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Auswahl eines Klangalgorithmus zur Verarbeitung von Audiosignalen gemäss den Merkmalen des Oberbegriffes der Ansprüche 1 und 28.
- Moderne Hifi-Anlagen sind mit verschiedenen Klangprogrammen ausgestattet, die es erlauben, stereophone Audiosignale auf mehr als nur zwei Lautsprecher zu verteilen oder anderweitig einen Raumklang zu erzeugen. So werden beispielsweise nach der Dekodierung der Audiosignale diese in fünf einzelne Audiokanäle aufgespaltet und über sogenannte "Virtualizer" zur Wiedergabe über lediglich zwei Lautsprecher verwendet. Es sind auch spezielle "Virtualizer" bekannt, welche die Audiosignale zur Wiedergabe speziell über Kopfhörer umwandeln.
- Eines der bekanntesten Verfahren hierfür ist das sogenannte "Dolby Pro Logic" Verfahren, welches bei Filmmaterial im wesentlichen dazu eingesetzt wird, die Lokalisation des Klanges beeinflussen zu können. So werden Sprecher üblicherweise auf den Center-Kanal abgebildet und Geräusche können ausschließlich aus den hinteren Lautsprechern kommen.
- Weiterhin gibt es eine ganze Klasse von Verfahren, die zur Nachbildung von Raumakustiken verwendet werden. Häufig anzutreffende Bezeichnungen derartiger Verfahren lauten "Hall", "Stadium", "Jazz", "Club" etc. Bei diesen auf Musiksignale optimierten Verfahren ist es nicht erwünscht, Sprachsignale (Gesang) nur aus dem Center-Lautsprecher zu vernehmen oder ein Musiksignal nur aus den hinteren Lautsprechern auszugeben, welches unter Verwendung des "Dolby Pro Logic" Verfahrens möglich ist.
- Bei dem Nachfolgeverfahren von Dolby Pro Logic, welches Dolby Pro Logic II genannt wurde, ist abgesehen von dem Filmmodus ein Modus für Musik vorgesehen, der diese Unterschiede berücksichtigt.
- Aus EP 0 481 374 B1 ist ein Verfahren zum Kodieren von Sprache bekannt. Hierbei wird eine diskrete Umformung eines Sprachfensters vorgenommen, um ein diskretes Spektrum von Koeffizienten zu erhalten. Eine angenäherte Einhüllenden des diskreten Spektrums wird in jedem einer Vielzahl von Unterbändern errechnet und zum digitalen Kodieren der definierten Einhüllenden eines jeden Unterbands verwendet. Innerhalb von Subbändern wird jeder skalierte Koeffizient in eine Anzahl von Bits mit mindestens einem von einer Vielzahl von Quantisierern unterschiedlicher Bitlängen umgerechnet. Der für jedes Unterband benutzte Ouantisierer wird für jedes Sprachfenster durch Berechnen der Zuweisung von Bits als eine Anzahl von Bits größer als oder gleich Null bestimmt, in Abhängigkeit einer Leistungsdichteabschätzung für das Unterband und einer Verzerrungsfehlerabschätzung für das Sprachfenster.
- Aus EP 0 587 733 B1 ist ein Signalanalysesystem zur Filterung von einem ein oder mehrere Signale repräsentierenden Eingangsabtastwert bekannt. Es sind Eingangspuffermittel zum Gruppieren der Eingangsabtastwerte in Zeitbereichs- Signalabtastwertblöcke vorgesehen. Die Eingangsabtastwerte sind analysefenster-gewichtete Abtastwerte. Außerdem sind Analysemittel zur Erzeugung von Spektralinformation als Antwort auf die Zeitbereichs- Signalabtastwertblöcke vorhanden; wobei die Spektralinformation Spektralkoeffizienten umfaßt, die im wesentlichen einer geradzahlig gestapelten Zeitbereichs-Aliasingaufhebungs-Transformation angewendet auf die Zeitbereichs-Signal-Abtastwertblöcke entspricht. Bei den Spektralkoeffizienten handelt es sich im wesentlichen um Koeffizienten einer modifizierten diskreten Cosinus-Transformation bzw. Koeffizienten einer modifizierten diskreten Sinus- Transformation. Die Analysemittel umfassen Vorwärts-Vor- Transformationsmittel zur Erzeugung modifizierter Abtastwertblöcke und Vorwärts-Transformationsmittel zur Erzeugung von Frequenzbereichs- Transformationskoeffizienten.
- Aus EP 0 664 943 B1 ist eine Kodiervorrichtung zur adaptiven Verarbeitung von Audiosignalen für das Kodieren, Übertragen oder Speichern und Wiedergewinnen bekannt, wobei der Rauschpegel mit dem Signalamplitudenpegel schwankt. Es ist eine Verarbeitungseinrichtung vorhanden, welche auf Eingangssignale derart anspricht, daß sie entweder ein erstes und ein zweites Signal oder die Summe und Differenz des ersten und zweiten Signals ausgibt. Das erste und zweite Signal entsprechen den beiden matrixkodierten Audiosignalen einer vier zu zwei Audiosignalmatrix, wobei die Verarbeitungseinrichtung auch ein Steuersignal erzeugt, welches anzeigt, ob das erste und zweite Signal oder die Summe und Differenz des ersten und zweiten Signals ausgegeben wird.
- Aus EP 0 519 055 B1 ist ein Decoder, bestehend aus einem Empfangsmittel zum Empfang einer Mehrzahl von Lieferkanälen formatierter Information, Deformatierungsmitteln zur Erzeugung ansprechend auf die Empfangsmittel, einer deformatierten Darstellung abhängig von jedem Lieferkanal, und Synthesemittel zur Erzeugung von Ausgangssignalen abhängig von den deformatierten Darstellungen, bekannt. Zwischen den Deformatierungsmitteln und den Synthesemitteln sind Verteilermittel angeordnet, welche auf die Deformatierungsmittel ansprechen und einen oder mehrere Zwischensignale erzeugen, wobei wenigstens ein Zwischensignal durch Kombination der Information von zwei oder mehr der deformatierten Darstellungen erzeugt wird. Die Synthesemittel erzeugen ein jeweiliges Ausgangssignal als Antwort auf jedes der Zwischensignale.
- Aus EP 0 520 068 B1 ist ein Kodierer zum Kodieren von zwei oder mehr Audiokanälen bekannt. Der Kodierer weist eine Teilbandeinrichtung zum Erzeugen von Teilbandsignalen, eine Mischeinrichtung zum Schaffen eines oder mehrerer zusammengesetzter Signale, und Mittel zum Erzeugen von Steuerinformation für ein entsprechendes zusammengesetztes Signal auf. Außerdem weist der Kodierer eine Kodiereinrichtung zum Erzeugen kodierter Information durch Zuteilen von Bits zu dem einen oder mehreren zusammengesetzten Signalen auf. Es ist weiterhin eine Formatiereinrichtung zum Zusammensetzen der kodierten Information und der Steuerinformation zu einem Ausgabesignal vorhanden.
- Aus EP 0 208 712 B1 ist ein Sprachkodierer bekannt. Dieser Sprachkodierer enthält eine Fourier-Transformationseinrichtung zur Ausführung einer diskreten Fourier-Transformation eines ankommenden Sprachsignals zur Erzeugung eines diskreten Transformationsspektrums von Koeffizienten, eine Normierungseinrichtung zum Modifizieren des Transformationsspektrums zur Erzeugung eines normierten, flacheren Spektrums und zum Codieren einer Funktion, durch die das diskrete Spektrum modifiziert wird. Außerdem ist eine Einrichtung zum Codieren wenigstens eines Teils des Spektrums vorhanden. Die Normierungseinrichtung weist eine Einrichtung (44) zum Definieren der approximierten Einhüllenden des diskreten Spektrums in jedem von mehreren Unterbändern von Koeffizienten und zum Codieren der definierten Einhüllenden eines jedes Unterbandes von Koeffizienten und Einrichtungen zum Skalieren jedes Spektrumkoeffizienten relativ zur definierten Einhüllenden des betreffenden Unterbandes von Koeffizienten auf.
- Nachteilig bei allen bekannten Erfindungen ist aber, dass die Auswahl eines Klangalgorithmus manuell einzustellen ist. Wird beispielsweise ein Fernsehton eines aktuell eingestellten Fernsehkanales über einen Dolby Pro Logic II Decoder verarbeitet und der Fernsehkanal mehrmals zwischen Musiksendern und Filmen oder Nachrichten umgeschaltet, so muss bei jedem Wechsel manuell zwischen den einzelnen Audioklangalgorithmen, welche die Audiodaten verarbeiten, wie zum Beispiel zwischen Musik- und Filmmodus, umgeschaltet werden.
- Aufgabe der Erfindung ist es ein Verfahren und eine Vorrichtung anzugeben, welches einem Audiosignal selbständig einem Klangalogrithmus zuweist.
- Die vorliegende Erfindung löst diese Aufgabe durch die Merkmale der Ansprüche 1 und 28. Vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen, der zugehörigen Beschreibung nebst Figuren angegeben.
- Die vorliegende Erfindung löst die Aufgabe dadurch, dass die Art des Audiosignales erkannt wird und auf Grund der Erkennung der Art des Audiosignales eine automatische Einstellung des Klangalgorithmus zugeordnet wird.
- Zur Erkennung der Art des Audiosignales werden verschiedene Maße definiert und ausgewertet.
- Als ein erstes Maß wird bestimmt, welche Dynamik in dem Audiosignal aktuell vorhanden ist. Die Bestimmung der Dynamik wird wie folgt vorgenommen. Die Abtastwerte des linken und rechten Audiokanals werden quadriert, aufaddiert und das resultierende Signal durch einen Tiefpass gefiltert. Der Tiefpass weist vorteilhaft eine Grenzfrequenz von etwa 3 Hz auf. Über eine definierte Zeitdauer, vorteilhaft z. B. fünf Sekunden, wird in diesem Zeitrahmen das Minimum und das Maximum des Audiosignals ermittelt. Der aktuell vorhandene Dynamikumfang in Dezibel entspricht dann dem zehnfachen der Differenz der Logarithmen beider Werte.
- In einer weiteren vorteilhaften Ausgestaltung der Erfindung werden die Dynamiken vom rechten und linken Audio-Kanal getrennt berechnet. Bei der weiteren Betrachtung wird nur der Audio-Kanal weiterverwendet, welcher den größeren Dynamikumfang aufweist.
- Es besteht auch die Möglichkeit statt der Quadrierung eine Absolutwertbildung vorzunehmen und anstelle der Tiefpassfilterung mit anschließender Maximasuche eine Pegelbestimmung für kurze Zeitdauern, beispielsweise über eine Zeitdauer von einer Drittel Sekunde durchzuführen und dann unter diesen Pegelwerten ein Maxima und Minima zur Berechnung der Dynamik durchzuführen.
- Bei Filmmaterial sind große Pegelsprünge und damit ein großer Dynamikumfang vorhanden, da beispielsweise der Signalpegel in Sprachpausen stark abfällt. Musiksignale haben üblicherweise jedoch nur einen Dynamikumfang von etwa zwanzig dB oder weniger. Auf überraschend einfache Art ist ein entsprechenden Maßes zu gewinnen indem der ermittelte Dynamikumfang mit einem Schwellwert verglichen wird.
- Ist der Dynamikumfang größer als der Schwellwert, so wird das Maß auf den Wert -1 gesetzt (Filmmodus), ansonsten auf den Wert 1 (Musikmodus). Anstelle dieser harten Unterteilung wird im weiteren ein gleitendes Maß bestimmt. Dazu wird der Dynamikumfang über eine Funktion auf den Wertebereich [-1,0. .1,0] abgebildet. Eine einfache Funktion dazu ist vom Schwellwert den errechneten Dynamikumfang abzuziehen, das Ergebnis durch den Schwellwert zu teilen und diesen Wert dann noch auf den Wertebereich [-1,0. .1,0] zu begrenzen. Dieser Wert wird im Folgenden als M1 bezeichnet. Sollte der Dynamikumfang 0 sein, so wird M1 zu 1 errechnet, bei einem dem Schwellwert entsprechenden Dynamikumfang errechnet sich M1 zu 0, was also als neutral zu bewerten ist und bei Dynamikumfängen größer oder gleich dem Doppelten des Schwellwertes errechnet sich M 1 zu -1,0.
- Um zu vermeiden, dass dieses Maß bei längeren Signalpausen anspricht, wird zudem ein Mindestpegel vorausgesetzt, der beispielsweise 30 dB unter dem Maximalwert liegt, welcher in einer gewissen Zeitspanne zuvor, in vorteilhafter Ausgestaltung etwa 5 Minuten, aufgetreten ist. Als Vergleichspegel wird dabei der bei der Dynamikermittlung gefundene Maximalwert verwendet. Sollte dieser Wert unter dem Mindestpegel liegen, so wird das aus dem Dynamikumfang errechnete Maß M 1 auf -1,0 gesetzt. Für eine gleitende Überblendung kann man den Wertebereich von 40 dB unter Maximalpegel bis 20 dB unter Maximalpegel heranziehen. Bei Werten von mehr als 40 dB unter Maximalpegel wird M1 dann auf -1 gesetzt, bei Werten von weniger als 20 dB unter Maximalpegel bleibt es unverändert, bei Werten dazwischen wird entsprechend eine lineare Interpolation zwischen diesen beiden Grenzfällen vorgenommen.
- Als weiteres Maß wird die Periodizität des Audio-Signales, im Weiteren mit M2 bezeichnet, herangezogen. Aus der Standardliteratur sind viele Verfahren zur Bestimmung der Periodizität eines Audiosignales bekannt. Ein sehr einfaches Verfahren besteht darin, die Abtastwerte des linken und rechten Kanals zu quadrieren, aufzuaddieren und das resultierende Signal durch einen Tiefpass mit einer Grenzfrequenz von etwa 50 Hz filtern. In diesem Signal werden dann die Maxima gesucht. Wird festgestellt, dass die Pegelmaxima periodisch mit für Musik typischen Zeitabständen von zwischen einer drittel bis einer ganzen Sekunde auftreten, so wird dieses Maß, M2, auf 1 gesetzt, ansonsten auf -1.
- Musiksignale lassen sich auch anhand ihrer Spektralverläufe als solche identifizieren. So haben beispielsweise Blas- und Streichinstrumente sehr charakteristische Spektren, die leicht detektiert werden können. Sollten derartige Spektralverläufe detektiert werden, so wird ein Maß M3 auf 1 gesetzt, ansonsten auf 0. Der Wert -1 wird hierbei nicht verwendet, da das Nicht- Vorhandensein dieser Spektren nicht automatisch bedeutet, dass kein Musiksignal vorliegt. Dieses Maß kann also nur eine Entscheidung in Richtung der Musikdetektion bewirken.
- Auch unbekannte Instrumente können im Spektrum identifiziert werden wenn sie mehrstimmig gespielt werden, d. h. wenn gleichzeitig mehr als ein Ton wahrzunehmen ist. In diesem Fall wird das für das Instrument typische Spektrum mehrfach bei unterschiedlichen Frequenzen vorhanden sein. Eine Verwechslung mit Sprache ist dabei nicht möglich, da sich die Spektren unterschiedlicher Sprecher unterscheiden und eine Person zu einem Zeitpunkt nur in einer Tonhöhe sprechen kann. Bei der Detektion derartiger Spektralkonstellationen wird ein Maß M4 auf den Wert 1 gesetzt, ansonsten wie bei im vorherigen für das Maß M3 aufgezeigt, auf den Wert 0. Eine noch genauere Aussage ist dadurch möglich, dass die Frequenzen dieser Töne verglichen werden. Sollte es sich um Musik handeln, so werden diese mit großer Wahrscheinlichkeit in einem musikalischen Zusammenhang zueinander stehen, also sich nur durch einen Faktor unterscheiden, der einer ganzzahligen Potenz der zwölften Wurzel aus 2 entspricht. Sollten derartige Töne detektiert werden, so kann auch anhand der Erkennung von Melodien, also der Beobachtung der Tonhöhen dieses Instruments über der Zeit Musik detektiert werden.
- Da bei Musiksignalen üblicherweise mehrere Instrumente spielen, die von ihrem Frequenzverhalten so aufeinander abgestimmt sind, dass sie sich gegenseitig ergänzen und nicht überdecken, kann man bei Musiksignalen einen verhältnismäßig flachen Frequenzgang beobachten. Die Flachheit des Frequenzganges wird ebenfalls als Maß für das Vorhandensein als Musik genutzt. Dazu wird der Pegel des Eingangssignales, insbesondere die Summe des rechten und linken Audio-Kanales, in verschiedenen Frequenzbändern insbesondere in den Frequenzbändern von 20 Hz bis 200 Hz, von 200 Hz bis 2 kHz und 2 kHz bis 20 kHz, ermittelt. Von jedem dieser Pegel wird der Maximalpegel ermittelt und dieser Wert mit der Anzahl an Bändern multipliziert. Davon werden die Pegel der einzelnen Bänder subtrahiert. Ergibt sich dabei ein großer Wert, so deutet dies daraufhin, dass die Leistung spektral in wenigen Bändern konzentriert ist und es sich somit wahrscheinlich nicht um Musik handelt. Zur Findung dieses Maßes, im weiteren mit M5 bezeichnet, wird ein Wertebereich von einem Maximalwert bis zu einem Minimalwert auf den Wertebereich [-1,0. . .1,0] linear abgebildet. Werte außerhalb dieses Bereiches werden auf die Grenzwerte abgebildet.
- Ein ähnliches Maß lässt sich aus der Anzahl an spektralen Maxima mit einem gewissen Mindestpegel ableiten. Bei Vorhandensein vieler Instrumente sind auch viele derartige Maxima vorhanden. Die Anzahl an vorhandenen Maxima kann direkt linear auf den Wertebereich [-1,0. . .1,0] zur Bestimmung eines weiteren Maßes M6 abgebildet werden.
- Abgesehen von der Analyse des Klangmaterials lässt auch die Quelle Rückschlüsse auf das Klangmaterial zu. So ist z. B. bei Wiedergabe einer Rundfunksendung oder einer CD die Wahrscheinlichkeit sehr hoch, dass es sich um Musiksignale handelt. Hingegen wird es sich bei der Wiedergabe einer in AC3 codierten DVD eher um einen Film handeln. Jeder Quelle wird also ein individuelles Maß zugewiesen, so kann z. B. der Quelle CD der Wert 0,5 und einer DVD der Wert -0,3 zugewiesen werden. Dieses Maß wird als M7 bezeichnet.
- Aus den einzelnen Maßen M1 bis M7 wird ein Gesamtmaß MG ermittelt. Dazu werden alle Maße M1 bis M7 mit einem individuellen Faktor gewichtet und aufaddiert. Da M1 eine sehr hohe Bedeutung hat, wird es mit dem größten Faktor, im Verhältnis zu den anderen Maßen M2 bis M7 bewertet. In der weiteren Beschreibung der Erfindung wird das Maß M1 mit dem Faktor 1 gewichtet, M2 wird mit Faktor 0,5, M3, M4, M5, M6 und M7 jeweils nur mit Faktor 0,2. Werte für das Gesamtmaß MG kleiner 0 entsprechen dann einem Signal ohne Musik, welches im Filmmodus wiedergegeben werden sollte und Werte größer 0 klassifizieren ein Musiksignal, wofür dann der Musikmodus Verwendung finden sollte. Je stärker negativ oder positiv dieser Wert ist, umso eindeutiger ist die Klassifizierung.
- Um ein häufiges Umschalten im Grenzfall, d. h. bei Werten von MG nahe Null, zu vermeiden, wird eine Hysterese verwendet. Das bedeutet dass eine Umschaltung vom Filmmodus zum Musikmodus erst dann erfolgt, wenn MG einen Wert größer Null (beispielsweise 0,3) überschreitet. Eine Umschaltung vom Musikmodus zum Filmmodus erfolgt erst bei Unterschreitung eines Wertes kleiner Null (beispielsweise -0,3).
- Das Umschalten zwischen dem Filmmodus und dem Musikmodus erfolgt mit einer durch den Benutzer einstellbaren Verzögerungszeit sowie Trägheit. Der Signaltyp muss für eine Zeitdauer entsprechend der Verzögerungszeit konstant sein, ansonsten erfolgt kein Wechsel des Wiedergabemodus. Nach dieser Verzögerungszeit erfolgt dann mit einer der Trägheit entsprechenden Zeitkonstante eine Überblendung zwischen den Modi, wodurch ansonsten eventuell hörbare Signalsprünge vermieden werden können und der Übergang von einem Modus in den anderen Modus unauffällig gestaltet werden kann. Im Normalfall liegt diese Zeitkonstante bei etwa 10 Sekunden. Bei sehr kurzen Zeitkonstanten wird versucht, einen Wechsel innerhalb einer Signalpause durchzuführen. In manchen Fällen sollte die vom Benutzer vorgewählte Verzögerungszeit sowie die Zeitkonstante der Trägheit weiter verringert werden, z. B. direkt nachdem bei einem Fernseher der Kanal umgeschaltet wird und das Audiosignal des Fernsehers wiedergegeben wird. Dieser Fall kann einfach festgestellt werden, wenn die entsprechende Audioverarbeitung im Fernseher untergebracht ist oder der Fernseher eine entsprechende Nachricht an die anderen angeschlossenen Geräte sendet. Ein derartiger Umschaltvorgang kann auch an einer abrupt auftretenden Signalpause erkannt werden, die bei Umschaltvorgängen innerhalb eines Gerätes immer die für dieses Gerät typische Dauer haben wird.
- Weiterhin ist die Detektion der Kanalumschaltung basierend auf dem Bildsignal möglich, da beim Umschalten üblicherweise die Synchronisation verlorengeht. Aus einem Synchronisationsverlust kann also auch auf einen Kanalwechsel geschlossen werden. Bei der Detektion eines Kanalwechsels wird die Verzögerungszeit dann auf Null gesetzt und die Zeitkonstante auf eine Zeit von beispielsweise 3 Sekunden reduziert. Nach der ersten darauffolgenden Bestimmung des Klangmaterials und einer entsprechend langen Zeit zum Überblenden auf den gewünschten Modus kann dann wieder auf die normale Verzögerungszeit und die lange Zeitkonstante gewechselt werden.
- Die Verzögerungszeit und die Trägheit werden auch in Abhängigkeit des Absolutwertes von MG verändert. Sehr hohe Absolutwerte entsprechen einer sehr deutlichen Klassifizierung, weshalb in solchen Fällen ein früherer Wechsel möglich ist.
- Zur Wiedergabe von Musiksignalen können verschiedene Klangprogramme verwendet werden. Beispielsweise ist es möglich, das Differenzsignal zwischen dem linken und rechten Eingangssignal auf die hinteren Lautsprecher auszugeben und die vorderen Kanäle unbeeinflusst zu lassen. Das Differenzsignal kann zusätzlich noch für beide Kanäle individuell vorverarbeitet werden, wozu üblicherweise Allpassfilter verwendet werden. Damit wird eine Dekorrelation der hinteren Lautsprecher erreicht. Alternativ kann bei Musiksignalen ein häufig als "Hall" bezeichnetes Klangprogramm eingesetzt werden. Bei diesem wird zusätzlich zu dem Differenzsignal noch ein Hallanteil des Originalsignales sowie des Differenzsignales auf allen Lautsprechern ausgegeben. Allen derart für Musiksignale geeigneten Klangprogrammen ist gemein, dass die Stereobreite weitestgehend erhalten bleibt, also kein oder nur wenig Signal auf den vorderen Centerlautsprecher ausgegeben wird und auch keine aktive Matrizierung stattfindet, d. h. dass der Pegel für die vorderen Kanäle nicht abgesenkt wird, wenn das Differenzsignal der Eingangskanäle im Vergleich zu deren Summe groß wird.
- Bei anderen Signalen als Musik wird beispielsweise Dolby Pro Logic oder ein ähnliches Verfahren eingesetzt werden. Dabei wird zum einen der Pegel der vorderen Kanäle reduziert, falls das Differenzsignal des Einganges im Vergleich zum Summensignal einen großen Pegel annimmt. Sollte das Differenzsignal sehr klein sein, so werden die Signale von den vorderen rechten und linken Kanälen zudem zum vorderen Centerkanal umgeleitet um eine Mittenortung bei Sprechern zu erreichen.
- Anstelle einer 5-Lautsprecher-Konstellation können auch noch mehr Lautsprecher verwendet werden, so dass dann z. B. das Differenzsignal auf drei hintere Lautsprecher ausgegeben wird.
- Im Weiteren wird die Erfindung anhand eines konkreten Ausführungsbeispieles erläutert. Das Ausführungsbeispiel zeigt eine erfindungsgemäße Vorrichtung.
- Die erfindungsgemäße Vorrichtung V weist einen Signaleingang E, einen Quelleninformationseingang Q sowie einen Signalausgang A auf. Über den Eingang E werden der Vorrichtung V Audiodaten zugeführt. Insbesondere werden Stereo-Audiodaten, d. h. Audiodaten in Zweikanalverfahren zugeführt. Werden die Daten in analoger Form zugeführt, so erfolgt in einer vorgeschalteten Vorrichtung eine Kanaltrennung der Audiosignale und eine Digitalisierung. Der Vorrichtung V werden dann digitale Daten zugeführt. Die Vorrichtung V ist jedoch in der Weise erweitert, dass sie auch mehrkanalige Audiodaten, beispielsweise im AC3 Format, verarbeitet kann. Auch ist eine rein analoge Realisierung möglich, wenn die Vorrichtungen V8, V4, V5, V6 und V7 durch entsprechende analoge Varianten unter Verwendung von Filterbänken anstelle der FFT realisiert werden oder auf die Auswertung dieser Charakteristiken verzichtet wird.
- Die Audiosignale, welche über den Eingang E der Vorrichtung V zugeführt werden, werden diversen weiteren Vorrichtungen V1 bis V10 zeitgleich zugeführt.
- Die Vorrichtungen V1 bis V7 bewerten das Eingangs-Audiosignal und führen es jeweils einer weiteren Vorrichtung VM1 bis VM6 zur Abbildung auf ein Maß zu. Hierbei dient die Vorrichtung VM1 zur Abbildung auf das Maß 1, die Vorrichtung VM2 zur Abbildung auf das Maß 2, usw.
- Im weiteren dient die Vorrichtung V1 zur Dynamikermittlung, die Vorrichtung V2 zur Pegelbestimmung, die Vorrichtung V3 zur Periodizitätsmittlung, die Vorrichtung V4 zur Ermittlung von Frequenzspektren, insbesondere von Musikinstrumenten, die Vorrichtung V5 zur Bestimmung der Flachheit des Frequenzganges des Audiosignals, die Vorrichtung V6 zur Ermittlung der Anzahl an Maxima im Frequenzspektum, die Vorrichtung V7 zur Ermittlung des Anteils ähnlicher spektraler Strukturen im Frequenzspektum, die Vorrichtung V8 zur Transformation der Audiosignale aus dem Zeitbereich in den Frequenzbereich, die Vorrichtung V9 zur Verarbeitung von Musiksignalen, die Vorrichtung V10 zur Verarbeitung von anderen Signalen, die Vorrichtung V11 zur Detektion von Umschaltvorgängen und die Vorrichtung V12 zur Abbildung auf einen Faktor zur Steuerung der Schaltgeschwindigkeit.
- Die aus den Vorrichtungen MV1 bis MV7 gewonnenen Maße werden mit Gewichtungsfaktoren G1 bis G7 gewichtet und aufaddiert. Das auf diese Weise gewonnene Gesamtmaß wird nochmals durch die Vorrichtungen V11 und V12 gewichtet und über die Hysteresevorrichtung H geleitet. Die Hysteresevorrichtung H verhindert, daß eine Umschaltung vom Filmmodus zum Musikmodus und umgekehrt erst dann erfolgt, wenn das Gesamtmaß einen vordefinierten Wert überschreitet oder unterschreitet. Anschließend wird das Gesamtmaß einem Integrator I, der vorteilhafterweise auf den Bereich [-0.5. . .1.5] begrenzt, und einer Vorrichtung B zur Begrenzung auf den Bereich [0. . .1.0] zugeführt.
- Das Gesamtmaß, welches über den Integrator I und die Vorrichtung B geführt ist, wird mit den Audiosignalen, welche von den Vorrichtungen V9 und V10 stammen gewichtet und addiert. Auf diese Weise wird der entsprechende Audioverarbeitungsmodus gewählt. Bezugszeichenliste A Ausgang (5-Kanal)
B Vorrichtung zur Begrenzung auf Bereich [0. .1.0]
G1, G2, G3, G4, G5, G6, G7 Gewichtungsfaktoren
H Hysteresevorrichtung
I Integrator
VM1 Vorrichtung zur Abbildung auf das Maß 1
VM2 Vorrichtung zur Abbildung auf das Maß 2
VM3 Vorrichtung zur Abbildung auf das Maß 3
VM4 Vorrichtung zur Abbildung auf das Maß 4
VM5 Vorrichtung zur Abbildung auf das Maß 5
VM6 Vorrichtung zur Abbildung auf das Maß 6
VM7 Vorrichtung zur Abbildung auf das Maß 7
V1 Vorrichtung zur Dynamikermittlung
V2 Vorrichtung zur Pegelbestimmung
V3 Vorrichtung zur Periodizitätsmittlung
V4 Vorrichtung zur Ermittlung von Frequenzspektren von Musikinstrumenten
V5 Vorrichtung zur Bestimmung der Flachheit des Frequenzganges
V6 Vorrichtung zur Ermittlung der Anzahl an Maxima im Frequenzspektum
V7 Vorrichtung zur Ermittlung des Anteils ähnlicher spektraler Strukturen im Frequenzspektum
V8 Vorrichtung zur Transformation in den Frequenzbereich
V9 Vorrichtung zur Verarbeitung von Musiksignalen
V10 Vorrichtung zur Verarbeitung von anderen Signalen
V11 Vorrichtung zur Detektion von Umschaltvorgängen
V12 Vorrichtung zur Abbildung auf einen Faktor zur Steuerung der Schaltgeschwindigkeit
Claims (28)
1. Verfahren zur Auswahl eines Klangalgorithmus zur Verarbeitung eines
Audiosignals,
dadurch gekennzeichnet, dass
das Audiosignal analysiert wird und auf Grund der Analyse die Art des
Audiosignals ermittelt wird, wobei eine Klassifizierung des Audiosignals als
ein Musiksignal oder ein anderes Signal vorgenommen wird und in
Abhängigkeit der Klassifizierung zur Weiterverarbeitung und späteren
Ausgabe des Audiosignals unterschiedliche Klangalgorithmen verwendet
werden.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, dass
das Audiosignal ein stereophones Audiosignal ist.
3. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet, dass
das Audiosignal aus mindestens zwei Audiokanälen besteht.
4. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet, dass
bei einem Musiksignal ein Klangprogramm gewählt wird, welches die
Stereobreite weitestgehend oder ganz erhält.
5. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet, dass
bei einem Musiksignal ein Klangprogramm gewählt wird, welches keine
Pegelreduktion oder nur eine geringe Pegelreduktion der vorderen Kanäle
vornimmt.
6. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet, dass
bei anderen Signalen als Musik ein Klangprogramm gewählt wird, welches
ähnlich dem Dolby Pro Logic Verfahren arbeitet.
7. Verfahren nach einem der Ansprüche 1 bis 6,
dadurch gekennzeichnet, dass
in Abhängigkeit von der Klassifizierung des Audiosignals die einzustellenden
Parameter für Musik und Filmmaterial automatisch ausgewählt werden.
8. Verfahren nach Anspruch 7,
dadurch gekennzeichnet, dass
eine Umlenkung des vorderen Centerkanales auf die vorderen linken und
rechten Kanäle vorgenommen wird und der Grad der Umlenkung individuell
vorgenommen wird.
9. Verfahren nach einem der vorhergehenden Ansprüche,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals verschiedene Maße (M1 bis M6) aus
dem Audiosignal und/oder der Quelle des Audiosignals (M7) ermittelt
werden, die ermittelten Maße (M1 bis M7) unterschiedlich gewichtet werden
und ein Gesamtmaß (MG) ermittelt wird, anhand welchem die
Klassifizierung des Audiosignals vorgenommen wird.
10. Verfahren nach Anspruch 9,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals der Dynamikumfang des
Eingangssignals und/oder dessen Pegel als ein erstes Maß (M1)
herangezogen wird.
11. Verfahren nach Anspruch 9 oder 10,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals die Periodizität des Audiosignals als ein
zweites Maß (M2) herangezogen wird.
12. Verfahren nach einem der Ansprüche 9 bis 11,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals das Vorhandensein von in Musik
typischen Signalspektren als ein drittes Maß (M3) herangezogen wird.
13. Verfahren nach Anspruch 12,
dadurch gekennzeichnet, dass
die typischen Signalspektren von Blas- und Streichinstrumenten erkannt
werden.
14. Verfahren nach einem der Ansprüche 9 bis 13,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals die Flachheit des Frequenzganges des
Audiosignales als ein viertes Maß (M4) herangezogen wird.
15. Verfahren nach einem der Ansprüche 9 bis 14,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals die Anzahl an zu beobachtenden
Maxima mit einem gewissen Mindestpegel im Spektrum als ein fünftes Maß
(M5) herangezogen wird.
16. Verfahren nach einem der Ansprüche 9 bis 15
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals das Vorhandensein ähnlicher spektraler
Strukturen bei unterschiedlichen Frequenzen in einem Spektrum als ein
sechstes Maß (M6) herangezogen wird.
17. Verfahren nach einem der Ansprüche 9 bis 16,
dadurch gekennzeichnet, dass
zur Klassifizierung des Audiosignals die Art der Quelle des Audiosignals als
ein siebtes Maß (M7) herangezogen wird.
18. Verfahren nach Anspruch 17,
dadurch gekennzeichnet, dass
die Quelle des Audiosignals eine CD, eine DVD, ein Datenfile, ein
Rundfunksignalempfänger, ein Audiorundfunksignalempfänger, ein
Satellitenrundfunksignalempfänger, ein Kabelrundfunksignalempfänger, ein
Fernsehsenderempfänger ist.
19. Verfahren nach Anspruch 18,
dadurch gekennzeichnet, dass
das Datenfile ein MP3-File ist.
20. Verfahren nach einem der Ansprüche 1 bis 19,
dadurch gekennzeichnet, dass
das Gesamtmaß (MG) für das Audiosignal durch gewichtete Addition der
einzelnen Maße (M1 bis M7) ermittelt wird.
21. Verfahren nach einem der Ansprüche 1 bis 20,
dadurch gekennzeichnet, dass
bei der Auswertung des Gesamtmaßes (MG) eine Hysterese verwendet
wird, wodurch ein häufiges Umschalten an der Schwelle bei leichten
Schwankungen vermieden wird.
22. Verfahren nach einem der Ansprüchen 1 bis 21,
dadurch gekennzeichnet, dass
eine Umschaltung auf einen anderen Klangalgorithmus erst dann
vorgenommen wird, wenn die Klassifizierung des Audiosignals für eine
einstellbare Zeitdauer konstant ist.
23. Verfahren nach Anspruch 22,
dadurch gekennzeichnet, dass
die Klangalgorithmen ineinander übergeblendet werden und die Zeit zur
Überblendung durch den Benutzer einstellbar ist.
24. Verfahren nach einem der Ansprüchen 22 oder 23,
dadurch gekennzeichnet, dass
die Zeitdauer in der die Klassifizierung des Audiosignals ermittelt wird und
die Zeit zur Überblendung eines Klangalgorithmus in einen anderen
Klangalgorithmus in Abhängigkeit vom Gesamtmaß (MG) verringert wird,
wenn das Gesamtmaß (GM) eine eindeutige Klassifizierung liefert.
25. Verfahren nach einem der Ansprüche 22 bis 24,
dadurch gekennzeichnet, dass
Umschaltvorgänge des Quellensignals erkannt werden und in solchen
Fällen die Zeitdauer zur Klassifizierung des Audiosignals und die Zeit zur
Überblendung eines Klangalgorithmus in einen anderen Klangalgorithmus
verringert wird.
26. Verfahren nach Anspruch 25,
dadurch gekennzeichnet, dass
Umschaltvorgänge an einer abrupt auftretenden Signalpause erkannt
werden.
27. Verfahren nach Anspruch 25,
dadurch gekennzeichnet, dass
Umschaltvorgänge an einem Synchronisationsverlust eines Bildsignals
erkannt werden.
28. Vorrichtung zur Durchführung des Verfahren nach einem oder mehreren der
vorangehenden Ansprüche.
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10148351A DE10148351B4 (de) | 2001-09-29 | 2001-09-29 | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus |
CN02823779.XA CN1689372B (zh) | 2001-09-29 | 2002-09-30 | 用于选择声音算法的方法和装置 |
EP02777268A EP1430750B1 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
PCT/EP2002/010961 WO2003030588A2 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
DE50214765T DE50214765D1 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
AT02777268T ATE488101T1 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
JP2003533646A JP4347048B2 (ja) | 2001-09-29 | 2002-09-30 | サウンドアルゴリズムの選定方法とその装置 |
US10/491,269 US7206414B2 (en) | 2001-09-29 | 2002-09-30 | Method and device for selecting a sound algorithm |
ES02777268T ES2356226T3 (es) | 2001-09-29 | 2002-09-30 | Procedimiento y dispositivo de selección de un algoritmo de sonido. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10148351A DE10148351B4 (de) | 2001-09-29 | 2001-09-29 | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10148351A1 true DE10148351A1 (de) | 2003-04-17 |
DE10148351B4 DE10148351B4 (de) | 2007-06-21 |
Family
ID=7700947
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10148351A Expired - Fee Related DE10148351B4 (de) | 2001-09-29 | 2001-09-29 | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus |
DE50214765T Expired - Lifetime DE50214765D1 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50214765T Expired - Lifetime DE50214765D1 (de) | 2001-09-29 | 2002-09-30 | Verfahren und vorrichtung zur auswahl eines klangalgorithmus |
Country Status (8)
Country | Link |
---|---|
US (1) | US7206414B2 (de) |
EP (1) | EP1430750B1 (de) |
JP (1) | JP4347048B2 (de) |
CN (1) | CN1689372B (de) |
AT (1) | ATE488101T1 (de) |
DE (2) | DE10148351B4 (de) |
ES (1) | ES2356226T3 (de) |
WO (1) | WO2003030588A2 (de) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602005009244D1 (de) * | 2004-11-23 | 2008-10-02 | Koninkl Philips Electronics Nv | Einrichtung und verfahren zur verarbeitung von audiodaten, computerprogrammelement und computerlesbares medium |
US20060115104A1 (en) * | 2004-11-30 | 2006-06-01 | Michael Boretzki | Method of manufacturing an active hearing device and fitting system |
WO2006070768A1 (ja) * | 2004-12-27 | 2006-07-06 | P Softhouse Co., Ltd. | オーディオ波形処理装置、方式およびプログラム |
KR100715949B1 (ko) * | 2005-11-11 | 2007-05-08 | 삼성전자주식회사 | 고속 음악 무드 분류 방법 및 그 장치 |
KR100749045B1 (ko) * | 2006-01-26 | 2007-08-13 | 삼성전자주식회사 | 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치 |
KR100717387B1 (ko) * | 2006-01-26 | 2007-05-11 | 삼성전자주식회사 | 유사곡 검색 방법 및 그 장치 |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
JP4439579B1 (ja) * | 2008-12-24 | 2010-03-24 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
CN102044246B (zh) * | 2009-10-15 | 2012-05-23 | 华为技术有限公司 | 一种音频信号检测方法和装置 |
CN102340598A (zh) * | 2011-09-28 | 2012-02-01 | 上海摩软通讯技术有限公司 | 具有广播音乐捕捉功能的移动终端及其音乐捕捉方法 |
CN105895111A (zh) * | 2015-12-15 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 基于Android的音频内容处理方法及设备 |
CN105828272A (zh) * | 2016-04-28 | 2016-08-03 | 乐视控股(北京)有限公司 | 音频信号处理方法和装置 |
CN110620986B (zh) * | 2019-09-24 | 2020-12-15 | 深圳市东微智能科技股份有限公司 | 音频处理算法的调度方法、装置、音频处理器和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69214882T2 (de) * | 1991-06-06 | 1997-03-20 | Matsushita Electric Ind Co Ltd | Gerät zur Unterscheidung von Musik und Sprache |
US5712953A (en) * | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
DE19848491A1 (de) * | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
DE19854125A1 (de) * | 1998-11-24 | 2000-05-25 | Bosch Gmbh Robert | Wiedergabegerät für Audiosignalträger und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals von einem Audiosignalträger |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0129989B1 (ko) * | 1993-06-30 | 1998-10-01 | 김광호 | 자동 음색 조정방법 및 장치 |
US5617478A (en) | 1994-04-11 | 1997-04-01 | Matsushita Electric Industrial Co., Ltd. | Sound reproduction system and a sound reproduction method |
US5666430A (en) * | 1995-01-09 | 1997-09-09 | Matsushita Electric Corporation Of America | Method and apparatus for leveling audio output |
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP3700890B2 (ja) * | 1997-07-09 | 2005-09-28 | ソニー株式会社 | 信号識別装置及び信号識別方法 |
CN1192358C (zh) * | 1997-12-08 | 2005-03-09 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
US6819863B2 (en) * | 1998-01-13 | 2004-11-16 | Koninklijke Philips Electronics N.V. | System and method for locating program boundaries and commercial boundaries using audio categories |
-
2001
- 2001-09-29 DE DE10148351A patent/DE10148351B4/de not_active Expired - Fee Related
-
2002
- 2002-09-30 JP JP2003533646A patent/JP4347048B2/ja not_active Expired - Fee Related
- 2002-09-30 CN CN02823779.XA patent/CN1689372B/zh not_active Expired - Lifetime
- 2002-09-30 WO PCT/EP2002/010961 patent/WO2003030588A2/de active Application Filing
- 2002-09-30 DE DE50214765T patent/DE50214765D1/de not_active Expired - Lifetime
- 2002-09-30 AT AT02777268T patent/ATE488101T1/de active
- 2002-09-30 US US10/491,269 patent/US7206414B2/en not_active Expired - Lifetime
- 2002-09-30 ES ES02777268T patent/ES2356226T3/es not_active Expired - Lifetime
- 2002-09-30 EP EP02777268A patent/EP1430750B1/de not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69214882T2 (de) * | 1991-06-06 | 1997-03-20 | Matsushita Electric Ind Co Ltd | Gerät zur Unterscheidung von Musik und Sprache |
US5712953A (en) * | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
DE19848491A1 (de) * | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
DE19854125A1 (de) * | 1998-11-24 | 2000-05-25 | Bosch Gmbh Robert | Wiedergabegerät für Audiosignalträger und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals von einem Audiosignalträger |
Non-Patent Citations (1)
Title |
---|
THONG ZHANG u.JAY KUO, C.C.: Audio Content Analy- sis for Online Audiovisual Data Segmentational and Classification. In: IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 4, May 2001, S. 441-457 * |
Also Published As
Publication number | Publication date |
---|---|
CN1689372B (zh) | 2011-08-03 |
EP1430750B1 (de) | 2010-11-10 |
ES2356226T3 (es) | 2011-04-06 |
US20050129251A1 (en) | 2005-06-16 |
ATE488101T1 (de) | 2010-11-15 |
WO2003030588A3 (de) | 2003-12-11 |
CN1689372A (zh) | 2005-10-26 |
JP4347048B2 (ja) | 2009-10-21 |
JP2005507584A (ja) | 2005-03-17 |
US7206414B2 (en) | 2007-04-17 |
DE10148351B4 (de) | 2007-06-21 |
DE50214765D1 (de) | 2010-12-23 |
EP1430750A2 (de) | 2004-06-23 |
WO2003030588A2 (de) | 2003-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69533822T2 (de) | Verfahren zur Wiedergabe von Audiosignalen und Vorrichtung dafür | |
DE60306512T2 (de) | Parametrische beschreibung von mehrkanal-audio | |
DE60206390T2 (de) | Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate | |
EP2206113B1 (de) | Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung | |
DE69827775T2 (de) | Tonkanalsmischung | |
DE602004008613T2 (de) | Treueoptimierte kodierung mit variabler rahmenlänge | |
EP2005421B1 (de) | Vorrichtung und verfahren zum erzeugen eines umgebungssignals | |
EP1430750B1 (de) | Verfahren und vorrichtung zur auswahl eines klangalgorithmus | |
WO1993019542A2 (de) | Verfahren zum übertragen oder speichern digitalisierter, mehrkanaliger tonsignale | |
DE102005014477A1 (de) | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung | |
WO2006094635A1 (de) | Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms | |
WO2001043503A2 (de) | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals | |
EP2939445B1 (de) | Erzeugung von 3d-audiosignalen | |
EP2499843B1 (de) | Verfahren zum abmischen von mikrofonsignalen einer tonaufnahme mit mehreren mikrofonen | |
WO2012032178A1 (de) | Vorrichtung und verfahren zur zeitlichen auswertung und optimierung von stereophonen oder pseudostereophonen signalen | |
WO2011009650A1 (de) | Vorrichtung und verfahren zur optimierung stereophoner oder pseudostereophoner audiosignale | |
DE102007029381A1 (de) | Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren | |
EP1318502B1 (de) | Verfahren zur Audiocodierung | |
WO2014117867A1 (de) | Verfahren zur mehrkanaltonbearbeitung in einem mehrkanaltonsystem | |
DE2252132C3 (de) | Decodierer für ein 4-2-4-Matrixsystem | |
DE102021201668A1 (de) | Signaladaptives Neumischen von getrennten Audioquellen | |
WO2015128379A1 (de) | Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal | |
DE4308175A1 (de) | Verfahren zum Wiedergeben eines ein- oder mehrkanaligen digitalen, blockweise codierten Tonsignals | |
DE3923447C2 (de) | ||
DE102017121876A1 (de) | Verfahren und vorrichtung zur formatumwandlung eines mehrkanaligen audiosignals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8127 | New person/name/address of the applicant |
Owner name: GRUNDIG MULTIMEDIA B.V., AMSTERDAM, NL |
|
8128 | New person/name/address of the agent |
Representative=s name: PROELL, J., RECHTSANW., 90471 NUERNBERG |
|
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20120403 |