EP1563485B1

EP1563485B1 - Verfahren zur verarbeitung von audiodateien und erfassungsvorrichtung zur anwendung davon

Info

Publication number: EP1563485B1
Application number: EP03782553A
Authority: EP
Inventors: Jérôme DANIEL
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2002-11-19
Filing date: 2003-11-13
Publication date: 2006-03-29
Anticipated expiration: 2023-11-13
Also published as: AU2003290190A1; CN1735922B; KR20050083928A; US7706543B2; KR100964353B1; CN1735922A; WO2004049299A1; DE60304358T2; JP4343845B2; EP1563485A1; DE60304358D1; ATE322065T1; FR2847376B1; JP2006506918A; FR2847376A1; US20060045275A1; ES2261994T3; BR0316718A; ZA200503969B

Claims

Verfahren zur Verarbeitung von Audiodateien, bei dem:
a) man Signale kodiert, die mindestens einen Ton darstellen, der sich im dreidimensionalen Raum ausbreitet und von einer Quelle kommt, die in einem ersten Abstand (p) von einem Bezugspunkt (O) gelegen ist, um eine Darstellung des Tons durch in einer Basis von sphärischen Harmonischen ausgedrückte Komponenten (B_mn ^σ) mit einem diesem Bezugspunkt (O) entsprechenden Ursprung zu erhalten,

b) und man an diese Komponenten (B_mn ^σ) eine Kompensierung eines Nahfeldeffekts durch eine Filterung anlegt, die eine Funktion von einem zweiten Abstand (R) ist, der bei einer Wiedergabe des Tons durch eine Wiedergabevorrichtung im Wesentlichen einen Abstand zwischen einem Wiedergabepunkt (Hp_i) und einem Hörwahrnehmungspunkt (P) definiert.
Verfahren nach Anspruch 1, bei dem, wenn diese Quelle vom Bezugspunkt (O) entfernt ist,
- man Komponenten von aufeinanderfolgenden Ordnungen m bei der Darstellung des Tons in dieser Basis von sphärischen Harmonischen erhält und

- man ein Filter (1/F_m) anlegt, dessen jeweils an eine Komponente der Ordnung m angelegte Koeffizienten sich analytisch in der Form des Kehrwerts eines Polynoms der Potenz m ausdrückt, dessen Variable umgekehrt proportional zur Tonfrequenz und zum zweiten Abstand (R) ist, um einen Nahfeldeffekt auf Höhe der Wiedergabevorrichtung zu kompensieren.
Verfahren nach Anspruch 1, bei dem, wenn diese Quelle eine in diesem ersten Abstand (ρ) vorgesehene virtuelle Quelle ist,
- man Komponenten von aufeinanderfolgenden Ordnungen m bei der Darstellung des Tons in dieser Basis von sphärischen Harmonischen erhält und

- man ein Globalfilter (H_m) anlegt, dessen jeweils an eine Komponente der Ordnung m angelegte Koeffizienten sich analytisch in der Form eines Bruchs ausdrücken, dessen
- Zähler ein Polynom der Potenz m ist, dessen Variable umgekehrt proportional zur Tonfrequenz und zum ersten Abstand (p) ist, um einen Nahfeldeffekt der virtuellen Quelle zu simulieren, und

- dessen Nenner ein Polynom der Potenz m ist, dessen Variable umgekehrt proportional zu der Tonfrequenz und zu dem zweiten Abstand (R) ist, um den Nahfeldeffekt der virtuellen Quelle in den niedrigen Tonfrequenzen zu kompensieren.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem man die in den Schritten a) und b) kodierten und gefilterten Daten mit einem diesen zweiten Abstand darstellenden Parameter (R/c) zur Wiedergabevorrichtung überträgt.
Verfahren nach einem der Ansprüche 1 bis 3, bei dem man, wenn die Wiedergabevorrichtung Mittel zum Lesen eines Speicherträgers umfasst, auf einem Speicherträger, der dazu bestimmt ist, von der Wiedergabevorrichtung gelesen zu werden, die in den Schritten a) und b) kodierten und gefilterten Daten mit einem diesen zweiten Abstand darstellenden Parameter (R/c) speichert.
Verfahren nach einem der Ansprüche 4 und 5, bei dem man vor einer Tonwiedergabe durch eine Wiedergabevorrichtung, die eine Vielzahl von Lautsprechern umfasst, die in einem dritten Abstand (R₂) von diesem Hörwahrnehmungspunkt (P) angeordnet sind, an die kodierten und gefilterten Daten ein Anpassungsfilter (H_m ^(R1/c,R2/c)) anlegt, dessen Koeffizienten eine Funktion von dem zweiten Abstand (R₁) und dem dritten Abstand (R₂) sind.
Verfahren nach Anspruch 6, bei dem die jeweils an eine Komponente der Ordnung m angelegten Koeffizienten des Anpassungsfilters (H_m ^(R1/c,R2/c)) sich analytisch in der Form eines Bruchs ausdrücken, dessen
- Zähler ein Polynom der Potenz m ist, dessen Variable umgekehrt proportional zur Tonfrequenz und zum zweiten Abstand (R) ist, und

- dessen Nenner ein Polynom der Potenz m ist, dessen Variable umgekehrt proportional zu der Tonfrequenz und zu dem dritten Abstand (R₂) ist.
Verfahren nach einem der Ansprüche 2, 3 und 7, bei dem man für die Durchführung des Schritts b)
- für Komponenten geradzahliger Ordnung m audionumerische Filter in der Form einer Kaskade von Zellen der Ordnung zwei und

- für Komponenten ungeradzahliger Ordnung m audionumerische Filter in der Form einer Kaskade von Zellen der Ordnung zwei und eine zusätzliche Zelle der Ordnung eins vorsieht.
Verfahren nach Anspruch 8, bei dem die Koeffizienten eines audionumerischen Filters bei einer Komponente der Ordnung m ausgehend von den numerischen Werten der Wurzeln dieser Polynome der Potenz m definiert sind.
Verfahren nach einem der Ansprüche 2, 3, 7, 8 und 9, bei dem diese Polynome Bessel-Polynome sind.
Verfahren nach einem der Ansprüche 1, 2 und 4 bis 10, bei dem man ein Mikrophon vorsieht, das ein Netz von akustischen Wandlern aufweist, die im Wesentlichen auf der Oberfläche einer Kugel angeordnet sind, deren Mittelpunkt im Wesentlichen dem Bezugspunkt (O) entspricht, um die Signale zu erhalten, die mindestens einen sich im dreidimensionalen Raum ausbreitenden Ton darstellen.
Verfahren nach Anspruch 11, bei dem man im Schritt b) ein Globalfilter anlegt, um einerseits einen Nahfeldeffekt in Abhängigkeit von diesem zweiten Abstand (R) zu kompensieren und andererseits die von den Wandlern kommenden Signale zu egalisieren, um eine Richtwirkungsgewichtung der Wandler zu kompensieren.
Verfahren nach einem der Ansprüche 11 und 12, bei dem man eine Anzahl von Wandlern vorsieht, die von einer gewählten Gesamtzahl von Komponenten abhängt, um den Ton in der Basis der sphärischen Harmonischen darzustellen.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem man im Schritt a) eine Gesamtzahl von Komponenten in der Basis der sphärischen Harmonischen wählt, um bei der Wiedergabe einen Bereich des Raums um den Wahrnehmungspunkt (P) herum zu erhalten, in dem die Wiedergabe des Tons getreu ist und dessen Abmessungen mit der Gesamtzahl von Komponenten zunehmen.
Verfahren nach Anspruch 14, bei dem man eine Wiedergabevorrichtung vorsieht, die eine Anzahl von Lautsprechern von mindestens gleich der Gesamtzahl der Komponenten vorsieht.
Verfahren nach einem der Ansprüche 1 bis 5 und 8 bis 13, bei dem
- man eine Wiedergabevorrichtung vorsieht, die mindestens einen ersten und einen zweiten Lautsprecher vorsieht, die in einem gewählten Abstand von einem Hörer angeordnet sind,

- für diesen Hörer eine Information der Empfindung der Lage von Tonquellen, die in einem vorbestimmten Bezugsabstand (R) vom Hörer gelegen sind, im Raum erhält und

- die Kompensierung des Schritts b) mit dem Bezugsabstand im Wesentlichen als zweiten Abstand anlegt.
Verfahren nach einem der Ansprüche 1 bis 3 und 8 bis 13 in Kombination mit einem der Ansprüche 4 und 5, bei dem
- man eine Wiedergabevorrichtung vorsieht, die mindestens einen ersten und einen zweiten Lautsprecher umfasst, die in einem gewählten Abstand von einem Hörer angeordnet sind,

- man für diesen Hörer eine Information der Empfindung der Lage von Tonquellen, die in einem vorbestimmten Bezugsabstand (R2) vom Hörer gelegen sind, im Raum erhält und

- man vor einer Tonwiedergabe durch die Wiedergabevorrichtung an die in den Schritten a) und b) kodierten und gefilterten Daten ein Anpassungsfilter (H_m ^(R/c,R2/c) anlegt, dessen Koeffizienten eine Funktion des zweiten Abstands (R) und im Wesentlichen des Bezugsabstands (R₂) sind.
Verfahren nach einem der Ansprüche 16 und 17, bei dem
- die Wiedergabevorrichtung einen Kopfhörer mit zwei Hörern für die Ohren des Hörers umfasst und

- man getrennt für jeden Hörer die Kodierung und Filterung der Schritte a) und b) für Signale, die jeweils zur Versorgung jedes Hörers bestimmt sind, anlegt, mit als erstem Abstand (p) jeweils einen Abstand (r_R, r_L) der jedes Ohr von einem Standort (M) einer wiederzugebenden Quelle trennt.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem man in den Schritten a) und b) ein Matrixsystem in Form bringt, das mindestens umfasst:
- eine Matrix (B), die die Komponenten in der Basis der sphärischen Harmonischen umfasst, und

- eine diagonale Matrix (Diag(1/F_m)), deren Koeffizienten Filterkoeffizienten des Schritts b) entsprechen, und man die Matrizes multiplizierten, um eine resultierende Matrix von kompensierten Komponenten (B̃) zu erhalten.
Verfahren nach Anspruch 19, bei dem
- die Wiedergabevorrichtung eine Vielzahl von Lautsprechern umfasst, die in einem gleichen Abstand (R) vom dem Hörwahrnehmungspunkt (P) angeordnet sind, und,

- um diese in den Schritten a) und b) kodierten und gefilterten Daten zu dekodieren und Signale zu formen, die dafür ausgelegt sind, die Lautsprecher zu speisen,
* man ein Matrixsystem bildet, das die resultierende Matrix (B̃) und eine vorbestimmte, der Wiedergabevorrichtung zugeordnete Dekodierungsmatrix (D) umfasst, und

* man eine Matrix (S), die die Signale zur Versorgung der Lautsprecher darstellende Koeffizienten aufweist, durch Multiplikation der Matrix (B̃) der kompensierten Komponenten mit der Dekodierungsmatrix (D) erhält.
Tonerfassungsvorrichtung, umfassend ein Mikrophon, das mit einem Netz von akustischen Wandlern versehen ist, die im Wesentlichen auf der Oberfläche einer Kugel angeordnet sind, dadurch gekennzeichnet, dass sie außerdem eine Verarbeitungseinheit aufweist, die dafür ausgelegt ist,
- jeweils von einem Wandler ausgehende Signale zu empfangen,

- an diese Signale eine Kodierung anzulegen, um eine Darstellung des Tons durch Komponenten (B_mn ^σ), die in einer Basis von sphärischen Harmonischen ausgedrückt sind, mit einem dem Mittelpunkt dieser Kugel (O) entsprechenden Ursprung zu erhalten,

- und an diese Komponenten (B_mn ^σ) eine Filterung anzulegen, die eine Funktion einerseits von einem dem Radius der Kugel (r) entsprechenden Abstand und andererseits von einem Bezugsabstand (R) ist.
Vorrichtung nach Anspruch 21, dadurch gekennzeichnet, dass die Filterung darin besteht, dass einerseits in Abhängigkeit von dem Radius der Kugel die von den Wandlern kommenden Signale egalisiert werden, um eine Richtwirkungsgewichtung der Wandler zu kompensieren, und andererseits ein Nahfeldeffekt in Abhängigkeit von einem gewählten Bezugsabstand (R) kompensiert wird, der bei einer Wiedergabe des Tons im Wesentlichen einen Abstand zwischen einem Wiedergabepunkt (HP_i) und einem Hörwahrnehmungspunkt (P) definiert.