FR2899424A1 - Procede de synthese binaurale prenant en compte un effet de salle - Google Patents

Procede de synthese binaurale prenant en compte un effet de salle Download PDF

Info

Publication number
FR2899424A1
FR2899424A1 FR0602694A FR0602694A FR2899424A1 FR 2899424 A1 FR2899424 A1 FR 2899424A1 FR 0602694 A FR0602694 A FR 0602694A FR 0602694 A FR0602694 A FR 0602694A FR 2899424 A1 FR2899424 A1 FR 2899424A1
Authority
FR
France
Prior art keywords
samples
delay
amplitude
filter
brir filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0602694A
Other languages
English (en)
Inventor
Julien Faure
Alexandre Guerin
Rozenn Nicol
Gregory Pallone
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0602694A priority Critical patent/FR2899424A1/fr
Priority to EP07731711A priority patent/EP1999998B1/fr
Priority to PCT/FR2007/050895 priority patent/WO2007110520A1/fr
Priority to US12/225,691 priority patent/US8045718B2/en
Priority to ES07731711T priority patent/ES2390831T3/es
Priority to JP2009502160A priority patent/JP4850948B2/ja
Publication of FR2899424A1 publication Critical patent/FR2899424A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones

Abstract

Un procédé de spatialisation 3D de canaux audio à partir d'un filtre BRIR incorporant un effet de salle. Pour un nombre N d'échantillons spécifique taille de la réponse impulsionnelle du filtre BRIR, il consiste à décomposer (A) le filtre BRIR en au moins un ensemble de valeurs de retard et d'amplitude associées aux instants d'arrivée des réflexions, extraire (B) sur le nombre N d'échantillons au moins un module spectral du filtre BRIR, et constituer (C) à partir de chaque retard successif, de son amplitude et de son module spectral associés un filtre BRIR élémentaire (BRIRe) directement appliqué aux canaux audio dans le domaine temporel, fréquentiel ou transformé.Application à la spatialisation binaurale bi- ou multicanale.

Description

PROCÉDÉ DE SYNTHÈSE BINAURALE PRENANT EN COMPTE UN EFFET DE SALLE
L'invention est relative à la spatialisation sonore, dite rendu 3D, de signaux audio, intégrant en particulier un effet de salle, notamment dans le domaine des techniques binaurales. Ainsi, le terme binaural vise la restitution sur un casque stéréophonique, ou une paire d'écouteurs, d'un signal sonore avec néanmoins des effets de spatialisation. L'invention ne se limite toutefois pas à la technique précitée et s'applique, notamment, à des techniques dérivées du binaural telles que les techniques de restitution transaurale , c'est-à-dire sur des hauts parleurs distants. TRANSAURAL est une marque de commerce déposée par la société COOPER BAUCK CORPORATION. Une application spécifique de l'invention est, par exemple, l'enrichissement des contenus audio en appliquant de manière efficace des fonctions de transfert acoustique de la tête d'un auditeur à des signaux monophoniques, afin de plonger ce dernier dans une scène sonore 3D, incluant en particulier un effet de salle. Pour la mise en oeuvre des techniques binaurales sur casque ou haut-parleurs, on définit la fonction de transfert, ou filtre, d'un signal sonore entre une position d'une source sonore dans l'espace et les deux oreilles d'un auditeur. La fonction de transfert acoustique de la tête précitée est désignée HRTF pour Head Related Transfer Function en anglais dans sa forme fréquentielle et HRIR pour Head Related Impulse Response en anglais dans sa forme temporelle. Pour une direction de l'espace, on obtient au final deux HRTF : une pour l'oreille droite et une pour l'oreille gauche.
En particulier, la technique binaurale consiste à appliquer de telles fonctions de transfert acoustique de la tête à des signaux audio monophoniques, afin d'obtenir un signal stéréophonique qui permet, lors d'une écoute au casque, d'avoir la sensation que les sources sonores proviennent d'une direction particulière de l'espace. Le signal de l'oreille droite est obtenu en filtrant le signal monophonique par la HRTF de l'oreille droite et le signal de l'oreille gauche est obtenu en filtrant ce même signal monophonique par la HRTF de l'oreille gauche. Les paramètres physiques essentiels qui permettent de caractériser ces fonctions de transfert sont : l'ITD pour Interaural Time Difference en anglais, défini comme la différence interaurale de temps d'arrivée des ondes sonores d'une même source sonore entre l'oreille gauche et l'oreille droite de l'auditeur. L'ITD est principalement lié à la phase des HRTF ; le module spectral, qui permet notamment de percevoir des différences de niveau entre l'oreille gauche et l'oreille droite en fonction de la fréquence ; lorsque les HRTF, ou les HRIR, de la tête de l'auditeur ne sont pas considérées comme correspondant à des conditions de propagation sonore en champ libre (condition anéchoïque), les fonctions de transfert précitées peuvent prendre en compte des phénomènes de réflexion diffusion, diffraction, lesquels correspondent à la réponse acoustique de la salle dans laquelle ces fonctions de transfert ont été mesurées ou simulées. Les fonctions de transfert précitées sont alors appelées BRIR pour Binaural Room Impulse Response en anglais dans leur forme temporelle. Les techniques binaurales précitées peuvent être par exemple employées pour simuler un rendu 3D de type 5.1 au casque d'écoute. Dans cette technique, à chaque position de haut parleur du système surround en anglais, ou multi haut-parleurs, correspond un couple de HRTF, une HRTF pour l'oreille gauche et une HRTF pour l'oreille droite. La somme des 5 canaux du signal en mode 5.1 convolués par les 5 filtres HRTF pour chaque oreille d'un auditeur permet d'obtenir deux canaux binauraux droit et gauche, lesquels simulent le mode 5.1 pour une écoute sur un casque d'écoute audio.
On parle dans cette situation de binaural virtual surround en anglais pour spatialisation binaurale simulant un système multi haut-parleurs. Lorsque, dans le rendu 3D, l'on prend en compte le fait, pour l'auditeur, de percevoir les sources sonores plus ou moins éloignées de la tête, phénomène connu sous le nom d'externalisation, et ce de manière indépendante de la direction de provenance des sources sonores, il arrive fréquemment, dans un rendu 3D binaural, que les sources soient perçues à l'intérieur de la tête par l'auditeur. La source ainsi perçue est dite non externalisée.
Différents travaux ont montré que l'ajout d'un effet de salle dans les méthodes de rendu 3D binaurales permet d'augmenter considérablement l'externalisation des sources sonores. Confer, notamment, D. R. Begault et E. M. Wenzel, "Direct comparison of the impact of head tracking, reverberation, and individualized head-related transfer functions on the spatial perception of a virtual speech source". J. Audio Eng. Soc., vol. 49, n 10, 2001. Actuellement, il existe deux méthodes principales, permettant d'intégrer l'effet de salle aux HRIR : la première, relative à l'effet de salle réel, consiste à mesurer des HRIR dans une salle non anéchoïque, comportant donc un effet de salle. Les HRIR obtenues, qui ne sont autres que des BRIR, doivent être d'une durée suffisamment longue pour intégrer les premières réflexions sonores, durée supérieure à 500 échantillons temporels pour une fréquence d'échantillonnage de 44 100 Hz, mais cette durée doit être encore plus importante, c'est-à-dire supérieure à 20 000 échantillons temporels à la même fréquence d'échantillonnage, si on veut intégrer l'effet de réverbération tardive. On note toutefois que les BRIR précitées peuvent être obtenues de manière équivalente par la convolution des HRIR mesurées en environnement anéchoïque avec l'effet de salle désiré, représenté par la réponse impulsionnelle de la salle ; la deuxième, relative à l'effet de salle artificiel, est issue de l'acoustique virtuelle et consiste à intégrer l'effet de salle au HRIR, de manière synthétique. Cette opération est réalisée grâce à des spatialisateurs qui introduisent des effets de réverbération artificielle. L'inconvénient de telles méthodes est que l'obtention d'un rendu réaliste nécessite une puissance de calcul importante.
En ce qui concerne la spatialisation sonore binaurale une méthode courante consiste à modéliser les filtres binauraux, en décomposant les HRTF, ou les HRIR, en une composante à phase minimale (filtre à phase minimale déterminé par le module spectral de la HRTF) et un retard pur. Pour une description plus détaillée d'une telle méthode, on pourra utilement se reporter aux articles de D. J. Kistler et F. L. Wightman, A mode/ of head-related transfer functions based on principal components analysis and minimum-phase reconstruction J. Acoustic Soc. Am. 91(3) p 1637-1647, 1992 et de Kulkarni A. et al. On the minimum-phase approximation of head-related functions 1995 IEEE ASSP Workshop on Applications of Signal Processing Audio and Acoustics (IEEE catalog number: 95TH8144). La différence de retard observée entre les HRTF ou les HRIR de l'oreille gauche et de l'oreille droite correspond alors à l'indice de localisation ITD. II existe différentes méthodes pour extraire les retards des HRIR ou HRTF. Les principales méthodes sont décrites par S. Busson Individualisation d'indices acoustiques pour la synthèse binaurale Thèse de doctorat de l'Université de la Méditerranée Aix-Marseille II, 2006. Le module spectral est obtenu en prenant le module de la transformée de Fourier des HRIR. Le nombre de coefficients peut alors être réduit, par exemple en moyennant l'énergie sur un nombre réduit de bandes de fréquences, par exemple selon des techniques de lissage fréquentiel basées sur les propriétés d'intégration du système auditif. Indépendamment de la façon dont sont modélisés les filtres HRTF ou HRIR, le cas échéant BRIR, il existe plusieurs méthodes d'implémentation de la spatialisation sonore binaurale. Parmi celles-ci, la méthode la plus simple et la plus directe est l'implémentation bi-canale du binaural, représentée en figure 1.
Selon cette méthode, la spatialisation des sources se fait de façon indépendante les unes des autres. Une paire de filtres HRTF est associée à chaque source. Le filtrage peut être réalisé soit dans le domaine temporel, sous la forme d'un produit de convolution, soit dans le domaine fréquentiel, sous la forme d'une multiplication complexe, ou encore dans tout autre domaine transformé, tel que le domaine PQMF pour Pseudo Quadrature Mirror Filter en anglais par exemple. L'implémentation multicanale du binaural est une alternative à l'implémentation bi-canale offrant une implémentation plus efficace qui consiste en une décomposition linéaire des HRTF, sous la forme d'une somme de produits de fonctions de la direction (gains d'encodage) et de filtres élémentaires (filtres de décodage). Cette décomposition permet de séparer les étapes d'encodage et de décodage, le nombre de filtres étant alors indépendant du nombre de sources à spatialiser. Les filtres élémentaires peuvent à leur tour être modélisés par un filtre à phase minimale et un retard pur pour simplifier leur implémentation. Il est également possible d'extraire les retards des HRTF d'origine et de les intégrer séparément à l'encodage. Les techniques antérieures précitées présentent des inconvénients majeurs, lors de l'implémentation de filtres BRIR, prenant en compte l'effet de salle, en particulier : la complexité : les BRIR, du fait de la durée importante des réponses de salle, contiennent un nombre d'échantillons temporels qui peut être très élevé, supérieur à 20 000 échantillons pour des salles de taille moyenne, ce nombre étant lié au retard des échos de salle et donc aux dimensions de cette dernière. En conséquence, les filtres BRIR correspondants requièrent une puissance de calcul et une taille mémoire très importantes ; l'externalisation : la modélisation sous la forme d'un filtre à phase minimale, associé à un retard pur, permet de réduire la taille des filtres. Cependant, le fait d'extraire un seul retard interaural pour chaque filtre BRIR ne permet pas de prendre en compte les premières réflexions.
Dans ce cas, le timbre sonore est bien respecté mais l'effet d'externalisation n'est plus reproduit. La présente invention a pour objet de remédier aux inconvénients précités de la technique antérieure.
En particulier, un objet de la présente invention est de proposer un procédé de calcul de paramètres de modélisation de filtres BRIR, filtres HRIR prenant en compte un effet de salle de l'art antérieur, ces paramètres comprenant un ou plusieurs retards éventuellement associés à des gains et à au moins un spectre d'amplitude, afin de permettre une implémentation performante soit dans le domaine temporel, soit dans le domaine fréquentiel ou transformé. Un autre objet de la présente invention est la mise en oeuvre d'un procédé de calcul de filtres BRIR spécifiques, lesquels, bien que équivalents en termes de qualité à des filtres BRIR classiques ou originaux permettant un positionnement et une externalisation satisfaisants des sources, réduisent fortement la puissance de calcul et de taille mémoire nécessaires à la mise en oeuvre du filtrage correspondant. Le procédé de spatialisation 3D de canaux audio, à partir d'au moins un filtre BRIR incorporant un effet de salle, objet de la présente invention, est remarquable en ce qu'il consiste au moins, pour un nombre d'échantillons spécifique correspondant à la taille de la réponse impulsionnelle du filtre BRIR, à décomposer ce filtre BRIR en au moins un ensemble de valeurs de retard et d'amplitude associées aux instants d'arrivée des réflexions, à extraire sur ce nombre d'échantillons au moins un module spectral du filtre BRIR, à constituer à partir de chaque retard successif de son amplitude et de son module spectral associés un filtre BRIR élémentaire directement appliqué aux canaux audio dans le domaine temporel, fréquentiel ou transformé. Le procédé objet de l'invention est en outre remarquable en ce que la décomposition du filtre BRIR est exécutée par un processus de détection des retards par détection des pics d'amplitude, au premier pic d'amplitude étant associé le retard correspondant à l'instant d'arrivée de l'onde sonore directe. Le procédé objet de l'invention est également remarquable en ce que l'extraction de chaque module spectral est exécutée par une transformation temps-fréquence.
Le procédé objet de l'invention est également remarquable en ce que, pour un nombre d'échantillons correspondant à la réponse impulsionnelle du filtre BRIR décomposé en sous-bandes de fréquences de rang k déterminé, la valeur du module spectral du filtre BRIR est définie comme une valeur réelle de gain représentative de l'énergie du filtre BRIR dans chaque sous-bande. Le procédé objet de l'invention est également remarquable en ce que à chaque retard est associé un module spectral et en ce que le module spectral du filtre BRIR est défini dans chaque sous- bande comme une valeur réelle de gain représentative de l'énergie du filtre BRIR partiel dans ladite sous-bande, cette valeur de gain étant fonction du retard associé. Cette modulation du module spectral en fonction du retard appliqué permet d'implémenter une reconstruction du filtre BRIR beaucoup plus proche du filtre BRIR d'origine. Enfin, le procédé objet de l'invention est remarquable en ce que chaque filtre BRIR élémentaire dans chaque sous-bande de fréquences de rang k est formé par une multiplication complexe, fonction ou non du retard associé à chaque pic d'amplitude incluant une valeur réelle de gain, et par un retard pur, augmenté de l'écart de retard vis-à-vis du retard alloué au premier échantillon correspondant à l'instant d'arrivée de l'onde sonore directe. Il sera mieux compris à la lecture de la description et à l'observation des dessins ci-après dans lesquels, outre la figure 1 relative à une technique de spatialisation sonore binaurale de l'art antérieur : la figure 2 représente, à titre purement illustratif, un organigramme des étapes essentielles de mise en oeuvre du procédé de spatialisation 3D de canaux audio à partir d'au moins un filtre BRIR incorporant un effet de salle, conforme à l'objet de la présente invention ; la figure 3a représente un détail de mise en oeuvre de l'étape de décomposition exécutée à l'étape A de la figure 2a ; la figure 3b représente un chronogramme d'échantillons permettant d'expliciter le mode opératoire d'une sous-étape Ao de constitution d'un premier vecteur I et d'un premier vecteur décalé l;+l de pics d'amplitude de la figure 3a ; la figure 3c représente à titre illustratif un chronogramme des échantillons de pics d'amplitude explicitant un processus de construction d'un deuxième vecteur à partir d'un vecteur d'écart entre le premier vecteur décalé et le premier vecteur illustrés à la figure 3b, ce deuxième vecteur regroupant les indices de rang des pics d'amplitude isolés ; la figure 3d représente un chronogramme des pics d'amplitude représentatifs des premières réflexions dues à l'effet de salle obtenu à partir du deuxième vecteur illustré en figure 3c, à chacune des premières réflexions étant alloué un retard correspondant au paramètre correspondant à l'instant d'arrivée de l'onde sonore directe, puis des retards successifs spécifiques ajoutés au paramètre de retard de l'onde sonore directe. Le procédé de spatialisation 3D de canaux audio à partir d'au moins un filtre BRIR incorporant un effet de salle, conforme à l'objet de l'invention sera maintenant décrit en liaison avec la figure 2 et les figures suivantes. Le procédé objet de l'invention consiste pour un nombre N donné d'échantillons spécifique, correspondant à la taille de la réponse impulsionnelle du filtre BRIR, à décomposer en une étape A, ce filtre BRIR en au moins un ensemble de valeurs d'amplitude et de valeurs de retard décrivant une suite de pics d'amplitude. Etape A de la figure 2, l'opération de décomposition est notée : n=N Aä , n ä=1 AMz Ax=Ao+8x.
Dans cette relation, Aä indique l'amplitude de l'échantillon de rang n et AMX indique l'amplitude de chaque pic d'amplitude, Ax désignant le retard associé à chacun des pics d'amplitude correspondant. 9 Ce retard est fonction du retard A0 correspondant à l'instant d'arrivée de l'onde directe ainsi qu'il sera décrit ci-après dans la description. L'étape A est suivie d'une étape B consistant à extraire, sur le nombre N d'échantillons au moins un module spectral moyen du filtre BRIR, chaque module spectral étant noté : BRIRN = GN . L'étape B est alors suivie d'une étape C consistant à constituer à partir de chaque retard successif, de l'amplitude et du module spectral associés à ce retard établis à l'étape B un filtre BRIR élémentaire noté BRIRe directement appliqué aux canaux audio dans le domaine temporel fréquentiel ou transformé, ainsi qu'il sera décrit ci-après dans la description. De manière plus spécifique, on comprend que la décomposition du filtre BRIR à l'étape A est exécutée par un processus de détection des retards par détection des pics d'amplitude, au premier pic d'amplitude étant associé le retard Aä correspondant à l'instant d'arrivée de l'onde sonore directe. Ainsi, le premier pic d'amplitude est défini par les paramètres AMO! A0 On comprend également qu'aux autres pics d'amplitude est alors associée successivement, outre le retard Ao , une valeur 8x dépendant de la position du pic d'amplitude dans les N échantillons, le retard alloué à chaque pic d'amplitude AMX est donné par Ax = Ao + 8x . D'autres méthodes de détection du premier pic peuvent aussi être utilisées, ainsi qu'il est connu de l'état de la technique, en particulier pour déterminer la valeur du retard Ao lequel peut par exemple être pris égal au retard interaural. L'étape B, d'extraction d'au moins un module spectral du filtre BRIR d'une durée de N échantillons permet d'assurer une correspondance du timbre entre chaque filtre BRIR original et le filtre BRIR reconstruit à partir des filtres BRIRe élémentaires, ainsi qu'il sera décrit ultérieurement dans la description.
En particulier, et de manière non limitative, l'extraction du module spectral peut être exécutée par une transformation temps-fréquence telle qu'une transformée de Fourier, ainsi qu'il sera décrit ultérieurement dans la description.
La mise en oeuvre des filtres BRIR élémentaires BRIRe formés chacun à partir de la valeur de chaque module spectral du filtre BRIR et bien entendu de l'amplitude et du retard dx considéré, permet d'assurer une réduction des coûts de calcul. Toutes les méthodes de filtrage à partir d'un filtre à phase minimale ou non, associées à toutes les méthodes d'implémentation des retards peuvent convenir à la décomposition proposée. En particulier, le procédé objet de l'invention peut par exemple être combiné à une implémentation multicanale de la spatialisation 3D binaurale. Un mode de mise en oeuvre particulier préférentiel non limitatif du procédé objet de l'invention sera maintenant décrit en liaison avec les figures 3a à 3d. Le mode de mise en oeuvre précité est mis en oeuvre dans le cadre de la décomposition de filtres BRIR pour une implémentation efficace dans le domaine des sous-bandes temporelles complexes plus particulièrement mais de manière non limitative le domaine PQMF complexe. Une telle implémentation peut être utilisée par un décodeur défini par la norme MPEG surround, afin d'obtenir un rendu 3D binaural de type 5.1. Le mode 5.1 est défini par la norme MPEG spatial audio coding ISO/IEC 23003-1 (doc N7947).
En référence à la demande de brevet français intitulée : Procédé et dispositif de spatialisation sonore binaurale efficace dans le domaine transformé , déposée le même jour au nom de la demanderesse, on indique que le filtrage binaural peut être effectué directement dans le domaine des sous- bandes, c'est-à-dire dans le domaine codé, afin de réduire les coûts de décodage incluant la mise en oeuvre du procédé. Le mode de réalisation précité peut être transposé au domaine temporel c'est-à-dire au domaine non transformé en sous-bandes ou à tout autre domaine transformé. Le procédé objet de l'invention permet d'obtenir de manière générale et en particulier dans son mode de mise en oeuvre préférentiel : des retards qui correspondent au retard Ao instant d'arrivée de l'onde sonore directe et aux retards des premières réflexions de la salle, ces retards étant ensuite implémentés dans le domaine des sous-bandes ; des valeurs de gain, valeurs réelles, un gain étant par exemple attribué à chaque sous bande et pour chaque réflexion à partir du contenu spectral des filtres BRIR, ainsi qu'il sera explicité ci-après. Ainsi, pour une exécution décrite à titre d'exemple non limitatif dans le domaine des sous-bandes temporelles complexes, l'extraction des retards consiste au moins pour tout filtre BRIR correspondant à une position de l'espace, ainsi que représenté en figure 3a et à partir de l'enveloppe temporelle du filtre établie sur le nombre d'échantillons N correspondant à la taille de la réponse impulsionnelle du filtre BRIR, cette enveloppe temporelle étant notée [Aä ] _; , à exécuter une première sous-étape, notée A0, consistant à identifier les indices de rang d'échantillon temporel dont la valeur d'amplitude est supérieure à une valeur de seuil notée V à l'étape Aol de la figure 3a. On comprend, en particulier, que la comparaison Aä > V est effectuée pour chaque échantillon des N échantillons successivement par retour à l'étape A01 par l'intermédiaire de la sous-étape A02 successivement sur les N échantillons. Cette opération permet d'engendrer un premier vecteur noté I; à la sous-étape A03, et un premier vecteur décalé noté l;+l à la sous-étape A04. Le premier vecteur I; correspond aux indices de rang des échantillons temporels dont la valeur d'amplitude est supérieure à la valeur de seuil V. Le premier vecteur décalé I;+1 se déduit du premier vecteur par décalage d'un indice. Le premier vecteur et le premier vecteur décalé étant représentatifs de la position des pics d'amplitude dans le nombre N d'échantillons. L'étape A0 est suivie d'une étape AI consistant à déterminer si les échantillons temporels dont l'amplitude est supérieure à la valeur de seuil V correspondant à des pics d'amplitude isolés par calcul d'un vecteur d'écartI' qui représente la différence entre le premier vecteur décalé I;.+1 et le premier vecteur I. En effet, on comprend que, si les valeurs contenues dans le vecteur d'écart l' sont importantes, alors on est en présence du début d'un pic distinct du pic précédent, ainsi qu'il sera décrit ultérieurement dans la description. L'étape AI est alors suivie d'une étape A2 consistant à calculer un deuxième vecteur P regroupant les indices de pics d'amplitude isolés sur le nombre N d'échantillons pour un seuil d'écart défini par une valeur spécifique W. Enfin, l'étape A2 est suivie d'une étape A3 consistant à identifier, à partir des échantillons du deuxième vecteur, pour chaque pic isolé identifié, l'indice de l'échantillon d'amplitude maximale parmi un nombre déterminé d'échantillons, pris égal à la valeur W précédemment citée suivant l'échantillon identifié par le deuxième vecteur. Cette valeur W peut être déterminée expérimentalement. L'indice et l'amplitude de tout nouvel échantillon d'amplitude maximale sont mémorisés sous la forme d'un vecteur d'indice de retard et d'un vecteur d'amplitude. Ainsi à la fin de l'étape A3, on dispose sous la forme d'un vecteur d'indice D'(i) et d'un vecteur d'amplitude A'(i) par exemple de l'ensemble des valeurs d'indice de retard et d'amplitude des pics d'amplitude précités. Une description spécifique de la mise en oeuvre des étapes Ao AI, A2 et A3 représentées en figure 2 sera maintenant donnée en liaison avec les figures 3b, 3c et 3d. En référence à la figure 3b, pour un filtre BRIR temporel correspondant à une position de l'espace, l'enveloppe temporelle de ce dernier est donnée par : BRIRenv(t)=IBRIR(t)I. L'étape Ao consiste alors à trouver tous les indices des échantillons dont la valeur d'enveloppe est supérieure à la valeur de seuil V.
De manière particulièrement avantageuse et selon un aspect remarquable du procédé objet de l'invention, la valeur de seuil V est elle-même fonction de l'énergie de l'enveloppe temporelle du filtre BRIR. Ainsi la valeur de seuil V vérifie avantageusement la relation : 1 BRIR(tY V=C1 " N Dans la relation précédente, outre N représentant le nombre d'échantillons temporels, C est une constante fixée à 1 par exemple. Suite aux comparaisons exécutées aux étapes A01 et A02, on stocke sur comparaison réussie, dans un vecteur I; de taille K, K étant le nombre d'échantillons dont la valeur absolue de l'amplitude dépasse la valeur de seuil V pour constituer le premier vecteur. A titre d'exemple non limitatif, sur la figure 3b, on a représenté l'enveloppe temporelle d'un filtre BRIR pour lequel le seuil V est fixé à la valeur réelle 0.037.
Le vecteur I; représenté à l'étape A03 de la figure 3a s'écrit : I; = [89 90 91 92 93 94 95 96 97 98 101 104 108 110 116 422 423 424 427.1. A partir de la mémorisation du vecteur l;, on procède également par décalage de l'indice du premier pic d'amplitude, l'indice 89, à la mémorisation du vecteur décalé I;+,, le vecteur I;+1 correspondant par exemple au vecteur I; dans lequel on a supprimé le premier pic d'amplitude . On dispose ainsi du premier vecteur I; et du premier vecteur décalé I;+,. A l'étape A, on procède alors au calcul du vecteur l', vecteur d'écart, différence entre le premier vecteur décalé l;+, et le premier vecteur I;.
Le vecteur d'écart l' vérifie la relation dans l'exemple donné : 1' _ [1 1 1 1 1 1 1 1 1 3 3 4 2 6 306 1 1 3 ...]. Les valeurs importantes contenues dans le vecteur l' indiquent la présence d'un pic d'amplitude distinct du pic d'amplitude précédant. L'étape A2 consiste alors à calculer le deuxième vecteur P qui regroupe les indices des pics distincts. Dans l'exemple donné le premier pic P(1) est donné bien entendu par P(1)=I(1)=89 c'est-à-dire par le premier pic d'amplitude précédemment mentionné. L'indice des pics suivants correspond aux indices augmentés de 1 des valeurs de I' qui dépassent un seuil d'écart défini par une valeur W. A titre d'exemple non limitatif et de manière expérimentale W peut être fixé à la valeur 20. Dans ces conditions, la valeur I'(15)=306 >W détermine un second pic isolé. La valeur de l'indice de rang de ce deuxième pic P(2) est alors donnée par 1(15+1)=422.
Ainsi le deuxième vecteur P peut être écrit sous la forme : P=[89 422...).
L'étape A3 de la figure 3a peut, ainsi que représenté en figure 3c, consister à partir de chacun des échantillons P(i) du deuxième vecteur représentatif de l'enveloppe temporelle, à trouver l'échantillon qui a la valeur d'amplitude maximale parmi les W = 20 échantillons suivants.
L'indice de ce nouvel échantillon est stocké dans le vecteur D' et son amplitude est stocké dans le vecteur A' ainsi que mentionné en liaison
avec l'étape A3 de la figure 3a selon les relations :
D'(i)=indice(max(BRIRenä([P(i);P(i+W)j))),
A'(i)=BRIR(D'(i)) * sign(BRIR(D'(1))).
De manière non limitative pour l'exemple donné en liaison avec la 2 0 figure 3 :
D'=[92 423 ...],
A'=[0.1878 0.0924 ...].
Si l'amplitude du premier échantillon d'amplitude maximale noté A(1) est négative, alors on prend en compte la valeur absolue de ce dernier.
25 Les amplitudes A des amplitudes maximales peuvent alors être normalisées en énergie par la relation : A= A'
~ A'(1)2 l Dans la relation précédente L est le nombre d'éléments de D' et de A,
c'est-à-dire des vecteurs d'indice et d'amplitude représentatifs de
30 chaque pic. Ce nombre dépend bien entendu de la valeur de seuil V et de la valeur de la constante W précitées. 15 Une représentation des amplitudes normalisées, des pics d'amplitude et de leur position de retard successif par rapport au premier pic d'amplitude auquel est alloué le retard Ao , est représentée en figure 3d. Une description plus détaillée d'un premier et d'un deuxième mode de mise en oeuvre des filtres BRIR élémentaires directement applicables et appliqués aux canaux audio dans le domaine transformé, en particulier dans le domaine PQMF complexe décomposé en sous-bandes SBk;, sera donnée à titre d'exemple non limitatif ci-après dans la description. On rappelle que la décomposition en sous-bandes dans le domaine précité permet de décomposer les N échantillons de la réponse impulsionnelle du filtre BRIR en M sous-bandes de fréquences, par exemple M=64, pour une application au MPEG surround précité. L'avantage d'une telle transformation est de pouvoir appliquer des gains réels à chaque sous-bande, en s'affranchissant des problèmes de repliement de spectre générés par le sous échantillonnage inhérent au banc de filtres. Dans le domaine des sous-bandes précitées, les retards et les gains sont appliqués sur les échantillons complexes, ainsi qu'il sera décrit ultérieurement dans la description.
Selon un premier mode de mise en oeuvre non limitatif, la valeur de chaque module spectral du filtre BRIR est définie dans chaque sous-bande comme au moins une valeur réelle de gain représentative de l'énergie du filtre BRIR dans ladite sous-bande. Dans ce premier mode de mise en oeuvre, les valeurs de gains correspondantes notées G(k,n) où k désigne le rang de la sous bande considérée et n le rang de l'échantillon parmi les N échantillons, sont obtenues en moyennant l'énergie de l'amplitude spectrale de chaque filtre BRIR dans chaque sous-bande. Pour un filtre BRIR fréquentiel BRIR*(f) correspondant à la transformée de Fourier à 8 192 échantillons du filtre BRIR(t) temporel, complété de 0 pour obtenir les 8 192 échantillons, la valeur des gains G(k, n) est donnée par la relation : f=f1+M' (H(f)BRIR*(f))2 f=f1 M' Dans la relation précédente, on indique que H est une fenêtre de pondération, fenêtre rectangulaire par exemple de largeur M' supérieure ou égale à la largeur de la sous-bande SBk, par exemple M'=64. La fenêtre de pondération est centrée sur la fréquence centrale de la sous-bande k et la fréquence f1 est inférieure ou égale à la fréquence de départ de la sous-bande k. Selon un deuxième mode de mise en oeuvre préférentielle du procédé objet de l'invention, à chaque retard est associé un module spectral.
La valeur de chaque module spectral est définie dans chaque sous-bande comme au moins une valeur de gain représentative de l'énergie du filtre BRIR partiel dans ladite sous-bande, cette valeur de gain étant fonction du retard appliqué en fonction de l'indice de chaque échantillon de pic d'amplitude, à partir du vecteur d'indice et d'amplitude.
Ainsi dans ce deuxième mode de réalisation, les gains G(k, n) sont modulés et peuvent donc varier à chaque nouveau retard I appliqué. Les valeurs de gain sont alors données par la relation : .f=f 1+M E (H ( f )BRIR * (f , l ))2 f=.f M' Dans la relation précédente, BRIR*(f,l) est la transformée de Fourier du filtre BRIR(t) temporel fenêtrée entre les échantillons D'(1)-Z et D'(1+1), l'énergie spectrale calculée étant celle du filtre BRIR partiel ainsi fenêtré, et complétée par des 0 pour obtenir 8 192 échantillons. Z dépend de la fréquence d'échantillonnage et peut prendre la valeur Z=10 pour une fréquence d'échantillonnage à 44.1 kHz.
Le deuxième mode de réalisation précité permet de manière remarquable une reconstruction beaucoup plus proche de la fonction de transfert ou filtre BRIR d'origine et en particulier de tenir compte de chacun des retards provoqués par les réflexions successives dans la salle, ce qui G(k, n) = G(k, n, l) _ permet d'obtenir un rendu d'effet de salle particulièrement performant et réaliste. On comprend alors que chaque filtre BRIR élémentaire, dans chaque sous-bande de fréquence k peut alors avantageusement être formé par une multiplication complexe, incluant une valeur réelle de gain, fonction ou non du retard appliqué en fonction de l'indice de chaque échantillon de pic d'amplitude, selon le premier ou le deuxième mode de réalisation retenu décrit précédemment dans la description. L'opération de multiplication complexe est donnée par la relation : (k+0.5)d (l S' (k, n) = G(k, n)A(l)e E(k,n). Le filtre BRIR élémentaire est également formé par un retard pur augmenté de l'écart de retard vis-à-vis du retard A0 alloué au premier pic d'amplitude. Ce retard peut alors être implémenté par l'intermédiaire d'une ligne à retard appliquée au produit obtenu par la rotation sous forme de multiplication complexe précitée. L'échantillon obtenu vérifie alors la relation : S(k,n) = S'(k,n-D(l)). Dans les relations précédentes E(k,n) désigne le énième échantillon complexe de la sous-bande k considérée, S(k,n) désigne le énième échantillon de la sous-bande k après application des gains et des retards, M est le nombre de sous-bande et d(l) et D(I) sont tels qu'ils correspondent à l'application du I ième retard de D(I)M+d(I) échantillons dans le domaine temporel non sous-échantillonné. Le retard D(I)M+d(I) correspond aux valeurs de D'(l) calculées selon le processus de détection de pics d'amplitude précédemment décrit en liaison avec les figures 3a à 3d. En outre, A(I) désigne l'amplitude du pic associé au retard correspondant et G(k, n) désigne le gain réel appliqué au nième échantillon complexe de la sous-bande SBk de rang k considérée.
Enfin, le procédé objet de l'invention permet le traitement de la réverbération tardive. On rappelle que la réverbération tardive correspond à la partie de la réponse d'une salle pour laquelle le champ acoustique est diffus et les réflexions ne sont en conséquence pas discernables. II est toutefois possible de traiter les effets de salle incluant une réverbération tardive, conformément au procédé objet de l'invention. Dans ce but, le procédé selon l'invention consiste à rajouter aux valeurs de pics d'amplitude détectées, une pluralité de valeurs d'amplitude arbitraires et réparties au-delà d'un instant arbitraire à partir de laquelle on considère que les réflexions discrètes sont terminées et où débute le phénomène de réverbération tardive. Ces valeurs d'amplitude sont calculées et réparties au-delà de la durée arbitraire, laquelle peut être prise égale à 200 millisecondes par exemple, jusqu'au dernier échantillon du nombre d'échantillons correspondant à la taille de la réponse impulsionnelle BRIR. Ainsi, conformément au procédé objet de l'invention, les pics d'amplitude des premières réflexions sont déterminés ainsi que précédemment décrit en liaison avec les figures 2 et suivantes, et, à partir d'un échantillon t1 correspondant à 200 millisecondes, déterminé expérimentalement et correspondant au début de la réverbération tardive, jusqu'à un échantillon t2 qui correspond à la fin de la réverbération ou, le cas échéant, à la fin des N échantillons de la réponse impulsionnelle du filtre BRIR, on rajoute R valeurs aux vecteurs D' et A' telles que : D'(L+r)=t1 +(t2-tl )/(R-1), A(L+r)=1. Dans la relation précédente, L est le nombre de pics détecté, r est un entier compris entre 1 et R.
La prise en compte du deuxième mode de réalisation précité dans lequel les valeurs de gains sont modulées en fonction du retard de chaque pic d'amplitude, permet alors d'introduire de manière efficace, la réverbération tardive dans le domaine des sous-bandes. Le phénomène de réverbération tardive peut également être traité par une ligne à retard ajoutée au traitement des premières réflexions. L'invention couvre enfin un programme d'ordinateur comportant une suite d'instructions mémorisées sur un support de mémorisation d'un ordinateur ou d'un dispositif dédié de spatialisation sonore 3D de signaux audio remarquable en ce que, lors de son exécution, ce programme d'ordinateur exécute le procédé de spatialisation sonore 3D à partir d'au moins un filtre BRIR comportant un effet de salle décrit précédemment dans la description en liaison avec les figures 2 et 3a à 3d. On comprend, en particulier, que le programme d'ordinateur précité peut être un programme directement exécutable implanté dans la mémoire permanente d'un ordinateur ou d'un dispositif de synthèse binaurale d'un effet de salle en spatialisation sonore.
La mise en oeuvre de l'invention peut alors être exécutée de manière totalement numérique.

Claims (10)

REVENDICATIONS
1. Procédé de spatialisation 3D de canaux audio, à partir d'au moins un filtre BRIR incorporant un effet de salle, caractérisé en ce qu'il consiste au moins, pour un nombre d'échantillons spécifique correspondant à la taille de la réponse impulsionnelle du filtre BRIR, à : - décomposer ce filtre BRIR en au moins un ensemble de valeurs de retard et d'amplitude associées aux instants d'arrivée des réflexions ; extraire sur ledit nombre d'échantillons au moins un module spectral du filtre BRIR ; -constituer à partir de chaque retard successif, de son amplitude et de son module spectral associés un filtre BRIR élémentaire directement appliqué auxdits canaux audio dans le domaine temporel, fréquentiel ou transformé.
2. Procédé selon la revendication 1, caractérisé en ce que ladite décomposition du filtre BRIR est exécutée par un processus de détection des retards par détection des pics d'amplitude, au premier pic d'amplitude étant associé le retard correspondant à l'instant d'arrivée de l'onde sonore directe.
3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que l'extraction de chaque module spectral est exécutée par une transformation temps-fréquence.
4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce que l'extraction des retards consiste au moins, pour tout filtre BRIR correspondant à une position de l'espace, à partir de l'enveloppe temporelle du filtre établie sur ledit nombre d'échantillons correspondant à la taille de la réponse impulsionnelle du filtre BRIR, à : identifier les indices de rang d'échantillons temporels dont la valeur d'amplitude est supérieure à une valeur de seuil, pour engendrer un premier vecteur et un premier vecteur décalé représentatifs de la positiondes pics d'amplitude dans ledit nombre d'échantillons ; déterminer l'existence de pics d'amplitude isolés par calcul d'un vecteur d'écart entre le premier vecteur décalé et le premier vecteur ; calculer un deuxième vecteur regroupant les indices de pics d'amplitude isolés sur ledit nombre d'échantillons ; discriminer à partir des échantillons dudit deuxième vecteur les indices successifs d'échantillons d'amplitude maximale parmi un nombre déterminé d'échantillons successifs, l'indice et l'amplitude desdits échantillons d'amplitude maximale étant mémorisés sous forme d'un vecteur d'indice de retard et d'amplitude.
5. Procédé selon l'une des revendications 1 à 4, caractérisé en ce que, pour un nombre d'échantillons correspondant à la réponse impulsionnelle du filtre BRIR décomposé en sous-bandes de fréquences de rang k déterminé, ladite valeur du module spectral du filtre BRIR est définie comme une valeur réelle de gain représentative de l'énergie du filtre BRIR dans chaque sous-bande.
6. Procédé selon la revendication 5, caractérisé en ce que la valeur du module spectral du filtre BRIR dans chaque sous-bande est calculée par application d'une fenêtre de pondération centrée sur la fréquence centrale de la sous-bande de fréquences de rang k et de largeur égale ou supérieure à la largeur de la sous-bande de fréquences.
7. Procédé selon l'une des revendications 5 ou 6, caractérisé en ce que, à chaque retard est associé un module spectral, et en ce que ledit module spectral est défini dans chaque sous-bande comme une valeur réelle de gain représentative de l'énergie du filtre BRIR partiel dans ladite sous-bande, valeur de gain fonction du retard associé.
8. Procédé selon l'une des revendications 5 à 7, caractérisé en ce que chaque filtre BRIR élémentaire dans chaque sous-bande de fréquences de rang k est formé par : une multiplication complexe, fonction ou non du retard appliqué en fonction de l'indice de chaque échantillon de pic d'amplitude incluant la valeur réelle de gain ;un retard pur, augmenté de l'écart de retard vis-à-vis du retard alloué au premier échantillon correspondant à l'instant d'arrivée de l'onde sonore directe.
9. Procédé selon l'une des revendications 1 à 8, caractérisé en ce que, pour le traitement de la réverbération tardive, celui-ci consiste à rajouter aux valeurs de pics d'amplitude détectées une pluralité de valeurs d'amplitudes arbitraires, réparties, depuis un instant arbitraire, jusqu'au dernier échantillon des nombres d'échantillons correspondant à la taille de la réponse impulsionnelle du filtre BRIR.
10. Programme d'ordinateur comportant une suite d'instructions mémorisées sur un support de mémorisation d'un ordinateur ou d'un dispositif dédié de spatialisation sonore 3D de signaux audio, caractérisé en ce que, lors de son exécution, ledit programme exécute le procédé de spatialisation sonore 3D à partir d'au moins un filtre BRIR comportant un effet de salle, selon l'une des revendications 1 à 9.
FR0602694A 2006-03-28 2006-03-28 Procede de synthese binaurale prenant en compte un effet de salle Withdrawn FR2899424A1 (fr)

Priority Applications (6)

Application Number Priority Date Filing Date Title
FR0602694A FR2899424A1 (fr) 2006-03-28 2006-03-28 Procede de synthese binaurale prenant en compte un effet de salle
EP07731711A EP1999998B1 (fr) 2006-03-28 2007-03-08 Procede de synthese binaurale prenant en compte un effet de salle
PCT/FR2007/050895 WO2007110520A1 (fr) 2006-03-28 2007-03-08 Procede de synthese binaurale prenant en compte un effet de salle
US12/225,691 US8045718B2 (en) 2006-03-28 2007-03-08 Method for binaural synthesis taking into account a room effect
ES07731711T ES2390831T3 (es) 2006-03-28 2007-03-08 Procedimiento de síntesis binaural teniendo en cuenta un efecto de sala
JP2009502160A JP4850948B2 (ja) 2006-03-28 2007-03-08 空間効果を考慮に入れたバイノーラル合成のための方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0602694A FR2899424A1 (fr) 2006-03-28 2006-03-28 Procede de synthese binaurale prenant en compte un effet de salle

Publications (1)

Publication Number Publication Date
FR2899424A1 true FR2899424A1 (fr) 2007-10-05

Family

ID=37398830

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0602694A Withdrawn FR2899424A1 (fr) 2006-03-28 2006-03-28 Procede de synthese binaurale prenant en compte un effet de salle

Country Status (6)

Country Link
US (1) US8045718B2 (fr)
EP (1) EP1999998B1 (fr)
JP (1) JP4850948B2 (fr)
ES (1) ES2390831T3 (fr)
FR (1) FR2899424A1 (fr)
WO (1) WO2007110520A1 (fr)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
US20110109798A1 (en) * 2008-07-09 2011-05-12 Mcreynolds Alan R Method and system for simultaneous rendering of multiple multi-media presentations
EP2368375B1 (fr) * 2008-11-21 2019-05-29 Auro Technologies Nv Convertisseur et procédé de conversion d'un signal audio
US9107021B2 (en) 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
US8995675B2 (en) * 2010-12-03 2015-03-31 The University Of North Carolina At Chapel Hill Methods and systems for direct-to-indirect acoustic radiance transfer
US9462387B2 (en) 2011-01-05 2016-10-04 Koninklijke Philips N.V. Audio system and method of operation therefor
US9794678B2 (en) * 2011-05-13 2017-10-17 Plantronics, Inc. Psycho-acoustic noise suppression
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization
US20150036827A1 (en) * 2012-02-13 2015-02-05 Franck Rosset Transaural Synthesis Method for Sound Spatialization
JP6102179B2 (ja) * 2012-08-23 2017-03-29 ソニー株式会社 音声処理装置および方法、並びにプログラム
WO2014171791A1 (fr) 2013-04-19 2014-10-23 한국전자통신연구원 Appareil et procédé de traitement de signal audio multicanal
KR102150955B1 (ko) 2013-04-19 2020-09-02 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
KR101815082B1 (ko) * 2013-09-17 2018-01-04 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
KR102317732B1 (ko) * 2013-09-17 2021-10-27 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9769589B2 (en) * 2013-09-27 2017-09-19 Sony Interactive Entertainment Inc. Method of improving externalization of virtual surround sound
CN108449704B (zh) 2013-10-22 2021-01-01 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9832589B2 (en) * 2013-12-23 2017-11-28 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US10382880B2 (en) 2014-01-03 2019-08-13 Dolby Laboratories Licensing Corporation Methods and systems for designing and applying numerically optimized binaural room impulse responses
CN104768121A (zh) * 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN107750042B (zh) 2014-01-03 2019-12-13 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US9832585B2 (en) 2014-03-19 2017-11-28 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
CN108307272B (zh) 2014-04-02 2021-02-02 韦勒斯标准与技术协会公司 音频信号处理方法和设备
US10142755B2 (en) * 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
US9866916B1 (en) * 2016-08-17 2018-01-09 International Business Machines Corporation Audio content delivery from multi-display device ecosystem
US10187740B2 (en) 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
FR3067511A1 (fr) * 2017-06-09 2018-12-14 Orange Traitement de donnees sonores pour une separation de sources sonores dans un signal multicanal
US10911855B2 (en) 2018-11-09 2021-02-02 Vzr, Inc. Headphone acoustic transformer

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5438623A (en) * 1993-10-04 1995-08-01 The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration Multi-channel spatialization system for audio signals
US5459790A (en) * 1994-03-08 1995-10-17 Sonics Associates, Ltd. Personal sound system with virtually positioned lateral speakers
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2893563B2 (ja) * 1992-12-11 1999-05-24 松下電器産業株式会社 音像定位係数算出装置
WO1995031881A1 (fr) 1994-05-11 1995-11-23 Aureal Semiconductor Inc. Affichage audio virtuel tridimensionnel utilisant des filtres de formation d'images a complexite reduite
US5596644A (en) * 1994-10-27 1997-01-21 Aureal Semiconductor Inc. Method and apparatus for efficient presentation of high-quality three-dimensional audio
FR2768546B1 (fr) 1997-09-18 2000-07-21 Matra Communication Procede de debruitage d'un signal de parole numerique
GB2366975A (en) * 2000-09-19 2002-03-20 Central Research Lab Ltd A method of audio signal processing for a loudspeaker located close to an ear
JP2003061200A (ja) * 2001-08-17 2003-02-28 Sony Corp 音声処理装置及び音声処理方法、並びに制御プログラム
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5438623A (en) * 1993-10-04 1995-08-01 The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration Multi-channel spatialization system for audio signals
US5459790A (en) * 1994-03-08 1995-10-17 Sonics Associates, Ltd. Personal sound system with virtually positioned lateral speakers
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound

Also Published As

Publication number Publication date
JP2009531906A (ja) 2009-09-03
EP1999998A1 (fr) 2008-12-10
ES2390831T3 (es) 2012-11-16
EP1999998B1 (fr) 2012-07-11
JP4850948B2 (ja) 2012-01-11
US20090103738A1 (en) 2009-04-23
WO2007110520A1 (fr) 2007-10-04
US8045718B2 (en) 2011-10-25

Similar Documents

Publication Publication Date Title
EP1999998B1 (fr) Procede de synthese binaurale prenant en compte un effet de salle
EP2000002B1 (fr) Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme
EP1992198B1 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP1600042B1 (fr) Procede de traitement de donnees sonores compressees, pour spatialisation
EP2898707B1 (fr) Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs
EP3427260B1 (fr) Codage et décodage optimisé d'informations de spatialisation pour le codage et le décodage paramétrique d'un signal audio multicanal
EP2005420A1 (fr) Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal
WO2004086818A1 (fr) Procede pour traiter un signal electrique de son
EP2042001A1 (fr) Spatialisation binaurale de donnees sonores encodees en compression
EP3475943B1 (fr) Procede de conversion et d'encodage stereophonique d'un signal audio tridimensionnel
EP3025514B1 (fr) Spatialisation sonore avec effet de salle
FR3065137A1 (fr) Procede de spatialisation sonore
EP1994526B1 (fr) Synthese et spatialisation sonores conjointes
EP3058564B1 (fr) Spatialisation sonore avec effet de salle, optimisee en complexite
EP3384688B1 (fr) Décompositions successives de filtres audio
EP2815589B1 (fr) Procédé de synthèse transaurale pour la spatialisation sonore
EP1869949A1 (fr) Procede et systeme de spatialisation d'un signal sonore en fonction des qualites intrinseques de ce dernier

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20071130