EP3025514B1 - Spatialisation sonore avec effet de salle - Google Patents
Spatialisation sonore avec effet de salle Download PDFInfo
- Publication number
- EP3025514B1 EP3025514B1 EP14748239.2A EP14748239A EP3025514B1 EP 3025514 B1 EP3025514 B1 EP 3025514B1 EP 14748239 A EP14748239 A EP 14748239A EP 3025514 B1 EP3025514 B1 EP 3025514B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- signals
- input signals
- mean
- transfer function
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims description 14
- 230000006870 function Effects 0.000 claims description 46
- 238000012546 transfer Methods 0.000 claims description 43
- 230000004044 response Effects 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 27
- 238000001914 filtration Methods 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims 1
- 210000005069 ears Anatomy 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 235000021183 entrée Nutrition 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 238000007792 addition Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 101150114988 invA gene Proteins 0.000 description 2
- SYHGEUNFJIGTRX-UHFFFAOYSA-N methylenedioxypyrovalerone Chemical compound C=1C=C2OCOC2=CC=1C(=O)C(CCC)N1CCCC1 SYHGEUNFJIGTRX-UHFFFAOYSA-N 0.000 description 2
- 101150021607 rppH gene Proteins 0.000 description 2
- 101150082821 sacA gene Proteins 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101150070603 yadA gene Proteins 0.000 description 2
- SVTBMSDMJJWYQN-UHFFFAOYSA-N 2-methylpentane-2,4-diol Chemical compound CC(O)CC(C)(C)O SVTBMSDMJJWYQN-UHFFFAOYSA-N 0.000 description 1
- 101100452676 Arabidopsis thaliana INVB gene Proteins 0.000 description 1
- 101100071959 Bartonella bacilliformis (strain ATCC 35685 / NCTC 12138 / KC583) ialB gene Proteins 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 241001362574 Decodes Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 101150080136 sacC gene Proteins 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 101150094617 spaK gene Proteins 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000004584 weight gain Effects 0.000 description 1
- 235000019786 weight gain Nutrition 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S1/005—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Definitions
- the energy of the average filter E E mean g / d can be measured directly from the constructed filter B mean g / d .
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Description
- L'invention est relative au traitement de données sonores, et plus particulièrement à la spatialisation (dite « rendu 3D ») de signaux audio.
- Une telle opération est par exemple exécutée lors du décodage d'un signal audio 3D codé, représenté sur un certain nombre de canaux, vers un nombre de canaux différents, deux par exemple, pour permettre la restitution des effets 3D audio sur un casque d'écoute.
- L'invention est également relative à la transmission et à la restitution de signaux audio multicanaux et à leur conversion vers un dispositif de restitution, transducteur, imposé par l'équipement d'un utilisateur. C'est par exemple le cas pour la restitution d'une scène sonore 5.1 par un casque d'écoute audio, ou par une paire de hauts parleurs.
- L'invention est également relative à la restitution, dans le cadre d'un jeu ou enregistrement vidéo par exemple, d'un ou plusieurs échantillons sonores stockés dans des fichiers, en vue de leur spatialisation.
- Dans le cas d'une source monophonique statique, la binauralisation est basée sur le filtrage du signal monophonique par la fonction de transfert entre la position désirée de la source et chacune des deux oreilles. Le signal binaural (deux canaux) obtenu peut alors alimenter un casque audio et fournir la sensation à l'auditeur d'une source à la position simulée. Ainsi, le terme « binaural » vise la restitution d'un signal sonore avec des effets de spatialisation.
- Chacune des fonctions de transfert simulant différentes positions peuvent être mesurées en chambre sourde, aboutissant ainsi à un ensemble de HRTF (pour « Head Related Transfer Functions » ou « Fonctions de Transferts Relatives à la Tête ») dans lesquelles aucun effet de salle n'est présent.
- Ces fonctions de transfert peuvent également être mesurées dans une salle « classique », aboutissant ainsi à un ensemble de BRIR (pour « Binaural Room Impulse Response » ou « Réponse Impulsionnelle Binaurale de salle») dans lesquelles l'effet de salle, ou réverbération, est présent. L'ensemble des BRIR correspondent donc à un ensemble de fonctions de transfert entre une position donnée et les oreilles d'un auditeur (réel ou tête artificielle) placé dans une salle.
- La technique habituelle de mesure de BRIR consiste à envoyer successivement dans chacun des haut-parleurs réels, positionnés autour d'une tête (réelle ou artificielle) équipée de microphones dans les oreilles, un signal de test (par exemple un signal sweep, une séquence binaire pseudo-aléatoire ou un bruit blanc). Ce signal de test rend possible, lors d'un traitement hors temps réel, la reconstitution (généralement par déconvolution) de la réponse impulsionnelle entre la position du haut-parleur et chacune des deux oreilles.
- La différence entre un ensemble de HRTF et de BRIR se situe principalement dans la longueur de la réponse impulsionnelle, de l'ordre de la milliseconde pour les HRTF, à l'ordre de la seconde pour les BRIR.
- Le filtrage étant basé sur la convolution entre le signal monophonique et la réponse impulsionnelle, la complexité pour effectuer une binauralisation avec des BRIR (contenant un effet de salle) est nettement plus élevée qu'avec des HRTF.
- Il est possible par cette technique de simuler au casque ou sur un nombre limité de haut-parleurs une écoute d'un contenu multicanal (L canaux) généré par L haut-parleurs dans une salle. En effet, il suffit de considérer chacun des L haut-parleurs comme une source virtuelle positionnée idéalement par rapport à l'auditeur, de mesurer dans la salle à simuler les fonctions de transfert (pour les oreilles gauche et droite) de chacun de ces L haut-parleurs, puis d'appliquer à chacun des L signaux audio (censés alimenter les L haut-parleurs réels) les filtres BRIR correspondant aux haut-parleurs. Les signaux alimentant chacune des oreilles sont sommés pour fournir un signal binaural alimentant un casque audio.
-
- Où * représente l'opérateur de convolution.
- Par la suite, l'indice 1 tel que l ∈ [1,L] fait référence à un des L haut-parleurs. On a bien une BRIR pour un signal 1.
- Ainsi, en référence à la
figure 1 , deux convolutions (une pour chaque oreille) sont présentes pour chaque haut-parleur (étapes S11 à S1L). - Pour L haut-parleurs, la binauralisation nécessite donc 2.L convolutions. On peut calculer la complexité Cconv dans le cas d'une implémentation rapide par bloc. Une implémentation rapide par bloc est par exemple donnée par une transformée de Fourier rapide (FFT pour « Fast Fourier Transform »). Le document « Submission and Evaluation Procedures for 3D Audio » (MPEG 3D Audio) précise une formule possible pour le calcul de Cconv :
- Dans cette équation, L représente le nombre de FFT pour transformer en fréquence les signaux d'entrée (1 FFT par signal d'entrée), le 2 représente le nombre de FFT inverse pour obtenir le signal binaural temporel (2 FFT inverse pour les deux canaux du binaural), le 6 indique un coefficient de complexité par FFT, le second 2 indique un bourrage de zéros nécessaire pour éviter les problèmes dus à la convolution circulaire, Fs indique la taille de chacune des BRIR, et nBlocs représente le fait d'utiliser un traitement par bloc, plus réaliste dans une approche où la latence ne doit pas être excessivement élevée, et . représente la multiplication.
- Ainsi pour utilisation typique avec nBlocs=10, Fs=48000, L=22, la complexité par échantillon de signal multicanal pour une convolution directe basée sur une FFT est de Cconv = 19049 multiplications-additions.
- Cette complexité est trop élevée pour une implémentation réaliste à l'heure actuelle sur des processeurs courants (mobiles par exemple), il est donc nécessaire de diminuer cette complexité sans dégrader fortement le rendu de la binauralisation.
- Pour que la spatialisation soit de bonne qualité, la totalité du signal temporel des BRIR doit être appliqué.
-
US 2006/045294 A1 divulgue un système de spatialisation sonore de signaux multicanaux pour délivrer au moins deux canaux de sortie, et incluant le partitionnement des réponses impulsionnelles en deux parties, la première contenant l'arrivée directe et les premières réflexions, et la seconde contenant la réverbération, les secondes parties d'au moins deux réponses impulsionnelles étant sommées et pondérées pour une obtenir une fonction de transfert unique représentant la réverbération à appliquer aux signaux d'entrée, afin de réduire la complexité des opérations de convolution.US 2006/045294 A1 divulgue également le filtrage par blocs de FFT. - STEWART REBECCA ET AL: "Generating a Spatial Average Reverberation Tail Across Multiple Impulse Responses",CONFERENCE: 35TH INTERNATIONAL CONFERENCE: AUDIO FOR GAMES; FEBRUARY 2009, AES, NEW YORK, USA, 1 février 2009 (2009-02-01) divulgue un partitionnement de réponses impulsionnelles similaire, ainsi que le moyennage des parties de réponses impulsionnelles représentant la réverbération, pour réduire la redondance dans les bases de données de réponses impulsionnelles.
- GARDNER W G: "EFFICIENT CONVOLUTION WITHOUT INPUT-OUTPUT DELAY",JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY, NEW YORK, NY, US, vol. 43, no. 3, 1 mars 1995 (1995-03-01), pages 127-135 décrit une implémentation efficace pour la convolution de réponses impulsionnelles, notamment dans le contexte des simulations de réverbération, sous forme de blocs FFT. Cet article suggère de réutiliser les transformées des signaux d'entrée dès que possible, pour réduire les coûts de calcul, et montre qu'un partitionnement d'une réponse impulsionnelle en sous-blocs de longueur multiple les uns des autres permet de réduire la complexité de calcul.
- La présente invention vient améliorer la situation.
- Elle vise à diminuer fortement la complexité de la binauralisation d'un signal multicanal avec effet de salle tout en conservant au mieux la qualité audio.
- La présente invention propose à cet effet un procédé de spatialisation sonore tel que défini dans les revendications 1 à 10.
- L'invention vise aussi un programme informatique comportant des instructions pour la mise en oeuvre du procédé.
- L'invention peut être mise en oeuvre par un dispositif de spatialisation sonore tel que défini dans la revendication 12.
- L'invention peut également être mise en oeuvre dans un module de décodage de signaux sonores, en tant que signaux d'entrée, comportant le dispositif de spatialisation ci-dessus.
- D'autres avantages et caractéristiques de l'invention apparaîtront à la lecture de la description détaillée ci-après d'exemples de réalisation de l'invention et à l'examen des dessins sur lesquels :
- la
figure 1 illustre un procédé de spatialisation de l'art antérieur, - la
figure 2 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation, - la
figure 3 représente une réponse impulsionnelle binaurale de salle BRIR, - la
figure 4 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation, - la
figure 5 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation, - la
figure 6 représente schématiquement un dispositif comportant des moyens de mise en oeuvre du procédé au sens de l'invention. - On se réfère à la
figure 6 pour illustrer tout d'abord un contexte possible de mise en oeuvre de la présente invention dans un dispositif de type terminal connecté TER (par exemple un téléphone, smartphone ou autre, ou encore une tablette connectée, un ordinateur connecté, ou autres). Un tel dispositif TER comporte des moyens de réception (une antenne typiquement) de signaux audio Xc codés en compression, un dispositif de décodage DECOD délivrant des signaux décodés X prêts à être traités par un dispositif de spatialisation avant la restitution des signaux audio (par exemple en binaural sur un casque à oreillettes CAS). Bien entendu, dans certains cas, il peut être avantageux de garder les signaux partiellement décodés (par exemple dans le domaine des sous-bandes) si le traitement de spatialisation est effectué dans le même domaine (traitement fréquentiel dans le domaine des sous-bandes par exemple). - En référence encore à la
figure 6 , le dispositif de spatialisation se présente par une combinaison d'éléments : - hardware comportant typiquement un ou plusieurs circuits CIR coopérant avec une mémoire de travail MEM et un processeur PROC,
- et software, dont les
figures 2 et4 sont des exemples d'organigrammes en illustrant l'algorithme général. - Ici, la coopération entre les éléments hardware et software produit un effet technique procurant notamment une économie de complexité de la spatialisation pour sensiblement un même rendu audio (même sensation pour un auditeur), comme on le verra plus loin.
- On se réfère maintenant à la
figure 2 pour décrire un traitement au sens de l'invention, ainsi mis en oeuvre par des moyens informatiques. - Dans une première étape S21, une préparation des données est effectuée. Cette préparation est optionnelle, les signaux peuvent être traités selon les étapes S22 et suivantes sans ce pré-traitement.
- En particulier, cette préparation consiste à effectuer une troncature de chaque BRIR pour ignorer les échantillons inaudibles au début et à la fin de la réponse impulsionnelle.
- Cette préparation, pour la troncature en début de réponse impulsionnelle TRONC S, à l'étape S211, consiste à déterminer un instant de début d'ondes sonores directes et peut-être mis en oeuvre par les étapes suivantes :
- Une somme cumulée des énergies de chacun des filtres BRIR(1) est calculée. Typiquement, cette énergie est calculée par une somme au carré des amplitudes des échantillons 1 à j, avec j compris dans [1 ; J] avec J le nombre d'échantillon d'un filtre BRIR.
- La valeur d'énergie du filtre d'énergie maximum valMax (parmi les filtres relatifs à l'oreille gauche et à l'oreille droite) est calculée.
- Pour chacun des haut-parleurs 1, on calcule l'indice pour lequel l'énergie de chacun des filtres BRIR(1) dépasse un certain seuil en dB calculé par rapport à valMax (e.g. valMax-50dB).
- L'indice de troncature iT retenu pour toutes les BRIR est l'indice minimum parmi tous les indices des BRIR et il est considéré comme l'instant de début d'ondes sonores directes.
- L'indice iT obtenu correspond donc au nombre d'échantillons à ignorer pour chacune des BRIR. Une troncature brutale en début de réponse impulsionnelle avec une fenêtre rectangulaire peut mener à des artefacts audibles si elle est appliquée dans une partie trop énergétique. Il peut donc être préférable d'appliquer une fenêtre de fondu d'entrée adaptée, cependant si des précautions ont été prises dans le seuil choisi, ce fenêtrage devient inutile, car inaudible (on coupe juste du signal inaudible).
- Le synchronisme entre BRIR rend possible l'application d'un délai constant pour toutes les BRIR dans un souci de simplicité d'implémentation, même si une optimisation de complexité est possible.
- La troncature de chaque BRIR pour ignorer les échantillons inaudibles à la fin de la réponse impulsionnelle TRONC E, à l'étape S212, peut être réalisée à partir d'étape similaires à celles décrites ci-avant, adaptées pour convenir à la fin de la réponse impulsionnelle. Une troncature brutale en fin de réponse impulsionnelle avec une fenêtre rectangulaire peut mener à des artefacts audibles sur des signaux impulsionnels où la queue de réverbération peut se révéler audible. Ainsi, dans un mode de réalisation, on applique une fenêtre de fondu de sortie adaptée.
- A l'étape 22, une isolation en synchronisme ISOL A/B est effectuée. Cette isolation en synchronisme consiste à séparer, pour chaque BRIR, la partie « son direct » et « premières réflexions » (ou Direct, noté A) et de la partie « son diffus » (ou Diffus, noté B). En effet, le traitement à effectuer sur la partie « son diffus » peut avantageusement être différent de celui à effectuer sur la partie « son direct » dans la mesure où il est préférable d'avoir une meilleure qualité de traitement sur la partie « son direct » que sur la partie « son diffus ». Ceci rend possible une optimisation du rapport qualité/complexité.
- En particulier, pour réaliser l'isolation en synchronisme, on détermine un index « iDD » d'échantillon unique et commun à toutes les BRIR (d'où le terme « synchronisme ») à partir duquel on considère que le reste de la réponse impulsionnelle correspond à un champ diffus. On partitionne donc les réponses impulsionnelles BRIR(1) en deux : A(l) et B(l), où la concaténation des deux correspond à BRIR(1).
- La
figure 3 montre l'index de partitionnement iDD à l'échantillon 2000. La partie à gauche de cet indice iDD correspond à la partie A. La partie à droite de cet indice iDD correspond à la partie B. - Dans un mode de réalisation, ces deux parties sont isolées, sans fenêtrage, afin de subir des traitements différents. Dans une variante, un fenêtrage entre les parties A(1) et B(1) est appliqué.
- L'indice iDD peut-être spécifique à la salle pour laquelle les BRIR ont été déterminés. Le calcul de cet indice peut donc dépendre de l'enveloppe spectrale, de la corrélation des BRIR ou encore de l'échogramme de ces BRIR. Par exemple, iDD peut être déterminé par une formule du type
- Dans un mode de réalisation, iDD est une valeur fixe, typiquement 2000. Dans une variante, iDD varie, avantageusement de manière dynamique, en fonction de l'environnement à partir duquel les signaux d'entrée sont capturés.
-
-
- Dans un mode de réalisation, les index d'échantillons choisis pour A et B peuvent également tenir compte des longueurs de trames dans le cas d'intégration dans un codeur audio. En effet, des tailles typiques de trames de 1024 échantillons peut mener à un choix tel que A fasse 1024 et B fasse 2048, en s'assurant que B est bien une zone de champ diffus pour toutes les BRIR.
- En particulier, il peut être intéressant que la taille de B soit un multiple de la taille de A car si le filtrage est implémenté par blocs de FFT, alors le calcul d'une FFT pour A peut être réutilisé pour B.
- Un champ diffus se caractérise par le fait qu'il est statistiquement identique en tous les points de la salle. Ainsi, sa réponse en fréquence varie peu en fonction du haut-parleur à simuler. La présente invention exploite cette caractéristique dans le but de remplacer tous les filtres Diffus D(l) de toutes les BRIR par un seul et unique filtre « moyen » Bmean afin de diminuer fortement la complexité due aux convolutions multiples. Pour cela, on peut modifier la partie champ diffus B à l'étape S23B, toujours en référence à la
figure 2 . - A l'étape S23B1, on calcule la valeur du filtre moyen Bmean. D'abord, il est extrêmement rare que le système complet soit calibré idéalement, on peut donc appliquer un gain de pondération qui sera reporté dans le signal d'entrée afin d'effectuer une unique convolution par oreille pour la partie champs diffus. On décompose donc les BRIR en des filtres normalisés en énergie, et on reporte le gain de normalisation
/ d (l) représente l'énergie de B g/d (l). -
- Dans un mode de réalisation, ce filtre moyen peut être obtenu par moyennage des échantillons temporels. Dans une variante, il peut être obtenu par tout autre type de moyennage comme par exemple un moyennage des densités spectrales de puissance.
- Dans un mode de réalisation, l'énergie du filtre moyen EE
mean g/d peut être mesurée directement à partir du filtre construit Bmean g/d . Dans une variante, il peut également être estimé en prenant en compte l'hypothèse que les filtres Bnorm g/d (l) sont décorrélés. En effet, dans ce cas, comme on somme des signaux d'énergie unitaire, on a : - L'énergie peut être calculée sur l'ensemble des échantillons correspondants à la partie champ diffus.
-
-
- Ainsi, les L convolutions avec la partie champ diffus sont remplacées par une seule convolution avec un filtre moyen, moyennant une somme pondérée du signal d'entrée.
- A l'étape S23B3, on peut optionnellement calculer un gain G corrigeant le gain du filtre moyen Bmean g/d . En effet, dans le cas de la convolution entre les signaux d'entrée et les filtres non approximés, quelles que soient les valeurs de corrélation entre les signaux d'entrée, le filtrage par des filtres décorrélés que sont les B g/d (l) mène à des signaux à sommer qui sont alors eux aussi décorrélés. A l'inverse, dans le cas de la convolution entre les signaux d'entrée et le filtre moyen approximé, l'énergie du signal issu de la sommation des signaux filtrés va dépendre de la valeur de corrélation existant entre les signaux d'entrée.
- Par exemple,
* si tous les signaux d'entrée I(1) sont identiques et d'énergie unitaire, et que les filtres B(l) sont tous décorrélés (puisque champs diffus) et d'énergie unitaire, on a : - Car les énergies des signaux décorrélés s'ajoutent.
- Ce cas est équivalent au précédent dans le sens où les signaux issus du filtrage sont tous décorrélés, grâce aux signaux d'entrée dans le premier cas, et grâce aux filtres dans le second cas.
* si tous les signaux d'entrée I(1) sont identiques et d'énergie unitaire, et que les filtres B(l) sont tous d'énergie unitaire, mais remplacés par des filtres identiques - Car les énergies des signaux identiques s'ajoutent en quadrature (car leurs amplitudes s'ajoutent).
- Ainsi,
- si deux haut-parleurs sont actifs simultanément, alimentés par des signaux décorrélés, alors aucun gain n'est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
- si deux haut-parleurs sont actifs simultanément, alimentés par des signaux identiques, alors un gain de 10. log10(L 2/L) =10.log 10(22/2) = 3.01dB est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
- si trois haut-parleurs sont actifs simultanément, alimentés par des signaux identiques, alors un gain de 10.log 10(L 2/L) = 10.log 10(32/3) = 4.77dB est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
- Les cas évoqués ci-avant correspondent aux cas extrêmes de signaux identiques ou décorrélés. Ces cas sont toutefois réalistes : une source positionnée au milieu de deux haut-parleurs, virtuels ou réels, fournira un signal identique à ces deux haut-parleurs (par exemple avec une technique de type VBAP, pour « Vector base amplitude panning »). Dans le cas d'un positionnement dans un système 3D, les 3 haut-parleurs peuvent recevoir le même signal au même niveau.
- Ainsi, on peut appliquer une compensation afin de respecter l'énergie des signaux binauralisés.
-
- Le gain G(I(l)) peut être estimé par un calcul de corrélation entre chacun des signaux. Il peut également être estimé en comparant les énergies des signaux avant et après sommations. Dans ce cas, le gain G peut varier dynamiquement au cours du temps, en fonction par exemple des corrélations entre les signaux d'entrée, qui varient eux-mêmes au cours du temps.
- Dans un mode de réalisation simplifié, il est possible de fixer un gain constant, par exemple G = -3dB = 10-3/20, ce qui évitera d'avoir à effectuer une estimation de corrélation qui peut être coûteuse. Le gain constant G peut alors être appliqué hors ligne aux facteurs de pondération (donnant ainsi
- Une fois les fonctions de transfert A et B isolées et les filtres Bmean g/d (optionnellement les poids W g/d (l) et G) calculés, on applique ces fonctions de transfert et ces filtres aux signaux d'entrée.
- Dans un premier mode de réalisation, décrit en référence à la
figure 4 , le traitement du signal multicanal par application des filtres Direct (A) et Diffus (B) pour chacune des oreilles est effectué de la manière suivante : - On applique (étapes S4A1 à S4AL) au signal multicanal d'entrée un filtrage efficace (par exemple convolution directe basée-FFT) par les filtres Direct (A), comme décrit dans l'état de l'art. On obtient un signal
- En fonction des relations entre les signaux d'entrée, notamment en fonction de leur corrélation, on peut optionnellement corriger à l'étape S4B11 le gain du filtre moyen Bmean g/d par application du gain G aux signaux de sortie après sommation des signaux d'entrée préalablement pondérés (étapes M4B1 à M4BL).
- On applique au signal multicanal B à l'étape S4B1 un filtrage efficace par le filtre Diffus moyen Bmean. Cette étape a bien lieu après sommation des signaux d'entrée préalablement pondérés (étapes M4B1 à M4BL). On obtient le signal
- On applique au signal
- Les signaux
- Si une troncature éliminant les échantillons inaudibles au début des réponses impulsionnelles a été réalisée, alors on applique à l'étape S41 au signal d'entrée un délai iT correspondant aux échantillons inaudibles supprimés.
- Dans une variante, en référence à la
figure 5 , les signaux ne sont pas seulement calculés pour les oreilles gauches et droites (indices g et d ci-avant) mais pour k dispositifs de restitution (typiquement des haut-parleurs). - Dans un second mode de réalisation, on applique le gain G préalablement à la sommation des signaux d'entrée, c'est-à-dire pendant les étapes de pondération (étapes M4B1 à M4BL).
- Dans un troisième mode de réalisation, on applique une décorrélation aux signaux d'entrée. Ainsi, les signaux sont décorrélés après convolution par le filtre Bmean quelles que soient les corrélations d'origine entre signaux d'entrée. On peut utiliser une implémentation efficace de décorrélation (par exemple en utilisant un réseau de retards bouclés) afin d'éviter l'utilisation de filtres de décorrélation couteux.
- Ainsi, en supposant de manière réaliste que des BRIR de longueur 48000 échantillons peuvent être :
- tronquées entre l'échantillon 150 et l'échantillon 3222 par la technique décrite à l'étape S21,
- décomposées en deux parties : champ direct A de 1024 échantillons, et champ diffus B de 2048 échantillons, par la technique décrite à l'étape S22,
- Ainsi pour nBlocs=10, Fs=48000, L=22, NA=1024 et NB=2048, la complexité par échantillon de signal multicanal pour une convolution basée-FFT est de Cconv = 3312 multiplications-additions. Ce résultat est cependant logiquement à comparer à une solution simple implémentant seulement la troncature, soit pour nBlocs=10, Fs=3072, L=22 :
- Il existe donc un facteur 19049/3312=5.75 de complexité entre l'état de l'art et la présente invention, et encore un facteur 13339/3312=4 de complexité entre l'état de l'art bénéficiant de la troncature et la présente invention.
- Si la taille de B est un multiple de la taille de A, alors si le filtrage est implémenté par blocs de FFT, le calcul d'une FFT pour A peut être réutilisé pour B. On a donc besoin de L FFT sur NA points, qui serviront à la fois au filtrage par A et par B, deux FFT inverse sur NA points pour obtenir le signal binaural temporel, et la multiplication des spectres en fréquence.
-
- Avec cette approche, on gagne encore un facteur 2, et donc un facteur 12 et 8 par rapport à l'état de l'art non tronquée et tronquée.
- L'invention peut trouver une application directe dans la norme MPEG-H 3D Audio.
- Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci-avant ; elle s'étend à d'autres variantes tout en restant dans l'étendue de la protection définie dans les revendications annexées.
- Ainsi par exemple, on a décrit ci-avant un mode de réalisation dans lequel le signal Direct A n'est pas approximé par un filtre moyen. Bien entendu, on peut utiliser filtre moyen de A pour faire les convolutions (étapes S4A1 à S4AL) avec les signaux issus des haut-parleurs.
- On a décrit ci-avant un mode de réalisation basé sur le traitement d'un contenu multicanal généré pour L haut-parleurs. Bien sûr, le contenu multicanal peut-être généré par tout type de source audio comme par exemple la voix, un instrument de musique, un bruit quelconque, etc.
- On a décrit ci-avant un mode de réalisation basé sur des valeurs de BRIR déterminées dans une salle. Bien sûr, on peut mettre en oeuvre la présente invention pour tout type d'environnement extérieur (par exemple salle de concert, plein air, etc.).
- On a décrit ci-avant un mode de réalisation basé sur l'application de deux fonctions de transfert. Bien sûr, on peut mettre en oeuvre la présente invention avec plus de deux fonctions de transfert. Par exemple, on peut isoler en synchronisme une partie relative aux sons émis directement, une partie relative aux premières réflexions et une partie relative aux sons diffus.
Claims (13)
- Procédé de spatialisation sonore dans lequel on applique au moins un filtrage à au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) pour délivrer au moins deux signaux de sortie (O(1), O(2), ..., O(K)), le filtrage comportant:- pondérer (M4B1, M4B2, ..., M4BL) lesdits au moins deux signaux d'entrée par des poids de pondération (Wk(1), ..., Wk(L)) respectifs, chaque poids de pondération étant spécifique à chacun des signaux d'entrée ;- pour chaque réponse impulsionnelle incorporant un effet de salle parmi une pluralité de réponses impulsionnelles incorporant un effet de salle, ladite réponse impulsionnelle incorporant un effet de salle étant respectivement associée à un signal d'entrée parmi lesdits au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) et à un signal de sortie parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :∘ partitionner (S22), dans un domaine temporel, ladite réponse impulsionnelle en une première partie (A) et une deuxième partie (B), ledit partitionnement étant effectué tel que :ladite première partie représente des propagations sonores directes et des premières réflexions sonores desdites propagations et s'étend sur un premier nombre d'échantillons ; etladite deuxième partie représente un champ sonore diffus présent après lesdites premières réflexions et s'étend sur un deuxième nombre d'échantillons, ledit deuxième nombre d'échantillons étant un multiple dudit premier nombre d'échantillons ;∘ déterminer une première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) à partir de ladite première partie ;∘ déterminer une deuxième fonction de transfert à partir de ladite deuxième partie ;- pour chaque signal de sortie (O(1), O(2), ..., O(K)) parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :∘ déterminer (S23B1) une troisième fonction de transfert (Bmean k) à partir d'une moyenne desdites deuxièmes fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;∘ appliquer (S4A1, S4A2, ..., S4AL) à chaque signal d'entrée (I(1), I(2), ..., I(L)) la première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) correspondant au signal d'entrée (I(1), I(2), ..., I(L)) et au signal de sortie (O(1), O(2), ..., O(K)) ;∘ appliquer (S4B1) à chaque signal d'entrée la troisième fonction de transfert (Bmean k) correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
dans lequel l'application des premières et troisièmes fonctions de transfert est effectuée par blocs de FFT ;- sommer des signaux résultant desdites applications des premières et troisièmes fonctions de transfert pour obtenir lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)). - Procédé selon la revendication 1, caractérisé en ce qu'un gain de compensation d'énergie (G) est appliqué (S4B11) aux poids de pondération (Wk(1), ..., Wk(L)).
- Procédé selon l'une des revendications précédentes, caractérisé en ce que ledit partitionnement de ladite réponse impulsionnelle comporte les opérations:- de détermination (S211) d'un instant de début de présence d'ondes sonores directes,- de détermination d'un instant de début de présence dudit champ sonore diffus après les premières réflexions, et- de sélection (S22), dans ladite réponse impulsionnelle, d'une partie de la réponse qui s'étend temporellement entre ledit instant de début de présence d'ondes sonores directes jusqu'audit instant de début de présence de champ diffus, ladite partie de réponse sélectionnée correspondant à ladite première fonction de transfert.
- Procédé selon la revendication 3, caractérisé en ce que ledit filtrage comporte l'application d'au moins un délai de compensation (S4B2) correspondant à un écart temporel entre ledit instant de début d'ondes sonores directes et ledit instant de début de présence de champ diffus.
- Procédé selon la revendication 4, caractérisé en ce que lesdites première et troisième fonctions de transfert sont appliquées parallèlement auxdits signaux d'entrée et en ce que ledit au moins un délai de compensation est appliqué aux signaux d'entrée filtrés par lesdites troisièmes fonctions de transfert.
- Procédé selon l'une des revendications précédentes, dans lequel ladite troisième fonction de transfert est donnée par :k un indice relatif à un signal de sortie,l ∈ [1; L] un indice relatif à un signal d'entrée parmi lesdits signaux d'entrée,L un nombre de signaux d'entrée,Bnorm k (l) une fonction de transfert normalisée obtenue à partir d'une deuxième fonction de transfert parmi lesdites deuxièmes fonctions de transfert.
- Procédé selon la revendication 6, caractérisé en ce qu'au moins un signal de sortie Ok dudit procédé est donné par :I(l) un signal d'entrée parmi lesdits signaux d'entrée,Ak(l) une première fonction de transfert parmi lesdites premières fonctions de transfert,Wk (l) un poids de pondération parmi lesdits poids de pondération,z -iDD correspond à l'application dudit délai de compensation,
où . est la multiplication, etoù * est l'opérateur de convolution. - Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de décorrélation des signaux d'entrée, préalablement à l'application des troisièmes fonctions de transfert et en ce qu'au moins un signal de sortie Ok dudit procédé est donné par :I(l) un signal d'entrée parmi lesdits signaux d'entrée,Id(l) un signal d'entrée parmi lesdits signaux d'entrée ayant été soumis à ladite étape de décorrélation,Ak (l) une première fonction de transfert parmi lesdites premières fonctions de transfert,W k (l) un poids de pondération parmi lesdits poids de pondération,z -iDD correspond à l'application dudit délai de compensation,où. est la multiplication, etoù * est l'opérateur de convolution.
- Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de détermination d'un gain de compensation d'énergie en fonction des signaux d'entrée et en ce qu'au moins un signal de sortie est donné par :I(l) un signal d'entrée parmi lesdits signaux d'entrée,G(I(1)) ledit gain de compensation d'énergie déterminé,Ak (l) une première fonction de transfert parmi lesdites premières fonctions de transfert,W k(l) un poids de pondération parmi lesdits poids de pondération,z-iDD correspond à l'application dudit délai de compensation,où. est la multiplication, etoù * est l'opérateur de convolution.
- Procédé selon l'une des revendications 6 à 9, caractérisé en ce que ledit poids est donné par :avec k l'indice relatif à un signal de sortie,l ∈ [1; L] l'indice relatif un signal d'entrée parmi lesdits signaux d'entrée,L le nombre de signaux d'entrée,E Bk (l) une énergie relative à une deuxième fonction de transfert parmi lesdites deuxièmes fonctions de transfert.
- Programme informatique comportant des instructions pour la mise en oeuvre du procédé selon l'une des revendications 1 à 10, lorsque ces instructions sont exécutées par un processeur.
- Dispositif de spatialisation sonore, comportant au moins un filtre appliqué à au moins deux signaux d'entrée (I(1), I(2), ..., I(L)), le dispositif étant apte à délivrer au moins deux signaux de sortie (O(1), O(2), ..., O(K)),
le dispositif comprenant des modules de pondération (M4B1, M4B2, ..., M4BL) pour pondérer lesdits au moins deux signaux d'entrée par des poids de pondération respectifs (Wk(1), ..., Wk(L)), chaque poids de pondération étant spécifique à chacun des signaux d'entrée ;
le dispositif étant en outre configuré pour :- pour chaque réponse impulsionnelle incorporant un effet de salle parmi une pluralité de réponses impulsionnelles incorporant un effet de salle, ladite réponse impulsionnelle incorporant un effet de salle étant respectivement associée à un signal d'entrée parmi lesdits au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) et à un signal de sortie parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :∘ partitionner (S22), dans un domaine temporel, ladite réponse impulsionnelle en une première partie (A) et une deuxième partie (B), ledit partitionnement étant effectué tel que :ladite première partie représente des propagations sonores directes et des premières réflexions sonores desdites propagations et s'étend sur un premier nombre d'échantillons ; etladite deuxième partie représente un champ sonore diffus présent après lesdites premières réflexions et s'étend sur un deuxième nombre d'échantillons, ledit deuxième nombre d'échantillons étant un multiple dudit premier nombre d'échantillons ;∘ déterminer une première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) à partir de ladite première partie ;∘ déterminer une deuxième fonction de transfert à partir de ladite deuxième partie le filtre comprenant :- pour chaque signal de sortie (O(1), O(2), ..., O(K)) parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :dans lequel des signaux résultant desdites applications des premières et troisièmes fonctions de transfert sont sommés pour obtenir lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)).∘ déterminer (S23B1) une troisième fonction de transfert (Bmean k) à partir d'une moyenne desdites deuxièmes fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;∘ appliquer (S4A1, S4A2, ..., S4AL) à chaque signal d'entrée des premières fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;∘ appliquer (S4B1) à chaque signal d'entrée la troisième fonction de transfert (Bmean k) correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
dans lequel l'application des premières et troisièmes fonctions de transfert est effectuée par blocs de FFT ; - Module de décodage de signaux sonores, comportant un dispositif de spatialisation selon la revendication 12, desdits signaux sonores en tant que signaux d'entrée.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1357299A FR3009158A1 (fr) | 2013-07-24 | 2013-07-24 | Spatialisation sonore avec effet de salle |
PCT/FR2014/051728 WO2015011359A1 (fr) | 2013-07-24 | 2014-07-04 | Spatialisation sonore avec effet de salle |
Publications (2)
Publication Number | Publication Date |
---|---|
EP3025514A1 EP3025514A1 (fr) | 2016-06-01 |
EP3025514B1 true EP3025514B1 (fr) | 2019-09-11 |
Family
ID=49876752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP14748239.2A Active EP3025514B1 (fr) | 2013-07-24 | 2014-07-04 | Spatialisation sonore avec effet de salle |
Country Status (8)
Country | Link |
---|---|
US (1) | US9848274B2 (fr) |
EP (1) | EP3025514B1 (fr) |
JP (1) | JP6486351B2 (fr) |
KR (2) | KR102206572B1 (fr) |
CN (1) | CN105684465B (fr) |
ES (1) | ES2754245T3 (fr) |
FR (1) | FR3009158A1 (fr) |
WO (1) | WO2015011359A1 (fr) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3001701B1 (fr) * | 2014-09-24 | 2018-11-14 | Harman Becker Automotive Systems GmbH | Systèmes et procédés de reproduction audio |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
JP1640846S (fr) * | 2018-10-16 | 2019-09-09 | ||
CN109584892A (zh) * | 2018-11-29 | 2019-04-05 | 网易(杭州)网络有限公司 | 音效模拟方法、装置、介质及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2851879A1 (fr) | 2003-02-27 | 2004-09-03 | France Telecom | Procede de traitement de donnees sonores compressees, pour spatialisation. |
GB0419346D0 (en) * | 2004-09-01 | 2004-09-29 | Smyth Stephen M F | Method and apparatus for improved headphone virtualisation |
JP2006279588A (ja) | 2005-03-29 | 2006-10-12 | Yamaha Corp | 多地点通信会議用端末 |
KR101370365B1 (ko) * | 2005-09-13 | 2014-03-05 | 코닌클리케 필립스 엔.브이. | 3d 사운드를 발생시키기 위한 방법 및 디바이스 |
JP5587551B2 (ja) * | 2005-09-13 | 2014-09-10 | コーニンクレッカ フィリップス エヌ ヴェ | オーディオ符号化 |
JP2010118978A (ja) * | 2008-11-14 | 2010-05-27 | Victor Co Of Japan Ltd | 音像定位制御装置および音像定位制御方法 |
US9431987B2 (en) * | 2013-06-04 | 2016-08-30 | Sony Interactive Entertainment America Llc | Sound synthesis with fixed partition size convolution of audio signals |
-
2013
- 2013-07-24 FR FR1357299A patent/FR3009158A1/fr not_active Withdrawn
-
2014
- 2014-07-04 JP JP2016528570A patent/JP6486351B2/ja active Active
- 2014-07-04 WO PCT/FR2014/051728 patent/WO2015011359A1/fr active Application Filing
- 2014-07-04 ES ES14748239T patent/ES2754245T3/es active Active
- 2014-07-04 KR KR1020167003222A patent/KR102206572B1/ko active IP Right Grant
- 2014-07-04 US US14/906,311 patent/US9848274B2/en active Active
- 2014-07-04 EP EP14748239.2A patent/EP3025514B1/fr active Active
- 2014-07-04 KR KR1020217001620A patent/KR102310859B1/ko active IP Right Grant
- 2014-07-04 CN CN201480052602.XA patent/CN105684465B/zh active Active
Non-Patent Citations (1)
Title |
---|
None * |
Also Published As
Publication number | Publication date |
---|---|
US9848274B2 (en) | 2017-12-19 |
KR20210008952A (ko) | 2021-01-25 |
JP6486351B2 (ja) | 2019-03-20 |
FR3009158A1 (fr) | 2015-01-30 |
ES2754245T3 (es) | 2020-04-16 |
KR102206572B1 (ko) | 2021-01-22 |
CN105684465B (zh) | 2018-06-12 |
EP3025514A1 (fr) | 2016-06-01 |
KR20160034942A (ko) | 2016-03-30 |
US20160174013A1 (en) | 2016-06-16 |
CN105684465A (zh) | 2016-06-15 |
WO2015011359A1 (fr) | 2015-01-29 |
KR102310859B1 (ko) | 2021-10-12 |
JP2016527815A (ja) | 2016-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1992198B1 (fr) | Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal | |
EP1600042B1 (fr) | Procede de traitement de donnees sonores compressees, pour spatialisation | |
JP5406956B2 (ja) | オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム | |
EP2000002B1 (fr) | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme | |
EP1999998B1 (fr) | Procede de synthese binaurale prenant en compte un effet de salle | |
EP2042001B1 (fr) | Spatialisation binaurale de donnees sonores encodees en compression | |
WO2007031905A1 (fr) | Procede et dispositif servant a generer et a traiter des parametres representant des fonctions hrtf | |
EP3025514B1 (fr) | Spatialisation sonore avec effet de salle | |
US20160247518A1 (en) | Apparatus and method for improving a perception of a sound signal | |
US11979723B2 (en) | Content based spatial remixing | |
US20160212564A1 (en) | Apparatus and Method for Compressing a Set of N Binaural Room Impulse Responses | |
EP2009891B1 (fr) | Transmission de signal audio dans un système de conférence audio immersive | |
EP3400599B1 (fr) | Encodeur ambisonique ameliore d'une source sonore a pluralite de reflexions | |
FR3065137A1 (fr) | Procede de spatialisation sonore | |
EP1994526B1 (fr) | Synthese et spatialisation sonores conjointes | |
EP3058564B1 (fr) | Spatialisation sonore avec effet de salle, optimisee en complexite | |
EP4042418B1 (fr) | Détermination de corrections à appliquer a un signal audio multicanal, codage et décodage associés | |
FR3136072A1 (fr) | Procédé de traitement de signal | |
CN116261086A (zh) | 声音信号处理方法、装置、设备及存储介质 | |
WO2005006811A1 (fr) | Traitement de signal binaural a efficacite amelioree |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20160107 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
AX | Request for extension of the european patent |
Extension state: BA ME |
|
DAX | Request for extension of the european patent (deleted) | ||
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: EXAMINATION IS IN PROGRESS |
|
17Q | First examination report despatched |
Effective date: 20180322 |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: GRANT OF PATENT IS INTENDED |
|
INTG | Intention to grant announced |
Effective date: 20190416 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE PATENT HAS BEEN GRANTED |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
REG | Reference to a national code |
Ref country code: AT Ref legal event code: REF Ref document number: 1180058 Country of ref document: AT Kind code of ref document: T Effective date: 20190915 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R096 Ref document number: 602014053445 Country of ref document: DE Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: FRENCH |
|
REG | Reference to a national code |
Ref country code: NL Ref legal event code: MP Effective date: 20190911 |
|
REG | Reference to a national code |
Ref country code: LT Ref legal event code: MG4D |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BG Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20191211 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: NO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20191211 Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: LT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: HR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: AL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: LV Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20191212 Ref country code: RS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
REG | Reference to a national code |
Ref country code: AT Ref legal event code: MK05 Ref document number: 1180058 Country of ref document: AT Kind code of ref document: T Effective date: 20190911 |
|
REG | Reference to a national code |
Ref country code: ES Ref legal event code: FG2A Ref document number: 2754245 Country of ref document: ES Kind code of ref document: T3 Effective date: 20200416 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200113 Ref country code: PL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: EE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: AT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: RO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200224 Ref country code: CZ Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: SK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: SM Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R097 Ref document number: 602014053445 Country of ref document: DE |
|
RAP2 | Party data changed (patent owner data changed or rights of a patent transferred) |
Owner name: ORANGE |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
PG2D | Information on lapse in contracting state deleted |
Ref country code: IS |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200112 |
|
26N | No opposition filed |
Effective date: 20200615 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MC Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
REG | Reference to a national code |
Ref country code: BE Ref legal event code: MM Effective date: 20200731 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200704 Ref country code: IE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200704 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200731 Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200731 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200731 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: MT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20190911 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20230620 Year of fee payment: 10 Ref country code: FR Payment date: 20230621 Year of fee payment: 10 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20230620 Year of fee payment: 10 Ref country code: ES Payment date: 20230801 Year of fee payment: 10 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20230620 Year of fee payment: 10 |