EP3025514B1 - Spatialisation sonore avec effet de salle - Google Patents

Spatialisation sonore avec effet de salle Download PDF

Info

Publication number
EP3025514B1
EP3025514B1 EP14748239.2A EP14748239A EP3025514B1 EP 3025514 B1 EP3025514 B1 EP 3025514B1 EP 14748239 A EP14748239 A EP 14748239A EP 3025514 B1 EP3025514 B1 EP 3025514B1
Authority
EP
European Patent Office
Prior art keywords
signals
input signals
mean
transfer function
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
EP14748239.2A
Other languages
German (de)
English (en)
Other versions
EP3025514A1 (fr
Inventor
Grégory PALLONE
Marc Emerit
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Publication of EP3025514A1 publication Critical patent/EP3025514A1/fr
Application granted granted Critical
Publication of EP3025514B1 publication Critical patent/EP3025514B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Definitions

  • the energy of the average filter E E mean g / d can be measured directly from the constructed filter B mean g / d .

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Description

  • L'invention est relative au traitement de données sonores, et plus particulièrement à la spatialisation (dite « rendu 3D ») de signaux audio.
  • Une telle opération est par exemple exécutée lors du décodage d'un signal audio 3D codé, représenté sur un certain nombre de canaux, vers un nombre de canaux différents, deux par exemple, pour permettre la restitution des effets 3D audio sur un casque d'écoute.
  • L'invention est également relative à la transmission et à la restitution de signaux audio multicanaux et à leur conversion vers un dispositif de restitution, transducteur, imposé par l'équipement d'un utilisateur. C'est par exemple le cas pour la restitution d'une scène sonore 5.1 par un casque d'écoute audio, ou par une paire de hauts parleurs.
  • L'invention est également relative à la restitution, dans le cadre d'un jeu ou enregistrement vidéo par exemple, d'un ou plusieurs échantillons sonores stockés dans des fichiers, en vue de leur spatialisation.
  • Dans le cas d'une source monophonique statique, la binauralisation est basée sur le filtrage du signal monophonique par la fonction de transfert entre la position désirée de la source et chacune des deux oreilles. Le signal binaural (deux canaux) obtenu peut alors alimenter un casque audio et fournir la sensation à l'auditeur d'une source à la position simulée. Ainsi, le terme « binaural » vise la restitution d'un signal sonore avec des effets de spatialisation.
  • Chacune des fonctions de transfert simulant différentes positions peuvent être mesurées en chambre sourde, aboutissant ainsi à un ensemble de HRTF (pour « Head Related Transfer Functions » ou « Fonctions de Transferts Relatives à la Tête ») dans lesquelles aucun effet de salle n'est présent.
  • Ces fonctions de transfert peuvent également être mesurées dans une salle « classique », aboutissant ainsi à un ensemble de BRIR (pour « Binaural Room Impulse Response » ou « Réponse Impulsionnelle Binaurale de salle») dans lesquelles l'effet de salle, ou réverbération, est présent. L'ensemble des BRIR correspondent donc à un ensemble de fonctions de transfert entre une position donnée et les oreilles d'un auditeur (réel ou tête artificielle) placé dans une salle.
  • La technique habituelle de mesure de BRIR consiste à envoyer successivement dans chacun des haut-parleurs réels, positionnés autour d'une tête (réelle ou artificielle) équipée de microphones dans les oreilles, un signal de test (par exemple un signal sweep, une séquence binaire pseudo-aléatoire ou un bruit blanc). Ce signal de test rend possible, lors d'un traitement hors temps réel, la reconstitution (généralement par déconvolution) de la réponse impulsionnelle entre la position du haut-parleur et chacune des deux oreilles.
  • La différence entre un ensemble de HRTF et de BRIR se situe principalement dans la longueur de la réponse impulsionnelle, de l'ordre de la milliseconde pour les HRTF, à l'ordre de la seconde pour les BRIR.
  • Le filtrage étant basé sur la convolution entre le signal monophonique et la réponse impulsionnelle, la complexité pour effectuer une binauralisation avec des BRIR (contenant un effet de salle) est nettement plus élevée qu'avec des HRTF.
  • Il est possible par cette technique de simuler au casque ou sur un nombre limité de haut-parleurs une écoute d'un contenu multicanal (L canaux) généré par L haut-parleurs dans une salle. En effet, il suffit de considérer chacun des L haut-parleurs comme une source virtuelle positionnée idéalement par rapport à l'auditeur, de mesurer dans la salle à simuler les fonctions de transfert (pour les oreilles gauche et droite) de chacun de ces L haut-parleurs, puis d'appliquer à chacun des L signaux audio (censés alimenter les L haut-parleurs réels) les filtres BRIR correspondant aux haut-parleurs. Les signaux alimentant chacune des oreilles sont sommés pour fournir un signal binaural alimentant un casque audio.
  • On note I(1) (avec 1=[I,L]) le signal d'entrée censé alimenter les L haut-parleurs. On note BRIRg/d(1), les BRIR de chacun des haut-parleurs pour chacune des deux oreilles, et on note Og/d le signal binaural de sortie. La binauralisation du signal multicanal s'écrit donc : O g = l = 1 L I l BRIR g l
    Figure imgb0001
    O d = l = 1 L I l BRIR d l
    Figure imgb0002
  • Où * représente l'opérateur de convolution.
  • Par la suite, l'indice 1 tel que l ∈ [1,L] fait référence à un des L haut-parleurs. On a bien une BRIR pour un signal 1.
  • Ainsi, en référence à la figure 1, deux convolutions (une pour chaque oreille) sont présentes pour chaque haut-parleur (étapes S11 à S1L).
  • Pour L haut-parleurs, la binauralisation nécessite donc 2.L convolutions. On peut calculer la complexité Cconv dans le cas d'une implémentation rapide par bloc. Une implémentation rapide par bloc est par exemple donnée par une transformée de Fourier rapide (FFT pour « Fast Fourier Transform »). Le document « Submission and Evaluation Procedures for 3D Audio » (MPEG 3D Audio) précise une formule possible pour le calcul de Cconv : C conv = L + 2 . nBlocs . 6 . log 2 2 Fs / nBlocs
    Figure imgb0003
  • Dans cette équation, L représente le nombre de FFT pour transformer en fréquence les signaux d'entrée (1 FFT par signal d'entrée), le 2 représente le nombre de FFT inverse pour obtenir le signal binaural temporel (2 FFT inverse pour les deux canaux du binaural), le 6 indique un coefficient de complexité par FFT, le second 2 indique un bourrage de zéros nécessaire pour éviter les problèmes dus à la convolution circulaire, Fs indique la taille de chacune des BRIR, et nBlocs représente le fait d'utiliser un traitement par bloc, plus réaliste dans une approche où la latence ne doit pas être excessivement élevée, et . représente la multiplication.
  • Ainsi pour utilisation typique avec nBlocs=10, Fs=48000, L=22, la complexité par échantillon de signal multicanal pour une convolution directe basée sur une FFT est de Cconv = 19049 multiplications-additions.
  • Cette complexité est trop élevée pour une implémentation réaliste à l'heure actuelle sur des processeurs courants (mobiles par exemple), il est donc nécessaire de diminuer cette complexité sans dégrader fortement le rendu de la binauralisation.
  • Pour que la spatialisation soit de bonne qualité, la totalité du signal temporel des BRIR doit être appliqué.
  • US 2006/045294 A1 divulgue un système de spatialisation sonore de signaux multicanaux pour délivrer au moins deux canaux de sortie, et incluant le partitionnement des réponses impulsionnelles en deux parties, la première contenant l'arrivée directe et les premières réflexions, et la seconde contenant la réverbération, les secondes parties d'au moins deux réponses impulsionnelles étant sommées et pondérées pour une obtenir une fonction de transfert unique représentant la réverbération à appliquer aux signaux d'entrée, afin de réduire la complexité des opérations de convolution. US 2006/045294 A1 divulgue également le filtrage par blocs de FFT.
  • STEWART REBECCA ET AL: "Generating a Spatial Average Reverberation Tail Across Multiple Impulse Responses",CONFERENCE: 35TH INTERNATIONAL CONFERENCE: AUDIO FOR GAMES; FEBRUARY 2009, AES, NEW YORK, USA, 1 février 2009 (2009-02-01) divulgue un partitionnement de réponses impulsionnelles similaire, ainsi que le moyennage des parties de réponses impulsionnelles représentant la réverbération, pour réduire la redondance dans les bases de données de réponses impulsionnelles.
  • GARDNER W G: "EFFICIENT CONVOLUTION WITHOUT INPUT-OUTPUT DELAY",JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY, NEW YORK, NY, US, vol. 43, no. 3, 1 mars 1995 (1995-03-01), pages 127-135 décrit une implémentation efficace pour la convolution de réponses impulsionnelles, notamment dans le contexte des simulations de réverbération, sous forme de blocs FFT. Cet article suggère de réutiliser les transformées des signaux d'entrée dès que possible, pour réduire les coûts de calcul, et montre qu'un partitionnement d'une réponse impulsionnelle en sous-blocs de longueur multiple les uns des autres permet de réduire la complexité de calcul.
  • La présente invention vient améliorer la situation.
  • Elle vise à diminuer fortement la complexité de la binauralisation d'un signal multicanal avec effet de salle tout en conservant au mieux la qualité audio.
  • La présente invention propose à cet effet un procédé de spatialisation sonore tel que défini dans les revendications 1 à 10.
  • L'invention vise aussi un programme informatique comportant des instructions pour la mise en oeuvre du procédé.
  • L'invention peut être mise en oeuvre par un dispositif de spatialisation sonore tel que défini dans la revendication 12.
  • L'invention peut également être mise en oeuvre dans un module de décodage de signaux sonores, en tant que signaux d'entrée, comportant le dispositif de spatialisation ci-dessus.
  • D'autres avantages et caractéristiques de l'invention apparaîtront à la lecture de la description détaillée ci-après d'exemples de réalisation de l'invention et à l'examen des dessins sur lesquels :
    • la figure 1 illustre un procédé de spatialisation de l'art antérieur,
    • la figure 2 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation,
    • la figure 3 représente une réponse impulsionnelle binaurale de salle BRIR,
    • la figure 4 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation,
    • la figure 5 illustre schématiquement les étapes d'un procédé au sens de l'invention, dans un exemple de réalisation,
    • la figure 6 représente schématiquement un dispositif comportant des moyens de mise en oeuvre du procédé au sens de l'invention.
  • On se réfère à la figure 6 pour illustrer tout d'abord un contexte possible de mise en oeuvre de la présente invention dans un dispositif de type terminal connecté TER (par exemple un téléphone, smartphone ou autre, ou encore une tablette connectée, un ordinateur connecté, ou autres). Un tel dispositif TER comporte des moyens de réception (une antenne typiquement) de signaux audio Xc codés en compression, un dispositif de décodage DECOD délivrant des signaux décodés X prêts à être traités par un dispositif de spatialisation avant la restitution des signaux audio (par exemple en binaural sur un casque à oreillettes CAS). Bien entendu, dans certains cas, il peut être avantageux de garder les signaux partiellement décodés (par exemple dans le domaine des sous-bandes) si le traitement de spatialisation est effectué dans le même domaine (traitement fréquentiel dans le domaine des sous-bandes par exemple).
  • En référence encore à la figure 6, le dispositif de spatialisation se présente par une combinaison d'éléments :
    • hardware comportant typiquement un ou plusieurs circuits CIR coopérant avec une mémoire de travail MEM et un processeur PROC,
    • et software, dont les figures 2 et 4 sont des exemples d'organigrammes en illustrant l'algorithme général.
  • Ici, la coopération entre les éléments hardware et software produit un effet technique procurant notamment une économie de complexité de la spatialisation pour sensiblement un même rendu audio (même sensation pour un auditeur), comme on le verra plus loin.
  • On se réfère maintenant à la figure 2 pour décrire un traitement au sens de l'invention, ainsi mis en oeuvre par des moyens informatiques.
  • Dans une première étape S21, une préparation des données est effectuée. Cette préparation est optionnelle, les signaux peuvent être traités selon les étapes S22 et suivantes sans ce pré-traitement.
  • En particulier, cette préparation consiste à effectuer une troncature de chaque BRIR pour ignorer les échantillons inaudibles au début et à la fin de la réponse impulsionnelle.
  • Cette préparation, pour la troncature en début de réponse impulsionnelle TRONC S, à l'étape S211, consiste à déterminer un instant de début d'ondes sonores directes et peut-être mis en oeuvre par les étapes suivantes :
    • Une somme cumulée des énergies de chacun des filtres BRIR(1) est calculée. Typiquement, cette énergie est calculée par une somme au carré des amplitudes des échantillons 1 à j, avec j compris dans [1 ; J] avec J le nombre d'échantillon d'un filtre BRIR.
    • La valeur d'énergie du filtre d'énergie maximum valMax (parmi les filtres relatifs à l'oreille gauche et à l'oreille droite) est calculée.
    • Pour chacun des haut-parleurs 1, on calcule l'indice pour lequel l'énergie de chacun des filtres BRIR(1) dépasse un certain seuil en dB calculé par rapport à valMax (e.g. valMax-50dB).
    • L'indice de troncature iT retenu pour toutes les BRIR est l'indice minimum parmi tous les indices des BRIR et il est considéré comme l'instant de début d'ondes sonores directes.
  • L'indice iT obtenu correspond donc au nombre d'échantillons à ignorer pour chacune des BRIR. Une troncature brutale en début de réponse impulsionnelle avec une fenêtre rectangulaire peut mener à des artefacts audibles si elle est appliquée dans une partie trop énergétique. Il peut donc être préférable d'appliquer une fenêtre de fondu d'entrée adaptée, cependant si des précautions ont été prises dans le seuil choisi, ce fenêtrage devient inutile, car inaudible (on coupe juste du signal inaudible).
  • Le synchronisme entre BRIR rend possible l'application d'un délai constant pour toutes les BRIR dans un souci de simplicité d'implémentation, même si une optimisation de complexité est possible.
  • La troncature de chaque BRIR pour ignorer les échantillons inaudibles à la fin de la réponse impulsionnelle TRONC E, à l'étape S212, peut être réalisée à partir d'étape similaires à celles décrites ci-avant, adaptées pour convenir à la fin de la réponse impulsionnelle. Une troncature brutale en fin de réponse impulsionnelle avec une fenêtre rectangulaire peut mener à des artefacts audibles sur des signaux impulsionnels où la queue de réverbération peut se révéler audible. Ainsi, dans un mode de réalisation, on applique une fenêtre de fondu de sortie adaptée.
  • A l'étape 22, une isolation en synchronisme ISOL A/B est effectuée. Cette isolation en synchronisme consiste à séparer, pour chaque BRIR, la partie « son direct » et « premières réflexions » (ou Direct, noté A) et de la partie « son diffus » (ou Diffus, noté B). En effet, le traitement à effectuer sur la partie « son diffus » peut avantageusement être différent de celui à effectuer sur la partie « son direct » dans la mesure où il est préférable d'avoir une meilleure qualité de traitement sur la partie « son direct » que sur la partie « son diffus ». Ceci rend possible une optimisation du rapport qualité/complexité.
  • En particulier, pour réaliser l'isolation en synchronisme, on détermine un index « iDD » d'échantillon unique et commun à toutes les BRIR (d'où le terme « synchronisme ») à partir duquel on considère que le reste de la réponse impulsionnelle correspond à un champ diffus. On partitionne donc les réponses impulsionnelles BRIR(1) en deux : A(l) et B(l), où la concaténation des deux correspond à BRIR(1).
  • La figure 3 montre l'index de partitionnement iDD à l'échantillon 2000. La partie à gauche de cet indice iDD correspond à la partie A. La partie à droite de cet indice iDD correspond à la partie B.
  • Dans un mode de réalisation, ces deux parties sont isolées, sans fenêtrage, afin de subir des traitements différents. Dans une variante, un fenêtrage entre les parties A(1) et B(1) est appliqué.
  • L'indice iDD peut-être spécifique à la salle pour laquelle les BRIR ont été déterminés. Le calcul de cet indice peut donc dépendre de l'enveloppe spectrale, de la corrélation des BRIR ou encore de l'échogramme de ces BRIR. Par exemple, iDD peut être déterminé par une formule du type iDD = V salls
    Figure imgb0004
    avec Vsalle le volume de la salle de mesure.
  • Dans un mode de réalisation, iDD est une valeur fixe, typiquement 2000. Dans une variante, iDD varie, avantageusement de manière dynamique, en fonction de l'environnement à partir duquel les signaux d'entrée sont capturés.
  • Le signal de sortie pour les oreilles gauche (g) et droite (d), représenté par O g/d , s'écrit donc : O g / d = l = 1 L I l BRIR g / d l = O A g / d + z iDD , O B g / d = l = 1 L I l A g / d l + z iDD . i = 1 L I l B g / d l
    Figure imgb0005
    z -iDD correspond au délai de iDD échantillons.
  • L'application de ce délai aux signaux est effectuée en stockant les valeurs calculées pour l = 1 L I l B g / d l
    Figure imgb0006
    dans une mémoire temporaire (par exemple dans un buffer) et en les restituant au moment voulu.
  • Dans un mode de réalisation, les index d'échantillons choisis pour A et B peuvent également tenir compte des longueurs de trames dans le cas d'intégration dans un codeur audio. En effet, des tailles typiques de trames de 1024 échantillons peut mener à un choix tel que A fasse 1024 et B fasse 2048, en s'assurant que B est bien une zone de champ diffus pour toutes les BRIR.
  • En particulier, il peut être intéressant que la taille de B soit un multiple de la taille de A car si le filtrage est implémenté par blocs de FFT, alors le calcul d'une FFT pour A peut être réutilisé pour B.
  • Un champ diffus se caractérise par le fait qu'il est statistiquement identique en tous les points de la salle. Ainsi, sa réponse en fréquence varie peu en fonction du haut-parleur à simuler. La présente invention exploite cette caractéristique dans le but de remplacer tous les filtres Diffus D(l) de toutes les BRIR par un seul et unique filtre « moyen » Bmean afin de diminuer fortement la complexité due aux convolutions multiples. Pour cela, on peut modifier la partie champ diffus B à l'étape S23B, toujours en référence à la figure 2.
  • A l'étape S23B1, on calcule la valeur du filtre moyen Bmean. D'abord, il est extrêmement rare que le système complet soit calibré idéalement, on peut donc appliquer un gain de pondération qui sera reporté dans le signal d'entrée afin d'effectuer une unique convolution par oreille pour la partie champs diffus. On décompose donc les BRIR en des filtres normalisés en énergie, et on reporte le gain de normalisation E B g / d l
    Figure imgb0007
    dans le signal d'entrée : O B g / d = l = 1 L I l B g / d l = l = 1 L I l E B g / d l . B norm g / d l = l = 1 L E B g / d l . I l B norm g / d l
    Figure imgb0008
    avec B norm g / d l = B g / d l E B g / d l
    Figure imgb0009
    E Bg / d (l) représente l'énergie de B g/d (l).
  • Ensuite, on approxime Bnorm g/d (l) par un seul et unique filtre moyen Bmean g/d qui n'est plus fonction du haut-parleur 1, mais qu'il est possible de normaliser également en énergie : O B g / d O ^ B g / d = l = 1 L E B g / d l . I l B mean g / d E B mean g / d
    Figure imgb0010
    avec B mean g / d = 1 L l = 1 L B norm g / d l
    Figure imgb0011
  • Dans un mode de réalisation, ce filtre moyen peut être obtenu par moyennage des échantillons temporels. Dans une variante, il peut être obtenu par tout autre type de moyennage comme par exemple un moyennage des densités spectrales de puissance.
  • Dans un mode de réalisation, l'énergie du filtre moyen EEmean g/d peut être mesurée directement à partir du filtre construit Bmean g/d . Dans une variante, il peut également être estimé en prenant en compte l'hypothèse que les filtres Bnorm g/d (l) sont décorrélés. En effet, dans ce cas, comme on somme des signaux d'énergie unitaire, on a : E B mean g / d = 1 L l = 1 L B norm g / d l 2 = 1 L 2 . L . E B norm g / d = 1 L
    Figure imgb0012
  • L'énergie peut être calculée sur l'ensemble des échantillons correspondants à la partie champ diffus.
  • A l'étape S23B2, on calcule la valeur du facteur de pondération W g/d (l). Un seul facteur de pondération à appliquer au signal d'entrée est calculé, prenant en compte les normalisations des filtres Diffus et du filtre moyen: O ^ B g / d = l = 1 L E B g / d l E B mean g / d . I l B mean g / d = l = 1 L 1 W g / d l . I l . B mean g / d
    Figure imgb0013
    Avec W g / d l = E B mean g / d E B g / d l
    Figure imgb0014
  • Le filtre moyen étant constant, il peut sortir de la somme : O ^ B g / d = l = 1 L 1 W g / d l . I l B mean g / d
    Figure imgb0015
  • Ainsi, les L convolutions avec la partie champ diffus sont remplacées par une seule convolution avec un filtre moyen, moyennant une somme pondérée du signal d'entrée.
  • A l'étape S23B3, on peut optionnellement calculer un gain G corrigeant le gain du filtre moyen Bmean g/d . En effet, dans le cas de la convolution entre les signaux d'entrée et les filtres non approximés, quelles que soient les valeurs de corrélation entre les signaux d'entrée, le filtrage par des filtres décorrélés que sont les B g/d (l) mène à des signaux à sommer qui sont alors eux aussi décorrélés. A l'inverse, dans le cas de la convolution entre les signaux d'entrée et le filtre moyen approximé, l'énergie du signal issu de la sommation des signaux filtrés va dépendre de la valeur de corrélation existant entre les signaux d'entrée.
  • Par exemple,
    * si tous les signaux d'entrée I(1) sont identiques et d'énergie unitaire, et que les filtres B(l) sont tous décorrélés (puisque champs diffus) et d'énergie unitaire, on a : E O B g / d = energie l = 1 L I l B norm g / d l = L
    Figure imgb0016
    * si tous les signaux d'entrée I(1) sont décorrélés et d'énergie unitaire, et que les filtres B(l) sont tous d'énergie unitaire, mais remplacés par des filtres identiques B mean g / d E B mean g / d ,
    Figure imgb0017
    on a: E O ^ B g / d = energie l = 1 L I l B mean g / d E B mean g / d = energie 1 E B mean g / d . l = 1 L I l B mean g / d = 1 E B mean g / d 2 . L . 1 L = L
    Figure imgb0018
  • Car les énergies des signaux décorrélés s'ajoutent.
  • Ce cas est équivalent au précédent dans le sens où les signaux issus du filtrage sont tous décorrélés, grâce aux signaux d'entrée dans le premier cas, et grâce aux filtres dans le second cas.
    * si tous les signaux d'entrée I(1) sont identiques et d'énergie unitaire, et que les filtres B(l) sont tous d'énergie unitaire, mais remplacés par des filtres identiques B mean g / d E B mean g / d ,
    Figure imgb0019
    on a: E O ^ B g / d = energie l = 1 L I l B mean g / d E B mean g / d = energie 1 E B mean g / d . l = 1 L I l B mean g / d = 1 E B mean g / d 2 . L 2 . 1 L = L 2
    Figure imgb0020
  • Car les énergies des signaux identiques s'ajoutent en quadrature (car leurs amplitudes s'ajoutent).
  • Ainsi,
    • si deux haut-parleurs sont actifs simultanément, alimentés par des signaux décorrélés, alors aucun gain n'est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
    • si deux haut-parleurs sont actifs simultanément, alimentés par des signaux identiques, alors un gain de 10. log10(L 2/L) =10.log 10(22/2) = 3.01dB est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
    • si trois haut-parleurs sont actifs simultanément, alimentés par des signaux identiques, alors un gain de 10.log 10(L 2/L) = 10.log 10(32/3) = 4.77dB est apporté en appliquant les étapes S23B1 et S23B2 par rapport à la méthode classique.
  • Les cas évoqués ci-avant correspondent aux cas extrêmes de signaux identiques ou décorrélés. Ces cas sont toutefois réalistes : une source positionnée au milieu de deux haut-parleurs, virtuels ou réels, fournira un signal identique à ces deux haut-parleurs (par exemple avec une technique de type VBAP, pour « Vector base amplitude panning »). Dans le cas d'un positionnement dans un système 3D, les 3 haut-parleurs peuvent recevoir le même signal au même niveau.
  • Ainsi, on peut appliquer une compensation afin de respecter l'énergie des signaux binauralisés.
  • Idéalement, ce gain de compensation G sera déterminé en fonction du signal d'entrée (soit G(I(1))) et sera appliqué à la somme des signaux d'entrée pondérés : O ^ B g / d = G . l = 1 L 1 W g / d l . I l B mean g / d
    Figure imgb0021
  • Le gain G(I(l)) peut être estimé par un calcul de corrélation entre chacun des signaux. Il peut également être estimé en comparant les énergies des signaux avant et après sommations. Dans ce cas, le gain G peut varier dynamiquement au cours du temps, en fonction par exemple des corrélations entre les signaux d'entrée, qui varient eux-mêmes au cours du temps.
  • Dans un mode de réalisation simplifié, il est possible de fixer un gain constant, par exemple G = -3dB = 10-3/20, ce qui évitera d'avoir à effectuer une estimation de corrélation qui peut être coûteuse. Le gain constant G peut alors être appliqué hors ligne aux facteurs de pondération (donnant ainsi G W g / d l
    Figure imgb0022
    ), ou au filtre Bmean g/d , ce qui évitera l'application d'un gain supplémentaire au vol.
  • Une fois les fonctions de transfert A et B isolées et les filtres Bmean g/d (optionnellement les poids W g/d (l) et G) calculés, on applique ces fonctions de transfert et ces filtres aux signaux d'entrée.
  • Dans un premier mode de réalisation, décrit en référence à la figure 4, le traitement du signal multicanal par application des filtres Direct (A) et Diffus (B) pour chacune des oreilles est effectué de la manière suivante :
    • On applique (étapes S4A1 à S4AL) au signal multicanal d'entrée un filtrage efficace (par exemple convolution directe basée-FFT) par les filtres Direct (A), comme décrit dans l'état de l'art. On obtient un signal O ^ A g / d
      Figure imgb0023
    • En fonction des relations entre les signaux d'entrée, notamment en fonction de leur corrélation, on peut optionnellement corriger à l'étape S4B11 le gain du filtre moyen Bmean g/d par application du gain G aux signaux de sortie après sommation des signaux d'entrée préalablement pondérés (étapes M4B1 à M4BL).
    • On applique au signal multicanal B à l'étape S4B1 un filtrage efficace par le filtre Diffus moyen Bmean. Cette étape a bien lieu après sommation des signaux d'entrée préalablement pondérés (étapes M4B1 à M4BL). On obtient le signal O ^ B g / d .
      Figure imgb0024
    • On applique au signal O ^ B g / d
      Figure imgb0025
      un délai iDD afin de compenser le retard introduit lors de l'étape d'isolation du signal B à l'étape S4B2.
    • Les signaux O ^ A g / d
      Figure imgb0026
      et O ^ B g / d
      Figure imgb0027
      sont sommés.
    • Si une troncature éliminant les échantillons inaudibles au début des réponses impulsionnelles a été réalisée, alors on applique à l'étape S41 au signal d'entrée un délai iT correspondant aux échantillons inaudibles supprimés.
  • Dans une variante, en référence à la figure 5, les signaux ne sont pas seulement calculés pour les oreilles gauches et droites (indices g et d ci-avant) mais pour k dispositifs de restitution (typiquement des haut-parleurs).
  • Dans un second mode de réalisation, on applique le gain G préalablement à la sommation des signaux d'entrée, c'est-à-dire pendant les étapes de pondération (étapes M4B1 à M4BL).
  • Dans un troisième mode de réalisation, on applique une décorrélation aux signaux d'entrée. Ainsi, les signaux sont décorrélés après convolution par le filtre Bmean quelles que soient les corrélations d'origine entre signaux d'entrée. On peut utiliser une implémentation efficace de décorrélation (par exemple en utilisant un réseau de retards bouclés) afin d'éviter l'utilisation de filtres de décorrélation couteux.
  • Ainsi, en supposant de manière réaliste que des BRIR de longueur 48000 échantillons peuvent être :
    • tronquées entre l'échantillon 150 et l'échantillon 3222 par la technique décrite à l'étape S21,
    • décomposées en deux parties : champ direct A de 1024 échantillons, et champ diffus B de 2048 échantillons, par la technique décrite à l'étape S22,
    alors la complexité de binauralisation peut être approximativement donnée par : C inv = C invA + C invB = L + 2 . 6 . log 2 2 . NA + L + 2 . 6 . log 2 2 . NB
    Figure imgb0028
    Avec NA et NB les tailles en échantillons de A et B
  • Ainsi pour nBlocs=10, Fs=48000, L=22, NA=1024 et NB=2048, la complexité par échantillon de signal multicanal pour une convolution basée-FFT est de Cconv = 3312 multiplications-additions. Ce résultat est cependant logiquement à comparer à une solution simple implémentant seulement la troncature, soit pour nBlocs=10, Fs=3072, L=22 : C tronc = L + 2 . nBlocs . 6 . log 2 2 . Fs / nBlocs = 13339
    Figure imgb0029
  • Il existe donc un facteur 19049/3312=5.75 de complexité entre l'état de l'art et la présente invention, et encore un facteur 13339/3312=4 de complexité entre l'état de l'art bénéficiant de la troncature et la présente invention.
  • Si la taille de B est un multiple de la taille de A, alors si le filtrage est implémenté par blocs de FFT, le calcul d'une FFT pour A peut être réutilisé pour B. On a donc besoin de L FFT sur NA points, qui serviront à la fois au filtrage par A et par B, deux FFT inverse sur NA points pour obtenir le signal binaural temporel, et la multiplication des spectres en fréquence.
  • Dans ce cas, la complexité peut être approximée (les additions sont négligées, (L+1) correspond à la multiplication des spectres, L pour A et 1 pour B) par : C inv 2 = L + 2 . 6 . log 2 2 . NA + L + 1 = 1607
    Figure imgb0030
  • Avec cette approche, on gagne encore un facteur 2, et donc un facteur 12 et 8 par rapport à l'état de l'art non tronquée et tronquée.
  • L'invention peut trouver une application directe dans la norme MPEG-H 3D Audio.
  • Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci-avant ; elle s'étend à d'autres variantes tout en restant dans l'étendue de la protection définie dans les revendications annexées.
  • Ainsi par exemple, on a décrit ci-avant un mode de réalisation dans lequel le signal Direct A n'est pas approximé par un filtre moyen. Bien entendu, on peut utiliser filtre moyen de A pour faire les convolutions (étapes S4A1 à S4AL) avec les signaux issus des haut-parleurs.
  • On a décrit ci-avant un mode de réalisation basé sur le traitement d'un contenu multicanal généré pour L haut-parleurs. Bien sûr, le contenu multicanal peut-être généré par tout type de source audio comme par exemple la voix, un instrument de musique, un bruit quelconque, etc.
  • On a décrit ci-avant un mode de réalisation basé sur des valeurs de BRIR déterminées dans une salle. Bien sûr, on peut mettre en oeuvre la présente invention pour tout type d'environnement extérieur (par exemple salle de concert, plein air, etc.).
  • On a décrit ci-avant un mode de réalisation basé sur l'application de deux fonctions de transfert. Bien sûr, on peut mettre en oeuvre la présente invention avec plus de deux fonctions de transfert. Par exemple, on peut isoler en synchronisme une partie relative aux sons émis directement, une partie relative aux premières réflexions et une partie relative aux sons diffus.

Claims (13)

  1. Procédé de spatialisation sonore dans lequel on applique au moins un filtrage à au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) pour délivrer au moins deux signaux de sortie (O(1), O(2), ..., O(K)), le filtrage comportant:
    - pondérer (M4B1, M4B2, ..., M4BL) lesdits au moins deux signaux d'entrée par des poids de pondération (Wk(1), ..., Wk(L)) respectifs, chaque poids de pondération étant spécifique à chacun des signaux d'entrée ;
    - pour chaque réponse impulsionnelle incorporant un effet de salle parmi une pluralité de réponses impulsionnelles incorporant un effet de salle, ladite réponse impulsionnelle incorporant un effet de salle étant respectivement associée à un signal d'entrée parmi lesdits au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) et à un signal de sortie parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :
    ∘ partitionner (S22), dans un domaine temporel, ladite réponse impulsionnelle en une première partie (A) et une deuxième partie (B), ledit partitionnement étant effectué tel que :
    ladite première partie représente des propagations sonores directes et des premières réflexions sonores desdites propagations et s'étend sur un premier nombre d'échantillons ; et
    ladite deuxième partie représente un champ sonore diffus présent après lesdites premières réflexions et s'étend sur un deuxième nombre d'échantillons, ledit deuxième nombre d'échantillons étant un multiple dudit premier nombre d'échantillons ;
    ∘ déterminer une première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) à partir de ladite première partie ;
    ∘ déterminer une deuxième fonction de transfert à partir de ladite deuxième partie ;
    - pour chaque signal de sortie (O(1), O(2), ..., O(K)) parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :
    ∘ déterminer (S23B1) une troisième fonction de transfert (Bmean k) à partir d'une moyenne desdites deuxièmes fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
    ∘ appliquer (S4A1, S4A2, ..., S4AL) à chaque signal d'entrée (I(1), I(2), ..., I(L)) la première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) correspondant au signal d'entrée (I(1), I(2), ..., I(L)) et au signal de sortie (O(1), O(2), ..., O(K)) ;
    ∘ appliquer (S4B1) à chaque signal d'entrée la troisième fonction de transfert (Bmean k) correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
    dans lequel l'application des premières et troisièmes fonctions de transfert est effectuée par blocs de FFT ;
    - sommer des signaux résultant desdites applications des premières et troisièmes fonctions de transfert pour obtenir lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)).
  2. Procédé selon la revendication 1, caractérisé en ce qu'un gain de compensation d'énergie (G) est appliqué (S4B11) aux poids de pondération (Wk(1), ..., Wk(L)).
  3. Procédé selon l'une des revendications précédentes, caractérisé en ce que ledit partitionnement de ladite réponse impulsionnelle comporte les opérations:
    - de détermination (S211) d'un instant de début de présence d'ondes sonores directes,
    - de détermination d'un instant de début de présence dudit champ sonore diffus après les premières réflexions, et
    - de sélection (S22), dans ladite réponse impulsionnelle, d'une partie de la réponse qui s'étend temporellement entre ledit instant de début de présence d'ondes sonores directes jusqu'audit instant de début de présence de champ diffus, ladite partie de réponse sélectionnée correspondant à ladite première fonction de transfert.
  4. Procédé selon la revendication 3, caractérisé en ce que ledit filtrage comporte l'application d'au moins un délai de compensation (S4B2) correspondant à un écart temporel entre ledit instant de début d'ondes sonores directes et ledit instant de début de présence de champ diffus.
  5. Procédé selon la revendication 4, caractérisé en ce que lesdites première et troisième fonctions de transfert sont appliquées parallèlement auxdits signaux d'entrée et en ce que ledit au moins un délai de compensation est appliqué aux signaux d'entrée filtrés par lesdites troisièmes fonctions de transfert.
  6. Procédé selon l'une des revendications précédentes, dans lequel ladite troisième fonction de transfert est donnée par : B mean k = 1 L l = 1 L B norm k l
    Figure imgb0031
    avec :
    k un indice relatif à un signal de sortie,
    l ∈ [1; L] un indice relatif à un signal d'entrée parmi lesdits signaux d'entrée,
    L un nombre de signaux d'entrée,
    Bnorm k (l) une fonction de transfert normalisée obtenue à partir d'une deuxième fonction de transfert parmi lesdites deuxièmes fonctions de transfert.
  7. Procédé selon la revendication 6, caractérisé en ce qu'au moins un signal de sortie Ok dudit procédé est donné par : O k = l = 1 L I l A k l + z iDD l = 1 L 1 W k l . I l B mean k
    Figure imgb0032
    avec :
    I(l) un signal d'entrée parmi lesdits signaux d'entrée,
    Ak(l) une première fonction de transfert parmi lesdites premières fonctions de transfert,
    Wk (l) un poids de pondération parmi lesdits poids de pondération,
    z -iDD correspond à l'application dudit délai de compensation,
    où . est la multiplication, et
    où * est l'opérateur de convolution.
  8. Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de décorrélation des signaux d'entrée, préalablement à l'application des troisièmes fonctions de transfert et en ce qu'au moins un signal de sortie Ok dudit procédé est donné par : O k = l = 1 L I l A k l + z iDD l = 1 L 1 W k l . I d l B mean k
    Figure imgb0033
    avec :
    I(l) un signal d'entrée parmi lesdits signaux d'entrée,
    Id(l) un signal d'entrée parmi lesdits signaux d'entrée ayant été soumis à ladite étape de décorrélation,
    Ak (l) une première fonction de transfert parmi lesdites premières fonctions de transfert,
    W k (l) un poids de pondération parmi lesdits poids de pondération,
    z -iDD correspond à l'application dudit délai de compensation,
    où. est la multiplication, et
    où * est l'opérateur de convolution.
  9. Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de détermination d'un gain de compensation d'énergie en fonction des signaux d'entrée et en ce qu'au moins un signal de sortie est donné par : O k = l = 1 L I l A k l + z iDD l = 1 L G I l . 1 W k l . I l B mean k
    Figure imgb0034
    avec :
    I(l) un signal d'entrée parmi lesdits signaux d'entrée,
    G(I(1)) ledit gain de compensation d'énergie déterminé,
    Ak (l) une première fonction de transfert parmi lesdites premières fonctions de transfert,
    W k(l) un poids de pondération parmi lesdits poids de pondération,
    z-iDD correspond à l'application dudit délai de compensation,
    où. est la multiplication, et
    où * est l'opérateur de convolution.
  10. Procédé selon l'une des revendications 6 à 9, caractérisé en ce que ledit poids est donné par : W k l = E B mean k E B k l
    Figure imgb0035
    avec k l'indice relatif à un signal de sortie,
    l ∈ [1; L] l'indice relatif un signal d'entrée parmi lesdits signaux d'entrée,
    L le nombre de signaux d'entrée,
    avec EBmeank une énergie relative à B mean k ,
    Figure imgb0036
    E Bk (l) une énergie relative à une deuxième fonction de transfert parmi lesdites deuxièmes fonctions de transfert.
  11. Programme informatique comportant des instructions pour la mise en oeuvre du procédé selon l'une des revendications 1 à 10, lorsque ces instructions sont exécutées par un processeur.
  12. Dispositif de spatialisation sonore, comportant au moins un filtre appliqué à au moins deux signaux d'entrée (I(1), I(2), ..., I(L)), le dispositif étant apte à délivrer au moins deux signaux de sortie (O(1), O(2), ..., O(K)),
    le dispositif comprenant des modules de pondération (M4B1, M4B2, ..., M4BL) pour pondérer lesdits au moins deux signaux d'entrée par des poids de pondération respectifs (Wk(1), ..., Wk(L)), chaque poids de pondération étant spécifique à chacun des signaux d'entrée ;
    le dispositif étant en outre configuré pour :
    - pour chaque réponse impulsionnelle incorporant un effet de salle parmi une pluralité de réponses impulsionnelles incorporant un effet de salle, ladite réponse impulsionnelle incorporant un effet de salle étant respectivement associée à un signal d'entrée parmi lesdits au moins deux signaux d'entrée (I(1), I(2), ..., I(L)) et à un signal de sortie parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :
    ∘ partitionner (S22), dans un domaine temporel, ladite réponse impulsionnelle en une première partie (A) et une deuxième partie (B), ledit partitionnement étant effectué tel que :
    ladite première partie représente des propagations sonores directes et des premières réflexions sonores desdites propagations et s'étend sur un premier nombre d'échantillons ; et
    ladite deuxième partie représente un champ sonore diffus présent après lesdites premières réflexions et s'étend sur un deuxième nombre d'échantillons, ledit deuxième nombre d'échantillons étant un multiple dudit premier nombre d'échantillons ;
    ∘ déterminer une première fonction de transfert (Ak(1), Ak(2), ..., Ak(L)) à partir de ladite première partie ;
    ∘ déterminer une deuxième fonction de transfert à partir de ladite deuxième partie le filtre comprenant :
    - pour chaque signal de sortie (O(1), O(2), ..., O(K)) parmi lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)) :
    ∘ déterminer (S23B1) une troisième fonction de transfert (Bmean k) à partir d'une moyenne desdites deuxièmes fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
    ∘ appliquer (S4A1, S4A2, ..., S4AL) à chaque signal d'entrée des premières fonctions de transfert correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
    ∘ appliquer (S4B1) à chaque signal d'entrée la troisième fonction de transfert (Bmean k) correspondant au signal de sortie (O(1), O(2), ..., O(K)) ;
    dans lequel l'application des premières et troisièmes fonctions de transfert est effectuée par blocs de FFT ;
    dans lequel des signaux résultant desdites applications des premières et troisièmes fonctions de transfert sont sommés pour obtenir lesdits au moins deux signaux de sortie (O(1), O(2), ..., O(K)).
  13. Module de décodage de signaux sonores, comportant un dispositif de spatialisation selon la revendication 12, desdits signaux sonores en tant que signaux d'entrée.
EP14748239.2A 2013-07-24 2014-07-04 Spatialisation sonore avec effet de salle Active EP3025514B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1357299A FR3009158A1 (fr) 2013-07-24 2013-07-24 Spatialisation sonore avec effet de salle
PCT/FR2014/051728 WO2015011359A1 (fr) 2013-07-24 2014-07-04 Spatialisation sonore avec effet de salle

Publications (2)

Publication Number Publication Date
EP3025514A1 EP3025514A1 (fr) 2016-06-01
EP3025514B1 true EP3025514B1 (fr) 2019-09-11

Family

ID=49876752

Family Applications (1)

Application Number Title Priority Date Filing Date
EP14748239.2A Active EP3025514B1 (fr) 2013-07-24 2014-07-04 Spatialisation sonore avec effet de salle

Country Status (8)

Country Link
US (1) US9848274B2 (fr)
EP (1) EP3025514B1 (fr)
JP (1) JP6486351B2 (fr)
KR (2) KR102206572B1 (fr)
CN (1) CN105684465B (fr)
ES (1) ES2754245T3 (fr)
FR (1) FR3009158A1 (fr)
WO (1) WO2015011359A1 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3001701B1 (fr) * 2014-09-24 2018-11-14 Harman Becker Automotive Systems GmbH Systèmes et procédés de reproduction audio
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
JP1640846S (fr) * 2018-10-16 2019-09-09
CN109584892A (zh) * 2018-11-29 2019-04-05 网易(杭州)网络有限公司 音效模拟方法、装置、介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2851879A1 (fr) 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
GB0419346D0 (en) * 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
JP2006279588A (ja) 2005-03-29 2006-10-12 Yamaha Corp 多地点通信会議用端末
KR101370365B1 (ko) * 2005-09-13 2014-03-05 코닌클리케 필립스 엔.브이. 3d 사운드를 발생시키기 위한 방법 및 디바이스
JP5587551B2 (ja) * 2005-09-13 2014-09-10 コーニンクレッカ フィリップス エヌ ヴェ オーディオ符号化
JP2010118978A (ja) * 2008-11-14 2010-05-27 Victor Co Of Japan Ltd 音像定位制御装置および音像定位制御方法
US9431987B2 (en) * 2013-06-04 2016-08-30 Sony Interactive Entertainment America Llc Sound synthesis with fixed partition size convolution of audio signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None *

Also Published As

Publication number Publication date
US9848274B2 (en) 2017-12-19
KR20210008952A (ko) 2021-01-25
JP6486351B2 (ja) 2019-03-20
FR3009158A1 (fr) 2015-01-30
ES2754245T3 (es) 2020-04-16
KR102206572B1 (ko) 2021-01-22
CN105684465B (zh) 2018-06-12
EP3025514A1 (fr) 2016-06-01
KR20160034942A (ko) 2016-03-30
US20160174013A1 (en) 2016-06-16
CN105684465A (zh) 2016-06-15
WO2015011359A1 (fr) 2015-01-29
KR102310859B1 (ko) 2021-10-12
JP2016527815A (ja) 2016-09-08

Similar Documents

Publication Publication Date Title
EP1992198B1 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP1600042B1 (fr) Procede de traitement de donnees sonores compressees, pour spatialisation
JP5406956B2 (ja) オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム
EP2000002B1 (fr) Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme
EP1999998B1 (fr) Procede de synthese binaurale prenant en compte un effet de salle
EP2042001B1 (fr) Spatialisation binaurale de donnees sonores encodees en compression
WO2007031905A1 (fr) Procede et dispositif servant a generer et a traiter des parametres representant des fonctions hrtf
EP3025514B1 (fr) Spatialisation sonore avec effet de salle
US20160247518A1 (en) Apparatus and method for improving a perception of a sound signal
US11979723B2 (en) Content based spatial remixing
US20160212564A1 (en) Apparatus and Method for Compressing a Set of N Binaural Room Impulse Responses
EP2009891B1 (fr) Transmission de signal audio dans un système de conférence audio immersive
EP3400599B1 (fr) Encodeur ambisonique ameliore d'une source sonore a pluralite de reflexions
FR3065137A1 (fr) Procede de spatialisation sonore
EP1994526B1 (fr) Synthese et spatialisation sonores conjointes
EP3058564B1 (fr) Spatialisation sonore avec effet de salle, optimisee en complexite
EP4042418B1 (fr) Détermination de corrections à appliquer a un signal audio multicanal, codage et décodage associés
FR3136072A1 (fr) Procédé de traitement de signal
CN116261086A (zh) 声音信号处理方法、装置、设备及存储介质
WO2005006811A1 (fr) Traitement de signal binaural a efficacite amelioree

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20160107

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20180322

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: GRANT OF PATENT IS INTENDED

INTG Intention to grant announced

Effective date: 20190416

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE PATENT HAS BEEN GRANTED

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 1180058

Country of ref document: AT

Kind code of ref document: T

Effective date: 20190915

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602014053445

Country of ref document: DE

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: NL

Ref legal event code: MP

Effective date: 20190911

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20191211

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20191211

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20191212

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 1180058

Country of ref document: AT

Kind code of ref document: T

Effective date: 20190911

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2754245

Country of ref document: ES

Kind code of ref document: T3

Effective date: 20200416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200113

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200224

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602014053445

Country of ref document: DE

RAP2 Party data changed (patent owner data changed or rights of a patent transferred)

Owner name: ORANGE

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG2D Information on lapse in contracting state deleted

Ref country code: IS

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200112

26N No opposition filed

Effective date: 20200615

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20200731

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200704

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200704

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200731

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200731

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200731

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190911

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20230620

Year of fee payment: 10

Ref country code: FR

Payment date: 20230621

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20230620

Year of fee payment: 10

Ref country code: ES

Payment date: 20230801

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20230620

Year of fee payment: 10