EP3449643B1 - Procédé et système de diffusion d'un signal audio à 360° - Google Patents

Procédé et système de diffusion d'un signal audio à 360° Download PDF

Info

Publication number
EP3449643B1
EP3449643B1 EP17725294.7A EP17725294A EP3449643B1 EP 3449643 B1 EP3449643 B1 EP 3449643B1 EP 17725294 A EP17725294 A EP 17725294A EP 3449643 B1 EP3449643 B1 EP 3449643B1
Authority
EP
European Patent Office
Prior art keywords
sound signal
microphones
ambisonic
format
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
EP17725294.7A
Other languages
German (de)
English (en)
Other versions
EP3449643A1 (fr
Inventor
Delphine Devallez
Frédéric AMADU
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arkamys SA
Original Assignee
Arkamys SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arkamys SA filed Critical Arkamys SA
Publication of EP3449643A1 publication Critical patent/EP3449643A1/fr
Application granted granted Critical
Publication of EP3449643B1 publication Critical patent/EP3449643B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones

Definitions

  • the present invention relates to the field of sound signal processing.
  • 3D audio has been reserved for sound professionals and researchers.
  • the purpose of this technology is to capture as much spatial information as possible during recording, then restore it to the listener and give them a feeling of immersion in the sound scene.
  • the interest is growing for videos filmed at 360 ° and reproduced via a virtual reality headset for a complete immersion in the image: the user can turn his head and explore the visual scene all around from him.
  • the most compact solution is the use of a network of microphones, such as for example the Eigenmike from mh acoustics, the Soundfield from TSL Products, and the TetraMic from Core Sound.
  • the document WO 2005/015954 shows a method for converting the signals of an array of microphones placed in a spherical configuration into an ambisonic format. Equipped with four to thirty-two microphones, these products are expensive and therefore reserved for professional use. Recent research has reduced the number of microphones ( Palacino, JD, & Nicol, R. (2013). "Spatial sound pick-up with a low number of microphones.” ICA 2013. Montreal, Canada .), and microphones of reduced size and cost can be used such as those available in mobile phones.
  • the shape of the microphone networks, a polyhedron remains standardized, however, from the dodecahedron for the EigenMike to the tetrahedron for the Soundfield and the TetraMic.
  • the present invention intends to remedy the drawbacks of the prior art by proposing a method for processing the sound signal making it possible to capture the sound signal in all directions, then to restore said sound signal.
  • the present invention relates, in its most general sense, to a method for processing the sound signal, according to claim 1.
  • the matrix calculation involves a matrix H calculated by the method of least squares from the measured directivities of the N microphones and the ideal directivities of the ambisonic components.
  • said microphones are arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a portable telephone.
  • said method uses four microphones spaced at an angle of 90 ° to the horizontal.
  • said method implements a filter bandpass filter from 100 Hz to 6 kHz.
  • the order R of the ambisonic type format is equal to one.
  • said information relating to the orientation of the head of a user listening to the sound signal is captured by a sensor in a mobile phone or by a sensor located in a headset or a virtual reality headset.
  • the data in ambisonic format are transformed into data in binaural format.
  • the present invention also relates to a sound signal processing system according to claim 9.
  • the present invention relates to a method for processing the sound signal, according to claim 1.
  • said microphones are arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a portable telephone.
  • the method according to the present invention uses four microphones spaced at an angle of 90 ° to the horizontal.
  • the order R of the ambisonic type format is equal to one.
  • the first step of the method according to the present invention consists in recording the sound signal.
  • N microphones are used, N being a natural integer greater than or equal to three, said microphones being arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a mobile telephone.
  • N is equal to four and the microphones are spaced 90 ° apart.
  • These microphones are arranged in a circle on a plane.
  • the radius of said circle is two centimeters, and the microphones are omnidirectional.
  • the sound signal is picked up by said microphones and digitized. It is a synchronous capture.
  • the second step of the method according to the present invention consists in encoding said four sampled digital signals, in an ambisonic type format of order R, R being a natural integer greater than or equal to one.
  • the ambisonic format is a standardized format for audio coding in several dimensions.
  • the order R is equal to one.
  • This order 1 makes it possible to represent the sound with the following concepts: Front - Rear and Left - Right.
  • the Figures 4a, 4b and 4c represent the ideal components W, Y and X of an order 1 ambisonic format (on a horizontal plane).
  • the Figures 5a, 5b and 5c illustrate the approximate W, Y and X components of a first order ambisonic format.
  • the Figure 2 illustrates the treatments applied in the context of the second step of the method according to the present invention.
  • Hanning windows are used with an overlap by implementing a “ overlap-add” type function .
  • This matrix includes weighting coefficients for each microphone signal and each frequency.
  • the method according to the present invention implements a filter bandpass filter from 100 Hz to 6 kHz. This eliminates the lower part and the acute part.
  • the impulse responses of the N microphones are measured, in the present case of the four microphones, with a source positioned every 5 ° or every 10 ° around the microphone array.
  • the frequency responses of the N microphones are obtained as a function of the angles measured, or in other words the directivities of the N microphones as a function of the frequency.
  • the microphones' responses are then placed in a matrix C.
  • H NOT ⁇ V P D ⁇ V
  • N the number of microphones (four in the present embodiment)
  • D the number of angular source positions measured (108 in the present embodiment)
  • V the number of ambisonic channels (three in the present example)
  • C DxN denotes the directivities of the microphones
  • H NxV denotes the matrix which transforms the directivities of the microphones into the desired directivities
  • P DxV denotes the directivities prescribed by the ambisonic format (W, X and Y in the present example of production).
  • H NxV P DxV / C DxN for each frequency index k if C DxN is invertible.
  • C DxN is not invertible.
  • a least squares method is implemented to solve for C 108x4 .
  • H 4x3 P 108x3
  • the matrix H is defined once for the future uses of the network of microphones considered. Then, with each use, a matrix multiplication is carried out in the frequency domain.
  • Said matrix H has as many lines as there are microphones, therefore four in the present embodiment, and as many columns as required by the order of the ambisonic format used, therefore three columns in the present embodiment, in which the order 1 is implemented horizontally.
  • Out In x H, where H denotes the previously calculated matrix, In denotes the input (audio channels coming from the network of microphones, passed in the frequency domain) and Out denotes the output (Out being reconverted in the temporal domain for get ambisonic format).
  • the method according to the present invention implements, during this second step, an algorithm called least squares algorithm for each frequency, with for example 512 frequency points.
  • data is obtained in the ambisonic format (in the present exemplary embodiment the signals W, X and Y).
  • the third step of the method according to the present invention consists in restoring the sound signal, by means of a transformation of the data in ambisonic format into two binaural channels.
  • the information relating to the orientation of the head of the user listening to the sound signal is collected and used. This can be realized by a sensor in a mobile phone, a headset or a virtual reality headset.
  • This orientation information consists of a vector comprising three angle values, in Anglo-Saxon terminology “ pitch”,”yaw” and “ roll”.
  • the angle value " yaw" is used on a plane.
  • the ambisonic format is transformed into eight audio channels corresponding to a virtual placement of eight speakers, each placed at 45 ° around the user.
  • the Figure 6 represents the placement of eight virtual speakers, each placed at 45 ° around a user.
  • W, X and Y are the data relating to the ambisonic format
  • ⁇ n represents the horizontal angle of the n th loudspeaker.
  • W, X and Y are the data relating to the ambisonic format
  • ⁇ n represents the horizontal angle of the n th loudspeaker.
  • HRTF head-related transfer function
  • IIR Infinite Impulse Response
  • ⁇ n ⁇ n - ⁇ .
  • the Figure 3 represents the different stages of the process according to the present invention.
  • the present invention also relates to a sound signal processing system according to claim 9.
  • This sound signal processing system includes at least one computing unit and one memory unit.

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

    Domaine de l'invention
  • La présente invention se rapporte au domaine du traitement du signal sonore.
  • Etat de la technique
  • On connaît dans l'état de la technique des procédés et des systèmes permettant de diffuser des signaux vidéo à 360°. Il existe un besoin dans l'état de la technique de pouvoir associer des signaux audio à ces signaux vidéo à 360°.
  • Jusqu'à maintenant, l'audio 3D était réservé aux professionnels du son et aux chercheurs. Cette technologie a pour objectif de capturer le maximum d'informations spatiales lors de l'enregistrement pour les restituer ensuite à l'auditeur et lui donner une sensation d'immersion dans la scène sonore. Dans le domaine de la vidéo, l'intérêt est croissant pour les vidéos filmées à 360° et reproduites via un casque de réalité virtuelle pour une immersion complète dans l'image : l'utilisateur peut tourner la tête et explorer la scène visuelle tout autour de lui. Pour obtenir la même fidélité dans le domaine du son, la solution la plus compacte est l'utilisation d'un réseau de microphones, comme par exemple l'Eigenmike de mh acoustics, le Soundfield de TSL Products, et le TetraMic de Core Sound. Le document WO 2005/015954 montre un procédé pour convertir les signaux d'un réseau de microphones placés selon une configuration sphérique en un format ambisonique. Equipés de quatre à trente-deux microphones, ces produits sont onéreux et donc réservés à des utilisations professionnelles. De récentes recherches ont permis de réduire le nombre de microphones (Palacino, J. D., & Nicol, R. (2013). "Spatial sound pick-up with a low number of microphones." ICA 2013. Montréal, Canada.), et des microphones de taille et de coût réduits peuvent être utilisés tels que ceux dont disposent les téléphones portables. La forme des réseaux de microphones, un polyhèdre, reste cependant standardisée, du dodécaèdre pour l'EigenMike au tetrahèdre pour le Soundfield et le TetraMic. Cette forme géométrique permet d'utiliser des formules simples pour convertir les signaux des microphones en un format ambisonique, et ont été développées par Gerzon en 1975 (Gerzon, M. (1975). « The design of precisely coincident microphone arrays for stereo and surround sound. » 50th Audio Engineering Society Conference .). Le format ambisonique est un ensemble de canaux audio qui contient toutes les informations nécessaires à la reconstruction spatiale du champ sonore. Une nouveauté apportée par le présent brevet est la possibilité d'utiliser une forme quelconque de réseau de microphones. Ainsi, il est tout à fait possible d'utiliser une forme déjà existante, telle une caméra 360° ou un téléphone portable, pour y inclure un certain nombre de microphones. On obtient alors un système complet et compact d'enregistrement du son et de l'image à 360°.
  • Exposé de l'invention
  • La présente invention entend remédier aux inconvénients de l'art antérieur en proposant un procédé de traitement du signal sonore permettant de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
  • A cet effet, la présente invention concerne, dans son acception la plus générale, un procédé de traitement du signal sonore, conformément à la revendication 1.
  • Ainsi, grâce au procédé selon la présente invention, il est possible de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
  • Avantageusement, le calcul matriciel fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
  • Selon un mode de réalisation, lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable.
  • Selon un mode de réalisation, ledit procédé met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
  • Selon un mode de réalisation, ledit procédé met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz.
  • Selon un mode de réalisation, l'ordre R du format de type ambisonique est égal à un.
  • Avantageusement, au cours de ladite étape de restitution, une information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est exploitée.
  • De préférence, une captation de ladite information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est réalisée par un capteur au sein d'un téléphone mobile ou bien par un capteur situé dans un casque d'écoute ou un casque de réalité virtuelle.
  • Selon un mode de réalisation, au cours de ladite étape de restitution, les données sous format ambisonique sont transformées en données sous format binaural.
  • La présente invention se rapporte également à un système de traitement du signal sonore, conformément à la revendication 9.
  • Brève description des dessins
  • On comprendra mieux l'invention à l'aide de la description, faite ci-après à titre purement explicatif, d'un mode de réalisation de l'invention, en référence aux Figures dans lesquelles :
    • Les Figures 1 et 3 représentent les différentes étapes du procédé selon la présente invention ;
    • La Figure 2 illustre les traitements appliqués dans le cadre de la seconde étape du procédé selon la présente invention ;
    • Les Figures 4a, 4b et 4c représentent les composantes W, Y et X idéales d'un format ambisonique d'ordre 1 (sur plan horizontal) ;
    • Les Figures 5a, 5b et 5c illustrent les composantes W, Y et X approximées d'un format ambisonique d'ordre 1 ; et
    • La Figure 6 représente le placement de huit haut-parleurs virtuels, chacun placé à 45° autour d'un utilisateur.
    Description détaillée des modes de réalisation de l'invention
  • La présente invention se rapporte à un procédé de traitement du signal sonore, conformément à la revendication 1.
  • Les Figures 1 et 3 illustrent les différentes étapes du procédé selon la présente invention.
  • Dans un mode de réalisation, lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable.
  • Dans un mode de réalisation, le procédé selon la présente invention met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
  • Dans un mode de réalisation, l'ordre R du format de type ambisonique est égal à un.
  • La première étape du procédé selon la présente invention consiste en l'enregistrement du signal sonore. On utilise pour cet enregistrement N microphones, N étant un entier naturel supérieur ou égal à trois, lesdits microphones étant disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable. Dans l'exemple de réalisation décrit ci-après, N est égal à quatre et les microphones sont espacés de 90°. Ces microphones sont disposés selon un cercle sur un plan. Dans un exemple particulier de mise en œuvre, le rayon dudit cercle est de deux centimètres, et les microphones sont omnidirectionnels.
  • Le signal sonore est capté par lesdits microphones, et numérisé. Il s'agit d'une captation synchrone.
  • On obtient à l'issue de cette première étape quatre signaux numériques échantillonnés.
  • La seconde étape du procédé selon la présente invention consiste en l'encodage desdits quatre signaux numériques échantillonnés, en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un.
  • On rappelle ici que le format ambisonique est un format normalisé de codage audio en plusieurs dimensions.
  • Dans l'exemple de réalisation décrit ci-après, l'ordre R est égal à un. Cet ordre 1 permet de représenter le son avec les notions suivantes : Avant - Arrière et Gauche - Droite.
  • Les Figures 4a, 4b et 4c représentent les composantes W, Y et X idéales d'un format ambisonique d'ordre 1 (sur plan horizontal).
  • Les Figures 5a, 5b et 5c illustrent les composantes W, Y et X approximées d'un format ambisonique d'ordre 1.
  • La Figure 2 illustre les traitements appliqués dans le cadre de la seconde étape du procédé selon la présente invention.
  • On observe sur la Figure 2 que les données en entrée sont dans le domaine temporel, passent dans le domaine fréquentiel suite à une opération de transformée de Fourier rapide (FFT ou « Fast Fourier Transform » en terminologie anglo-saxonne), puis les données en sortie sont dans le domaine temporel suite à une opération de transformée de Fourier rapide inverse (IFFT ou « Inverse Fast Fourier Transform » en terminologie anglo-saxonne).
  • De préférence, on utilise des fenêtres de Hanning avec un recouvrement en mettant en œuvre une fonction de type « overlap-add ».
  • On observe également sur la Figure 2 que les données fréquentielles d'entrées sont modifiées à l'aide d'une multiplication matricielle. Cette matrice comporte des coefficients pondérateurs pour chaque signal de microphone et chaque fréquence.
  • On observe également sur la Figure 2 qu'un filtrage au moyen d'un filtre passe-bande est réalisé sur les données avant la sortie.
  • Dans un mode de réalisation, le procédé selon la présente invention met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz. On élimine ainsi la partie basse et la partie aigüe.
  • Afin de calculer les coefficients de la matrice de pondération, on mesure des réponses impulsionnelles des N microphones, dans le cas présent des quatre microphones, avec une source positionnée tous les 5° ou tous les 10° autour du réseau de microphones.
  • A l'aide d'une transformée de Fourier rapide, on obtient les réponses en fréquence des N microphones en fonction des angles mesurés, ou autrement dit les directivités des N microphones en fonction de la fréquence.
  • Il est possible d'utiliser à ce stade les principes du procédé décrit dans la demande internationale publiée sous le numéro WO 2015/128160 « Procédé et système d'égalisation acoustique automatisé » pour égaliser les réponses en fréquence sur l'axe de chacun des microphones. Les mêmes filtres d'égalisation sont appliqués à tous les microphones et pour toutes les positions angulaires de source.
  • Les réponses des microphones sont ensuite placées dans une matrice C.
  • Dans le domaine fréquentiel, pour chaque index de fréquence k, on a C D × N . H N × V = P D × V
    Figure imgb0001
    où N est le nombre de microphones (quatre dans le présent exemple de réalisation), D est le nombre de positions angulaires de source mesurées (108 dans le présent exemple de réalisation) et V est le nombre de canaux ambisoniques (trois dans le présent exemple de réalisation), CDxN désigne les directivités des microphones, HNxV désigne la matrice qui transforme les directivités des microphones en les directivités désirées, et PDxV désigne les directivités prescrites par le format ambisonique (W, X et Y dans le présent exemple de réalisation).
  • On a ainsi HNxV = PDxV / CDxN pour chaque index de fréquence k si CDxN est inversible.
  • En pratique, CDxN n'est pas inversible. Dans un mode de réalisation, on met en œuvre une méthode des moindres carrés pour résoudre C108x4 . H4x3 = P108x3
  • La matrice H est définie une fois pour les utilisations futures du réseau de microphones considéré. Ensuite, à chaque utilisation on réalise une multiplication matricielle dans le domaine fréquentiel.
  • Ladite matrice H possède autant de lignes que de microphones donc quatre dans le présent exemple de réalisation, et autant de colonnes que le requiert l'ordre du format ambisonique utilisé, donc trois colonnes dans le présent exemple de réalisation dans lequel l'ordre 1 est mis en œuvre sur le plan horizontal.
  • On a Out = In x H , où H désigne la matrice précédemment calculée, In désigne l'entrée (canaux audio provenant du réseau de microphones, passés dans le domaine fréquentiel) et Out désigne la sortie (Out étant reconverti dans le domaine temporel pour obtenir le format ambisonique).
  • Le procédé selon la présente invention met en œuvre, au cours de cette seconde étape, un algorithme dit algorithme des moindres carrés pour chaque fréquence, avec par exemple 512 points de fréquence.
  • A l'issue de cette seconde étape, on obtient des données sous le format ambisonique (dans le présent exemple de réalisation les signaux W, X et Y).
  • La troisième étape du procédé selon la présente invention consiste en la restitution du signal sonore, grâce à une transformation des données sous format ambisonique en deux canaux binauraux.
  • Au cours de cette troisième étape, l'information relative à l'orientation de la tête de l'utilisateur écoutant le signal sonore, est récupérée et exploitée. Ceci peut être réalisé par un capteur au sein d'un téléphone mobile, d'un casque d'écoute ou d'un casque de réalité virtuelle.
  • Cette information sur l'orientation consiste en un vecteur comportant trois valeurs d'angles, en terminologie anglo-saxonne « pitch », « yaw » et « roll ».
  • Dans le présent exemple de réalisation, sur un plan, on utilise la valeur d'angle « yaw ».
  • On transforme le format ambisonique en huit canaux audio correspondant à un placement virtuel de huit haut-parleurs, chacun placé à 45° autour de l'utilisateur.
  • La Figure 6 représente le placement de huit haut-parleurs virtuels, chacun placé à 45° autour d'un utilisateur.
  • Chaque haut parleur virtuel restitue un signal audio issu des composantes ambisoniques selon la formule: P n = W + Xcosθ n + Ysinθ n
    Figure imgb0002
    où W, X et Y sont les données relatives au format ambisonique, et où θn représente l'angle horizontal du nième haut-parleur. Par exemple, dans le présent exemple de réalisation θ0 = 0°, θ1 = 45°, θ2 = 90°, etc.
  • Ensuite, on effectue une étape de filtrage avec une paire de HRTF par haut-parleur, HRTF signifiant « Head-related transfer fonction » en terminologie anglo-saxonne. On associe une paire de filtres HRTF (oreille gauche et oreille droite) à chaque haut-parleur virtuel, puis on additionne (tous les canaux « oreille gauche » et tous les canaux « oreille droite » ensemble), afin de former deux canaux de sortie.
  • Des coefficients IIR (« Infinite Impulse Response ») sont mis en œuvre à ce stade, lesdits filtres HRTF étant modélisés sous formes de filtres IIR.
  • Lorsque l'utilisateur tourne la tête, la position des haut-parleurs virtuels est modifiée. Par exemple pour une rotation de la tête d'un angle a, l'angle des haut-parleurs virtuels devient βn = θn-α. On remplace alors θn par (θn-α) dans la formule (1) pour calculer le signal restitué par le nième haut-parleur virtuel.
  • Ainsi, grâce au procédé selon la présente invention, il est possible de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
  • La Figure 3 représente les différentes étapes du procédé selon la présente invention.
  • La présente invention se rapporte également à un système de traitement du signal sonore, conformément à la revendication 9.
  • Ce système de traitement du signal sonore comprend au moins une unité de calcul et une unité de mémoire.
  • L'invention est décrite dans ce qui précède à titre d'exemple. Il est entendu que l'homme du métier est à même de réaliser différentes variantes de l'invention sans pour autant sortir du cadre du brevet.

Claims (9)

  1. Procédé de traitement du signal sonore, comportant les étapes suivantes :
    • Captation de façon synchrone d'un signal sonore d'entrée (Sentrée) à l'aide de N microphones, N étant un entier naturel supérieur ou égal à trois;
    • Encodage dudit signal sonore d'entrée (Sentrée) en un format de données (D) de son, ledit encodage comportant une sous-étape de transformation dudit signal d'entrée en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un, ladite sous-étape de transformation en un format de type ambisonique étant mise en œuvre à l'aide d'une transformée de Fourier rapide, d'une multiplication matricielle, d'une transformée de Fourier rapide inverse et à l'aide d'un filtre passe-bande ; et
    • Restitution d'un signal sonore de sortie (Ssortie) à l'aide d'un traitement numérique desdites données (D) de son ;
    et caractérisé en ce que la multiplication matricielle fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
  2. Procédé de traitement du signal sonore selon la revendication 1, caractérisé en ce que lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N, ou à chaque coin d'un téléphone portable.
  3. Procédé de traitement du signal sonore selon la revendication 2, caractérisé en ce qu'il met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
  4. Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'il met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz.
  5. Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce que l'ordre R du format de type ambisonique est égal à un.
  6. Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'au cours de ladite étape de restitution, une information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est exploitée.
  7. Procédé de traitement du signal sonore selon la revendication 6, caractérisé en ce qu'une captation de ladite information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est réalisée par un capteur au sein d'un téléphone, d'un casque d'écoute ou d'un casque de réalité virtuelle.
  8. Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'au cours de ladite étape de restitution, les données sous format ambisonique sont transformées en données sous format binaural.
  9. Système de traitement du signal sonore, comportant des moyens pour :
    • Capter de façon synchrone un signal sonore d'entrée (Sentrée) à l'aide de N microphones, N étant un entier naturel supérieur ou égal à trois ;
    • Encoder ledit signal sonore d'entrée (Sentrée) en un format de données (D) de son, et des moyens pour transformer ledit signal d'entrée en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un, lesdits moyens pour transformer en un format de type ambisonique étant mis en œuvre à l'aide d'une transformée de Fourier rapide, d'une multiplication matricielle, d'une transformée de Fourier rapide inverse et à l'aide d'un filtre passe-bande ; et
    • Restituer un signal sonore de sortie (Ssortie) à l'aide d'un traitement numérique desdites données (D) de son ;
    et caractérisé en ce que la multiplication matricielle fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
EP17725294.7A 2016-04-26 2017-04-20 Procédé et système de diffusion d'un signal audio à 360° Active EP3449643B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1653684A FR3050601B1 (fr) 2016-04-26 2016-04-26 Procede et systeme de diffusion d'un signal audio a 360°
PCT/FR2017/050935 WO2017187053A1 (fr) 2016-04-26 2017-04-20 Procédé et système de diffusion d'un signal audio à 360°

Publications (2)

Publication Number Publication Date
EP3449643A1 EP3449643A1 (fr) 2019-03-06
EP3449643B1 true EP3449643B1 (fr) 2020-06-10

Family

ID=56943619

Family Applications (1)

Application Number Title Priority Date Filing Date
EP17725294.7A Active EP3449643B1 (fr) 2016-04-26 2017-04-20 Procédé et système de diffusion d'un signal audio à 360°

Country Status (5)

Country Link
US (1) US10659902B2 (fr)
EP (1) EP3449643B1 (fr)
CN (1) CN109661824A (fr)
FR (1) FR3050601B1 (fr)
WO (1) WO2017187053A1 (fr)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO099696A0 (en) * 1996-07-12 1996-08-08 Lake Dsp Pty Limited Methods and apparatus for processing spatialised audio
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
NZ502603A (en) * 2000-02-02 2002-09-27 Ind Res Ltd Multitransducer microphone arrays with signal processing for high resolution sound field recording
FR2858512A1 (fr) * 2003-07-30 2005-02-04 France Telecom Procede et dispositif de traitement de donnees sonores en contexte ambiophonique
GB0906269D0 (en) * 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
US9986356B2 (en) * 2012-02-15 2018-05-29 Harman International Industries, Incorporated Audio surround processing system
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
CN104424953B (zh) * 2013-09-11 2019-11-01 华为技术有限公司 语音信号处理方法与装置
FR3018015B1 (fr) 2014-02-25 2016-04-29 Arkamys Procede et systeme d'egalisation acoustique automatise

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None *

Also Published As

Publication number Publication date
FR3050601A1 (fr) 2017-10-27
EP3449643A1 (fr) 2019-03-06
FR3050601B1 (fr) 2018-06-22
CN109661824A (zh) 2019-04-19
US20190132695A1 (en) 2019-05-02
US10659902B2 (en) 2020-05-19
WO2017187053A1 (fr) 2017-11-02

Similar Documents

Publication Publication Date Title
EP1836876B1 (fr) Procédé et dispositif d'individualisation de hrtfs par modélisation
EP1563485B1 (fr) Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
EP1946612B1 (fr) Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif
EP2000002B1 (fr) Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme
EP1992198B1 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP2898707B1 (fr) Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs
EP1586220B1 (fr) Procede et dispositif de pilotage d'un ensemble de restitution a partir d'un signal multicanal
EP1999998A1 (fr) Procede de synthese binaurale prenant en compte un effet de salle
EP2995095B1 (fr) Appareil et procédé de compression d'un ensemble de réponses impulsionnelles spatiales binaurales à n canaux
EP2009891B1 (fr) Transmission de signal audio dans un système de conférence audio immersive
EP3025514B1 (fr) Spatialisation sonore avec effet de salle
EP3449643B1 (fr) Procédé et système de diffusion d'un signal audio à 360°
FR3065137A1 (fr) Procede de spatialisation sonore
WO2021212287A1 (fr) Procédé de traitement de signal audio, dispositif de traitement audio et appareil d'enregistrement
EP3384688B1 (fr) Décompositions successives de filtres audio
US10764684B1 (en) Binaural audio using an arbitrarily shaped microphone array
EP2987339B1 (fr) Procédé de restitution sonore d'un signal numérique audio
FR3069693B1 (fr) Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique
Devallez et al. Method and system of broadcasting a 360 audio signal

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20181113

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: GRANT OF PATENT IS INTENDED

INTG Intention to grant announced

Effective date: 20191126

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE PATENT HAS BEEN GRANTED

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

Ref country code: AT

Ref legal event code: REF

Ref document number: 1280121

Country of ref document: AT

Kind code of ref document: T

Effective date: 20200615

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602017018008

Country of ref document: DE

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200910

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

REG Reference to a national code

Ref country code: NL

Ref legal event code: MP

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200910

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 1280121

Country of ref document: AT

Kind code of ref document: T

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20201012

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20201010

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602017018008

Country of ref document: DE

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

26N No opposition filed

Effective date: 20210311

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20210420

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210420

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20210430

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210420

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210430

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210430

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210420

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20201010

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210430

P01 Opt-out of the competence of the unified patent court (upc) registered

Effective date: 20230512

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20170420

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20230427

Year of fee payment: 7

Ref country code: DE

Payment date: 20230425

Year of fee payment: 7

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20200610