WO2011128582A2 - Procédé et système d'analyse et de codage de signaux audiophoniques - Google Patents
Procédé et système d'analyse et de codage de signaux audiophoniques Download PDFInfo
- Publication number
- WO2011128582A2 WO2011128582A2 PCT/FR2011/050839 FR2011050839W WO2011128582A2 WO 2011128582 A2 WO2011128582 A2 WO 2011128582A2 FR 2011050839 W FR2011050839 W FR 2011050839W WO 2011128582 A2 WO2011128582 A2 WO 2011128582A2
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- signal
- phase
- audiophonic
- parameters
- decomposing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000005236 sound signal Effects 0.000 title abstract description 17
- 238000000354 decomposition reaction Methods 0.000 abstract description 11
- 238000004458 analytical method Methods 0.000 description 10
- 230000000737 periodic effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- NEPLKJAINOWIJL-DHNNRRLOSA-N dnc014884 Polymers C1C2=CC3=CC=CC=C3N2[C@@]2(C)[C@@H]1[C@@]1(C)CCC(=O)C(C)(C)[C@@H]1CC2 NEPLKJAINOWIJL-DHNNRRLOSA-N 0.000 description 2
- 230000003071 parasitic effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100519149 Escherichia coli pcoS gene Proteins 0.000 description 1
- OZJHCMYAXLCFKU-UHFFFAOYSA-N Polyavolensinone Natural products CC1(C)C2CCC3n4c(CC3(C)C2(C)CCC1=O)cc5ccccc45 OZJHCMYAXLCFKU-UHFFFAOYSA-N 0.000 description 1
- 208000028790 Speech Sound disease Diseases 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Definitions
- the present invention relates to a method and system for decomposing an audiophonic signal, the general form of which can be expressed by where ⁇ ( ⁇ ) is the phase of the signal.
- It relates in particular to the analysis and coding of elementary audio signals, as generated by a musical instrument, or voice signals.
- a real audiophonic signal generally comprises low frequency aperiodic signals constituting the envelope of the signal, modulated by one or more periodic signals, for example generated by musical instruments.
- each periodic signal i.e. the shape of this signal over a period
- the waveform of each periodic signal is characteristic of the timbre of this signal.
- the simplest waveform, corresponding to a linear signal, is a sinusoid, whose frequency is characteristic of the height of the sound signal, and whose amplitude determines the intensity of this sound signal.
- Square, triangular, or sawtooth waveforms are also classic shapes.
- real sound signals for example generated by a musical instrument
- Fourier series decomposition breaks down any type of periodic signal, and is used by many audio coding methods, such as MP3 encoding.
- audio coding methods such as MP3 encoding.
- their decomposition in Fourier series requires the retention of a large number of coefficients, coefficients which are difficult to give a physical meaning.
- the purpose of the invention is therefore to enable the analysis and the representation, thus the coding and the synthesis, of an audiophonic signal, whatever its anharmonicity, by means of a small number of parameters, with respect to the number of parameters necessary for encoding and synthesis by Fourier series, said parameters being carrying a physical meaning and constituting a simple and explicit signature of the waveform of this signal, therefore the timbre of this signal.
- the subject of the invention is a process of the aforementioned type, characterized in that it comprises the following steps:
- the method according to the invention makes it possible to analyze an audiophonic signal by reducing the number of parameters necessary for its coding, compared to the decomposition methods according to the state of the art.
- these parameters have a physical meaning, which makes it possible to compare several signals by directly comparing the parameters resulting from their decomposition.
- the method according to the invention also comprises the following characteristics, taken separately or in combination:
- phase equation is expressed in the form:
- r varying in [0,1] is a parameter measuring the anharmonicity of said signal
- the signal x (t) is expressed by means of two parameters r and ⁇ 0 , in the form:
- phase equation is expressed in the form:
- ⁇ ( ⁇ ) and 0 ( ⁇ ) are trigonometric polynomials
- the subject of the invention is a system for decomposing an audiophonic signal, the general form of which can be expressed by where ⁇ ( ⁇ ) is the phase of the signal, characterized in that
- the system according to the invention also comprises the following characteristics, taken separately or in combination:
- the system comprises means for expressing the phase equation in the form:
- r varying in [0,1] is a parameter measuring the anharmonicity of said signal
- the system comprises means for expressing the signal x (t) by means of two parameters r and ⁇ 0 , in the form:
- the system comprises means for expressing the phase equation in the form:
- ⁇ ( ⁇ ) and Q ( ⁇ ) are trigonometric polynomials
- the system comprises means for determining the expression of the phase ⁇ (t) in the form:
- FIG. 1 represents the form of an elementary audio signal
- FIG. 2 is a diagram showing a system for decomposing an audiophonic signal according to one embodiment of the invention.
- FIG. 3 is a block diagram illustrating the method of decomposing an audiophonic signal according to one embodiment of the invention.
- FIG. 1 shows the form of an elementary audiophonic signal 1, as produced by a musical instrument, or a voice signal, the time being plotted on the abscissa and the amplitude of the signal on the ordinate.
- This signal 1 is quasi-periodic, of period T. The variations of this signal from one period to another are notably due to parasitic signals, constituting a white noise, and to the variation of signal intensity during time.
- the signal 1 is a strongly non-linear signal consisting of a signal at a fundamental frequency f, inverse of the period T, and a plurality of signals of higher frequencies.
- FIG. 2 illustrates an embodiment of the system according to the invention.
- This system comprises means 3 for acquiring audio signals, for example a microphone, and means 5 for processing and analyzing such signals, comprising an analog / digital converter 7, means 9 for analyzing digital audio signals. , for example a processor.
- the system also includes storage means 10, for example a ROM.
- the microphone 3 is able to convert sound waves from a musical instrument 1 1 into electrical pulses, forming an analog audio signal.
- the analog / digital converter 7 is adapted to digitize an analog audio signal, by sampling this signal with a predetermined sampling frequency and quantization of this signal.
- the processor 9 is able to analyze an audiophonic signal so as to encode this signal by means of characteristic parameters of this signal.
- FIG. 3 is a block diagram illustrating the acquisition and analysis of an audiophonic signal by means of the system described with reference to FIG. 2, according to one embodiment of the invention.
- the musical instrument 1 1 emits sound waves, the fundamental frequency of which varies over time. These waves are perceived by the microphone 3, which converts them into electrical pulses constituting an analog audio signal, and immediately transmits this signal to the analog / digital converter 7, continuously.
- the analog to digital converter 7 digitizes the analog audio signal, by sampling and quantizing.
- the sampling of the signal is for example carried out with a sampling frequency of 44100 Hz, which is the sampling frequency of the audiophonic signals on a compact disc.
- the digital audio signal is then transmitted to the processor 9.
- This digital audiophonic signal consists of a succession of elementary audiophonic signals whose fundamental frequencies differ.
- the processor 9 carries out in a step 1 7 a local Fourier transform of the digital audiophonic signal, and detects the successive fundamental frequencies of this signal as well as the location and the duration of each of the elementary signals.
- the temporal width of the window used for this Fourier transform must be large enough for this window to contain at least ten periods of the elementary signal of lower frequency. For example, for a fundamental frequency elementary signal equal to at least 500 Hz, a window width equal to or greater than 20 ms will be chosen.
- Each signal thus detected is a quasi-periodic signal, the variations of this signal from one period to another being notably due to parasitic signals and to the variation of signal intensity over time.
- this intensity can be considered constant over a period of the order of ten periods, or as linearly varying.
- the processor 9 breaks down the digital audio signal into elementary signals of fixed fundamental frequencies, and each comprising at least ten periods.
- the processor 9 analyzes each of these elementary signals.
- Each elementary signal x (t) is an anharmonic signal whose main morphology can be described in the following form:
- phase dynamics all relevant dynamic information is expressed by phase dynamics.
- this function F is therefore described by means of a very small number of parameters.
- a small number of parameters will be understood to mean a reduced number of parameters relative to the number of parameters necessary for the decomposition of the same function, by means of the Fourier series, with an equivalent level of precision.
- This analysis step 21 thus comprises a first step of expressing the phase ⁇ , and in particular the function F, derived from ⁇ with respect to time.
- phase dynamics can be written in the form:
- phase dynamics contains only one parameter, r, which varies in the interval [0,1].
- ⁇ 0 is a phase origin, is decomposed and rewritten in a form involving the parameters r and ⁇ 0 :
- the decomposition of the signal x (t) involves only two parameters, r and ⁇ 0 .
- the parameter ⁇ 0 which defines the composition of the signal in the two functions hcos and hsin, is a morphology parameter, which corresponds to the angle of reflection symmetry of the phase dynamics.
- the phase equation can be written in the form:
- P n and Q m are trigonometric polynomials of respective degrees n and m.
- the general form of a trigonometric polynomial of degree n is:
- the analysis of the signal x (t) then consists in determining an expression of ⁇ involving a small number of parameters, which makes it possible to determine an expression of the signal x (t) as a function of these parameters.
- phase equation (4) can be rewritten in the form:
- the period T of the signal can be determined by integrating this equation with respect to ⁇ , between 0 and 2 ⁇ :
- phase equation can be expressed as follows:
- the time t is thus expressed as a function of the phase ⁇ , and in a dual way the phase ⁇ is expressed as a function of the time t, using clearly defined independent parameters, which measure the anharmonicity (parameters r or r k ) , and the morphology (parameters ⁇ 0 or ⁇ ).
- the processor 9 codes the signal x (t) by means of a small number of parameters.
- the elementary signal x (t) is described almost exactly by an amplitude, a period T, an harmonicity r and a morphology ⁇ 0 .
- the elementary signal x (t) is described even more precisely by two pairs of parameters (r 1, and (r 2 , ⁇ 2 ), supplemented by their respective weights.
- Each of the elementary signals constituting the digital audiophonic signal is therefore characterized by a limited number of parameters, carrying a physical meaning because representative of the non-linearity and the morphology of these signals.
- the processor controls the recording in the memory of the characteristic parameters determined during the steps 17, 19 and 21, that is to say the time position, the duration, the amplitude and the fundamental frequency of each elemental signal, as well as the parameters of morphology and harmonicity characteristic of the waveform of each elemental signal, and therefore of their timbre.
- the method and the system according to the invention thus make it possible to decompose a signal and to code it using a limited number of parameters, and with greater precision than the Fourier series decomposition.
- This compactness makes it possible to reduce the space required for storing these signals, to increase the bit rate of the transmission channels and to improve the quality of reproduction of the resynthesized sounds.
- the parameters determined during the decomposition according to the method according to the invention have a strong physical meaning and make it possible to describe the anharmonicity and the morphology of the signal.
- the method according to the invention can be effectively used for voice recognition or identification, in which context the signals comprise strong non-linear components which constitute a discriminant signature of these signals.
- the method can be used for the characterization of phoniatric and phonological disorders and the evaluation of their evolution.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Discrete Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Ce procédé de décomposition d'un signal audiophonique dont la forme générale peut être exprimée par x(t) = x
0 + χ
1cos(Φ(t)), où Φ(t) est la phase du signal est caractérisé en ce qu'il comprend les étapes de détermination (21) d'une expression de l'équation de phase (I), et de détermination (21) d'une expression de la phase Φ(t) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcosn et psinn définies par : (II).
Description
Procédé et système d'analyse et de codage de signaux audiophoniques
La présente invention concerne un procédé et un système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par
où Φ(ί) est la phase du signal.
Elle concerne en particulier l'analyse et le codage de signaux audiophoniques élémentaires, tels que générés par un instrument de musique, ou des signaux vocaux.
La description des signaux audiophoniques et leur codage au moyen de paramètres sont une préoccupation ancienne, ce codage permettant de minimiser l'espace nécessaire à leur stockage ou le débit nécessaire à leur transmission, par exemple à travers un réseau de communication, tout en conservant toute l'information nécessaire à la synthèse du signal.
Un signal audiophonique réel comprend généralement des signaux apériodiques de basses fréquences, constituant l'enveloppe du signal, modulés par un ou plusieurs signaux périodiques, par exemple générés par des instruments de musique.
La forme d'onde de chaque signal périodique, c'est-à-dire la forme de ce signal sur une période, est caractéristique du timbre de ce signal. La forme d'onde la plus simple, correspondant à un signal linéaire, est une sinusoïde, dont la fréquence est caractéristique de la hauteur du signal sonore, et dont l'amplitude détermine l'intensité de ce signal sonore. Les formes d'onde carrées, triangulaires, ou en dent de scie, sont également des formes classiques.
Cependant, les signaux sonores réels, par exemple générés par un instrument de musique, sont généralement fortement anharmoniques, c'est-à-dire non-linéaires, et présentent des formes d'ondes plus complexes, car ils résultent de la superposition de multiples signaux de fréquences différentes.
La décomposition de tels signaux est généralement effectuée au moyen des séries de Fourier, introduites en 1822 par Joseph Fourier. Cette technique consiste à décomposer un signal périodique de fréquence f en une somme infinie de fonctions sinusoïdales de fréquences multiples de f. Tout signal périodique x(t) de période T=1 /f peut ainsi être exprimé comme une somme de fonctions sinusoïdales, du type :
Les coefficients cn, appelés coefficients de Fourier, qui sont définis par la formule :
constituent un codage du signal x(t). A partir de cette analyse, la donnée des coefficients cn permet de synthétiser le signal x(t).
Afin d'augmenter la compacité de ce codage, il convient de limiter le nombre de coefficients cn, à priori infini, et de ne conserver que les premiers termes de l'expression (1 ). Ces termes doivent cependant être en nombre suffisant pour que le signal synthétisé à partir du codage soit aussi proche que possible du signal x(t) d'origine.
La décomposition en séries de Fourier permet de décomposer tout type de signal périodique, et elle est utilisée par de nombreuses méthodes de codage audio, par exemple le codage MP3. Cependant, les signaux sonores étant généralement fortement non-linéaires, leur décomposition en séries de Fourier nécessite de conserver un grand nombre de coefficients, coefficients auxquels il est difficile de donner un sens physique.
L'invention a donc pour but de permettre l'analyse et la représentation, donc le codage et la synthèse, d'un signal audiophonique, quelle que soit son anharmonicité, au moyen d'un petit nombre de paramètres, par rapport au nombre de paramètres nécessaires au codage et à la synthèse par série de Fourier, lesdits paramètres étant porteurs d'un sens physique et constituant une signature simple et explicite de la forme d'onde de ce signal, donc du timbre de ce signal.
A cet effet, l'invention a pour objet un procédé du type précité, caractérisé en ce qu'il comprend les étapes suivantes :
- détermination d'une expression de l'équation de phase Γ
- détermination d'une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcosn et psinn définies par :
Ainsi réalisé, le procédé selon l'invention permet d'analyser un signal audiophonique en réduisant le nombre de paramètres nécessaire à son codage, par rapport aux procédés de décomposition selon l'état de la technique. De plus, ces paramètres ont un sens physique, ce qui permet de comparer plusieurs signaux en comparant directement les paramètres issus de leur décomposition.
Le procédé selon l'invention comporte également les caractéristiques suivantes, prises séparément ou en combinaison :
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal ;
dans laquelle Ρ(φ) et 0(φ) sont des polynômes trigonométriques ;
Selon un autre aspect, l'invention a pour objet un système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par où Φ(ί) est la phase du signal, caractérisé en ce qu'il
comprend :
- des moyens pour déterminer une expression de l'équation de phase
- des moyens pour déterminer une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcoSn et psinn définies par :
Le système selon l'invention comporte également les caractéristiques suivantes, prises séparément ou en combinaison :
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal ;
- le système comprend des moyens pour exprimer le signal x(t) au moyen de deux paramètres r et Φ0, sous la forme :
dans laquelle Ρ(Φ) et Q(Φ) sont des polynômes trigonométriques ;
L'invention sera mieux comprise au regard d'un exemple de réalisation de l'invention qui va maintenant être décrit en faisant référence aux figures annexées parmi lesquelles :
la figure 1 représente la forme d'un signal audiophonique élémentaire ;
- la figure 2 est un schéma représentant un système de décomposition d'un signal audiophonique selon un mode de réalisation de l'invention ; et
- la figure 3 est un schéma synoptique illustrant le procédé de décomposition d'un signal audiophonique selon un mode de réalisation de l'invention.
On a représenté sur la figure 1 , la forme d'un signal audiophonique élémentaire 1 , tel que produit par un instrument de musique, ou un signal vocal, le temps étant porté en abscisse et l'amplitude du signal en ordonnée. Ce signal 1 est quasi-périodique, de période T. Les variations de ce signal d'une période à une autre sont notamment dues à des signaux parasites, constitutifs d'un bruit blanc, et à la variation d'intensité du signal au cours du temps.
Le signal 1 est un signal fortement non-linéaire, constitué d'un signal à une fréquence fondamental f, inverse de la période T, et d'une pluralité de signaux de fréquences plus élevées.
La figure 2 illustre un mode de réalisation du système selon l'invention. Ce système comprend des moyens 3 d'acquisition de signaux audiophoniques, par exemple un microphone, et des moyens 5 de traitement et d'analyse de tels signaux, comprenant un convertisseur analogique/numérique 7, des moyens 9 d'analyse de signaux audiophoniques numériques, par exemple un processeur. Le système comprend également des moyens 10 de mémorisation, par exemple une mémoire ROM.
Le microphone 3 est apte à convertir des ondes sonores issues d'un instrument de musique 1 1 en impulsions électriques, formant un signal audiophonique analogique.
Le convertisseur analogique/numérique 7 est apte à numériser un signal audiophonique analogique, par échantillonnage de ce signal avec une fréquence d'échantillonnage prédéterminée et quantification de ce signal.
Le processeur 9 est apte à analyser un signal audiophonique de manière à coder ce signal au moyen de paramètres caractéristiques de ce signal.
La figure 3 est un schéma synoptique illustrant l'acquisition et l'analyse d'un signal audiophonique au moyen du système décrit en référence à la figure 2, selon un mode de réalisation de l'invention.
Dans une étape 13 d'acquisition, l'instrument de musique 1 1 émet des ondes sonores, dont la fréquence fondamentale varie au cours du temps. Ces ondes sont perçues par le microphone 3, qui les convertit en impulsions électriques constituant un signal audiophonique analogique, et transmet immédiatement ce signal au convertisseur analogique/numérique 7, de manière continue.
Dans une étape 15 de numérisation, le convertisseur analogique/numérique 7 numérise le signal audiophonique analogique, par échantillonnage et quantification. L'échantillonnage du signal est par exemple réalisé avec une fréquence d'échantillonnage de 44100 Hz, qui est la fréquence d'échantillonnage des signaux audiophoniques sur un disque compact. Le signal audiophonique numérique est alors transmis au processeur 9.
Ce signal audiophonique numérique est constitué d'une succession de signaux audiophoniques élémentaires dont les fréquences fondamentales diffèrent. Afin d'identifier ces signaux élémentaires, le processeur 9 réalise dans une étape 1 7 une transformée de Fourier locale du signal audiophonique numérique, et détecte les fréquences fondamentales successives de ce signal ainsi que l'emplacement et la durée de chacun des signaux élémentaires. La largeur temporelle de la fenêtre utilisée pour cette transformée de Fourier doit être suffisamment grande pour que cette fenêtre contienne au moins dix périodes du signal élémentaire de plus basse fréquence. Par exemple, pour un signal élémentaire de fréquence fondamentale égale au minimum à 500 Hz, on choisira une fenêtre de largeur égale ou supérieure à 20 ms.
Chaque signal ainsi détecté est un signal quasi-périodique, les variations de ce signal d'une période à une autre étant notamment dues à des signaux parasites et à la variation d'intensité du signal au cours du temps. Cependant, cette intensité peut être considérée comme constante sur une durée de l'ordre de dix périodes, ou comme variant de manière linéaire.
Ainsi, dans une étape 1 9, le processeur 9 décompose le signal audiophonique numérique en signaux élémentaires de fréquences fondamentales fixes, et comprenant chacun au moins dix périodes.
Puis, dans une étape 21 , le processeur 9 analyse chacun de ces signaux élémentaires.
Chaque signal élémentaire x(t) est un signal anharmonique dont la morphologie principale peut être décrite sous la forme suivante :
dans laquelle toute la dépendance temporelle est contenue dans la fonction de phase Φ.
Or, dans un signal anharmonique, la principale contribution à l'anharmonicité provient de la brisure de symétrie de la dynamique de phase. Ainsi, toute l'information dynamique pertinente est exprimée par la dynamique de phase. Lors de l'analyse du signal x(t), il convient donc d'étudier cette phase Φ(ί), et en particulier la dynamique de phase exprimée par la fonction F, dérivée de la fonction Φ par rapport au temps t :
Ainsi, la morphologie du signal x(t) est complètement déterminée par la connaissance de F.
Lors de l'étape d'analyse 21 du procédé selon l'invention, cette fonction F est donc décrite au moyen d'un très petit nombre de paramètres. On entendra par petit nombre de paramètres un nombre de paramètres réduit par rapport au nombre de paramètres
nécessaire à la décomposition de la même fonction, au moyen des séries de Fourier, avec un niveau de précision équivalent.
Cette étape d'analyse 21 comprend ainsi une première étape consistant à exprimer la phase Φ, et en particulier la fonction F, dérivée de Φ par rapport au temps.
Dans la suite de la description, on supposera que le signal est de période 2π, mais l'analyse décrite peut être généralisée à tout signal de période quelconque T, en remplaçant dans les équations les temps t par
Dans le cas le plus simple, et pour un signal de période 2π, la dynamique de phase peut être écrite sous la forme :
appelée équation de phase.
La fonction F présente dans ce cas une symétrie de réflexion par rapport à l'axe Φ=0. Cette expression de la dynamique de phase ne contient qu'un seul paramètre, r, qui varie dans l'intervalle [0,1 ]. La limite r=0 correspond à un signal harmonique, la limite r=1 à un signal infiniment anharmonique.
Le signal x(t), qui peut être écrit sous la forme :
où Φ0 est une origine de phase, est décomposé et réécrit sous une forme faisant intervenir les paramètres r et Φ0 :
Ainsi, la décomposition du signal x(t) fait intervenir seulement deux paramètres, r et Φ0.
r, appelé paramètre d'anharmonicité, mesure le degré d'anharmonicité du signal, la limite r=0 correspond à un signal harmonique, la limite r=1 à un signal infiniment anharmonique. Par ailleurs, le paramètre Φ0, qui définit la composition du signal dans les deux fonctions hcos et hsin, est un paramètre de morphologie, qui correspond à l'angle de symétrie de réflexion de la dynamique de phase.
Dans le cas général, c'est-à-dire pour un signal périodique quelconque, l'équation de phase peut s'écrire sous la forme :
dans laquelle Pn et Qm sont des polynômes trigonométriques de degrés respectifs n et m. La forme générale d'un polynôme trigonométrique de degré n est :
L'analyse du signal x(t) consiste alors à déterminer une expression de Φ faisant intervenir un petit nombre de paramètres, ce qui permet de déterminer une expression du signal x(t) en fonction de ces paramètres.
La factorisation du polynôme Ρη(Φ) permet de transformer en une somme de termes simples, ce qui permet de réécrire l'équation de phase sous la forme :
dans laquelle les paramètres rk, compris entre 0 et 1 , mesurent l'anharmonicité du signal x(t), et les paramètres Φκ caractérisent sa morphologie.
La période T du signal peut être déterminée en intégrant cette équation par rapport à Φ, entre 0 et 2π :
A partir de ce résultat, et des contraintes selon lesquelles la période est égale à 2π et le signal est harmonique lorsque les coefficients rk sont tous nuls, l'équation de phase peut être exprimée ainsi :
La définition des fonctions des fonctions polycos et polysin, notées pcosn et psinn, qui s'expriment par :
et possèdent entre autre les propriétés suivantes :
La résolution de cette équation permet d'accéder à une expression analytique de ί(Φ), qui s'exprime par :
Le temps t est donc exprimé en fonction de la phase Φ, et de manière duale la phase Φ est exprimée en fonction du temps t, à l'aide de paramètres indépendants clairement définis, qui mesurent l'anharmonicité (paramètres r ou rk), et la morphologie (paramètres Φ0 ou φκ).
Ainsi, lors de l'étape 21 d'analyse, le processeur 9 code le signal x(t) au moyen d'un petit nombre de paramètres.
Selon un mode de réalisation, le signal élémentaire x(t) est décrit de manière quasi-exacte par une amplitude, une période T, une harmonicité r et une morphologie Φ0.
Selon un autre mode de réalisation, le signal élémentaire x(t) est décrit de manière encore plus précise par deux couples de paramètres (r1 ; et (r2, φ2), complétés de leurs poids respectifs.
Chacun des signaux élémentaires constituant le signal audiophonique numérique est donc caractérisé par un nombre restreint de paramètres, porteurs d'un sens physique car représentatifs de la non-linéarité et de la morphologie de ces signaux.
Après l'analyse des signaux élémentaires, le processeur commande en 23 l'enregistrement dans la mémoire des paramètres caractéristiques déterminés lors des étapes 17, 19 et 21 , c'est-à-dire la position temporelle, la durée, l'amplitude et la fréquence fondamentale de chaque signal élémentaire, ainsi que les paramètres de morphologie et d'harmonicité caractéristiques de la forme d'onde de chaque signal élémentaire, donc de leur timbre.
Il est alors possible, à partir de la seule donnée de ces paramètres, de synthétiser un signal très proche du signal audiophonique numérique d'origine, sans déformation du timbre d'origine.
Le procédé et le système selon l'invention permettent ainsi de décomposer un signal et de coder celui-ci à l'aide d'un nombre restreint de paramètres, et ce avec une plus grande précision que la décomposition en série de Fourier. Cette compacité permet de réduire l'espace nécessaire au stockage de ces signaux, d'augmenter le débit des canaux de transmission et d'améliorer la qualité de restitution des sons resynthétisés.
De plus, contrairement aux coefficients de Fourier, les paramètres déterminés lors de la décomposition suivant le procédé selon l'invention ont un fort sens physique et permettent de décrire l'anharmonicité et la morphologie du signal.
Il devra toutefois être compris que l'exemple de réalisation présenté ci-dessus n'est pas limitatif, et que le procédé et le système selon l'invention peuvent être mis en œuvre pour la décomposition de signaux audiophoniques autres que des signaux produits par des instruments de musique.
Notamment, le procédé selon l'invention peut être efficacement utilisé pour la reconnaissance ou l'identification vocale, contexte dans lequel les signaux comportent des composantes non-linéaires fortes qui constituent une signature discriminante de ces signaux. De la même manière, le procédé peut être utilisé pour la caractérisation des troubles phoniatriques et phonologiques et l'évaluation de leur évolution.
Claims
1 . - Procédé de décomposition d'un signal audiophonique (1 ), dont la forme générale peut être exprimée par où Φ(ί) est la phase du signal,
caractérisé en ce qu'il comprend les étapes suivantes :
- détermination (21 ) d'une expression de l'équation de phase
- détermination (21 ) d'une expression de la phase Φ(ί) en fonction de paramètres (r, rk,
2. - Procédé de décomposition d'un signal audiophonique (1 ) selon la revendication 1 , caractérisé en ce que l'équation de phase est exprimée sous la forme :
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal.
3. - Procédé de décomposition d'un signal audiophonique selon la revendication 2, caractérisé en ce que le signal x(t) est exprimé au moyen de deux paramètres r et Φ0, sous la forme :
4. - Procédé de décomposition d'un signal audiophonique selon la revendication 1 , caractérisé en ce que l'équation de phase est exprimée sous la forme :
dans laquelle Ρ(Φ) et Ο(Φ) sont des polynômes trigonométriques.
5. - Procédé de décomposition d'un signal audiophonique selon la revendication 4, caractérisé en ce que l'expression de la phase Φ(ί) est déterminée sous la forme :
dans laquelle les fonctions psiri! et pcosi sont définis par :
6. - Système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par est la phase du signal, caractérisé
en ce qu'il comprend :
- des moyens (9) pour déterminer une expression de l'équation de phase et
- des moyens (9) pour déterminer une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir
7. - Système de décomposition d'un signal audiophonique selon la revendication 6, caractérisé en ce qu'il comprend des moyens (9) pour exprimer l'équation de phase sous la forme :
dans laquelle r, variant dans [0,1], est un paramètre mesurant l'anharmonicité dudit signal.
8. - Système de décomposition d'un signal audiophonique selon la revendication 7, caractérisé en ce qu'il comprend des moyens (9) pour exprimer le signal x(t) au moyen de deux paramètres r et Φ0, sous la forme :
9. - Système de décomposition d'un signal audiophonique selon la revendication 6, caractérisé en ce qu'il comprend des moyens (9) pour exprimer l'équation de phase sous la forme : ( )
dans laquelle Ρ(Φ) et Ο(Φ) sont des polynômes trigonométriques.
10.- Système de décomposition d'un signal audiophonique selon la revendication 9, caractérisé en ce qu'il comprend des moyens (9) pour déterminer l'expression de la phase Φ(ί) sous la forme :
dans laquelle les fonctions psin1 et pcos1 sont définis par :
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1052878A FR2959038A1 (fr) | 2010-04-15 | 2010-04-15 | Procede et systeme d'analyse et de codage de signaux audiophoniques |
FR1052878 | 2010-04-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
WO2011128582A2 true WO2011128582A2 (fr) | 2011-10-20 |
WO2011128582A3 WO2011128582A3 (fr) | 2012-01-12 |
Family
ID=43658520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/FR2011/050839 WO2011128582A2 (fr) | 2010-04-15 | 2011-04-12 | Procédé et système d'analyse et de codage de signaux audiophoniques |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR2959038A1 (fr) |
WO (1) | WO2011128582A2 (fr) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2955187A1 (fr) * | 2010-01-08 | 2011-07-15 | Centre Nat Rech Scient | Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant |
-
2010
- 2010-04-15 FR FR1052878A patent/FR2959038A1/fr not_active Withdrawn
-
2011
- 2011-04-12 WO PCT/FR2011/050839 patent/WO2011128582A2/fr active Application Filing
Non-Patent Citations (1)
Title |
---|
None |
Also Published As
Publication number | Publication date |
---|---|
FR2959038A1 (fr) | 2011-10-21 |
WO2011128582A3 (fr) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8467892B2 (en) | Content-based audio comparisons | |
US20110314995A1 (en) | Intervalgram Representation of Audio for Melody Recognition | |
EP0801790B1 (fr) | Procede de codage de parole a analyse par synthese | |
FR3001593A1 (fr) | Correction perfectionnee de perte de trame au decodage d'un signal. | |
FR2955187A1 (fr) | Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant | |
WO1996021218A1 (fr) | Procede de codage de parole a analyse par synthese | |
EP2795618B1 (fr) | Procédé de détection d'une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d'ordinateur correspondant | |
EP0721180A1 (fr) | Procédé de codage de parole à analyse par synthèse | |
EP0685833A1 (fr) | Procédé de codage de parole à prédiction linéaire | |
WO2011128582A2 (fr) | Procédé et système d'analyse et de codage de signaux audiophoniques | |
FR2905489A1 (fr) | Procede d'estimation de phase pour la modelisation sinusoidale d'un signal numerique. | |
EP1116216A1 (fr) | Procede et dispositif de detection d'activite vocale | |
WO2006032751A1 (fr) | Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio | |
EP1982330A2 (fr) | Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants | |
EP1438707A2 (fr) | Procede de caracterisation du timbre d'un signal sonore selon au moins un descripteur | |
EP1605440B1 (fr) | Procédé de séparation de signaux sources à partir d'un signal issu du mélange | |
CA2796172C (fr) | Procede et systeme d'analyse de l'activite cardiaque d'un patient et applications correspondantes | |
JPH1020886A (ja) | 波形データに存在する調和波形成分の検出方式 | |
FR2751776A1 (fr) | Procede d'extraction de la frequence fondamentale d'un signal de parole | |
EP1194923B1 (fr) | Procedes et dispositifs d'analyse et de synthese audio | |
EP1192618B1 (fr) | Codage audio avec liftrage adaptif | |
WO2014096734A1 (fr) | Procede et dispositif de conversion numerique d'un signal d'entree derive d'un signal electrique delivre par une chaine d'acquisition d'un capteur | |
FR2988512A1 (fr) | Detection d'un son transitoire dans un signal audio | |
WO2011151598A1 (fr) | Procede et systeme de synthese de signaux periodiques anharmoniques et instrument de musique comprenant un tel systeme | |
WO2015189419A1 (fr) | Analyse frequentielle par demolation de phase d'un signal acoustique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11719353 Country of ref document: EP Kind code of ref document: A2 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11719353 Country of ref document: EP Kind code of ref document: A2 |