WO2011128582A2 - Procédé et système d'analyse et de codage de signaux audiophoniques - Google Patents

Procédé et système d'analyse et de codage de signaux audiophoniques Download PDF

Info

Publication number
WO2011128582A2
WO2011128582A2 PCT/FR2011/050839 FR2011050839W WO2011128582A2 WO 2011128582 A2 WO2011128582 A2 WO 2011128582A2 FR 2011050839 W FR2011050839 W FR 2011050839W WO 2011128582 A2 WO2011128582 A2 WO 2011128582A2
Authority
WO
WIPO (PCT)
Prior art keywords
signal
phase
audiophonic
parameters
decomposing
Prior art date
Application number
PCT/FR2011/050839
Other languages
English (en)
Other versions
WO2011128582A3 (fr
Inventor
Patrick Hanusse
Original Assignee
Centre National De La Recherche Scientifique (C.N.R.S.)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National De La Recherche Scientifique (C.N.R.S.) filed Critical Centre National De La Recherche Scientifique (C.N.R.S.)
Publication of WO2011128582A2 publication Critical patent/WO2011128582A2/fr
Publication of WO2011128582A3 publication Critical patent/WO2011128582A3/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Definitions

  • the present invention relates to a method and system for decomposing an audiophonic signal, the general form of which can be expressed by where ⁇ ( ⁇ ) is the phase of the signal.
  • It relates in particular to the analysis and coding of elementary audio signals, as generated by a musical instrument, or voice signals.
  • a real audiophonic signal generally comprises low frequency aperiodic signals constituting the envelope of the signal, modulated by one or more periodic signals, for example generated by musical instruments.
  • each periodic signal i.e. the shape of this signal over a period
  • the waveform of each periodic signal is characteristic of the timbre of this signal.
  • the simplest waveform, corresponding to a linear signal, is a sinusoid, whose frequency is characteristic of the height of the sound signal, and whose amplitude determines the intensity of this sound signal.
  • Square, triangular, or sawtooth waveforms are also classic shapes.
  • real sound signals for example generated by a musical instrument
  • Fourier series decomposition breaks down any type of periodic signal, and is used by many audio coding methods, such as MP3 encoding.
  • audio coding methods such as MP3 encoding.
  • their decomposition in Fourier series requires the retention of a large number of coefficients, coefficients which are difficult to give a physical meaning.
  • the purpose of the invention is therefore to enable the analysis and the representation, thus the coding and the synthesis, of an audiophonic signal, whatever its anharmonicity, by means of a small number of parameters, with respect to the number of parameters necessary for encoding and synthesis by Fourier series, said parameters being carrying a physical meaning and constituting a simple and explicit signature of the waveform of this signal, therefore the timbre of this signal.
  • the subject of the invention is a process of the aforementioned type, characterized in that it comprises the following steps:
  • the method according to the invention makes it possible to analyze an audiophonic signal by reducing the number of parameters necessary for its coding, compared to the decomposition methods according to the state of the art.
  • these parameters have a physical meaning, which makes it possible to compare several signals by directly comparing the parameters resulting from their decomposition.
  • the method according to the invention also comprises the following characteristics, taken separately or in combination:
  • phase equation is expressed in the form:
  • r varying in [0,1] is a parameter measuring the anharmonicity of said signal
  • the signal x (t) is expressed by means of two parameters r and ⁇ 0 , in the form:
  • phase equation is expressed in the form:
  • ⁇ ( ⁇ ) and 0 ( ⁇ ) are trigonometric polynomials
  • the subject of the invention is a system for decomposing an audiophonic signal, the general form of which can be expressed by where ⁇ ( ⁇ ) is the phase of the signal, characterized in that
  • the system according to the invention also comprises the following characteristics, taken separately or in combination:
  • the system comprises means for expressing the phase equation in the form:
  • r varying in [0,1] is a parameter measuring the anharmonicity of said signal
  • the system comprises means for expressing the signal x (t) by means of two parameters r and ⁇ 0 , in the form:
  • the system comprises means for expressing the phase equation in the form:
  • ⁇ ( ⁇ ) and Q ( ⁇ ) are trigonometric polynomials
  • the system comprises means for determining the expression of the phase ⁇ (t) in the form:
  • FIG. 1 represents the form of an elementary audio signal
  • FIG. 2 is a diagram showing a system for decomposing an audiophonic signal according to one embodiment of the invention.
  • FIG. 3 is a block diagram illustrating the method of decomposing an audiophonic signal according to one embodiment of the invention.
  • FIG. 1 shows the form of an elementary audiophonic signal 1, as produced by a musical instrument, or a voice signal, the time being plotted on the abscissa and the amplitude of the signal on the ordinate.
  • This signal 1 is quasi-periodic, of period T. The variations of this signal from one period to another are notably due to parasitic signals, constituting a white noise, and to the variation of signal intensity during time.
  • the signal 1 is a strongly non-linear signal consisting of a signal at a fundamental frequency f, inverse of the period T, and a plurality of signals of higher frequencies.
  • FIG. 2 illustrates an embodiment of the system according to the invention.
  • This system comprises means 3 for acquiring audio signals, for example a microphone, and means 5 for processing and analyzing such signals, comprising an analog / digital converter 7, means 9 for analyzing digital audio signals. , for example a processor.
  • the system also includes storage means 10, for example a ROM.
  • the microphone 3 is able to convert sound waves from a musical instrument 1 1 into electrical pulses, forming an analog audio signal.
  • the analog / digital converter 7 is adapted to digitize an analog audio signal, by sampling this signal with a predetermined sampling frequency and quantization of this signal.
  • the processor 9 is able to analyze an audiophonic signal so as to encode this signal by means of characteristic parameters of this signal.
  • FIG. 3 is a block diagram illustrating the acquisition and analysis of an audiophonic signal by means of the system described with reference to FIG. 2, according to one embodiment of the invention.
  • the musical instrument 1 1 emits sound waves, the fundamental frequency of which varies over time. These waves are perceived by the microphone 3, which converts them into electrical pulses constituting an analog audio signal, and immediately transmits this signal to the analog / digital converter 7, continuously.
  • the analog to digital converter 7 digitizes the analog audio signal, by sampling and quantizing.
  • the sampling of the signal is for example carried out with a sampling frequency of 44100 Hz, which is the sampling frequency of the audiophonic signals on a compact disc.
  • the digital audio signal is then transmitted to the processor 9.
  • This digital audiophonic signal consists of a succession of elementary audiophonic signals whose fundamental frequencies differ.
  • the processor 9 carries out in a step 1 7 a local Fourier transform of the digital audiophonic signal, and detects the successive fundamental frequencies of this signal as well as the location and the duration of each of the elementary signals.
  • the temporal width of the window used for this Fourier transform must be large enough for this window to contain at least ten periods of the elementary signal of lower frequency. For example, for a fundamental frequency elementary signal equal to at least 500 Hz, a window width equal to or greater than 20 ms will be chosen.
  • Each signal thus detected is a quasi-periodic signal, the variations of this signal from one period to another being notably due to parasitic signals and to the variation of signal intensity over time.
  • this intensity can be considered constant over a period of the order of ten periods, or as linearly varying.
  • the processor 9 breaks down the digital audio signal into elementary signals of fixed fundamental frequencies, and each comprising at least ten periods.
  • the processor 9 analyzes each of these elementary signals.
  • Each elementary signal x (t) is an anharmonic signal whose main morphology can be described in the following form:
  • phase dynamics all relevant dynamic information is expressed by phase dynamics.
  • this function F is therefore described by means of a very small number of parameters.
  • a small number of parameters will be understood to mean a reduced number of parameters relative to the number of parameters necessary for the decomposition of the same function, by means of the Fourier series, with an equivalent level of precision.
  • This analysis step 21 thus comprises a first step of expressing the phase ⁇ , and in particular the function F, derived from ⁇ with respect to time.
  • phase dynamics can be written in the form:
  • phase dynamics contains only one parameter, r, which varies in the interval [0,1].
  • ⁇ 0 is a phase origin, is decomposed and rewritten in a form involving the parameters r and ⁇ 0 :
  • the decomposition of the signal x (t) involves only two parameters, r and ⁇ 0 .
  • the parameter ⁇ 0 which defines the composition of the signal in the two functions hcos and hsin, is a morphology parameter, which corresponds to the angle of reflection symmetry of the phase dynamics.
  • the phase equation can be written in the form:
  • P n and Q m are trigonometric polynomials of respective degrees n and m.
  • the general form of a trigonometric polynomial of degree n is:
  • the analysis of the signal x (t) then consists in determining an expression of ⁇ involving a small number of parameters, which makes it possible to determine an expression of the signal x (t) as a function of these parameters.
  • phase equation (4) can be rewritten in the form:
  • the period T of the signal can be determined by integrating this equation with respect to ⁇ , between 0 and 2 ⁇ :
  • phase equation can be expressed as follows:
  • the time t is thus expressed as a function of the phase ⁇ , and in a dual way the phase ⁇ is expressed as a function of the time t, using clearly defined independent parameters, which measure the anharmonicity (parameters r or r k ) , and the morphology (parameters ⁇ 0 or ⁇ ).
  • the processor 9 codes the signal x (t) by means of a small number of parameters.
  • the elementary signal x (t) is described almost exactly by an amplitude, a period T, an harmonicity r and a morphology ⁇ 0 .
  • the elementary signal x (t) is described even more precisely by two pairs of parameters (r 1, and (r 2 , ⁇ 2 ), supplemented by their respective weights.
  • Each of the elementary signals constituting the digital audiophonic signal is therefore characterized by a limited number of parameters, carrying a physical meaning because representative of the non-linearity and the morphology of these signals.
  • the processor controls the recording in the memory of the characteristic parameters determined during the steps 17, 19 and 21, that is to say the time position, the duration, the amplitude and the fundamental frequency of each elemental signal, as well as the parameters of morphology and harmonicity characteristic of the waveform of each elemental signal, and therefore of their timbre.
  • the method and the system according to the invention thus make it possible to decompose a signal and to code it using a limited number of parameters, and with greater precision than the Fourier series decomposition.
  • This compactness makes it possible to reduce the space required for storing these signals, to increase the bit rate of the transmission channels and to improve the quality of reproduction of the resynthesized sounds.
  • the parameters determined during the decomposition according to the method according to the invention have a strong physical meaning and make it possible to describe the anharmonicity and the morphology of the signal.
  • the method according to the invention can be effectively used for voice recognition or identification, in which context the signals comprise strong non-linear components which constitute a discriminant signature of these signals.
  • the method can be used for the characterization of phoniatric and phonological disorders and the evaluation of their evolution.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Ce procédé de décomposition d'un signal audiophonique dont la forme générale peut être exprimée par x(t) = x 0 + χ 1cos(Φ(t)), où Φ(t) est la phase du signal est caractérisé en ce qu'il comprend les étapes de détermination (21) d'une expression de l'équation de phase (I), et de détermination (21) d'une expression de la phase Φ(t) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcosn et psinn définies par : (II).

Description

Procédé et système d'analyse et de codage de signaux audiophoniques
La présente invention concerne un procédé et un système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par
Figure imgf000003_0001
où Φ(ί) est la phase du signal.
Elle concerne en particulier l'analyse et le codage de signaux audiophoniques élémentaires, tels que générés par un instrument de musique, ou des signaux vocaux.
La description des signaux audiophoniques et leur codage au moyen de paramètres sont une préoccupation ancienne, ce codage permettant de minimiser l'espace nécessaire à leur stockage ou le débit nécessaire à leur transmission, par exemple à travers un réseau de communication, tout en conservant toute l'information nécessaire à la synthèse du signal.
Un signal audiophonique réel comprend généralement des signaux apériodiques de basses fréquences, constituant l'enveloppe du signal, modulés par un ou plusieurs signaux périodiques, par exemple générés par des instruments de musique.
La forme d'onde de chaque signal périodique, c'est-à-dire la forme de ce signal sur une période, est caractéristique du timbre de ce signal. La forme d'onde la plus simple, correspondant à un signal linéaire, est une sinusoïde, dont la fréquence est caractéristique de la hauteur du signal sonore, et dont l'amplitude détermine l'intensité de ce signal sonore. Les formes d'onde carrées, triangulaires, ou en dent de scie, sont également des formes classiques.
Cependant, les signaux sonores réels, par exemple générés par un instrument de musique, sont généralement fortement anharmoniques, c'est-à-dire non-linéaires, et présentent des formes d'ondes plus complexes, car ils résultent de la superposition de multiples signaux de fréquences différentes.
La décomposition de tels signaux est généralement effectuée au moyen des séries de Fourier, introduites en 1822 par Joseph Fourier. Cette technique consiste à décomposer un signal périodique de fréquence f en une somme infinie de fonctions sinusoïdales de fréquences multiples de f. Tout signal périodique x(t) de période T=1 /f peut ainsi être exprimé comme une somme de fonctions sinusoïdales, du type :
Figure imgf000003_0002
Les coefficients cn, appelés coefficients de Fourier, qui sont définis par la formule :
Figure imgf000004_0001
constituent un codage du signal x(t). A partir de cette analyse, la donnée des coefficients cn permet de synthétiser le signal x(t).
Afin d'augmenter la compacité de ce codage, il convient de limiter le nombre de coefficients cn, à priori infini, et de ne conserver que les premiers termes de l'expression (1 ). Ces termes doivent cependant être en nombre suffisant pour que le signal synthétisé à partir du codage soit aussi proche que possible du signal x(t) d'origine.
La décomposition en séries de Fourier permet de décomposer tout type de signal périodique, et elle est utilisée par de nombreuses méthodes de codage audio, par exemple le codage MP3. Cependant, les signaux sonores étant généralement fortement non-linéaires, leur décomposition en séries de Fourier nécessite de conserver un grand nombre de coefficients, coefficients auxquels il est difficile de donner un sens physique.
L'invention a donc pour but de permettre l'analyse et la représentation, donc le codage et la synthèse, d'un signal audiophonique, quelle que soit son anharmonicité, au moyen d'un petit nombre de paramètres, par rapport au nombre de paramètres nécessaires au codage et à la synthèse par série de Fourier, lesdits paramètres étant porteurs d'un sens physique et constituant une signature simple et explicite de la forme d'onde de ce signal, donc du timbre de ce signal.
A cet effet, l'invention a pour objet un procédé du type précité, caractérisé en ce qu'il comprend les étapes suivantes :
- détermination d'une expression de l'équation de phase Γ
- détermination d'une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcosn et psinn définies par :
Figure imgf000004_0002
Ainsi réalisé, le procédé selon l'invention permet d'analyser un signal audiophonique en réduisant le nombre de paramètres nécessaire à son codage, par rapport aux procédés de décomposition selon l'état de la technique. De plus, ces paramètres ont un sens physique, ce qui permet de comparer plusieurs signaux en comparant directement les paramètres issus de leur décomposition. Le procédé selon l'invention comporte également les caractéristiques suivantes, prises séparément ou en combinaison :
- l'équation de phase est exprimée sous la forme :
Figure imgf000005_0001
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal ;
- le signal x(t) est exprimé au moyen de deux paramètres r et Φ0, sous la forme :
Figure imgf000005_0002
où α les fonctions hsin et hcos étant définies par :
Figure imgf000005_0010
Figure imgf000005_0003
- l'équation de phase est exprimée sous la forme :
Figure imgf000005_0004
dans laquelle Ρ(φ) et 0(φ) sont des polynômes trigonométriques ;
- l'expression de la phase φ(ί) est déterminée sous la forme :
Figure imgf000005_0005
dans laquelle les fonctions psin1 et pcos1 sont définis par :
Figure imgf000005_0006
Selon un autre aspect, l'invention a pour objet un système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par où Φ(ί) est la phase du signal, caractérisé en ce qu'il
Figure imgf000005_0009
comprend :
- des moyens pour déterminer une expression de l'équation de phase
Figure imgf000005_0008
et
- des moyens pour déterminer une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcoSn et psinn définies par :
Figure imgf000005_0007
Le système selon l'invention comporte également les caractéristiques suivantes, prises séparément ou en combinaison :
- le système comprend des moyens pour exprimer l'équation de phase sous la forme :
Figure imgf000006_0001
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal ;
- le système comprend des moyens pour exprimer le signal x(t) au moyen de deux paramètres r et Φ0, sous la forme :
Figure imgf000006_0002
où , les fonctions hsin et hcos étant définies par :
Figure imgf000006_0008
Figure imgf000006_0003
Figure imgf000006_0004
- le système comprend des moyens pour exprimer l'équation de phase sous la forme :
Figure imgf000006_0005
dans laquelle Ρ(Φ) et Q(Φ) sont des polynômes trigonométriques ;
- le système comprend des moyens pour déterminer l'expression de la phase Φ(t) sous la forme :
Figure imgf000006_0006
dans laquelle les fonctions psirii et pcosi sont définis par :
Figure imgf000006_0007
L'invention sera mieux comprise au regard d'un exemple de réalisation de l'invention qui va maintenant être décrit en faisant référence aux figures annexées parmi lesquelles :
la figure 1 représente la forme d'un signal audiophonique élémentaire ;
- la figure 2 est un schéma représentant un système de décomposition d'un signal audiophonique selon un mode de réalisation de l'invention ; et
- la figure 3 est un schéma synoptique illustrant le procédé de décomposition d'un signal audiophonique selon un mode de réalisation de l'invention. On a représenté sur la figure 1 , la forme d'un signal audiophonique élémentaire 1 , tel que produit par un instrument de musique, ou un signal vocal, le temps étant porté en abscisse et l'amplitude du signal en ordonnée. Ce signal 1 est quasi-périodique, de période T. Les variations de ce signal d'une période à une autre sont notamment dues à des signaux parasites, constitutifs d'un bruit blanc, et à la variation d'intensité du signal au cours du temps.
Le signal 1 est un signal fortement non-linéaire, constitué d'un signal à une fréquence fondamental f, inverse de la période T, et d'une pluralité de signaux de fréquences plus élevées.
La figure 2 illustre un mode de réalisation du système selon l'invention. Ce système comprend des moyens 3 d'acquisition de signaux audiophoniques, par exemple un microphone, et des moyens 5 de traitement et d'analyse de tels signaux, comprenant un convertisseur analogique/numérique 7, des moyens 9 d'analyse de signaux audiophoniques numériques, par exemple un processeur. Le système comprend également des moyens 10 de mémorisation, par exemple une mémoire ROM.
Le microphone 3 est apte à convertir des ondes sonores issues d'un instrument de musique 1 1 en impulsions électriques, formant un signal audiophonique analogique.
Le convertisseur analogique/numérique 7 est apte à numériser un signal audiophonique analogique, par échantillonnage de ce signal avec une fréquence d'échantillonnage prédéterminée et quantification de ce signal.
Le processeur 9 est apte à analyser un signal audiophonique de manière à coder ce signal au moyen de paramètres caractéristiques de ce signal.
La figure 3 est un schéma synoptique illustrant l'acquisition et l'analyse d'un signal audiophonique au moyen du système décrit en référence à la figure 2, selon un mode de réalisation de l'invention.
Dans une étape 13 d'acquisition, l'instrument de musique 1 1 émet des ondes sonores, dont la fréquence fondamentale varie au cours du temps. Ces ondes sont perçues par le microphone 3, qui les convertit en impulsions électriques constituant un signal audiophonique analogique, et transmet immédiatement ce signal au convertisseur analogique/numérique 7, de manière continue.
Dans une étape 15 de numérisation, le convertisseur analogique/numérique 7 numérise le signal audiophonique analogique, par échantillonnage et quantification. L'échantillonnage du signal est par exemple réalisé avec une fréquence d'échantillonnage de 44100 Hz, qui est la fréquence d'échantillonnage des signaux audiophoniques sur un disque compact. Le signal audiophonique numérique est alors transmis au processeur 9. Ce signal audiophonique numérique est constitué d'une succession de signaux audiophoniques élémentaires dont les fréquences fondamentales diffèrent. Afin d'identifier ces signaux élémentaires, le processeur 9 réalise dans une étape 1 7 une transformée de Fourier locale du signal audiophonique numérique, et détecte les fréquences fondamentales successives de ce signal ainsi que l'emplacement et la durée de chacun des signaux élémentaires. La largeur temporelle de la fenêtre utilisée pour cette transformée de Fourier doit être suffisamment grande pour que cette fenêtre contienne au moins dix périodes du signal élémentaire de plus basse fréquence. Par exemple, pour un signal élémentaire de fréquence fondamentale égale au minimum à 500 Hz, on choisira une fenêtre de largeur égale ou supérieure à 20 ms.
Chaque signal ainsi détecté est un signal quasi-périodique, les variations de ce signal d'une période à une autre étant notamment dues à des signaux parasites et à la variation d'intensité du signal au cours du temps. Cependant, cette intensité peut être considérée comme constante sur une durée de l'ordre de dix périodes, ou comme variant de manière linéaire.
Ainsi, dans une étape 1 9, le processeur 9 décompose le signal audiophonique numérique en signaux élémentaires de fréquences fondamentales fixes, et comprenant chacun au moins dix périodes.
Puis, dans une étape 21 , le processeur 9 analyse chacun de ces signaux élémentaires.
Chaque signal élémentaire x(t) est un signal anharmonique dont la morphologie principale peut être décrite sous la forme suivante :
Figure imgf000008_0001
dans laquelle toute la dépendance temporelle est contenue dans la fonction de phase Φ.
Or, dans un signal anharmonique, la principale contribution à l'anharmonicité provient de la brisure de symétrie de la dynamique de phase. Ainsi, toute l'information dynamique pertinente est exprimée par la dynamique de phase. Lors de l'analyse du signal x(t), il convient donc d'étudier cette phase Φ(ί), et en particulier la dynamique de phase exprimée par la fonction F, dérivée de la fonction Φ par rapport au temps t :
Figure imgf000008_0002
Ainsi, la morphologie du signal x(t) est complètement déterminée par la connaissance de F.
Lors de l'étape d'analyse 21 du procédé selon l'invention, cette fonction F est donc décrite au moyen d'un très petit nombre de paramètres. On entendra par petit nombre de paramètres un nombre de paramètres réduit par rapport au nombre de paramètres nécessaire à la décomposition de la même fonction, au moyen des séries de Fourier, avec un niveau de précision équivalent.
Cette étape d'analyse 21 comprend ainsi une première étape consistant à exprimer la phase Φ, et en particulier la fonction F, dérivée de Φ par rapport au temps.
Dans la suite de la description, on supposera que le signal est de période 2π, mais l'analyse décrite peut être généralisée à tout signal de période quelconque T, en remplaçant dans les équations les temps t par
Figure imgf000009_0006
Dans le cas le plus simple, et pour un signal de période 2π, la dynamique de phase peut être écrite sous la forme :
Figure imgf000009_0001
appelée équation de phase.
La fonction F présente dans ce cas une symétrie de réflexion par rapport à l'axe Φ=0. Cette expression de la dynamique de phase ne contient qu'un seul paramètre, r, qui varie dans l'intervalle [0,1 ]. La limite r=0 correspond à un signal harmonique, la limite r=1 à un signal infiniment anharmonique.
Le signal x(t), qui peut être écrit sous la forme :
Figure imgf000009_0002
où Φ0 est une origine de phase, est décomposé et réécrit sous une forme faisant intervenir les paramètres r et Φ0 :
Figure imgf000009_0003
avec
Figure imgf000009_0005
et dans laquelle on a défini les fonctions hcos et hsin suivantes :
Figure imgf000009_0004
Ainsi, la décomposition du signal x(t) fait intervenir seulement deux paramètres, r et Φ0.
r, appelé paramètre d'anharmonicité, mesure le degré d'anharmonicité du signal, la limite r=0 correspond à un signal harmonique, la limite r=1 à un signal infiniment anharmonique. Par ailleurs, le paramètre Φ0, qui définit la composition du signal dans les deux fonctions hcos et hsin, est un paramètre de morphologie, qui correspond à l'angle de symétrie de réflexion de la dynamique de phase. Dans le cas général, c'est-à-dire pour un signal périodique quelconque, l'équation de phase peut s'écrire sous la forme :
Figure imgf000010_0003
dans laquelle Pn et Qm sont des polynômes trigonométriques de degrés respectifs n et m. La forme générale d'un polynôme trigonométrique de degré n est :
Figure imgf000010_0004
L'analyse du signal x(t) consiste alors à déterminer une expression de Φ faisant intervenir un petit nombre de paramètres, ce qui permet de déterminer une expression du signal x(t) en fonction de ces paramètres.
Avantageusement, l'équation de phase (4) peut être réécrite sous la forme :
Figure imgf000010_0001
La factorisation du polynôme Ρη(Φ) permet de transformer en une somme de termes simples, ce qui permet de réécrire l'équation de phase sous la forme :
Figure imgf000010_0005
dans laquelle les paramètres rk, compris entre 0 et 1 , mesurent l'anharmonicité du signal x(t), et les paramètres Φκ caractérisent sa morphologie.
La période T du signal peut être déterminée en intégrant cette équation par rapport à Φ, entre 0 et 2π :
Figure imgf000010_0002
A partir de ce résultat, et des contraintes selon lesquelles la période est égale à 2π et le signal est harmonique lorsque les coefficients rk sont tous nuls, l'équation de phase peut être exprimée ainsi :
Figure imgf000010_0006
Où la fonction Dk est définie par :
Figure imgf000010_0007
Et vérifie :
Figure imgf000011_0003
La définition des fonctions des fonctions polycos et polysin, notées pcosn et psinn, qui s'expriment par :
Figure imgf000011_0004
et possèdent entre autre les propriétés suivantes :
Figure imgf000011_0001
permet de réécrire l'équation de phase sous la forme :
Figure imgf000011_0002
La résolution de cette équation permet d'accéder à une expression analytique de ί(Φ), qui s'exprime par :
Figure imgf000011_0005
Le temps t est donc exprimé en fonction de la phase Φ, et de manière duale la phase Φ est exprimée en fonction du temps t, à l'aide de paramètres indépendants clairement définis, qui mesurent l'anharmonicité (paramètres r ou rk), et la morphologie (paramètres Φ0 ou φκ).
Ainsi, lors de l'étape 21 d'analyse, le processeur 9 code le signal x(t) au moyen d'un petit nombre de paramètres.
Selon un mode de réalisation, le signal élémentaire x(t) est décrit de manière quasi-exacte par une amplitude, une période T, une harmonicité r et une morphologie Φ0. Selon un autre mode de réalisation, le signal élémentaire x(t) est décrit de manière encore plus précise par deux couples de paramètres (r1 ; et (r2, φ2), complétés de leurs poids respectifs.
Chacun des signaux élémentaires constituant le signal audiophonique numérique est donc caractérisé par un nombre restreint de paramètres, porteurs d'un sens physique car représentatifs de la non-linéarité et de la morphologie de ces signaux.
Après l'analyse des signaux élémentaires, le processeur commande en 23 l'enregistrement dans la mémoire des paramètres caractéristiques déterminés lors des étapes 17, 19 et 21 , c'est-à-dire la position temporelle, la durée, l'amplitude et la fréquence fondamentale de chaque signal élémentaire, ainsi que les paramètres de morphologie et d'harmonicité caractéristiques de la forme d'onde de chaque signal élémentaire, donc de leur timbre.
Il est alors possible, à partir de la seule donnée de ces paramètres, de synthétiser un signal très proche du signal audiophonique numérique d'origine, sans déformation du timbre d'origine.
Le procédé et le système selon l'invention permettent ainsi de décomposer un signal et de coder celui-ci à l'aide d'un nombre restreint de paramètres, et ce avec une plus grande précision que la décomposition en série de Fourier. Cette compacité permet de réduire l'espace nécessaire au stockage de ces signaux, d'augmenter le débit des canaux de transmission et d'améliorer la qualité de restitution des sons resynthétisés.
De plus, contrairement aux coefficients de Fourier, les paramètres déterminés lors de la décomposition suivant le procédé selon l'invention ont un fort sens physique et permettent de décrire l'anharmonicité et la morphologie du signal.
Il devra toutefois être compris que l'exemple de réalisation présenté ci-dessus n'est pas limitatif, et que le procédé et le système selon l'invention peuvent être mis en œuvre pour la décomposition de signaux audiophoniques autres que des signaux produits par des instruments de musique.
Notamment, le procédé selon l'invention peut être efficacement utilisé pour la reconnaissance ou l'identification vocale, contexte dans lequel les signaux comportent des composantes non-linéaires fortes qui constituent une signature discriminante de ces signaux. De la même manière, le procédé peut être utilisé pour la caractérisation des troubles phoniatriques et phonologiques et l'évaluation de leur évolution.

Claims

REVEND ICATIONS
1 . - Procédé de décomposition d'un signal audiophonique (1 ), dont la forme générale peut être exprimée par où Φ(ί) est la phase du signal,
Figure imgf000013_0009
caractérisé en ce qu'il comprend les étapes suivantes :
- détermination (21 ) d'une expression de l'équation de phase
Figure imgf000013_0008
- détermination (21 ) d'une expression de la phase Φ(ί) en fonction de paramètres (r, rk,
Φ0, φκ) mesurant l'anharmonicité du signal et sa morphologie, à partir des fonctions pcosn et psinn définies par :
Figure imgf000013_0002
2. - Procédé de décomposition d'un signal audiophonique (1 ) selon la revendication 1 , caractérisé en ce que l'équation de phase est exprimée sous la forme :
Figure imgf000013_0003
dans laquelle r, variant dans [0,1 ], est un paramètre mesurant l'anharmonicité dudit signal.
3. - Procédé de décomposition d'un signal audiophonique selon la revendication 2, caractérisé en ce que le signal x(t) est exprimé au moyen de deux paramètres r et Φ0, sous la forme :
Figure imgf000013_0004
où les fonctions hsin et hcos étant définies par :
Figure imgf000013_0007
Figure imgf000013_0005
4. - Procédé de décomposition d'un signal audiophonique selon la revendication 1 , caractérisé en ce que l'équation de phase est exprimée sous la forme :
Figure imgf000013_0001
dans laquelle Ρ(Φ) et Ο(Φ) sont des polynômes trigonométriques.
5. - Procédé de décomposition d'un signal audiophonique selon la revendication 4, caractérisé en ce que l'expression de la phase Φ(ί) est déterminée sous la forme :
Figure imgf000013_0006
dans laquelle les fonctions psiri! et pcosi sont définis par :
Figure imgf000014_0002
6. - Système de décomposition d'un signal audiophonique, dont la forme générale peut être exprimée par est la phase du signal, caractérisé
Figure imgf000014_0009
en ce qu'il comprend :
- des moyens (9) pour déterminer une expression de l'équation de phase et
Figure imgf000014_0008
- des moyens (9) pour déterminer une expression de la phase Φ(ί) en fonction de paramètres mesurant l'anharmonicité du signal et sa morphologie, à partir
Figure imgf000014_0010
des fonctions pcosn et psinn définies par :
Figure imgf000014_0003
7. - Système de décomposition d'un signal audiophonique selon la revendication 6, caractérisé en ce qu'il comprend des moyens (9) pour exprimer l'équation de phase sous la forme :
Figure imgf000014_0004
dans laquelle r, variant dans [0,1], est un paramètre mesurant l'anharmonicité dudit signal.
8. - Système de décomposition d'un signal audiophonique selon la revendication 7, caractérisé en ce qu'il comprend des moyens (9) pour exprimer le signal x(t) au moyen de deux paramètres r et Φ0, sous la forme :
Figure imgf000014_0005
où , les fonctions hsin et hcos étant définies par :
Figure imgf000014_0007
Figure imgf000014_0001
9. - Système de décomposition d'un signal audiophonique selon la revendication 6, caractérisé en ce qu'il comprend des moyens (9) pour exprimer l'équation de phase sous la forme :
Figure imgf000014_0006
( )
dans laquelle Ρ(Φ) et Ο(Φ) sont des polynômes trigonométriques.
10.- Système de décomposition d'un signal audiophonique selon la revendication 9, caractérisé en ce qu'il comprend des moyens (9) pour déterminer l'expression de la phase Φ(ί) sous la forme :
Figure imgf000015_0001
dans laquelle les fonctions psin1 et pcos1 sont définis par :
Figure imgf000015_0002
PCT/FR2011/050839 2010-04-15 2011-04-12 Procédé et système d'analyse et de codage de signaux audiophoniques WO2011128582A2 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1052878A FR2959038A1 (fr) 2010-04-15 2010-04-15 Procede et systeme d'analyse et de codage de signaux audiophoniques
FR1052878 2010-04-15

Publications (2)

Publication Number Publication Date
WO2011128582A2 true WO2011128582A2 (fr) 2011-10-20
WO2011128582A3 WO2011128582A3 (fr) 2012-01-12

Family

ID=43658520

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2011/050839 WO2011128582A2 (fr) 2010-04-15 2011-04-12 Procédé et système d'analyse et de codage de signaux audiophoniques

Country Status (2)

Country Link
FR (1) FR2959038A1 (fr)
WO (1) WO2011128582A2 (fr)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2955187A1 (fr) * 2010-01-08 2011-07-15 Centre Nat Rech Scient Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None

Also Published As

Publication number Publication date
FR2959038A1 (fr) 2011-10-21
WO2011128582A3 (fr) 2012-01-12

Similar Documents

Publication Publication Date Title
US8467892B2 (en) Content-based audio comparisons
US20110314995A1 (en) Intervalgram Representation of Audio for Melody Recognition
EP0801790B1 (fr) Procede de codage de parole a analyse par synthese
FR3001593A1 (fr) Correction perfectionnee de perte de trame au decodage d'un signal.
FR2955187A1 (fr) Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant
WO1996021218A1 (fr) Procede de codage de parole a analyse par synthese
EP2795618B1 (fr) Procédé de détection d'une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d'ordinateur correspondant
EP0721180A1 (fr) Procédé de codage de parole à analyse par synthèse
EP0685833A1 (fr) Procédé de codage de parole à prédiction linéaire
WO2011128582A2 (fr) Procédé et système d'analyse et de codage de signaux audiophoniques
FR2905489A1 (fr) Procede d'estimation de phase pour la modelisation sinusoidale d'un signal numerique.
EP1116216A1 (fr) Procede et dispositif de detection d'activite vocale
WO2006032751A1 (fr) Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
EP1982330A2 (fr) Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants
EP1438707A2 (fr) Procede de caracterisation du timbre d'un signal sonore selon au moins un descripteur
EP1605440B1 (fr) Procédé de séparation de signaux sources à partir d'un signal issu du mélange
CA2796172C (fr) Procede et systeme d'analyse de l'activite cardiaque d'un patient et applications correspondantes
JPH1020886A (ja) 波形データに存在する調和波形成分の検出方式
FR2751776A1 (fr) Procede d'extraction de la frequence fondamentale d'un signal de parole
EP1194923B1 (fr) Procedes et dispositifs d'analyse et de synthese audio
EP1192618B1 (fr) Codage audio avec liftrage adaptif
WO2014096734A1 (fr) Procede et dispositif de conversion numerique d'un signal d'entree derive d'un signal electrique delivre par une chaine d'acquisition d'un capteur
FR2988512A1 (fr) Detection d'un son transitoire dans un signal audio
WO2011151598A1 (fr) Procede et systeme de synthese de signaux periodiques anharmoniques et instrument de musique comprenant un tel systeme
WO2015189419A1 (fr) Analyse frequentielle par demolation de phase d'un signal acoustique

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11719353

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11719353

Country of ref document: EP

Kind code of ref document: A2