EP1525576B1 - Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps - Google Patents

Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps Download PDF

Info

Publication number
EP1525576B1
EP1525576B1 EP03766165A EP03766165A EP1525576B1 EP 1525576 B1 EP1525576 B1 EP 1525576B1 EP 03766165 A EP03766165 A EP 03766165A EP 03766165 A EP03766165 A EP 03766165A EP 1525576 B1 EP1525576 B1 EP 1525576B1
Authority
EP
European Patent Office
Prior art keywords
spectral
real
block
coefficient
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP03766165A
Other languages
German (de)
English (en)
Other versions
EP1525576A1 (fr
Inventor
Bernd Edler
Stefan Geyersberger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of EP1525576A1 publication Critical patent/EP1525576A1/fr
Application granted granted Critical
Publication of EP1525576B1 publication Critical patent/EP1525576B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Definitions

  • the present invention relates to time-frequency conversion algorithms, and more particularly to such algorithms in conjunction with audio compression concepts.
  • a complex special coefficient can be represented by a first and a second partial spectral coefficient, the first part spectral coefficient being the real part and the second part spectral coefficient being the imaginary part, as desired.
  • the complex spectral coefficient may also be represented by the magnitude as the first partial spectral coefficient and the phase as the second partial spectral coefficient.
  • the input signal is first divided into blocks of a predetermined length by means of multiplication with temporally staggered window functions. Each of these blocks is then converted to a spectral representation by application of the DFT. Do the blocks used each contain L samples, i. H. If the window length is L, the output of the DFT can again be completely described in the form of a total of L values (real and imaginary parts or magnitude and phase values). For example, if the input signal is real, L / 2 results in complex values. When using suitable window functions, the input signal can be reconstructed from this representation with the aid of an inverse DFT.
  • DFT discrete Fourier transformation
  • non-overlapping window functions means a strong limitation on the achievable quality of the spectral decomposition, in particular the separation of different frequency bands.
  • modulated filter banks which are characterized by the possibility of an efficient implementation.
  • MDCT modified discrete cosine transformation
  • the window length L may assume values between N and 2N - 1 due to different degrees of overlap.
  • Fig. 6 shows the decomposition of a time discrete input signal x (n) into the spectral components u k, m , where m represents the temporal block index, ie the time index after the sampling rate reduction, while k is the frequency index or subband index.
  • the sampling frequencies are the same in all subbands, ie the original sampling frequency is reduced by the factor N.
  • filter bank with filters 60 and downstream downsampling elements 62 provides a uniform band division.
  • the above transformation rule may also differ from the above equation, e.g. For example, when the sine function is used instead of the cosine function, or when "+ N / 2" is used instead of "-N / 2". It is also conceivable to use the alternating MDCT / MDST mentioned later (when using k instead of k + 1/2).
  • hP (n) represents the prototype impulse response.
  • Hk (n) is the filter impulse response for the filter associated with subband k.
  • n is the counting index of the time-discrete input signal x (n), while N indicates the number of spectral coefficients.
  • the output values of a real-valued transformation such as the MDCT, which is known not energy conserving, but are only partially usable for applications that require complex-valued spectral components. If, for example, the amounts of the real output values are used as an approximation for the amounts of complex-valued spectral components in the corresponding frequency ranges, then even with sinusoidal input signals of constant amplitude there will be strong fluctuations. Such a procedure thus provides only poor approximations for short-term magnitude spectrums of the input signal.
  • a Scalable and Progressive Audio Codec Vinton and Atlas, IEEE ICASSP 2001, 7-11 May 2001 , Salt Lake City
  • the input signal is windowed by an Kaiser-Bessel window function to produce temporally successive blocks of samples.
  • the blocks of input values are then transformed either by a modified Discrete Cosine Transform (MDCT) or by a Modified Discrete Sine Transform (MDST) depending on a shift index.
  • MDCT modified Discrete Cosine Transform
  • MDST Modified Discrete Sine Transform
  • two temporally adjacent blocks of spectral coefficients are combined into a single complex transformation such that the MDCT block represents the real parts of complex spectral coefficients, while the temporally consecutive MDST block represents the associated imaginary parts of the complex spectral coefficients.
  • the MDCT block represents the real parts of complex spectral coefficients
  • the temporally consecutive MDST block represents the associated imaginary parts of the complex spectral coefficients.
  • the object of the present invention is to provide an improved concept for generating a complex spectral representation of a time-discrete signal.
  • a device for generating a complex spectral representation according to claim 1 a method for generating a complex spectral representation according to claim 18, a device for encoding a discrete-time signal according to claim 19, a method for encoding a discrete-time signal according to claim 20, an apparatus for generating a real spectral representation according to claim 21, a method for generating a real spectral representation according to claim 22 or solved by a computer program according to claim 23.
  • the present invention is based on the finding that a good approximation for a spectral representation of a time-discrete signal from a block-wise real-valued spectral representation of the time-discrete signal can be determined by a first Ambigralkostory and / or a second partial spectral coefficient is calculated by combining at least two real spectral coefficients.
  • This is z. B. the real part / or the imaginary part of an approximated complex spectral coefficient for a particular frequency index by combining two or more real spectral coefficients, preferably in temporal and / or frequency proximity to the complex spectral coefficients to be calculated.
  • the combination is a linear combination, wherein furthermore the real spectral coefficients to be combined before the linear combination, ie an addition or subtraction, can be weighted with constant weighting factors.
  • a linear combination is an addition or subtraction of different linear combination partners, which may or may not be weighted with weighting factors before the linear combination.
  • the weighting factors can be positive or negative real numbers including zero.
  • the two or more real spectral coefficients that are combined to obtain a complex partial spectral coefficient for a frequency index and a (temporal) block index are arranged in frequency and / or temporal proximity.
  • the real spectral coefficients are at a higher or lower by 1 frequency index from the current (temporal) block.
  • the corresponding real spectral coefficients are located in temporal proximity from the immediately preceding time block or the immediately following time block with the same frequency index.
  • the real spectral coefficients of the immediately preceding or immediately following temporal block having a frequency index higher or lower by a frequency index than that Frequency index of the partial spectral coefficient just calculated.
  • the combination rule for calculating a partial spectral coefficient varies depending on whether the frequency index is even or odd.
  • the frequency response - which usually has a bandpass character - should have a desired course for positive frequencies, and should be as small as possible or equal to 0 for negative frequencies.
  • Such a frequency response results from the inventive concept and is considered advantageous for many applications.
  • the properties of this frequency response can be in preferred embodiments z. B. by appropriate adjustment of the weighting factors or by appropriate modification of the window functions of the first transformation to generate the real-valued spectral coefficients are manipulated.
  • the system thus provides many degrees of freedom for adaptation to particular needs, in particular the possibility of not only combining two real spectral coefficients, but also combining more than two real spectral coefficients to provide an even better approximation to a desired frequency response of the overall arrangement to reach.
  • Fig. 1 shows an apparatus for generating a complex spectral representation of a time-discrete signal x (n).
  • the discrete-time signal x (n) is fed to a means 10 for generating a block-wise real-valued spectral representation of the discrete-time signal, the spectral representation having temporally consecutive blocks, each block having a set of spectral coefficients as shown in FIG Fig. 2a to 2b will be explained in more detail.
  • At the output of the device 10 is thus a sequence of consecutive blocks of spectral coefficients that are real-valued spectral coefficients due to the property of the device 10.
  • This sequence of temporally successive blocks of spectral coefficients is fed to a post-processing means 12 to obtain a block-wise complex approximated spectral representation comprising successive blocks, each block having a set of complex approximated spectral coefficients, a complex approximated spectral coefficient being determined by a first Part spectral coefficient and a second spectral coefficient can be displayed, wherein at least the first or the second spectral coefficient is determined by a combination of at least two real spectral coefficients.
  • Fig. 2a to 2c together, they show a sequence of blocks of real-valued spectral coefficients, as determined by means 10 of FIG Fig. 1 be generated.
  • m represents a block index while k represents a frequency index.
  • Fig. 2 shows a block of real-valued spectral coefficients plotted along the frequency axis at the time point or block index (m-1).
  • the block of spectral coefficients comprises spectral coefficients u i, m-1 , where i is a run index, while m-1 is the block index.
  • Fig. 2b shows the same situation, but now for the temporally following block m.
  • Fig. 2c shows the same situation again, but now for the block index (m + 1). This results in the episode of Fig. 2a, 2b, 2c a time course, by an arrow 20 in the Fig. 2a to 2c is symbolized.
  • Fig. 3 shows an alternative representation of the device for generating a complex spectral representation, wherein the discrete-time input signal x (n) in the device 10 for Generating a block-wise real spectral representation is fed in Fig. 3 is denoted by T 1 . It should be noted that this is a first conversion of the time signal, which has been windowed to be in block, into a spectral representation at the output of the device 10.
  • Fig. 3 shows a snapshot at the time or block index m, so refers to Fig. 2b which has been described above.
  • the output values of the device 10, ie the real-valued spectral coefficients, which may be MDCT coefficients, for example, are fed to the device 12 for post-processing to obtain a complex spectrum on the output side, which for each frequency index k a first Partspektralkostoryen p k, m and a second partial spectral coefficients q k, m , where p k, m is the real part and q k, m is the imaginary part of the complex spectral coefficient for the frequency index k, where m denotes the block index.
  • Fig. 3 is designated T 1 and 10, respectively. From these, for example, a real and an imaginary part p, q are formed for a specific frequency index and for a specific (temporal) block index. Alternatively, of course, amount and phase could be generated.
  • special phase relationships of the modulation functions can be exploited, which are the basis of a modulated filter bank.
  • the operation T 2 or 12, respectively, which is connected after the first transformation, is again an invertible, critically sampled transformation. This results in a total system, which also has the property of critical sampling and at the same time allows a reconstruction of the spectral components obtained.
  • T 2 is now a two-dimensional transformation, since in the preferred embodiment of the present invention both temporally adjacent and frequency adjacent real valued spectral coefficients are combined, ie as their input values extend along the time and frequency axes, as shown in FIG Fig. 2a to 2c has been shown. Since a real and an imaginary part are formed from each transformation operation using the device 12, a value pair is to be calculated for a critical scan only for every second scanning position of the time / frequency plane. This is achieved in a preferred embodiment of the present invention by sampling rate reduction along the time axis, ie computation only for every other block of the first transform T 1 . Alternatively, this is achieved by sampling rate reduction along the frequency axis, ie computation only for every second subband i of the first transformation. Again, alternatively, this is offset, ie achieved in the form of a checkerboard pattern, in which alternately every second block and every second band are used.
  • the transformation coefficients of the second transformation, with which the output values of T 1 are each weighted before their summation, ie the weighting factors, preferably fulfill the conditions for the exact reconstruction according to the respective sampling scheme.
  • the system according to the invention contains a number of degrees of freedom, which can be used for optimizing the properties of the overall system, ie for optimizing the frequency response of the entire system as a complex filter bank.
  • Fig. 4 A first embodiment of the present invention for the detailed specification of the device 12 for post-processing shown. It is preferable to distinguish between a straight frequency index k and an odd frequency index k + 1.
  • a straight frequency index that is, when p k, m and q k, m are to be calculated (m is the block index and k is the frequency index)
  • the real part p k, m is summed by two temporally successive real-valued spectral coefficients.
  • p k, m thus results either from the summation of the spectral coefficient with the index k from the Fig. 2b and 2a or from the Fig. 2c and 2b ,
  • the associated imaginary part q k, m is inventively either by summing two successive values with the frequency index k-1 again the Fig. 2a, 2b (Block m-1 and block m) or the Fig. 2b and 2c (Block m and block m + 1).
  • the real part p k + 1, m is calculated as the difference between two consecutive values, ie as the difference between the spectral coefficients k + 1 of the Fig. 2a, 2b or 2b, 2c .
  • the associated imaginary part q k + 1, m results as the difference between two successive values with the frequency index k, ie as the difference between the real-valued spectral coefficients with the index k der Fig. 2a, 2b or 2b, 2c ,
  • Fig. 4 shown transformation function which is generally designated by the reference numeral 12 a, wherein the transformation function has two transformation sub-regulations h L (m) and h H (m), which, as shown in Fig. 4 shown in pairs alternately applied to the output values of the device 10.
  • the first subfunction h L (m) has the form ⁇ 1, 1 ⁇
  • the second subfunction has the form ⁇ 1, -1 ⁇ .
  • the notation of the subfunctions h L (m) and h H (m) is intended to mean that a sum or difference of the corresponding spectral coefficients is to be formed from two (temporally) adjacent blocks.
  • the critical sampling is achieved by a factor of 2 temporal sampling rate reduction, as indicated by the device labeled 12b in FIG Fig. 4 is shown symbolically. If an orthogonality of the second transformation (12a, 12b) is desired, then all the output values p, q can be normalized by multiplication by the factor 1 / ⁇ 2.
  • the second transformation (12a, 12b) connected downstream of the first transformation which is, for example, an MDCT, respectively engages over the two adjacent bands from which the real part p k, m and the imaginary part q k, m are formed for a frequency index k.
  • temporally successive real-valued spectral coefficients are taken into account in the combination, ie the summation or subtraction.
  • the downstream transformation 12a, 12b does not include any degrees of freedom for optimizing the overall system in terms of adjustable weighting factors contained in the functions h L and h H , it is preferable to optimize the overall system by the window function of the first transformation, for example the MDCT manipulate, ie in To change comparison to a given known window function.
  • the window function of the first transformation for example the MDCT manipulate, ie in To change comparison to a given known window function.
  • Equation T 2 is an inverse to the transform rule T 2 T 2 transformation rule used -1. If equations (1) to (4) are considered, it turns out that the real spectral components u k, m-1 and u k, m from the real part p k, m and the imaginary part q k + 1, m from the Equations (1) and (4) can be calculated by solving two equations (1) and (4) for two unknowns according to the sought real spectral coefficients u k, m-1 and u k, m .
  • T 2 -1 Knowing the sequence of blocks of complex approximated spectral coefficients, it is possible to calculate back to the sequence of real spectral coefficients by performing the inverse combination rule.
  • the values of the coefficients a, b, and c can be used to optimize the overall system, again to achieve a desired frequency response of the overall arrangement, which, as has been stated, is desirable, for example positive frequencies a bandpass characteristic is available as a frequency response, while for negative frequencies the greatest possible attenuation is desired.
  • weighting factors a, b, c are used to weight all the real spectral coefficients adjacent to the real spectral coefficient u k, m in the time-frequency plane more or less, as shown in equation (6) ,
  • the methods according to the invention can be implemented in hardware or in software.
  • the implementation may be on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which interact with a programmable computer system such that the corresponding method is executed.
  • the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out one or more of the inventive methods when the computer program product runs on a computer.
  • the invention is also a computer program having a program code for performing one or more of the methods when the computer program runs on a computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Processing (AREA)

Claims (23)

  1. Dispositif pour générer une représentation spectrale complexe d'un signal discret dans le temps, aux caractéristiques suivantes:
    un moyen (10) destiné à générer une représentation spectrale de valeurs réelles par bloc du signal discret dans le temps, la représentation spectrale présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels; et
    un moyen (12) destiné à post-traiter la représentation spectrale de valeurs réelles par bloc, pour obtenir une représentation spectrale approximée complexe par bloc qui présente des blocs successifs, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, au moins le premier ou le deuxième coefficient spectral partiel pouvant être déterminé par une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence.
  2. Dispositif selon la revendication 1,
    dans lequel le premier coefficient spectral partiel est une partie réelle du coefficient spectral approximé complexe, et dans lequel le deuxième coefficient spectral partiel est une partie imaginaire du coefficient spectral approximé complexe.
  3. Dispositif selon la revendication 1 ou 2,
    dans lequel la combinaison est une combinaison linéaire.
  4. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à combiner, pour déterminer un coefficient spectral complexe d'une fréquence déterminée, un coefficient spectral réel de la fréquence et un coefficient spectral réel d'une fréquence adjacente supérieure ou inférieure.
  5. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à combiner, pour déterminer un coefficient spectral complexe d'une fréquence déterminée, un coefficient spectral réel dans un bloc actuel et un coefficient spectral réel dans un bloc précédent dans le temps ou un bloc suivant dans le temps.
  6. Dispositif selon l'une des revendications précédentes, réalisé de manière à fonctionner à un balayage critique, de sorte que pour chaque valeur de balayage discrète dans le temps soit générée, par le moyen (10) destiné à générer une représentation spectrale réelle par bloc, une valeur spectrale réelle et que soit généré, pour deux coefficients spectraux réels, un coefficient spectral complexe.
  7. Dispositif selon la revendication 6,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à n'être actif pour la réduction du taux de balayage que pour chaque deuxième bloc de coefficients spectraux de valeurs réelles, ou à être actif pour la réduction du taux de balayage pour chaque deuxième coefficient spectral réel, ou à n'être actif pour la réduction du taux de balayage alternativement que pour chaque deuxième bloc ou que pour chaque deuxième coefficient spectral réel.
  8. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à additionner, pour le premier coefficient spectral partiel à indice de fréquence pair, deux coefficients spectraux réels au même indice de fréquence d'un bloc actuel et d'un bloc précédent dans le temps, et à additionner, pour le deuxième coefficient spectral partiel à l'indice de fréquence pair, deux coefficients spectraux réels à indice de fréquence inférieur de 1 du bloc actuel et du bloc précédent dans le temps.
  9. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à former, pour le premier coefficient spectral partiel à indice de fréquence impair, une différence entre deux coefficients spectraux réels à l'indice de fréquence impair d'un bloc actuel et d'un bloc précédent dans le temps, et à former, pour le deuxième coefficient spectral partiel, une différence entre deux coefficients spectraux réels à indice de fréquence inférieur de 1 du bloc actuel et du bloc précédent dans le temps.
  10. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à normaliser le premier et le deuxième coefficient spectral partiel chaque fois par un facteur 1 / 2 .
    Figure imgb0012
  11. Dispositif selon l'une des revendications 1 à 7,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à utiliser, comme premier coefficient spectral partiel pour un indice de fréquence, un coefficient spectral réel à l'indice de fréquence et à utiliser, pour le calcul du deuxième coefficient spectral partiel, une somme pondérée du coefficient spectral réel à indices de fréquence voisins d'un bloc actuel, d'un ou de plusieurs blocs précédents ou d'un ou plusieurs blocs suivants, au moins deux facteurs de pondération étant différents de 0.
  12. Dispositif selon la revendication 11,
    dans lequel le moyen (12) destiné à post-traiter est réalisé de manière à ne pas utiliser, pour le calcul du deuxième coefficient spectral partiel, le coefficient spectral réel formant le premier coefficient spectral partiel.
  13. Dispositif selon la revendication 11 ou 12,
    dans lequel le moyen destiné à post-traiter est réalisé de manière à appliquer, pour le calcul du deuxième coefficient spectral partiel, la règle suivante: q k , m = a * u k - 1 , m + 1 + - b * u k - 1 , m + a * u k - 1 , m - 1 + - c * u k , m + 1 + c * u k , m - 1 + a * u k + 1 , m + 1 + b * u k + 1 , m + a * u k + 1 , m - 1 ;
    Figure imgb0013

    où a, b, c sont des facteurs de pondération positifs ou négatifs, k-1 est un indice de fréquence actuel k moins 1, m-1 est un indice de bloc actuel m moins 1, k+1 est un indice de fréquence actuel k plus 1, m+1 est un indice de bloc actuel m plus 1, et u uk-1,m-1 est un coefficient spectral réel d'un bloc précédent dans le temps à indice de fréquence k-1, uk-1,m est un coefficient spectral réel d'un bloc à indice de fréquence k-1, uk-1,m+1 est un coefficient spectral réel d'un bloc suivant dans le temps à indice de fréquence k-1, uk,m-1 est un coefficient spectral réel à indice de fréquence k du bloc précédent dans le temps, uk,m+1 est un coefficient spectral réel à l'indice de fréquence pour le bloc suivant dans le temps, uk+1,m-1 est un coefficient spectral réel à l'indice de fréquence k+1 du bloc précédent dans le temps, uk+1,m est un coefficient spectral réel pour l'indice de fréquence k+1 du bloc actuel, et uk+1,m+1 est un coefficient spectral réel à l'indice de fréquence k+1 du bloc suivant dans le temps.
  14. Dispositif selon la revendication 13,
    dans lequel diffèrent, pour les indices de fréquence pairs et impairs k, les signes d'un ou de plusieurs facteurs de pondération.
  15. Dispositif selon la revendication 13 ou 14,
    dans lequel les facteurs de pondération sont réglés pour créer une courbe de fréquence désirée pour le dispositif pour générer une représentation spectrale complexe.
  16. Dispositif selon l'une des revendications précédentes,
    dans lequel le moyen (10) destiné à générer est réalisé de manière à effectuer une transformation cosinusoïdale discrète modifiée.
  17. Dispositif selon la revendication 16,
    dans lequel le moyen (10) destiné à générer est réalisé de manière à effectuer une transformation cosinusoïdale discrète modifiée avec un chevauchement de fenêtre de 50%.
  18. Procédé pour générer une représentation spectrale complexe d'un signal discret dans le temps, aux étapes suivantes consistant à:
    générer (10) une représentation spectrale de valeurs réelles par bloc du signal discret dans le temps, la représentation spectrale présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels; et
    post-traiter (12) la représentation spectrale de valeurs réelles par bloc, pour obtenir une représentation spectrale approximée complexe par bloc qui présente des blocs successifs, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, au moins le premier ou le deuxième coefficient spectral partiel pouvant être déterminé par une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence.
  19. Dispositif pour coder un signal discret dans le temps, aux caractéristiques suivantes:
    un dispositif destiné à générer une représentation spectrale de valeurs réelles par bloc du signal discret dans le temps, la représentation spectrale présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels;
    un module psycho-acoustique destiné à calculer un seuil de masquage psycho-acoustique en fonction du signal discret dans le temps;
    un moyen destiné à quantifier un bloc de coefficients spectraux de valeurs réelles à l'aide du seuil de masquage psycho-acoustique,
    le module psycho-acoustique présentant un moyen (12) destiné à post-traiter la représentation spectrale réelle par bloc, pour obtenir une représentation spectrale approximée complexe qui présente des blocs successifs, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, au moins le premier ou le deuxième coefficient spectral partiel pouvant être déterminé par une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence.
  20. Procédé pour coder un signal discret dans le temps, aux étapes suivantes consistant à:
    générer une représentation spectrale de valeurs réelles par bloc du signal discret dans le temps, la représentation spectrale présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels;
    calculer un seuil de masquage psycho-acoustique en fonction du signal discret dans le temps;
    quantifier un bloc de coefficients spectraux de valeurs réelles à l'aide du seuil de masquage psycho-acoustique,
    à l'étape de calcul étant effectuée une étape (12) consistant à post-traiter la représentation spectrale réelle par bloc, pour obtenir une représentation spectrale approximée complexe qui présente des blocs successifs, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, au moins le premier ou le deuxième coefficient spectral partiel pouvant être déterminé par une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence.
  21. Dispositif pour générer une représentation spectrale réelle à partir d'une représentation spectrale approximée complexe, la représentation spectrale réelle à déterminer présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels, la représentation spectrale approximée complexe présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, les coefficients spectraux approximés complexes étant calculés par une règle de transformation à partir des coefficients spectraux réels, la règle de transformation comprenant une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence, pour calculer au moins le premier ou le deuxième coefficient spectral partiel d'un coefficient spectral approximé complexe, à la caractéristique suivante:
    un moyen destiné à exécuter une règle de combinaison inverse à la règle de transformation (T2), pour calculer, à partir des coefficients spectraux approximés complexes, les coefficients spectraux réels.
  22. Procédé pour générer une représentation spectrale réelle à partir d'une représentation spectrale approximée complexe, la représentation spectrale réelle à déterminer présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux réels, la représentation spectrale approximée complexe présentant des blocs successifs dans le temps, chaque bloc présentant un ensemble de coefficients spectraux approximés complexes, un coefficient spectral approximé complexe pouvant être représenté par un premier coefficient spectral partiel et un deuxième coefficient spectral partiel, les coefficients spectraux approximés complexes étant calculés par une règle de transformation à partir des coefficients spectraux réels, la règle de transformation comprenant une combinaison d'au moins deux coefficients spectraux réels adjacents dans le temps et/ou en fréquence, pour calculer au moins le premier ou le deuxième coefficient spectral partiel d'un coefficient spectral approximé complexe, à l'étape suivante consistant à:
    exécuter une règle de combinaison inverse à la règle de transformation (T2), pour calculer, à partir des coefficients spectraux approximés complexes, les coefficients spectraux réels.
  23. Programme d'ordinateur avec un code de programme pour réaliser le procédé selon la revendication 18, la revendication 20 ou la revendication 22 lorsque le programme est exécuté sur un ordinateur.
EP03766165A 2002-07-26 2003-07-14 Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps Expired - Lifetime EP1525576B1 (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10234130 2002-07-26
DE10234130A DE10234130B3 (de) 2002-07-26 2002-07-26 Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
PCT/EP2003/007608 WO2004013839A1 (fr) 2002-07-26 2003-07-14 Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps

Publications (2)

Publication Number Publication Date
EP1525576A1 EP1525576A1 (fr) 2005-04-27
EP1525576B1 true EP1525576B1 (fr) 2009-05-27

Family

ID=30469126

Family Applications (1)

Application Number Title Priority Date Filing Date
EP03766165A Expired - Lifetime EP1525576B1 (fr) 2002-07-26 2003-07-14 Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps

Country Status (6)

Country Link
US (2) US7707030B2 (fr)
EP (1) EP1525576B1 (fr)
AT (1) ATE432524T1 (fr)
AU (1) AU2003250945A1 (fr)
DE (2) DE10234130B3 (fr)
WO (1) WO2004013839A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI575962B (zh) * 2012-02-24 2017-03-21 杜比國際公司 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980933B2 (en) 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
DE102004059979B4 (de) 2004-12-13 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals
KR100736607B1 (ko) * 2005-03-31 2007-07-09 엘지전자 주식회사 오디오 부호화 방법 및 장치
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2374211B1 (fr) 2008-12-24 2012-04-04 Dolby Laboratories Licensing Corporation Détermination et modification de la sonie d'un signal audio dans le domaine fréquentiel
EP2375409A1 (fr) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codeur audio, décodeur audio et procédés connexes pour le traitement de signaux audio multicanaux au moyen d'une prédiction complexe
BR122019026166B1 (pt) * 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, aparelho e método para emitir um sinal de áudio estereofônico tendo um canal esquerdo e um canal direito e meio legível por computador não transitório
MY194835A (en) 2010-04-13 2022-12-19 Fraunhofer Ges Forschung Audio or Video Encoder, Audio or Video Decoder and Related Methods for Processing Multi-Channel Audio of Video Signals Using a Variable Prediction Direction
MX2013011131A (es) * 2011-03-28 2013-10-30 Dolby Lab Licensing Corp Transformada con complejidad reducida para canal de efectos de baja frecuencia.
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
US20140074614A1 (en) * 2012-09-12 2014-03-13 Globys, Inc. Time series-based entity behavior classification
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP3067889A1 (fr) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Procédé et appareil de commutation de noyau de transformée adaptive de signal en codage audio
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
WO2019121980A1 (fr) 2017-12-19 2019-06-27 Dolby International Ab Procédés, appareil et systèmes pour voix unifiée et améliorations de décodage et d'encodage audio
EP3729427A1 (fr) 2017-12-19 2020-10-28 Dolby International AB Procédés et appareil pour des améliorations d'un système de transposition d'harmoniques de décodage de flux audio et vocal unifié
FR3087309B1 (fr) * 2018-10-12 2021-08-06 Ateme Optimisation d'un sous-echantillonnage intervenant avant le codage d'images en compression

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI575962B (zh) * 2012-02-24 2017-03-21 杜比國際公司 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換

Also Published As

Publication number Publication date
US8155954B2 (en) 2012-04-10
AU2003250945A1 (en) 2004-02-23
US7707030B2 (en) 2010-04-27
ATE432524T1 (de) 2009-06-15
DE50311552D1 (de) 2009-07-09
DE10234130B3 (de) 2004-02-19
US20050197831A1 (en) 2005-09-08
US20100161319A1 (en) 2010-06-24
WO2004013839A1 (fr) 2004-02-12
EP1525576A1 (fr) 2005-04-27

Similar Documents

Publication Publication Date Title
EP1525576B1 (fr) Dispositif et procede permettant de generer une representation spectrale complexe d'un signal a valeurs discretes en temps
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
EP1741039B1 (fr) Traitement de signaux d'information par modification dans la representation de la zone spectrale/zone spectrale de modulation
DE69518452T2 (de) Verfahren für die Transformationskodierung akustischer Signale
DE69603166T2 (de) Verfahren und vorrichtung zur effizienten implementierung von einseitenband-filterbänken, die genaue werte der spektralen amplitude und phase erzeugen
DE69107841T2 (de) Transformationskodierer und -dekodierer mit adaptiver blocklänge, adaptiver transformation und adaptivem fenster für hochwertige tonsignale.
DE69230308T2 (de) Transformationsverarbeitungsgerät und -verfahren und Medium zum Speichern komprimierter Digitaldaten
DE69221616T2 (de) Digitale Filterbank mit niedriger Rechenkomplexität
DE602006000399T2 (de) Teilweise komplexmodulierte filterbank
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
EP1979901B1 (fr) Procede et dispositifs pour le codage de signaux audio
EP1609084B1 (fr) Dispositif et procede de conversion en une representation transformee ou de conversion inverse de ladite representation transformee
DE69521176T2 (de) Verfahren zur Dekodierung kodierter Sprachsignale
DE69623360T2 (de) Schätzung von Anregungsparametern
EP1697931B1 (fr) Dispositif et procede pour determiner une valeur estimee
EP1647009B1 (fr) Procede et dispositif pour traiter un signal
EP0200239B1 (fr) Banc de filtres numériques de polyphase à réduction d'échantillonnage maximale
EP1397799B1 (fr) Procede et dispositif de traitement de valeurs d'echantillonnage audio discretes dans le temps
EP1654674B1 (fr) Dispositif et procede pour traiter au moins deux valeurs d'entree
EP1697930A1 (fr) Dispositif et procede pour traiter un signal multicanal
EP0065210A2 (fr) Méthode de traitement de signaux électriques avec un dispositif de filtrage numérique
EP1239455A2 (fr) Méthode et dispositif pour la réalisation d'une transformation de Fourier adaptée à la fonction de transfert des organes sensoriels humains, et dispositifs pour la réduction de bruit et la reconnaissance de parole basés sur ces principes
DE69823557T2 (de) Schnelle frequenztransformationstechnik für transform audio koder
DE69719260T2 (de) Breitbandiger Spektralquantisierer für Sprache
DE69515509T2 (de) Sprachverarbeitung

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20041230

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL LT LV MK

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): AT CH DE FR GB LI

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWAN

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT CH DE FR GB LI

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REF Corresponds to:

Ref document number: 50311552

Country of ref document: DE

Date of ref document: 20090709

Kind code of ref document: P

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20100302

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 14

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 15

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 16

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20220725

Year of fee payment: 20

Ref country code: DE

Payment date: 20220621

Year of fee payment: 20

Ref country code: AT

Payment date: 20220718

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20220726

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CH

Payment date: 20220727

Year of fee payment: 20

P01 Opt-out of the competence of the unified patent court (upc) registered

Effective date: 20230512

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50311552

Country of ref document: DE

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20230713

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK07

Ref document number: 432524

Country of ref document: AT

Kind code of ref document: T

Effective date: 20230714

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20230713