DE112008003153B4 - Frequency band determination method for shaping quantization noise - Google Patents

Frequency band determination method for shaping quantization noise Download PDF

Info

Publication number
DE112008003153B4
DE112008003153B4 DE112008003153.3T DE112008003153T DE112008003153B4 DE 112008003153 B4 DE112008003153 B4 DE 112008003153B4 DE 112008003153 T DE112008003153 T DE 112008003153T DE 112008003153 B4 DE112008003153 B4 DE 112008003153B4
Authority
DE
Germany
Prior art keywords
frequency band
tns
transient
audio signals
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112008003153.3T
Other languages
German (de)
Other versions
DE112008003153T5 (en
Inventor
Taejin Lee
Minje Kim
Seungkwon Beack
Dae-Young Jang
Kyeongok Kang
Jeong-Il Seo
Jinwoo Hong
Hochong Park
Rin-Chul Kim
Jeong-Geun Kim
YoungCheol Park
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority claimed from PCT/KR2008/005918 external-priority patent/WO2009066869A1/en
Publication of DE112008003153T5 publication Critical patent/DE112008003153T5/en
Application granted granted Critical
Publication of DE112008003153B4 publication Critical patent/DE112008003153B4/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen, das umfasst: Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind; Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das zum Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind; und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind, wobei das vorgegebene Frequenzband, das anzuwenden ist, ein bestimmtes TNS-Frequenzband ist, das auf einen allgemeinen TNS-Algorithmus angewendet wird, und wobei das erweiterte Frequenzband nach unten bis zu einem Frequenzband erweitert ist, das niedriger als ein bestimmtes TNS-Frequenzband ist.A frequency band determination method for shaping quantization noise, comprising: checking whether audio signals obtained from low-pass filtering are transient; Determining a predetermined frequency band to apply as a frequency band to be used for shaping quantization noise when the audio signals are not transient; and determining an extended frequency band extended beyond the predetermined frequency band to apply as a frequency band to be applied when the audio signals are transient, wherein the predetermined frequency band to be applied is a specific TNS frequency band a general TNS algorithm is applied, and wherein the extended frequency band is extended down to a frequency band lower than a certain TNS frequency band.

Description

Technisches GebietTechnical area

Die vorliegende Erfindung bezieht sich auf ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen. Insbesondere formt das Verfahren das Rauschen unter Verwendung eines langen Blocks und reduziert ein Vorecho und musikalisches Rauschen durch Ausrechnen, ob ein angewendetes Frequenzband ein allgemeines Frequenzband und ein erweitertes Frequenzband ist, anhand der Tatsache, ob Audiosignale transiente Signale sind.The present invention relates to a frequency band determination method for shaping quantization noise. In particular, the method shapes the noise using a long block and reduces pre-echo and musical noise by calculating whether an applied frequency band is a general frequency band and an extended frequency band based on the fact whether audio signals are transient signals.

Diese Arbeit wurde unterstützt durch das IT R&D-Programm für MIC/IITA [2007-S-005-01, ”Development of Richmedia Broadcasting Technologies through Advanced Audio and Video Codec Technologies”].This work was supported by the IT R & D Program for MIC / IITA [2007-S-005-01, "Development of Rich Media Broadcasting Technologies through Advanced Audio and Video Codec Technologies"].

Technischer HintergrundTechnical background

In einer hocheffizienten fortschrittlichen Audiocodierungstechnologie (High Efficiency Advanced Audio Coding, HE-AAC) wird ein Algorithmus zum Formen temporalen Rauschens (Temporal Noise Shaping, TNS), der einer von Algorithmen zum Formen von Quantisierungsrauschen ist, verwendet, um transiente Signale effektiv darzustellen. Daher verringert der TNS-Algorithmus ein Vorecho.In a highly efficient advanced audio coding (HE-AAC) technology, a temporal noise shaping (TNS) algorithm, which is one of quantization noise shaping algorithms, is used to effectively represent transient signals. Therefore, the TNS algorithm reduces a pre-echo.

Trotz der Verwendung des TNS-Algorithmus treten jedoch bei niedrigen Bitraten häufig das Vorecho und das musikalische Rauschen auf.Despite the use of the TNS algorithm, however, at low bit rates, the pre-echo and the musical noise often occur.

Um in der HE-ACC-Audiocodierungstechnologie eine Klangqualität mit wahrnehmbar transparenter Codierung zu erfassen, sollte das Quantisierungsrauschen einen Maskierungsschwellenwert nicht übersteigen. In einer Wahrnehmungs-Codierungstechnologie, die ein Frequenzsignal-Analyseverfahren verwendet, wird jedoch das Quantisierungsrauschen codiert und dann im Zeitbereich weit gespreizt. Daher ist es bei niedrigen Bitraten schwierig, die Bedingung zu erfüllen, dass das Quantisierungsrauschen den Maskierungsschwellenwert im Zeitbereich nicht übersteigt.In order to capture sound quality with perceptibly transparent coding in HE-ACC audio coding technology, quantization noise should not exceed a masking threshold. However, in a perceptual coding technology using a frequency signal analysis method, the quantization noise is coded and then widely spread in the time domain. Therefore, at low bit rates, it is difficult to satisfy the condition that the quantization noise does not exceed the masking threshold in the time domain.

Beispielsweise ist in der AAC-Audiocodierungstechnologie, die im Allgemeinen 1024 modifizierte diskrete Kosinustransformationskoeffizienten (Modified Discrete Cosine Transform, MDCT) verwendet, ein Quantisierungsrauschen mit einer 48-kMz-Abtastrate über 40 ms verteilt. Diese Verteilung kann hörbare Artefakte hervorrufen, wenn die Signale transiente Signale sind. Zu diesem Zeitpunkt kann das Quantisierungsrauschen wahrnehmbar detektiert werden, bevor die transienten Signale erzeugt werden. Dieses Quantisierungsrauschen wird Vorecho-Phänomen genannt.For example, in AAC audio coding technology, which generally uses 1024 Modified Discrete Cosine Transform (MDCT) coefficients, quantization noise is distributed over a 48 ms sampling rate over 40 ms. This distribution can cause audible artifacts when the signals are transient signals. At this time, the quantization noise may be perceptibly detected before the transient signals are generated. This quantization noise is called the pre-echo phenomenon.

In dem TNS-Algorithmus, der entwickelt worden ist, um mit dem Vorecho-Phänomen effektiv umzugehen, wird die Form des Quantisierungsrauschens, das im Zeitbereich weit gespreizt ist, eingestellt, um eine Maskierungswirkung zu haben.In the TNS algorithm which has been developed to deal with the pre-echo phenomenon effectively, the shape of quantization noise that is widely spread in the time domain is adjusted to have a masking effect.

Der TNS-Algorithmus verwendet eine lineare prädiktive Codierung (Linear Predictive Coding, LPC), die auf einer Dualität zwischen dem Zeitbereich und einem Frequenzbereich basiert. Tabelle 1 erläutert ein optimales Codierungsverfahren für Tonsignale und transiente Signale hinsichtlich der Dualität.The TNS algorithm uses Linear Predictive Coding (LPC) based on a duality between the time domain and a frequency domain. Table 1 illustrates an optimal encoding method for audio signals and transient signals with respect to duality.

Tabelle 1

Figure DE112008003153B4_0002
Table 1
Figure DE112008003153B4_0002

Das heißt, dass im Frequenzbereich das optionale Codierungsverfahren für die Tonsignale mit einer bestimmten Frequenz ein direktes Codierungsverfahren ist, das eine Frequenzkoeffizientencodierung verwendet. Im Zeitbereich ist das optimale Codierungsverfahren für die Tonsignale mit einer bestimmten Frequenz ein prädiktives Codierungsverfahren, das eine LPC-Codierung verwendet.That is, in the frequency domain, the optional coding method for the tone signals having a certain frequency is a direct coding method using frequency coefficient coding. In the time domain, the optimal coding method for the tone signals having a particular frequency is a predictive coding method using LPC coding.

Wenn hingegen die Dualität betrachtet wird, ist im Frequenzbereich das optimale Codierungsverfahren für die transienten Signale das prädiktive Codierungsverfahren, das die Frequenzkoeffizienten-Prädiktionscodierung verwendet. Im Zeitbereich ist das optionale Codierungsverfahren für die transienten Signale das direkte Codierungsverfahren, das die Zeitabtastcodierung verwendet.On the other hand, considering the duality, in the frequency domain, the optimal coding method for the transient signals is the predictive coding method using the frequency coefficient prediction coding. In the time domain, the optional encoding method for the transient signals is the direct encoding method that uses time sampling coding.

Der TNS-Algorithmus wird anhand des prädiktiven Codierungsverfahrens im Frequenzbereich angewendet.The TNS algorithm is applied using the frequency domain predictive coding technique.

Tabelle 2 zeigt das Frequenzband, das TNS anwendet. Tabelle 2 Arten von Blöcken langer Block kurzer Block Frequenzband, das TNS anwendet 1275 Hz~ 2750 Hz~ Table 2 shows the frequency band that TNS applies. Table 2 Types of blocks long block short block Frequency band applying TNS 1275 Hz ~ 2750 Hz ~

Hierbei ist der TNS-Frequenzbereich (Band) entsprechend der Blocklänge in einen langen Block und einen kurzen Block klassifiziert. Das Frequenzband, das den TNS-Algorithmus anwendet, beträgt mehr als 1275 Hz für den langen Block und mehr als 2750 Hz für den kurzen Block.Here, the TNS frequency range (band) is classified according to the block length into a long block and a short block. The frequency band using the TNS algorithm is more than 1275 Hz for the long block and more than 2750 Hz for the short block.

Das heißt, dass im langen Block der TNS-Algorithmus auf einen Frequenzbereich von einem Frequenzband von 1275 Hz bis zu einer Grenzfrequenz, bei der eine Spektralbandreplizierung (Spectrum Band Replication, SBR) beginnt, angewendet wird. Andererseits wird im kurzen Block der TNS-Algorithmus auf einen Frequenzbereich von einem Frequenzband von 2750 Hz bis zu der Grenzfrequenz, bei der die SBR beginnt, angewendet. In einem Band unterhalb der obigen Frequenzbänder tritt das Vorecho häufig auf.That is, in the long block, the TNS algorithm is applied to a frequency range from a frequency band of 1275 Hz to a cut-off frequency at which spectral band replication (SBR) begins. On the other hand, in the short block, the TNS algorithm is applied to a frequency range from a frequency band of 2750 Hz up to the cutoff frequency at which the SBR starts. In a band below the above frequency bands, the pre-echo occurs frequently.

Um das Vorecho weiter zu reduzieren, wird ein Blockschalten ausgeführt. Das Blockschalten bezeichnet das Verfahren des Ersetzens eines langen Fensters mit einer Rahmenlänge durch ein kurzes Fenster mit 1/8 der Rahmenlänge. Das Blockschalten zwischen dem langen Block und dem kurzen Block dient dazu, das Vorecho durch Anwenden des Quantisierungsrauschen-Effekts nur im kurzen Block wahrnehmbar zu verbessern.To further reduce the pre-echo, a block switch is executed. Block switching refers to the process of replacing a long window with a frame length with a 1/8 frame length short window. The block switching between the long block and the short block serves to perceptibly improve the pre-echo by applying the quantization noise effect only in the short block.

Wenn jedoch die Signale stabil sind und die Bitrate niedrig ist, kann das kurze Fenster einen gegenteiligen Effekt hervorrufen. Da das Bit in der niedrigen Bitrate unzureichend ist, werden Frequenzkomponenten, die in jedem kurzen Block verloren gegangen sind, als spektrale Löcher gezeigt. Die spektralen Löcher sind auf einer Zeitachse in einem entsprechenden Rahmen diskontinuierlich verbunden, um das musikalische Rauschen hervorzurufen. Das heißt, dass bei der niedrigen Bitrate mit unzureichendem Bit dann, wenn der lange Block statt des kurzen Blocks verwendet wird, das Vorecho auftritt. Außerdem tritt bei niedriger Bitrate mit unzureichendem Bit dann, wenn der kurze Block übermäßig verwendet wird, das musikalische Rauschen auf. However, if the signals are stable and the bit rate is low, the short window may produce an adverse effect. Since the bit in the low bit rate is insufficient, frequency components lost in each short block are shown as spectral holes. The spectral holes are intermittently connected on a time axis in a corresponding frame to cause the musical noise. That is, at the low bit rate with insufficient bit, when the long block is used instead of the short block, the pre-echo occurs. In addition, at low bit rate with insufficient bit, when the short block is excessively used, the musical noise occurs.

Die Druckschrift US 2007/0016405 A1 beschreibt Kodierungen mit verbesserter Zeitauflösung für ausgewählte Segmente mittels adaptiver Blocktransformation einer Gruppe von Signalwerten einer Teilband-Zerlegung.The publication US 2007/0016405 A1 describes encodings with improved time resolution for selected segments by means of adaptive block transformation of a group of signal values of a subband decomposition.

Jürgen Herre, „Temporal Noise Shaping, Quantization, and Coding Methods in Perceptual Audio Coding: A Tutorial Introduction”, in: AES 17th International Conference: High Quality Audio Coding; Publication Date: August 1, 1999; beschreibt ein Verfahren zur Prädiktionscodierung, das auf Spektraldaten über der Frequenz angewendet wird, wobei die zeitliche Form des Quantifizierungsfehlers-Signals am Ausgang des Decoders an die zeitliche Form des Eingabesignals angepasst erscheint.Jürgen Herre, "Temporal Noise Shaping, Quantization, and Coding Methods in Perceptual Audio Coding: A Tutorial Introduction", in: AES 17th International Conference: High Quality Audio Coding; Publication Date: August 1, 1999; describes a method of predictive coding applied to spectral data versus frequency, wherein the temporal shape of the quantization error signal at the output of the decoder appears to be matched to the temporal shape of the input signal.

Offenbarung der ErfindungDisclosure of the invention

Technisches ProblemTechnical problem

Eine Ausführungsform der vorliegenden Erfindung ist darauf gerichtet, ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen.An embodiment of the present invention is directed to a frequency band determination method for shaping quantization noise.

In der herkömmlichen Technologie zum Formen von temporalem Rauschen (Temporal Noise Shaping, TNS) kann dann, wenn die Bitrate niedrig ist, ein Vorecho und musikalisches Rauschen in transienten Blöcken nicht verhindert werden. Eine Aufgabe der vorliegenden Erfindung ist es, die obigen Probleme zu lösen.In the conventional Temporal Noise Shaping (TNS) technology, when the bit rate is low, pre-echo and musical noise in transient blocks can not be prevented. An object of the present invention is to solve the above problems.

Somit schafft diese Erfindung ein Verfahren zum Bestimmen eines Frequenzbereichs zum Formen von Quantisierungsrauschen unter Verwendung eines langen Blocks in Übereinstimmung mit einem angewendeten Frequenzband, das als ein allgemeines Frequenzband oder als ein Erweiterungsfrequenzband klassifiziert ist, und in Abhängigkeit davon, ob Audiosignale transiente Signale sind, um das Vorecho und das musikalische Rauschen effektiv zu verringern, und ein dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen.Thus, this invention provides a method of determining a frequency range for forming quantization noise using a long block in accordance with an applied frequency band classified as a general frequency band or an extension frequency band, and depending on whether audio signals are transient signals to effectively reduce the pre-echo and the musical noise, and a method of shaping transient noise using this method.

Die Aufgaben der vorliegenden Erfindung sind nicht auf die oben erwähnten Aufgaben eingeschränkt. Andere Aufgaben und Vorteile der vorliegenden Erfindung können durch die folgende Beschreibung verstanden werden und werden mit Bezugnahme auf die Ausführungsformen der vorliegenden Erfindung deutlich. Außerdem ist für den Fachmann auf dem Gebiet der vorliegenden Erfindung klar, dass Aufgaben und Vorteile der vorliegenden Erfindung durch die Mittel, die beansprucht werden, und durch Kombinationen hiervon verwirklicht werden können.The objects of the present invention are not limited to the above-mentioned objects. Other objects and advantages of the present invention can be understood by the following description, and become apparent with reference to the embodiments of the present invention. Moreover, it will be apparent to those skilled in the art that objects and advantages of the present invention may be realized by the means claimed and combinations thereof.

Technische LösungTechnical solution

Gemäß einem Aspekt der vorliegenden Erfindung wird ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen geschaffen, das umfasst: Prüfen, ob Audiosignale, die aus einer Tiefpassfilterung erhalten werden, transiente Signale sind, Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das auf das Formen des Quantisierungsrauschens anzuwenden ist, wenn die Audiosignale nicht transient sind, und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind, wobei das vorgegebene Frequenzband, das anzuwenden ist, ein bestimmtes TNS-Frequenzband ist, das auf einen allgemeinen TNS-Algorithmus angewendet wird, und wobei das erweiterte Frequenzband nach unten bis zu einem Frequenzband erweitert ist, das niedriger als ein bestimmtes TNS-Frequenzband ist.According to one aspect of the present invention, there is provided a frequency band determining method for shaping quantization noise, comprising: checking whether audio signals obtained from low-pass filtering are transient signals, determining a predetermined frequency band to apply as a frequency band thereto the shaping of the quantization noise is to be applied when the audio signals are non-transient and determining an extended frequency band extended beyond the predetermined frequency band to apply as a frequency band to be applied when the audio signals are transient, wherein the predetermined frequency band which is to be applied is a particular TNS frequency band applied to a general TNS algorithm, and wherein the extended frequency band is extended down to a frequency band lower than a certain TNS frequency band.

Vorteilhafte WirkungenAdvantageous effects

Diese Erfindung formt Quantisierungsrauschen von Audiosignalen unter Verwendung eines langen Blocks in Übereinstimmung mit einem Frequenzband für die Anwendung eines Algorithmus zum Formen von temporalem Rauschen (TNS-Algorithmus) und klassifiziert das Frequenzband in ein allgemeines Frequenzband und in ein Erweiterungsfrequenzband in Übereinstimmung damit, ob die Audiosignale transiente Signale sind. Somit können ein Vorecho und musikalisches Rauschen einfach verringert werden.This invention forms quantization noise of audio signals by using a long block in accordance with a frequency band for the application of an algorithm for shaping temporal noise (TNS algorithm) and classifies the frequency band into a general frequency band and an extension frequency band in accordance with whether the audio signals are transient signals. Thus, a pre-echo and musical noise can be easily reduced.

Daher ist in dieser Erfindung die Klangqualität besser als bei einem Verfahren zum Formen von Quantisierungsrauschen, das den herkömmlichen TNS-Algorithmus verwendet. Das Verfahren der vorliegenden Erfindung, das den langen Block verwendet, reduziert das Vorecho effektiver als das typische Verfahren. Ferner ist es möglich, nahezu die gleiche Leistung zu schaffen, die in dem Verfahren, das nur den kurzen Block verwendet, erhalten werden kann.Therefore, in this invention, the sound quality is better than a method of shaping quantization noise using the conventional TNS algorithm. The method of the present invention using the long block reduces the pre-echo more effectively than the typical method. Further, it is possible to provide almost the same performance that can be obtained in the method using only the short block.

Daher wird in dieser Erfindung der kurze Block nicht übermäßig verwendet, wodurch das musikalische Rauschen reduziert werden kann.Therefore, in this invention, the short block is not excessively used, whereby the musical noise can be reduced.

Kurzbeschreibung der ZeichnungenBrief description of the drawings

1 ist eine Blockansicht, die eine Vorrichtung zum Verarbeiten des Formens von temporalem Rauschen (TNS-Verarbeitung) gemäß einer Ausführungsform der vorliegenden Erfindung zeigt. 1 Fig. 10 is a block diagram showing an apparatus for processing the shaping of temporal noise (TNS processing) according to an embodiment of the present invention.

2 und 3 zeigen das Vorecho gemäß dem Transientenindex. 2 and 3 show the pre-echo according to the transient index.

4 ist ein Ablaufplan, der ein Verfahren zum Formen von Quantisierungsrauschen in einem niedrigen Frequenzband unter Verwendung eines langen Blocks gemäß einer Ausführungsform der vorliegenden Erfindung beschreibt. 4 FIG. 10 is a flowchart describing a method of shaping quantization noise in a low frequency band using a long block according to an embodiment of the present invention. FIG.

Beste Art zum Ausführen der ErfindungBest way to carry out the invention

Die Vorteile, Merkmale und Aspekte der Erfindung werden anhand der folgenden Beschreibung der Ausführungsformen, die auf die beigefügten Zeichnungen Bezug nimmt und im Folgenden angegeben wird, deutlich. Daher kann der Fachmann auf dem Gebiet der vorliegenden Erfindung das technologische Konzept und den Umfang der Erfindung einfach ausführen. Falls ferner angenommen wird, dass eine genaue Beschreibung eines verwandten Gebiets einen Punkt der vorliegenden Erfindung verdunkeln könnte, wird die genaue Beschreibung hier nicht gegeben. Die bevorzugten Ausführungsformen der vorliegenden Erfindung werden im Folgenden im Einzelnen mit Bezug auf die beigefügten Zeichnungen beschrieben.The advantages, features and aspects of the invention will become apparent from the following description of the embodiments, which refers to the accompanying drawings and is given below. Therefore, those skilled in the art can readily understand the technological concept and scope of the invention. Further, assuming that a detailed description of a related art could obscure a point of the present invention, the detailed description will not be given here. The preferred embodiments of the present invention will be described below in detail with reference to the accompanying drawings.

1 ist eine Blockansicht, die eine Vorrichtung zum Verarbeiten des Formens eines temporalen Rauschens (TNS-Verarbeitung) gemäß einer Ausführungsform der vorliegenden Erfindung zeigt. 1 Fig. 10 is a block diagram showing an apparatus for processing the shaping of a temporal noise (TNS processing) according to an embodiment of the present invention.

In 1 enthält eine TNS-Verarbeitungsvorrichtung 100 eine TNS-Bestimmungseinrichtung 110 und einen TNS-Codierer 120.In 1 contains a TNS processing device 100 a TNS determination device 110 and a TNS encoder 120 ,

Die TNS-Verarbeitungsvorrichtung 100 formt das Quantisierungsrauschen in einem Zeitbereich in einem Filterbankfenster neu, um das Rauschen nicht wahrnehmbar zu machen. Im Folgenden wird die TNS-Verarbeitungsvorrichtung 100 in einer allgemeinen HE-ACC-Codierungsvorrichtung beschrieben.The TNS processing device 100 reshapes the quantization noise in a time domain in a filter bank window to make the noise imperceptible. Hereinafter, the TNS processing device 100 in a general HE-ACC encoding device.

Die TNS-Bestimmungseinrichtung 110 bestimmt, ob ein TNS-Prozess angewendet wird oder nicht.The TNS determining device 110 determines whether a TNS process is applied or not.

Genauer multipliziert die TNS-Bestimmungseinrichtung 110 ein Gewicht wie in Gl. 1 gezeigt, um eine lineare prädiktive Codierung (LPC) eines im Voraus berechneten modifizierten diskreten Kosinustransformationsspektrums (MDCT-Spektrum) zu berechnen. Xw(k) = X(k)·wfac(k) (Gl. 1) wobei

Figure DE112008003153B4_0003
wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit darstellen.More specifically, the TNS determiner multiplies 110 a weight as in Eq. 1 to calculate a linear predictive coding (LPC) of a pre-computed modified discrete cosine transform (MDCT) spectrum. X w (k) = X (k) · WFAC (k) (Eq. 1) in which
Figure DE112008003153B4_0003
where k and n represent an MDCT coefficient unit and a scale factor unit, respectively.

Das heißt, dass Gl. 1 auf die Energie eines entsprechenden Skalenbandes normiert. Der MDCT-Spektrumsbereich wird auf einen vorgegebenen Bereich angewendet. Daher bestimmt die TNS-Bestimmungseinrichtung 110 einen Frequenzbereich (Band) für die Anwendung des LPC. This means that Eq. 1 normalized to the energy of a corresponding scale band. The MDCT spectrum range is applied to a given range. Therefore, the TNS determining means determines 110 a frequency range (band) for the application of the LPC.

Die TNS-Bestimmungseinheit 110 wendet ein Glättungsfilter auf das normierte Spektrum an. Dies dient der LPC-Analyse. Die Glättungsfilterung bedeutet eine Abwärtsfilterung in einem Frequenzbandbereich von einer LPC-Unterbrechungsfrequenz zu einer LPC-Betriebsfrequenz durch den in Gl. 2 gezeigten Prozess.

Figure DE112008003153B4_0004
wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit darstellen.The TNS determination unit 110 applies a smoothing filter to the normalized spectrum. This is for the LPC analysis. The smoothing filtering means down-filtering in a frequency band range from an LPC interrupt frequency to an LPC operating frequency by the one shown in Eq. 2 shown process.
Figure DE112008003153B4_0004
where k and n represent an MDCT coefficient unit and a scale factor unit, respectively.

Andererseits führt die TNS-Bestimmungseinrichtung 110 eine Aufwärtsfilterung in einem Frequenzbandbereich von der LPC-Betriebsfrequenz zu einer Kappungsfrequenz aus. Gl. 3 zeigt den Aufwärtsfilterungsprozess.

Figure DE112008003153B4_0005
wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit repräsentieren.On the other hand, the TNS determining means performs 110 up-filtering in a frequency band range from the LPC operating frequency to a cut-off frequency. Eq. 3 shows the up-filtering process.
Figure DE112008003153B4_0005
where k and n represent an MDCT coefficient unit and a scale factor unit, respectively.

Die TNS-Bestimmungseinrichtung 110 berechnet eine Autokorrelationsfunktion und die LPC unter Verwendung eines Levinson-Durbin-Algorithmus. Die TNS-Bestimmungseinrichtung 110 erfasst einen partialen Autokorrelationskoeffizienten (Partial Autocorrelation Coefficient, PARCOR) und berechnet eine Vorhersageverstärkung auf der Grundlage des Rechenergebnisses unter Verwendung des Levinson-Durbin-Algorithmus.The TNS determining device 110 calculates an autocorrelation function and the LPC using a Levinson-Durbin algorithm. The TNS determining device 110 detects a Partial Autocorrelation Coefficient (PARCOR) and calculates a prediction gain based on the result of the calculation using the Levinson-Durbin algorithm.

Wenn die berechnete Vorhersageverstärkung einen Schwellenwert übersteigt, bestimmt die TNS-Bestimmungseinrichtung 110, dass die LPC an dem Spektrum ausgeführt werden sollte und dass ein TNS-Algorithmus auf das momentane Fenster angewendet werden sollte.If the calculated prediction gain exceeds a threshold, the TNS determiner determines 110 that the LPC should be performed on the spectrum and that a TNS algorithm should be applied to the current window.

Der TNS-Codierer 120 führt eine Quantisierungssimulation in einer Reihenfolge von hohen zu niedrigen PARCOR-Koeffizienten aus, um die TNS-Reihenfolge und einen ersten Koeffizienten zu bestimmen, der nicht kleiner als der Schwellenwert, z. B. 0,1, ist. Dies dient dazu, nur effektive TNS-PARCOR-Koeffizienten zu verwenden.The TNS encoder 120 performs a quantization simulation in an order of high to low PARCOR coefficients to determine the TNS order and a first coefficient not less than the threshold, e.g. B. 0.1, is. This is to use only effective TNS PARCOR coefficients.

Der TNS-Codierer 120 läuft durch ein LPC-Filter mit der bestimmten Reihenfolge und dem bestimmten Koeffizienten und wendet den TNS-Algorithmus auf den MDCT-Spektralkoeffizienten an, um die Codierung auszuführen. Die ACC-Codierung wird unter Verwendung des angewendeten MDCT-Spektralkoeffizienten ausgeführt.The TNS encoder 120 passes through an LPC filter of the particular order and coefficient and applies the TNS algorithm to the MDCT spectral coefficients to perform the encoding. The ACC coding is performed using the applied MDCT spectral coefficient.

Diese Erfindung erweitert den TNS-Algorithmus nach unten auf niedrige Frequenzen wie etwa 100 Hz und wendet ihn darauf an. Da hier der TNS-Algorithmus erweitert angewendet wird, wird das Vorecho verringert. Die Tonkomponenten der Frequenz, die den TNS-Algorithmus anwenden, d. h. die niedrigen Frequenzen, können jedoch verzerrt werden.This invention extends the TNS algorithm down to low frequencies, such as 100 Hz, and applies it to it. Since the TNS algorithm is applied here extended, the pre-echo is reduced. The sound components of the frequency applying the TNS algorithm, d. H. the low frequencies, however, can be distorted.

Daher verwendet diese Erfindung gleichzeitig den allgemeinen TNS-Algorithmus und den Erweiterungs-TNS-Algorithmus. Das bedeutet, dass diese Erfindung bestimmt, ob sie den allgemeinen TNS-Algorithmus oder den Erweiterungs-TNS-Algorithmus anwendet, woraufhin sie den TNS-Algorithmus auf der Grundlage des Bestimmungsergebnisses ausführt. Eine Referenz für die Bestimmung ist der Erweiterungsbereich der erweiterten niedrigen Frequenz.Therefore, this invention simultaneously uses the general TNS algorithm and the extension TNS algorithm. This means that this invention determines whether it is the general TNS Apply algorithm or the extension TNS algorithm, whereupon it executes the TNS algorithm based on the determination result. A reference for the determination is the extended low frequency extension range.

Im Folgenden werden Bedingungen für die Bestimmung, ob der TNS-Algorithmus oder der Erweiterungs-TNS-Algorithmus angewendet wird, beschrieben.The following describes conditions for determining whether the TNS algorithm or the extension TNS algorithm is used.

Erstens bestimmt die TNS-Bestimmungseinrichtung 110, ob der allgemeine TNS-Algorithmus angewendet werden kann oder nicht. Wenn das Blockschaltergebnis nur im niedrigen Frequenzband transient ist, wendet die TNS-Bestimmungseinrichtung 110 den Erweiterungs-TNS-Algorithmus an.First, the TNS determiner determines 110 whether the general TNS algorithm can be applied or not. If the block switch result is transient only in the low frequency band, the TNS determiner applies 110 the extension TNS algorithm.

Zweitens wendet die TNS-Bestimmungseinrichtung 110 den Erweiterungs-TNS-Algorithmus an, wenn die Vorhersageverstärkung in dem Frequenzband, das den TNS-Algorithmus bis zu 100 Hz erweitert anwendet, den Schwellenwert übersteigt und die transienten Signale mit erhöhter Energie sich zwischen dem vierten und dem siebten Rahmen von acht Rahmen befinden. Andererseits wendet die TNS-Bestimmungseinrichtung 110 den allgemeinen TNS-Algorithmus an, wenn die transienten Signale mit verringerter Energie sich zwischen dem nullten und dem dritten Rahmen von acht Rahmen befinden.Second, the TNS determiner applies 110 the extension TNS algorithm when the prediction gain in the frequency band applying the TNS algorithm extended up to 100 Hz exceeds the threshold and the transient signals with increased energy are between the fourth and seventh frames of eight frames. On the other hand, the TNS determining means applies 110 the general TNS algorithm when the transient signals with reduced energy are between the zeroth and the third frame of eight frames.

Der Transientenindex der transienten Signale 0 bis 7 gibt den Transientenindex an, der durch das Blockschalten zwischen dem kurzen Block und dem langen Block bestimmt wird. Jeder Block gibt die einzelnen Punkte an, an denen der entsprechende Rahmen in acht Rahmen unterteilt wird. Dieser Transientenindex wird für die effektive Codierung für die HE-ACC verwendet und auf ihn wird Bezug genommen, wenn acht kurze Blöcke zu vier Gruppen zusammengebunden werden, um die kurzen Blöcke anzuwenden. Der Referenzwert für den TNS-Algorithmus ist der Transientenindex der Signale, die durch die niedrige Frequenz geschickt und gefiltert werden.The transient index of the transient signals 0 to 7 indicates the transient index determined by the block switching between the short block and the long block. Each block indicates the individual points at which the corresponding frame is divided into eight frames. This transient index is used for the effective coding for the HE-ACC and is referred to when eight short blocks are tied together into four groups to apply the short blocks. The reference value for the TNS algorithm is the transient index of the signals sent and filtered by the low frequency.

Unter der oben beschriebenen zweiten Bedingung wird die Wirkung des Vorechos betrachtet und hat das Ausmaß der Wirkung Einfluss auf die Erweiterungs-TNS-Anwendung. Hierbei ist die Zeit für das Vorecho gleich der entsprechenden Fensterlänge.Under the second condition described above, the effect of the pre-echo is considered and the extent of the effect affects the extension TNS application. Here, the time for the pre-echo is equal to the corresponding window length.

Das bedeutet, dass, wenn sich der transiente Abschnitt mit erhöhter Energie in einem vorderen Abschnitt des entsprechenden Rahmens befindet, das Vorecho in einem schmaleren Bereich auftritt. Wenn sich andererseits der transiente Abschnitt mit erhöhter Energie in einem Endabschnitt des entsprechenden Rahmens befindet, tritt das Vorecho in einem weiteren Bereich auf.That is, when the transient high-energy portion is in a front portion of the corresponding frame, the pre-echo occurs in a narrower range. On the other hand, when the transient high energy portion is in an end portion of the corresponding frame, the pre-echo occurs in a wider range.

Die 2 und 3 zeigen das Vorecho gemäß dem Transientenindex.The 2 and 3 show the pre-echo according to the transient index.

In 2 gibt ein erster Transientenindex 101 ein transientes Signal in einem Endabschnitt des Rahmens an. Da sich hier das erste Vorecho 102 im Endabschnitt des Rahmens befindet, tritt das erste Vorecho 102 in einem größeren Bereich auf.In 2 gives a first transient index 101 a transient signal in an end portion of the frame. Because here is the first pre-echo 102 located in the end portion of the frame, the first pre-echo occurs 102 in a larger area.

In 3 gibt ein zweiter Transientenindex 103 ein transientes Signal in einem vorderen Abschnitt des Rahmens an. Wenn sich hier der zweite Transientenindex 103 in dem Endabschnitt des Rahmens befindet, hat das zweite Vorecho 104 eine größere Wirkung als das erste Vorecho 102, das in 2 gezeigt ist. Daher bestimmt die TNS-Bestimmungseinrichtung 110, dass der Erweiterungs-DNS-Algorithmus angewendet wird.In 3 gives a second transient index 103 a transient signal in a front portion of the frame. If here is the second transient index 103 located in the end portion of the frame has the second pre-echo 104 a greater impact than the first pre-echo 102 , this in 2 is shown. Therefore, the TNS determining means determines 110 that the extension DNS algorithm is applied.

4 ist ein Ablaufplan, der ein Verfahren zum Formen des Quantisierungsrauschens in einem niedrigen Frequenzband unter Verwendung eines langen Blocks gemäß einer Ausführungsform der vorliegenden Erfindung beschreibt. 4 Fig. 10 is a flowchart describing a method of shaping the quantization noise in a low frequency band using a long block according to an embodiment of the present invention.

Eine TNS-Bestimmungseinrichtung 110 berechnet im Schritt S302 eine Vorhersageverstärkung von Audiosignalen unter Verwendung eines langen Blocks. Das heißt, dass die TNS-Bestimmungseinrichtung 110 die Autokorrelationsfunktion und die LPC unter Verwendung eines Levinson-Durbin-Algorithmus berechnet und einen PARCOR anhand des Rechenergebnisses erfasst und eine Vorhersageverstärkung berechnet.A TNS determination device 110 calculates a prediction gain of audio signals using a long block in step S302. That is, the TNS determiner 110 calculates the autocorrelation function and the LPC using a Levinson-Durbin algorithm, and obtains a PARCOR from the computation result and calculates a prediction gain.

Die TNS-Bestimmungseinrichtung 110 bestimmt im Schritt S304, ob die berechnete Vorhersageverstärkung den Schwellenwert übersteigt.The TNS determining device 110 determines in step S304 whether the calculated prediction gain exceeds the threshold.

Die TNS-Bestimmungseinrichtung 110 führt getrennt hiervon eine Tiefpassfilterung unter Verwendung des Tiefpassfilters aus, um Frequenzkomponenten in einem Erweiterungsband zu bestimmen. Dies dient dazu, nur den langen Block zu verwenden. Ein Beispiel der Tiefpassfilterfunktion ist in Gl. 4 gezeigt.

Figure DE112008003153B4_0006
wobei H(z) die Tiefpassfilterfunktion angibt. Auf H(z) können verschiedene Tiefpassfilterfunktionen angewendet werden. In der Tiefpassfilterungsfähigkeit der verschiedenen Tiefpassfilterfunktionen besteht kein großer Unterschied. Die TNS-Bestimmungseinrichtung 110 verwendet das Tiefpassfilter, um das Signal in einem niedrigen Frequenzband unter 1 kHz zu erfassen. The TNS determining device 110 Separately, perform low pass filtering using the low pass filter to determine frequency components in an extension band. This is to use only the long block. An example of the low pass filter function is given in Eq. 4.
Figure DE112008003153B4_0006
where H (z) indicates the low pass filter function. On H (z) various low pass filter functions can be applied. There is not much difference in the low pass filtering capability of the various low pass filter functions. The TNS determining device 110 uses the low-pass filter to capture the signal in a low frequency band below 1 kHz.

Auf der Grundlage des Vergleichsergebnisses in Schritt S304 prüft die TNS-Bestimmungseinrichtung 110, wenn die Vorhersageverstärkung den Schwellenwert übersteigt, in Schritt S306, ob die durch die niedrige Frequenz durchgelassenen und gefilterten Signale transient sind. Das heißt, dass die TNS-Bestimmungseinrichtung 110 in Übereinstimmung mit dem Prüfergebnis in Schritt S306 das Frequenzband bestimmt, das zum Formen des Quantisierungsrauschens angewendet wird. Wenn andererseits die Vorhersageverstärkung den Schwellenwert nicht übersteigt, berechnet die TNS-Bestimmungseinrichtung 110 im Schritt S314 die Vorhersageverstärkung des Erweiterungsbandes und prüft, ob die Vorhersageverstärkung des Erweiterungsbandes den Schwellenwert übersteigt. Hier wird geprüft, ob die Signale, die durch den niedrigen Frequenzdurchgang geschickt und gefiltert worden sind, transient sind, indem der Blockschaltalgorithmus in der AAC-Vorrichtung verwendet wird.Based on the comparison result in step S304, the TNS determining means checks 110 if the prediction gain exceeds the threshold, in step S306, whether the low-pass filtered and filtered signals are transient. That is, the TNS determiner 110 determines, in accordance with the result of the check in step S306, the frequency band used for shaping the quantization noise. On the other hand, if the prediction gain does not exceed the threshold, the TNS determiner calculates 110 in step S314, the prediction gain of the expansion band and checks whether the prediction gain of the expansion band exceeds the threshold. Here, it is checked whether the signals sent and filtered by the low frequency pass are transient by using the block switching algorithm in the AAC device.

Anhand des Prüfergebnisses in Schritt S306 führt die TNS-Bestimmungseinrichtung 110 dann, wenn die durch die niedrige Frequenz geschickten und gefilterten Signale transient sind, keine Neueinstellung eines Maskierungsschwellenwertes 308 aus. Wenn andererseits die Signale, die durch die niedrige Frequenz geschickt und gefiltert worden sind, nicht transient sind, bestimmt die TNS-Bestimmungseinrichtung 110, dass der allgemeine TNS-Algorithmus angewendet wird, in Schritt 312.Based on the result of the check in step S306, the TNS determining means performs 110 then, when the signals sent and filtered by the low frequency are transient, no re-adjustment of a masking threshold 308 is made. On the other hand, if the signals sent and filtered by the low frequency are not transient, the TNS determiner determines 110 in that the general TNS algorithm is applied, in step 312.

Wenn der Maskierungsschwellenwert nicht neu eingestellt wird, wird im allgemeinen TNS-Algorithmus der Schwellenwert in dem Frequenzband, das den TNS-Algorithmus nicht anwendet, gesenkt, um das Bit effektiv zu nutzen. Andererseits ist in dieser Erfindung, die den Erweiterungs-TNS-Algorithmus verwendet, da hier alle Frequenzbänder den TNS-Algorithmus anwenden, eine Neueinstellung des Maskierungsschwellenwertes nicht erforderlich.If the masking threshold is not reset, in the general TNS algorithm, the threshold in the frequency band that does not use the TNS algorithm is lowered to effectively use the bit. On the other hand, in this invention using the extension TNS algorithm, since all frequency bands apply the TNS algorithm here, re-adjustment of the masking threshold is not required.

Die TNS-Bestimmungseinrichtung 110 stellt den Maskierungsschwellenwert nicht neu ein und erweitert im Schritt S310 das Frequenzband, das den TNS-Algorithmus anwendet, nach unten auf die Frequenz von etwa 100 Hz. Der TNS-Codierer 120 berechnet den Koeffizienten anhand des TNS-Algorithmus, der erweitert auf das niedrige Frequenzband angewendet wird, neu, woraufhin er die TNS-Codierung ausführt.The TNS determining device 110 does not reset the masking threshold and in step S310 expands the frequency band using the TNS algorithm down to the frequency of about 100 Hz. The TNS Encoder 120 recalculates the coefficient based on the TNS algorithm which is extended to the low frequency band, whereupon it performs the TNS coding.

Auf der Grundlage des Prüfergebnisses im Schritt S314 analysiert die TNS-Bestimmungseinrichtung 110 dann, wenn die Vorhersageverstärkung des Erweiterungsbandes den Schwellenwert übersteigt, Art und Index des transienten Signals, das durch die niedrige Frequenz geschickt und gefiltert wird, und prüft im Schritt S316, ob die Wirkung des Vorechos einen Referenzwert übersteigt. Das heißt, dass die TNS-Bestimmungseinrichtung 110 auf der Grundlage des Analyseergebnisses im Schritt 316 bestimmt, ob das Quantisierungsrauschen geformt wird oder nicht. Beispielsweise bestimmt die TNS-Bestimmungseinrichtung 110, dass die Wirkung des Vorechos den Referenzwert übersteigt, und wendet den TNS-Algorithmus an, wenn sich die Art und der Index der Transiente mit erhöhter Energie im Endabschnitt des entsprechenden Rahmens befinden oder wenn sich die Art und der Index der Transiente mit niedriger Energie im vorderen Abschnitt des entsprechenden Rahmens befinden.Based on the check result in step S314, the TNS determining means analyzes 110 when the prediction gain of the extension band exceeds the threshold, the type and index of the transient signal sent and filtered by the low frequency, and checks in step S316 if the effect of the pre-echo exceeds a reference value. That is, the TNS determiner 110 determines whether or not the quantization noise is formed based on the analysis result in step 316. For example, the TNS determining means determines 110 in that the effect of the pre-echo exceeds the reference value, and applies the TNS algorithm if the type and index of the transient with increased energy are in the end portion of the corresponding frame, or if the type and index of the low-energy transient in the front section of the corresponding frame.

Wenn andererseits im Schritt S314 die Vorhersageverstärkung des Erweiterungsbandes anhand des Prüfergebnisses den Schwellenwert nicht übersteigt, wendet die TNS-Bestimmungseinrichtung 110 die TNS im Schritt S318 nicht an.On the other hand, if in step S314 the prediction gain of the extension band based on the test result does not exceed the threshold, the TNS determiner applies 110 the TNS is not on in step S318.

Die TNS-Bestimmungseinrichtung 110 stellt den Maskierungsschwellenwert im Schritt S308 nicht neu ein, wenn auf der Grundlage des Prüfergebnisses im Schritt S316 die Wirkung des Vorechos groß ist. Wenn andererseits die Wirkung des Vorechos klein ist, wendet die TNS-Bestimmungseinrichtung 110 den TNS-Algorithmus im Schritt S318 nicht an.The TNS determining device 110 does not reset the masking threshold in step S308 if, based on the result of the check in step S316, the effect of the pre-echo is large. On the other hand, if the effect of the pre-echo is small, the TNS determiner applies 110 do not start the TNS algorithm in step S318.

Wie oben beschrieben worden ist, kann die Technologie der vorliegenden Erfindung als Programm verwirklicht werden. Von einem Computer-Programmierer des verwandten Gebiets kann einfach auf einen Code und ein Codesegment, die das Programm bilden, geschlossen werden. Außerdem ist das verwirklichte Programm in einem computerlesbaren Aufzeichnungsmedium, d. h. in einem Informationsspeichermedium gespeichert und wird von dem Computer gelesen und ausgeführt, wodurch das Verfahren der vorliegenden Erfindung realisiert wird. Das Aufzeichnungsmedium umfasst alle Typen von Aufzeichnungsmedien, die von dem Computer gelesen werden können.As described above, the technology of the present invention can be realized as a program. A computer programmer of the related art can easily infer a code and a code segment that make up the program. In addition, the implemented program is in a computer-readable recording medium, i. H. stored in an information storage medium and is read and executed by the computer, thereby realizing the method of the present invention. The recording medium includes all types of recording media that can be read by the computer.

Die vorliegende Anmeldung enthält den Erfindungsgegenstand der koreanischen Patenanmeldungen Nrn. 2007-0119413 und 2008-0048837 , eingereicht beim koreanischen Patentamt am 21. November 2007 bzw. am 26. Mai 2008, wobei die gesamten Inhalte hiervon durch Bezugnahme mit aufgenommen sind.The present application contains the subject of the invention Korean Patent Application Nos. 2007-0119413 and 2008-0048837 , filed with the Korean Patent Office on November 21, 2007 and May 26, 2008, respectively, the entire contents of which are incorporated herein by reference.

Obwohl die vorliegende Erfindung mit Bezug auf bestimmte bevorzugte Ausführungsformen beschrieben worden ist, ist für den Fachmann auf dem Gebiet klar, dass verschiedene Änderungen und Abwandlungen vorgenommen werden können, ohne vom Schutzbereich der Erfindung, wie er in den folgenden Ansprüchen definiert ist, abzuweichen.Although the present invention has been described with respect to certain preferred embodiments, it will be understood by those skilled in the art that various changes and modifications may be made without departing from the scope of the invention as defined in the following claims.

Claims (3)

Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen, das umfasst: Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind; Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das zum Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind; und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind, wobei das vorgegebene Frequenzband, das anzuwenden ist, ein bestimmtes TNS-Frequenzband ist, das auf einen allgemeinen TNS-Algorithmus angewendet wird, und wobei das erweiterte Frequenzband nach unten bis zu einem Frequenzband erweitert ist, das niedriger als ein bestimmtes TNS-Frequenzband ist.A frequency band determination method for shaping quantization noise, comprising: Checking whether audio signals obtained from low-pass filtering are transient; Determining a predetermined frequency band to apply as a frequency band to be used for shaping quantization noise when the audio signals are not transient; and Determining an extended frequency band extended beyond the predetermined frequency band to apply it as a frequency band to be applied when the audio signals are transient, wherein the predetermined frequency band to be applied is a particular TNS frequency band applied to a general TNS algorithm, and wherein the extended frequency band is extended down to a frequency band lower than a certain TNS frequency band. Verfahren nach Anspruch 1, weiterhin aufweisend: Vergleichen einer Vorhersageverstärkung der Audiosignale unter Verwendung eines langen Blocks mit einem Schwellenwert; Prüfen, ob eine Vorhersageverstärkung des Erweiterungsbandes den Schwellenwert übersteigt, wenn die Vorhersageverstärkung der Audiosignale den Schwellenwert nicht übersteigt; Prüfen von Energie und Anordnung von transienten Signalen der Audiosignale; und Bestimmen des erweiterten Frequenzbandes als eines anzuwendenden Frequenzbandes, wenn die Vorhersageverstärkung des Frequenzbandes den Schwellenwert übersteigt und die transienten Signale der Audiosignale mit erhöhter Energie in einem Endabschnitt des entsprechenden Rahmens angeordnet sind. wobei das Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind, ausgeführt wird, wenn die Vorhersageverstärkung den Schwellenwert übersteigt.The method of claim 1, further comprising: Comparing a prediction gain of the audio signals using a long block with a threshold value; Checking if a prediction gain of the expansion band exceeds the threshold if the prediction gain of the audio signals does not exceed the threshold; Examining energy and arrangement of transient signals of the audio signals; and Determining the extended frequency band as a frequency band to be applied when the prediction gain of the frequency band exceeds the threshold and the transient signals of the enhanced energy audio signals are located in an end portion of the corresponding frame. wherein the checking as to whether audio signals obtained from low-pass filtering are transient is performed when the prediction gain exceeds the threshold value. Verfahren nach Anspruch 2, weiterhin aufweisend: Bestimmen des erweiterten Frequenzbandes als eines anzuwendenden Frequenzbandes, wenn die Vorhersageverstärkung des Frequenzbandes den Schwellenwert übersteigt und die transienten Signale der Audiosignale mit verringerter Energie in einem Anfangsabschnitt des entsprechenden Rahmens angeordnet sind.The method of claim 2, further comprising: Determining the extended frequency band as a frequency band to be applied when the prediction gain of the frequency band exceeds the threshold and the transient signals of the reduced energy audio signals are located in an initial portion of the corresponding frame.
DE112008003153.3T 2007-11-21 2008-10-09 Frequency band determination method for shaping quantization noise Active DE112008003153B4 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20070119413 2007-11-21
KR10-2007-0119413 2007-11-21
KR10-2008-0048837 2008-05-26
KR1020080048837A KR100938282B1 (en) 2007-11-21 2008-05-26 Method of determining frequency range for transient noise shaping and transient noise shaping method using that
PCT/KR2008/005918 WO2009066869A1 (en) 2007-11-21 2008-10-09 Frequency band determining method for quantization noise shaping and transient noise shaping method using the same

Publications (2)

Publication Number Publication Date
DE112008003153T5 DE112008003153T5 (en) 2010-12-23
DE112008003153B4 true DE112008003153B4 (en) 2017-01-19

Family

ID=40860459

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112008003153.3T Active DE112008003153B4 (en) 2007-11-21 2008-10-09 Frequency band determination method for shaping quantization noise

Country Status (2)

Country Link
KR (1) KR100938282B1 (en)
DE (1) DE112008003153B4 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
US20070016405A1 (en) * 2005-07-15 2007-01-18 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR20070109982A (en) * 2004-11-09 2007-11-15 코닌클리케 필립스 일렉트로닉스 엔.브이. Audio coding and decoding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834877B1 (en) 2006-06-15 2008-06-03 주식회사 나비티엔씨 Fluid water proof sheet, and method for constructing the same
KR20080048837A (en) 2006-11-29 2008-06-03 삼성전자주식회사 Apparatus and method for outputting tactile feedback on display device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
KR20070109982A (en) * 2004-11-09 2007-11-15 코닌클리케 필립스 일렉트로닉스 엔.브이. Audio coding and decoding
US20070016405A1 (en) * 2005-07-15 2007-01-18 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HERRE, J.: Temporal Noise Shaping, Quantization and Coding Methods in Perceptual Audio Coding: A Tutorial Introduction. In: AES 17th International Conference: High-Quality Audio Coding; Publication Date: August 1,1999 *

Also Published As

Publication number Publication date
KR100938282B1 (en) 2010-01-22
DE112008003153T5 (en) 2010-12-23
KR20090052790A (en) 2009-05-26

Similar Documents

Publication Publication Date Title
EP1145227B1 (en) Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal
DE60024501T2 (en) Improvement of Perceptual Quality of SBR (Spectral Band Replication) AND HFR (Radio Frequency Reconstruction) Coding method by adaptively adding noise floor and limiting the noise substitution
DE60303689T2 (en) AUDIO DECODING DEVICE AND METHOD
DE60103424T2 (en) IMPROVING THE PERFORMANCE OF CODING SYSTEMS USING HIGH FREQUENCY RECONSTRUCTION PROCESSES
EP1953739B1 (en) Method and device for reducing noise in a decoded signal
DE60214027T2 (en) CODING DEVICE AND DECODING DEVICE
DE602005002256T2 (en) MULTI-CHANNEL RECONSTRUCTION BASED ON MULTIPARPARAMETRIZATION
DE60202881T2 (en) RECONSTRUCTION OF HIGH-FREQUENCY COMPONENTS
DE60225381T2 (en) Method for coding voice and music signals
DE69333394T2 (en) Highly effective coding method and device
DE69923555T2 (en) METHOD AND DEVICE FOR ENTROPYING THE CODING OF QUANTIZED TRANSFORMATION COEFFICIENTS OF A SIGNAL
DE19959156C2 (en) Method and device for processing a stereo audio signal to be encoded
EP1825461A1 (en) Method and apparatus for artificially expanding the bandwidth of voice signals
EP0954909A1 (en) Method for coding an audio signal
EP1697930A1 (en) Device and method for processing a multi-channel signal
DE602004007550T2 (en) IMPROVED FREQUENCY RANGE ERROR
DE60017825T2 (en) Method and device for coding and decoding audio signals and record carriers with programs therefor
DE60131766T2 (en) PERCEPTIONALLY IMPROVED CODING OF ACOUSTIC SIGNALS
DE60311619T2 (en) Data reduction in audio encoders using non-harmonic effects
WO1998048531A1 (en) Method for masking defects in a stream of audio data
DE60311891T2 (en) AUDIO CODING
DE19743662A1 (en) Bit rate scalable audio data stream generation method
DE102004009949A1 (en) Device and method for determining an estimated value
DE112008003153B4 (en) Frequency band determination method for shaping quantization noise
DE4343366C2 (en) Method and circuit arrangement for increasing the bandwidth of narrowband speech signals

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: H03M 7/30 AFI20081009BHDE

R082 Change of representative

Representative=s name: PATENTANWAELTE BETTEN & RESCH, DE

R081 Change of applicant/patentee

Owner name: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH IN, KR

Free format text: FORMER OWNERS: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH INSTITUTE, DAEJEON, KR; KWANGWOON UNIVERSITY INDUSTRY-ACADEMIC COLLABORATION FOUNDATION, SEOUL, KR

Effective date: 20131028

Owner name: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH IN, KR

Free format text: FORMER OWNER: ELECTRONICS AND TELECOMMUNICATI, KWANGWOON UNIVERSITY INDUSTRY-A, , KR

Effective date: 20131028

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

Effective date: 20131028

Representative=s name: PATENTANWAELTE BETTEN & RESCH, DE

Effective date: 20131028

R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final