DE60024501T2 - Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution - Google Patents

Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution Download PDF

Info

Publication number
DE60024501T2
DE60024501T2 DE60024501T DE60024501T DE60024501T2 DE 60024501 T2 DE60024501 T2 DE 60024501T2 DE 60024501 T DE60024501 T DE 60024501T DE 60024501 T DE60024501 T DE 60024501T DE 60024501 T2 DE60024501 T2 DE 60024501T2
Authority
DE
Germany
Prior art keywords
signal
frequency bands
gain
noise
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60024501T
Other languages
English (en)
Other versions
DE60024501D1 (de
Inventor
Lars Liljeryd
Kristofer KJÖRLING
Per Ekstrand
Fredrik Henn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26663489&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60024501(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from SE9900256A external-priority patent/SE9900256D0/xx
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Application granted granted Critical
Publication of DE60024501D1 publication Critical patent/DE60024501D1/de
Publication of DE60024501T2 publication Critical patent/DE60024501T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

  • GEBIET DER TECHNIK
  • Die vorliegende Erfindung bezieht sich auf Quellcodiersysteme, die eine Hochfrequenzrekonstruktion (HFR), wie beispielsweise eine Spektralbandreplikation, SBR [WO 98/57436], oder verwandte Verfahren benutzen. Dieselbe verbessert eine Leistungsfähigkeit von sowohl Verfahren hoher Qualität (SBR) als auch Hochkopierverfahren niedriger Qualität [US-Patent 5,127,054]. Dieselbe ist sowohl auf Sprachcodier- als auch natürliche Audiocodiersysteme anwendbar. Ferner kann die Erfindung vorteilhaft bei natürlichen Audiocodecs mit oder ohne Hochfrequenzrekonstruktion verwendet werden, um die hörbare Wirkung abgestellter Frequenzbänder, die gewöhnlich unter Niedrige-Bitrate-Bedingungen auftreten, durch ein Anwenden einer adaptiven Grundrauschaddition zu reduzieren.
  • HINTERGRUND DER ERFINDUNG
  • Das Vorhandensein von stochastischen Signalkomponenten ist eine wichtige Eigenschaft vieler Musikinstrumente sowie der menschlichen Stimme. Eine Reproduktion dieser Rauschkomponenten, die gewöhnlich mit anderen Signalkomponenten gemischt sind, ist entscheidend, falls das Signal als natürlich klingend wahrgenommen werden soll. Bei einer Hochfrequenzrekonstruktion ist es unter bestimmten Bedingungen zwingend, dem rekonstruierten Hochband ein Rauschen hinzuzufügen, um Rauschgehalte zu erreichen, die dem Original ähnlich sind. Diese Notwendigkeit stammt von der Tatsache, dass die meisten harmonischen Klänge von zum Beispiel Rohrblatt- oder Bogeninstrumenten einen höheren relativen Rauschpegel in der Hochfrequenzregion verglichen mit der Niederfrequenzregion aufweisen. Ferner treten harmonische Klänge manchmal zusammen mit einem Hochfrequenzrauschen auf, was in einem Signal ohne eine Ähnlichkeit zwischen Rauschpegeln des Hochbands und des Tiefbands resultiert. In jedem Fall leiden eine Frequenztransposition, d. h. eine SBR hoher Qualität, sowie ein jeglicher Hochkopierprozess niedriger Qualität gelegentlich unter einem Fehlen eines Rauschens in dem replizierten Hochband. Weiterhin weist ein Hochfrequenzrekonstruktionsprozess gewöhnlich eine gewisse Art einer Hüllkurveneinstellung auf, wo es erwünscht ist, eine ungewollte Rauschsubstitution für Oberschwingungen zu vermeiden. Es ist somit wesentlich, in der Lage zu sein, Rauschpegel bei dem Hochfrequenzregenerationsprozess bei dem Decodierer hinzuzufügen und zu steuern.
  • Unter Niedrige-Bitrate-Bedingungen zeigen natürliche Audiocodecs häufig ein starkes Abstellen von Frequenzbändern. Dies wird auf einer Rahmen-zu-Rahmen-Basis durchgeführt, was in Spektrallöchern resultiert, die auf eine beliebige Weise über dem gesamten codierten Frequenzbereich erscheinen können. Dies kann hörbare Artefakte bewirken. Die Wirkung desselben kann durch eine adaptive Grundrauschaddition vermindert werden.
  • Einige Audiocodiersysteme des Stands der Technik umfassen eine Einrichtung, um Rauschkomponenten bei dem Decodierer wieder zu erzeugen. Dies gestattet, dass der Codierer Rauschkomponenten bei dem Codierprozess weglässt, wobei derselbe so effizienter gemacht wird. Damit derartige Verfahren jedoch erfolgreich sind, darf das Rauschen, das bei dem Codierprozess durch den Codierer ausgeschlossen wird, keine anderen Signalkomponenten enthalten. Dieses Rauschcodierschema, das auf einer harten Entscheidung basiert, resultiert in einem relativ geringen Belastungszyklus, da die meisten Rauschkomponenten gewöhnlich zeitmäßig und/oder frequenzmäßig mit anderen Signalkomponenten gemischt sind. Ferner löst dasselbe in keiner Weise das Problem ungenügender Rauschgehalte bei rekonstruierten Hochfrequenzbändern.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung, die durch die Ansprüche 1 und 2 definiert ist, spricht das Problem eines ungenügenden hörbaren Rauschgehalts in einem regenerierten Hochband und von Spektrallöchern aufgrund von abgestellten Frequenzbändern unter Niedrige-Bitrate-Bedingungen durch ein adaptives Hinzufügen eines Grundrauschens an. Dieselbe verhindert ferner eine ungewollte Rauschsubstitution für Oberschwingungen. Dies wird mittels einer Grundrauschpegelschätzung bei dem Codierer sowie eine adaptive Rauschpegeladdition und einer Begrenzung einer ungewollten Rauschsubstitution bei dem Decodierer durchgeführt.
  • Die adaptive Grundrauschaddition und das Rauschsubstitutionsbegrenzungsverfahren weisen die folgenden Schritte auf:
    • – bei einem Codierer, Schätzen des Grundrauschpegels eines ursprünglichen Signals unter Verwendung von Senk- und Spitzenfolgern, die auf eine Spektraldarstellung des ursprünglichen Signals angewendet werden;
    • – bei einem Codierer, Abbilden des Grundrauschpegels zu mehreren Frequenzbändern oder Darstellen desselben unter Verwendung von LCP oder irgendeiner anderen Polynomdarstellung;
    • – bei einem Codierer oder Decodierer, Glätten des Grundrauschpegels zeitmäßig und/oder frequenzmäßig;
    • – bei einem Decodierer, Formen eines Zufallsrauschen gemäß einer Spektralhüllkurvendarstellung des ursprünglichen Signals und Einstellen des Rauschens gemäß dem Grundrauschpegel, der bei dem Codierer geschätzt wird;
    • – bei einem Decodierer, Glätten des Rauschpegels zeitmäßig und/oder frequenzmäßig;
    • – Addieren des Grundrauschens zu dem hochfrequenzrekonstruierten Signal entweder in dem regenerierten Hochband oder in den abgestellten Frequenzbändern.
    • – Bei einem Decodierer, Einstellen der Spektralhüllkurve des hochfrequenzrekonstruierten Signals unter Verwendung eines Begrenzens der Hüllkurveneinstellungs-Verstärkungsfaktoren.
    • – Bei einem Decodierer, Verwenden einer Interpolation der empfangenen Spektralhüllkurve für eine erhöhte Frequenzauflösung und somit eine verbesserte Leistungsfähigkeit des Begrenzers.
    • – Bei einem Decodierer, Anwenden eines Glättens auf die Hüllkurveneinstellungs-Verstärkungsfaktoren.
    • – Bei einem Decodierer, Erzeugen eines hochfrequenzrekonstruierten Signals, das die Summe aus mehreren hochfrequenzkonstruierten Signalen ist, die aus unterschiedlichen Tiefbandfrequenzbereichen stammen, und Analysieren des Tiefbands, um Steuerdaten zu der Summierung zu liefern.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorliegende Erfindung wird nun durch darstellende Beispiele, die den Schutzbereich oder die Wesensart der Erfindung nicht begrenzen, mit Bezug auf die zugehörigen Zeichnungen beschrieben, in denen:
  • 1 den Spitzen- und Senkfolger, der auf ein Hoch- und Mittelauflösungsspektrum angewendet wird, und die Abbildung des Grundrauschens zu Frequenzbändern gemäß der vorliegenden Erfindung darstellt;
  • 2 das Grundrauschen bei einer zeitmäßigen und frequenzmäßigen Glättung gemäß der vorliegenden Erfindung darstellt;
  • 3 das Spektrum eines ursprünglichen Eingangssignals darstellt;
  • 4 das Spektrum des Ausgangssignals von einem SBR-Prozess ohne eine adaptive Grundrauschaddition darstellt;
  • 5 das Spektrum des Ausgangssignals mit SBR und einer adaptiven Grundrauschaddition gemäß der vorliegenden Erfindung darstellt;
  • 6 die Verstärkungsfaktoren für die Spektralhüllkurveneinstellungsfilterbank gemäß der vorliegenden Erfindung darstellt;
  • 7 das Glätten von Verstärkungsfaktoren in der Spektralhüllkurveneinstellungsfilterbank gemäß der vorliegenden Erfindung darstellt;
  • 8 eine mögliche Implementierung der vorliegenden Erfindung bei einem Quellcodiersystem auf der Codiererseite darstellt;
  • 9 eine mögliche Implementierung der vorliegenden Erfindung bei einem Quellcodiersystem auf der Decodiererseite darstellt.
  • BESCHREIBUNG VON BEVORZUGTEN AUSFÜHRUNGSBEISPIELEN
  • Die unten beschriebenen Ausführungsbeispiele stellen lediglich die Grundlagen der vorliegenden Erfindung für eine Verbesserung von Hochfrequenzrekonstruktionssystemen dar. Es ist klar, dass Modifikationen und Variationen der hierin beschriebenen Anordnungen und der Details anderen Fachleuten auf dem Gebiet ersichtlich sind. Es ist deshalb die Absicht, lediglich durch den Schutzbereich der folgenden Patentansprüche und nicht durch die spezifischen Details begrenzt zu sein, die durch eine Beschreibung und Erläuterung der Ausführungsbeispiele hierin vorgelegt sind.
  • Grundrauschpegelschätzung
  • Bei einem Analysieren eines Audiosignalspektrums mit einer ausreichenden Frequenzauflösung sind Formanten, einzelne Sinuskurven, etc. deutlich sichtbar und dies wird hierin im Folgenden als die fein strukturierte Spektralhüllkurve bezeichnet. Falls jedoch eine niedrige Auflösung verwendet wird, können keine feinen Details beobachtet werden, und dies wird hierin im Folgenden als die grob strukturierte Spektralhüllkurve bezeichnet. Der Pegel des Grundrauschens, obwohl derselbe der Definition nach nicht notwendigerweise ein Rauschen ist, wie derselbe überall in der vorliegenden Erfindung verwendet wird, bezieht sich auf das Verhältnis zwischen einer grob strukturierten Spektralhüllkurve, die entlang der Lokal-Minimum-Punkte in dem Hochauflösungsspektrum interpoliert ist, und einer grob strukturierten Spektralhüllkurve, die entlang den Lokal-Maximum-Punkten in dem Hochauflösungsspektrum interpoliert ist. Diese Messung wird durch ein Berechnen einer Hochauflösungs-FFT für das Signalsegment und ein Anwenden eines Spitzen- und eines Senkfolgers, 1, erhalten. Der Grundrauschpegel wird dann als die Differenz zwischen dem Spitzen- und dem Senkfolger berechnet. Bei einem geeigneten zeitmäßigen und frequenzmäßigen Glätten dieses Signals wird ein Grundrauschpegelmaß erhalten. Die Spitzenfolgerfunktion und die Senkfolgerfunktion können gemäß Gl. 1 und Gl. 2 beschrieben werden,
    Figure 00060001
    Figure 00070001
    wobei T der Abklingfaktor ist und X(k) der logarithmische absolute Wert des Spektrums bei einer Linie k ist. Das Paar wird für zwei unterschiedliche FFT-Größen berechnet, eine hohe Auflösung und eine mittlere Auflösung, um einen guten Schätzwert während Vibratos und quasistationären Klängen zu erlangen. Die Spitzen- und Senkfolger, die auf die Hochauflösungs-FFT angewendet werden, werden LP-gefiltert (tiefpassgefiltert), um Extremwerte auszusondern. Nach einem Erhalten der zwei Grundrauschpegelschätzwerte wird der größte gewählt. Bei einer Implementierung der vorliegenden Erfindung werden die Grundrauschpegelwerte zu mehreren Frequenzbändern abgebildet, jedoch könnten andere Abbildungen verwendet werden, z. B. Kurvenanpassungspolynome oder LPC-Koeffizienten. Es ist anzumerken, dass mehrere unterschiedliche Ansätze verwendet werden könnten, wenn die Rauschgehalte bei einem Audiosignal bestimmt werden. Wie es oben beschrieben ist, ist es jedoch ein Ziel dieser Erfindung, die Differenz zwischen lokalen Minima und Maxima in einem Hochauflösungsspektrum zu schätzen, obwohl dies nicht notwendigerweise eine genaue Messung des wahren Rauschpegels ist. Andere mögliche Verfahren sind eine Linearprädikation, eine Autokorrelation, etc., wobei diese häufig bei Rauschen-/kein-Rauschen-Algorithmen mit harter Entscheidung [„Improving Audio Codecs by Noise Substitution" D. Schultz, JAES, Bd. 44, Nr. 7/8, 1996] verwendet werden. Obwohl diese Verfahren versuchen, die Größe eines echten Rauschens in einem Signal zu messen, sind dieselben zum Messen eines Grundrauschpegels anwendbar, wie es in der vorliegenden Erfindung definiert ist, auch wenn dieselben keine gleich guten Ergebnisse wie das oben umrissene Verfahren ergeben. Es ist ebenfalls möglich, einen Analyse-durch-Synthese-Ansatz zu verwenden, d. h. einen, der einen Decodierer in dem Codierer aufweist und auf diese Weise einen korrekten Wert der Größe eines erforderlichen adaptiven Rauschens bewertet.
  • Adaptive Grundrauschaddition
  • Um das adaptive Grundrauschen anzuwenden, muss eine Spektralhüllkurvendarstellung des Signals verfügbar sein. Dies können lineare PCM-Werte für Filterbandimplementierungen oder eine LPC-Darstellung sein. Das Grundrauschen wird gemäß dieser Hüllkurve vor einem Einstellen desselben zu korrekten Pegeln gemäß den Werten, die durch den Decodierer empfangen werden, geformt. Es ist auch möglich, die Werte mit einem zusätzlichen Versatz, der in dem Decodierer gegeben ist, einzustellen.
  • Bei einer Decodiererimplementierung der vorliegenden Erfindung werden die empfangenen Grundrauschpegel mit einer oberen Begrenzung, die in dem Decodierer gegeben ist, verglichen, zu mehreren Filterbankkanälen abgebildet und nachfolgend durch ein LP-Filter sowohl zeitmäßig als auch frequenzmäßig, 2, geglättet. Das replizierte Hochbandsignal wird eingestellt, um den korrekten Gesamtsignalpegel zu erhalten, nach einem Addieren des Grundrauschens zu dem Signal. Die Einstellungsfaktoren und Grundrauschenergien werden gemäß Gl. 3 und Gl. 4 berechnet.
    Figure 00080001
    wobei k die Frequenzlinie angibt, l den Zeitindex für jeden Subbandabtastwert, sfb_nrg(k,l), die Hüllkurvendarstellung ist und nf(k,l) der Grundrauschpegel ist. Wenn ein Rauschen mit einer Energie noiseLevel(k,l) erzeugt wird und die Hochbandamplitude mit adjustFactor(k,l) eingestellt wird, werden das addierte Grundrauschen und das Hochband eine Energie gemäß sfb_nrg(k,l) aufweisen. Ein Beispiel des Ausgangs von dem Algorithmus ist in 25 angezeigt. 3 zeigt das Spektrum eines ursprünglichen Signals, das eine sehr ausgeprägte Formantenstruktur in dem Tiefband, aber viel weniger ausgeprägt in dem Hochband, enthält. Ein Verarbeiten desselben mit SBR ohne eine adaptive Grundrauschaddition ergibt ein Ergebnis gemäß Anspruch 4. Hier ist es offensichtlich, dass, obwohl die Formantenstruktur des replizierten Hochbands korrekt ist, der Grundrauschpegel zu niedrig ist. Der Grundrauschpegel, der gemäß der Erfindung geschätzt und angewendet wird, ergibt das Ergebnis von 5, bei dem das Grundrauschen, das dem replizierten Hochband überlagert ist, angezeigt ist. Der Vorteil einer adaptiven Grundrauschaddition ist sowohl visuell als auch hörbar offensichtlich.
  • Transponiererverstärkungsanpassung
  • Ein idealer Replikationsprozess, der mehrere Transpositionsfaktoren benutzt, erzeugt eine große Anzahl von harmonischen Komponenten und liefert eine harmonische Dichte ähnlich derselben des Originals. Ein Verfahren, um geeignete Verstärkungsfaktoren für die unterschiedlichen Oberschwingungen auszuwählen, ist unten beschrieben. Man nehme an, dass das Eingangssignal eine harmonische Reihe ist:
  • Figure 00090001
  • Eine Transposition um einen Faktor Zwei ergibt:
  • Figure 00090002
  • Es ist deutlich, dass jede zweite Oberschwingung in dem transponierten Signal fehlt. Um die harmonische Dichte zu erhöhen, werden Oberschwingungen von Transpositionen höherer Ordnung, M = 3,5 etc., zu dem Hochband addiert. Um am meisten von mehreren Oberschwingungen zu profitieren, ist es wichtig, die Pegel derselben geeignet einzustellen, um zu vermeiden, dass eine Oberschwingung innerhalb eines überlappenden Frequenzbereichs eine andere dominiert. Ein Problem, das entsteht, wenn dies vorgenommen wird, besteht darin, wie die Differenzen bei einem Signalpegel zwischen den Quellbereichen der Oberschwingungen zu handhaben sind. Diese Differenzen neigen ferner dazu, zwischen einem Programmmaterial zu variieren, was es schwierig macht, konstante Verstärkungsfaktoren für die unterschiedlichen Oberschwingungen zu verwenden. Ein Verfahren für eine Pegeleinstellung der Oberschwingungen, das die Spektralverteilung in dem Tiefband berücksichtigt, ist hier erläutert. Die Ausgangssignale von den Transponierern werden durch Verstärkungseinsteller zugeführt, addiert und zu der Hüllkurveneinstellungsfilterbank gesendet. Zu dieser Filterbank wird auch das Tiefbandsignal gesendet, wobei eine Spektralanalyse desselben ermöglicht ist. Bei der vorliegenden Erfindung werden die Signalleistungen der Quellbereiche entsprechend den unterschiedlichen Transpositionsfaktoren bewertet und die Verstärkungen der Oberschwingungen werden entsprechend eingestellt. Eine höher entwickelte Lösung besteht darin, die Steigung des Tiefbandspektrums zu schätzen und dies vor der Filterbank unter Verwendung einfacher Filterimplementierungen, z. B. Fächerfilter oder Shelving-Filter, zu kompensieren. Es ist wichtig, anzumerken, dass diese Prozedur die Abgleichsfunktionalität der Filterbank nicht beeinflusst und dass das Tiefband, das durch die Filterbank analysiert wird, durch dieselbe nicht wieder synthetisiert wird.
  • Rauschsubstitutionsbegrenzung
  • Gemäß dem Obigen (Gl. 5 und Gl. 6) wird das replizierte Hochband gelegentlich Löcher in dem Spektrum enthalten. Der Hüllkurveneinstellungsalgorithmus versucht, die Spektralhüllkurve des regenerierten Hochbands derselben des Originals ähnlich zu machen. Man nehme an, das ursprüngliche Signal weist eine hohe Energie innerhalb eines Frequenzbands auf und dass das transponierte Signal ein Spektralloch innerhalb dieses Frequenzbands zeigt. Dies impliziert, vorausgesetzt, dass die Verstärkungsfaktoren beliebige Werte annehmen dürfen, dass ein sehr hoher Verstärkungsfak tor auf dieses Frequenzband angewendet wird und ein Rauschen oder andere ungewollte Signalkomponenten zu der gleichen Energie wie derselben des Originals eingestellt werden. Dies wird als eine Substitution eines ungewollten Rauschens bezeichnet. Man lasse P1 = [p11,...,p1N] Gl. 7die Skalierungsfaktoren des ursprünglichen Signals zu einer gegebenen Zeit und P2 = [p21,...p2N] Gl. 8die entsprechenden Skalierungsfaktoren des transponierten Signals sein, wobei jedes Element der zwei Vektoren eine Subbandenergie darstellt, die zeitmäßig und frequenzmäßig normiert ist. Die erforderlichen Verstärkungsfaktoren für die Spektralhüllkurveneinstellungsfilterbank werden erhalten als
  • Figure 00110001
  • Durch ein Beobachten von G ist es trivial, die Frequenzbänder mit einer Substitution eines unerwünschten Rauschens zu bestimmen, da dieselben viel höhere Verstärkungsfaktoren als die anderen zeigen. Die Substitution eines unerwünschten Rauschens wird somit ohne weiteres durch ein Anwenden eines Begrenzers auf die Verstärkungsfaktoren vermieden, d. h. ein Ermöglichen, dass dieselben bis zu einer bestimmten Begrenzung, gmax, frei variieren. Die Verstärkungsfaktoren unter Verwendung des Rauschbegrenzers werden erhalten durch Glim = [min(g1, gmax),..., min(gN, gmax)]. Gl . 10
  • Dieser Ausdruck zeigt jedoch lediglich das Grundprinzip dieser Rauschbegrenzer an. Da die Spektralhüllkurve des transponierten und des ursprünglichen Signals sich sowohl bei einem Pegel als auch einer Steigung erheblich unterscheiden könnten, ist es nicht machbar, konstante Werte für gmax zu verwenden. An Stelle dessen wird die durchschnittliche Verstärkung, definiert als
    Figure 00120001
    berechnet und die Verstärkungsfaktoren dürfen dieselbe um eine bestimmte Größe überschreiten. Um Breitbandpegelvariationen zu berücksichtigen, ist es ferner möglich, die zwei Vektoren P1 und P2 in unterschiedliche Teilvektoren zu teilen und dieselben entsprechend zu verarbeiten. Auf diese Weise wird ein sehr effizienter Rauschbegrenzer erhalten, ohne die Funktionalität der Pegeleinstellung der Subbandsignale, die nützliche Informationen enthalten, zu stören oder zu begrenzen.
  • Interpolation
  • Bei Subbandaudiocodierern werden die Kanäle der Analysefilterbank häufig gruppiert, wenn Skalierungsfaktoren erzeugt werden. Die Skalierungsfaktoren stellen einen Schätzwert der Spektraldichte innerhalb des Frequenzbands dar, das die gruppierten Analysefilterbankkanäle enthält. Um die niedrigstmögliche Bitrate zu erhalten, ist es erwünscht, die Anzahl von gesendeten Skalierungsfaktoren zu minimieren, was die Verwendung von größtmöglichen Gruppen von Filterkanälen impliziert. Gewöhnlich wird dies durch ein Gruppieren der Frequenzbänder gemäß einer Bark-Skala vorgenommen, wobei so die logarithmische Frequenzauflösung des menschlichen Hörsystems ausgenutzt wird. Bei einer SBR-Decodierer-Hüllkurveneinstellungsfilterbank ist es möglich, die Kanäle identisch zu der Gruppierung zu gruppieren, die während der Skalierungsfaktorberechnung bei dem Codierer verwendet wird. Die Einstellungsfilterbank kann jedoch durch ein Interpolieren von Werten aus den empfangenen Skalierungsfaktoren auf einer Filterbankkanalbasis immer noch wirksam sein. Das einfachste Interpolationsverfahren besteht darin, jedem Filterbankkanal innerhalb der Gruppe, die für die Skalierungsfaktorberechnung verwendet wird, den Wert des Skalierungsfaktors zuzuweisen. Das transponierte Signal wird ferner analysiert und ein Skalierungsfaktor pro Filterbankkanal wird berechnet. Diese Skalierungsfaktoren und die interpolierten, die die ursprüngliche Spektralhüllkurve darstellen, werden verwendet, um die Verstärkungsfaktoren gemäß dem Obigen zu berechnen. Es gibt zwei Hauptvorteile bei diesem Frequenzbereich-Interpolierungsschema. Das transponierte Signal weist gewöhnlich ein dünner besetztes Spektrum als das ursprüngliche auf. Eine Spektralglättung ist somit vorteilhaft und dasselbe wird effizienter gemacht, wenn dasselbe an schmalen Frequenzbändern verglichen mit breiten Bändern wirksam ist. Mit anderen Worten können die erzeugten Oberschwingungen besser durch die Hüllkurveneinstellungsfilterbank isoliert und gesteuert werden. Ferner wird die Leistungsfähigkeit des Rauschbegrenzers verbessert, da Spektrallöcher bei einer höheren Frequenzauflösung besser geschätzt und gesteuert werden können.
  • Glättung
  • Nach einem Erhalten der Verstärkungsfaktoren ist es vorteilhaft, ein zeitmäßiges und frequenzmäßiges Glätten anzuwenden, um ein Aliasing und ein Nachschwingen oder Ringing bei der Einstellungsfilterbank sowie eine Welligkeit bei den Verstärkungsfaktoren zu vermeiden. 6 zeigt die Verstärkungsfaktoren an, die mit den entsprechenden Subbandabtastwerten multipliziert werden sollen. Die Figur stellt zwei Hochauflösungsblöcke gefolgt durch drei Niedrigauflösungsblöcke und einen Hochauflösungsblock dar. Dieselbe zeigt ferner die abnehmende Frequenzauflösung bei höheren Frequenzen. Die Schärfe von 6 ist in 7 durch ein Filtern der Verstärkungsfaktoren sowohl zeitmäßig als auch frequenzmäßig zum Beispiel durch ein Einsetzen eines gewichteten gleitenden Mittels eliminiert. Es ist jedoch wichtig, die Transientenstruktur für die kurzen Blöcke zeitmäßig beizubehalten, um das Transientenansprechen des replizierten Frequenzbereichs nicht zu reduzieren. Gleichermaßen ist es wichtig, die Verstärkungsfaktoren für die Hochauflösungsblöcke nicht übermäßig zu filtern, um die Formantenstruktur des replizierten Frequenzbereichs beibehalten. In 9b ist das Filtern beabsichtigterweise für eine bessere Sichtbarkeit übertrieben.
  • Praktische Implementierungen
  • Die vorliegende Erfindung kann sowohl in Hardwarechips als auch in DSPs für verschiedene Arten von Systemen, für eine Speicherung oder Sendung von Signalen, analog oder digital, unter Verwendung beliebiger Codecs implementiert werden. 8 und 9 zeigen eine mögliche Implementierung der vorliegenden Erfindung. Hier wird eine Hochbandrekonstruktion mittels einer Spektralbandreplikation, SBR, vorgenommen. In 8 ist die Codiererseite angezeigt. Das analoge Eingangssignal wird dem A/D-Wandler 801 und einem beliebigen Audiocodierer, 802, sowie der Grundrauschpegelschätzeinheit 803 und einer Hüllkurvenextraktionseinheit 804 zugeführt. Die codierten Informationen werden in einen seriellen Bitstrom, 805, gemultiplext und gesendet oder gespeichert. In 9 ist eine typische Decodiererimplementierung angezeigt. Der serielle Bitstrom wird gedemultiplext, 901, und die Hüllkurvendaten werden decodiert, 902, d. h. die Spektralhüllkurve des Hochbands und der Grundrauschpegel. Das gedemultiplexte quellcodierte Signal wird unter Verwendung eines beliebigen Audiodecodierers, 903, decodiert und aufwärts abgetastet 904. Bei der vorliegenden Implementierung wird eine SBR-Transposition bei einer Einheit 905 angewendet. Bei dieser Einheit werden die unterschiedlichen Oberschwingungen unter Verwendung der Rückkopplungsinformationen von der Analysefilterbank, 908, gemäß der vorliegenden Erfindung verstärkt. Die Grundrauschpegeldaten werden zu der Adaptive-Grundrauschaddi tion-Einheit, 906, gesendet, wo ein Grundrauschen erzeugt wird. Gemäß der vorliegenden Erfindung werden die Spektralhüllkurvendaten interpoliert, 907, und die Verstärkungsfaktoren werden begrenzt 909 und geglättet 910. Das rekonstruierte Hochband wird eingestellt 911 und das adaptive Rauschen wird addiert. Schließlich wird das Signal wieder synthetisiert 912 und zu dem verzögerten 913 Tiefband addiert. Das digitale Ausgangssignal wird zurück in einen analogen Signalverlauf 914 umgewandelt.

Claims (6)

  1. Eine Vorrichtung zum Verbessern eines Quelldecodierers, wobei der Quelldecodierer ein decodiertes Audiosignal durch ein Decodieren eines codierten Signals erzeugt, das durch ein Quellcodieren eines ursprünglichen Signals erhalten wird, wobei das ursprüngliche Signal einen Tiefbandabschnitt und einen Hochbandabschnitt aufweist, wobei das codierte Signal den Tiefbandabschnitt des ursprünglichen Signals umfasst und den Hochbandabschnitt des ursprünglichen Signals nicht umfasst, wobei das decodierte Signal für eine Hochfrequenzrekonstruktion verwendet wird, um ein hochfrequenzrekonstruiertes Signal zu erhalten, das einen rekonstruierten Hochbandabschnitt des ursprünglichen Signals umfasst, die folgende Merkmale aufweist: einen Einsteller (907, 909, 910, 911) zum Einstellen einer Spektralhüllkurve des hochfrequenzrekonstruierten Signals unter Verwendung begrenzter Verstärkungsfaktoren für ausgewählte Frequenzbänder des hochfrequenzrekonstruierten Signals, wobei der Einsteller folgende Merkmale umfasst: einen Verstärkungsfaktor-Berechner zum Berechnen von Hüllkurveneinstellungsverstärkungsfaktoren für Frequenzbänder des hochfrequenzrekonstruierten Signals; einen Begrenzer (909) zum Begrenzen von Hüllkurveneinstellungsverstärkungsfaktoren für die ausgewählten Frequenzbänder, wobei der Begrenzer wirksam ist, um die Hüllkurveneinstellungsverstärkungsfaktoren zu beobachten, um die ausgewählten Frequenzbänder als die Frequenzbänder zu bestimmen, die Verstärkungsfaktoren aufweisen, die eine bestimmte Verstärkungsfaktorgrenze überschreiten, und um die Verstärkungsfaktoren der ausgewählten Frequenzbänder zu begrenzen.
  2. Die Vorrichtung gemäß Anspruch 1, bei der der Verstärkungsfaktor-Berechner wirksam ist, um die Verstärkungsfaktoren unter Verwendung der folgenden Gleichung zu bestimmen:
    Figure 00170001
    wobei g1,..., gN die Verstärkungsfaktoren für Frequenzbänder 1,..., N sind, wobei P1 = [p11,...,p1N] Skalierungsfaktoren für die Frequenzbänder 1,..., N des ursprünglichen Signals zu einer gegebenen Zeit sind, und wobei P2 = [p21,..., p2N] Skalierungsfaktoren für die Frequenzbänder des transponierten Signals sind.
  3. Die Vorrichtung gemäß Anspruch 2, bei der ein Element pij in den Vektoren P1 und P2 eine Frequenzbandenergie darstellt, die in einer Zeit und einer Frequenz normiert ist.
  4. Die Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der der Begrenzer wirksam ist, um die Verstärkungsfaktoren der ausgewählten Frequenzbänder durch ein Anwenden der folgenden Gleichung zu begrenzen: Glim = [min(g1, gmax),..., min (gN, gmax)], wobei Glim ein Vektor ist, der die begrenzten und unbegrenzten Verstärkungsfaktoren g1,..., gN für die Frequenzbänder 1,..., N aufweist, wobei min(,) die Minimumfunktion ist, und wobei gmax die bestimmte Verstärkungsfaktorgrenze ist.
  5. Die Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der der Begrenzer (909) wirksam ist, um unter Verwendung der folgenden Gleichung eine durchschnittliche Verstärkung Gavg zu bestimmen:
    Figure 00180001
    wobei P1 = [p11,..., p1N] Skalierungsfaktoren für die Frequenzbänder 1,..., N des ursprünglichen Signals zu einer gegebenen Zeit sind, wobei P2 = [p21,..., P2N] Skalierungsfaktoren für die Frequenzbänder des transponierten Signals sind, und wobei die durchschnittliche Verstärkung plus eines bestimmten Betrags die bestimmte Verstärkungsfaktorgrenze ist.
  6. Die Vorrichtung gemäß Anspruch 5, bei der der Begrenzer (909) wirksam ist, um die zwei Vektoren P1 und P2 in unterschiedliche Teilvektoren zu dividieren.
DE60024501T 1999-01-27 2000-01-26 Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution Expired - Lifetime DE60024501T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE9900256A SE9900256D0 (sv) 1999-01-27 1999-01-27 Metod och anordning för förbättring av effektivitet och ljudkvalitet hos ljudkodare
SE9900256 1999-01-27
SE9903553 1999-10-01
SE9903553A SE9903553D0 (sv) 1999-01-27 1999-10-01 Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)

Publications (2)

Publication Number Publication Date
DE60024501D1 DE60024501D1 (de) 2006-01-05
DE60024501T2 true DE60024501T2 (de) 2006-06-08

Family

ID=26663489

Family Applications (5)

Application Number Title Priority Date Filing Date
DE60038915T Expired - Lifetime DE60038915D1 (de) 1999-01-27 2000-01-26 Verfahren und Vorrichtungen zur Spektralbandreplikation und Hochfrequenzen-Rekonstruktion basierten Audiokodierung mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60013785T Expired - Lifetime DE60013785T2 (de) 1999-01-27 2000-01-26 VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
DE60024501T Expired - Lifetime DE60024501T2 (de) 1999-01-27 2000-01-26 Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60043364T Expired - Lifetime DE60043364D1 (de) 1999-01-27 2000-01-26 Vorrichtung und Verfahren für die Anpassung der spektralen Hüllkurve eines hochfrequenzrekonstruierten Signals
DE60043363T Expired - Lifetime DE60043363D1 (de) 1999-01-27 2000-01-26 Verfahren und Vorrichtung für die Dekodierung eines Signals mittels Spektralbandreplikation und Interpolation von Skalenfaktoren

Family Applications Before (2)

Application Number Title Priority Date Filing Date
DE60038915T Expired - Lifetime DE60038915D1 (de) 1999-01-27 2000-01-26 Verfahren und Vorrichtungen zur Spektralbandreplikation und Hochfrequenzen-Rekonstruktion basierten Audiokodierung mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60013785T Expired - Lifetime DE60013785T2 (de) 1999-01-27 2000-01-26 VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION

Family Applications After (2)

Application Number Title Priority Date Filing Date
DE60043364T Expired - Lifetime DE60043364D1 (de) 1999-01-27 2000-01-26 Vorrichtung und Verfahren für die Anpassung der spektralen Hüllkurve eines hochfrequenzrekonstruierten Signals
DE60043363T Expired - Lifetime DE60043363D1 (de) 1999-01-27 2000-01-26 Verfahren und Vorrichtung für die Dekodierung eines Signals mittels Spektralbandreplikation und Interpolation von Skalenfaktoren

Country Status (15)

Country Link
US (11) USRE43189E1 (de)
EP (5) EP1408484B1 (de)
JP (7) JP3603026B2 (de)
CN (6) CN1838238B (de)
AT (5) ATE276569T1 (de)
AU (1) AU2585700A (de)
BR (4) BR122015007146B1 (de)
DE (5) DE60038915D1 (de)
DK (5) DK1408484T3 (de)
ES (5) ES2307100T3 (de)
HK (6) HK1053534A1 (de)
PT (4) PT1157374E (de)
RU (1) RU2226032C2 (de)
SE (1) SE9903553D0 (de)
WO (1) WO2000045379A2 (de)

Families Citing this family (178)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
ATE319162T1 (de) * 2001-01-19 2006-03-15 Koninkl Philips Electronics Nv Breitband-signalübertragungssystem
FR2821501B1 (fr) * 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
AUPR433901A0 (en) * 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
DE60208426T2 (de) 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
EP1374230B1 (de) * 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audiocodierung und decodierung
EP1444688B1 (de) 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Kodiervorrichtung und dekodiervorrichtung
EP1451812B1 (de) * 2001-11-23 2006-06-21 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
JP4317355B2 (ja) * 2001-11-30 2009-08-19 パナソニック株式会社 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP3579047B2 (ja) 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CN100492492C (zh) 2002-09-19 2009-05-27 松下电器产业株式会社 音频解码设备和方法
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
EP1414273A1 (de) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Signalisierung von eingebetten Daten
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
ATE486348T1 (de) * 2003-06-30 2010-11-15 Koninkl Philips Electronics Nv Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch
DE602004021266D1 (de) * 2003-09-16 2009-07-09 Panasonic Corp Kodier- und dekodierapparat
US7949057B2 (en) * 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
GB2407952B (en) * 2003-11-07 2006-11-29 Psytechnics Ltd Quality assessment tool
JP2007514968A (ja) * 2003-12-01 2007-06-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号強化方法及び装置、目的信号検出器、音響システム
FR2865310A1 (fr) * 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
GB2416285A (en) 2004-07-14 2006-01-18 British Broadcasting Corp Transmission of a data signal in an audio signal
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
WO2006075563A1 (ja) * 2005-01-11 2006-07-20 Nec Corporation オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
EP1845520A4 (de) * 2005-02-02 2011-08-10 Fujitsu Ltd Signalverarbeitungsverfahren und signalverarbeitungseinrichtung
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US9560349B2 (en) 2005-04-19 2017-01-31 Koninklijke Philips N.V. Embedded data signaling
DK1742509T3 (da) * 2005-07-08 2013-11-04 Oticon As Et system og en fremgangsmåde til eliminering af feedback og støj i et høreapparat
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4701392B2 (ja) * 2005-07-20 2011-06-15 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
WO2007029796A1 (ja) * 2005-09-08 2007-03-15 Pioneer Corporation 帯域拡張装置、帯域拡張方法および帯域拡張プログラム
US8396717B2 (en) * 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP4954080B2 (ja) 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
US7536299B2 (en) * 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US20070270987A1 (en) 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
EP1870880B1 (de) 2006-06-19 2010-04-07 Sharp Kabushiki Kaisha Signalverarbeitungsverfahren, Signalverarbeitungsvorrichtung und Aufzeichnungsmedium
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US20100017197A1 (en) * 2006-11-02 2010-01-21 Panasonic Corporation Voice coding device, voice decoding device and their methods
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
GB0703275D0 (en) * 2007-02-20 2007-03-28 Skype Ltd Method of estimating noise levels in a communication system
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
MX2010001394A (es) 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
CN101868823B (zh) * 2007-10-23 2011-12-07 歌乐株式会社 高频插值装置和高频插值方法
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
JP5140162B2 (ja) * 2007-12-20 2013-02-06 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音抑圧方法及び装置
US9177566B2 (en) * 2007-12-20 2015-11-03 Telefonaktiebolaget L M Ericsson (Publ) Noise suppression method and apparatus
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
AU2009221444B2 (en) * 2008-03-04 2012-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
CN102789785B (zh) 2008-03-10 2016-08-17 弗劳恩霍夫应用研究促进协会 操纵具有瞬变事件的音频信号的方法和设备
CN101582263B (zh) * 2008-05-12 2012-02-01 华为技术有限公司 语音解码中噪音增强后处理的方法和装置
US9575715B2 (en) * 2008-05-16 2017-02-21 Adobe Systems Incorporated Leveling audio signals
MY155538A (en) * 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010003557A1 (en) * 2008-07-11 2010-01-14 Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Apparatus and method for generating a bandwidth extended signal
KR101224560B1 (ko) 2008-07-11 2013-01-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 인코드된 오디오 신호를 디코딩하는 장치 및 방법
AU2013257391B2 (en) * 2008-07-11 2015-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for generating bandwidth extension output data
RU2536679C2 (ru) * 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
CA3231911A1 (en) 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8983831B2 (en) * 2009-02-26 2015-03-17 Panasonic Intellectual Property Corporation Of America Encoder, decoder, and method therefor
KR101367604B1 (ko) 2009-03-17 2014-02-26 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
EP2239732A1 (de) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines synthetischen Audiosignals und zur Kodierung eines Audiosignals
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
WO2011001578A1 (ja) * 2009-06-29 2011-01-06 パナソニック株式会社 通信装置
CN101638861B (zh) * 2009-08-16 2012-07-18 岳阳林纸股份有限公司 一种工业淋膜原纸的制造方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
JP5414454B2 (ja) 2009-10-23 2014-02-12 日立オートモティブシステムズ株式会社 車両運動制御装置
US9305563B2 (en) 2010-01-15 2016-04-05 Lg Electronics Inc. Method and apparatus for processing an audio signal
EP2362375A1 (de) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Gerät und Verfahren zur Änderung eines Audiosignals durch Hüllkurvenenformung
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2011127832A1 (en) * 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
JP5589631B2 (ja) 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101709095B1 (ko) 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP2011059714A (ja) * 2010-12-06 2011-03-24 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP2466580A1 (de) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Codierer und Verfahren zur prädiktiven Codierung, Decodierer und Verfahren zur Decodierung, System und Verfahren zur prädiktiven Codierung und Decodierung und prädiktiv codiertes Informationssignal
US8706509B2 (en) * 2011-04-15 2014-04-22 Telefonaktiebolaget L M Ericsson (Publ) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
JP5569476B2 (ja) * 2011-07-11 2014-08-13 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
JP2013073230A (ja) * 2011-09-29 2013-04-22 Renesas Electronics Corp オーディオ符号化装置
CN103123787B (zh) * 2011-11-21 2015-11-18 金峰 一种移动终端与媒体同步与交互的方法
ES2568640T3 (es) * 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
EP2830062B1 (de) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Verfahren und vorrichtung für hochfrequente codierung/decodierung zur bandbreitenerweiterung
CN104221082B (zh) * 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
US20140081627A1 (en) * 2012-09-14 2014-03-20 Quickfilter Technologies, Llc Method for optimization of multiple psychoacoustic effects
EP3693962A1 (de) * 2013-01-29 2020-08-12 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Rauschfüllungskonzept
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
CN116741186A (zh) * 2013-04-05 2023-09-12 杜比国际公司 立体声音频编码器和解码器
CN110265047B (zh) 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
RU2662921C2 (ru) 2013-06-10 2018-07-31 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
ES2635026T3 (es) 2013-06-10 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
EP2830055A1 (de) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kontextbasierte Entropiecodierung von Probenwerten einer spektralen Hüllkurve
EP2830065A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Decodierung eines codierten Audiosignals unter Verwendung eines Überschneidungsfilters um eine Übergangsfrequenz
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN105874534B (zh) * 2014-03-31 2020-06-19 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
ES2843300T3 (es) * 2014-05-01 2021-07-16 Nippon Telegraph & Telephone Codificación de una señal de sonido
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2980801A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Schätzung des Rauschens in einem Audiosignal, Rauschschätzer, Audiocodierer, Audiodecodierer und System zur Übertragung von Audiosignalen
EP3067889A1 (de) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und vorrichtung zur transformation für signal-adaptive kernelschaltung bei der audiocodierung
US10741196B2 (en) 2016-03-24 2020-08-11 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
CA3019506C (en) 2016-04-12 2021-01-19 Markus Multrus Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置
US10537341B2 (en) 2017-09-20 2020-01-21 Depuy Ireland Unlimited Company Orthopaedic system and method for assembling prosthetic components
US10537446B2 (en) 2017-09-20 2020-01-21 Depuy Ireland Unlimited Company Method and instruments for assembling an orthopaedic prosthesis
US10543001B2 (en) 2017-09-20 2020-01-28 Depuy Ireland Unlimited Company Method and instruments for assembling a femoral orthopaedic prosthesis
EP3483879A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analyse-/synthese-fensterfunktion für modulierte geläppte transformation
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
SG11202010374VA (en) * 2018-04-25 2020-11-27 Dolby Int Ab Integration of high frequency audio reconstruction techniques
AU2019257701A1 (en) 2018-04-25 2020-12-03 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
CN110633686B (zh) * 2019-09-20 2023-03-24 安徽智寰科技有限公司 一种基于振动信号数据驱动的设备转速识别方法
US11817114B2 (en) 2019-12-09 2023-11-14 Dolby Laboratories Licensing Corporation Content and environmentally aware environmental noise compensation
CN111257933B (zh) * 2019-12-26 2021-01-05 中国地质大学(武汉) 基于低频阴影现象的油气藏预测新方法
CN113630120A (zh) * 2021-03-31 2021-11-09 中山大学 一种结合1比特模数转换器的零时延通信方法及其应用
KR20220158395A (ko) 2021-05-24 2022-12-01 한국전자통신연구원 오디오 신호의 부호화 및 복호화 방법과 그 방법을 수행하는 부호화기 및 복호화기

Family Cites Families (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4166924A (en) 1977-05-12 1979-09-04 Bell Telephone Laboratories, Incorporated Removing reverberative echo components in speech signals
FR2412987A1 (fr) 1977-12-23 1979-07-20 Ibm France Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede
JPS55102982A (en) * 1979-01-31 1980-08-06 Sony Corp Synchronizing detection circuit
US4330689A (en) 1980-01-28 1982-05-18 The United States Of America As Represented By The Secretary Of The Navy Multirate digital voice communication processor
EP0070948B1 (de) 1981-07-28 1985-07-10 International Business Machines Corporation Sprachkodierungsverfahren und Ausführungsanordnung für das genannte Verfahren
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4672670A (en) 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
US4538297A (en) * 1983-08-08 1985-08-27 Waller Jr James Aurally sensitized flat frequency response noise reduction compansion system
US4700362A (en) 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation A-D encoder and D-A decoder system
IL73030A (en) 1984-09-19 1989-07-31 Yaacov Kaufman Joint and method utilising its assembly
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
FR2577084B1 (fr) 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
CA1220282A (en) 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
DE3683767D1 (de) 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4771465A (en) 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5285520A (en) 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5226000A (en) * 1988-11-08 1993-07-06 Wadia Digital Corporation Method and system for time domain interpolation of digital audio signals
EP0392126B1 (de) 1989-04-11 1994-07-20 International Business Machines Corporation Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion
US5261027A (en) 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US4974187A (en) 1989-08-02 1990-11-27 Aware, Inc. Modular digital signal processing system
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US4969040A (en) 1989-10-26 1990-11-06 Bell Communications Research, Inc. Apparatus and method for differential sub-band coding of video signals
US5293449A (en) 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
JP3158458B2 (ja) 1991-01-31 2001-04-23 日本電気株式会社 階層表現された信号の符号化方式
GB9104186D0 (en) 1991-02-28 1991-04-17 British Aerospace Apparatus for and method of digital signal processing
US5235420A (en) 1991-03-22 1993-08-10 Bell Communications Research, Inc. Multilayer universal video coder
KR100268623B1 (ko) 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
JPH05191885A (ja) 1992-01-10 1993-07-30 Clarion Co Ltd 音響信号イコライザ回路
US5765127A (en) 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5351338A (en) 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
CA2106440C (en) 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
JP3496230B2 (ja) 1993-03-16 2004-02-09 パイオニア株式会社 音場制御システム
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JPH07160299A (ja) 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
JP2616549B2 (ja) 1993-12-10 1997-06-04 日本電気株式会社 音声復号装置
CA2118880A1 (en) * 1994-03-11 1995-09-12 Kannan Ramchandran Jpeg/mpeg decoder-compatible optimized thresholding for image and video signal compression
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5787387A (en) 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
DE69533822T2 (de) * 1994-10-06 2005-12-01 Fidelix Y.K., Kiyose Verfahren zur Wiedergabe von Audiosignalen und Vorrichtung dafür
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729024A1 (fr) 1994-12-30 1996-07-05 Matra Communication Annuleur d'echo acoustique avec filtrage en sous-bandes
US5701390A (en) 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US5617509A (en) * 1995-03-29 1997-04-01 Motorola, Inc. Method, apparatus, and radio optimizing Hidden Markov Model speech recognition
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5915235A (en) 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5692050A (en) 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
EP0756267A1 (de) * 1995-07-24 1997-01-29 International Business Machines Corporation Methode und System zur Stille-Entfernung in Sprachübertragung
JPH0946233A (ja) 1995-07-31 1997-02-14 Kokusai Electric Co Ltd 音声符号化方法とその装置、音声復号方法とその装置
JPH0955778A (ja) 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5781888A (en) 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP3304739B2 (ja) 1996-02-08 2002-07-22 松下電器産業株式会社 ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置
CN1126264C (zh) * 1996-02-08 2003-10-29 松下电器产业株式会社 宽频带声音信号编码装置和宽频带声音信号编码解码装置
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5848164A (en) 1996-04-30 1998-12-08 The Board Of Trustees Of The Leland Stanford Junior University System and method for effects processing on audio subband data
DE19617476A1 (de) * 1996-05-02 1997-11-06 Francotyp Postalia Gmbh Verfahren und Anordnung zur Datenverarbeitung in einem Postverarbeitungssystem mit einer Frankiermaschine
US5974387A (en) 1996-06-19 1999-10-26 Yamaha Corporation Audio recompression from higher rates for karaoke, video games, and other applications
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
CA2184541A1 (en) 1996-08-30 1998-03-01 Tet Hin Yeap Method and apparatus for wavelet modulation of signals for transmission and/or storage
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US5875122A (en) 1996-12-17 1999-02-23 Intel Corporation Integrated systolic architecture for decomposition and reconstruction of signals using wavelet transforms
CN1187070A (zh) * 1996-12-31 1998-07-08 大宇电子株式会社 使用多个处理单元的中值滤波方法及装置
US5812927A (en) * 1997-02-10 1998-09-22 Lsi Logic Corporation System and method for correction of I/Q angular error in a satellite receiver
CN1190773A (zh) * 1997-02-13 1998-08-19 合泰半导体股份有限公司 语音编码的波形增益估测方法
JPH10276095A (ja) 1997-03-28 1998-10-13 Toshiba Corp 符号化器及び復号化器
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
GB9714001D0 (en) * 1997-07-02 1997-09-10 Simoco Europ Limited Method and apparatus for speech enhancement in a speech communication system
US6144937A (en) 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6104994A (en) * 1998-01-13 2000-08-15 Conexant Systems, Inc. Method for speech coding under background noise conditions
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
FI116642B (fi) * 1998-02-09 2006-01-13 Nokia Corp Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti
KR100474826B1 (ko) 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
US5990738A (en) * 1998-06-19 1999-11-23 Datum Telegraphic Inc. Compensation system and methods for a linear power amplifier
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
GB2344036B (en) 1998-11-23 2004-01-21 Mitel Corp Single-sided subband filters
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
KR100749291B1 (ko) 1999-07-27 2007-08-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 필터링 장치
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
EP1211636A1 (de) 2000-11-29 2002-06-05 STMicroelectronics S.r.l. Filtereinrichtung und Verfahren zur Reduzierung von Geräusch in elektrischen Signalen, insbesondere akustische Signale und Bilder
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition

Also Published As

Publication number Publication date
JP4852122B2 (ja) 2012-01-11
PT1157374E (pt) 2004-12-31
CN101625866B (zh) 2012-12-26
US8543385B2 (en) 2013-09-24
CN100587807C (zh) 2010-02-03
BR122015007141B1 (pt) 2016-03-01
US20150095039A1 (en) 2015-04-02
US8036880B2 (en) 2011-10-11
DE60038915D1 (de) 2008-06-26
RU2226032C2 (ru) 2004-03-20
EP1914729A1 (de) 2008-04-23
US20120213385A1 (en) 2012-08-23
JP2009211089A (ja) 2009-09-17
JP3603026B2 (ja) 2004-12-15
JP4511443B2 (ja) 2010-07-28
JP2006201801A (ja) 2006-08-03
EP1914729B1 (de) 2009-11-18
US20160099005A1 (en) 2016-04-07
AU2585700A (en) 2000-08-18
SE9903553D0 (sv) 1999-10-01
BR122015007146B1 (pt) 2016-03-01
HK1094077A1 (en) 2007-03-16
JP2009244886A (ja) 2009-10-22
US8036882B2 (en) 2011-10-11
US20130339023A1 (en) 2013-12-19
PT1617418E (pt) 2008-08-22
JP2002536679A (ja) 2002-10-29
DE60013785T2 (de) 2005-09-29
BR122015007138B1 (pt) 2016-03-01
JP2005010801A (ja) 2005-01-13
US20140229188A1 (en) 2014-08-14
DE60043363D1 (de) 2009-12-31
US20090319280A1 (en) 2009-12-24
EP1617418A3 (de) 2006-07-26
DK1914728T3 (da) 2010-01-25
EP1408484A3 (de) 2004-10-20
WO2000045379A3 (en) 2000-12-07
WO2000045379A2 (en) 2000-08-03
HK1082093A1 (en) 2006-05-26
HK1140572A1 (en) 2010-10-15
ATE276569T1 (de) 2004-10-15
PT1914728E (pt) 2010-02-24
ATE449407T1 (de) 2009-12-15
BR0009138A (pt) 2001-11-27
US20090319259A1 (en) 2009-12-24
US9245533B2 (en) 2016-01-26
ES2226779T3 (es) 2005-04-01
CN1181467C (zh) 2004-12-22
ATE449406T1 (de) 2009-12-15
CN1838238A (zh) 2006-09-27
EP1157374A2 (de) 2001-11-28
DE60024501D1 (de) 2006-01-05
HK1062349A1 (en) 2004-10-29
EP1408484B1 (de) 2005-11-30
USRE43189E1 (en) 2012-02-14
CN1838239A (zh) 2006-09-27
EP1617418A2 (de) 2006-01-18
DE60043364D1 (de) 2009-12-31
CN1408109A (zh) 2003-04-02
ES2334404T3 (es) 2010-03-09
EP1914728B1 (de) 2009-11-18
ES2254992T3 (es) 2006-06-16
EP1408484A2 (de) 2004-04-14
DK1157374T3 (da) 2004-12-20
ATE311651T1 (de) 2005-12-15
JP4519783B2 (ja) 2010-08-04
DK1408484T3 (da) 2006-01-30
DE60013785D1 (de) 2004-10-21
EP1617418B1 (de) 2008-05-14
HK1093812A1 (en) 2007-03-09
JP4519784B2 (ja) 2010-08-04
US8738369B2 (en) 2014-05-27
CN101625866A (zh) 2010-01-13
JP2006201802A (ja) 2006-08-03
DK1914729T3 (da) 2010-01-25
CN1258171C (zh) 2006-05-31
JP4852123B2 (ja) 2012-01-11
JP2006085187A (ja) 2006-03-30
US8036881B2 (en) 2011-10-11
JP4377302B2 (ja) 2009-12-02
ES2334403T3 (es) 2010-03-09
CN1838238B (zh) 2010-11-03
US20090315748A1 (en) 2009-12-24
CN1838239B (zh) 2014-05-07
PT1914729E (pt) 2010-02-15
US8935156B2 (en) 2015-01-13
BRPI0009138B1 (pt) 2016-03-29
DK1617418T3 (da) 2008-09-01
HK1053534A1 (en) 2003-10-24
US8255233B2 (en) 2012-08-28
CN1758334A (zh) 2006-04-12
EP1914728A1 (de) 2008-04-23
US20120029927A1 (en) 2012-02-02
ATE395688T1 (de) 2008-05-15
EP1157374B1 (de) 2004-09-15
ES2307100T3 (es) 2008-11-16
CN1555046A (zh) 2004-12-15
US6708145B1 (en) 2004-03-16

Similar Documents

Publication Publication Date Title
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE102005032724B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
DE102008015702B4 (de) Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE69821089T2 (de) Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
DE60012198T2 (de) Kodierung der hüllkurve des spektrums mittels variabler zeit/frequenz-auflösung
DE60019268T2 (de) Breitbandiges audio-übertragungssystem
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
EP2158588B1 (de) Spektralglättungsverfahren von verrauschten signalen
DE60100813T2 (de) Verbesserte spektrale übersetzung/faltung im subband-bereich
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE69832195T2 (de) Verfahren zur Grundfrequenzbestimmung unter Verwendung von Warnehmungsbasierter Analyse durch Synthese
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
DE60124079T2 (de) Sprachverarbeitung
EP1280138A1 (de) Verfahren zur Analyse von Audiosignalen
DE69828709T2 (de) Erhöhung der Dichte von kodierten Sprachsignalen
DE60311891T2 (de) Audiocodierung
DE60311619T2 (de) Datenreduktion in Audiokodierern unter Ausnutzung nichtharmonischer Effekte
DE602004004445T2 (de) Vorrichtungen zum Komprimieren und Dekomprimieren von Sprache und Verfahren zum Bereitstellen von skalierbaren Bandbreitestrukturen
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms

Legal Events

Date Code Title Description
8364 No opposition during term of opposition