DE60018246T2 - SYSTEM FOR TRANSMITTING AN AUDIO SIGNAL - Google Patents
SYSTEM FOR TRANSMITTING AN AUDIO SIGNAL Download PDFInfo
- Publication number
- DE60018246T2 DE60018246T2 DE60018246T DE60018246T DE60018246T2 DE 60018246 T2 DE60018246 T2 DE 60018246T2 DE 60018246 T DE60018246 T DE 60018246T DE 60018246 T DE60018246 T DE 60018246T DE 60018246 T2 DE60018246 T2 DE 60018246T2
- Authority
- DE
- Germany
- Prior art keywords
- time
- signal
- audio signal
- frequency
- transformed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
Description
Die vorliegende Erfindung bezieht sich auf ein Übertragungssystem mit einem Sender mit einem Codierer zum Codieren eines Audiosignals, wobei der Codierer Folgendes umfasst: Frequenzbestimmungsmittel zum Bestimmen einer Frequenz wenigstens einer periodischen Komponente des Audiosignals, wobei der Sender weiterhin Übertragungsmittel aufweist zum Übertragen eines Signals, das die genannte Frequenz wenigstens einer periodischen Komponente darstellt, zu einem Empfänger, wobei der genannte Empfänger Empfangsmittel aufweist zum Empfangen eines Signals, das die genannte Frequenz von dem Sender darstellt, und einen Decoder zum Herleiten eines rekonstruierten Audiosignals auf Basis der genannten Frequenz der wenigstens eine periodischen Komponente.The The present invention relates to a transmission system having a Transmitter having an encoder for encoding an audio signal, wherein the encoder comprises: frequency determining means for determining a frequency of at least one periodic component of the audio signal, wherein the transmitter further comprises transmission means has to transmit a signal that has said frequency of at least one periodic Component to a receiver, said receiver receiving means for receiving a signal having said frequency from the transmitter, and a decoder for deriving a reconstructed audio signal based on said frequency of at least one periodic component.
Die vorliegende Erfindung bezieht sich ebenfalls auf einem Sender, einen Empfänger, ein Codierungsverfahren und ein Decodierungsverfahren.The The present invention also relates to a transmitter, a Receiver, a coding method and a decoding method.
Huimin Yang u. a.: "Pitch Synchonous Modulated Lapped Transform of the Linear Predication Residual of Speech", "Proceedings of the International Conference on Signal Processing", 12. Oktober 1998, beschreibt ein verlustfreies Modell der Sprachcodierung. In dem beschriebenen Verfahren wird eine zeitunveränderliche Transformation an dem zeitverzerrten Sprachsignal durchgeführt.Huimin Yang u. a .: "Pitch Synchonous Modulated Lapped Transform of the Linear Predication Residual of Speech "," Proceedings of the International Conference on Signal Processing, October 12, 1998, describes a lossless one Model of speech coding. In the described method is a time-invariable transformation performed on the time-distorted speech signal.
Kleijn, W.B. u. a.: "Interpolation of Pitch-Predictor Parameters in Analysis-by-Synthesis Speech Coders", "IEEE Transaction on Speech and Audio Processing", US IEEE Inc. Heft 2, Nr. 1, Teil 1, Seiten 42–54 beschreibt einen Analyse-durch-Synthese Sprachcodierer. Die Effizienz des Codierers wird dadurch gesteigert, dass ein Pitch-Prädiktor vorgesehen wird, der das vergangene rekonstruierte Signal auf dem aktuellen Signal abbildet.Kleijn, W. B. u. a .: "Interpolation of Pitch Predictor Parameters in Analysis-by-Synthesis Speech Coders, IEEE Transaction on Speech and Audio Processing ", US IEEE Inc. Vol. 2, No. 1, Part 1, pages 42-54 describes an analysis-by-synthesis Speech. The efficiency of the coder is thereby increased, that provided a pitch predictor which is the past reconstructed signal on the current signal maps.
WO-A-95/10760 beschreibt einen 1200 Bit-per-Sekunde Vocoder, der Split-Vektorverarbeitung anwendet. US-A-5 884 253 beschreibt ein Sprachcodierungssystem, das eine rekonstruierte stimmhafte Sprache mit einer geschmeidig entfaltenden Pitchzykluswellenform schafft. EO-A-0 696 026 beschreibt eine weitere Sprachcodierungsanordnung und aus US-A-4 937 873 ist ein Übertragungssystem bekannt.WO 95/10760 describes a 1200 bit per second vocoder, the split vector processing applies. US-A-5 884 253 describes a speech coding system, that a reconstructed voiced language with a supple unfolding pitch cycle waveform creates. EO-A-0 696 026 another speech coding arrangement and from US-A-4,937,873 a transmission system known.
Derartige Übertragungssysteme und Audiocodierer werden in Applikationen verwendet, in denen Audiosignale über ein Übertragungsmedium mit einer begrenzten Übertragungskapazität übertragen werden sollen oder auf Speichermedien mit einer begrenz ten Speicherkapazität gespeichert werden sollen. Beispiele derartiger Applikationen sind die Übertragung von Audiosignalen übers Internet, die Übertragung von Audiosignalen von einem Mobiltelefon zu einer Basisstation und umgekehrt und die Speicherung von Audiosignalen auf einem CD-ROM, in einem Halbleiterspeicher oder auf einer Festplatte.Such transmission systems and audio encoders are used in applications in which audio signals are transmitted over a transmission medium transmitted with a limited transmission capacity or stored on storage media with a limited storage capacity should be. Examples of such applications are the transmission of audio signals over Internet, the transfer of audio signals from a mobile phone to a base station and vice versa and the storage of audio signals on a CD-ROM, in a semiconductor memory or on a hard disk.
Es wurden bereits verschiedene Operationsgrundlagen von Audiocodierern versucht um eine gute Audioqualität mit einer bescheidenen Bitrate zu erhalten. Bei einem dieser Operationsmethoden wird ein zu übertragenes Audiosignal in eine Anzahl Segmente mit einer Länge von 10–20 ms aufgeteilt. In jedem der genannten Segmente wird das Audiosignal durch eine Anzahl Sinuskurven dargestellt, die durch ihre Amplitude und ihre Frequenz definiert werden. In dem Codierer werden die Amplituden und Frequenzen der Sinuskurven bestimmt.It were already different bases of operation of audio encoders trying to get a good audio quality with a modest bitrate to obtain. In one of these surgical methods is a transmitted Audio signal divided into a number of segments with a length of 10-20 ms. In each of said segments, the audio signal is represented by a number of sinusoids represented by its amplitude and frequency become. In the encoder, the amplitudes and frequencies of the Sine curves determined.
Die Übertragungsmittel übertragen eine Darstellung der Amplituden und Frequenzen zu dem Empfänger. Die von dem Sender durchgeführten Vorgänge können Kanalcodierung, Verschachtelung und Modulation umfassen.Transfer the transfer agent a representation of the amplitudes and frequencies to the receiver. The performed by the transmitter operations can Channel coding, interleaving and modulation include.
Die Empfangsmittel empfangen ein Signal, welches das Audiosignal von einem Übertragungskanal darstellt und führt Vorgänge wie Demodulation, Entschachtelung und Kanaldecodierung durch. Der Decoder erhält die Darstellung des Audiosignals von dem Empfänger und leitet ein rekonstruiertes Audiosignal davon dadurch ab, dass eine Anzahl Sinuskurven erzeugt werden, wie durch das codierte Signal beschrieben, und dass diese zu einem rekonstruierten Audiosignal kombiniert werden.The Receiving means receive a signal which the audio signal from represents a transmission channel and leads operations such as demodulation, deinterleaving and channel decoding. Of the Decoder receives the representation of the audio signal from the receiver and derives a reconstructed Audio signal thereof by generating a number of sinusoids be as described by the coded signal, and that this be combined into a reconstructed audio signal.
Obschon das bekannte System eine gute Codierungsqualität schafft, gibt es dennoch einen hörbaren Unterschied zwischen dem rekonstruierten Audiosignal und dem ursprünglichen Audiosignal.Although the known system creates a good coding quality, there are still an audible difference between the reconstructed audio signal and the original one Audio signal.
Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, ein Übertragungssystem der eingangs beschriebene Art zu schaffen, wobei die Qualität des rekonstruierten Audiosignal weiter verbessert ist.It is now u. a. An object of the present invention is a transmission system to create the type described above, the quality of the reconstructed Audio signal is further improved.
Um diese Aufgabe zu erfüllen schafft die vorliegende Erfindung in einem ersten Aspekt einen Sender mit einem Codierer zum Codieren eines Audiosignals, wobei der Codierer einen Codierer zum Codieren eines Audiosignals aufweist, wobei der Codierer Folgendes umfasst: Frequenzbestimmungsmittel zum Bestimmen einer Frequenz wenigstens einer periodischen Komponente des Audiosignals; Frequenzänderungsbestimmungsmittel zum Bestimmen einer Frequenzänderung der genannten wenigstens einen periodi schen Komponente des Audiosignals über einen vorbestimmten Zeitbetrag, Zeittransformationsmittel zum Erhalten eines in der Zeit transformierten Eingangssignals; Übertragungsmittel zum Übertragen eines Signals, das die genannte Frequenz darstellt, zu einem Empfänger, wobei die Übertragungsmittel vorgesehen sind zum Übertragen eines weiteren Signals, das die genannte Frequenzänderung darstellt, zu dem Empfänger; dadurch gekennzeichnet, dass die Beziehung zwischen der Echtzeit t und der transformierten Zeit τ durch einen Parameter definiert wird, wobei dieser Parameter von den Übertragungsmitteln zu einem Empfangsmittel übertragen wird, wobei der Parameter durch ein Empfangsmittel interpretiert werden kann zum Effektuieren der umgekehrten Zeittransformation des Signals.Around to fulfill this task In a first aspect, the present invention provides a transmitter an encoder for encoding an audio signal, wherein the encoder an encoder for encoding an audio signal, wherein the An encoder comprising: frequency determining means for determining a Frequency of at least one periodic component of the audio signal; Frequency change determining means for determining a frequency change said at least one periodic component of the audio signal via a predetermined amount of time, time transforming means for obtaining a time-transformed input signal; transmission means to transfer a signal representing said frequency to a receiver, wherein the transmission means are provided for transmission another signal, the said frequency change represents to the recipient; characterized in that the relationship between the real time t and the transformed time τ a parameter is defined, this parameter being from the transmission means transmitted to a receiving means where the parameter is interpreted by a receiving means can be used to effect the inverse time transformation the signal.
Ein anderer Aspekt der vorliegenden Erfindung schafft einen Empfänger mit Empfangsmitteln zum Empfangen eines codierten Audiosignals, das ein Audiosignal darstellt durch wenigstens eine Frequenz wenigstens einer periodischen Komponente des Audiosignals, und mit einem Decoder zum Herleiten eines rekonstruierten Audiosignals auf Basis der genannten Frequenz, wobei der Empfänger vorgesehen ist zum Empfangen eines weiteren Signals, das eine Frequenzänderung der genannten wenigstens einen periodischen Komponente des genannten Audiosignals über einen vorbestimmten Zeitbetrag darstellt, wobei der Decoder vorgesehen ist zum Herleiten des genannten rekonstruierten Audiosignals auch auf Basis der genannten Frequenzänderung, wobei der Decoder Zeittransformationsmittel aufweist zum Erhalten des rekonstruierten Audiosignals durch Zeittransformation eines decodierten Signals, wobei die Zeittransformationsmittel dadurch gekennzeichnet sind, dass die Beziehung zwischen der Echtzeit t und der transformierten Zeit τ des empfangenen Signals durch einen Parameter definiert wird, wobei dieser Parameter von den Empfangsmitteln empfangen wird, wobei der Parameter durch die Empfangsmittel interpretiert wird zum Effektuieren der umgekehrten Zeittransformation des Signals.One Another aspect of the present invention provides a receiver Receiving means for receiving an encoded audio signal, the an audio signal represents at least one frequency at least a periodic component of the audio signal, and a decoder for deriving a reconstructed audio signal based on said Frequency, the receiver being is provided for receiving a further signal, which is a frequency change said at least one periodic component of said Audio signal over represents a predetermined amount of time, the decoder provided is also for deriving said reconstructed audio signal based on the mentioned frequency change, wherein the decoder comprises time-transform means for obtaining the reconstructed audio signal by time transformation of a decoded signal, the time-transforming means thereby are characterized that the relationship between the real time t and the transformed time τ of the received signal is defined by a parameter, where this parameter is received by the receiving means, the Parameter interpreted by the receiving means is for effecting the inverse time transformation of the signal.
Ein weiterer Aspekt der vorliegenden Erfindung schafft ein Übertragungssystem mit einem Empfänger, wie oben beschrieben.One Another aspect of the present invention provides a transmission system with a receiver, like described above.
Ein Verfahrensaspekt der vorliegenden Erfindung schafft ein Verfahren zum Codieren eines Audiosignals, wobei dieses Verfahren die nachfolgenden Verfahrensschritte umfasst: das Bestimmen einer Frequenz von wenigstens einer periodischen Komponente, und das Herleiten eines Signals, das die genannte Frequenz wenigstens einer periodischen Komponente des Audiosignals darstellt, wobei das Verfahren weiterhin die nachfolgenden Verfahrensschritte umfasst: das Bestimmen eines Signals, das eine Frequenzänderung der wenigstens einen periodischen Komponente des Audiosignals über einen vorbestimmten Zeitbetrag darstellt, das Herleiten eines zeittransformierten Audiosignals, dadurch gekennzeichnet, dass die Beziehung zwischen der Echtzeit t und der transformierten Zeit τ durch einen Parameter bestimmt wird, wobei dieser Parameter durch die Übertragungsmittel zu den Empfangsmitteln übertragen wird, wobei der Parameter durch die Empfangsmittel interpretiert wird zum Effektuieren einer umgekehrten Zeittransformation des Signals.One Method aspect of the present invention provides a method for coding an audio signal, this method being the following ones Method steps include: determining a frequency of at least a periodic component, and deriving a signal, that is the said frequency of at least one periodic component of the audio signal, the method further comprising the following method steps comprising: determining a signal that is a frequency change the at least one periodic component of the audio signal over one represents predetermined amount of time, deriving a time-transformed Audio signal, characterized in that the relationship between the Real time t and the transformed time τ determined by a parameter , this parameter being transmitted by the transmission means to the receiving means where the parameter is interpreted by the receiving means is used to effect a reverse time transformation of the signal.
Nach noch einem anderen Aspekt schafft die vorliegende Erfindung ein verfahren zum Herleiten eines rekonstruierten Audiosignals von einem codierten Audiosignal, das das genannte Audiosignal darstellt, durch wenigstens eine Frequenz wenigstens einer periodischen Komponente des Audiosignals, und einen Decoder zum Herleiten eines rekonstruierten Audiosignals auf Basis der genannten Frequenz, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: das Herleiten des genannten rekonstruierten Audiosignals, ebenfalls auf Basis eines weiteren Signals, das eine Frequenzänderung der genannten wenigstens einen periodischen Komponente des Audiosignals über einen vorbestimmten Zeitbetrag darstellt; das Herleiten des rekonstruierten Audiosignals durch eine Zeittransformation eines decodierten Signals, dadurch gekennzeichnet, dass die Beziehung zwischen der transformierten Zeit τ und der Echtzeit t durch einen Parameter bestimmt wird, wobei der Parameter von einem Übertragungsmittel her empfangen und interpretiert wird zum Effektuieren einer umgekehrten Zeittransformation des Signals.To In yet another aspect, the present invention provides method for deriving a reconstructed audio signal from a encoded audio signal representing said audio signal by at least a frequency of at least one periodic component of the audio signal, and a decoder for deriving a reconstructed audio signal based on said frequency, said method being the following Method steps include: deriving said reconstructed Audio signal, also based on another signal, the one frequency change said at least one periodic component of the audio signal via a represents predetermined amount of time; the derivation of the reconstructed Audio signal by a time transformation of a decoded signal, characterized in that the relationship between the transformed Time τ and the real time t is determined by a parameter, where the parameter from a transmission medium is received and interpreted to effect an inverted Time transformation of the signal.
Dadurch, dass auch eine Frequenzänderung der genannten wenigstens einen periodischen Komponente bestimmt wird, kann die Qualität des rekonstruierten Audiosignal auf zweierlei Weisen verbessert werden. Die erste Art und Weise ist, dass die Frequenzänderung dem Empfänger zugeführt wird, der die genannte Frequenzänderung zum Herleiten eines rekonstruierten Audiosignals benutzen kann. Die zweite Art und Weise ist, dass die Frequenzänderung benutzt wird zum Erhalten eines genaueren Wertes einer Frequenz des Audiosignals. Dies kann beispielsweise die Tonhöhe in einem Sprachsignal sein, oder eine beliebige periodische Komponente in einem Audiosignal. Dadurch, dass die Frequenzänderung über einen vorbestimmten Zeitbetrag verwendet wird, kann ein mittlerer Frequenzwert, welcher der genannten Grundfrequenz entspricht, genauer bestimmt werden.By also determining a frequency change of said at least one periodic component, the quality of the reconstructed audio signal can be improved in two ways. The first way is that the frequency change is applied to the receiver which can use said frequency change to derive a reconstructed audio signal. The second way is that the frequency change is used to obtain a more accurate value of a frequency of the audio signal. This can be, for example, the pitch in a speech signal, or any periodic one Component in an audio signal. By using the frequency change over a predetermined amount of time, a mean frequency value corresponding to said fundamental frequency can be more accurately determined.
Eine Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Übertragungsmittel vorgesehen sind zum Übertragen eines weiteren Signals, das die genannte Frequenzänderung darstellt, zu dem Empfänger und dass der Decoder vorgesehen ist zum Herleiten des genannten rekonstruierten Audiosignals ebenfalls auf Basis der genannten Änderung der genannten Frequenz.A embodiment The present invention is characterized in that the transmission means are provided for transmission another signal, the said frequency change represents to the recipient and that the decoder is provided for deriving said reconstructed audio signal also based on the aforementioned change the said frequency.
Dadurch, dass die Frequenzänderung durch ein zusätzliches Signal dargestellt wird, das dem Empfänger zugeführt wird, wird es möglich, dass Sinuskurven, die sich in einem einzigen Syntheseintervall (einigermaßen) in der Frequenz ändern, zur Erzeugung des rekonstruierten Audiosignals benutzt werden. Dies entspricht mehr den Eigenschaften des wirklichen Audiosignals, was zu einer besseren Qualität des rekonstruierten Audiosignals führt.Thereby, that the frequency change by an additional Signal is presented to the receiver, it becomes possible that Sinusoids that occur in a single synthesis interval (reasonably) in change the frequency, be used to generate the reconstructed audio signal. This corresponds more to the characteristics of the real audio signal, what to a better quality the reconstructed audio signal leads.
Eine weitere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Zeittransformationsmittel vorgesehen sind zur Zeitkompression des Eingangssignals während eines ersten Teils des vorbestimmten Zeitbetrags und zur Zeitexpansion des Eingangssignals während eines zweiten Teils des vorbestimmten Zeitbetrags, derart, dass das in der Zeit transformierte Eingangssignal eine geringere Frequenzänderung hat als das Eingangssignal.A another embodiment The present invention is characterized in that the time-transforming means are provided for time compression of the input signal during a first part of the predetermined time amount and time expansion of the input signal during a second part of the predetermined amount of time such that the time-transformed input signal has a lower frequency change has as the input signal.
Es hat sich herausgestellt, dass die Anwendung der Zeittransformation, auch als Zeitverzerrung bezeichnet, zum Erhalten eines in der Zeit transformierten Audiosignals, eine effektive Art und Weise ist für den Umgang mit Frequenzänderungen des zu codierenden Signals. Durch Anwendung einer geeigneten Zeittransformation wird es möglich, Ein Signal zu transformieren, das sich in der Frequenz zu einem zeittransformierten Signal ändert, das eine im Wesentlichen konstante Frequenz hat.It it has been found that the application of the time transformation, also referred to as time warping, for getting one in time Transformed audio signal, an effective way is for dealing with frequency changes of the signal to be coded. By applying a suitable time transformation will it be possible To transform a signal that is in frequency to one time-transformed signal changes, which has a substantially constant frequency.
Ein Beispiel davon ist ein Audiosignal mit einem linearen Frequenzhub, startend bei einer niedrigen Frequenz am Anfang eines Segmentes und endend bei einer höheren Frequenz am Ende des Segmentes. Durch Zeitkompression des Eingangssignals in dem ersten Teil des Segmentes wird die Frequenz des zeittransformierten Signals höher als die Frequenz des ursprünglichen Eingangssignals.One Example of this is an audio signal with a linear frequency sweep, starting at a low frequency at the beginning of a segment and ending at a higher one Frequency at the end of the segment. By time compression of the input signal in the first part of the segment is the frequency of the time-transformed Signal higher as the frequency of the original Input signal.
Durch Zeitexpansion des Eingangssignals in dem zweiten Teil des Segmentes wird die Frequenz des zeittransformierten Eingangssignals niedriger sein als die Frequenz des ursprünglichen Eingangssignals.By Time expansion of the input signal in the second part of the segment the frequency of the time-transformed input signal becomes lower be as the frequency of the original one Input signal.
Folglich wird ein zeittransformiertes Eingangssignal erhalten, dessen Frequenz am Anfang des Segmentes zugenommen hat und dessen Frequenz am Ende des Segmentes abgenommen hat. Wenn eine geeignete Wahl der Zeittransformation getroffen worden ist, wird es möglich, ein transformiertes Eingangssignal mit einer abgenommenen Frequenzänderung zu erhalten.consequently a time-transformed input signal is obtained whose frequency at the beginning of the segment has increased and its frequency at the end of the segment has decreased. If a suitable choice of time transformation has been taken, it becomes possible a transformed input signal with a frequency change removed to obtain.
Noch eine andere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die die Zeittransformation bestimmenden Mittel vorgesehen sind zum Herleiten einer Anzahl zeittransformierten Eingangssignale, die je einer anderen Zeittransformation entsprechen, und dass der Codierer Bestimmungsmittel aufweist zum Selektieren der Zeittransformation entsprechend dem zeittransformierten Eingangssignal mit der kleinsten Frequenzänderung über den genannten vorbestimmten Zeitbetrag.Yet another embodiment The present invention is characterized in that the Time-transformation determining means are provided for deriving a number of time-transformed input signals, each one different Time transformation correspond, and that the encoder determining means has for selecting the time transformation according to time-transformed input signal with the smallest frequency change over the said predetermined amount of time.
Eine Art und Weise zur Bestimmung der geeignetesten Zeittransformation ist, eine Anzahl verschiedener Zeittransformationen zu versuchen und diejenige zu selektieren, die zu einem transformierten Audiosignal mit der kleinsten Frequenzänderung führt.A Way of determining the most suitable time transformation is to try a number of different time transformations and to select the one associated with a transformed audio signal the smallest frequency change leads.
Noch eine andere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die die Zeittransformation bestimmenden Mittel vorgesehen sind zum Selektieren des zeittransformierten Eingangssignals mit der kleinsten Frequenzänderung über den genannten vorbestimmten Zeitbetrag durch Selektion des zeittransformierten Eingangssignals mit der höchsten Spitze in der Autokorrelationsfunktion.Yet another embodiment The present invention is characterized in that the Time-transformation determining means are provided for selecting the time-transformed input signal having the smallest frequency change over the said predetermined amount of time by selecting the time-transformed Input signal with the highest Tip in autocorrelation function.
Eine nützliche Art und Weise der Bestimmung des transformierten Zeitsignals mit der kleinsten Frequenzänderung ist die Autokorrelationsfunktion der verschiedenen zeittransformierten Eingangssignale zu berechnen. Das zeittransformierte Audiosignal mit der höchsten Spitze in der Autokorrelationsfunktion hat die kleinste Frequenzänderung. Auf alternative Weise ist es möglich, die FFT des zeittransformierten Eingangssignals zu berechnen. Denn das zeittransformierte Audiosignal, das zu der höchsten Spitze in der FFT-Domäne führt, hat die meist konstante Frequenz.A useful way of determining the transformed time signal with the smallest frequency change is to compute the autocorrelation function of the various time-transformed input signals. The time-transformed audio signal with the highest peak in the autocorrelation function has the smallest frequency change. Alternatively, it is possible to calculate the FFT of the time-transformed input signal. Because the time-transformed audio signal to the highest peak in the FFT domain leads, has the most constant frequency.
Wieder eine andere Ausführungsform des Übertragungssystems nach der vorliegenden Erfindung weist das Kennzeichen auf, dass die Zeittransformation durch eine quadratische Beziehung zwischen der wirklichen Zeit und der transformierten Zeit definiert wird.Again another embodiment of the transmission system according to the present invention, the feature that the time transformation through a quadratic relationship between the real time and the transformed time is defined.
Eine quadratische Funktion zwischen der wirklichen Zeit und der transformierten Zeit kann auf einfache Art und Weise berechnet werden, und ist imstande, Zeitkompression in einem ersten Teil des Zeitsegmentes und Zeitexpansion in einem zweiten Teil des Zeitsegmentes zu erreichen.A quadratic function between the real time and the transformed Time can be easily calculated and is able to Time compression in a first part of the time segment and time expansion to reach in a second part of the time segment.
Wieder eine andere Ausführungsform des Übertragungssystems nach der vorliegenden Erfindung weist das Kennzeichen auf, dass die Beziehung zwischen der wirklichen Zeit t und der transformierten Zeit T durch die nachfolgende Gleichung definiert wird: wobei a der Parameter ist, der die Zeittransformation definiert, und wobei T die Dauer eines Signalsegmentes ist.Yet another embodiment of the transmission system according to the present invention is characterized in that the relationship between the actual time t and the transformed time T is defined by the following equation: where a is the parameter that defines the time transformation, and T is the duration of a signal segment.
Die oben stehende quadratische Zeittransformation hat nur einen Parameter und ist dennoch imstande, Zeitkompression und Zeitexpansion während eines einzigen Signalsegmentes zu erhalten. Der Vorteil, dass es nur einen einzigen Parameter gibt, ist die reduzierte Anzahl Bits, die erforderlich sind zum Übertragen der optimalen Zeittransformation zu dem Sender. Weiterhin kann dargelegt werden, dass diese Zeittransformationsfunktion imstande ist, eine lineare Frequenzänderung des Eingangssignals völlig zu eliminieren.The The above quadratic time transformation has only one parameter and yet is capable of time compression and time expansion during one to receive single signal segment. The advantage that there is only one single parameter is the reduced number of bits required are to transfer the optimal time transformation to the transmitter. Furthermore, it can be stated be that this time transformation function is capable of one linear frequency change the input signal completely to eliminate.
Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im vorliegenden Fall näher beschrieben. Es zeigen:embodiments The invention are illustrated in the drawings and are in the present Case closer described. Show it:
In
dem Übertragungssystem
nach
Ein
erster Ausgang der Frequenzänderungsbestimmungsmittel
An
dem zweiten Ausgang der Frequenzänderungsbestimmungsmittel
Der
Ausgang des Zeitverzerrers
Das
Signal a, das Signal PITCH und das Ausgangssignal des Analysators
Die Übertragungsmittel
In
dem Empfänger
In
dem Decoder
Der
Demultiplexer liefert Ausgangssignale q, PITCH und LPC an den Ausgängen. Die
Signale PITCH und LPC werden in dem Synthesizer
Der
Ausgang des Synthesizers
Eine
in dem Zeitverzerrer
In
(1) ist a ein Verzerrungsparameter, T ist die Dauer des Sprachsegmentes,
t stellt die Echtzeit dar und τ ist
die transformierte Zeit. Der Wert des Verzerrungsparameters a hat
einen Bereich, der gewährleistet, dass
die Verzerrungsfunktion immer mit der Zeit t zunimmt. Dies führt zu:
Die Verzerrungsfunktion wird derart gewählt, dass die Gesamtdauer des verzerrten Audiosegmentes der Dauer des ursprünglichen Audiosegmentes entspricht. Der Start- und der Endwert des verzerrten Segmentes sind dem Start- und dem Endwert des ursprünglichen Audiosegmentes gleich.The Distortion function is chosen such that the total duration of the distorted audio segment corresponds to the duration of the original audio segment. The start and end values of the distorted segment are the starting point and the final value of the original one Same audio segment.
Ob Zeitkompression oder Zeitexpansion stattfindet, kann durch Differenzierung (1) gegenüber t ermittelt werden. Dies führt zu: If Time compression or time expansion can take place through differentiation (1) opposite t be determined. this leads to to:
Zeitkompression erfolgt, wenn dτ/dt kleiner ist als 1 und Zeitexpansion erfolgt, wenn dτ/dt größer ist als 1. Aus (3) folgt, dass Zeitkompression für t < T/2 auftritt und dass Zeitexpansion für t > T/2 auftritt, wenn a > 0 ist. Zeitkompression erfolgt für t > T/2 und Zeitexpansion erfolgt für t < T/2, wenn a < 0 ist.time compression occurs when dτ / dt is less than 1 and time expansion occurs when dτ / dt is greater than 1. From (3) it follows that time compression occurs for t <T / 2 and that time expansion for t> T / 2 occurs when a> 0. time compression done for t> T / 2 and time expansion done for t <T / 2, if a <0.
Das Umgekehrte der Zeitverzerrungsfunktion nach (1) wird definiert entsprechend: The Reverse of the time-distortion function according to (1) is defined according to:
Nachstehend wird die Wirkungsweise des durch (1) definierten Zeitverzerrers analysiert. Wenn das Signal s(t) ein Signal mit einer zeitveränderlichen Periodizität ist, wie stimmhafte Sprache, kann dies wie folgt geschrieben werden: below becomes the operation of the time equalizer defined by (1) analyzed. If the signal s (t) is a signal with a time-variant periodicity is, like voiced speech, this can be written as follows:
In (5) ist k die harmonische Zahl, xk und yk sind Amplitudenfaktoren, und ϕ(t) ist ein Phasenwinkel. Für das zeittransformierte Signal s'(τ) kann Folgendes geschrieben werden: In (5), k is the harmonic number, x k and y k are amplitude factors, and φ (t) is a phase angle. The following can be written for the time-transformed signal s' (τ):
Da (5) und (6) dieselben physikalischen Signale darstellen, ist ϕ(t) gleich ψ(τ). Die momentane Winkelfrequenz ωκ(τ) der k. Harmonischen von s(t) wird gegeben durch: Since (5) and (6) represent the same physical signals, φ (t) is equal to ψ (τ). The instantaneous angular frequency ω κ (τ) of k. Harmonic of s (t) is given by:
Für die augenblickliche Winkelfrequenz Ωκ(τ) der k. Harmonischen von s'(τ) kann Folgendes gefunden werden: For the instantaneous angular frequency Ω κ (τ) of k. Harmonics of s' (τ) can be found:
Weil ϕ(t) = ψ(τ) ist, sind ihre Zeitableitungen t auch gleich. Unter Verwendung der Kettenregel, lässt sich dies wie folgt schreiben: Because φ (t) = ψ (τ) is their time derivatives are also the same. Using the chain rule, let yourself write this as follows:
Für die Beziehung zwischen Ωκ(τ) und ωκ(τ) kann unter Verwendung von (9) Folgendes gefunden werden: For the relationship between Ω κ (τ) and ω κ (τ), using (9), the following can be found:
Eine andere wichtige Eigenschaft des Zeitverzerrers ist, dass die mittlere Frequenz der k. Harmonischen der verzerrten Signale der mittleren Frequenz der k. Harmonischen des ursprünglichen Signals entspricht. Dies geht auf einfache Art und Weise aus dem Folgenden hervor: A Another important feature of the time equalizer is that the middle one Frequency of k. Harmonics of the distorted signals of the middle Frequency of k. Harmonics of the original signal corresponds. This is easily apparent from the following:
Nachstehend wird dargelegt, dass die oben stehende Zeitverzerrungsfunktion imstande ist, linear Frequenzschwankungen aus dem Eingangssignal zu entfernen.below It is stated that the above time-skewing function is capable is to remove linear frequency fluctuations from the input signal.
Substitution von (3) in (10) führt zu dem Folgenden: substitution from (3) to (10) to the following:
Es wird nun ein Eingangssignal mit einem sinusförmigen Eingangssignal mit einer Winkelfrequenz ω(t), die sich in der Zeit linear ändert. Für die Winkelfrequenz dieses Signals kann Folgendes geschrieben werden: It Now an input signal with a sinusoidal input signal with a Angular frequency ω (t), which changes linearly in time. For the Angular frequency of this signal can be written as:
Substitution von (13) in (12) ergibt: substitution from (13) in (12) gives:
Falls Ω(τ) konstant sein soll, soll Folgendes gelten: If Ω (τ) is constant should be, the following should apply:
Substitution von (15) in (14) führt zu: substitution from (15) to (14) to:
Dies entspricht einem konstanten Wert, der dem Mittelwert der Winkelfrequenz ω(t) über das Segment mit einer Dauer T entspricht.This corresponds to a constant value which is the mean of the angular frequency ω (t) over the Segment with a duration T corresponds.
In
den Frequenzänderungsbestimmungsmitteln
Der
Ausgang des Gewichtungsfilters
Der
Ausgang der Zeitverzerrer
Die
Korrelatoren
Das
Eingangssignal der Korrelatoren
Die
Nullphasenfunktionen zi(n) werden gegenüber deren
Wert zi(0) in den Normalisierern
Die
Zeitverzerrer und -entzerrer sind bisher als kontinuierliche Zeitvorgänge beschrieben
worden. In einer echten Implementierung sollen diese Vorgänge in einem
diskreten Zeitsystem implementiert werden. Wenn ein Segment des
Eingangssignals mit einer Dauer T durch N Abtastwerte dargestellt
wird, hat das verzerrte Segment ebenfalls eine Dauer T und sollte
auch durch N Abtastwerte dargestellt werden. Die Abtastzeitpunkte
des zeitverzerrten Signals entsprechen aber nicht den Abtastzeitpunkten
des ursprünglichen
Eingangssignals. Dies ist für
einen Zeitverzerrer in
In
Um dieses Problem zu lösen sollen Abtastwerte für jeden der auftretenden Werte von τj berechnet werden, die gegeben werden durch: To solve this problem, samples should be calculated for each of the occurring values of τ j given by:
Dies geschieht durch Berechnung eines entsprechenden Wertes von t aus τj unter Verwendung von (4). Aus diesem Wert von t werden die nächsten Werte in dem Abtastgitter ermittelt. Dies führt zu zwei Werten von i, entsprechend: This is done by calculating a corresponding value of t from τ j using (4). From this value of t, the next values in the sampling grid are determined. This leads to two values of i, corresponding to:
In (18) stellt ⌈ ⌉ die nächste ganze Zahl kleiner als das Argument dar und stellt die nächste ganze Zahl größer als das Argument dar. Zum Schluss wird ein linear interpolierter Abtastwert τj berechnet, und zwar entsprechend: In (18) ⌈ ⌉ represents the next integer less than the argument and represents the next integer greater than the argument. Finally, a linearly interpolated sample τ j is calculated, corresponding to:
Es zeigt sich, dass neben der linearen Interpolation auch andere Interpolationstypen wie quadratische und kubische Interpolation angewandt werden können.It shows that in addition to the linear interpolation, other types of interpolation how quadratic and cubic interpolation can be applied.
Die
Graphik
Die
inverse Verzerrung kann auf dieselbe Art und Weise erfolgen wie
in
Dann setzt sich die Berechnung dadurch fort, dass der Wert von τ entsprechend einem gegebenen ti ermittelt wird, und zwar durch Verwendung des Ausdrucks (1). Aus diesem Wert von t werden die nächsten Werte auf dem Abtastgitter ermittelt. Dies führt zu zwei Werten von j, entsprechend: Then, the calculation continues by determining the value of τ corresponding to a given t i by using the expression (1). From this value of t, the next values on the sampling grid are determined. This leads to two values of j, corresponding to:
Zum Schluss wird ein linear interpolierter Abtastwert für ti berechnet, und zwar entsprechend: Finally, a linear interpolated sample for t i is calculated, corresponding to:
Es dürfte einleuchten, dass die vorliegende Erfindung durch Verwendung spezieller Hardware oder durch Anwendung eines Programms implementiert werden kann, das in einem programmierbaren Prozessor läuft. Es ist ebenfalls vorstellbar, dass eine Kombination dieser Implementierungen angewandt wird.It might It will be appreciated that the present invention can be accomplished by using specific ones Hardware or by implementing a program which runs in a programmable processor. It is also conceivable that a combination of these implementations is used.
Text in der ZeichnungText in the drawing
- Zeitverzerrerwarper
- FrequenzänderungsbestimmungsmittelFrequency change determining means
- Tonhöhepitch
- Analysatoranalyzer
- Multiplexermultiplexer
- Demultiplexerdemultiplexer
- Synthesizersynthesizer
- Entzerrerequalizer
- Selektionsmittelselection means
Claims (19)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99201656 | 1999-05-26 | ||
EP99201656 | 1999-05-26 | ||
PCT/EP2000/004219 WO2000074039A1 (en) | 1999-05-26 | 2000-05-08 | Audio signal transmission system |
Publications (2)
Publication Number | Publication Date |
---|---|
DE60018246D1 DE60018246D1 (en) | 2005-03-31 |
DE60018246T2 true DE60018246T2 (en) | 2006-05-04 |
Family
ID=8240236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60018246T Expired - Fee Related DE60018246T2 (en) | 1999-05-26 | 2000-05-08 | SYSTEM FOR TRANSMITTING AN AUDIO SIGNAL |
Country Status (7)
Country | Link |
---|---|
US (1) | US6978241B1 (en) |
EP (1) | EP1099215B1 (en) |
JP (1) | JP2003500708A (en) |
KR (1) | KR20010072035A (en) |
CN (1) | CN1227646C (en) |
DE (1) | DE60018246T2 (en) |
WO (1) | WO2000074039A1 (en) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1446796A1 (en) * | 2001-10-26 | 2004-08-18 | Koninklijke Philips Electronics N.V. | Tracking of sinusoidal parameters in an audio coder |
KR101105129B1 (en) * | 2003-01-17 | 2012-01-16 | 톰슨 라이센싱 | A method for using a synchronous sampling design in a fixed-rate sampling mode |
US7567903B1 (en) * | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CN102884572B (en) * | 2010-03-10 | 2015-06-17 | 弗兰霍菲尔运输应用研究公司 | Audio signal decoder, audio signal encoder, method for decoding an audio signal, method for encoding an audio signal |
JP6303340B2 (en) * | 2013-08-30 | 2018-04-04 | 富士通株式会社 | Audio processing apparatus, audio processing method, and computer program for audio processing |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4937873A (en) | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
JPH0546199A (en) * | 1991-08-21 | 1993-02-26 | Matsushita Electric Ind Co Ltd | Speech encoding device |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
WO1995010760A2 (en) * | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
JPH07219597A (en) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | Pitch converting device |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
US5794185A (en) * | 1996-06-14 | 1998-08-11 | Motorola, Inc. | Method and apparatus for speech coding using ensemble statistics |
JPH10149199A (en) * | 1996-11-19 | 1998-06-02 | Sony Corp | Voice encoding method, voice decoding method, voice encoder, voice decoder, telephon system, pitch converting method and medium |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
-
2000
- 2000-05-08 JP JP2001500258A patent/JP2003500708A/en active Pending
- 2000-05-08 EP EP00931174A patent/EP1099215B1/en not_active Expired - Lifetime
- 2000-05-08 KR KR1020017000967A patent/KR20010072035A/en not_active Application Discontinuation
- 2000-05-08 CN CNB008014647A patent/CN1227646C/en not_active Expired - Fee Related
- 2000-05-08 WO PCT/EP2000/004219 patent/WO2000074039A1/en active IP Right Grant
- 2000-05-08 DE DE60018246T patent/DE60018246T2/en not_active Expired - Fee Related
- 2000-05-22 US US09/575,609 patent/US6978241B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6978241B1 (en) | 2005-12-20 |
CN1318188A (en) | 2001-10-17 |
WO2000074039A1 (en) | 2000-12-07 |
CN1227646C (en) | 2005-11-16 |
EP1099215A1 (en) | 2001-05-16 |
DE60018246D1 (en) | 2005-03-31 |
KR20010072035A (en) | 2001-07-31 |
JP2003500708A (en) | 2003-01-07 |
EP1099215B1 (en) | 2005-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60202881T2 (en) | RECONSTRUCTION OF HIGH-FREQUENCY COMPONENTS | |
DE60024501T2 (en) | Improvement of Perceptual Quality of SBR (Spectral Band Replication) AND HFR (Radio Frequency Reconstruction) Coding method by adaptively adding noise floor and limiting the noise substitution | |
DE60303214T2 (en) | PROCEDURE FOR REDUCING ALIASING FAILURES CAUSED BY THE ADAPTATION OF THE SPECTRAL CURVE IN REAL-VALUE FILTER BANKS | |
DE69731588T2 (en) | CODING DEVICE WITH REDUCED COMPLEXITY FOR A SIGNAL TRANSMISSION SYSTEM | |
EP1979901B1 (en) | Method and arrangements for audio signal encoding | |
DE69531642T2 (en) | Synthesis of an excitation signal in the event of data frame failure or loss of data packets | |
DE602004002390T2 (en) | AUDIO CODING | |
DE69634645T2 (en) | Method and apparatus for speech coding | |
DE102008042579B4 (en) | Procedure for masking errors in the event of incorrect transmission of voice data | |
DE69910240T2 (en) | DEVICE AND METHOD FOR RESTORING THE HIGH FREQUENCY PART OF AN OVER-SAMPLE SYNTHETIZED BROADBAND SIGNAL | |
DE60219351T2 (en) | SIGNAL MODIFICATION METHOD FOR EFFICIENT CODING OF LANGUAGE SIGNALS | |
DE3710664C2 (en) | ||
DE60031002T2 (en) | MULTIMODAL MIX AREA LANGUAGE CODIER WITH CLOSED CONTROL LOOP | |
DE60308567T2 (en) | Decoding device, coding device, decoding method and coding method | |
DE60133757T2 (en) | METHOD AND DEVICE FOR CODING VOTING LANGUAGE | |
EP1386307B2 (en) | Method and device for determining a quality measure for an audio signal | |
DE60118631T2 (en) | METHOD FOR REPLACING TRACKED AUDIO DATA | |
DE60128479T2 (en) | METHOD AND DEVICE FOR DETERMINING A SYNTHETIC HIGHER BAND SIGNAL IN A LANGUAGE CODIER | |
DE60018246T2 (en) | SYSTEM FOR TRANSMITTING AN AUDIO SIGNAL | |
DE60221927T2 (en) | Device and program for sound coding | |
DE69924280T2 (en) | LANGUAGE SYNTHESIS FROM BASIC FREQUENCY PROTOTYP WAVE FORMS THROUGH TIME-SYNCHRONOUS WAVEFORM INTERPOLATION | |
EP1023777B1 (en) | Method and device for limiting a stream of audio data with a scaleable bit rate | |
DE2622423A1 (en) | VOCODER SYSTEM | |
DE60124079T2 (en) | language processing | |
DE60024080T2 (en) | CODING OF LANGUAGE SEGMENTS WITH SIGNAL TRANSITIONS THROUGH INTERPOLATION OF MULTI PULSE EXTRACTION SIGNALS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |