EP0075311A2 - Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip - Google Patents

Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip Download PDF

Info

Publication number
EP0075311A2
EP0075311A2 EP82108691A EP82108691A EP0075311A2 EP 0075311 A2 EP0075311 A2 EP 0075311A2 EP 82108691 A EP82108691 A EP 82108691A EP 82108691 A EP82108691 A EP 82108691A EP 0075311 A2 EP0075311 A2 EP 0075311A2
Authority
EP
European Patent Office
Prior art keywords
filter
fir
sum
speech
taps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP82108691A
Other languages
English (en)
French (fr)
Other versions
EP0075311B1 (de
EP0075311A3 (en
Inventor
Rüdiger Dr.-Ing. Reiss
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP0075311A2 publication Critical patent/EP0075311A2/de
Publication of EP0075311A3 publication Critical patent/EP0075311A3/de
Application granted granted Critical
Publication of EP0075311B1 publication Critical patent/EP0075311B1/de
Expired legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Definitions

  • the invention relates to an arrangement for the transmission of speech according to the channel vocoder principle, in which, in a vocoder analyzer, the speech signal to be transmitted f f filling curve values for a number specified by a filter bank of M spectral channels differing by frequency position and width, and optionally additional language-specific parameters How the fundamental speech frequency and voice characteristics are derived and combined in a suitable manner to form a digital sum signal in the rhythm of successive frames each comprising an analysis interval are transmitted to the reception side, in which the digital sum signal on the reception side in turn is transferred to the individual M spectral channels and, if appropriate, to the additional language-specific parameters assigned channels is divided and these channel signals are then fed to the receiver-side vocoder synthesizer, which in turn is a transmitter-side vocoder analyzer has the appropriate filter bank and a pulse generator and outputs the generated synthetic speech signal on the output side.
  • Channel vocoder transmission methods are known, for example, from the literature IEEE Transactions on Audio and Electroacoustics, Vol. AU-15, No. 4, Dec. 1967, pages 148 to 161.
  • Such Channel vocoders in the analysis section and in the synthesis section made use of the same filter bank. In the case of voice transmission in half duplex, this results in an inexpensive outlay because the filter bank can be switched over and thus only needs to be present once per device.
  • So-called “switched capasitor filters” can also be used as digital filters, which are available in an integrated embodiment and manage with a small installation volume.
  • such filters have the disadvantage that their transfer function is repeated periodically in the frequency domain.
  • the input signal for such a filter must not have any spectral components have above half the sampling frequency.
  • the upper band limit of the input signal must be further away from half the sampling frequency if interference is to be avoided.
  • the analysis part there are no problems with this, since this distance can be reliably maintained with simple means.
  • this requirement cannot be guaranteed without considerable additional expenditure due to the pulse-shaped excitation function.
  • considerable analog screening means have to be used here in order to sufficiently suppress disruptive effects in the form of a chirping background noise.
  • the invention has for its object to provide a solution for a digital filter bank for the synthesis part of a channel vocoder implemented in digital technology, which can ensure optimal speech quality of the generated synthetic speech with relatively little technical effort.
  • the filter bank designed in digital technology consists of non-recursive time-variant filters with a finite impulse response (FIR filter) and that the filter bank the excitation variable of the pulse generator is supplied on the input side with a constant pulse amplitude and that the time variance of the gain factor of the filter bank is brought about in multipliers by multiplying the filter bank coefficients by the envelope values transmitted in rhythm with successive frames.
  • FIR filter finite impulse response
  • the invention is based on the essential finding that the impulse response of a FIR filter amounts to the same whether the pulse train supplied to its input is weighted with the transmitted envelope values or the weighting is carried out by multiplying the filter coefficients by the transmitted envelope values .
  • the FIR filters to which the excitation variable is supplied on the input side, each have a chain connection of N-1 identical delay stages with a maximum of N taps.
  • Each FIR filter has a number of switches corresponding to the taps, the control inputs of which are connected to the taps.
  • Each switch connects the output of a multiplier to the filter output.
  • the one inputs of the multipliers together form the input for the assigned transmitted envelope value and at each of the other inputs of the multipliers there is a filter coefficient which, in its entirety, defines the filter response.
  • the filter bank is a FIR sum filter, which has a chain connection of N-1 equal delay stages with a maximum of N taps and has a number of switches corresponding to the taps, the control inputs of which are connected to the taps.
  • N-1 equal delay stages with a maximum of N taps and has a number of switches corresponding to the taps, the control inputs of which are connected to the taps.
  • the excitation quantity supplied to the FIR filter or the FIR sum filter can be a pulse sequence that is generated periodically by a pulse generator and can be controlled in its repetition rate by the transmitted basic speech frequency value.
  • the filter coefficients are dimensioned such that an optimal speech quality of the synthesized speech is guaranteed.
  • a first such preferred dimensioning can consist in that the filter coefficients of the FIR filter or the filter areas of the FIR sum filter with center frequencies ⁇ 2 kHz for impulse responses and those of the FIR filters or the filter areas of the sum filter with center frequencies> 2 kHz for noise responses are measured.
  • a further preferred dimensioning can consist in dimensioning all filter coefficients of the FIR filter or the FIR sum filter for noise responses.
  • the envelope values Ai combined within an analysis interval on the transmission side to form a time-division multiplex frame, as well as the fundamental frequency information No and the voiced-unvoiced criterion Sc, are first returned to the individual channels, namely the .sup M spectral channels for the M envelope values A1, A2 ... AM as well as the channel for the voiced-unvoiced criterion Sc and the channel for the fundamental frequency information No are divided.
  • the actual synthesis part ST has the filter bank with the bandpasses B1, B2 ... BM, to which the envelope values are fed via a modulator M1, M2 ... MM.
  • the second input of the modulators is either switched over to the excitation variable x (n) in the form of the periodic pulse sequence generated by the pulse generator PB or in the form of the pseudo-random pulse train generated by a random pulse generator PNG.
  • the pulses of the pulse generator PG or of the random pulse generator PNG which are output at the modulator outputs and weighted by the envelope values A1, A2 ... AM are passed over the bandpass filters B1, B2 ... BM.
  • the filter responses Y1 (n), Y2 (n) ... YM (n) are then combined via the summer SU to the synthesized speech signal y (n) at the output of the synthesis part ST.
  • the output signal y (n) is obtained taking into account the filter coefficients h1 (k), h2 (k) ... hM (k ) the relationship for these bandpass filters
  • each of the band filters B1, B2 ... BM N representing a FIR filter has taps and that N-1 identical delay elements with the delay time are selected to be equal to the mean time interval between two successive pulses.
  • the expression in equation (1) after the first sum symbol represents the respective filter response yi (n), so that equation (1) can also be written
  • Equation (1) the same result is obtained for the output signal y (n) if instead of weighting the excitation variable x (n) supplied by the pulse generator DG or by the random pulse generator PNG, the filter coefficients hi (k) are multiplied by the envelope values Ai.
  • the equation (1) for the output signal of the synthesis part y (n) can therefore be rewritten as follows.
  • the synthesis part ST which realizes equations (3) to (5) and is constructed with FIR filters is shown in FIG. 2. Instead of the time-inverted bandpasses B1, B2 ... BM according to FIG. 1, the bandpasses B1 ', B2' ... BM 'representing time-variant FIR filters now take place.
  • the excitation variable x (n) is fed directly to the inputs of these bandpass filters in the form of a pulse train with a constant pulse amplitude.
  • the time variance of the filters is controlled via the envelope values A1, A2 ... AM by the filter coefficients hi (k) weight by forming the products gi (k). This weighting must be done once for each incoming frame of the sum signal ss for each filter.
  • FIG. 3 shows a bandpass filter Bi 'in the form of such a time-variant FIR filter. It has N-1 identical delay stages Z-1 and N taps connected in chain. The N taps are fed to control inputs of N switches S, which each connect the output of a multiplier MU to the sum line 1 providing the filter response yi (n). Each multiplier MU assigned to a switch S is supplied with the associated envelope value Ai at its one input. The filter coefficients hi (0), hi (1), ... hi (N-1) are present at the N second inputs of the N multipliers MU.
  • the excitation variable x (n) supplied to the input of the chain of delay elements only has the function of controlling the switches S "open” or "closed” depending on whether there is no pulse or a pulse.
  • FIG. 4 shows an embodiment of the synthesis part ST according to FIG. 2, in which the bandpasses B1 ', B2' ... BM 'are combined to form a sum filter SB.
  • the sum filter SB designated in FIG. 4 with ST ' 3 in turn has the chain connection of N equal delay stages Z -1 with N taps, which are each fed to the control input of one of N switches.
  • a multiplier-summing arrangement MS is provided here, each of which has M multipliers. The outputs of the M multipliers are connected to the associated switch S via a summer SU.
  • the filter coefficients hi (k) of all equivalent taps of the individual filters are supplied to one input of the M multipliers MU of a multiplier-summing arrangement MS, while the envelope values A1, A2 ... AM are present at their second inputs.
  • the respective sum function becomes connected to the sum line 1 and in this way the output signal y (n) obtained at the output of the synthesis part ST '.
  • the transmission of the voiced-unvoiced criterion Sc and the random generator PNG can be dispensed with in an extremely advantageous manner in such a synthesis part with time-variant FIR filters with a suitable measurement of the filter coefficients defining the impulse response or the noise response will.
  • This state of affairs is shown schematically in FIG. 5.
  • the filter coefficients hi '(k) are expediently determined here experimentally so that the synthesized speech signal has an optimal speech quality at the output. As has already been explained, this can be done in such a way that the filter coefficients hi '(n) of the bandpasses B1', B2 '...

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

Die Erfindung betrifft eine Ausführung des Syntheseteils eines Kanalvocoders zur Übertragung von Sprache mit erheblicher Frequenzbandreduktion in digitaler Technik, bei dem eine Reduzierung des Schaltungsaufwandes unter Verwendung von nicht rekursiven Filtern mit endlicher Impulsantwort (FIR-Filter) anstelle einer Gewichtung der impulsförmigen Anregungsgrösse [x(n)] mit den übertragenen Hüllkurvenwerten der Spektralkanäle eine Zeitvarianz der FIR-Filter durch Gewichtung ihrer Filterkoeffizienten [hi(n)] mit den übertragenen Hüllkurvenwerten herbeigeführt ist. Dieses Grundkonzept ermöglicht es darüber hinaus bei geeigneter Bemessung der Filterkoeffizienten [hi'(n)] auch unter Verzicht der Übertragung eines Stimmhaft-Stimmloskriteriums (Sc) eine optimale Sprachqualität der synthetisierten Sprache am Ausgang des Syntheseteils (ST, ST') zu erhalten.

Description

  • Die Erfindung bezieht sich auf eine Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip, bei dem sendeseitig in einem Vocoderanalysator vom zu übertragenden Sprachsignal ffüllkurvenwerte für eine durch eine Filterbank vorgegebene Anzahl von sich durch Frequenzlage und -breite unterscheidenden M Spektralkanälen sowie gegebenenfalls zusätzliche sprachspezifische Parameter, wie Sprachgrundfrequenz und Stimmcharakteristikum abgeleitet und in geeigneter Weise zu einem digitalen Summensignal zusammengefaßt im Rhythmus aufeinander folgender je ein Analyseintervall umfassenden Rahmen zur Empfangsseite übertragen werden, bei dem ferner das digitale Summensignal empfangsseitig wiederum auf die einzelnen M Spektralkanäle und gegebenenfalls auf die den zusätzlichen sprachspezifischen Paramatern zugeordneten Kanäle aufgeteilt wird und diese Kanalsignale anschließend dem empfangsseitigen Vocodersynthetisator zugeführt werden, der seinerseits eine dem sendeseitigen Vocoderanalysator entsprechende Filterbank sowie einen Pulsgenerator aufweist und ausgangsseitig das generierte synthetische Sprachsignal abgibt.
  • Kanalvocoder-Übertragungsverfahren sind beispielsweise durch die Literatur IEEE Transactions on Audio and Electroacoustics, Vol. AU-15, Nr. 4, Dez. 1967, Seiten 148 bis 161 bekannt. In der Regel wird bei solchen Kanalvocodern im Analyseteil und im Syntheseteil von der gleichen Filterbank Gebrauch gemacht. Bei Sprach- übertragung im Halbduplex ergibt sich hierdurch ein günstiger Aufwand, weil die Filterbank jeweils umgeschaltet werden kann und so nur einmal je Gerät vorhanden zu sein braucht.
  • Der im Zuge der fortschreitenden integrierten Technik sich mehr und mehr vollziehende Übergang von analogen Schaltungen auf digitale Schaltungen führt auch dazu, Kanalvocoder ausschließlich in digitaler-Technik zu realisieren. Wie beispielsweise die Literaturstelle IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-29, Nr. 1 Febr. 1981, Seiten 13 bis 23, insbesondere Seite 16, rechte Spalte, erster Absatz ausweist, werden für die Realisierung der Filterbank in digitaler Ausführung IIR-Filter und FIR-Filter erwähnt. Der Aufwand für derartige Filter ist jedoch erheblich. Dies gilt insbesondere für das nicht rekursive Filter mit endlicher Impulsantwort (FIR-Filter), weil dieses hierfür von hoher Ordnungszahl sein muß. Die digitalen rekursiven Filter mit unendlicher Impulsantwort (IIR-Filter) lassen sich zwar für den genannten Zweck mit wesentlich niedrigerer Ordnungszahl verwirklichen, haben jedoch nicht die günstigen Eigenschaften der FIR-Filter.
  • Als digitale Filter können auch sogenannte "Switched capasitor-Filter" Verwendung finden, die in integrierter Ausführungsform zur Verfügung stehen und mit einem kleinen Einbauvolumen auskommen. Solche Filter haben jedoch wie alle Abtastfilter den Nachteil, daß sich ihre Übertragungsfunktion im Frequenzbereich periodisch wiederholt. Mit anderen Worten darf hier das Eingangssignal für ein solches Filter keine spektralen Anteile oberhalb der halben Abtastfrequenz besitzen. Wie die Praxis zeigt, muß hier die obere Bandgrenze des Eingangssignals noch einen größeren Abstand von der halben Abtastfrequenz aufweisen, wenn Störungen vermieden werden sollen. Hinsichtlich des Analyseteils ergeben sich hierdurch keine Probleme, da dieser Abstand mit einfachen Mitteln sicher eingehalten werden kann. Im Syntheseteil dagegen ist diese Forderung nicht ohne erheblichen Zusatzaufwand infolge der impulsförmigen Anregungsfunktion zu gewährleisten. Hier müssen mit anderen Worten erhebliche analoge Siebmittel aufgewendet werden, um störende Effekte in Form eines zwitschernden Hintergrundgeräusches in ausreichendem Maß zu unterdrücken.
  • Der Erfindung liegt die Aufgabe zugrunde, für das Syntheseteil eines in digitaler Technik ausgeführten Kanalvocoders eine Lösung für eine digitale Filterbank aufzuzeigen, die bei relativ geringem technischen Aufwand eine optimale Sprachqualität der generierten synthetischen Sprache gewährleisten kann.
  • Ausgehend von einer Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip der einleitend geschilderten Art wird diese Aufgabe gemäß der Erfindung dadurch gelöst, daß die in digitaler Technik gestaltete Filterbank aus nicht rekursiven zeitvarianten Filtern mit endlicher Impulsantwort (FIR-Filter) bestehen, daß ferner der Filterbank eingangsseitig die Anregungsgröße des Pulsgenerators mit konstanter Pulsamplitude zugeführt ist und daß die Zeitvarianz des Verstärkungsfaktors der Filterbank durch Multiplikation der Filterbankkoeffizienten mit den im Rhythmus aufeinander folgender Rahmen übertragenen Hüllkurvenwerten in Multiplizierern herbeigeführt ist.
  • Bei der Erfindung wird von der wesentlichen Erkenntnis ausgegangen, daß es für die Impulsantwort eines FIR-Filters auf das gleiche hinausläuft, ob die seinem Eingang zugeführte Impulsfolge mit den übertragenen Hüllkurvenwerten gewichtet ist oder aber die Gewichtung über eine Multiplikation der Filterkoeffizienten mit den übertragenen Hüllkurvenwerten erfolgt. Die erfindungsgemäße Ausbildung der Filterbank als zeitvariante Filterbank, der eingangsseitig die Anregungsgröße des Pulsgenerators mit konstanter Amplitude zugeführt wird-, vermindert in außerordentlich vorteilhafter Weise die im Syntheseteil durchzuführenden Multiplikationen und damit den Filteraufwand.
  • Bei einer ersten bevorzugten Ausführungsform weisen die FIR-Filter, denen eingangsseitig die Anregungsgröße zugeführt ist, jeweils eine Kettenschaltung von N-1 gleichen Verzögerungsstufen mit maximal N Abgriffen auf. Jedes FIR-Filter hat eine den Abgriffen entsprechende Anzahl von Schaltern, deren Steuereingänge mit den Abgriffen verbunden sind. Jeder Schalter verbindet dabei den Ausgang eines Multiplizierers mit dem Filterausgang. Die einen Eingänge der Multiplizierer bilden gemeinsam den Eingang für den zugeordneten übertragenen Hüllkurvenwert und an jedem der anderen Eingänge der Multiplizierer steht ein Filterkoeffizient an, die in ihrer Gesamtheit die Filterantwort festlegen.
  • Bei einer zweiten bevorzugten Anordnung ist die Filterbank ein FIR-Summenfilter, das eine Kettenschaltung von N-1 gleichen Verzögerungsstufen mit maximal N Abgriffen aufweist und eine den Abgriffen entsprechende Zahl von-Schaltern hat, deren Steuereingänge mit den Abgriffen verbunden sind. Hierbei verbindet jeder Schalter den Ausgang einer Multiplizierer-Summierschaltung mit dem Filterausgang, die die Produktbildung der Einzelfilterkoeffizienten mit den zugehörigen übertragenen Hüllkurvenwerten ausführt und die Produktsumme bildet.
  • Die üblicherweise aus Gründen der Redundanzreduktion ausschließlich in Potenzen von zwei übertragenen Hüllkurvenwerte geben die Möglichkeit, ihre Multiplikation mit den Filterkoeffizienten jeweils in einem Schiebewerk auszuführen, was eine weitere erhebliche Aufwandsminderung mit sich bringt.
  • In Weiterbildung der Erfindung kann die den FIR-Filtern bzw. dem FIR-Summenfilter zugeführte Anregungsgröße unter Verzicht auf eine Stimmlos-Stimmhaft-Umschaltung eine von einem Pulsgenerator periodisch erzeugte und vom übertragenen Sprachgrundfrequenzwert in ihrer Folgefrequenz steuerbare Pulsfolge sein. In diesem Zusammenhang sind die Filterkoeffizienten derart bemessen, daß hierdurch eine optimale Sprachqualität der synthetisierten Sprache gewährleistet ist.
  • Eine erste derartige bevorzugte Bemessung kann darin bestehen, daß die Filterkoeffizienten der FIR-Filter bzw. der Filterbereiche des FIR-Summenfilters mit Mittenfrequenzen < 2 kHz für Impulsantworten und diejenigen der FIR-Filter bzw. der Filterbereiche des Summenfilters mit Mittenfrequenzen > 2 kHz für Rauschantworten bemessen sind.
  • Eine weitere bevorzugte Bemessung kann darin bestehen, daß sämtliche Filterkoeffizienten der FIR-Filter bzw. des FIR-Summenfilters für Rauschantworten bemessen sind.
  • Anhand von in der Zeichnung dargestellten Ausführungsbeispielen soll die Erfindung im folgenden noch näher erläutert werden. In der Zeichnung bedeuten
    • Fig. 1 das Blockschaltbild des Syntheseteils eines üblichen Kanalvocoders,
    • Fig. 2 das Fig. 1 entsprechende Blockschaltbild eines erfindungsgemäßen Syntheseteils,
    • Fig. 3 das Blockschaltbild eines digitalen Bandfilters des Synteseteils nach Fig. 2,
    • Fig. 4 ein weiteres Syntheseteil mit einem digitalen Summenfil-ter nach der Erfindung,
    • Fig. 5 eine weitere Ausführungsform eines Syntheseteils nach der Erfindung in schematischer Darstellung.
  • Die innerhalb eines Analyseintervalls auf der Sendeseite zu einem Zeitmultiplexrahmen zusammengefaßten Hüllkurvenwerte Ai sowie der Grundfrequenzinformation No und dem Stimmhaft-Stimmlos-Kriterium Sc werden auf der Empfangsseite im Demultiplexer DEMUX, dem eingangsseitig das Summensignal ss zugeführt wird, zunächst wieder in die einzelnen Kanäle, nämlich die M Spektralkanäle für die M Hüllkurvenwerte A1, A2 ... AM sowie den Kanal für das Stimmhaft-Stimmlos-Kriterium Sc und den Kanal für die Grundfrequenzinformation No aufgeteilt.
  • Das eigentliche Syntheseteil ST weist die Filterbank mit den Bandpässen B1, B2 ... BM auf, denen die Hüllkurvenwerte jeweils über einen Modulator M1, M2 ... MM zugeführt werden. Dem jeweils zweiten Eingang der Modulatoren wird in Abhängigkeit des Stimmhaft-Stiminlos-Kriteriums S über den Umschalter U entweder die Anregungsgröße x(n) in Form der vom Pulsgenerator PB erzeugten periodischen Pulsfolge oder aber in Form der von einem Zufallsimpulsgenerator PNG erzeugten Pseudozufallsimpulsfolge zugeführt. Die an den Modulatorausgängen abgegebenen, durch die Hüllkurvenwerte A1, A2 ... AM gewichteten Impulse des Pulsgenerators PG bzw. des Zufallsimpulsgenerators PNG werden über die Bandfilter B1, B2 ... BM hinweggeführt. Die Filterantworten Y1(n), Y2(n) ... YM(n) werden anschließend über den Summierer SU zum synthetisierten Sprachsignal y(n) am Ausgang des Syntheseteils ST zusammengefaßt.
  • Für die Ausführung der Bandfilter B1, B2 ... BM als FIR-Filter ergibt sich für das Ausgangssignal y(n) unter Berücksichtigung der in Fig. 1 ebenfalls angeschriebenen Filterkoeffizienten h1(k), h2(k) ... hM(k) für diese Bandfilter die Beziehung
    Figure imgb0001
  • Dabei ist davon ausgegangen, daß jedes der ein FIR-Filter darstellenden Bandfilter B1, B2 ... BM N Abgriffe aufweist und aus N-1 gleichen Verzögerungsgliedem mit der Verzögerungszeit die gleich des mittleren Zeitabstands zweier aufeinander folgender Impulse gewählt ist. Der Ausdruck in Gleichung (1) hinter dem ersten Summenzeichen stellt die jeweilige Filterantwort yi(n) dar, so daß sich die Gleichung (1) auch schreiben läßt
    Figure imgb0002
  • Wie die Gleichung (1) erkennen läßt, ergibt sich für das Ausgangssignal y(n) das gleiche Ergebnis, wenn anstelle einer Gewichtung der vom Pulsgenerator DG bzw. vom Zufallsimpulsgenerator PNG gelieferten Anregungsgröße x(n) mit den Hüllkurvenwerten Ai die Filterkoeffizienten hi(k) mit den Hüllkurvenwerten Ai multipliziert werden. Die Gleichung (1) für das Ausgangssignal des Syntheseteils y(n) kann deshalb wie folgt umgeschrieben werden.
    Figure imgb0003
  • Setzt man für das Produkt Ai . hi (k) = gi (k), so ergibt sich
    Figure imgb0004
  • Der Ausdruck hinter dem ersten Summenzeichen stellt wiederum die Ausgangsfunktion yi(n) eines Einzelfilters dar, so daß auch hier gilt
    Figure imgb0005
  • Das die Gleichungen (3) bis (5) realisierende, mit FIR-Filtern aufgebaute Syntheseteil ST ist in Fig. 2 dargestellt. Anstelle der zeitinverianten Bandpässe B1, B2 ... BM nach Fig. 1 treten nunmehr die zeitvariante FIR-Filter darstellenden Bandpässe B1', B2' ... BM'. Die Anregungsgröße x(n) wird hier in Form einer Impulsfolge mit konstanter Impulsamplitude den Eingängen dieser Bandfilter unmittelbar zugeführt. Die Zeitvarianz der Filter wird über die Hüllkurvenwerte A1, A2 ... AM dadurch gesteuert, daß sie die Filterkoeffizienten hi(k) durch Bilden der Produkte gi(k) gewichten. Diese Gewichtung muß für jeden ankommenden Rahmen des Summensignals ss für jedes Filter einmal erfolgen.
  • In Fig. 3 ist ein Bandpaß Bi' in Gestalt eines solchen zeitvarianten FIR-Filters dargestellt. Es weist N-1 gleiche in Kette geschaltete Verzögerungsstufen Z-1 und N Abgriffe auf. Die N Abgriffe sind Steuereingängen von N Schaltern S zugeführt, die jeweils den Ausgang eines Multiplizierers MU mit der die Filterantwort yi(n) liefernden Summenleitung 1 verbinden. Jedem einem Schalter S zugeordneten Multiplizierer MU wird an seinem einen Eingang der zugehörige Hüllkurvenwert Ai zugeführt. An den N zweiten Eingängen der N Multiplizierer MU liegen die Filterkoeffizienten hi(0), hi(1), ... hi(N-1) an. Die dem Eingang der Kette aus Verzögerungsgliedern zugeführte Anregungsgröße x(n) hat innerhalb des Filters lediglich die Funktion einer Steuerung der Schalter S "auf" oder "zu" je nachdem, ob kein Impuls oder ein Impuls auftritt. Dies ist möglich geworden, da die Anregungsgröße selbst nicht mehr durch die Hüllkurvenwerte gewichtet ist. Der Übergang von zeitinvarianten zu zeitvarianten FIR-Filtern ermöglicht somit eine Einsparung von M Multiplizierern..Wie bereits erwähnt worden ist, können diese Multiplizierer in außerordentlich einfacher Weise als Schiebewerke ausgeführt sein, da die übertragenen Hüllkurvenwerte aus Gründen der Redundanzminderung lediglich Werte aufweisen können, die entweder Null oder Potenzen von zwei sind.
  • Fig. 4 zeigt eine Ausführung des Syntheseteils ST nach Fig. 2, bei dem die Bandpässe B1', B2' ... BM' zu einem Summenfilter SB zusammengefaßt sind. Das Summenfilter SB des in Fig. 4 mit ST' bezeichneten Syntheseteils weist entsprechend Fig. 3 wiederum die Kettenschaltung von N gleichen Verzögerungsstufen Z-1 mit N Abgriffen auf, die jeweils dem Steuereingang eines von N Schaltern zugeführt sind. Im Unterschied zum Einzelfilter nach Fig. 3 sind hier anstelle eines Multiplizierers eine Multiplizierer-Summieranordnung MS vorgesehen, die jeweils M Multiplizierer aufweisen. Die Ausgänge der M Multiplizierer sind über einen Summierer SU mit dem zugehörigen Schalter S verbunden. Am einen Eingang der M Multiplizierer MU einer Multiplizierer-Summieranordnung MS sind die Filterkoeffizienten hi(k) aller gleichwertigen Abgriffe der Einzelfilter zugeführt, während an ihren zweiten Eingängen die Hüllkurvenwerte A1, A2 ... AM anstehen. In Abhängigkeit davon, daß in einem vorgegebenen Zeitabschnitt ein Impuls der Anregungsgröße x(n) am Steuereingang eines Schalters anliegt oder nicht wird die jeweilige Summenfunktion
    Figure imgb0006
    an die Summenleitung 1 angeschaltet und auf diese Weise das Ausgangssignal y(n) am Ausgang des Syntheseteils ST' gewonnen.
  • Wie weitere der Erfindung zugrundeliegende Untersuchungen gezeigt haben, kann in außerordentlich vorteilhafter Weise bei einem solchen Syntheseteil mit zeitvarianten FIR-Filtern bei geeigneter Messung der die Impulsantwort bzw. die Rauschantwort festlegenden Filterkoeffizienten auf die Übertragung des Stimmhaft-Stimmmlos-Kriteriums Sc sowie den Zufallsgenerator PNG verzichtet werden. Schematisch ist dieser Sachverhalt in Fig. 5 dargestellt. Die Filterkoeffizienten hi'(k) werden hier zweckmäßig auf experimentellem Wege so festgelegt, daß das synthetisierte Sprachsignal am Ausgang eine optimale Sprachqualität aufweist. Dies kann, wie bereits ausgeführt worden ist, in der Weise erfolgen, daß die Filterkoeffizienten hi'(n) der Bandpässe B1', B2' ... BM' bzw. der Filterbereiche des Summenfilters SB mit Mittenfrequenzen < 2 kHz für Impulsantworten und diejenigen der Bandpässe bzw. der Filterbereiche des Summenfilters mit Mittenfrequenzen > 2 kHz für Rauschantworten bemessen werden. Es ist jedoch in außerordentlich vorteilhafter Weise auch möglich, sämtliche Filterkoeffizienten hi'(n) der Bandpässe bzw. des Summenfilters in geeigneter Weise für Rauschantworten zu bemessen.

Claims (7)

1. Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip, bei dem sendeseitig in einem Vocoderanalysator vom zu übertragenden Sprachsignal Hüllkurvenwerte für eine durch eine Filterbank vorgegebene Anzahl von sich durch Frequenzlage und -breite unterscheidenden M Spektralkanälen sowie gegebenenfalls zusätzliche sprachspezifische Parameter, wie Sprachgrundfrequenz und Stimmcharakteristikum, abgeleitet und in geeigneter Weise zu einem digitalen Summensignal zusammengefaßt im Rhythmus aufeinander folgender je ein Analyseintervall umfassenden Rahmen zur Empfangsseite übertragen werden, bei dem ferner das digitale Summensignal empfangsseitig wiederum auf die einzelnen M Spektralkanäle und gegebenenfalls auf die den zusätzlichen sprachspezifischen Parametern zugeordneten Kanäle aufgeteilt wird und diese Kanalsignale anschließend dem empfangsseitigen Vocodersynthetisator zugeführt werden, der seinerseits eine dem sendeseitigen Vocoderanalysator entsprechende Filterbank sowie einen Pulsgenerator aufweist und ausgangsseitig das generierte synthetische Sprachsignal abgibt, dadurch gekennzeichnet , daß die in digitaler Technik gestaltete Filterbank aus nicht rekursiven zeitvarianten Filtern (B1' ... BM') mit endlicher Impulsantwort (FIR-Filter) bestehen, daß ferner der Filterbank eingangsseitig die Anregungsgröße (x(n)) des Pulsgenerators (PG, PNG) mit konstanter Pulsamplitude zugeführt ist und daß die Zeitvarianz des Verstärkungsfaktors der Filterbank durch Multiplikation der Filterbankkoeffizienten (hi(n),hi'(n)) mit den im Rhythmus aufeinander folgender Rahmen übertragenen Hüllkurvenwerten (A1 ... AM) in Multiplizierern (MU) herbeigeführt ist.
2. Anordnung nach Anspruch 1, dadurch gekennzeichnet , daß die FIR-Filter, denen eingangsseitig die Anregungsgröße (x(n)) zugeführt ist, jeweils eine Kettenschaltung von N-1 gleichen Verzögerungsstufen (Z-1) mit maximal N Abgriffen aufweisen, daß jedes FIR-Filter ferner eine den Abgriffen entsprechende Anzahl von Schaltern (S) hat, deren Steuereingänge mit den Abgriffen verbunden sind, daß außerdem jeder Schalter den Ausgang eines Multiplizierers (MU) mit dem Filterausgang verbindet und daß die einen Eingänge der Multiplizierer gemeinsam den Eingang für den zugeordneten übertragenen Hüllkurvenwert bilden und an jedem der anderen Eingänge der Multiplizierer ein Filterkoeffizient (hi(n)) ansteht, die in ihrer Gesamtheit die Filterantwort festlegen.
3. Anordnung nach Anspruch 1, dadurch gekennzeichnet , daß die Filterbank ein FIR-Summenfilter ist, das eine Kettenschaltung von N-1 gleichen Verzögerungsstufen (Z-1) mit maximal N Abgriffen aufweist, daß ferner eine den Abgriffen entsprechende Zahl von Schaltern (S) vorgesehen ist, deren Steuereingänge mit den Abgriffen verbunden sind und daß jeder Schalter den Ausgang einer Multiplizierer-Summierschaltung (MS) mit dem Filterausgang verbindet, die die Produktbildung der Einzelfilterkoeffizienten (hi(n)) mit den zugehörigen übertragenen Hüllkurvenwerten (Ai) ausführt und die Produktsumme bildet.
4. Anordnung nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet , daß die Multiplizierer durch Schiebewerke realisiert sind.
5. Anordnung nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet , daß die den FIR-Filtern (B1' ... BM', Bi') bzw. dem FIR-Summenfilter (SB) zugeführte Anregungsgröße (x(n)) unter Verzicht auf eine Stimmlos-Stimmhaft-Umschaltung eine von einem Pulsgenerator (PG) periodisch erzeugte und vom übertragenen Sprachgrundfrequenzwert (No) in ihrer Folgefrequenz steuerbare Pulsfolge ist und daß die Filterkoeffizienten (hi(n)) derart bemessen sind, daß hierdurch eine optimale Sprachqualität der synthetisierten Sprache gewährleistet ist.
6. Anordnung nach Anspruch 5, dadurch gekennzeichnet , daß die Filterkoeffizienten (hi'(n)) der FIR-Filter (B1' ... BM', Bi) bzw. der Filterbereiche des FIR-Summenfilters (SB) mit Mittenfrequenzen < 2 kHz für Impulsantworten und diejenigen der FIR-Filter bzw. der Filterbereiche des FIR-Summenfilters mit Mittenfrequenzen >2 kHz für Rauschantworten bemessen sind.
7. Anordnung nach Anspruch 5, dadurch gekennzeichnet , daß sämtliche Filterkoeffizienten (hi'(n)) der FIR-Filter (B1' ... BM', Bi') bzw. des FIR-Summenfilters (SB) für Rauschantworten bemessen sind.
EP82108691A 1981-09-22 1982-09-20 Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip Expired EP0075311B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE3137679 1981-09-22
DE19813137679 DE3137679A1 (de) 1981-09-22 1981-09-22 Anordnung zur uebertragung von sprache nach dem kanalvocoderprinzip

Publications (3)

Publication Number Publication Date
EP0075311A2 true EP0075311A2 (de) 1983-03-30
EP0075311A3 EP0075311A3 (en) 1984-02-01
EP0075311B1 EP0075311B1 (de) 1986-08-20

Family

ID=6142325

Family Applications (1)

Application Number Title Priority Date Filing Date
EP82108691A Expired EP0075311B1 (de) 1981-09-22 1982-09-20 Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip

Country Status (4)

Country Link
US (1) US4574392A (de)
EP (1) EP0075311B1 (de)
JP (1) JPS594720B2 (de)
DE (2) DE3137679A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1233891A (en) * 1985-05-27 1988-03-08 Peter Gillingham Switched capacitor finite impulse response filter
DE3521413C2 (de) * 1985-06-14 1995-09-21 Daimler Benz Aerospace Ag Sprechfunkanordnung
GB2182795B (en) * 1985-11-12 1988-10-05 Nat Res Dev Apparatus and methods for speech analysis
JPS6345933A (ja) * 1986-04-15 1988-02-26 Nec Corp 秘話装置
DE3826858A1 (de) * 1988-08-08 1990-02-15 Thomson Brandt Gmbh Zwei-band-filter
RU2584462C2 (ru) * 2014-06-10 2016-05-20 Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования Московский технический университет связи и информатики (ФГОБУ ВПО МТУСИ) Способ передачи и приема сигналов, представленных параметрами ступенчатого модуляционного разложения, и устройство для его осуществления

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1569433A (de) * 1967-06-29 1969-05-30

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5853358B2 (ja) * 1980-03-31 1983-11-29 株式会社東芝 音声分析装置
US4377793A (en) * 1981-01-13 1983-03-22 Communications Satellite Corporation Digital adaptive finite impulse response filter with large number of coefficients
JPS5833313A (ja) * 1981-08-21 1983-02-26 Nec Corp トランスバ−サル定利得可変等化器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1569433A (de) * 1967-06-29 1969-05-30

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE TRANSACTIONS ON COMMUNICATIONS, Band COM-22, Nr. 9, September 1974, Seiten 1172-1179, New York, USA *

Also Published As

Publication number Publication date
JPS594720B2 (ja) 1984-01-31
JPS5870298A (ja) 1983-04-26
DE3137679A1 (de) 1983-04-07
EP0075311B1 (de) 1986-08-20
US4574392A (en) 1986-03-04
EP0075311A3 (en) 1984-02-01
DE3272737D1 (en) 1986-09-25

Similar Documents

Publication Publication Date Title
DE2818204C2 (de) Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals
DE102006047197B3 (de) Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
EP0065210B1 (de) Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung
EP0290790B1 (de) Filterbank
EP0052847A2 (de) Verfahren und Schaltungsanordnung zur Umsetzung der Abtastfrequenz einer Abtastfolge unter Umgehung der Konversion in ein kontinuierliches Signal
DE3405010A1 (de) Vorrichtung zur erzeugung eines verzoegerungsschaetzwertes fuer eine echoausloescheinrichtung
DE3116042C2 (de) Digitalfilter
EP0485390B1 (de) Verfahren zur übertragung eines signals
EP0957471B1 (de) Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
EP0075311B1 (de) Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip
DE3702215C2 (de)
EP0651525A2 (de) Drop-and-Add-Multiplexer zur Umsetzung und Aufbereitung eines Frequenzmultiplexsignals
DE3922469C2 (de)
DE3523537C2 (de) Verfahren und Empfangsanordnung zur Unterdrückung von Inbandstörungen
DE3431141A1 (de) Transversalfilter-echokompensator fuer lange akustische echos
DE3127189C2 (de) Digitalfiltervorrichtung mit Resonanzeigenschaften
EP0402519B1 (de) Verfahren und Anordnung zur Verbesserung des Dynamikbereichs eines adaptiven rekursiven Netzwerks zur Verarbeitung zeitdiskreter Signale
DE2011772C3 (de) Filter mit einer periodischen Frequenzcharakteristik
DE2747857C3 (de) Vierpol, dessen Übertragungsfunktion einstellbar ist
EP0155008B1 (de) Digitale Filteranordnung zur Aufteilung von Signalen in Teilbänder
DE2217574B2 (de) Schmalbandiges Digitalfilter
EP0196413B1 (de) Tiefen- oder Höhen-Shelving-Filter
EP0169961B1 (de) Digitales Filter
DE3303516A1 (de) Verfahren und vorrichtung zur frequenzverschiebung eines digitalen eingangssignals
DE3734882C1 (en) Radio-frequency mixer

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Designated state(s): CH DE FR GB IT LI NL

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Designated state(s): CH DE FR GB IT LI NL

17P Request for examination filed

Effective date: 19840705

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): CH DE FR GB IT LI NL

REF Corresponds to:

Ref document number: 3272737

Country of ref document: DE

Date of ref document: 19860925

ET Fr: translation filed
ITF It: translation for a ep patent filed

Owner name: STUDIO JAUMANN

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed
PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 19900816

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 19900925

Year of fee payment: 9

ITTA It: last paid annual fee
PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 19900930

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CH

Payment date: 19901217

Year of fee payment: 9

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Effective date: 19910920

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LI

Effective date: 19910930

Ref country code: CH

Effective date: 19910930

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Effective date: 19920401

NLV4 Nl: lapsed or anulled due to non-payment of the annual fee
GBPC Gb: european patent ceased through non-payment of renewal fee
PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Effective date: 19920529

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 19921124

Year of fee payment: 11

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Effective date: 19940601