DE3302503C2 - - Google Patents

Info

Publication number
DE3302503C2
DE3302503C2 DE3302503A DE3302503A DE3302503C2 DE 3302503 C2 DE3302503 C2 DE 3302503C2 DE 3302503 A DE3302503 A DE 3302503A DE 3302503 A DE3302503 A DE 3302503A DE 3302503 C2 DE3302503 C2 DE 3302503C2
Authority
DE
Germany
Prior art keywords
signal
step size
interval
threshold
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE3302503A
Other languages
English (en)
Other versions
DE3302503A1 (de
Inventor
James Loton Warren N.J. Us Flanagan
James David Millington N.J. Us Johnston
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Publication of DE3302503A1 publication Critical patent/DE3302503A1/de
Application granted granted Critical
Publication of DE3302503C2 publication Critical patent/DE3302503C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

Die Erfindung betrifft eine Sprachverarbeitungsanlage gemäß dem Oberbegriff des Anspruch 1 sowie ein entsprechendes Verfahren gemäß dem Oberbegriff des Anspruchs 7.
Es ist bekannt, daß die normale Sprache Ruheintervalle enthält, die Teil der übermittelten Nachricht sind.
Ruheintervalle treten zwischen Sätzen, Phrasen, Wörtern sowie innerhalb der Wörter auf. Üblicherweise werden Ruheintervalle durch den Zuhörer als normale Beigabe der Sprache aufgefaßt. Die Ruheintervalle tragen jedoch zu einem bedeutsamen Anteil des Sprachmusters bei. Wenn ein Sprachsignal zur Übertragung über einen Nachrichtenkanal oder zur Eingabe in einem Speicher codiert wird, so nehmen die Codefolgen, die den Ruheintervallen entsprechen, Abschnitte des codierten Signals ein, die weggelassen oder für andere Zwecke benutzt werden können. Es ist natürlich erforderlich, die Ruheintervalle an ihrer richtigen Stelle im Sprachmuster wiederherzustellen, um die Nachricht zu verstehen. Die Codierung der Ruheintervalle kann jedoch so vereinfacht werden, daß das gespeicherte oder übertragene Digitalsignal kompakter wird. Auf diese Weise läßt sich der Wirkungsgrad der Nachrichtenanlage verbessern.
Es stehen viele Verfahren zur digitalen Codierung von Sprachsignalen zur Verfügung. Eine direkte Umwandlung abgetasteter Sprache in Binärform kann durch eine Pulscodemodulation erreicht werden. Diese Umwandlung beinhaltet die Quantisierung jedes Sprachabtastwertes in eine Stufe einer Gruppe von diskreten Stufen und Codieren der gewählten Quantisierungsstufe. Adaptive Formen der Pulscodemodulation, bei denen die Quantisierung der Sprachsignal-Abtastwerte an den Pegel des Eingangssignals angepaßt ist, ermöglichen eine höhere Güte mit weniger Bits je Digitalabtastwert. Bei solchen adaptiven Anordnungen kann die Schrittgröße im Quantisierer sich so ändern, daß sie an die statistischen Eigenschaften des Eingangssignals angepaßt ist. Differentielle Pulsmodulationssysteme codieren die Differenz zwischen Eingangssignal-Abtastwerten statt die Abtastwerte selbst, um den Codierwirkungsgrad zu verbessern. Diese Codieranordnungen unterscheiden jedoch nicht genau zwischen aktiven und inaktiven Teilen des Eingangssignals. Demgemäß beeinflussen Ruheperioden im Signal den Wirkungsgrad der Nachrichtenübertragung auf nachteilige Weise.
In der US-PS 42 80 192 wird eine Anordnung zur Minimierung des Speicherraums für eine digitale Speicherung analoger Informationen offenbart, bei der ein analoges Eingangssignal, beispielsweise Sprache, in einen Strom von kontinuierlichen Deltamodulationscodierungen mit variabler Steigung (ADM) umgewandelt wird. Ein sprachbetätigter Schalter stellt den Anfang eines Pausenintervalls fest, wenn das Analogsignal unter einen vorbestimmten Pegel abfällt. Die Pause wird mittels eines Zählers zeitlich bestimmt, der dann angehalten wird, wenn das Sprachsignal einen vorbestimmten Pegel übersteigt. Ein besonderer Pausencode einschließlich einer Zeitinformation wird dann in den digitalen Codestrom eingeführt. Der sprachbetätigte Schalter und die Zeitanordnungen beseitigen sich wiederholende Codierungen der Pausenintervalle aus dem Analogsignal.
Sprachbetätigte Schalter sind in bekannter Weise so ausgelegt, daß sie mit niedriger Geschwindigkeit arbeiten, um ein Abschneiden oder Begrenzen von Silben zu verhindern, und sie enthalten Einrichtungen, die die Feststellung von kurzen Ruheintervallen sperren. Demgemäß enthält eine Anlage entsprechend der obengenannten US-PS 42 80 192 eine kompensierende Verzögerung, um die Einfügung von Pausencodierungen an den richtigen Stellen im Datenstrom zu erleichtern. Die im sprachbetätigten Schalter vorhandene Verzögerung macht es aber schwierig, kurze Ruheperioden festzustellen, die mit einer höheren Rate als der Wortrate auftreten.
Aus der US-PS 44 84 344 ist ein sprachbetätigter Schalter bekannt, bei dem Ruheintervalle durch Vergleichen analoger Sprachsignale mit einem Schwellenwertsignal bestimmt werden.
In der zur Formulierung des Oberbegriffs herangezogene US-PS 40 53 712 wird ein adaptiver digitaler Codierer-Decodierer beschrieben, bei dem besonders codierte Bitmuster anstelle von Ruhemustern in einen CVSD-Ausgangsbitstrom eingefügt werden, um die Gesamtbitrate zu verringern. Die Ruhemusterfeststellung wird erreicht, indem das CVSD-Ausgangssignal in ein Analogsignal rückumgewandelt und das Analogsignal mit festen Amplitudenschwellenwerten verglichen wird. Die Regenerierung des analogen Sprachsignals zur Feststellung von Ruheintervallen macht eine zusätzliche Decodieranordnung erforderlich, die die Kosten erhöht. Während zwar direkte Amplitudenschwellenwerte die Anordnung verhältnismäßig frei von einer Geschwindigkeitsbegrenzung bei der Feststellung von Ruheintervallen machen, ergibt sich aber eine erhöhte Empfindlichkeit gegen Rauschen. Im Ergebnis ist es schwierig, Reibelaute von Ruheintervallen zu unterscheiden, und die Anordnung ist anfälliger gegen eine Sprachbegrenzung.
Ziel der Erfindung ist es, eine verbesserte Digitalcodierung zu schaffen, die in der Lage ist, auf wirtschaftliche Weise Ruheintervalle ohne Begrenzung der Geschwindigkeit auszuschalten.
Die Lösung der Aufgabe ist im Patentanspruch 1 sowie im Patentanspruch 7 angegeben. Die Probleme der bekannten Verfahren zur Beseitigung von Ruheintervallen werden demnach entsprechend der vorliegenden Erfindung durch Verwendung von bereits bei adaptiven Pulsmodulationsverfahren erzeugten, Schrittgrößen-bezogenen Signalen zur Feststellung von Ruheintervallen überwunden. Diese Schrittgrößen-bezogenen Signale stellen den Energiehaushalt der zugeführten Sprachsignale dar, werden aber nicht durch die bei sprachbetätigten Schaltern vorhandenen Verzögerungsmechanismen beeinträchtigt. Als Ergebnis wird eine analoge Signalverarbeitung beseitigt, die Feststellung von Ruheintervallen ist nicht auf vorbestimmte Raten oder Geschwindigkeiten beschränkt, und Anordnungen zur richtigen Lokalisierung der Ruheintervall-Codierungen werden unnötig.
Die vorliegende Erfindung ist gerichtet auf eine Sprachverarbeitungsanlage, bei der ein Sprachmuster in eine Folge von adaptiv digitalcodierten Signalen umgewandelt wird. Ruheintervalle im Sprachmuster werden festgestellt, und es wird eine digitalcodierte Signaldarstellung des Ruheintervalls erzeugt. Die adaptiv digitalcodierten Signale und die digitalcodierten Ruheintervall-Signaldarstellungen werden kombiniert, um ein dem Sprachmuster entsprechendes Digitalsignal zu erzeugen. Die Umwandlung des Sprachmusters in eine Folge von adaptiv digitalcodierten Signalen sieht die Bildung eines Signals vor, das der adaptiven Schrittgröße für jedes adaptiv digitalcodierte Signal entspricht. Es werden erste und zweite Schwellenwertsignale erzeugt. Die Ruheintervallfeststellung beinhaltet die Erzeugung eines in Ruheintervall anzeigenden Signals, wenn das der Adaptionsschrittgröße entsprechende Signal unter den ersten Schwellenwert abfällt, und eine Beendigung des Ruheintervallsignals, wenn das der Adaptionsschrittgröße entsprechende Signal während eines Ruheintervalls das zweite Schwellenwertsignal übersteigt.
Nachfolgend wird die Erfindung anhand der Zeichnungen beschrieben. Es zeigt
Fig. 1 das Blockschaltbild einer digitalen Sprachübertragungsanordnung zur Erläuterung der Erfindung;
Fig. 2 ein genaueres Blockschaltbild eines adaptiven Codierers, der in der Schaltungsanordnung gemäß Fig. 1 verwendet werden kann;
Fig. 3 ein genaueres Blockschaltbild eines Ruhedetektors, der in der Schaltungsanordnung nach Fig. 1 verwendet werden kann;
Fig. 4 ein genaueres Blockschaltbild eines adaptiven Schwellenwertgenerators, der in der Schaltungsanordnung nach Fig. 1 verwendet werden kann;
Fig. 5 ein genaueres Block-Schaltbild einer Ruhezähleranordnung, die in der Schaltungsanordnung nach Fig. 1 verwendet werden kann;
Fig. 6 ein genaueres Blockschaltbild eines Codemodifizierschaltung, die in der Schaltungsanordnung nach Fig. 1 verwendet werden kann,
Fig. 7 und 10 Flußdiagramme, die die Arbeits­ weise der Schaltungsanordnung nach Fig. 1 erläutern,
Fig. 8 und 11 Kurvendiagramme, die die Arbeits­ weise der Schaltungsanordnung nach Fig. 1 erläutern,
Fig. 9 ein genaueres Blockschaltbild einer Ruhe­ codedetektor- und Zähleranordnung, die in der Schaltungsanordnung nach Fig. 1 verwendet werden kann.
In Fig. 1 ist eine digitale Sprachübertragungs­ anlage zur Erläuterung der Erfindung dargestellt. Gemäß Fig. 1 wird ein Sprachmuster einem Mikrophon 101 zugeführt und das vom Mikrophon abgegebene Schaltsignal wird einer Tiefpaßfilter- und Abtastschaltung 103 zugeführt. Die Schaltung 103 führt in bekannter Weise eine Tiefpaßfilte­ rung des zugeführten Sprachsignals durch und tastet das gefilterte Signal mit der vorbestimmten Rate eines Takt­ generators 107 ab. Die Grenzfrequenz des Tiefpaßfilters kann beispielsweise 3,2 kHz und die Abtastrate kann bei­ spielsweise 8 kHz betragen. Die Folge von Sprachabtast­ werten, die von der Schaltung 103 geliefert wird, stellt die Kurvenform des Sprachsignals dar.
Ein Analog-Digitalwandler 105 nimmt die aufein­ ander folgenden Sprachabtastwerte von der Schaltung 103 auf und wandelt jeden Sprachabtastwert in ein digitalco­ diertes Signal um, dessen Wert der Amplitude des Sprach­ abtastwertes entspricht. Die digitalcodierten Signale vom Wandler 105 werden dem Eingang eines adaptiven Codierers 110 zugeführt. In bekannter Weise transformiert ein adap­ tiver Codierer ein Digitalsignal vom Wandler 105 in ein wirksameres codiertes Signal, das verbesserte Signal-Rausch­ eigenschaften besitzt.
Ein Typ eines adaptiven Codierers, der in der Schaltungsanordnung nach Fig. 1 benutzt werden kann, ist in der Blockschaltung nach Fig. 2 gezeigt. Dort handelt es sich um einen Codierer für adaptive differentiale Pulscodemodulation (ADPCM). Es sei jedoch angemerkt, daß auch andere Ausführungen adaptiver Codemodulatoren benutzt werden können. Bei der differentiellen Pulscodemodulation wird die Differenz zwischen jedem Abtastwert xn und der Voraussage dieses Abtastwertes (n) auf der Grundlage ver­ gangener Abtastwerte quantisiert und für die Übertragung codiert. Unter Verwendung einer Anzahl von Quantisier­ stufen erzeugt man eine treppenförmige Annäherung an das Sprachsignal. Bei der differentiellen Codierung wird ein solcher Betrag an Redundanz aus dem Signal entfernt, daß über einer konventionellen PCM-Codierung erreichbar ist.
Im allgemeinen wird bei der differentiellen Co­ dierung eine feste Quantisierer-Schrittgröße benutzt. Eine adaptive Anordnung enthält eine Einrichtung zur Überwa­ chung des digitalen Codiererausgangssignals. Unter Anspre­ chen auf die Größe des Differenzsignals am Ausgang wird die effektive Schrittgröße des Quantisierers abgeändert. Auf diese Weise wird die Quantisierung des Eingangssignals optimiert.
Gemäß Fig. 2 wird die Folge von Digitalsignalen xn vom Analog-Digitalwandler 105 einem Eingang eines Addie­ rers 201 zugeführt. Am anderen Eingang des Addierers liegt ein vorausgesagter Schätzwert des augenblicklichen Digi­ talsignals xn auf der Grundlage der Folge von vorhergehen­ den Signalen xn-1, xn-2, . . . an. Die Differenz zwischen dem augenblicklichen Signal xn und dem vorausgesagten Signal n erscheint am Ausgang des Addierers 201 und wird dem Quantisierer 203 zugeführt. Dieser vergleicht das Differenzsignal vom Addierer 201 mit einer vorgegebenen Gruppe von Quantisierstufen und erzeugt ein Signal, das der am nächsten liegenden Quantisierstufe entspricht. Das quantisierte Differenzsignal am Ausgang des Quantisierers 203 wird dem Codierer 207 zugeführt, der einen Digitalcode Cn entsprechend der zugeführten Quantisierstufe erzeugt.
Das Ausgangssignal des Codierers 207 ist eine Folge von Digitalcodierungen, die die quantisierte Diffe­ renz zwischen den Sprachsignalabtastwerten und ihren vor­ ausgesagten Werten darstellen. Das quantisierte Differenzsignal am Ausgang des Quantisierers 203 wird außerdem einem Eingang eines Addierers 209 zugeführt, in welchem es mit dem vorausgesagten Abtastwert von einer Voraussageeinrichtung 205 aufsummiert wird. Das Summensignal vom Addierer 209 gelangt an den Eingang der Voraussageeinrichtung 205. Folglich wird das Ausgangssignal der Voraussageeinrichtung so aktualisiert, daß es den vorausgesagten Wert des nächsten Sprachabtastwertsignals xn+1 darstellt.
Eine Schrittgrößen-Generatorschaltung 210 nimmt die Ausgangscodierungen Cn des Codierers 207 auf und liefert darauf ansprechend ein Schrittgrößensignal Δn, um die Stufen im Quantisierer 203 entsprechend der relativen Amplitude von Cn einzustellen. Wenn Cn groß ist, so expandiert das Schrittgrößensignal Δn die Schrittgrößen im Quantisierer 203, wodurch der Quantisierer sich an das Signal hoher Amplitude anpaßt. Kleine Werte von Cn führen zu Schrittgrößen, die zu einer Kontraktion im Quantisierer derart führen, daß er sich an Signale kleiner Amplitude anpaßt. Auf diese Weise wird der Quantisierer an den erwarteten Pegel des Eingangssignals angepaßt. Der Aufbau und die Verwendung von adaptiven und differentiellen Codierern ist erläutert in einem Buch "Digital Processing of Speech Signals" von L. R. Rabiner und R. W. Schafer, veröffentlicht bei Prentice Hall, Unc., Engelwood Cliffs, New. Jersey, Copyright by Bell Telephone Laboratories Inc., 1978.
Alternativ kann der adaptive Codierer 110 einen Mikroprozessor enthalten, beispielsweise einen Mikroprozessor der Firma Motorola vom Typ 68 000, der beschrieben ist in MC 68 000 Design Module User's Guide, Motorola Inc., 1980, und entsprechend einem vorgegebenen Satz von in einem Festwertspeicher abgelegten Befehlen arbeitet.
Der Schrittgrößengenerator 210 in Fig. 2 arbei­ tet entsprechend der Gleichung:
dn = βdn-1 + mCn (1),
um ein Signal dn entsprechend dem Logarithmus der Schritt­ größe unter Ansprechen auf das letzte Ausgangssignal Cn-1 des Codierers 207 zu erzeugen. β ist eine Konstante, die sich auf das Ausscheiden von Fehlern bezieht und bei­ spielsweise beträgt:
β = 1-2-6 (2).
dn-1 ist das vorhergehende logarithmische Schrittgrößen­ signal und m ist ein Faktor zur Einstellung der Schritt­ größe mit Bezug auf den erwarteten dynamischen Bereich des Signals und die Anzahl von Quantisierstufen.
Gemäß Fig. 2 wird das codierte Digitalsignal Cn an den Adresseneingang des Multiplizierer-Faktorgenera­ tors 211 angelegt, der einen bekannten programmierbaren Festwertspeicher (PROM) aufweist, welcher in der Lage ist, ein im voraus zugeordnetes Ausgangssignal mCn für jedes codierte digitale Eingangssignal Cn zu liefern, das an seine Adresseneingänge angelegt wird.
m = logQM (3),
wobei
M = 0,85 für die niedrigsten vier Stufen,
1,2 für die Stufen 5 und 6,
1,6 für die Stufe 7,
2,4 für die Stufe 8 ist und
Q = D1/s.
D ist der dynamische Bereich des Eingangssignals,
xn und s ist die Anzahl von Schrittgrößen.
Das Verzögerungsregister 215 speichert das vor­ hergehende logarithmische Schrittgrößensignal dn-1. Unter Ansprechen auf das Taktsignal CLT vom Taktgenerator 107 für das n-te Eingangssignal wird das Signal dn-1 an die Schiebeeinrichtung 217 und einen Eingang der Subtrahier­ einrichtung 219 gegeben. Die Schiebeeinrichtung 217 schiebt das codierte Signal dn-1 zur Bildung des Signals 2-6dn-1 um sechs Stellen nach rechts und kann eine ver­ drahtete Anordnung aufweisen, um eine Neuzuordnung der Codiersignalbits durchzuführen.
Die Subtrahiereinrichtung 219 nimmt das Signal dn-1 vom Register 215 und das Signal 2-6dn-1 von der Schiebeeinrichtung 217 auf und erzeugt das Differenz­ signal (1-2-6)dn-1. Das Ausgangssignal der Subtrahiereinrich­ tung 219 wird mit Signalen mCn im Addierer 212 aufsummiert, und das sich ergebende Signal dn wird durch einen Takt­ impuls CLT in das Register 215 eingegeben. Das Signal dn im Register 215 stellt den Logarithmus der Codierer- Schrittgröße Δn dar, die dem Quantisierer 203 zugeführt wird. Zur Bildung des Signals Δn wird der Digitalcode dn den Adresseneingängen einer Signalbildungseinrichtung 221 zugeführt. Diese Einrichtung ist ein programmierbarer Festwertspeicher (PROM), in dem eine Tabelle für die Be­ ziehung von dn zu Δn abgelegt ist. Für jedes Adressenein­ gangssignal dn wird das entsprechende Schrittgrößensignal Δn am Ausgang des Festwertspeichers geliefert.
Das logarithmische Schrittgrößensignal dn stellt die Energie der Folge von Sprachabtastwerten xn dar und kann zur Bestimmung von Ruheintervallen im Sprachsignal benutzt werden. Im Gegensatz zu den sprachbetätigten Schaltern und anderen Detektoren für das Vorhandensein eines Sprachsignals ändert sich das logarithmische Schrittgrößensignal mit einer wesentlich höheren Rate als der Silbenrate, ohne Rauschen oder eine Sprachbegrenzung in das sich ergebende codierte Sprachsignal einzuführen. Folglich wird eine Feststellung von Ruheintervallen unter Ansprechen auf Änderungen des logarithmischen Schritt­ größensignals im wesentlichen ohne Einschränkung der Rate erreicht.
Eine Feststellung von Ruheintervallen wird im Ruhedetektor 115 durchgeführt, der genauer in Fig. 3 darge­ stellt ist. Gemäß Fig. 3 wird das Signal dn vom adaptiven Codierer 110 dem Eingang a eines Größenkomparators 301 und dem Eingang c eines Größenkomparators 305 zugeführt. Der Komparator 305 wird betätigt, wenn das Signal dn un­ ter ein Schwellenwertpegelsignal TH1 abfällt. Der betätig­ te Ausgang des Komparators 305 stellt ein Flipflop 320 über ein ODER-Gatter 315 ein. Im eingestellten Zustand liefert das Flipflop 320 ein eingeschaltetes Signal SF, das anzeigt, daß ein Ruheintervall begonnen hat. Das Signal SF betätigt ein UND-Gatter 310, dem außerdem das Aus­ gangssignal des Komparators 301 zugeführt ist. Das Schwel­ lenwertsignal TH2 am Eingang b des Komparators 301 ent­ spricht dem Pegel für vorhandene Sprache. Wenn das Signal dn das Schwellenwertsignal TH2 übersteigt, wird der Kompa­ rator 301 betätigt. Das Flipflop 320 wird über das UND- Gatter 310 und das ODER-Gatter 315 nur dann zurückgestellt, wenn das logarithmische Schrittgrößensignal dn während eines Ruheintervalls über den Schwellenwert TH2 ansteigt.
Die Schwellenwertsignale TH1 und TH2 können feste Spannungswerte sein, wenn der Dynamikbereich des Ein­ gangssprachsignals durch einen Signalkompressor voreinge­ stellt wird, der zwischen das Mikrophon 101 und die Fil­ ter- und Abtastschaltung 103 in Fig. 1 eingeschaltet ist. Eine solche Kompressionsanordnung verändert jedoch das Sprachsignal, so daß die Spracheigenschaften eines Spre­ chers unnatürlich werden. Demgemäß besteht die Möglich­ keit, daß das wiedergewonnene Sprachmuster nicht so klingt wie der Sprecher. Deshalb wird der normalerweise verwendete Sprachsignalkompressor durch Benutzung eines adaptiven Schwellenwertgenerators 112 in Fig. 1 beseitigt. Der adaptive Schwellenwertgenerator mo­ difiziert die Schwellenwertsignale TH1 und TH2 unter An­ sprechen auf das logarithmische Schrittgrößensignal, wo­ durch die Spracheigenschaften des Sprechers nicht durch die Einrichtungen verändert werden, die für eine Beseiti­ gung der Ruheintervalle erforderlich sind.
Der adaptive Schwellenwertgenerator 112 ist ge­ nauer in Fig. 4 gezeigt. Gemäß Fig. 4 erzeugt ein Pegel­ generator 401 ein voreingestelltes Grenzsignal L, das dem niedrigsten erwarteten logarithmischen Schrittgrößen­ signal entspricht, welches einem aktiven Spracheingangs­ signal für die Schaltung gemäß Fig. 1 zugeordnet ist, so­ wie voreingestellte Pegelsignale HW1 und HW2 entsprechend der normalerweise erwarteten Differenz zwischen dmax und den Ruheschwellenwerten. dmax ist im allgemeinen der Maximalwert in der Folge von Signalen dn vom adaptiven Codierer 110. Ein Register 427 wird zu Anfang auf L ein­ gestellt und speichert das Maximum der logarithmischen Schrittgrößensignale bis zum Abtastwert xn-1. Das Signal dmax vom Register 427 wird im Komparator 403 mit dem augenblicklichen logarithmischen Schrittgrößensignal dn ver­ glichen. Der Komparator wird betätigt, wenn dn größer als dmax ist. Das Betätigungssignal vom Komparator 403 be­ wirkt, daß der Schalter 409 mit drei Zuständen öffnet und der Schalter 405 mit drei Zuständen schließt, wodurch das Signal für dn größer als dmax dem Eingang a des Subtra­ hierers 415 und der Schiebeeinrichtung 412 zugeführt wird. Falls das Signal dmax größer als das Signal dn ist, bleibt der Komparator 403 nicht betätigt, und das Signal dmax vom Register 427 läuft durch den Schalter 409 mit drei Zuständen und wird dem Eingang a des Substrahierers 415 sowie dem Eingang der Schiebeeinrichtung 412 zu­ geführt.
Die Schiebeeinrichtung 412 schiebt ihr Eingangs­ signal um 10 Stellen nach rechts, und der Subtrahierer 415 liefert das Signal
dmax(1-2-10)
an den Eingang b des Komparators 418 und den Eingang eines Schalters 425 mit drei Zuständen. Der Komparator 418 wird betätigt, wenn das ihm zugeführte Grenzsignal L größer als das Ausgangssignal des Subtrahierers 415 ist. In diesem Fall wird der Schalter 420 mit drei Zuständen eingeschaltet und das Grenzsignal L in das Register 427 eingegeben. Wenn das Ausgangssignal des Subtrahierers 415 kleiner als das Grenzsignal L ist, bleibt der Kompa­ rator 418 abgeschaltet. Der Schalter 425 mit drei Zustän­ den wird eingeschaltet, und das Register 427 nimmt das Maximum der logarithmischen Schrittgrößensignale bis zu dem und einschließlich des logarithmischen Schrittgrößen­ signals dn auf.
Das Signal dmax vom Register 427 wird dem Sub­ trahierer 430 zugeführt, der das Signal dmax-HM1 bildet. Dieser Schwellenwert wird entsprechend dem maximalen logarithmischen Schrittgrößensignal dmax abgeändert, der­ art, daß der Ruheschwellenwert adaptiv geändert wird. Der Subtrahierer 440 bildet das Signal
TH2 = dmax-HW2
und der Schwellenwert für vorhandene Sprache wird adaptiv unter Ansprechen auf das maximale logarithmische Schritt­ größensignal abgeändert. Auf diese Weise werden die Ruhe­ intervalle jedes Sprachsignals ohne Änderung der Sprach­ eigenschaften des Sprechers festgestellt.
Das Ausgangssignal SF des Ruhedetektors 115 wird einem Ruhezähler 120 zugeführt, der genauer in Fig. 5 dar­ gestellt ist. Gemäß Fig. 5 gelangt das Signal SF an einen Eingang eines UND-Gatters 505 und an den Eingang eines Inverters 507. Während der normalen Sprache ist das Signal SF abgeschaltet und das Ausgangssignal des Inverters 507 stellt den Zähler 510 auf Null. Bei Beginn eines Ruhe­ intervalls wird das Signal SF betätigt, und Taktsignale CLT durchlaufen das UND-Gatter 505 zum Eingang des Zählers 510. Dieser wird weitergeschaltet, bis das Ende des Ruhe­ intervalls festgestellt ist. Ein Zwischenspeicher 515 wird bei Beendigung des Ruheintervalls betätigt, so daß der Ruheintervall-Zählwert vom Zähler 510 in den Zwischen­ speicher übertragen wird. Der Ruhezählwert SCT vom Zwi­ schenspeicher 515 gelangt an einen Eingang des Codepro­ zessors 125, der außerdem die im adaptiven Codierer 110 erzeugten Codierungen Cn und das Signal SF vom Detektor 115 aufnimmt.
Der Codeprozessor 125 ist in der Lage, eine Nachricht zu erzeugen, die die kombinierten Ausgangs­ codierungen Cn und die Ruheintervallcodierungen umfaßt, und liefert die Nachricht je nach Bedarf an ein Nachrichten­ netzwerk 140. Der Prozessor 125 kann einen Mikroprozessor umfassen, beispielsweise einen Mikroprozessor der Firma Motorola vom Typ 68 000, der beschrieben ist in der oben­ genannten Veröffentlichung "MC 68 000 Design Module User's Guide", 1980. Die Codekombinationen des Prozessors 125 werden entsprechend einer festen Gruppe von Befehlen durchgeführt, die in einem Festwertspeicher (ROM) abge­ legt sind.
Die aus dem Sprachsignal weggelassene Ruhe­ intervalle werden durch einen besonderen Ruhecode SC, ge­ folgt von dem Ruhezählwertsignal SCT vom Ruhezähler 120, dargestellt. Bei der Schaltungsanordnung nach Fig. 1 ist der Ruhecode gewählt als das maximale Ausgangssignal des adaptiven Codierers. Für eine ADPCM-Codeanordnung mit vier Bits ist die maximale Kombination gleich 87₁₆. Die­ ser Code ist wegen der niedrigen Wahrscheinlichkeit für sein Auftreten gewählt worden. Um eine fehlerhafte Anzeige von Ruheintervallen zu vermeiden, muß der maximale Code, der in Cn auftritt, ersetzt werden. Die Codemodifizier­ schaltung 130 gemäß Fig. 1 ersetzt die 87er Codekombination durch eine Kombination 96₁₆, um die Signalverzerrung auf ein Minimum zu bringen.
Die Codemodifizierschaltung ist genauer in Fig. 6 dargestellt. Gemäß Fig. 6 wird das Ausgangssignal des adaptiven Codierers 110 bei jedem Taktimpuls CLT dem Re­ gister 610 zugeführt. Der Code Cn im Register 610 wird normalerweise wieder über den Schalter 615 mit drei Zu­ ständen zum Register 625 gegeben, und der Code Cn-1 im Register 625 erscheint am Ausgang des Schalters 601 mit drei Zuständen. Die Ausgangssignale der Register 610 und 625, die das Paar augenblicklicher Codiersignale darstel­ len, werden im Komparator 635 mit der Codekombination 87₁₆ verglichen. Diese Codierungen werden vom Signalgene­ rator 632 in bekannter Weise geliefert. Bei Feststellung einer Folge 87₁₆ in den Registern 610 und 625 wird der Ausgang des Komparators 635 betätigt und der Ausgang des Inverters 637 abgeschaltet. Unter Ansprechen auf das ab­ geschaltete Signal werden die Schalter 601 und 615 mit drei Zuständen abgeschaltet, während die Schalter 605 und 620 durch das Signal CC betätigt werden. Dadurch wird das Signal 9₁₆ vom Generator 632 in das Register 625 eingege­ ben, und das Signal 6₁₆ vom Generator 632 wird über den Schalter 605 mit drei Zuständen in den Datenstrom einge­ fügt. Das Ausgangssignal des Codemodifizierers 130 wird dann je nach Bedarf geändert.
Das Flußdiagramm in Fig. 7 zeigt die Folge von Operationen, die in der Schaltungsanordnung der Fig. 1 durchgeführt werden, und die Kurvenformen in Fig. 8 geben die Signale und Codierungen an verschiedenen Punkten in der Schaltungsanordnung nach Fig. 1 an. Vor Eintreffen eines Sprachsignals am Mikrophon 101 wird der Ruhezähler 120 auf Null zurückgestellt. Das Signal SF vom Ruhedetek­ tor 115 wird abgeschaltet, und das gespeicherte maximale logarithmische Schrittgrößensignal dmax im Schwellenwert­ generator 112 wird auf Null eingestellt. Diese Operationen sind im Kästchen 701 angegeben. Das Sprachsignal zwischen den Zeitpunkten t₀ und t₁ in der Kurvenform 801 entspricht nicht einem Ruheintervall. Demgemäß ist das sich aus der Sprachkurvenform (Kurvenform 805) ergebende Schrittgrößen­ signal dn größer als das Schwellenwertsignal TH1 der kur­ venform 809. Das Ruhe-Kennzeichensignal SF vom Ruhedetek­ tor 115 wird zurückgestellt, und die Ausgangscodierungen Cn werden über die Codemodifizierschaltung 130 dem Code­ prozessor 125 zugeführt. Diese Codierungen C₁, C₂, . . ., Cn entsprechen normaler Sprache und sind in der Kurvenform 813 angegeben.
Entsprechend Fig. 7 gilt das Kästchen 708 beim Auftreten jedes Codetaktimpulses CLT. Unter Ansprechen auf den Impuls CLT bildet der adaptive Codierer 110 ent­ sprechend Kästchen 710 das nächste adaptive Codiereraus­ gangssignal Cn. Das logarithmische Schrittgrößensignal dn und das Schrittgrößensignal Δn werden im adaptiven Co­ dierer gemäß Kästchen 712 erzeugt, und entsprechend dem Entscheidungskästchen 715 wird das Signal dn mit dem Signal dmax im adaptiven Schwellenwertgenerator 112 vergli­ chen. Falls das logarithmische Schrittgrößensignal dn größer als das Signal dmax ist, so wird das Signal dmax durch das augenblickliche Signal dn ersetzt (Kästchen 718).
Es wird dann das Signal dn im Ruhedetektor 115 geprüft, um festzustellen, ob es kleiner als oder gleich dem unteren Schwellenwertsignal vom Schwellenwertgenerator 112 ist (Entscheidungskästchen 720). Zwischen den Zeit­ punkten t₀ und t₁ in Fig. 8 ist das logarithmische Schrittgrößensignal (Kurvenform 805) größer als das adap­ tive Schwellenwertsignal TH1 (Kurvenform 809), und es wird entsprechend dem Entscheidungskästchen 723 festgestellt, ob das Ruhekennzeichnungssignal SF eingestellt worden ist. Da das Signal SF zwischen den Zeitpunkten t₀ und t₁ nicht betätigt worden ist, wird für jeden Taktimpuls CLT in die­ sem Intervall in das Kästchen 725 eingetreten. Das augen­ blickliche Codesignal Cn wird entsprechend dem Entschei­ dungskästchen 725 im Codemodifizierer 130 als Ruhecode SC geprüft. Wenn das Codesignal Cn dem reservierten Ruhe­ code SC entspricht, so wird Cn in der Modifizierlogik der Schaltung 130 geändert (Kästchen 729). Im anderen Fall wird der unveränderte Code Cn zwecks Übertragung oder Speicherung in den Codeprozessor 125 gegeben.
Wenn der Zeitpunkt t₁ erreicht ist, wird die Arbeitsweise des Codierers abgeändert. Die codierten Si­ gnale Cn, dn und Δn werden entsprechend dem Kästchen 710 und 712 erzeugt, und das Signal dn wird mit dem in der adaptiven Schwellenwertschaltung 112 gespeicherten Signal dmax verglichen (Entscheidungskästchen 715). Zum Zeit­ punkt t₁ ist jedoch das Signal dn kleiner als das adaptive Schwellenwertsignal TH1, so daß über das Entscheidungs­ kästchen 720 in das Kästchen 735 zur Einstellung des Ruhe­ kennzeichens eingetreten wird. Im Ruhedetektor 115 wird das Signal SF bestätigt, und der Ruhezähler 120 wird ent­ sprechend dem Kästchen 738 weitergeschaltet. Dann tritt man in das Wertekästchen 708 ein, um einen Taktimpuls CL für den nächsten Sprachsignalcode festzustellen.
Zwischen den Zeitpunkten t₁ und t₂ ist das lo­ garithmische Schrittgrößensignal dn kleiner als das Schwellenwertsignal TH2. Folglich wird über das Kästchen 735 zur Einstellung des Ruhekennzeichens oder über die Entscheidungskästchen 723 und 740 in das Kästchen 738 zur Weiterschaltung des Ruhezählers eingetreten, so daß ent­ sprechend dem Kästchen 738 das Ruheintervall weiterhin zeitlich bestimmt wird. Wenn der Zeitpunkt t₂ erreicht ist, übersteigt das logarithmische Schrittgrößensignal dn entsprechend dem Entscheidungskästchen 740 das Schwellenwertsignal TH2 für vorhandene Sprache. Das Käst­ chen 742 für die Ruhekennzeichen-Rückstellung wird über einen Weg aktiviert, der die Entscheidungskästchen 720, 723 und 740 enthält. Das Ruheintervallsignal SF im Detek­ tor 115 wird zurückgestellt, um das Ruheintervall zu be­ enden. Die Ruhe-Anfangssignale (SC=87₁₆) und das Ruhe­ zählsignal (SCT) werden im Codeprozessor 125 unter An­ sprechen auf die Rückstellung des Signals SF erzeugt (Kästchen 744). Gemäß Kästchen 746 wird dann der Ruhezäh­ ler auf 0 zurückgestellt. Der augenblickliche Code Cn wird nach der Ruhecodeprüfung und der Abänderungsfolge der Kästchen 725 und 729 in der Modizifierschaltung 130 in den Codeprozessor 125 eingegeben.
Der Ruhecode SC und der Ruhezählwert SCT werden in den im Codeprozessor 125 gespeicherten Datenstrom ein­ gegeben, wie in der Kurvenform 813 zwischen den Zeitpunk­ ten t₂ und t₃ angegeben ist. Nachfolgend werden die Codie­ rungen Cn vom Codemodifizierer 130 zum Datenstrom hinzuge­ fügt, da kein weiteres Ruheintervall festgestellt wird. Die Codierungen und der Datenstrom im Prozessor 125 ein­ schließlich des Ruhecode und des Ruhezählwertcode sind in der Kurvenform 815 dargestellt.
Die Schaltungsanordnung gemäß Fig. 1 kann ein Sprachspeichersystem umfassen, bei dem das Netzwerk 140 ein Digitalprozessor ist, der die vom Codeprozessor 125 empfangenen, hinsichtlich der Ruheintervalle editierten Codierungen speichert. Unter Ansprechen auf das Sprach­ signal der Kurvenform 801 wird die in der Kurvenform 815 gezeigte digitale Codefolge in den Prozessor des Netzwerks 140 eingegeben. Entsprechend der Kurvenform 815 wird das Ruheintervall zwischen den Zeitpunkten t₁ und t₂ durch den Ruhecode SC, gefolgt von dem Ruhezählwert SCT, ersetzt. Auf diese Weise werden die Speicheranforderungen für das Netz­ werk 140 wesentlich herabgesetzt.
Die Digitalcodierungen vom Netzwerk 140 werden dem Decoder 150 zugeführt, der ein Abbild des ursprüng­ lich vom Mikrophon 101 gelieferten Sprachmusters ein­ schließlich der Ruheintervalle liefert. Im Decoder 150 werden die adaptiv digitalcodierten Signale dem Eingang eines Ruhecodededektors und Zählers 152 und einer Wähler­ schaltung 160 über ein Schieberegister 151 zugeführt, das eine zuerst eingeschobene Information auch zuerst wieder ausgibt (FIFO von First-In-First-Out). Das Schieberegi­ ster 151 tritt, abhängig von Taktimpulsen CLR vom Gene­ rator 153, in Tätigkeit und gibt die Folge von digital­ codierten Signalen zum Detektor 152 und zum Wähler 160. Der Wähler 160 läßt normalerweise die Codierungen Cn direkt zum adaptiven Decoder 165 zwecks Umwandlung in Sprachabtastwerte durch. Der Decoder 165 kann einen ADPCM- Decoder eines Typs enthalten, der in einem Aufsatz "Adaptive Differential Pulse Code Modulation Coding" von J. R. Boddie et al., in Bell System Technical Journal Band 60, Nr. 7, September 1981, beschrieben ist. Alterna­ tiv kann der Decoder einen Mikroprozessor enthalten, be­ spielsweise den obenerwähnten Mikroprozessor der Firma Motorola vom Typ 68 000, der entsprechend den in einem Fest­ wertspeicher abgelegten Befehlen arbeitet. Bei Feststellung eines Ruhecode in der Detektorschaltung 152 verbindet der Wäh­ ler 160 den Codegenerator 155 mit dem adaptiven Decoder 165. Der Generator 155 erzeugt der Ruhe entsprechende Co­ dierungen Cn für dasjenige Zeitintervall, das in dem Ruhezählwertcode SCT angegeben ist. Das Ruheintervall wird im Ruhezähler 152 gemessen. Auf diese Weise werden die Ruheintervalle wieder in den Codestrom eingefügt. Die Folge von abgetasteten Signalen vom adaptiven Decoder 165 entspricht der ursprünglich codierten Sprachkurvenform einschließlich der Ruheintervalle. Das abgetastete Sprach­ signal wird mittels des Digital-Analogwandlers 170 und des Tiefpaßfilters 175 in analoge Form umgewandelt, und das Sprachmuster wird vom akustischen Wandler 180 erzeugt.
Der Ruhecodedetektor und die Zählerschaltung 152 sind genauer in Fig. 9 dargestellt. Gemäß Fig. 9 wird die adaptiv codierte Signalfolge vom Netzwerk 140 dem Eingang eines vielstufigen Schieberegisters 905 zugeführt. Die Codierungen vom Register 905 werden an Eingänge des Komparators 915 angelegt, in welchem sie mit den im Code­ generator 920 erzeugten Ruhecodierungen 87₁₆ verglichen werden. Bei Feststellung eines Code 87₁₆ vom Schieberegi­ ster 905 wird der Komparator 915 betätigt. Das eingeschal­ tete Signal SL vom Komparator 915 betätigt das UND-Gatter 930, so daß der Zähler 940 auf den Ruhe-Zählwertcode auf der Leitung 927 eingestellt wird. Das betätigte Signal SL bewirkt die Einstellung des Flipflops 925, und dessen Signal SL1 trennt die Leitung 181 vom Eingang des adapti­ ven Decoders 165 ab und verbindet den Ruhecodegenerator 155 mit dem Eingang des adaptiven Decoders. Das Signal SL1 sperrt außerdem das UND-Gatter 156, so daß das FIFO- Schieberegister 151 während der Ruhezählung keine codier­ ten Signale liefert. Die nachfolgenden Taktimpulse CLR schalten den Zählwert des Zählers 940 über das UND-Gatter 935 zurück, bis der Zählwert 0 erreicht ist. Zu diesem Zeitpunkt stellt das Übertragungs-Ausgangssignal des Zählers 940 das Ruheintervall-Flipflop 925 zurück, und das Signal SL1 wird abgeschaltet. Der Wähler 160 verbindet jetzt die Leitung 181 mit dem adaptiven Decoder 165, und der adap­ tive Codestrom vom FIFO-Register 151 wird dem Decoder 165 zugeführt.
Die Folge von Operationen der Decoderschaltung 150 ist im Flußdiagramm gemäß Fig. 10 dargestellt und die sich auf diese Operation beziehenden Kurvenformen sind in Fig. 11 gezeigt. Die Kurvenform 1101 in Fig. 11 er­ läutert eine Folge von adaptiv codierten, vom Netzwerk 140 ankommenden Signalen. Zwischen den Zeitpunkten t₀ und t₁ werden adaptive Digitalcodierungen C₁ bis Cn sequentiell an den Decoder 150 angelegt. Nach dem Code Cn erscheint ein Ruhecoder SC, gefolgt von einem Ruhezählcode SCT im Datenstrom der Kurvenform 1101. Diese beiden Codierungen stellen ein Ruheintervall im Sprachsignal dar. Nach dem Ruheintervall erscheint eine Folge von adaptiven Digital­ codierungen, beginnend mit dem Code Cn+1.
Gemäß Fig. 10 werden entsprechend dem Kästchen 1001 zu Anfang die Register, Flipflops und Zwischenspei­ cher des Decoders 150 zurückgestellt. Beim nächsten Takt­ impuls CLR gelangt man über das Kästchen 1005 "Warten auf Takt" zum Kästchen 1007. Zwischen den Zeitpunkten t₀ und t₁ in Fig. 1 kommen Sprachcodierungen C₁, C₂, . . . , Cn vom Netzwerk 140 an. Für jeden empfangenen Impuls wird ent­ sprechend dem Kästchen 1007 ein Ausgangsabtastwert im De­ coder 165 erzeugt. Entsprechend dem Entscheidungskästchen 1009 wird das Signal SL1 vom Flipflop 925 geprüft. Im Sprachintervall zwischen t₀ und t₁ ist das Signal SL1 nicht eingestellt, und der nächste Eingangscode vom FIFO- Register 151 trifft ein (Kästchen 1020). Da der Eingangs­ code nicht der Ruhecode ist, geht man über das Entschei­ dungskästchen 1025 zum Kästchen 1029 weiter, und der Ein­ gangsabtastwert wird decodiert.
Bei Erreichen des Zeitpunktes t₁ ist der Ein­ gangscode der Ruhecode SC. Dieser wird im Komparator 915 festgestellt, und man gelangt über das Entscheidungskäst­ chen 1025 zum Kästchen 1034. Hier wird der Zähler 940 mit dem Ruhezählwert M (Kurvenform 1107) vom Schieberegister 905 geladen. Der Ruhecodegenerator 155 wird durch das be­ tätigte Signal SL1 (Kurvenform 1105) mit dem Decoder 165 verbunden.
Beim Auftreten des nächsten Taktimpulses CL ge­ langt man über das Entscheidungskästchen 1009 zum Käst­ chen 1040, bei dem der Ruhezähler zurückgeschaltet wird. Der Ruhezählwert ist bis zum Zeitpunkt t₂ größer als 0. Folglich bleibt das Kästchen 1036 über das Kästchen 1025 bestimmend, und die Ruhecodefolge vom Generator 155 wird an den Decoder 165 angelegt. Zum Zeitpunkt t₂ ist der Ruhezählwert auf 0 zurückgeschaltet (Kurvenform 1107), und das Flipflop 925 wird entsprechend dem Kästchen 1044 über das Kästchen 1042 zurückgestellt. Nach dem Zeitpunkt t₂ wird der normale Betrieb mit den Eingangscodierungen über einen Weg wieder aufgenommen, der die Kästchen 1005, 1007, 1009, 1020, 1025 und 1029 enthält. Das Eingangs­ signal des Decoders 165, das in der Kurvenform 1109 dar­ gestellt ist, enthält das Ruheintervall zwischen den Zeitpunkten t₁ und t₂, das unter Ansprechen auf den Code SC und den Ruhezählwertcode in der Kurvenform 1101 wieder­ hergestellt wird.
Die Erfindung ist mit Bezug auf ein bestimmtes Ausführungsbeispiel beschrieben worden. Der Fachmann kann jedoch Abänderungen treffen. Bei­ spielsweise können der hier beschriebene ADPCM-Codierer und -Decodierer durch einen anderen Typ einer bekannten adaptiven Digitalcodier- und -decodieranordnung ersetzt werden, beispielsweise eine adaptive PCM-Anordnung.

Claims (10)

1. Sprachverarbeitungsanlage mit einer Einrichtung (110) zur Umwandlung eines Sprachmusters in eine Folge von adaptiv digitalcodierten Signalen, einer Einrichtung (115) zur Feststellung von Ruheintervallen in dem Sprachmuster, einer Einrichtung (115, 120), die unter Ansprechen auf jedes festgestellte Ruheintervall eine digitalcodierte Signaldarstellung des Ruheintervalls erzeugt, und einer Einrichtung (125), die die adaptiv digitalcodierten Signale und die digitalcodierten Ruheintervall-Signaldarstellungen kombiniert, um ein dem Sprachmuster entsprechendes Digitalsignal zu erzeugen, dadurch gekennzeichet,
daß die Umwandlungseinrichtung eine Einrichtung (210) zur Bildung eines Signals enthält, das der adaptiven Schrittgröße für jedes adaptiv digitalcodierte Signal entspricht, ferner eine Einrichtung (112) zur Erzeugung erster und zweiter Schwellenwertsignale, wobei das zweite Schwellenwertsignal größer als das erste Schwellenwertsignal ist, und
daß die Ruheintervall-Feststelleinrichtung (115) eine Einrichtung (305, 315, 320) aufweist, die unter Ansprechen darauf, daß das der Adaptionsschrittgröße entsprechende Signal unter den ersten Schwellenwert abfällt, ein ein Ruheintervall anzeigendes Signal erzeugt, und
eine Einrichtung (301, 310), die unter gemeinsamem Ansprechen darauf, daß das Ruheintervallsignal vorhanden ist und das der Adaptionsschrittgröße entsprechende Signal das zweite Schwellenwertsignal übersteigt, das Ruheintervallsignal beendet.
2. Sprachverarbeitungsanlage nach Anspruch 1, dadurch gekennzeichnet,
daß die Ruheintervall-Signalerzeugungseinrichtung eine Einrichtung (305) aufweist, die unter Ansprechen darauf, daß das erste Schwellenwertsignal das der Schrittgröße entsprechende Signal übersteigt, ein drittes Signal erzeugt, das das Ruheintervallsignal beginnen läßt, und eine Einrichtung (301), die unter Ansprechen darauf, daß das der Schrittgröße entsprechende Signal das zweite Schwellenwertsignal übersteigt, ein viertes Signal erzeugt, sowie eine Einrichtung (310), die unter gemeinsamem Ansprechen auf das Ruheintervallsignal und das vierte Signal das Ruheintervallsignal beendet.
3. Sprachverarbeitungsanlage nach Anspruch 1 oder 2, dadurch gekennzeichnet,
daß die Einrichtung zur Bildung des der Adaptionsschrittgröße entsprechenden Signals eine Einrichtung (211, 212, 215, 217, 219) zur Bildung eines Signals aufweist, das den Logarithmus der Schrittgröße für jedes adaptiv digitalcodierte Signal darstellt.
4. Sprachverarbeitungsanlage nach einem der Ansprüche 1, 2 oder 3, dadurch gekennzeichnet,
daß die Schwellenwert-Signalerzeugungseinrichtung eine Einrichtung (401) zur Erzeugung von Signalen mit einem ersten und einem zweiten vorbestimmten Pegel aufweist, ferner eine Einrichtung (403-425), die unter Ansprechen auf die Folge von der Schrittgröße entsprechenden Signalen ein Signal erzeugt, das das der maximalen Schrittgröße entsprechende Signal in der Folge von der Schrittgröße entsprechenden Signalen darstellt, und eine Einrichtung (430), die unter gemeinsamem Ansprechen auf das der maximalen Schrittgröße entsprechende Signal und das Signal mit dem vorbestimmten ersten Pegel ein adaptives erstes Schwellenwertpegelsignal erzeugt, sowie eine Einrichtung (440), die unter gemeinsamem Ansprechen auf das der maximalen Schrittgröße entsprechende Signal und das Signal mit dem zweiten vorbestimmten Pegel ein adaptives zweites Schwellenwertpegelsignal erzeugt.
5. Sprachverarbeitungsanlage nach einem der vorhergehenden Ansprüche, gekennzeichnet durch eine Einrichtung (140), die unter Ansprechen auf die adaptiv digitalcodierten Signale und die codierten Ruheintervallsignale eine die Sprache darstellende digitalcodierte Signalfolge speichert.
6. Sprachverarbeitungsanlage nach Anspruch 5, gekennzeichnet durch eine Einrichtung (150), die unter Ansprechen auf die gespeicherte, digitalcodierte Signalfolge das der Sprache entsprechende Sprachmuster aufbaut.
7. Verfahren zur Verarbeitung von Sprache mit den Schritten:
Umwandeln eines Sprachmusters in eine Folge von adaptiv digitalcodierten Signalen,
Feststellen von Ruheintervallen im Sprachmuster,
Erzeugen einer digitalcodierten Signaldarstellung jedes festgestellten Ruheintervalls und
Kombinieren der adaptiv digitalcodierten Signale sowie der ein Ruheintervall darstellenden, codierten Signale zur Bildung eines das Sprachmuster darstellenden Digitalsignals,
dadurch gekennzeichnet,
daß der Sprachmuster-Umwandlungsschritt die Bildung eines der Adaptionsschrittgröße entsprechenden Signals für jedes adaptiv digitalcodierte Signal und die Erzeugung erster und zweiter Schwellenwertsignale umfaßt, wobei das zweite Schwellenwertsignal größer als das erste Schwellenwertsignal ist und
daß der Ruheintervall-Feststellschritt die Erzeugung eines das Ruheintervall anzeigenden Signals unter Ansprechen darauf umfaßt, daß das der Adaptionsschrittgröße entsprechende Signal unter das erste Schwellenwertsignal abfällt, sowie die Beendigung des Ruheintervallsignals unter Ansprechen darauf, daß das Ruheintervallsignal vorhanden ist und das der Adaptionsschrittgröße entsprechende Signal das zweite Schwellenwertsignal übersteigt.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß der Verfahrensschritt zur Erzeugung des Ruheintervallsignals die Erzeugung eines dritten Signals unter Ansprechen darauf, daß das erste Schwellenwertsignal das der Schrittgröße entsprechende Signal übersteigt, umfaßt, sowie die anfängliche Erzeugung des Ruheintervallsignals unter Ansprechen auf das dritte Signal, die Erzeugung eines vierten Signals unter Ansprechen darauf, daß das der Schrittgröße entsprechende Signal das zweite Schwellenwertsignal übersteigt, und Beendigung des Ruheintervallsignals unter gemeinsamem Ansprechen auf das Ruheintervallsignal und das vierte Signal.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß die Bildung des der Adaptionsschrittgröße entsprechenden Signals die Bildung eines Signals umfaßt, das den Logarithmus der Schrittgröße für jedes adaptiv digitalcodierte Signal darstellt.
10. Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, daß der Verfahrensschritt zur Erzeugung der Schwellenwertsignale die Erzeugung erster und zweiter Signale mit einem vorbestimmten Pegel umfaßt, ferner die Erzeugung eines Signals, das das der maximalen Schrittgröße entsprechende Signal in der Folge von der Schrittgröße entsprechenden Signalen darstellt, die Erzeugung eines ersten adaptiven Schwellenwertsignals unter gemeinsamem Ansprechen auf das der maximalen Schrittgröße entsprechende Signal und das erste Signal mit vorbestimmtem Pegel, und die Erzeugung eines adaptiven Schwellenwertsignals mit zweitem Pegel unter Ansprechen auf das der maximalen Schrittgröße entsprechende Signal und das zweite Signal mit vorbestimmtem Pegel.
DE19833302503 1982-01-27 1983-01-26 Anlage und verfahren zur sprachverarbeitung Granted DE3302503A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/343,238 US4449190A (en) 1982-01-27 1982-01-27 Silence editing speech processor

Publications (2)

Publication Number Publication Date
DE3302503A1 DE3302503A1 (de) 1983-08-04
DE3302503C2 true DE3302503C2 (de) 1992-12-17

Family

ID=23345266

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19833302503 Granted DE3302503A1 (de) 1982-01-27 1983-01-26 Anlage und verfahren zur sprachverarbeitung

Country Status (4)

Country Link
US (1) US4449190A (de)
CA (1) CA1181857A (de)
DE (1) DE3302503A1 (de)
FR (1) FR2520539B1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19581756T1 (de) * 1994-09-30 1997-10-02 Motorola Inc Verfahren und Vorrichtung zur Erkennung einer Grenze zwischen Tönen in einer kontinuierlichen Sprache

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58197918A (ja) * 1982-05-14 1983-11-17 Nec Corp 適応差分復号器
FR2545301B1 (fr) * 1983-04-29 1986-07-25 Telephonie Ind Commerciale Procede de compression-decompression d'un signal de type vocal
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
US4697209A (en) * 1984-04-26 1987-09-29 A. C. Nielsen Company Methods and apparatus for automatically identifying programs viewed or recorded
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
DE3425026A1 (de) * 1984-07-06 1986-02-06 Siemens AG, 1000 Berlin und 8000 München Verfahren zur abspeicherung von in sprachinformationen auftretenden sprachpausen
US4588979A (en) * 1984-10-05 1986-05-13 Dbx, Inc. Analog-to-digital converter
US4630302A (en) * 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US5023911A (en) * 1986-01-10 1991-06-11 Motorola, Inc. Word spotting in a speech recognition system without predetermined endpoint detection
EP0238075B1 (de) * 1986-03-18 1991-08-21 Siemens Aktiengesellschaft Verfahren zur Unterscheidung von Sprachsignalen von Signalen geräuschfreier oder geräuschbehafteter Sprachpausen
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
EP0537804B1 (de) * 1987-01-16 1997-07-23 Sharp Kabushiki Kaisha Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
DE3850885D1 (de) * 1987-10-09 1994-09-01 Sound Entertainment Inc Spracherzeugung aus digital gespeicherten koartikulierten sprachsegmenten.
JP2551050B2 (ja) * 1987-11-13 1996-11-06 ソニー株式会社 有音無音判定回路
JPH04285765A (ja) * 1991-03-13 1992-10-09 Casio Comput Co Ltd デジタルレコーダ
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
CA2080862C (en) * 1991-12-19 1996-11-26 Priya Jakatdar Recognizer for recognizing voice messages in pulse code modulated format
FR2686183A1 (fr) * 1992-01-15 1993-07-16 Idms Sa Systeme de numerisation d'un signal audio, procede et dispositif de mise en óoeuvre pour constituer une base de donnees numeriques.
EP0652560A4 (de) * 1993-04-21 1996-05-01 Advance Kk Gerät zur aufzeichnung und wiedergabe von stimme.
US5675778A (en) * 1993-10-04 1997-10-07 Fostex Corporation Of America Method and apparatus for audio editing incorporating visual comparison
US5642464A (en) * 1995-05-03 1997-06-24 Northern Telecom Limited Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
CN1202676C (zh) 1995-12-07 2005-05-18 皇家菲利浦电子有限公司 一种用于对数字式通用盘设备和多路复现装置之间的非pcm位流编码,传送和解码的方法和设备
US5890109A (en) * 1996-03-28 1999-03-30 Intel Corporation Re-initializing adaptive parameters for encoding audio signals
FR2758676A1 (fr) * 1997-01-21 1998-07-24 Philips Electronics Nv Methode de reduction des clics dans un systeme de transmission de donnees
JP2000269821A (ja) * 1999-03-18 2000-09-29 Oki Micro Design Co Ltd 予測符号化信号復号化装置及び雑音除去方法
GB9912577D0 (en) * 1999-05-28 1999-07-28 Mitel Corp Method of detecting silence in a packetized voice stream
US6801894B2 (en) * 2000-03-23 2004-10-05 Oki Electric Industry Co., Ltd. Speech synthesizer that interrupts audio output to provide pause/silence between words
US7673223B2 (en) * 2001-06-15 2010-03-02 Qualcomm Incorporated Node processors for use in parity check decoders
US7072828B2 (en) * 2002-05-13 2006-07-04 Avaya Technology Corp. Apparatus and method for improved voice activity detection
US6957375B2 (en) * 2003-02-26 2005-10-18 Flarion Technologies, Inc. Method and apparatus for performing low-density parity-check (LDPC) code operations using a multi-level permutation
US20040225494A1 (en) * 2003-05-07 2004-11-11 Mayginnes Kevin B. Mitigation of interference on digital voice channels
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
GB0414420D0 (en) * 2004-06-28 2004-07-28 Cambridge Silicon Radio Ltd Speech activity detection
GB2416955B (en) * 2004-07-28 2009-03-18 Vodafone Plc Conference calls in mobile networks
US8411709B1 (en) 2006-11-27 2013-04-02 Marvell International Ltd. Use of previously buffered state information to decode in an hybrid automatic repeat request (H-ARQ) transmission mode
US8897393B1 (en) 2007-10-16 2014-11-25 Marvell International Ltd. Protected codebook selection at receiver for transmit beamforming
US8542725B1 (en) 2007-11-14 2013-09-24 Marvell International Ltd. Decision feedback equalization for signals having unequally distributed patterns
US8565325B1 (en) 2008-03-18 2013-10-22 Marvell International Ltd. Wireless device communication in the 60GHz band
US8761261B1 (en) 2008-07-29 2014-06-24 Marvell International Ltd. Encoding using motion vectors
US8498342B1 (en) 2008-07-29 2013-07-30 Marvell International Ltd. Deblocking filtering
US8345533B1 (en) 2008-08-18 2013-01-01 Marvell International Ltd. Frame synchronization techniques
US8681893B1 (en) 2008-10-08 2014-03-25 Marvell International Ltd. Generating pulses using a look-up table
US8520771B1 (en) 2009-04-29 2013-08-27 Marvell International Ltd. WCDMA modulation
US8817771B1 (en) 2010-07-16 2014-08-26 Marvell International Ltd. Method and apparatus for detecting a boundary of a data frame in a communication network
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
US10832005B1 (en) 2013-11-21 2020-11-10 Soundhound, Inc. Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4053712A (en) * 1976-08-24 1977-10-11 The United States Of America As Represented By The Secretary Of The Army Adaptive digital coder and decoder
US4280192A (en) * 1977-01-07 1981-07-21 Moll Edward W Minimum space digital storage of analog information
US4272810A (en) * 1978-12-21 1981-06-09 Bell Telephone Laboratories, Incorporated Arrangement for deleting trailing message portions
US4484344A (en) * 1982-03-01 1984-11-20 Rockwell International Corporation Voice operated switch

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19581756T1 (de) * 1994-09-30 1997-10-02 Motorola Inc Verfahren und Vorrichtung zur Erkennung einer Grenze zwischen Tönen in einer kontinuierlichen Sprache

Also Published As

Publication number Publication date
DE3302503A1 (de) 1983-08-04
FR2520539B1 (fr) 1986-07-04
CA1181857A (en) 1985-01-29
FR2520539A1 (fr) 1983-07-29
US4449190A (en) 1984-05-15

Similar Documents

Publication Publication Date Title
DE3302503C2 (de)
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE69534285T3 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE2934489C2 (de)
DE69628972T2 (de) MPEG Audio Dekoder
DE3009677A1 (de) Verfahren zur erkennung von sprache und sprachpausen
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
DE3883519T2 (de) Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE3784942T2 (de) Duplex-datenuebertragung.
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
EP0287578B1 (de) Digitales codierverfahren
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE9006717U1 (de) Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
DE2551632A1 (de) Verfahren und vorrichtung zum synthetisieren einer natuerlich klingenden sprache
DE69127134T2 (de) Sprachkodierer
DE69822085T2 (de) Änderung der Sprachabspielgeschwindigkeit mittels Wavelet-Kodierung
DE3785189T2 (de) Verfahren und Einrichtung zur Veränderung von Sprachgeschwindigkeit.
DE69937140T2 (de) Adaptive bit-zuordnung für audio-kodierer
EP0635177B1 (de) Verfahren zum übertragen und/oder speichern digitalisierter, datenreduzierter audiosignale
DE3329779C2 (de) Verfahren und Schaltungsanordnung zur Herstellung von Konferenzverbindungen in einem Vermittlungssystem
DE3788874T2 (de) Verfahren zum Schützen der Integrität von kodierten Signalen.
AT403969B (de) Verfahren zur kompression eines analogen signals
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE3685520T2 (de) Kodier- und uebertragungseinrichtung zur ausfuehrung einer kodierung mit adaptiver quantisierung.

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: AT & T TECHNOLOGIES, INC., NEW YORK, N.Y., US

8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: BLUMBACH, KRAMER & PARTNER, 65193 WIESBADEN