DE2034623C2 - Verfahren für das Erkennen von Sprachsignalen in Rauschen - Google Patents

Verfahren für das Erkennen von Sprachsignalen in Rauschen

Info

Publication number
DE2034623C2
DE2034623C2 DE2034623A DE2034623A DE2034623C2 DE 2034623 C2 DE2034623 C2 DE 2034623C2 DE 2034623 A DE2034623 A DE 2034623A DE 2034623 A DE2034623 A DE 2034623A DE 2034623 C2 DE2034623 C2 DE 2034623C2
Authority
DE
Germany
Prior art keywords
signal
speech
duration
counter
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE2034623A
Other languages
English (en)
Other versions
DE2034623A1 (de
Inventor
Ettore Washington D.C. Fariello
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Comsat Corp
Original Assignee
Comsat Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Comsat Corp filed Critical Comsat Corp
Publication of DE2034623A1 publication Critical patent/DE2034623A1/de
Application granted granted Critical
Publication of DE2034623C2 publication Critical patent/DE2034623C2/de
Expired legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/204Multiple access
    • H04B7/212Time-division multiple access [TDMA]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/17Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
    • H04J3/175Speech activity or inactivity detectors

Description

2. Vorrichtung zur Durchführung des Verfahrens für das Erkennen von Sprachsignalen in Rauschen gemäß Anspruch 1 mit:
— einer Einrichtung (10) zum Vergleich der Momentanwerte sowohl der Nutzsignale als auch der Rauschsignale mit einem Schwellenwert, dessen Pegel so festgelegt wird, daß er vom Momentanwert des Nutzsignals mit höherer Wahrscheinlichkeit überschritten wird als vom Momentanwert der Rauschsignale, wobei sowohl der Schwellenwert als auch die Signalpegel digital durch positive und negative PCM-Codeworte dargestellt sind;
— einer Einrichtung (12) zum Erzeugen eines Erkennungssignals, sobald ein Amplituden-Abtastwert den Schwellenwert überschreitet;
gekennzeichnet durch eine Einrichtung (14, 26), um aus dem Erkennungssignal ein Übertragungssteuersignal zu erzeugen, dessen Dauer gleich der Dauer eines erkannten Sprachsignals ist oder zur Dauer dieses Signals in einer festlegbaren Beziehung steht, eine vorbestimmte maximale Dauer aber nicht überschreitet
3. Vorrichtung nach Anspruch 2, gekennzeichnet durch
— eine Einrichtung (16, 32), um die Dauer eines Sprachsignals zu messen, indem die während dieser Zeit aufgelaufenen Zeittakte summiert werden;
— eine Einrichtung (18, 34), um die Einrichtung (16, 32) zurückzustellen, sobald die Dauer des Sprachsignals ein vorbestimmtes Maximum erreicht hat;
— eine Einrichtung (20, 22), um die Dauer einer Vergleichsperiode, die mit dem Ende des Sprachsignals beginnt, zu messen, in dem die während dieser Zeitdauer auflaufenden Zeittakte summiert werden;
eine Einrichtung (36), um dann ein Ausgangssignal zu erzeugen, wenn die Dauer der Vergleichsperiode gleich der Dauer der vorangegangenen Signalperiode ist
Die vorliegende Erfindung bezieht sich auf ein Verfahren für das Erkennen eines Sprachsignals in Rauschen nach dem Oberbegriff des Anspruchs 1.
Weiterhin bezieht sich die Erfindung auf eine Vorrichtung zur Durchführung des Verfahrens.
Es ist bereits seit langem bekannt, daß nur während etwa 30%—40% der Dauer eines Gesprächs Sprachsignale vorhanden sind. Die übrige Zeit ist durch Gesprächspausen oder durch Sprachtöne, die zu schwach für eine Unterscheidung bzw. eine Auflösung in Einzeltöne sind, ausgefüllt Um den Wirkungsgrad eines Kommunikationssystems zu steigern, kann man einen Sender in Abhängigkeit von einem Sprachdetektorausgang lediglich bei Anwesenheit von Sprachsignalen mit Sinngehalt einschalten und erreicht damit eine vorteilhafte, erhebliche Energieeinsparung. Dies ist besonders bei der Satelliten-Nachrichtenübertragung von Bedeutung, weil man dadurch die vorhandenen Kanäle besser ausnützen kann. Die meisten bekannten Sprachdetektoren arbeiten vorwiegend analog und nicht digital und messen im allgemeinen den Effektivwert und nicht den Augenblickswert eines Eingangssignals. Beim Überschreiten eines eingestellten Schwellenwertes durch den Effektivwert eines Eingangssignals wird ein Ausgangssignal erzeugt, um die Anwesenheit von Sprache anzuzeigen. Derartige Sprachdetektoren haben zwei erhebliche Nachteile. Erstens vergeht eine verhältnismäßig lange Zeit nach dem Beginn eines Sprachsignais, bis ein Ausgangssignal erzeugt wird. Dies ist eine Folge davon, daß derartige Detektoren ein Integral bilden bzw. eine Speicherfunktion aufweisen, so daß eine bestimmte Zeitdauer erforderlich ist, bis der Effektivwert des Signals den Schwellenwert übersteigt Dadurch wird der Anfangsabschnitt des brauchbaren Signals abgeschnitten und erzeugt einen schroffen Sprachanfang, was in Übertragungssystemen, welche durch den Ausgang des Sprachdetektors getriggert sind, eine unerwünschte Verzerrung verursacht Zweitens muß der Schwellenwert bekannter Sprachdetektoren sehr niedrig eingestellt werden, um auf jedes Sprachsignal mit Sinngehalt anzusprechen und um eine gute Sprachqualität zu erhalten. Auf Grund des niedrigen eingestellten Schwellenwertes triggern häufig herausragende Rauschsignale die Detektoren, wodurch eine weitere Verzerrung in das System eingebracht und die gewünschte Energieeinsparung zum Teil wieder zunichte gemacht wird.
In den US-Patentschriften 34 24 869 und 33 69 080 sind bekannte Verfahren und Vorrichtungen beschrieben, die insbesondere auch dem Inhalt des Oberbegriffes des Anspruches 1 sowie dem soeben abgehandelten Stand der Technik entsprechen. Die dort beschriebenen Verfahren haben die genannten Nachteile.
Der Erfindung liegt demgegenüber die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung so verfügbar zu machen, daß mit deren Hilfe noch dichter an die Sprachsignale herangegangen werden kann, ohne merkbare Qualitätseinbußen hinnehmen zu müssen.
Die Lösung ist in den Merkmalen der vorangestellten
Ansprüche enthalten und die Vorteile lassen sich dadurch erzielen, daß digital die Momentanwerte der Eingangssignale mit einem zweckmäßig gewählten Schwellenwert verglichen werden.
Es wird ein Erkennungssignal gebildet, des die Anwesenheit eines Sprachsignals anzeigt Aus diesem Erkennungssignal wird ein Sende-Steuersignal erzeugt, dessen Dauer der Dauer des Sprachsignals, gegebenenfalls zuzüglich einer zweckmäßig gewählten Überhangzeit, entspricht
Der Sprachdetektor ist gemäß der Erfindung digital aufgebaut Es wurde festgestellt daß Spitzenwerte viel früher nach Beginn eines Sprachsignals auftreten als ein Effektivwert benötigt um einen zweckmäßig eingestellten Schwellenwert zu überschreiten. Es wurde weiter festgestellt daß oberhalb eines bestimmten Pegels die Wahrscheinlichkeit, daß ein Augenblickswert eines Sprachsignals den Mittelwert übersteigt, immer mehr wächst als die Wahrscheinlichkeit, daß ein Augenblickswert für ein Zufallssignal oder ein »weißes", & h. einer Gauß-Verteilung entsprechendes Signal den Mittelwert übersteigt Anders ausgedrückt, treten für gleiche Effektivwerte der Leistung der Sprachsignale und des weißen Rauschens augenblickliche Spitzenspannungen oberhalb eines bestimmten Pegels häufiger für Sprache als für Rauschen auf. Wenn man den Schwellenwert in diesen Bereich legt, verbessert sich die Wirkungsweise bedeutend sowohl in Hinblik auf die Verzögerung der Anzeige als auch in Hinblick auf die Unterdrückung des Rauschens.
Vokale, Umlaute und als Reibelaut gesprochene Konsonanten sind Impulse nahezu periodischr Wellenform, deren Spitzenwerte gruppenweise auftretea Innerhalb dieser Gruppen weisen die Spitzenwerte ungefähr gleichen Zeitabstand auf. Jede Gruppe enthält eine gewisse Anzahl von Spitzen, deren Amplituden entweder kontinuierlich bis zum Ende jeder Tonhöhen-Periode absinken oder im wesentlichen konstant bleiben, je nach der Stimmleistung und der Sprechweise. Des weiteren sind die Spitzen innerhalb jeder Gruppe entsprechend der Spektralverteilung der Sprache voneinander getrennt Deshalb und weil die fCAf-Abtastrate an oder oberhalb der Nyquist-Grenze liegt, wird der digitale Sprachdetektor jedesmal von mehr als einem Abtastwert getriggert
Endkonsonanten sind nicht wie die voranstehend beschriebenen Laute gruppiert, sondern ihre Spitzenwerte weisen im Zeitintervall eine annähernd exponentiell Verteilung auf. Jeder Spitzenwert hat jedoch eine Dauer von einigen ms, und das Abtastsystem tastet jeden Spitzenwert mehr als einmal ab.
Das Rauschen als völliges Zufallsereignis weist nicht die Charakteristika von Sprachlauten auf. Auf sehr hohe Spitzen folgen im allgemeinen solche mit niedriger Amplitude.
Weitere Einzelheiten, Merkmale und Vorteile der vorliegenden Erfindung werden anhand der in den Figuren dargestellten Ausführungsbeispielen näher beschrieben. Es zeigen
F i g. 1 kumulative Verteilungsfunktionen der Sprach- und statischen Rauschsignale,
F i g. 2 ein Blockschaltbild eines digitalen Sprachdetektors gemäß der vorliegenden Erfindung,
F i g. 3 eine schematische Darstellung des Zeitablaufs für die Schaltung gemäß F i g. 2 und
F i g. 4 ein Blockschaltbild einer weiteren Ausführungsform gemäß der Erfindung.
F i g. 1 zeigt eine kumulative Verteilungsfunktion sowohl der Sprachsignale als auch des weißen Rauschens, bei der als Abszissenwerte die Verhältnisse der Momentan- zu den Effektivwerten der Signalpegel in dB und als Ordinatenwerte die Wahrscheinlichkeiten des Auftretens in logaritbmischem Maßstab aufgetragen sind. Aus diesen Kurven ist leicht ersichtlich, daß oberhalb des Werts von ungefähr 4,5 dB die Wahrscheinlichkeit für ein Sprachsignal immer größer als die für das weiße Rauschen wird. Durch die Einstellung eines genügend
ίο hohen Detektorschwellenwertes in dem günstigen Wahrscheinlichkeitsbereich kann daher die Möglichkeit, daß durch ein Rauschsignal getriggert wird, sehr klein gehalten oder unter Umständen sogar vermieden werden. Durch einen Schwellenwert von —25 dBmobeispielsweise kann, verglichen mit einem üblichen Schwellenwert von —40 dBmo herkömmlicher analoger oder Effektivwert-Speicher-Detektoren, in dem erfindungsgemäßen Sprach-Detektor erreicht werden, daß er bei Rauschsignalen mit Effektivwerten von —35 dB nicht triggert, sehr wohl jedoch bei Sprachsignalen mit -45 dB.
Im Blockschaltbild nach F i g. 2 wird der gewählte Schwellenwert einem digitalen Vergleichsschaltkreis 10 eingegeben. Beispielsweise kann der Code für den Schwellenwert aus den letzten 6 bits eines 7-bit-Codewortes in einem PCM-Code mit 128 Abtaststufen bestehen. Dabei liegt der neutrale Punkt oder Null-Spannungspegel zwischen der 63. und 64. Stufe und gleiche Pegel oberhalb oder unterhalb des Nullspannungspegels unterscheiden sich nur durch das erste (Vorzeichen-)bit Dies bedeutet, daß der Schwellenwertcode 011000 der 24. und 103. Stufe entspricht, deren vollständige zugehörige Codeworte lauten: 0011000 und 1011000. Der Schwellenwertcode kann wiederholt in den Vergleichsschaltkreis 10 seriell oder parallel eingegeben oder auch dauernd im Vergleichsschaltkreis 10 gespeichert werden.
Die zweite Eingangsgröße für die Vergleichsschaltung 10 ist das fOf-Codewort jedes Amplitudenabtastwertes und wird dem Ausgang eines fCM-Codierers entnommen.
Die Vergleichsschaltung 10 erzeugt immer dann ein Ausgangssignal, wenn die letzten 6 bits eines codierten Abtastwertes gleich dem gewählten Schwellenwertcode sind oder diesen überschreiten. Dieses Ausgangssignal startet einen Impulsgenerator 12, der seinerseits einen Ausgangsimpuls mit vorbestimmter Minimaldauer erzeugt, die ausreicht, um den Ein-Zustand des endgültigen Detektorausgangssignals während des Auftretens kontinuierlicher Sprachsignale aufrecht zu erhalten. Dadurch wird eine getrennte Triggerung durch jede momentane, den Schwellenwert überschreitende Sprachsignalspitze vermieden. Die Minimaldauer des Ausgangsimpulses des Impulsgenerators 12 wird in Übereinstimmung mit der Frequenz der Sprachsignalspitzen gewählt und ist immer größer als die PCM-Abtastperiode. Der Impulsgenerator 12 wird durch jeden Ausgangsimpuls der Schaltung 10 getriggert und startet die Verzögerung durch jeden Triggerimpuls, so daß bei einer Serie von Impulsen der Vergleichsschaltung 10, die geringeren Abstand als die minimale Ausgangsimpulsdauer des Impulsgenerators 12 aufweisen, der Ausgangsimpuls des letzteren angehoben bleibt
Der Impulsgenerator 12 kann aus einer Anordnung bekannter Schaltungen bestehen wie seriell geschaltete Flipflops mit übersteuertem Setz-Eingang, die von einer vom Zeittakt abgeleiteten Impulsfolge rückstellbar sind. Das Ausgangssignal des Impulsgenerators 12 ist durch
die Rechteckschwingung A des Steuerungsdiagramms gemäß F i g. 3 gekennzeichnet.
Der Ausgangsimpuls des Impulsgenerators 12 wird einem Überhangzeit-Zähler 14 zugeleitet. Darin startet er über ein UND-Gatter 18 einen Zähler 16, stellt einen Zähler 20 und einen Sprach-Dauer-Detektor 22 zurück und sperrt ein NAND-Gatter 24. Nachdem der Rücksetz-Eingang des Binär-Zählers 16 von tief nach hoch gebracht wurde, beginnt dieser den 8-kHz Zeitrastertakt zu zählen, der an seinem Eingang anliegt Der erste Ausgangsimpuls der zweiten Stufe des Zählers 16 setzt das Träger-Steuerungs-Flipflop 26 über die Leitung 28 und der hochgesetzte ^-Ausgang des Flipflops, wie es Rechteckschwingung F von F i g. 33 zeigt, versetzt das Trägersignal des Übertragungssystems in Sendebereitschaft
Man nimmt das Triggersignal für das Träger-Steuerungs-Flipflop 26 von Ausgang der zweiten Stufe des Zählers 16, um ein Durchgehen des Systems zu vermeiden, und erkauft sich damit eine Ansprechverzögerung von 250 μ5, die jedoch im Hinblick auf die Sprachverständlichkeit vernachlässigbar ist Der Zähler 16 erzeugt die in F i g. 3B gezeigten Ausgangsimpulse im Abstand von 10 ms, die über die Leitung 30 einem Sprachdauer-Zähler 32 zugeführt werden. Dieser ist ein aus 4 Flipflops bestehender Binärzähler, dessen in F i g. 3 unterhalb der Schwingung B gezeigten Parallelausgänge die Anzahl der von Zähler 16 empfangenen Impulse wiedergeben. Sobald der Sprachdauer-Zähler 32 von Zähler 16 fünfzehn Impulse empfange hat und sich sein Parallelausgang im Zustand (1111) befindet, dem ein hochgsetzter Signalpegel an allen vier Ausgängen entspricht, wie im ersten Beispiel von F i g. 3 dargestellt ist, wird das Ausgangssignal des Detektors 34 für maximale Überhangzeit, der den Inhalt des Zählers 32 kodiert, heruntergesetzt, wie in F i g. 3C gezeigt Dies stellt am Ausgang des Gatters 18 den tiefen Rücksetzspiegel wieder her, entsprechend den Impulsdiagrammen A, C von F i g. 3, der das Rückstellen des Zählers 16 bewirkt, den Zustand (1111) des Zählers 32 jedoch beläßt
Nach dem Ende des Sprachimpulses und nach Ablauf der Verzögerung des Impulsgenerators 12 (zusammen 200 ms im ersten Beispiel von F i g. 3) geht das Ausgangssigna! von Impulsgenerator 12 auf den tiefen Pegel. Damit verschwindet an einem binärkodierten Dezimalzähler 20 das hochgesetzte Rückstellsignal, worauf dieser die 8-kHz Takte zu zählen beginnt, wie es das Impulsdiagramm D in F i g. 3 zeigt Gleichzeitig verschwindet das Rückstellsignal an einem Sprachdauer-Detektor 22, der nun damit bginnt, die Ausgangsimpulse des Zählers 20 zu zählen, wie es das Impulsdiagramm gerade unterhalb der Wellenform D in F i g. 3 zeigt Der Sprachdauer-Detektor 22 besteht aus einem 4-stufigen Binärzähler genau wie der Sprachdauer-Zähler 32 mit dem Unterschied, daß er sich, während Sprache anliegt, im Rücksetzzustand befindet und während der sonstigen Zeit in Betrieb ist Sowohl die parallelen Ausgänge des Sprachdauer-Zählers 32 als auch des Sprachdauerdetektors 22 werden dem Detektor 36 für die verzögerte Übergangszeit zugeführt Letzterer arbeitet wie ein digitaler Vergleicher, der die beiden Zählerzustände vergleicht und bei Koinzidenz ein Ausgangssignal abgibt, wie es das Impulsdiagramm Fin Fi g. 3 zeigt Dieses Ausgangssignal setzt das Träger-Steuerungs-Flipflop 26 zurück, dessen tiefgesetztes (>Ausgangssignal das Trägersignal abschaltet, um die Übertragung zu beenden.
Der hochgesetzte (^-Ausgang des rückgesetzten Träger-Steuerungs-Flipflops 26 wird dem NAND-Gatter 24 zugeführt, das einen hochgesetzten Rücksetzimpuls erzeugt, sobald der nächste Impuls des Zählers 20 beendet ist, wie in Fig.3G gezeigt. Dieser Rückstellimpuls wird dem Sprachdauerzähler 32 zugeführt, um diesen in den Zustand (0000) zurückzusetzen, was wiederum den Ausgang des Detektors 34 für maximale Überhangzeit hoch und den Ausgang des Detektors 36 für verzögerte Überhangzeit tief setzt.
to Zu diesem Zeitpunkt hat der Schaltkreis einen vollständigen Spracherkennungszyklus durchlaufen und ist bereit, den nächsten Sprachimpuls zu empfangen.
Im ersten Beispiel von F i g. 3 dauert das Sprachsignal, wie es durch den Ausgangsimpuls des Impulsgenerators 12 dargestellt wird, 200 ms und überschreitet damit die maximale Überhangzeit von 150 ms, wie sie vom Schaltkreis 14 erzeugt wird. Unter diesen Bedingungen erreicht der Sprachdauer-Zähler 32 seinen maximalen Zählerstand 15 oder (1111). Nach dem Ende des Sprachsignals erreicht deshalb der Sprachdauer-Detektor 22 den Zustand (1111) bis sein Ausgang mit demjenigen des Sprachdauer-Zählers 32 übereinstimmt, den Detektor 36 für die verzögrte Überhangszeit triggert und den Zyklus beendet Dieserart wird die maximale Überhangzeit von 150 ms gebildet
Im zweiten Beispiel von F i g. 3 ist das Sprachsignal nach 100 ms beendet Während dieser Zeit liefert der Zähler 16 10 Impulse und der Sprachdauer-Zähler 32 erreicht den binären Zustand (1010). Nach dem Ende des Sprachimpulses liefert der Zähler 20 10 Impulse an den Sprachdauer-Detektor 22, dessen binärer Zustand dann ebenfalls (1010) ist Diese Übereinstimmung wird im Detektor 36 für die verzögerte Überhangzeit erkannt, das Träger-Steuerungs-Flipflop 26 zurückgesetzt und
somit die Übertragung beendet Bei diesem Beispiel bewirkt der Schaltkreis 14 eine Überhangzeit, die gleich der Dauer des Sprachsignals ist, da letzteres die maximal zulässigen 150 ms nicht überschreitet
Einzelheiten der verschiedenen Schaltungskomponenten, wie Zähler 16 und 20, Sprachdauerzähler 32 und Detektor 22 werden nicht detailliert beschrieben, da sie allgemein bekannt sind. Das gleiche gilt für die logische NAND-Schaltung 24, die nicht aus einer einzelnen Gatterschaltung bestehen muß, sondern auch aus mehreren bekannten logischen Schaltkreisen zusammengesetzt sein kann.
Eine weitere Ausführungsform zeigt Bild 4. Das Ausgangssignal einer Vergleichsschaltung 10 wird einem Entscheidungsimpulszähler 11 zugeführt Dieser Zähler
so 11 erzeugt nur dann ein Ausgangssignal, wenn er eine festgelegte Anzahl von ungestörten, aufeinanderfolgenden Impulsen von der Schaltung 10 empfangen hat Auf Grund der spezifischen Charakteristik von Sprachsignalen, wie sie vorangehend beschrieben wurde und wegen des zufälligen Auftretens von Rauschsignalen bedeutet dies eine weitere Steigerung der Zuverlässigkeit der Schaltung, indem die Wahrscheinlichkeit, daß zufällige Rauschspitzen ein Sprachsignal vortäuschen, verringert wird Wird beispielsweise der Zähler 11 erst nach 4 empfangenen Impulsen getriggert — diese Anzahl wurde experimentiell als Optimum ermittelt — so wird die Sprachverständlichkeit nur so unwesentlich durch das Abschneiden der ersten vier Impulse verschlechtert, daß der Unterschied nicht wahrgenommen wird.
Der Ausgang des Zählers 11 wird dem Impulsgenerator 12 zugeleitet, dessen Ausgang direkt mit dem Einstelleingang des Träger-Steuerungs-Flip-Flops 26 ge-
koppelt ist. Wahlweise kann auch das Impulsgenerator-Ausgangssignal selbst als das Trägersteuersignal verwendet werden. Eine fest vorgegebene Überhangzeit, vorzugsweise im Bereich von 160 bis 200 ms, kann vom Impulsgenerator 12 abgeleitet werden, wodurch wiederholtes Triggern des Trägers vermieden und der Schaltungsaufwand stark verringert wird.
In dieser Weise kann aus der Beschreibung der beiden erfindungsgemäßen Ausführungsformen ersehen werden, daß verschiedene Änderungen in der Form und in den Einzelheiten möglich sind, ohne daß dadurch von dem vorliegenden Gegenstand der Erfindung abgewichen wird.
Hierzu 4 Blatt Zeichnungen

Claims (1)

PS S-'t Patentansprüche:
1. Verfahren für das Erkennen von Sprachsignalen in Rauschen in der Abfolge der Funktionen:
— Vergleich der Momentanwerte sowohl der Sprachsignale als auch der Rauschsignale mit einem Schwellenwert, dessen Pegel so festgelegt wird, daß er vom Momentanwert des Nutzsignals mit höherer Wahrscheinlichkeit Oberschritten wird als vom Momentanwert der Rauschsignale, wobei sowohl der Schwellenwert als auch die Signalpegel digital durch positive und negative /CM-Codeworte dargestellt werden,
- Erzeugen eines Erkennungssignals, sobald ein Amplituden-Abtastwert den Schwellenwert überschreitet,
gekennzeichnet durch
— ein aus dem Erkennungssignal erzeugtes Übertragungssteuersignal, dessen Dauer gleich der Dauer eines erkannten Sprachsignals ist oder zur Dauer dieses Signals in einer festlegbaren Beziehung steht, jedoch eine vorbestimmte Maximal-Dauer nicht überschreitet
DE2034623A 1969-07-14 1970-07-13 Verfahren für das Erkennen von Sprachsignalen in Rauschen Expired DE2034623C2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US84152869A 1969-07-14 1969-07-14
US1918470A 1970-03-13 1970-03-13

Publications (2)

Publication Number Publication Date
DE2034623A1 DE2034623A1 (de) 1971-04-08
DE2034623C2 true DE2034623C2 (de) 1982-12-09

Family

ID=26691957

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2034623A Expired DE2034623C2 (de) 1969-07-14 1970-07-13 Verfahren für das Erkennen von Sprachsignalen in Rauschen

Country Status (7)

Country Link
US (1) US3712959A (de)
JP (1) JPS5250483B1 (de)
DE (1) DE2034623C2 (de)
FR (1) FR2060544A5 (de)
GB (1) GB1305819A (de)
NL (1) NL173340C (de)
SE (1) SE365922B (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE786256A (fr) * 1971-07-15 1973-01-15 Philips Nv Dispositif de commutation commande par des signaux
FR2157143A5 (de) * 1971-10-19 1973-06-01 Queffeulou Jean Yves
US3864520A (en) * 1972-07-25 1975-02-04 Ford Ind Inc Signal monitoring control apparatus
US3825694A (en) * 1972-10-30 1974-07-23 Cit Alcatel Conversation detector for a telephonic channel concentrator
US3832491A (en) * 1973-02-13 1974-08-27 Communications Satellite Corp Digital voice switch with an adaptive digitally-controlled threshold
US3832493A (en) * 1973-06-18 1974-08-27 Itt Digital speech detector
US3890467A (en) * 1973-11-01 1975-06-17 Communications Satellite Corp Digital voice switch for use with delta modulation
US3882458A (en) * 1974-03-27 1975-05-06 Gen Electric Voice operated switch including apparatus for establishing a variable threshold noise level
IT1014614B (it) * 1974-04-24 1977-04-30 Sits Soc It Telecom Siemens Circuito per rivelare la presenza di attivita in banda fonica in una giunzione telefonica
JPS5154703A (de) * 1974-11-08 1976-05-14 Oki Electric Ind Co Ltd
IT1044353B (it) * 1975-07-03 1980-03-20 Telettra Lab Telefon Metodo e dispositivo per il rico noscimento della presenza e.o assenza di segnale utile parola parlato su linee foniche canali fonici
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
DE2649259C2 (de) * 1976-10-29 1983-06-09 Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zum automatischen Erkennen von gestörter Telefonsprache
US4130739A (en) * 1977-06-09 1978-12-19 International Business Machines Corporation Circuitry for compression of silence in dictation speech recording
US4323730A (en) * 1979-06-13 1982-04-06 Northern Telecom Limited Idle channel noise suppressor for speech encoders
FR2466825A1 (fr) * 1979-09-28 1981-04-10 Thomson Csf Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif
CA1147071A (en) * 1980-09-09 1983-05-24 Northern Telecom Limited Method of and apparatus for detecting speech in a voice channel signal
US4357491A (en) * 1980-09-16 1982-11-02 Northern Telecom Limited Method of and apparatus for detecting speech in a voice channel signal
US4499594A (en) * 1982-06-10 1985-02-12 The Aerospace Corporation Digital to analog converter
US4573188A (en) * 1982-06-10 1986-02-25 The Aerospace Corporation Digital to analog converter
JPH07113840B2 (ja) * 1989-06-29 1995-12-06 三菱電機株式会社 音声検出器
JP2908168B2 (ja) * 1993-03-15 1999-06-21 シャープ株式会社 信号識別回路
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3369080A (en) * 1964-12-16 1968-02-13 Bell Telephone Labor Inc Conference circuit for coded signals permitting conference calls between vocoder and analogue stations
US3424869A (en) * 1965-06-15 1969-01-28 Bell Telephone Labor Inc Digital speech interpolation communication system

Also Published As

Publication number Publication date
NL173340C (nl) 1984-01-02
FR2060544A5 (de) 1971-06-18
NL173340B (nl) 1983-08-01
JPS5250483B1 (de) 1977-12-24
US3712959A (en) 1973-01-23
GB1305819A (de) 1973-02-07
SE365922B (de) 1974-04-01
NL7010412A (de) 1971-01-18
DE2034623A1 (de) 1971-04-08

Similar Documents

Publication Publication Date Title
DE2034623C2 (de) Verfahren für das Erkennen von Sprachsignalen in Rauschen
DE2159575C3 (de) Deltamodulator
EP0025086A2 (de) Verfahren und Anordnung zur Impulsabstandsmessung bei periodischen Impulspaaren
DE2323959C3 (de) Anordnung zur Fernablesung mehrerer Zähler
EP0251028A2 (de) Verfahren zur Übertragung eines Audiosignales
DE2730662A1 (de) Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors
DE2131635A1 (de) Digitale Komprimierschaltung
DE3002960A1 (de) Adaptiver deltamodulator
DE1912981A1 (de) Codierer fuer Pulscodemodulation und differentielle Pulscodemodulation
DE2455584C3 (de) Freisprecheinrichtung
DE2410748C3 (de) Sprachgeschätzter Signalempfänger für Mehrfrequenzsignale
DE2143438A1 (de) Digitaler Schwellwert-Detektor
DE2857329C1 (de) Verfahren und Einrichtung zur Verringerung des Bedarfs der Zahl von uebertragenen Bits bei der UEbertragung von PCM-Information
DE2139918A1 (de) Analog Digital Codierer
DE2110033B2 (de) Sender zum Übertragen von Analogsignalen durch Impulskodemodulation
DE2950160A1 (de) Logarithmischer analog-digital- wandler
DE3621513C2 (de) Verfahren zur Übertragung eines Audiosignales
DE2610834A1 (de) Detektor zur feststellung des spitzenwerts einer veraenderlichen elektrischen groesse
DE2062589C3 (de) Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales
DE3040241A1 (de) Schaltungsanordnung zur messung der daempfung einer uebertragungsstrecke
EP1859560A1 (de) Datenübertragungsverfahren mit pulsbreitenmodulation, sender und empfänger dafür
DE2325364A1 (de) Anordnung zum entdecken eines schwachen nutzsignals in rausch- oder stoersignalen
DE3043727A1 (de) Verfahren zum periodischen wandeln eines digitalwertes in einen analogwert
DE1940082A1 (de) Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine
DE3342739A1 (de) A/d- und d/a-wandlung

Legal Events

Date Code Title Description
8181 Inventor (new situation)

Free format text: FARIELLO, ETTORE, WASHINGTON, D.C., US

D2 Grant after examination