DE2623025A1 - Verfahren und schalteinrichtung zur analyse eines signals - Google Patents

Verfahren und schalteinrichtung zur analyse eines signals

Info

Publication number
DE2623025A1
DE2623025A1 DE19762623025 DE2623025A DE2623025A1 DE 2623025 A1 DE2623025 A1 DE 2623025A1 DE 19762623025 DE19762623025 DE 19762623025 DE 2623025 A DE2623025 A DE 2623025A DE 2623025 A1 DE2623025 A1 DE 2623025A1
Authority
DE
Germany
Prior art keywords
signal
speech
threshold level
channel
ptl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19762623025
Other languages
English (en)
Inventor
Alcide Molinari
Federico Vagliani
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telettra Laboratori di Telefonia Elettronica e Radio SpA
Original Assignee
Telettra Laboratori di Telefonia Elettronica e Radio SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telettra Laboratori di Telefonia Elettronica e Radio SpA filed Critical Telettra Laboratori di Telefonia Elettronica e Radio SpA
Publication of DE2623025A1 publication Critical patent/DE2623025A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/17Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
    • H04J3/175Speech activity or inactivity detectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Circuits Of Receivers In General (AREA)
  • Transceivers (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

Anmelder: TELETTRA, Laboratcri di Telefonla Slettronica e Radio, $. ^- B-I 20059 - YIMBRCATE 2623025
Verfahren und Schalteinrichtung zur Analyse eines Signals
Die Erfindung "bezieht sich auf ein Verfahren und eine Schalteinrichtung zur Feststellung des Vorhandenseins und/oder Fehlens eines Nutzsignals (Sprachsignals) in einem einer Fernsprechleitung oder einem Sprachkanal zugeordneten Kanalsignal. Insbesondere bezieht sich die Erfindung auf Einrichtungen zur Analyse eines Signals daraufhin, ob ein Sprachsignal vorhanden ist oder fehlt, wobei derartige Signale bei Interpolationssystemen einer Vielzahl von Sprachkanälen gegeben sind, wobei eine .analyse der Kurzzeitleistung des Kanalsignals durchgeführt und der Analysenwert (im folgenden als Signal "a" bezeichnet) mit einem voreingestellten, konstanten Schwellenwertsignal verglichen wird.
üblicherweise erfolgt die Sprachfeststellung auf diese Weise, nämlich durch Bestimmung der Kurzzeitleistung des Kanalsignals und Vergleichen dieses Wertes mit einem voreingestellten, konstanten Schwellenwert. GemäiB Erfindung kann das Verfahren und die Schalteinrichtung sowohl auf Analogkanalsignale im 300 3400 Hz-Basisband als auch auf Digitaldarstellungen oder -wiedergaben dieser Signale (z.B. durch PCM (Pulszahlmodulation) -Kodierung) , angewendet werden. Sie findet insbesondere Anwendung in Interpolationssystemen, bei denen die Sprachfeststellung bezüglich aller dem System zugeordneten Signale erfolgen muß. 609884/1003
262302b
Das allgemeine Problem der Erhöhung (z.B. Verdoppelung) der Teilnehmerkapazität von Fernsprechleitungen bzw. -Zwischenleitungen fand stets großes Interesse, insbesondere dann, wenn die Kosten für die Leitungen hoch sind. Obgleich verschiedene Interpolationstechniken und -verfahren, allgemein als "Sprachinterpolation" bzw. S.I. bezeichnet, untersucht und realisiert wurden und werden, sind diese Techniken für die Gewährleistung einer einwandfreien Punktion sämtlich von der richtigen Entscheidung darüber abhängig, ob zu einem gegebenen Zeitpunkt ein Sprachsignal auf einem Kanalsignal vorhanden ist oder nicht.
In diesem Zusammenhang ist es wichtig, darauf hinzuweisen, daß die Zwischenleitungsgüte, womit die Sprachqualität nach der Übermittlung definiert wird, von der richtigen Bestimmung des Vorhandenseins oder Fehlens von Sprachsignalen in allen oder einem einzelnen Interpolationssystem zugeordneten Sprachkanälen abhängt. Diese Bestimmung wird immer schwieriger und aufwendiger sein, weil an den Sprachkanälen stets Störsignale auftreten, die nichts mit der Sprach»zu tun haben, welche die einzige Nutzinformation darstellt, die übermittelt werden soll. Wie erwähnt, kann das Kanalsignal, bei dem das Vorhandensein oder Fehlen von Sprachsignalen bestimmt werden soll, ein Basisband-Analogsignal f(t) oder ein Digitalsignal sein, das durch Abgreifen von f(t) im Zeitraum Tc und durch Zählen des Abgriffs entweder linear, wobei ein Signal f (n,Tc) mit gleichen Schritten erzielt wird, oder nach einer vorherigen Unterdrückung^
609884/ 1003
im allgemeinen logarithmisch nach A oder u, wobei ein Signal fA (n,Tc) mit ungleichen Schrittstufen erhalten wird, und schließlich Kodieren der quantisierten Proben mit "bs Bits pro Abgriff (z.B. bs = 8) erzielt wurde, so daß man ein klassisches Pulszählmodulationssignal erhält. Im allgemeinen ist den herkömmlichen Systemen und Vorrichtungen zur Bestimmung oder Peststellung des Vorhandenseins oder Fehlens von Sprachsignalen, auch als Sprachdetektoren bezeichnet, Abkürzung S.D., ein als Nachschwingzeitgenerator (H.T.G. = Hangover Time Generator) bezeichneter Schaltkreis nachgeschaltet, der, da er keinen Teil der Erfindung bildet, nicht näher beschrieben, aber in Fig. 1 dargestellt ist. Der üblichste "Sprachdetektor", ist derzeit die als das T.A.S.I.-System bezeichnete Analog-Technik bekannt (Time Assignment Spee$n Interpolation). Hierbei werden die Sprachpausen ausgenutzt. Ein Blockschaltbild ist in Fig. dargestellt. Das Eingangssignal zu diesem System ist das dem zu prüfenden Sprachkanal CP zugeordnete Kanalsignal f(t), während das endgültige Ausgangssignal UP ein logisches Signal AT ist, das nur die beiden Zustände EIN und AUS besitzen kann, wobei der Zustand EIN dem Vorhandensein von Sprache, bzw. einem aktiven Kanal und AUS dem Pehlen von Sprache, bzw. einem passiven Kanal, entspricht. Ein herkömmlicher Sprachdetektor (S.D.) erfüllt im wesentlichen zwei grundsätzliche Punktionen, nämlich eine Bestimmung der Kurzzeitleistung pe(t) des Kanä.1-signals f(t) und den Vergleich dieses Wertes mit einem voreingestellten konstanten'Schwellenwertpegel ptm. Die Kurzzeitleistung pe(t) des Kanalsignals wird durch den Kurzzeit-
609884/1003
leistungsschätzer S.T.P.E. (Short time power estimator) bestimmt oder geschätzt, der aus zwei in Kaskade geschalteten Blocks "besteht, nämlich aus einer Quadrierstufe (S.E. = square elevator) und einem Tiefpaßfilter als Integrator (L.P.F.I. = Low Pass Filter as Integrator). Das Eingangskanalsignal f(t) wird durch die Übertragungsfunktion T(i) (Fig. 1a) des S.E.
2 quadriert, so daß das Ausgangssignal u = i ist. Das Signal wird dann durch den Tiefpaßfilter-Integrator L.P.F.I. entsprechend gefiltert, wobei letzterer das Signal f (t) am Eingang abnimmt und ein Signal h(t) (Fig. 1b") als Ansprechimpuls liefert, so daß das Ausgangssignal u gleich dem Eingangssignal i, beaufschlagt mit h ist. Die so erhaltene Kurzzeitleistungs-Schätzung pe(t) wird dann durch einen Leistungskomparator (P.C.) mit einem Schwellenwertpegel ptm verglichen, wodurch das gewünschte logische Signal AT (pe> ptm ergibt AT=EIIT; pe <ptm ergibt AT=AUS) geliefert wird. Beispielsweise kann die Schwellenwertleistung ptm auf etwa -40 dBmO eingestellt sein, und die Zeitkonstante t des Tiefpaßfilters kann zwischen 5 und 50 ms variieren (der Wert von -40 dBmO beruht auf einer CCITT-Empfehlung, die diesen Grenzwert für das Geräusch- oder Störsignal auf Fernsprechleitungen vorschreibt).
Die vorstehend beschriebenen, bekannten Einrichtungen werfen gewisse Schwierigkeiten auf, die nachfolgend nach der Definition der verschiedenen Auswertungsparameter näher erläutert werden. An dieser Stelle sei erwähnt, daß den bekannten Systemen ein grundsätzlicher Nachteil insofern anhaftet, als diese Systeme zur Unterscheidung zwischen Sprach- und Störsignal
6098 8 4/1003
tatsächlich nur einen Vergleich zwischen der geschätzten Kurzzeitleistung und einem konstanten Schwellenwertpegel anstellen, so daß sie das Anliegen eines Sprachsignals einer vergleichsweise hohen Leistung zuordnen und umgekehrt, was jedoch nicht immer zutrifft. Außerdem kann man darauf hinweisen, daß die "bekannten Systeme das besondere Verhalten des Signals pe(t) in Abhängigkeit von der Zeit in den zwei verschiedenen Zuständen auswerten, wenn Sprach- und Störsignal oder nur Störsignal im Kanalsignal vorhanden sind.
Dagegen zieht die erfindungsgemäße Einrichtung Nutzen aus einigen Besonderheiten des Sprachsignals im Vergleich zu entsprechenden Besonderheiten oder Eigenarten des Störsignals, welche insbesondere sind:
a) Zu erster Annäherung kann das Sprachsignal in verhältnismäßig lange Zeitintervalle (Dauer von 10 - 300 ms) unterteilt werden, die generell als "Sprechsegmente11 und "Nichtsprechsegmente" bezeichnet werden. Während der Sprechsegmente schwingen die Stimmbänder, und der so erzeugte Ton wird anschließend durch die Stimmräume modifiziert, während andererseits während der Mchtsprechsegmente die Stimmbänder nicht stimuliert werden und der Ton durch Luftturbulenzen im Stimmraum erzeugt wird.
Wie später noch deutlicher werden wird, ist es für die Erfindungszwecke wesentlich, daß die Kurzzeitleistung der Sprechsegmente erheblich höher ist als diejenigen der Hichtsprechsegmente.
6 0 9884/1003
262302S
b) Während das gesamte Spraohsignal von schnellen Vorgängen, wie der Schwingung der Stimmbänder und Luftturbulenz im Stimmraum abhängig ist, hängt seine Kurzzeitleistung, häufig als Hüllkurve bezeichnet, von wesentlich langsameren Vorgängen ab, z.B. dem Zustand des Stimmraums (d.h. der Relativposition der verschiedenen Stimmorgane) und der Intensität der Anregung der Stimmbänder.
Zusammenfassend läßt sich sagen, daß die Hüllkurve oder Kurzzeitleistung pe(t) nicht nur in der Bandbreite (0 - 50 Hz) stärker begrenzt ist als das vollständige Sprachsignal (300 3400 Hz), sondern auch sehr stark zeitabhängig variiert. Die Erfindung beruht nun auf der Tatsache, daß die Kurzzeitleistung pe(t) des Sprachsignals sehr stark zeitabhängig variiert, während die Kurzzeitleistung des Hintergrundrauschens praktisch zeitkonstant ist oder nur langsam variiert.
Aufgabe der Erfindung ist damit grundsätzlich die Schaffung einer Schalteinrichtung zur Feststellung des Vorhandenseins oder Fehlens von Sprachsignalen auf einer Fernsprechleitung, wobei diese Einrichtung im Vergleich zu den herkömmlichen Sprachdetektoren wesentlich verbesserte Leistungseigenschaften (Qualität) besitzen soll.
Im Zusammenhang mit dieser Aufgabe bezweckt die Erfindung weiterhin die Schaffung einer betriebsfähigen Einrichtung.
609884/1003
Diese Aufgabe wird "bei einer Einrichtung zur Feststellung des Vorhandenseins oder Fehlens von Sprachsignalen in ein Sprachkanal, wobei 'die Kurzzeitleistung des Kanalsignals abgeschätzt und dieses Schätzsignal (als Signal "a" bezeichnet) mit einem voreingestellten konstanten Schwellenwertpegel ptm verglichen wird, erfindungsgemäß dadurch gelöst, daß die Schwankungen der geschätzten Leistung (a) durch Vergleichen derselben mit einem anderen Signal (b) ausgewertet werden, das streng auf die geschätzte Leistung bezogen ist, und das Signal "a" weiterhin mit einem zweiten, voreingestellten konstanten Schwellenwertpegel ptl verglichen wird, welcher der Bedingung ptm >ptl geaügt.
Im einzelnen werden bei der bevorzugten Äusführungsform der Erfindung die beiden Signale a und b extrahiert. Das Signal a wird mit zwei äußeren konstanten Schwellenwertpegeln ptm und ptl verglichen, (ptm yptl), das Signal a oder b wird mit zwei verschiedenen Faktoren multipliziert und die Ergebnissse dieser Multiplikationen werden getrennt mit dem anderen Signal (b oder a) verglichen, das nicht multipliziert worden ist, wobei die Ergebnisse dieser Vergleiche durch eine Kombinationsschaltung geliefert werden, welche das endgültige logische Signal erzeugt.
Bei einer ersten Ausführungsform der Erfindung besteht das Signal "b" aus dem Signal "a" selbst, nach Verzögerung um Δ t. Bei einer zweiten Ausführungsform ist das Signal b dem Signal a ähnlich, doch wird es durch Integration auf kürzerer Zeit-
609884/1003
basis erhalten. Die Vorrichtung zur Realisierung des erfindungsgemäßen Systems bestehen aus einem Kurzzeitleistungs-Schätzelement S.S.P.E, und einem ersten Komparator zum Vergleichen des von diesem Schätzelement gelieferten Signals mit dem konstanten Schwellenwertpegel ptm und diese Ausführungsform ist gekennzeichnet durch eine Einrichtung zum Extrahieren des Signals (b), durch eine Einrichtung zum Vergleichen des Signals (a) mit einem zweiten konstanten Schwellenwertpegel (ptl), durch eine Einrichtung zum getrennten Multiplizieren des Signals (a) oder (b) mit zwei verschiedenen Faktoren (K und 1/K'), durch eine Einrichtung zum Vergleichen der betreffenden Signale aus den beiden Multiplikationen mit dem nicht multiplizierten Signal (a oder b) und durch eine Einrichtung zur Bildung der Kombinationsschaltung, die an ihrem Ausgang das endgültige logische Signal (AT) liefert.
In einer ersten Ausführungsform der Erfindung besteht das Mittel zum Extrahieren des Signals b einfach aus einer mittels einer Verzögerungsleitung D.L. erreichte Verzögerung At. In einer zweiten Ausführungsform besteht das Mittel zum Extrahieren des Signals b aus einem zweiten Kurzzeitleistungs-Schätzelement der Art des Schätzelements S.T.P.E., das auf kürzeren Integrationszeitbasen arbeitet.
Die erste Version des Sprachdetektors gemäß Erfindung arbeitet nach folgendem Prinzip: Die eine Funktion der Zeit darstellende Kurzzeitleistung pe(t) wird vom Kanalsignal f(t) extrahiert;
609884/1003
die Kurzzeitleistung zum Zeitpunkt t pe(t) wird mit einem Sohwellenwertpegel ptm verglichen, und wenn pe(t)> ptm zutrifft, wird der Kanal als aktiv bestimmt (AT ergibt EIN); pe(t) wird auch mit einem anderen Schwellenwertpegel ptl (ptl < ptm) zusammengesetzt, und wenn pe(t)<ptl zutrifft, wird der Kanal als unbelegt (AT ergibt AUS) bestimmt; schließlich - und dies stellt das speziellste Merkmal der Erfindung dar - wird die Kurzzeitleistung pe(t) zum Zeitpunkt t mit der gleichen Leistung zum Zeitpunkt t -At, d.g. mit pe(t --At), verglichen, und wenn pe(t)> Kpe (t -At) oder pe(t)< 1/K' pe(t -At) zutrifft, wird der Kanal als aktiv oder belegt (AT ergibt EIK-) und im umgekehrten Pail als unbelegt (AT ergibt AUS) definiert; die Größen K und K1 sind dabei Konstanten, die größer als 1 und nicht notwendigerweise gleich sind.
Der Sprachdetektor (S.D.) 1 gemäß Erfindung ist speziell im Blockschaltbild von Pig. 2 dargestellt, das eine bevorzugte, aber die Erfindung nicht einschränkende, sondern nur erläuternde Ausführungsform zeigt. Das Kanalsignal f(t) tritt in das Kurzzeitleistungs-Schätzelement (S.T.P.E.) ein, welches an seinem Ausgang das Leistungssignal zum Zeitpunkt t, pe(t) liefert. Auf einer Leitung 1 gelangt das Signal pe(t) in eine Verzögerungsleitung (D.L.), wobei eine YerzögerungÄ t zu einem Leistungssignal zum Zeitpunkt t -At1, d.h. pe(t -Ät) (Leitung 2) führt. Das Signal pe (t -At) wird an zwei Multipliziererblocks (Leitungen 3 und 4) angelegt und mit K bzw. 1/K1 multipliziert und die multiplizierten Signale (Leitungen 5 und 6)
609884/1003
werden zwei Leistungskomparatoren P.C.1 und P.G.2 eingespeist. Das Signal pe(t) wird ebenfalls (über Leitungen 7, 8, 9 und 10) an Leistungskomparatoren P.G.3, P.G.4, P.C.1 bzw. P.G.2 angelegt. An die beiden Komparatoren P.G.3 und P.C.4 werden dabei auch die beiden Schwellenwertpegel ptm (Leitung 11) und ptl (Leitung 12) angelegt, welche der Bedingung ptm> ptl genügen. Zur Erzielung des endgültigen Signals AT werden die logischen Ausgangssignale der Komparatoren P.C.4, P.G.1 und P.G.2 durch ein ODER-Glied, das seinerseits durch das Ausgangssignal des !Comparators P.G.3 konditioniert wird, miteinander kombiniert.
Ganz allgemein, unverbindlich und lediglich erläuternd kann gesagt werden, daß typische Werte von ptm, ptl, K und Kf jeweils -30 bis -40 dBmO, -40 bis -50 dBmO, 10 - 100 ms, 1,5 8 bzw. 1,5-8 sein können. In diesem Pail koinzidieren die vorher genannten Signale a und b mit pe(t) bzw. pe(t -At)·
Die zweite Version des Sprachdetektors S.D.2 gemäß der Erfindung arbeitet nach folgendem Prinzip: Aus dem Kanalsignal f(t) werden zwei unterschiedliche Kurzzeitleistungen extrahiert, nämlich pes(t) durch Integrieren von f(t) auf vergleichsweise langer Zeitbasis und pef(t) durch Integrieren desselben Signals auf vergleichsweise kurzer Zeitbasis. Im allgemeinen sind die Integrationszeiten für pes(t) 2- bis 8-mal langer als die Integrationszeiten für pef(t). Die "langsame" Kurzzeitleistung pes(t) wird mit einem Schwellenwertpegel ptm verglichen, und
609884/1003
wenn pes(t)> ptm zutrifft, wird der Kanal als aktiv (AT ergibt EIN) definiert, pes(t) wird auch mit einem anderen Schwellenwertpegel ptl (ptl> ptm) verglichen, und wenn pes(t)<ptl zutrifft, wird der Kanal als unbelegt (AT ergibt AUS) bestimmt«- Schließlich wird als erfindungsgemäße Besonderheit die "schnelle" Kurzzeitleistung pef(t) mit der "langsamen" Leistung pes(t) verglichen, und wenn pef(t)> K>pes(t) oder pef(t) O/K1 pes(t) zutrifft, wird der Kanal als aktiv (AT ergibt EIN) oder im um gekehrten Fall als unbelegt (AT ergibt AUS) definiert. Die Größen K und K1 sind (wiederum) größer als 1 und nicht notwendigerweise gleich groß.
Der zweite Sprachdetektor S.D.2 gemäß der Erfindung ist beispielhaft im Blockschaltbild von Fig. 3 dargestellt. Das Kanalsignal f(t) wird dabei an zwei ähnlichen Kurzzeitleistungs-Schätzblöcke angelegt, von denen das "schnelle" Schätzelement S.T.P.E.i1. an seinem Ausgang (Leitung 1) (zum Zeitpunkt t) das Signal pef(t) liefert, während das "langsame" Schätzelement S.T.P.E.S. an seinem Ausgang (Leitung 2) (zum Zeitpunkt t) das Signal pef(t) liefert. Das Signal pes(t) wird (über Leitung 3) an eine Multiplizierschaltung K, an eine Multiplizierschaltung 1/K' (Leitung 4), einen Komparator P.C.4 (Leitung 8) und einen Komparator P.G.3 (Leitung 7) angelegt. Das Signal pef(t) wird (über Leitung 9) dem Komparator P.G.1 und (über Leitung 10) dem Komparator P.G.2 eingegeben. Die Schwellenwertpegel ptm und ptl (ptm ptl) werden über Leitungen 11 und 12 den Komparatoren P.C.4 bzw. P.G.3 eingespeist. Die Ausgangssignale der Multi-
609884/1003
plizierschaltungen K und 1/K1 (Leitungen 5 und 6) werden unmittelbar an die Komparator en P.C.1 "bzw. P.C. 2 angelegt. Zur Erzielung des endgültigen oder gewünschten Signals AT werden die logischen Ausgangssignale der Komparatoren P.G.4, P.G.1 und P.C.2 durch ein ODER-Glied, das seinerseits durch das Ausgangssignal des !Comparators P.G.3 konditioniert wird, miteinander kombiniert.
Wiederum lediglich als erläuterndes Beispiel können typische Werte für ptm, ptl, K und K' jeweils -30 bis -40 dBmO, -50 bis -60 dBmO, 1,5-8 bzw. 1,5-8 sein.
In diesem Pail koinzidieren die vorher genannten Signale a und b mit pes(t) bzw. pef(t).
Bevor ein unmittelbarer Vergleich zwischen dem herkömmlichen Sprachdetektor und den erfindungsgemäßen Sprachdetektoren angestellt wird, sollen einige Größen definiert werden, die ein Maß für das Verhalten der verschiedenen Sprachdetektoren sind:
a) Es kann gesagt werden, daß die Störgeräuschunempfindlichkeit (Noise Immunity) eines Sprachdetektors gleich X dBmO ist, falls dann, wenn am Eingangskanalsignal f(t) nur ein Störsignal liegt, das Ausgangssignal AT des Sprachdetektors nicht in den EIN-Zustand bis hinauf zu einer Stör(signal) leistung von X dBmO übergeht. Je höher die Störunempfindlichkeit ist, umso besser ist der Sprachdetektor.
b) Mit Stellzeit ist das Intervall gemeint, das von dem Zeit-
609884/1003
punkt, an welchem irgendein Sprachsignal auf dem Kanal f(t) eingeleitet wird, bis zu dem Zeitpunkt verstreicht, an dem AT auf EIF übergeht. Je kürzer die Stellzeit ist, umso besser ist der Sprachdetektor.
c) Mit Rückstellzeit ist das Intervall gemeint, das vom Augenblick des Auftretens irgendeines Sprachsignals auf dem Kanal f(t) bis zum Augenblick, an welchem AT auf AUS übergeht, verstreicht. Je kürzer die Rückstellzeit ist, umso besser ist der Sprachdetektor.
d) Der Ausdruck "Qualität" bzw. "Güte" Q bezieht sich auf die Fähigkeit des Sprachdetektors, die Übertragung von "Löchern" (d.h. Unterbrechungen infolge des Übergangs von AT auf AUS) zu vermeiden, während auf dem Kanal f(t) ein Wort oder Satz übermittelt wird.
Da die Güte Q nur subjektiv bewertet werden kann, ist es schwierig, ihre Größe zahlenmäßig auszudrücken. Diese Charakteristik ist jedoch von äußerster Wichtigkeit, weil die Übertragungsunterbrechungen mitten in einem Wort äußerst störend sind. Je besser die Güte Q ist, umso besser ist also auch der Sprachdetektor.
Die überlegenen Leistungen der erfindungsgemäßen Sprachdetektoren im Vergleich zu den herkömmlichen Sprachdetektoren lassen sich wie folgt zusammenfassen:
609884/1003
a) Bei gleicher Störunempfindlichkeit zeigen die Sprachdetektoren S.D.1 und S.D.2 kürzere Stell- und Rückstellzeiten und eine erheblich "bessere Güte Q.
Id) Bei gleicher Güte Q, besitzen die Sprachdetektoren S.D.1 und S.D.2 kürzere Stell- und Rückstellzeiten und eine wesentlich höhere Störunempfindlichkeit (10 - 15 dB).
Bezüglich der Schätzelementblocks S.T.P.E., S.T.P.E.F. und S.T.P.E.S. gemäß den !Pig. 1 bis 3 ist darauf hinzxiweisen, daß die betreffenden Elemente in unterschiedlicher Weise realisierbar sind, je nachdem, ob sie Analogsignale der Art des Signals f(t) oder Digitalsignale der Art f(nTc) und/oder f. (nTc) verarbeiten sollen. Fig. 4a zeigt ein Blockschaltbild, das unterschiedslos für die drei genannten Schätzelemente zutrifft und wobei denen das zu verarbeitende Signal ein Analogoder ein Digitalsignal sein kann.
Der Block 1 kann entweder ein Gleichrichter (R) sein, so daß T[i] mit T1[I] koinzidiert und u = [i] (Pig· 4b), oder aber ein Quadrierelement, so daß T Li] mit T2 [i] koinzidiert und u = i (Pig. 4c).
Der Block 2 ist in jedem Pail vom Tiefpaßfilter-Integratortyp, wobei es sich beim Impuls entweder um einen Rechteckimpuls h^ (t) (Pig. 4d) oder um einen exponentiell abnehmenden Impuls Yi (t) (Fig. 4c) handelt. Die Blöcke S.T.P.E.P. und S.T.P.E.S. unterscheiden sich dabei durch verschiedene Werte der Zeitkonstante t. 609884/1003
Das Blockschaltbild gemäß Pig. 4a gilt auch für die Verarbeitung von Digitalsignalen f(n.Tc) oder f. (n.Tc); in diesem Fall ist auch die Ausgangsleistung pe(nTc) ein Digitalsignal, und die Antwort auf die LPFI-Impulse müssen als Wort h..(nTc) und h?(nTc) angesehen werden.
Die Komparatoren P.C. erhalten analoge oder digitale Eingangssignale in Abhängigkeit davon, ob Signale f(t) oder f(n.Tc) oder f(n.Tc) verarbeitet werden. Auf ähnliche Weise sind auch die Multiplizierschaltungen K und 1/K1 Analog- oder Digital-Multiplizierschaltungen. In jedem Fall sind die Ausgangssignale der Komparatoren logische Signale (EIN und AUS).
609884/1003

Claims (11)

  1. Patentansprüche
    ./Verfahren zur Peststellung des Vorhandenseins oder Fehlens eines Nutzsignals in einem einer Fernsprechleitung oder einem Sprachkanal zugeordneten Kanalsignal, beispielsweise eines Multiplex- bzw. Interpolationssystems mit mehreren Sprachkanälen, wobei eine Bestimmung der Kanalsignal-Kurzzeitleistung vorgenommen und der Schätzwert (als Signal "a" bezeichnet) mit einem voreingestellten konstanten Schwellenwertpegel (ptm) verglichen \tfird, dadurch gekennzeichnet, daß die Änderungen des Schätzwertes a durch Vergleichen desselben mit einem anderen, streng auf die geschätzte Leistung bezogenen Signal b ausgewertet werden und das Signal a weiterhin mit einem zweiten konstanten, voreingestellten Schwellenwertpegel (ptl) verglichen wird, welcher der Bedingung ptm > ptl genügt, und daß die Yergleichs-Ergebnisse in einer geeigneten Kombinationsschaltung verarbeitet werden, die an ihrem Ausgang das endgültige logische Signal liefert, welches dem Vorhandensein oder I'ehlen des Sprachsignals im Sprachkanal entspricht.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Sprachsignal ein Analogsignal (f(t)) im 300 - 3400 Hz-Basisband oder eine Digitaldarstellung davon (z.B.'Impulszählmodulation-Kodierung)ist.
  3. 3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß das Signal (b) durch Verzögerung des Signals (a) um eine
    609 8 8 4/1003
    Differenzzeit At erhalten wird.
  4. 4. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß das Signal (Td) seist ein Schätzwert wie das Signal (a) ist, aber durch Integration auf kürzerer Zeitbasis erhalten worden ist.
  5. 5. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das Signal (a) und/oder das Signal (b) mit zwei verschiedenen Faktoren K bzw. 1/K'multipliziert werden.
  6. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die von den beiden Multiplikationsvorgänge erhaltenen Signale in zwei getrennten Komparatoren mit dem jeweils anderen Signal nicht multiplizierten (a oder b), verglichen werden.
  7. 7. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß alle von den Komparatoren erhaltenen Signale einer ersten logischen Verarbeitungsstufe unterworfen werden, mit Ausnahme des Signals, das beim Vergleich des Signals (a) mit dem niedrigeren Schwellenwertpegel (ptl) erhalten wird.
  8. 8. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das aus der ersten Verarbeitungsstufe erhaltene Signal mit dem durch den Vergleich des Signals
    609884/ 1 003
    (a) mit dem niedrigeren Schwellenwertpegel erhaltenen Signal kombiniert wird, und daß das endgültige logische, das Vorhandensein oder Fehlen eines Sprachsignals anzeigende Signal AT durch diese zweite Verarbeitungsstufe geliefert wird.
  9. 9. Schalteinrichtung zur Realisierung des Verfahrens nach einem der vorangehenden Ansprüche, bestehend aus einem Schätzelement für die Kurzzeitleistung ("a") und einem Komparator zum Vergleichen der geschätzten Leistung mit einem voreingestellten konstanten Schwellenwertpegel (ptm), gekennzeichnet durch eine Einrichtung zum Extrahieren des Signals (b), durch eine Einrichtung zum Vergleichen des Signals (a) mit einem zweiten konstanten Schwellenwertpegel (ptl), durch eine Einrichtung zum getrennten Multiplizieren des Signals (a) oder (b) mit zwei verschiedenen Faktoren (K und 1/K')> durch eine Einrichtung zum Vergleichen der betreffenden Signale aus den beiden Multiplikationen mit dem nicht multiplizierten Signal (a oder b) und durch eine Einrichtung zur Bildung der Kombinationsschaltung, die an ihrem Ausgang das endgültige logische Signal (AT) liefert.
  10. 10. Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Einrichtung zum Extrahieren des Signals (b) aus einer Verzögerungsleitung oder einem Schieberegister (Verzögerung T) besteht.
    609884/ 1003
  11. 11. Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Einrichtung zum Extrahieren des Signals (b) aus einem zweiten Kurzzeitleistungs-Schätzelement besteht, das auf kürzerer Integrationszeitbasis arbeitet.
    60988 A /1003
DE19762623025 1975-07-03 1976-05-22 Verfahren und schalteinrichtung zur analyse eines signals Withdrawn DE2623025A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT25053/75A IT1044353B (it) 1975-07-03 1975-07-03 Metodo e dispositivo per il rico noscimento della presenza e.o assenza di segnale utile parola parlato su linee foniche canali fonici

Publications (1)

Publication Number Publication Date
DE2623025A1 true DE2623025A1 (de) 1977-01-27

Family

ID=11215547

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762623025 Withdrawn DE2623025A1 (de) 1975-07-03 1976-05-22 Verfahren und schalteinrichtung zur analyse eines signals

Country Status (13)

Country Link
US (1) US4057690A (de)
JP (1) JPS5231606A (de)
BE (1) BE842136A (de)
BR (1) BR7603465A (de)
DE (1) DE2623025A1 (de)
ES (1) ES449486A1 (de)
FR (1) FR2316814A1 (de)
GB (1) GB1491662A (de)
IT (1) IT1044353B (de)
LU (1) LU75069A1 (de)
NL (1) NL7607412A (de)
NO (1) NO146521C (de)
ZA (1) ZA762946B (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3017623A1 (de) * 1980-05-08 1981-11-12 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur verkehrserfassung von aus analogsignalen bestehenden nachrichtenstroemen auf fernmeldeleitungen
DE3244851A1 (de) * 1981-12-03 1983-06-16 Ricoh Co., Ltd. Optisches datenuebertragungssystem
DE3220905C1 (de) * 1982-06-03 1983-12-29 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen
DE2840908C2 (de) * 1978-08-31 1984-07-12 LGZ Landis & Gyr Zug AG, Zug Detektor zur Feststellung der Anwesenheit eines elektrischen Signals
DE3323534C1 (de) * 1983-06-30 1985-02-14 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4351216A (en) * 1979-08-22 1982-09-28 Hamm Russell O Electronic pitch detection for musical instruments
US4314100A (en) * 1980-01-24 1982-02-02 Storage Technology Corporation Data detection circuit for a TASI system
DE3023375C1 (de) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
US4357491A (en) * 1980-09-16 1982-11-02 Northern Telecom Limited Method of and apparatus for detecting speech in a voice channel signal
EP0054365B1 (de) * 1980-12-09 1984-09-12 Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland Spracherkennungssystem
USRE32172E (en) * 1980-12-19 1986-06-03 At&T Bell Laboratories Endpoint detector
US4370521A (en) * 1980-12-19 1983-01-25 Bell Telephone Laboratories, Incorporated Endpoint detector
FR2502374B1 (fr) * 1981-03-18 1986-04-18 Trt Telecom Radio Electr Dispositif de discrimination de la parole
US4531228A (en) * 1981-10-20 1985-07-23 Nissan Motor Company, Limited Speech recognition system for an automotive vehicle
DE3243232A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
US4627091A (en) * 1983-04-01 1986-12-02 Rca Corporation Low-energy-content voice detection apparatus
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
FR2629964B1 (fr) * 1988-04-12 1991-03-08 Telediffusion Fse Procede et dispositif de discrimination de signal
US5065395A (en) * 1990-04-09 1991-11-12 Dsc Communications Corporation Rudimentary digital speech interpolation apparatus and method
US5305422A (en) * 1992-02-28 1994-04-19 Panasonic Technologies, Inc. Method for determining boundaries of isolated words within a speech signal
US5675639A (en) * 1994-10-12 1997-10-07 Intervoice Limited Partnership Voice/noise discriminator
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
EP2107553B1 (de) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Verfahren zur Erkennung einer Unterbrechung einer Sprachausgabe
EP2148325B1 (de) * 2008-07-22 2014-10-01 Nuance Communications, Inc. Verfahren zur Bestimmung der Anwesenheit einer gewollten Signalkomponente
US9537460B2 (en) * 2011-07-22 2017-01-03 Continental Automotive Systems, Inc. Apparatus and method for automatic gain control
WO2013187932A1 (en) 2012-06-10 2013-12-19 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
WO2014039028A1 (en) 2012-09-04 2014-03-13 Nuance Communications, Inc. Formant dependent speech signal enhancement
US9613633B2 (en) 2012-10-30 2017-04-04 Nuance Communications, Inc. Speech enhancement
CN110580913B (zh) * 2019-09-26 2022-03-04 嘉楠明芯(北京)科技有限公司 语音激活检测方法、装置及计算机可读存储介质
CN112382312A (zh) * 2020-09-23 2021-02-19 福建信通慧安科技有限公司 目标探测器及目标探测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3046347A (en) * 1959-02-25 1962-07-24 Bell Telephone Labor Inc Transmission control in a two way communication system
US3712959A (en) * 1969-07-14 1973-01-23 Communications Satellite Corp Method and apparatus for detecting speech signals in the presence of noise
US3878337A (en) * 1970-03-13 1975-04-15 Communications Satellite Corp Device for speech detection independent of amplitude
DE2334459C3 (de) * 1973-07-06 1982-03-25 Siemens AG, 1000 Berlin und 8000 München Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2840908C2 (de) * 1978-08-31 1984-07-12 LGZ Landis & Gyr Zug AG, Zug Detektor zur Feststellung der Anwesenheit eines elektrischen Signals
DE3017623A1 (de) * 1980-05-08 1981-11-12 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur verkehrserfassung von aus analogsignalen bestehenden nachrichtenstroemen auf fernmeldeleitungen
DE3244851A1 (de) * 1981-12-03 1983-06-16 Ricoh Co., Ltd. Optisches datenuebertragungssystem
DE3220905C1 (de) * 1982-06-03 1983-12-29 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen
DE3323534C1 (de) * 1983-06-30 1985-02-14 Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen

Also Published As

Publication number Publication date
NO146521C (no) 1982-10-13
LU75069A1 (de) 1977-01-21
BR7603465A (pt) 1977-07-05
NL7607412A (nl) 1977-01-05
NO146521B (no) 1982-07-05
FR2316814B1 (de) 1982-11-05
NO762317L (de) 1977-01-04
US4057690A (en) 1977-11-08
FR2316814A1 (fr) 1977-01-28
ZA762946B (en) 1977-04-27
ES449486A1 (es) 1977-08-01
BE842136A (fr) 1976-09-16
GB1491662A (en) 1977-11-09
JPS5231606A (en) 1977-03-10
IT1044353B (it) 1980-03-20

Similar Documents

Publication Publication Date Title
DE2623025A1 (de) Verfahren und schalteinrichtung zur analyse eines signals
DE69525836T2 (de) Kodierung und dekodierung eines breitbandigen digitalen informationssignals
EP0066229B1 (de) Verfahren und Anordnung zum Demodulieren von FSK-Signalen
DE69026185T2 (de) Mehrfrequenzsignal-Empfänger und Verfahren zu dessen Erkennung
DE3200895C2 (de) Verfahren und Vorrichtung zum Umwandeln eines ersten Binärwortes in ein zweites Binärwort
DE2558402B2 (de) Digitaler Mehrfrequenzcodesignalempfänger für Fernmelde-, insbesondere Fernsprechvermittlungsanlagen
DE2805478C2 (de) Schaltungsanordnung zur Diskriminierung von Sprachsignalen
DE2433885C3 (de) Vorrichtung zum Synchronisieren der Eingansschaltung eines elektronischen Testinstruments auf zu prüfende Signalfolgen
DE69805771T2 (de) Kanalimpulsantwortschätzung unter verwendung von korrelation mit linienwegnahme
DE69316880T2 (de) Numerische Verstärkungsregelung
DE112014003074T5 (de) Rauschenanalysevorrichtung, elektronisches Gerät und Rauschquellenidentifikationssystem
DE69325087T2 (de) Verfahren zur bildung einer qualitätsmessung für signalburst
DE69614829T2 (de) Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE2811293A1 (de) Verfahren und anordnung zur sprachuebertragung
WO1989003574A1 (en) Digital adaptive transform coding process
DE19523343B4 (de) Vorrichtung zum Messen einer Leckleistung
DE69700274T2 (de) Verfahren und Apparat zur Kodierung eines digitalen Audiosignals
DE3416818C1 (de) Verfahren zur Behandlung von Modem-Signalen
DE69510865T2 (de) Verfahren und Gerät zur Vorverarbeitung eines akustischen Signals vor der Sprachcodierung
DE3831047C2 (de)
DE68911355T2 (de) Verfahren und Einrichtung zur Signalunterscheidung.
DE3739481C2 (de)
DE4431047A1 (de) Verfahren zum Trennen von wiederkehrenden Signalabschnitten aus unterschiedlichen Signalquellen von einem durch Überlagerung entstehenden Summensignal
DE2655598C2 (de) Nachrichtenübertragungsverfahren

Legal Events

Date Code Title Description
8141 Disposal/no request for examination