DE2623025A1 - Verfahren und schalteinrichtung zur analyse eines signals - Google Patents
Verfahren und schalteinrichtung zur analyse eines signalsInfo
- Publication number
- DE2623025A1 DE2623025A1 DE19762623025 DE2623025A DE2623025A1 DE 2623025 A1 DE2623025 A1 DE 2623025A1 DE 19762623025 DE19762623025 DE 19762623025 DE 2623025 A DE2623025 A DE 2623025A DE 2623025 A1 DE2623025 A1 DE 2623025A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech
- threshold level
- channel
- ptl
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 20
- 230000010354 integration Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- NANVJYXVUMMBIC-UHFFFAOYSA-N diethyl 2,4,6-trioxoheptanedioate Chemical compound CCOC(=O)C(=O)CC(=O)CC(=O)C(=O)OCC NANVJYXVUMMBIC-UHFFFAOYSA-N 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 230000036039 immunity Effects 0.000 description 4
- 210000001260 vocal cord Anatomy 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001143 conditioned effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 206010019133 Hangover Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J3/00—Time-division multiplex systems
- H04J3/17—Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
- H04J3/175—Speech activity or inactivity detectors
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Time-Division Multiplex Systems (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Circuits Of Receivers In General (AREA)
- Transceivers (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Description
Anmelder: TELETTRA, Laboratcri di Telefonla
Slettronica e Radio, $. ^- B-I
20059 - YIMBRCATE 2623025
Die Erfindung "bezieht sich auf ein Verfahren und eine Schalteinrichtung
zur Feststellung des Vorhandenseins und/oder Fehlens eines Nutzsignals (Sprachsignals) in einem einer Fernsprechleitung
oder einem Sprachkanal zugeordneten Kanalsignal. Insbesondere bezieht sich die Erfindung auf Einrichtungen zur
Analyse eines Signals daraufhin, ob ein Sprachsignal vorhanden ist oder fehlt, wobei derartige Signale bei Interpolationssystemen einer Vielzahl von Sprachkanälen gegeben sind, wobei
eine .analyse der Kurzzeitleistung des Kanalsignals durchgeführt und der Analysenwert (im folgenden als Signal "a" bezeichnet)
mit einem voreingestellten, konstanten Schwellenwertsignal verglichen wird.
üblicherweise erfolgt die Sprachfeststellung auf diese Weise,
nämlich durch Bestimmung der Kurzzeitleistung des Kanalsignals und Vergleichen dieses Wertes mit einem voreingestellten, konstanten
Schwellenwert. GemäiB Erfindung kann das Verfahren und
die Schalteinrichtung sowohl auf Analogkanalsignale im 300 3400 Hz-Basisband als auch auf Digitaldarstellungen oder
-wiedergaben dieser Signale (z.B. durch PCM (Pulszahlmodulation) -Kodierung) , angewendet werden. Sie findet insbesondere
Anwendung in Interpolationssystemen, bei denen die Sprachfeststellung
bezüglich aller dem System zugeordneten Signale erfolgen muß. 609884/1003
262302b
Das allgemeine Problem der Erhöhung (z.B. Verdoppelung) der Teilnehmerkapazität von Fernsprechleitungen bzw. -Zwischenleitungen
fand stets großes Interesse, insbesondere dann, wenn die Kosten für die Leitungen hoch sind. Obgleich verschiedene
Interpolationstechniken und -verfahren, allgemein als "Sprachinterpolation" bzw. S.I. bezeichnet, untersucht
und realisiert wurden und werden, sind diese Techniken für die Gewährleistung einer einwandfreien Punktion sämtlich von
der richtigen Entscheidung darüber abhängig, ob zu einem gegebenen Zeitpunkt ein Sprachsignal auf einem Kanalsignal vorhanden
ist oder nicht.
In diesem Zusammenhang ist es wichtig, darauf hinzuweisen, daß die Zwischenleitungsgüte, womit die Sprachqualität nach der
Übermittlung definiert wird, von der richtigen Bestimmung des Vorhandenseins oder Fehlens von Sprachsignalen in allen oder
einem einzelnen Interpolationssystem zugeordneten Sprachkanälen abhängt. Diese Bestimmung wird immer schwieriger und aufwendiger
sein, weil an den Sprachkanälen stets Störsignale auftreten, die nichts mit der Sprach»zu tun haben, welche die
einzige Nutzinformation darstellt, die übermittelt werden soll. Wie erwähnt, kann das Kanalsignal, bei dem das Vorhandensein
oder Fehlen von Sprachsignalen bestimmt werden soll, ein Basisband-Analogsignal f(t) oder ein Digitalsignal sein, das
durch Abgreifen von f(t) im Zeitraum Tc und durch Zählen des Abgriffs entweder linear, wobei ein Signal f (n,Tc) mit gleichen
Schritten erzielt wird, oder nach einer vorherigen Unterdrückung^
609884/ 1003
im allgemeinen logarithmisch nach A oder u, wobei ein Signal
fA (n,Tc) mit ungleichen Schrittstufen erhalten wird, und
schließlich Kodieren der quantisierten Proben mit "bs Bits pro Abgriff (z.B. bs = 8) erzielt wurde, so daß man ein
klassisches Pulszählmodulationssignal erhält. Im allgemeinen ist den herkömmlichen Systemen und Vorrichtungen zur Bestimmung
oder Peststellung des Vorhandenseins oder Fehlens von Sprachsignalen, auch als Sprachdetektoren bezeichnet, Abkürzung S.D.,
ein als Nachschwingzeitgenerator (H.T.G. = Hangover Time Generator)
bezeichneter Schaltkreis nachgeschaltet, der, da er keinen Teil der Erfindung bildet, nicht näher beschrieben, aber
in Fig. 1 dargestellt ist. Der üblichste "Sprachdetektor", ist derzeit die als das T.A.S.I.-System bezeichnete Analog-Technik
bekannt (Time Assignment Spee$n Interpolation). Hierbei werden die Sprachpausen ausgenutzt. Ein Blockschaltbild ist in Fig.
dargestellt. Das Eingangssignal zu diesem System ist das dem zu prüfenden Sprachkanal CP zugeordnete Kanalsignal f(t),
während das endgültige Ausgangssignal UP ein logisches Signal
AT ist, das nur die beiden Zustände EIN und AUS besitzen kann, wobei der Zustand EIN dem Vorhandensein von Sprache, bzw. einem
aktiven Kanal und AUS dem Pehlen von Sprache, bzw. einem passiven Kanal, entspricht. Ein herkömmlicher Sprachdetektor
(S.D.) erfüllt im wesentlichen zwei grundsätzliche Punktionen, nämlich eine Bestimmung der Kurzzeitleistung pe(t) des Kanä.1-signals
f(t) und den Vergleich dieses Wertes mit einem voreingestellten konstanten'Schwellenwertpegel ptm. Die Kurzzeitleistung
pe(t) des Kanalsignals wird durch den Kurzzeit-
609884/1003
leistungsschätzer S.T.P.E. (Short time power estimator) bestimmt
oder geschätzt, der aus zwei in Kaskade geschalteten Blocks "besteht, nämlich aus einer Quadrierstufe (S.E. = square
elevator) und einem Tiefpaßfilter als Integrator (L.P.F.I. =
Low Pass Filter as Integrator). Das Eingangskanalsignal f(t) wird durch die Übertragungsfunktion T(i) (Fig. 1a) des S.E.
2 quadriert, so daß das Ausgangssignal u = i ist. Das Signal
wird dann durch den Tiefpaßfilter-Integrator L.P.F.I. entsprechend
gefiltert, wobei letzterer das Signal f (t) am Eingang abnimmt und ein Signal h(t) (Fig. 1b") als Ansprechimpuls
liefert, so daß das Ausgangssignal u gleich dem Eingangssignal
i, beaufschlagt mit h ist. Die so erhaltene Kurzzeitleistungs-Schätzung
pe(t) wird dann durch einen Leistungskomparator (P.C.)
mit einem Schwellenwertpegel ptm verglichen, wodurch das gewünschte
logische Signal AT (pe> ptm ergibt AT=EIIT; pe <ptm
ergibt AT=AUS) geliefert wird. Beispielsweise kann die Schwellenwertleistung ptm auf etwa -40 dBmO eingestellt sein, und die
Zeitkonstante t des Tiefpaßfilters kann zwischen 5 und 50 ms variieren (der Wert von -40 dBmO beruht auf einer CCITT-Empfehlung,
die diesen Grenzwert für das Geräusch- oder Störsignal auf Fernsprechleitungen vorschreibt).
Die vorstehend beschriebenen, bekannten Einrichtungen werfen
gewisse Schwierigkeiten auf, die nachfolgend nach der Definition der verschiedenen Auswertungsparameter näher erläutert
werden. An dieser Stelle sei erwähnt, daß den bekannten Systemen ein grundsätzlicher Nachteil insofern anhaftet, als diese
Systeme zur Unterscheidung zwischen Sprach- und Störsignal
6098 8 4/1003
tatsächlich nur einen Vergleich zwischen der geschätzten Kurzzeitleistung
und einem konstanten Schwellenwertpegel anstellen, so daß sie das Anliegen eines Sprachsignals einer vergleichsweise
hohen Leistung zuordnen und umgekehrt, was jedoch nicht immer zutrifft. Außerdem kann man darauf hinweisen, daß die
"bekannten Systeme das besondere Verhalten des Signals pe(t) in Abhängigkeit von der Zeit in den zwei verschiedenen Zuständen
auswerten, wenn Sprach- und Störsignal oder nur Störsignal im Kanalsignal vorhanden sind.
Dagegen zieht die erfindungsgemäße Einrichtung Nutzen aus einigen Besonderheiten des Sprachsignals im Vergleich zu entsprechenden
Besonderheiten oder Eigenarten des Störsignals, welche insbesondere sind:
a) Zu erster Annäherung kann das Sprachsignal in verhältnismäßig lange Zeitintervalle (Dauer von 10 - 300 ms) unterteilt
werden, die generell als "Sprechsegmente11 und "Nichtsprechsegmente"
bezeichnet werden. Während der Sprechsegmente schwingen die Stimmbänder, und der so erzeugte Ton wird anschließend
durch die Stimmräume modifiziert, während andererseits während der Mchtsprechsegmente die Stimmbänder
nicht stimuliert werden und der Ton durch Luftturbulenzen im Stimmraum erzeugt wird.
Wie später noch deutlicher werden wird, ist es für die Erfindungszwecke wesentlich, daß die Kurzzeitleistung der
Sprechsegmente erheblich höher ist als diejenigen der Hichtsprechsegmente.
6 0 9884/1003
262302S
b) Während das gesamte Spraohsignal von schnellen Vorgängen,
wie der Schwingung der Stimmbänder und Luftturbulenz im Stimmraum abhängig ist, hängt seine Kurzzeitleistung, häufig
als Hüllkurve bezeichnet, von wesentlich langsameren Vorgängen ab, z.B. dem Zustand des Stimmraums (d.h. der Relativposition
der verschiedenen Stimmorgane) und der Intensität der Anregung der Stimmbänder.
Zusammenfassend läßt sich sagen, daß die Hüllkurve oder Kurzzeitleistung
pe(t) nicht nur in der Bandbreite (0 - 50 Hz) stärker begrenzt ist als das vollständige Sprachsignal (300 3400
Hz), sondern auch sehr stark zeitabhängig variiert. Die Erfindung beruht nun auf der Tatsache, daß die Kurzzeitleistung
pe(t) des Sprachsignals sehr stark zeitabhängig variiert, während die Kurzzeitleistung des Hintergrundrauschens praktisch
zeitkonstant ist oder nur langsam variiert.
Aufgabe der Erfindung ist damit grundsätzlich die Schaffung einer Schalteinrichtung zur Feststellung des Vorhandenseins
oder Fehlens von Sprachsignalen auf einer Fernsprechleitung, wobei diese Einrichtung im Vergleich zu den herkömmlichen
Sprachdetektoren wesentlich verbesserte Leistungseigenschaften (Qualität) besitzen soll.
Im Zusammenhang mit dieser Aufgabe bezweckt die Erfindung weiterhin
die Schaffung einer betriebsfähigen Einrichtung.
609884/1003
Diese Aufgabe wird "bei einer Einrichtung zur Feststellung des
Vorhandenseins oder Fehlens von Sprachsignalen in ein Sprachkanal, wobei 'die Kurzzeitleistung des Kanalsignals abgeschätzt
und dieses Schätzsignal (als Signal "a" bezeichnet) mit einem
voreingestellten konstanten Schwellenwertpegel ptm verglichen wird, erfindungsgemäß dadurch gelöst, daß die Schwankungen der
geschätzten Leistung (a) durch Vergleichen derselben mit einem anderen Signal (b) ausgewertet werden, das streng auf die
geschätzte Leistung bezogen ist, und das Signal "a" weiterhin
mit einem zweiten, voreingestellten konstanten Schwellenwertpegel ptl verglichen wird, welcher der Bedingung ptm
>ptl geaügt.
Im einzelnen werden bei der bevorzugten Äusführungsform der
Erfindung die beiden Signale a und b extrahiert. Das Signal a wird mit zwei äußeren konstanten Schwellenwertpegeln ptm und
ptl verglichen, (ptm yptl), das Signal a oder b wird mit zwei
verschiedenen Faktoren multipliziert und die Ergebnissse dieser Multiplikationen werden getrennt mit dem anderen Signal (b oder
a) verglichen, das nicht multipliziert worden ist, wobei die Ergebnisse dieser Vergleiche durch eine Kombinationsschaltung
geliefert werden, welche das endgültige logische Signal erzeugt.
Bei einer ersten Ausführungsform der Erfindung besteht das Signal "b" aus dem Signal "a" selbst, nach Verzögerung um Δ t.
Bei einer zweiten Ausführungsform ist das Signal b dem Signal a ähnlich, doch wird es durch Integration auf kürzerer Zeit-
609884/1003
basis erhalten. Die Vorrichtung zur Realisierung des erfindungsgemäßen
Systems bestehen aus einem Kurzzeitleistungs-Schätzelement S.S.P.E, und einem ersten Komparator zum Vergleichen
des von diesem Schätzelement gelieferten Signals mit dem konstanten Schwellenwertpegel ptm und diese Ausführungsform ist gekennzeichnet durch eine Einrichtung zum Extrahieren
des Signals (b), durch eine Einrichtung zum Vergleichen des Signals (a) mit einem zweiten konstanten Schwellenwertpegel
(ptl), durch eine Einrichtung zum getrennten Multiplizieren des Signals (a) oder (b) mit zwei verschiedenen Faktoren
(K und 1/K'), durch eine Einrichtung zum Vergleichen der betreffenden
Signale aus den beiden Multiplikationen mit dem nicht multiplizierten Signal (a oder b) und durch eine Einrichtung
zur Bildung der Kombinationsschaltung, die an ihrem Ausgang das endgültige logische Signal (AT) liefert.
In einer ersten Ausführungsform der Erfindung besteht das Mittel zum Extrahieren des Signals b einfach aus einer mittels
einer Verzögerungsleitung D.L. erreichte Verzögerung At. In einer zweiten Ausführungsform besteht das Mittel zum Extrahieren
des Signals b aus einem zweiten Kurzzeitleistungs-Schätzelement der Art des Schätzelements S.T.P.E., das auf kürzeren Integrationszeitbasen
arbeitet.
Die erste Version des Sprachdetektors gemäß Erfindung arbeitet nach folgendem Prinzip: Die eine Funktion der Zeit darstellende
Kurzzeitleistung pe(t) wird vom Kanalsignal f(t) extrahiert;
609884/1003
die Kurzzeitleistung zum Zeitpunkt t pe(t) wird mit einem Sohwellenwertpegel ptm verglichen, und wenn pe(t)>
ptm zutrifft, wird der Kanal als aktiv bestimmt (AT ergibt EIN); pe(t) wird auch mit einem anderen Schwellenwertpegel ptl (ptl
< ptm) zusammengesetzt, und wenn pe(t)<ptl zutrifft, wird der Kanal als unbelegt (AT ergibt AUS) bestimmt; schließlich - und
dies stellt das speziellste Merkmal der Erfindung dar - wird die Kurzzeitleistung pe(t) zum Zeitpunkt t mit der gleichen
Leistung zum Zeitpunkt t -At, d.g. mit pe(t --At), verglichen,
und wenn pe(t)> Kpe (t -At) oder pe(t)< 1/K' pe(t -At) zutrifft,
wird der Kanal als aktiv oder belegt (AT ergibt EIK-) und im umgekehrten Pail als unbelegt (AT ergibt AUS) definiert;
die Größen K und K1 sind dabei Konstanten, die größer als 1
und nicht notwendigerweise gleich sind.
Der Sprachdetektor (S.D.) 1 gemäß Erfindung ist speziell im Blockschaltbild von Pig. 2 dargestellt, das eine bevorzugte,
aber die Erfindung nicht einschränkende, sondern nur erläuternde Ausführungsform zeigt. Das Kanalsignal f(t) tritt in
das Kurzzeitleistungs-Schätzelement (S.T.P.E.) ein, welches
an seinem Ausgang das Leistungssignal zum Zeitpunkt t, pe(t) liefert. Auf einer Leitung 1 gelangt das Signal pe(t) in eine
Verzögerungsleitung (D.L.), wobei eine YerzögerungÄ t zu einem
Leistungssignal zum Zeitpunkt t -At1, d.h. pe(t -Ät) (Leitung
2) führt. Das Signal pe (t -At) wird an zwei Multipliziererblocks (Leitungen 3 und 4) angelegt und mit K bzw. 1/K1 multipliziert
und die multiplizierten Signale (Leitungen 5 und 6)
609884/1003
werden zwei Leistungskomparatoren P.C.1 und P.G.2 eingespeist.
Das Signal pe(t) wird ebenfalls (über Leitungen 7, 8, 9 und 10) an Leistungskomparatoren P.G.3, P.G.4, P.C.1 bzw. P.G.2
angelegt. An die beiden Komparatoren P.G.3 und P.C.4 werden
dabei auch die beiden Schwellenwertpegel ptm (Leitung 11) und
ptl (Leitung 12) angelegt, welche der Bedingung ptm> ptl genügen.
Zur Erzielung des endgültigen Signals AT werden die logischen Ausgangssignale der Komparatoren P.C.4, P.G.1 und
P.G.2 durch ein ODER-Glied, das seinerseits durch das Ausgangssignal
des !Comparators P.G.3 konditioniert wird, miteinander
kombiniert.
Ganz allgemein, unverbindlich und lediglich erläuternd kann gesagt werden, daß typische Werte von ptm, ptl, K und Kf jeweils
-30 bis -40 dBmO, -40 bis -50 dBmO, 10 - 100 ms, 1,5 8 bzw. 1,5-8 sein können. In diesem Pail koinzidieren die
vorher genannten Signale a und b mit pe(t) bzw. pe(t -At)·
Die zweite Version des Sprachdetektors S.D.2 gemäß der Erfindung
arbeitet nach folgendem Prinzip: Aus dem Kanalsignal f(t) werden zwei unterschiedliche Kurzzeitleistungen extrahiert,
nämlich pes(t) durch Integrieren von f(t) auf vergleichsweise langer Zeitbasis und pef(t) durch Integrieren desselben Signals
auf vergleichsweise kurzer Zeitbasis. Im allgemeinen sind die Integrationszeiten für pes(t) 2- bis 8-mal langer als die
Integrationszeiten für pef(t). Die "langsame" Kurzzeitleistung pes(t) wird mit einem Schwellenwertpegel ptm verglichen, und
609884/1003
wenn pes(t)> ptm zutrifft, wird der Kanal als aktiv (AT ergibt
EIN) definiert, pes(t) wird auch mit einem anderen Schwellenwertpegel
ptl (ptl> ptm) verglichen, und wenn pes(t)<ptl zutrifft,
wird der Kanal als unbelegt (AT ergibt AUS) bestimmt«- Schließlich wird als erfindungsgemäße Besonderheit die "schnelle"
Kurzzeitleistung pef(t) mit der "langsamen" Leistung pes(t) verglichen, und wenn pef(t)>
K>pes(t) oder pef(t) O/K1 pes(t)
zutrifft, wird der Kanal als aktiv (AT ergibt EIN) oder im um gekehrten Fall als unbelegt (AT ergibt AUS) definiert. Die
Größen K und K1 sind (wiederum) größer als 1 und nicht notwendigerweise
gleich groß.
Der zweite Sprachdetektor S.D.2 gemäß der Erfindung ist beispielhaft
im Blockschaltbild von Fig. 3 dargestellt. Das Kanalsignal f(t) wird dabei an zwei ähnlichen Kurzzeitleistungs-Schätzblöcke
angelegt, von denen das "schnelle" Schätzelement S.T.P.E.i1. an seinem Ausgang (Leitung 1) (zum Zeitpunkt t) das
Signal pef(t) liefert, während das "langsame" Schätzelement S.T.P.E.S. an seinem Ausgang (Leitung 2) (zum Zeitpunkt t) das
Signal pef(t) liefert. Das Signal pes(t) wird (über Leitung 3) an eine Multiplizierschaltung K, an eine Multiplizierschaltung
1/K' (Leitung 4), einen Komparator P.C.4 (Leitung 8) und einen
Komparator P.G.3 (Leitung 7) angelegt. Das Signal pef(t) wird
(über Leitung 9) dem Komparator P.G.1 und (über Leitung 10) dem Komparator P.G.2 eingegeben. Die Schwellenwertpegel ptm und
ptl (ptm ptl) werden über Leitungen 11 und 12 den Komparatoren P.C.4 bzw. P.G.3 eingespeist. Die Ausgangssignale der Multi-
609884/1003
plizierschaltungen K und 1/K1 (Leitungen 5 und 6) werden unmittelbar
an die Komparator en P.C.1 "bzw. P.C. 2 angelegt. Zur
Erzielung des endgültigen oder gewünschten Signals AT werden die logischen Ausgangssignale der Komparatoren P.G.4, P.G.1 und
P.C.2 durch ein ODER-Glied, das seinerseits durch das Ausgangssignal des !Comparators P.G.3 konditioniert wird, miteinander
kombiniert.
Wiederum lediglich als erläuterndes Beispiel können typische Werte für ptm, ptl, K und K' jeweils -30 bis -40 dBmO, -50 bis
-60 dBmO, 1,5-8 bzw. 1,5-8 sein.
In diesem Pail koinzidieren die vorher genannten Signale a
und b mit pes(t) bzw. pef(t).
Bevor ein unmittelbarer Vergleich zwischen dem herkömmlichen Sprachdetektor und den erfindungsgemäßen Sprachdetektoren angestellt
wird, sollen einige Größen definiert werden, die ein Maß für das Verhalten der verschiedenen Sprachdetektoren sind:
a) Es kann gesagt werden, daß die Störgeräuschunempfindlichkeit (Noise Immunity) eines Sprachdetektors gleich X dBmO ist,
falls dann, wenn am Eingangskanalsignal f(t) nur ein Störsignal liegt, das Ausgangssignal AT des Sprachdetektors
nicht in den EIN-Zustand bis hinauf zu einer Stör(signal)
leistung von X dBmO übergeht. Je höher die Störunempfindlichkeit
ist, umso besser ist der Sprachdetektor.
b) Mit Stellzeit ist das Intervall gemeint, das von dem Zeit-
609884/1003
punkt, an welchem irgendein Sprachsignal auf dem Kanal
f(t) eingeleitet wird, bis zu dem Zeitpunkt verstreicht, an dem AT auf EIF übergeht. Je kürzer die Stellzeit ist,
umso besser ist der Sprachdetektor.
c) Mit Rückstellzeit ist das Intervall gemeint, das vom Augenblick
des Auftretens irgendeines Sprachsignals auf dem Kanal f(t) bis zum Augenblick, an welchem AT auf AUS übergeht, verstreicht.
Je kürzer die Rückstellzeit ist, umso besser ist der Sprachdetektor.
d) Der Ausdruck "Qualität" bzw. "Güte" Q bezieht sich auf die Fähigkeit des Sprachdetektors, die Übertragung von "Löchern"
(d.h. Unterbrechungen infolge des Übergangs von AT auf AUS) zu vermeiden, während auf dem Kanal f(t) ein Wort oder Satz
übermittelt wird.
Da die Güte Q nur subjektiv bewertet werden kann, ist es schwierig, ihre Größe zahlenmäßig auszudrücken. Diese Charakteristik
ist jedoch von äußerster Wichtigkeit, weil die Übertragungsunterbrechungen mitten in einem Wort äußerst störend
sind. Je besser die Güte Q ist, umso besser ist also auch der Sprachdetektor.
Die überlegenen Leistungen der erfindungsgemäßen Sprachdetektoren
im Vergleich zu den herkömmlichen Sprachdetektoren lassen sich wie folgt zusammenfassen:
609884/1003
a) Bei gleicher Störunempfindlichkeit zeigen die Sprachdetektoren
S.D.1 und S.D.2 kürzere Stell- und Rückstellzeiten und eine erheblich "bessere Güte Q.
Id) Bei gleicher Güte Q, besitzen die Sprachdetektoren S.D.1
und S.D.2 kürzere Stell- und Rückstellzeiten und eine
wesentlich höhere Störunempfindlichkeit (10 - 15 dB).
Bezüglich der Schätzelementblocks S.T.P.E., S.T.P.E.F. und
S.T.P.E.S. gemäß den !Pig. 1 bis 3 ist darauf hinzxiweisen, daß
die betreffenden Elemente in unterschiedlicher Weise realisierbar sind, je nachdem, ob sie Analogsignale der Art des
Signals f(t) oder Digitalsignale der Art f(nTc) und/oder f. (nTc) verarbeiten sollen. Fig. 4a zeigt ein Blockschaltbild,
das unterschiedslos für die drei genannten Schätzelemente zutrifft und wobei denen das zu verarbeitende Signal ein Analogoder
ein Digitalsignal sein kann.
Der Block 1 kann entweder ein Gleichrichter (R) sein, so daß T[i] mit T1[I] koinzidiert und u = [i] (Pig· 4b), oder aber
ein Quadrierelement, so daß T Li] mit T2 [i] koinzidiert und
u = i (Pig. 4c).
Der Block 2 ist in jedem Pail vom Tiefpaßfilter-Integratortyp,
wobei es sich beim Impuls entweder um einen Rechteckimpuls h^
(t) (Pig. 4d) oder um einen exponentiell abnehmenden Impuls Yi (t) (Fig. 4c) handelt. Die Blöcke S.T.P.E.P. und S.T.P.E.S.
unterscheiden sich dabei durch verschiedene Werte der Zeitkonstante t. 609884/1003
Das Blockschaltbild gemäß Pig. 4a gilt auch für die Verarbeitung von Digitalsignalen f(n.Tc) oder f. (n.Tc); in diesem
Fall ist auch die Ausgangsleistung pe(nTc) ein Digitalsignal,
und die Antwort auf die LPFI-Impulse müssen als Wort h..(nTc)
und h?(nTc) angesehen werden.
Die Komparatoren P.C. erhalten analoge oder digitale Eingangssignale in Abhängigkeit davon, ob Signale f(t) oder f(n.Tc) oder
f(n.Tc) verarbeitet werden. Auf ähnliche Weise sind auch die
Multiplizierschaltungen K und 1/K1 Analog- oder Digital-Multiplizierschaltungen.
In jedem Fall sind die Ausgangssignale der Komparatoren logische Signale (EIN und AUS).
609884/1003
Claims (11)
- Patentansprüche./Verfahren zur Peststellung des Vorhandenseins oder Fehlens eines Nutzsignals in einem einer Fernsprechleitung oder einem Sprachkanal zugeordneten Kanalsignal, beispielsweise eines Multiplex- bzw. Interpolationssystems mit mehreren Sprachkanälen, wobei eine Bestimmung der Kanalsignal-Kurzzeitleistung vorgenommen und der Schätzwert (als Signal "a" bezeichnet) mit einem voreingestellten konstanten Schwellenwertpegel (ptm) verglichen \tfird, dadurch gekennzeichnet, daß die Änderungen des Schätzwertes a durch Vergleichen desselben mit einem anderen, streng auf die geschätzte Leistung bezogenen Signal b ausgewertet werden und das Signal a weiterhin mit einem zweiten konstanten, voreingestellten Schwellenwertpegel (ptl) verglichen wird, welcher der Bedingung ptm > ptl genügt, und daß die Yergleichs-Ergebnisse in einer geeigneten Kombinationsschaltung verarbeitet werden, die an ihrem Ausgang das endgültige logische Signal liefert, welches dem Vorhandensein oder I'ehlen des Sprachsignals im Sprachkanal entspricht.
- 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Sprachsignal ein Analogsignal (f(t)) im 300 - 3400 Hz-Basisband oder eine Digitaldarstellung davon (z.B.'Impulszählmodulation-Kodierung)ist.
- 3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß das Signal (b) durch Verzögerung des Signals (a) um eine609 8 8 4/1003Differenzzeit At erhalten wird.
- 4. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß das Signal (Td) seist ein Schätzwert wie das Signal (a) ist, aber durch Integration auf kürzerer Zeitbasis erhalten worden ist.
- 5. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das Signal (a) und/oder das Signal (b) mit zwei verschiedenen Faktoren K bzw. 1/K'multipliziert werden.
- 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die von den beiden Multiplikationsvorgänge erhaltenen Signale in zwei getrennten Komparatoren mit dem jeweils anderen Signal nicht multiplizierten (a oder b), verglichen werden.
- 7. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß alle von den Komparatoren erhaltenen Signale einer ersten logischen Verarbeitungsstufe unterworfen werden, mit Ausnahme des Signals, das beim Vergleich des Signals (a) mit dem niedrigeren Schwellenwertpegel (ptl) erhalten wird.
- 8. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das aus der ersten Verarbeitungsstufe erhaltene Signal mit dem durch den Vergleich des Signals609884/ 1 003(a) mit dem niedrigeren Schwellenwertpegel erhaltenen Signal kombiniert wird, und daß das endgültige logische, das Vorhandensein oder Fehlen eines Sprachsignals anzeigende Signal AT durch diese zweite Verarbeitungsstufe geliefert wird.
- 9. Schalteinrichtung zur Realisierung des Verfahrens nach einem der vorangehenden Ansprüche, bestehend aus einem Schätzelement für die Kurzzeitleistung ("a") und einem Komparator zum Vergleichen der geschätzten Leistung mit einem voreingestellten konstanten Schwellenwertpegel (ptm), gekennzeichnet durch eine Einrichtung zum Extrahieren des Signals (b), durch eine Einrichtung zum Vergleichen des Signals (a) mit einem zweiten konstanten Schwellenwertpegel (ptl), durch eine Einrichtung zum getrennten Multiplizieren des Signals (a) oder (b) mit zwei verschiedenen Faktoren (K und 1/K')> durch eine Einrichtung zum Vergleichen der betreffenden Signale aus den beiden Multiplikationen mit dem nicht multiplizierten Signal (a oder b) und durch eine Einrichtung zur Bildung der Kombinationsschaltung, die an ihrem Ausgang das endgültige logische Signal (AT) liefert.
- 10. Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Einrichtung zum Extrahieren des Signals (b) aus einer Verzögerungsleitung oder einem Schieberegister (Verzögerung T) besteht.609884/ 1003
- 11. Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Einrichtung zum Extrahieren des Signals (b) aus einem zweiten Kurzzeitleistungs-Schätzelement besteht, das auf kürzerer Integrationszeitbasis arbeitet.60988 A /1003
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT25053/75A IT1044353B (it) | 1975-07-03 | 1975-07-03 | Metodo e dispositivo per il rico noscimento della presenza e.o assenza di segnale utile parola parlato su linee foniche canali fonici |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2623025A1 true DE2623025A1 (de) | 1977-01-27 |
Family
ID=11215547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19762623025 Withdrawn DE2623025A1 (de) | 1975-07-03 | 1976-05-22 | Verfahren und schalteinrichtung zur analyse eines signals |
Country Status (13)
Country | Link |
---|---|
US (1) | US4057690A (de) |
JP (1) | JPS5231606A (de) |
BE (1) | BE842136A (de) |
BR (1) | BR7603465A (de) |
DE (1) | DE2623025A1 (de) |
ES (1) | ES449486A1 (de) |
FR (1) | FR2316814A1 (de) |
GB (1) | GB1491662A (de) |
IT (1) | IT1044353B (de) |
LU (1) | LU75069A1 (de) |
NL (1) | NL7607412A (de) |
NO (1) | NO146521C (de) |
ZA (1) | ZA762946B (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3017623A1 (de) * | 1980-05-08 | 1981-11-12 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur verkehrserfassung von aus analogsignalen bestehenden nachrichtenstroemen auf fernmeldeleitungen |
DE3244851A1 (de) * | 1981-12-03 | 1983-06-16 | Ricoh Co., Ltd. | Optisches datenuebertragungssystem |
DE3220905C1 (de) * | 1982-06-03 | 1983-12-29 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen |
DE2840908C2 (de) * | 1978-08-31 | 1984-07-12 | LGZ Landis & Gyr Zug AG, Zug | Detektor zur Feststellung der Anwesenheit eines elektrischen Signals |
DE3323534C1 (de) * | 1983-06-30 | 1985-02-14 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4351216A (en) * | 1979-08-22 | 1982-09-28 | Hamm Russell O | Electronic pitch detection for musical instruments |
US4314100A (en) * | 1980-01-24 | 1982-02-02 | Storage Technology Corporation | Data detection circuit for a TASI system |
DE3023375C1 (de) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
US4357491A (en) * | 1980-09-16 | 1982-11-02 | Northern Telecom Limited | Method of and apparatus for detecting speech in a voice channel signal |
EP0054365B1 (de) * | 1980-12-09 | 1984-09-12 | Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland | Spracherkennungssystem |
USRE32172E (en) * | 1980-12-19 | 1986-06-03 | At&T Bell Laboratories | Endpoint detector |
US4370521A (en) * | 1980-12-19 | 1983-01-25 | Bell Telephone Laboratories, Incorporated | Endpoint detector |
FR2502374B1 (fr) * | 1981-03-18 | 1986-04-18 | Trt Telecom Radio Electr | Dispositif de discrimination de la parole |
US4531228A (en) * | 1981-10-20 | 1985-07-23 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
DE3243232A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
DE3243231A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
US4764966A (en) * | 1985-10-11 | 1988-08-16 | International Business Machines Corporation | Method and apparatus for voice detection having adaptive sensitivity |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
FR2629964B1 (fr) * | 1988-04-12 | 1991-03-08 | Telediffusion Fse | Procede et dispositif de discrimination de signal |
US5065395A (en) * | 1990-04-09 | 1991-11-12 | Dsc Communications Corporation | Rudimentary digital speech interpolation apparatus and method |
US5305422A (en) * | 1992-02-28 | 1994-04-19 | Panasonic Technologies, Inc. | Method for determining boundaries of isolated words within a speech signal |
US5675639A (en) * | 1994-10-12 | 1997-10-07 | Intervoice Limited Partnership | Voice/noise discriminator |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US6671667B1 (en) * | 2000-03-28 | 2003-12-30 | Tellabs Operations, Inc. | Speech presence measurement detection techniques |
EP2107553B1 (de) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Verfahren zur Erkennung einer Unterbrechung einer Sprachausgabe |
EP2148325B1 (de) * | 2008-07-22 | 2014-10-01 | Nuance Communications, Inc. | Verfahren zur Bestimmung der Anwesenheit einer gewollten Signalkomponente |
US9537460B2 (en) * | 2011-07-22 | 2017-01-03 | Continental Automotive Systems, Inc. | Apparatus and method for automatic gain control |
WO2013187932A1 (en) | 2012-06-10 | 2013-12-19 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
WO2014039028A1 (en) | 2012-09-04 | 2014-03-13 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
US9613633B2 (en) | 2012-10-30 | 2017-04-04 | Nuance Communications, Inc. | Speech enhancement |
CN110580913B (zh) * | 2019-09-26 | 2022-03-04 | 嘉楠明芯(北京)科技有限公司 | 语音激活检测方法、装置及计算机可读存储介质 |
CN112382312A (zh) * | 2020-09-23 | 2021-02-19 | 福建信通慧安科技有限公司 | 目标探测器及目标探测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3046347A (en) * | 1959-02-25 | 1962-07-24 | Bell Telephone Labor Inc | Transmission control in a two way communication system |
US3712959A (en) * | 1969-07-14 | 1973-01-23 | Communications Satellite Corp | Method and apparatus for detecting speech signals in the presence of noise |
US3878337A (en) * | 1970-03-13 | 1975-04-15 | Communications Satellite Corp | Device for speech detection independent of amplitude |
DE2334459C3 (de) * | 1973-07-06 | 1982-03-25 | Siemens AG, 1000 Berlin und 8000 München | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung |
-
1975
- 1975-07-03 IT IT25053/75A patent/IT1044353B/it active
-
1976
- 1976-05-06 GB GB18568/76A patent/GB1491662A/en not_active Expired
- 1976-05-11 FR FR7614058A patent/FR2316814A1/fr active Granted
- 1976-05-18 ZA ZA762946A patent/ZA762946B/xx unknown
- 1976-05-21 BE BE6045511A patent/BE842136A/xx unknown
- 1976-05-22 DE DE19762623025 patent/DE2623025A1/de not_active Withdrawn
- 1976-05-31 BR BR7603465A patent/BR7603465A/pt unknown
- 1976-06-02 LU LU75069A patent/LU75069A1/xx unknown
- 1976-06-24 US US05/699,364 patent/US4057690A/en not_active Expired - Lifetime
- 1976-07-01 JP JP51077112A patent/JPS5231606A/ja active Pending
- 1976-07-02 NO NO762317A patent/NO146521C/no unknown
- 1976-07-02 ES ES449486A patent/ES449486A1/es not_active Expired
- 1976-07-05 NL NL7607412A patent/NL7607412A/xx not_active Application Discontinuation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2840908C2 (de) * | 1978-08-31 | 1984-07-12 | LGZ Landis & Gyr Zug AG, Zug | Detektor zur Feststellung der Anwesenheit eines elektrischen Signals |
DE3017623A1 (de) * | 1980-05-08 | 1981-11-12 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur verkehrserfassung von aus analogsignalen bestehenden nachrichtenstroemen auf fernmeldeleitungen |
DE3244851A1 (de) * | 1981-12-03 | 1983-06-16 | Ricoh Co., Ltd. | Optisches datenuebertragungssystem |
DE3220905C1 (de) * | 1982-06-03 | 1983-12-29 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen |
DE3323534C1 (de) * | 1983-06-30 | 1985-02-14 | Vierling, Oskar, Prof. Dr.Phil.Habil., 8553 Ebermannstadt | Sensor zur Verkehrserfassung von aus Analogsignalen bestehenden Nachrichtenströmen auf Fernmeldeleitungen |
Also Published As
Publication number | Publication date |
---|---|
NO146521C (no) | 1982-10-13 |
LU75069A1 (de) | 1977-01-21 |
BR7603465A (pt) | 1977-07-05 |
NL7607412A (nl) | 1977-01-05 |
NO146521B (no) | 1982-07-05 |
FR2316814B1 (de) | 1982-11-05 |
NO762317L (de) | 1977-01-04 |
US4057690A (en) | 1977-11-08 |
FR2316814A1 (fr) | 1977-01-28 |
ZA762946B (en) | 1977-04-27 |
ES449486A1 (es) | 1977-08-01 |
BE842136A (fr) | 1976-09-16 |
GB1491662A (en) | 1977-11-09 |
JPS5231606A (en) | 1977-03-10 |
IT1044353B (it) | 1980-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2623025A1 (de) | Verfahren und schalteinrichtung zur analyse eines signals | |
DE69525836T2 (de) | Kodierung und dekodierung eines breitbandigen digitalen informationssignals | |
EP0066229B1 (de) | Verfahren und Anordnung zum Demodulieren von FSK-Signalen | |
DE69026185T2 (de) | Mehrfrequenzsignal-Empfänger und Verfahren zu dessen Erkennung | |
DE3200895C2 (de) | Verfahren und Vorrichtung zum Umwandeln eines ersten Binärwortes in ein zweites Binärwort | |
DE2558402B2 (de) | Digitaler Mehrfrequenzcodesignalempfänger für Fernmelde-, insbesondere Fernsprechvermittlungsanlagen | |
DE2805478C2 (de) | Schaltungsanordnung zur Diskriminierung von Sprachsignalen | |
DE2433885C3 (de) | Vorrichtung zum Synchronisieren der Eingansschaltung eines elektronischen Testinstruments auf zu prüfende Signalfolgen | |
DE69805771T2 (de) | Kanalimpulsantwortschätzung unter verwendung von korrelation mit linienwegnahme | |
DE69316880T2 (de) | Numerische Verstärkungsregelung | |
DE112014003074T5 (de) | Rauschenanalysevorrichtung, elektronisches Gerät und Rauschquellenidentifikationssystem | |
DE69325087T2 (de) | Verfahren zur bildung einer qualitätsmessung für signalburst | |
DE69614829T2 (de) | Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE2811293A1 (de) | Verfahren und anordnung zur sprachuebertragung | |
WO1989003574A1 (en) | Digital adaptive transform coding process | |
DE19523343B4 (de) | Vorrichtung zum Messen einer Leckleistung | |
DE69700274T2 (de) | Verfahren und Apparat zur Kodierung eines digitalen Audiosignals | |
DE3416818C1 (de) | Verfahren zur Behandlung von Modem-Signalen | |
DE69510865T2 (de) | Verfahren und Gerät zur Vorverarbeitung eines akustischen Signals vor der Sprachcodierung | |
DE3831047C2 (de) | ||
DE68911355T2 (de) | Verfahren und Einrichtung zur Signalunterscheidung. | |
DE3739481C2 (de) | ||
DE4431047A1 (de) | Verfahren zum Trennen von wiederkehrenden Signalabschnitten aus unterschiedlichen Signalquellen von einem durch Überlagerung entstehenden Summensignal | |
DE2655598C2 (de) | Nachrichtenübertragungsverfahren |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8141 | Disposal/no request for examination |