DE2334459B2 - Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung - Google Patents

Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Info

Publication number
DE2334459B2
DE2334459B2 DE19732334459 DE2334459A DE2334459B2 DE 2334459 B2 DE2334459 B2 DE 2334459B2 DE 19732334459 DE19732334459 DE 19732334459 DE 2334459 A DE2334459 A DE 2334459A DE 2334459 B2 DE2334459 B2 DE 2334459B2
Authority
DE
Germany
Prior art keywords
input
output
voiced
signal
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19732334459
Other languages
English (en)
Other versions
DE2334459A1 (de
DE2334459C3 (de
Inventor
Claus 8000 München Balzereit
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19732334459 priority Critical patent/DE2334459C3/de
Publication of DE2334459A1 publication Critical patent/DE2334459A1/de
Publication of DE2334459B2 publication Critical patent/DE2334459B2/de
Application granted granted Critical
Publication of DE2334459C3 publication Critical patent/DE2334459C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Current Or Voltage (AREA)

Description

zwischen einem stimmhaften und einem stimmlosen Sprachanteil getroffen wird und sich so bei der Wiedergabe eine klarere Sprache ergibt Ein weiterer Vorteil liegt darin, daB diese Unterscheidung mit einem relativ geringem Aufwand durchgeführt >vird. Bei einer vorteilhaften Variante des Verfahrens nach der Erfindung, das eine Unterscheidung mit großer Sicherheit durchführt, wird ab einer Anzahl von 16 Differenzspannungen, die kleiner als die Schwellwertspannungen sind, auf ein stimmloses Sprachsignal erkannt
Anhand des in der F i g. 2 der Zeichnung dargestellten Ausführungsbeispiels soll die Erfindung im folgenden noch näher erläutert werden. Die Fig.2 zeigt das Blockschaltbild einer Anordnung zur Sprachsignalauswertung mit einer Unterscheidungsmöglichkeit zwischen stimmhaften und stimmlosen Lauten. Im einzelnen ist ein Signaleingang 8 für das auszuwertende Signal vorgesehen, der mit dem Eingang eines Regelverstärker Vl verbunden ist Der Regelverstärker sorgt für eine konstante mittlere Aussteuerung der nachfolgenden Schaltung und kann deshalb entfallen, falls diese konstante Aussteuerung ohnehin gegeben ist.
Mit dem Ausgang 8' des Regelverstärkers V1 oder mit dem Signaleingang 8 ist der Eingang der ersten Stufe τ 1 einer Laufzeitkette verbunden. Die weiteren Stufen der Laufzeitkette 2 .. .τη) sind hintereinander geschaltet und mit dem Ausgang der ersten Stufe verbunden. Mit dem Ausgang jeder Stufe der Laufzeitkette ist ein erster Eingang jeweils eines Differenzverstärkers Ai... An verbunden, der andere Eingang jedes der Differenzverstärker ist mit dem Ausgang 8' des Regelverstärkers Vl oder mit dem Signaleingang 8 direkt verbunden und erhält so ein unverzögertes Signal.
In jedem der Differenzverstärker A 1 .. An wird die Differenz zwischen dem unverzögerten Signal und demjenigen Signal gebildet, das nach einer bestimmten, sich von Stufe zu Stufe steigernden Verzögerung am Ausgang der jeweiligen Stufe abgegeben wird. Der Ausgang jedes der Differenzverstärker ist mit einer der Gleichrichteranordnung Gl ... Gn verbunden, die vorzugsweise aus Doppelweggleichrichtern bestehen. An den Ausgang jeder der Gleichrichteranordnungen sind Summierglieder angeschlossen, die zumindest aus jeweils einem Kondensator CX ... Cn bestehen. In Parallelschaltung mit den Kondensatoren können Entladewiderstände vorgesehen werden, diese Widerstände können aber auch an anderer Stelle in der Schaltung auftreten. Die Widerstände können auch entfallen, wenn — wie im vorliegenden Fall — in anderer Weise für eine Entladung der Kondensatoren C 1...Cn gesorgt wird
Jedes der Summierglieder und damit jeder der Kondensatoren Ci ... Cn ist mit einem der festen Anschlüsse, also mit einem der Eingänge des Abtastschalters 5 verbunden. Durch die gestrichelt dargestellte
ίο Leitung L1 soll angedeutet werden, daß der Abtastschalter 5 von einem über den Eingang 61 mit einem Taktgenerator 4 verbundenen ersten Zähler 6 gesteuert wird. Da der Ausgang des Abtastschalters 5 mit dem einen Eingang 71 eines Vergleichers 7 verbunden ist, gelangen die durch den Abtastschalter 5 von den Summiergliedern abgetasteten Spannungen zum Verglcicher 7. Der andere Eingang 72 des Vergleichers 7 ist mit einer Vergleichsspannungsquelle UrX und mit einem Anschluß eines Siebkondensators Cverbunden.
Ist die von dem Abtastschalter 5 ausgewählte, zu vergleichende Spannung gleich oder kleiner der von der Vergleichsspannungsquelle Ur 1 abgegebenen Vergleichsspannung, tritt also ein Vergleichsminimum auf, dann gibt der Verstärker 7 einen Impuls ab, der dem Eingang 62 des ersten Zählers 6 und dem Eingang 81 des zweiten Zählers STZ zugeführt wird. Nach Erhalt des ersten Impulses vom Ausgang des Vergleichers 7 gibt der erste Zähler 6 vom Ausgang 64 über die Steuerleitung L 1 einen Impuls zum Abtastschalter 5.
jo durch den dieser veranlaßt wird, die Verbindung mit einem weiteren Anschluß herzustellen. Außerdem kann der erste Zähler 6 die im Hauptpatent beschriebene Ermittlung der Grundfrequenz durchführen. Das Ergebnis des ersten Zählers 6 wird über dessen Ausgang 65 zum Eingang 82 des zweiten Zählers STZ übertragen. Hat der zweite Zähler STZ den Zählerstand von beispielsweise 16 erreicht, dann gibt er an seinem Ausgang 84 ein Signal ab, das das Auftreten eines stimmlosen Lautes meldet. Weiterhin wird über den Ausgang 83 ein Rückstellimpuls zum Eingang 63 des Zählers 6 gegeben, durch den dieser auf Null zurückgestellt wird.
Diese Anordnung zur Unterscheidung zwischen stimmhaften und stimmlosen Lauten in einem Sprachsignal kann mit Anordnungen zur Ermittlung der Grundfrequenz kombiniert werden, so daß eine umfassende Anordnung zur Sprachauswertung entsteht.
Hierzu 1 Blatt Zeichnungen

Claims (3)

Patentansprüche:
1. Verfahren zur Auswertung eines Sprachsignales, bei dem als Kriterium für die Unterscheidung eines stimmhaften von einem stimmlosen Laut das Auftreten von, eine vorgegebene Schwellwertspannung unterschreitenden Minima des in Form von Differenzspannungen auftretenden Vergleichsergebnisses aus dem Eingangssignal und den einzelnen ι ο zeitverzögerten Signalen (Abtastproben) dient, nach Patentanspruch 3 von Patent 20 62 5S9, dadurch gekennzeichnet, daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen mit der Schwellwertspannung verglichen wird, daß diejenigen Differenzspannungen, die kleiner als die Schwellwertspannung sind, gezählt werden und daß ab einer entsprechend der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprachsignal erkannt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß ab einer Anzahl von 16 Differenzspannungen, die kleiner als die Schwellwertspannung sind, auf ein stimmloses Sprachsignal erkannt wird.
3. Anordnung zur Durchführung des Verfahrens nach Anspruch 1 oder 2, dadurch gekennzeichnet,
daß eine Laufzeitkette mit η Stufen (rl ... τη) vorgesehen ist,
daß Differenzverstärker (Ai ... An) vorgesehen sind, die mit ihren jeweils ersten Eingang an die Ausgänge der Stufen 1 ... τη) der Laufzeitkette angeschaltet sind und deren jeweils zweiter Eingang mit dem Eingang (8') der Laufzeitkette verbunden ist,
daß Summierglieder vorgesehen sind, die mit Masse verbunden sind und zumindest jeweils einen Kondensator (Ci ... Cn) enthalten und über eine Gleichrichteranordnung (Gi ... Gn) mit den Ausgängen der Differenzverstärker verbunden sind, daß ein Abtastschalter (5) vorgesehen ist, dessen feste Anschlüsse (Ki... Kn)m\t den Kondensatoren (Ci... Cn) der Summierglieder verbunden sind,
daß ein Vergleicher (7) vorgesehen ist, dessen einer Eingang (71) mit dem Ausgang des Abtastschalters und dessen anderer Ausgang (72) mit einer Vergleichsspannungsquelle (Ur i) verbunden ist,
daß ein Taktgenerator (4) vorgesehen ist, dessen Takt den Abtastschalter steuern,
daß ein erster Zähler (6) vorgesehen ist, der die dem Abtastschalter (5) zugeführten Takte zählt und der so über eine Steuerleitung (L i) mit dem Abtastschalter (5) verbunden ist, der außerdem mit dem Ausgang des Vergleichers (7) und mit dem Ausgang des Taktgenerators verbunden ist und
daß ein zweiter Zähler (STZ) mit einem ersten und einem zweiten Eingang (81,82) und einem ersten und einem zweiten Ausgang (83, 84) vorgesehen ist, dessen erster Eingang (81) mit dem Ausgang des Vergleichers (7), dessen zweiter Eingang (82) mit einem Ausgang des ersten Zählers (6) und dessen erster Ausgang (83) mit einem Eingang des ersten Zählers (6) verbunden ist und
daß an dem zweiten Ausgang (84) des zweiten Zählers (STZ) bei Auftreten eines stimmlosen Signales ein Steuerimpuls entnehmbar ist.
Das Hauptpatent betrifft neben einem Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen Signales, insbesondere eines Sprachsignales, das durch Begrenzung des Frequenzbandes die Grundfrequenz nicht mehr enthält, ein Verfahren zur Unterscheidung eines stimmhaften von einem stimmlosen Laut sowie Schaltungsanordnungen zur Durchführung dieser Verfahren. Die Schaltungsanordnung nach dem Hauptpatent besteht aus einer Laufzeitkette mit mehreren Stufen, aus Differenzverstärkern, Gleichrichteranordnungen, Summiergliedern, einem Abtastschalter, einer Vergleichsspannungsquelle, einem Taktgenerator und einem Zähler, der bestimmte Takte des Taktgenerators zählt.
Das Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen Signales nach dem Hauptpatent wird in der Weise durchgeführt, daß das Signal um mehrere aufeinanderfolgende Zeitabschnitte verzögert wird, daß die erzeugten zeitverzögerten Signale mit jeweils ein und demselben gerade vorliegenden Momentanwert des Eingangssignales unter Differenzbildung verglichen werden und daß die Verzögerungszeit desjenigen zeitverzögerten Signals, das den ersten auftretenden unter einem vorgegebenen Minimalschwellenwert liegenden Differenzpegel liefert als die der Grundfrequenz entsprechende Periodendauer weiterverwendet wird.
Bei dem Verfahren zur Unterscheidung eines stimmhaften von einem stimmlosen Laut nach dem Hauptpatent dient als Kriterium das Auftreten von eine vorgegebene Schwellwertspannung unterschreitenden Minima des in Form von Differenzspannungen auftretenden Vergleichsergebnisses aus dem Eingangssignal und den einzelnen zeitverzögerten Signalen (Abtastproben).
Die F i g. 1 zeigt den typischen Spannungsverlauf eines stimmhaften Lautes, wobei erkennbar ist, daß sich einzelne Schwingungspakete mit der Periode der Grundfrequenz fi wiederholen. Für stimmlose Laute ist ein derartiger typischer Spannungsverlauf nicht angebbar, da stimmlose Laute im wesentlichen durch das Auftreten eines Rauschens mit mehr oder weniger großer Amplitude gekennzeichnet sind. Weiterhin ist zu beachten, daß bei stimmlosen Sprachsignalen die Hauptenergie bei Frequenzen von über 3 kHz liegt, während für die Erkennung der Grundfrequenz stimmhafter Laute ein Sprachband von etwa 300 Hz bis 1 kHz ausreicht. Um Unsicherheiten bei der Grundfrequenzerkennung zu vermeiden, wird das Sprachsignal deshalb gewöhnlich über einen Bandpaß mit dem Durchlaßbereich von 300 Hz bis 1 kHz geleitet. Dadurch werden aber stimmlose Sprachanteile fast völlig ausgefiltert, so daß sich Unsicherheiten bei der Stimmhaft- Stimmlos-Unterscheidung ergeben.
Der Erfindung liegt nun die Aufgabe zugrunde, das letztgenannte Verfahren nach dem Hauptpatent dahin gehend weiterzubilden, daß eine sichere Stimmhaft-Stimmlos-Unterscheidung erreicht wird.
Diese Aufgabe wird gemäß der Erfindung dadurch gelöst, daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen mit der Schwellwertspannung verglichen wird, daß diejenigen Differenzspannungen, die kleiner als die Schwellwertspannung sind, gezählt werden und daß ab einer, entsprechend der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprechsignal erkannt wird.
Der Hauptvorteil des erfindungsgemäßen Verfahrens liegt also darin, daß eine sichere Unterscheidung
DE19732334459 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung Expired DE2334459C3 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19732334459 DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19732334459 DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Publications (3)

Publication Number Publication Date
DE2334459A1 DE2334459A1 (de) 1975-01-23
DE2334459B2 true DE2334459B2 (de) 1981-07-02
DE2334459C3 DE2334459C3 (de) 1982-03-25

Family

ID=5886153

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19732334459 Expired DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Country Status (1)

Country Link
DE (1) DE2334459C3 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1044353B (it) * 1975-07-03 1980-03-20 Telettra Lab Telefon Metodo e dispositivo per il rico noscimento della presenza e.o assenza di segnale utile parola parlato su linee foniche canali fonici
ATE9415T1 (de) * 1980-12-09 1984-09-15 The Secretary Of State For Industry In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And Spracherkennungssystem.
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USB83255I5 (de) * 1961-11-14
DE1572453A1 (de) * 1967-12-16 1970-07-16 Ibm Schaltungsanordnung zur Analyse und Synthese von Sprachsignalen
FR1583983A (de) * 1968-05-27 1969-12-12
DE2062589C3 (de) * 1970-12-18 1981-03-12 Siemens AG, 1000 Berlin und 8000 München Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales

Also Published As

Publication number Publication date
DE2334459A1 (de) 1975-01-23
DE2334459C3 (de) 1982-03-25

Similar Documents

Publication Publication Date Title
DE3306730C2 (de)
EP0296588A2 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
DE3802903A1 (de) Einrichtung zur uebertragung von sprache
DE2422028A1 (de) Schaltungsanordnung zur identifizierung einer formantfrequenz in einem gesprochenen wort
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE3102385C2 (de)
DE2502873A1 (de) Anordnung zur frequenzmessung
DE2805478C2 (de) Schaltungsanordnung zur Diskriminierung von Sprachsignalen
DE2710834C2 (de) Einbruch-Alarmsystem
DE1572516A1 (de) Schaltungsanordnung fuer die Spracherkennung
DE19961817B4 (de) Frequenzabweichung detektierendes Gerät und Frequenzabweichungs-Detektionsverfahren
DE1937464A1 (de) Sprachanalysiergeraet
DE2334459C3 (de) Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung
DE2431458C2 (de) Verfahren und Anordnung zur automatischen Sprechererkennung
DE3810068C2 (de)
DE1772633A1 (de) Verfahren zur Spracherkennung
DE2062589C3 (de) Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales
EP0939308A2 (de) Vorrichtung zur Erkennung oder zur Analyse von Maschinenschäden
DE3630518C2 (de) Einrichtung zum lautweisen Identifizieren eines Sprechmusters
DE1271203B (de) Verfahren und Anordnung zur Gewinnung der Anregungsfunktion bei Kanalvocodern
DE2313009C2 (de) Anordnung zur Durchführung eines Verfahrens zur Grundfrequenzermittlung mit Ausblendung der Subharmonischen der Grundfrequenz
DE1151284B (de) Frequenzanalysator zum Ermitteln des Verlaufes einer in einem Sprechfrequenz-teilband liegenden kennzeichnenden Sprechfrequenz
DE102021103175A1 (de) Verfahren und audioverarbeitungseinheit zur erfassung eines tons
DE1572452A1 (de) Anordnung zur Bestimmung der stimmhaften Anteile von Sprachlauten

Legal Events

Date Code Title Description
AF Is addition to no.

Ref country code: DE

Ref document number: 2062589

Format of ref document f/p: P

C3 Grant after two publication steps (3rd publication)
8340 Patent of addition ceased/non-payment of fee of main patent