DE1963082A1 - Verfahren und Einrichtung zur automatischen Sprachverarbeitung - Google Patents

Verfahren und Einrichtung zur automatischen Sprachverarbeitung

Info

Publication number
DE1963082A1
DE1963082A1 DE19691963082 DE1963082A DE1963082A1 DE 1963082 A1 DE1963082 A1 DE 1963082A1 DE 19691963082 DE19691963082 DE 19691963082 DE 1963082 A DE1963082 A DE 1963082A DE 1963082 A1 DE1963082 A1 DE 1963082A1
Authority
DE
Germany
Prior art keywords
values
groups
signal
speech
extreme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19691963082
Other languages
English (en)
Other versions
DE1963082C2 (de
Inventor
Heinz Kusch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19691963082 priority Critical patent/DE1963082C2/de
Publication of DE1963082A1 publication Critical patent/DE1963082A1/de
Application granted granted Critical
Publication of DE1963082C2 publication Critical patent/DE1963082C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • BEZEICHNUNG : Verfahren und Einrichtung zur automatischen Sprachverarbeitung STICHWORT : Spracherkennung SACHGEBIET : ERFINDER : Heinz Kusch BERUF : Physiker | NATIONALITÄT : deutsch ADRESSe : 8036 Herrsching, Leitenhöhe 41 INHALTSANGABE Die Erfindung betrifft ein Verfahren und zugehörige Einrichtungen zur Extrahierung typischer Signale, der Kompression und/oder Synthetisierung von Sprachsignalen.
  • Das Sprachsignal wird erfindungsgemäß in seine Extremwerte gegliedert deren aufeinanderfolgende Abstände zueinander ins Verhältnis eesetzt und so ihre typischen Gruppen(Laute) charakterisieren, die wiederum zu Wortkombination zusammengefaßt werden.
  • Es ist weiter vorgesehen, die Funktionen der erkannten Laute zur Vornahme von Schalthandlungen einzusetzen; fernerVSprachkompression zu verwenden. Die Umkehrung des Verfahrens ermöglicht synthetische Sprache zu erzeugen.
  • VERFAHREN UND EINRICHTUNG ZUR AUTOMATISCHEN SPRACHVERARRP,ITUNfi Unter den neueren Methoden zur Sprachverarbeitung sind Frequenz Amplituden-Zeit-Verfahren von besonderem Interesses Die Aufgabe dieser Verfahren besteht u.a. darin, redundante Bestandteile des Sprachsignals zu entfernen und Informationen abzuleiten, die eine zweckmäßige Signal-Verarbeitung insbesondere eine automatische irkennung ermöglichen. Um dieses zu erreichen werden überwiegend die Frequenzanteile des Sprachsignals analysiert, wobei die Sprache in Form abgetasteter Zeitfunktionen verarbeitet wird. Es sind auch Vorschläge bekannt, die Signale ganz oder überwiegend aus FormMerkmalen der Sprachschwingungen gewinnen.Nebr. Abtastverfahren die mit äquidistanten Abständen aus dem Signal Proben entnehmen und durch Vergleich relevante Extremwerte feststellen, gibt es auch Verfahren die Extremwerte durch die Nulldurchgänge der ersten Ableitung f'(x) iarkieren. Die Genauigkeit dieser Verfahren ist aber jiber einen größeren Frequenzbereich nicht groß. Bei dem ersten ist die Ungenauigkeit durch die Breite der äquidistqnten Abstände gegeben und bei der technischen Differentiation durch die Konstante T von R,C.
  • Die ungünstige Amplituden- und Frequenzabhängigkeit ist aus der Formel ersichtlich. U = U sin qv t erleidet durch das R,C-Glied e eine Phasenverschiebung von tan#= wird I1C unter gleichzeitiger Abnahme der Amplitude um den Faktor . Die flochpaßwirkung des R,C-liedes bewirkt eine ungünstige Bevorzugung der hohen Frequenzen.
  • Demgegenüber schlägt die Erfindung zunächst ein Verfahren mit zugehöriger Einrichtung vor, das kontinuierlich die Extrahierung der Extreme in verhältnismäßig leicht durchführbarer Weise über den großen Frequenz~ bzw. Amplitudehbereich des gesamten Sprachbandes ermöglicht. Erreicht wird dieses erfindungsgemäß dadurch, daß die Extrema, durch die Differenzwerte die über ein entgegengerichtetes Diodenpaar durch Auf- und Entladen. eines Kondensators entstehen, markiert werden. Es werden Einrichtungen vorgeschlagen, die zur Durchführung des vorgenannten Verfahrens besonders geeignet sind.
  • Weiterhin werden erfindungsgemäß Verfahren und Einrichtungen, die eine besondere Verarbeitung der relevanten Extremwerte vorsehen, beschrieben. Dabei schlägt die Erfindung ein Signal-Verhältnisgruppen-Verfahren vor mit dem typische Signal-Verhältnisgruppen Folgen extrahiert, SprachkomprSssion oder Synthese in verhältnismäßig leicht durchführbarer Weise und mit weitgehend verlustfreier Rückgewinnbarkeit der Lautinformation ermöglicht werden0 rfindungsgemäß wird dieses dadurch erreicht, daßddie Abstände der Extremwerte zueinander ins Verhältnis gesetzt und diese zu typischen Gruppen zusaengefaßt als neue Informationsgröße Aussalzen über Invarianten der Sprache darstellen. Redundante Bestandteile des Sprachsignals, Flankenverläute und absolute Werte entfallen dadurch. Wiederholungen werden dagegen gezählt und das Ergebnis codiert. Die Codierung der solcher Art gewonnenen Größen führt zu einep automatischen Erkennung der Sprache und/oder zur Sprachkompression bzw. zur synthetischen Sprache.
  • Die Möglichkeit, daß man aus einer Schwingung Proben gerade an den Stellen ihrer Scheitel entnehmen kann ist an sich nicht unbekannt.
  • Die Erfindung hat aber das Verdienst neben einem sehr einfachen Extrahierungsverfahren erkannt zu haben, daß man beim Sprachsignal durch Verhältnisbildung der Extremwertahstände dem Sprachsignal äquivalente und durch Gruppenbildung dieser stark vereinfachte typische Signal folgen erhält die zur Lösung der eingangs genannten Aufgaben führt.
  • Es werden Einrichtungen vorgeschlagen, die zur Durchführung der vorgenannten Verfahren besonders geeignet sind, aber auch für die Umsetzung anderer Signale verwendet werden könnens Weitere in diesem Rahmen vorgesehene Verfahrens- und Sinrichtungsmerkmale, die der Durchführung und Anwendung der Erfindung mehr im einzelnen dienen, sind den auf sie gerichteten Patentansprüchen entnehmbar.
  • Nachfolgend werden beispielsweise Ausführungsmöglichkeiten der Erfindung anhand der Zeichnungen näher beschrieben.
  • Im ersten Beispiel wird einen Schaltungsanordnung nach Fig.1 gezeigt, die in einfacher Weise eine Auf- und Entladung eines--Speicherkondensators C durch ein in tegensätzlicher Richtung geschaltetes Diodenpaar vornimmt. In der Zeitspanne zwischen Auf- und Entladung Oes Signals f(x) entsteht ein Spannungsabfall zwischen den Extremwerten an den Dioden Dl,D2, der von einem Komparator K angezeigt wird.
  • Der Impuls am Ausgang des Komparators markiert so die Extremwerte E,e des Signals.
  • In der Schaltungsanordnung gemäß Fig.2 wird ein zweites-Beispiel erläutert das die Verhältnisse von den Abständen benachbarter Extremwerte (ebenfalls fortlaufend) bestimmt. Die Werte des Signals f(x) werden zunächst von Extremwert E zu Extremwert e durch ein getrenrites Diodenpaar Dl,D2 in den nachfolgenden Kondensatoren C1,C2 gespeichert.
  • Durch die Schalter S1,S2 werden die Dioden wechselweise überbrückt. Gesteuert werden die Schalter über ein F1F1 durch den Komparatorimpuls E,e . Die Spannung über den Dioden D1 und D2 werden von den Differenzenverstärkern Vl,V2 abgenommen und einzeln über Logarithmierverstärker L1,L2 geleitet. Durch die Differenzenbildung mittels eines Differenzenverstätkers DV der an beide Logarithmierverstärkerausgänge angeschlossen ist entsteht: log V1 - log v2 s log Diese Schaltung erlaubt also neben der Bildung der Abstände E - e von Extremwert E zu Extremwert e noch die Bestimmung der Verhältnisse V1 v2 v2 ,V3 ... von Abstand E1,1 zu Abstand ES,e2 . Es entsteht so neben einer Differenzen Folge l,e2;e2,E3;.., eine Verhältnis Folge V1,v2;v2,V3;...
  • Im dritten Beispiel wird in Fig 3 eine Schaltungsanordnung gezeigt die Verhältnis folgen zu Gruppen zusammenfaßt. Dieses geschieht durch einen Steuerungsanteil ST und einen Codierteil CT ; ferner durch eine Anzeige A das das Codierungsergebnis des erkannten Lautes anzeigt. Eine Ausführungsmöglichkeit besteht hierbei aus einer Widerstandsmatrix RM deren Widerstände so angelegt werden , daß die Korrelation mit dem Signal den kleinsten Abstand ergeben nach der Formel: Die Referenzpannungen Rs werden dabei durch eine Schalteranordnung S die von einem Schieberegister SR gesteuert werden durchlaufend abgefragt. Der beginn und das Ende der Abfrage wird fortlaufend bei Übereinstimmung der Referenzspannung mit der Codierung ausgelöst.
  • Es wird also bei Übereinstimmung der jeweilige Laut L erkannt.
  • n Zinke andere Ausführungsmöglichkeit wird dadurch erhalten, daß die Extremwerte der Hüllkurven über das Eingangssignal die Anfangs-und Endpunkte für die Abfrage der Codiermatrix , festlegt, wobei statt der Widerstandsmatrix Verhältnisbereiche VB codiert werden 5. Fig.4 die dann den entsprechenden Laut Ln anzeigen A

Claims (13)

  1. PATENTANSYItiJCHZ 1. Verfahren zur automatischen Sprachverarbeitung in Form von Ableitung relevanter Informationen und Reduzierung redundanter Bestandteile von Sprachsignalen dadurch gekennzeichnet,daß die Extremwerte des Sprachsignals und/oder deren Abstände extrahiert und/oder diese zueinander ins Verhältnis gesetzt und/oder Diese zu Gruppen zusammengefaßt als typische Informationsgrößen codiert zur weiteren Verarbeitung gelangen.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,daß die Extremwerte des Signals durch die Differenzwerte , die über einem Element mit Diodenwirkung in beiden Richtungen mit nachfolgendem sich auf- und entladenden Kondensator entstehen und einen Komparator zur Wirkung bringen, markiert werden.
  3. 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,daß die Werte der Zeit und/oder Amplituden der Abstände der Extremwerte fortlaufend jeweils miteinander verglichen und deren Verhältniswerte bestimmt und/oder zu Gruppen zusammengefaßt werden.
  4. 4. Verfahren nach Anspruch 1 bis 3 dadurch gekennzeichnet,daß die Gruppenbildung der Differenzwerte und/oder der Verhältniswerte durch: Feststellung gleicher Wiederholungen der Werte und/oder durch die Extrema der Hüllkurven die über die Werte und/oder die Amplituden und/oder Zeitwerte des Signals gebildet werden.
  5. 5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet,daß gleiche Gruppen gezählt und/oder codiert werden und/oder zu neuen Gruppen zusammengefaßt und/oder nur jeweils eine der gleichen Gruppen allein weiter verarbeitet wird.
  6. 6. Verfahren nach Anspruch 1 bis 5 dadurch gekennzeichnet,daß die Werte in den Gruppen und/oder der gesamten Gruppe und/oder mehrerer Gruppen durch Codierung und/oder einer Widerstandsmatrix zusammengefaßt werden0
  7. 7. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet,daß zur Bearbeitung des Signals Sprachschwingungen herangezogen werden und/oder deren Frequenzanteile und/oder deren Amplituden und/oder deren Zeitwerte und/oder andere Signale z.B. Impuisfolgen von Datenverarbeitungsanlagen.
  8. 8. Verfahren nach Anspruch 1 bis 7, dadurch gekennzeichnet,daß durch Anwendung und/oder Codierung der Werte,Laute und/eder Worte angezeigt und/oder geschrieben und/oder Schaithandlungen ausgeführt und/oder Signalkompression und/oder synthetische Sprache hergestellt werden.
  9. 9. Verfahren nach Anspruch 1 bis 8, dadurch gekennzeichnet,daß das Verfahren in Software hergestellt wird.
  10. 10. 6'inrichtung zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 8 oder Analyse oder Kompression oder Synthese oder zur Vornahme von Schaithandlungen der in einem Signal enthaltenen Information, gekennzeichnet durch Extremwerterkennungsschaltungen die Extrem~ werte aus Signalen erkennen und dadurch jeweils erzeugte Impulse die Feststellung der Abstände zwischen den Extremwerten ermöglichen und Mittel die von diesen fortlaufend die Verhältnisse zueinander messen und diese Größen übertragen bzw. in den Kode aufFenommen werden.
  11. 11. Einrichtung nach Anspruch 10 dadurch gekennzeichnet,daß mit diesen Einrichtungen Sprache automatisch erkannt wird und diese Vorgänge auslöst die durch das erkannte Signal Schalthandlungen ausführt.
  12. 12. Einrichtung nach Anspruch 10 und 11 dadurch gekennzeichnet1daß eine Codierung der Laute zu Worten erfolgt und diese eine Auswahl von Kombination trifft und durch diese eine automatische Steuerung durchführt und/oder diese durch synthttische Sprache mitteilt.
  13. 13. Einrichtung nach Anspruch 1 bis 12 dadurch gekennzeichnet'daß nach Fig. 2,3 und deren Beschreibung verfahren wird.
DE19691963082 1969-12-16 1969-12-16 Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung Expired DE1963082C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19691963082 DE1963082C2 (de) 1969-12-16 1969-12-16 Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19691963082 DE1963082C2 (de) 1969-12-16 1969-12-16 Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung

Publications (2)

Publication Number Publication Date
DE1963082A1 true DE1963082A1 (de) 1971-06-24
DE1963082C2 DE1963082C2 (de) 1984-08-02

Family

ID=5754042

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19691963082 Expired DE1963082C2 (de) 1969-12-16 1969-12-16 Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung

Country Status (1)

Country Link
DE (1) DE1963082C2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1197638B (de) * 1958-09-29 1965-07-29 Heinz Kusch Verfahren zum selbsttaetigen Umsetzen von Lautschwingungen in Lauterkennungs-Signale
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system
DE1487540A1 (de) * 1966-12-01 1969-04-24 Telefunken Patent Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information
DE1802502A1 (de) * 1967-10-13 1969-05-14 Ibm Schaltungsanordnung zur Festellung der Anwesenheit von Sprachlauten

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1197638B (de) * 1958-09-29 1965-07-29 Heinz Kusch Verfahren zum selbsttaetigen Umsetzen von Lautschwingungen in Lauterkennungs-Signale
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system
DE1487540A1 (de) * 1966-12-01 1969-04-24 Telefunken Patent Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information
DE1802502A1 (de) * 1967-10-13 1969-05-14 Ibm Schaltungsanordnung zur Festellung der Anwesenheit von Sprachlauten

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Also Published As

Publication number Publication date
DE1963082C2 (de) 1984-08-02

Similar Documents

Publication Publication Date Title
DE2753277C2 (de) Verfahren und Einrichtung zur Spracherkennung
DE3633791A1 (de) Verfahren und anordnung zur messung des widerstandsverhaeltnisses an einer widerstands-halbbruecke
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute
DE1903759A1 (de) Digitalkorrelator
DE2634426A1 (de) Bandkompressionseinrichtung
DE2150180A1 (de) Vorrichtung zum Auswerten der Steigung eines Signals
DE1422040A1 (de) Verfahren zum automatischen Erkennen gesprochener Worte
DE2953968C2 (de) Integrierende Analog-/Digital-Wandlerschaltung
DE1963082A1 (de) Verfahren und Einrichtung zur automatischen Sprachverarbeitung
DE2752522A1 (de) Abstimmbare tonsignal-detektorschaltung
DE2431458C2 (de) Verfahren und Anordnung zur automatischen Sprechererkennung
DE2062589A1 (de) Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals
DE2834751C2 (de)
DE2460079A1 (de) Verfahren zur bestimmung der stellung des schleifers eines potentiometers und schaltungsanordnung zur durchfuehrung des verfahrens
DE1122274B (de) Verfahren und Anordnung zur automatischen Erkennung von Sprache
EP0392049B1 (de) Verfahren zur Dehnung oder Raffung eines Zeitsignals
DE2324692A1 (de) Digital-analog-wandler
DE3533867C2 (de)
DE2003074C3 (de) Mehr-Flanken-Kodieranordnung
AT247018B (de) Anordnung zur Gewinnung einer digitalisierten Darstellung natürlicher Sprache
DE19803722A1 (de) Austastschaltung
DE1940082A1 (de) Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine
DE1951146A1 (de) Phasenkomparator
DE2104012B2 (de) Elektrische Einrichtung zur Erkennung von Sprachlauten
DE3535130A1 (de) Verfahren und einrichtung zur impedanzmessung

Legal Events

Date Code Title Description
D2 Grant after examination
8364 No opposition during term of opposition