DE1963082A1 - Verfahren und Einrichtung zur automatischen Sprachverarbeitung - Google Patents
Verfahren und Einrichtung zur automatischen SprachverarbeitungInfo
- Publication number
- DE1963082A1 DE1963082A1 DE19691963082 DE1963082A DE1963082A1 DE 1963082 A1 DE1963082 A1 DE 1963082A1 DE 19691963082 DE19691963082 DE 19691963082 DE 1963082 A DE1963082 A DE 1963082A DE 1963082 A1 DE1963082 A1 DE 1963082A1
- Authority
- DE
- Germany
- Prior art keywords
- values
- groups
- signal
- speech
- extreme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 5
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 239000003990 capacitor Substances 0.000 claims description 4
- 238000007599 discharging Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 claims 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 claims 1
- 230000002596 correlated effect Effects 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- BEZEICHNUNG : Verfahren und Einrichtung zur automatischen Sprachverarbeitung STICHWORT : Spracherkennung SACHGEBIET : ERFINDER : Heinz Kusch BERUF : Physiker | NATIONALITÄT : deutsch ADRESSe : 8036 Herrsching, Leitenhöhe 41 INHALTSANGABE Die Erfindung betrifft ein Verfahren und zugehörige Einrichtungen zur Extrahierung typischer Signale, der Kompression und/oder Synthetisierung von Sprachsignalen.
- Das Sprachsignal wird erfindungsgemäß in seine Extremwerte gegliedert deren aufeinanderfolgende Abstände zueinander ins Verhältnis eesetzt und so ihre typischen Gruppen(Laute) charakterisieren, die wiederum zu Wortkombination zusammengefaßt werden.
- Es ist weiter vorgesehen, die Funktionen der erkannten Laute zur Vornahme von Schalthandlungen einzusetzen; fernerVSprachkompression zu verwenden. Die Umkehrung des Verfahrens ermöglicht synthetische Sprache zu erzeugen.
- VERFAHREN UND EINRICHTUNG ZUR AUTOMATISCHEN SPRACHVERARRP,ITUNfi Unter den neueren Methoden zur Sprachverarbeitung sind Frequenz Amplituden-Zeit-Verfahren von besonderem Interesses Die Aufgabe dieser Verfahren besteht u.a. darin, redundante Bestandteile des Sprachsignals zu entfernen und Informationen abzuleiten, die eine zweckmäßige Signal-Verarbeitung insbesondere eine automatische irkennung ermöglichen. Um dieses zu erreichen werden überwiegend die Frequenzanteile des Sprachsignals analysiert, wobei die Sprache in Form abgetasteter Zeitfunktionen verarbeitet wird. Es sind auch Vorschläge bekannt, die Signale ganz oder überwiegend aus FormMerkmalen der Sprachschwingungen gewinnen.Nebr. Abtastverfahren die mit äquidistanten Abständen aus dem Signal Proben entnehmen und durch Vergleich relevante Extremwerte feststellen, gibt es auch Verfahren die Extremwerte durch die Nulldurchgänge der ersten Ableitung f'(x) iarkieren. Die Genauigkeit dieser Verfahren ist aber jiber einen größeren Frequenzbereich nicht groß. Bei dem ersten ist die Ungenauigkeit durch die Breite der äquidistqnten Abstände gegeben und bei der technischen Differentiation durch die Konstante T von R,C.
- Die ungünstige Amplituden- und Frequenzabhängigkeit ist aus der Formel ersichtlich. U = U sin qv t erleidet durch das R,C-Glied e eine Phasenverschiebung von tan#= wird I1C unter gleichzeitiger Abnahme der Amplitude um den Faktor . Die flochpaßwirkung des R,C-liedes bewirkt eine ungünstige Bevorzugung der hohen Frequenzen.
- Demgegenüber schlägt die Erfindung zunächst ein Verfahren mit zugehöriger Einrichtung vor, das kontinuierlich die Extrahierung der Extreme in verhältnismäßig leicht durchführbarer Weise über den großen Frequenz~ bzw. Amplitudehbereich des gesamten Sprachbandes ermöglicht. Erreicht wird dieses erfindungsgemäß dadurch, daß die Extrema, durch die Differenzwerte die über ein entgegengerichtetes Diodenpaar durch Auf- und Entladen. eines Kondensators entstehen, markiert werden. Es werden Einrichtungen vorgeschlagen, die zur Durchführung des vorgenannten Verfahrens besonders geeignet sind.
- Weiterhin werden erfindungsgemäß Verfahren und Einrichtungen, die eine besondere Verarbeitung der relevanten Extremwerte vorsehen, beschrieben. Dabei schlägt die Erfindung ein Signal-Verhältnisgruppen-Verfahren vor mit dem typische Signal-Verhältnisgruppen Folgen extrahiert, SprachkomprSssion oder Synthese in verhältnismäßig leicht durchführbarer Weise und mit weitgehend verlustfreier Rückgewinnbarkeit der Lautinformation ermöglicht werden0 rfindungsgemäß wird dieses dadurch erreicht, daßddie Abstände der Extremwerte zueinander ins Verhältnis gesetzt und diese zu typischen Gruppen zusaengefaßt als neue Informationsgröße Aussalzen über Invarianten der Sprache darstellen. Redundante Bestandteile des Sprachsignals, Flankenverläute und absolute Werte entfallen dadurch. Wiederholungen werden dagegen gezählt und das Ergebnis codiert. Die Codierung der solcher Art gewonnenen Größen führt zu einep automatischen Erkennung der Sprache und/oder zur Sprachkompression bzw. zur synthetischen Sprache.
- Die Möglichkeit, daß man aus einer Schwingung Proben gerade an den Stellen ihrer Scheitel entnehmen kann ist an sich nicht unbekannt.
- Die Erfindung hat aber das Verdienst neben einem sehr einfachen Extrahierungsverfahren erkannt zu haben, daß man beim Sprachsignal durch Verhältnisbildung der Extremwertahstände dem Sprachsignal äquivalente und durch Gruppenbildung dieser stark vereinfachte typische Signal folgen erhält die zur Lösung der eingangs genannten Aufgaben führt.
- Es werden Einrichtungen vorgeschlagen, die zur Durchführung der vorgenannten Verfahren besonders geeignet sind, aber auch für die Umsetzung anderer Signale verwendet werden könnens Weitere in diesem Rahmen vorgesehene Verfahrens- und Sinrichtungsmerkmale, die der Durchführung und Anwendung der Erfindung mehr im einzelnen dienen, sind den auf sie gerichteten Patentansprüchen entnehmbar.
- Nachfolgend werden beispielsweise Ausführungsmöglichkeiten der Erfindung anhand der Zeichnungen näher beschrieben.
- Im ersten Beispiel wird einen Schaltungsanordnung nach Fig.1 gezeigt, die in einfacher Weise eine Auf- und Entladung eines--Speicherkondensators C durch ein in tegensätzlicher Richtung geschaltetes Diodenpaar vornimmt. In der Zeitspanne zwischen Auf- und Entladung Oes Signals f(x) entsteht ein Spannungsabfall zwischen den Extremwerten an den Dioden Dl,D2, der von einem Komparator K angezeigt wird.
- Der Impuls am Ausgang des Komparators markiert so die Extremwerte E,e des Signals.
- In der Schaltungsanordnung gemäß Fig.2 wird ein zweites-Beispiel erläutert das die Verhältnisse von den Abständen benachbarter Extremwerte (ebenfalls fortlaufend) bestimmt. Die Werte des Signals f(x) werden zunächst von Extremwert E zu Extremwert e durch ein getrenrites Diodenpaar Dl,D2 in den nachfolgenden Kondensatoren C1,C2 gespeichert.
- Durch die Schalter S1,S2 werden die Dioden wechselweise überbrückt. Gesteuert werden die Schalter über ein F1F1 durch den Komparatorimpuls E,e . Die Spannung über den Dioden D1 und D2 werden von den Differenzenverstärkern Vl,V2 abgenommen und einzeln über Logarithmierverstärker L1,L2 geleitet. Durch die Differenzenbildung mittels eines Differenzenverstätkers DV der an beide Logarithmierverstärkerausgänge angeschlossen ist entsteht: log V1 - log v2 s log Diese Schaltung erlaubt also neben der Bildung der Abstände E - e von Extremwert E zu Extremwert e noch die Bestimmung der Verhältnisse V1 v2 v2 ,V3 ... von Abstand E1,1 zu Abstand ES,e2 . Es entsteht so neben einer Differenzen Folge l,e2;e2,E3;.., eine Verhältnis Folge V1,v2;v2,V3;...
- Im dritten Beispiel wird in Fig 3 eine Schaltungsanordnung gezeigt die Verhältnis folgen zu Gruppen zusammenfaßt. Dieses geschieht durch einen Steuerungsanteil ST und einen Codierteil CT ; ferner durch eine Anzeige A das das Codierungsergebnis des erkannten Lautes anzeigt. Eine Ausführungsmöglichkeit besteht hierbei aus einer Widerstandsmatrix RM deren Widerstände so angelegt werden , daß die Korrelation mit dem Signal den kleinsten Abstand ergeben nach der Formel: Die Referenzpannungen Rs werden dabei durch eine Schalteranordnung S die von einem Schieberegister SR gesteuert werden durchlaufend abgefragt. Der beginn und das Ende der Abfrage wird fortlaufend bei Übereinstimmung der Referenzspannung mit der Codierung ausgelöst.
- Es wird also bei Übereinstimmung der jeweilige Laut L erkannt.
- n Zinke andere Ausführungsmöglichkeit wird dadurch erhalten, daß die Extremwerte der Hüllkurven über das Eingangssignal die Anfangs-und Endpunkte für die Abfrage der Codiermatrix , festlegt, wobei statt der Widerstandsmatrix Verhältnisbereiche VB codiert werden 5. Fig.4 die dann den entsprechenden Laut Ln anzeigen A
Claims (13)
- PATENTANSYItiJCHZ 1. Verfahren zur automatischen Sprachverarbeitung in Form von Ableitung relevanter Informationen und Reduzierung redundanter Bestandteile von Sprachsignalen dadurch gekennzeichnet,daß die Extremwerte des Sprachsignals und/oder deren Abstände extrahiert und/oder diese zueinander ins Verhältnis gesetzt und/oder Diese zu Gruppen zusammengefaßt als typische Informationsgrößen codiert zur weiteren Verarbeitung gelangen.
- 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,daß die Extremwerte des Signals durch die Differenzwerte , die über einem Element mit Diodenwirkung in beiden Richtungen mit nachfolgendem sich auf- und entladenden Kondensator entstehen und einen Komparator zur Wirkung bringen, markiert werden.
- 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,daß die Werte der Zeit und/oder Amplituden der Abstände der Extremwerte fortlaufend jeweils miteinander verglichen und deren Verhältniswerte bestimmt und/oder zu Gruppen zusammengefaßt werden.
- 4. Verfahren nach Anspruch 1 bis 3 dadurch gekennzeichnet,daß die Gruppenbildung der Differenzwerte und/oder der Verhältniswerte durch: Feststellung gleicher Wiederholungen der Werte und/oder durch die Extrema der Hüllkurven die über die Werte und/oder die Amplituden und/oder Zeitwerte des Signals gebildet werden.
- 5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet,daß gleiche Gruppen gezählt und/oder codiert werden und/oder zu neuen Gruppen zusammengefaßt und/oder nur jeweils eine der gleichen Gruppen allein weiter verarbeitet wird.
- 6. Verfahren nach Anspruch 1 bis 5 dadurch gekennzeichnet,daß die Werte in den Gruppen und/oder der gesamten Gruppe und/oder mehrerer Gruppen durch Codierung und/oder einer Widerstandsmatrix zusammengefaßt werden0
- 7. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet,daß zur Bearbeitung des Signals Sprachschwingungen herangezogen werden und/oder deren Frequenzanteile und/oder deren Amplituden und/oder deren Zeitwerte und/oder andere Signale z.B. Impuisfolgen von Datenverarbeitungsanlagen.
- 8. Verfahren nach Anspruch 1 bis 7, dadurch gekennzeichnet,daß durch Anwendung und/oder Codierung der Werte,Laute und/eder Worte angezeigt und/oder geschrieben und/oder Schaithandlungen ausgeführt und/oder Signalkompression und/oder synthetische Sprache hergestellt werden.
- 9. Verfahren nach Anspruch 1 bis 8, dadurch gekennzeichnet,daß das Verfahren in Software hergestellt wird.
- 10. 6'inrichtung zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 8 oder Analyse oder Kompression oder Synthese oder zur Vornahme von Schaithandlungen der in einem Signal enthaltenen Information, gekennzeichnet durch Extremwerterkennungsschaltungen die Extrem~ werte aus Signalen erkennen und dadurch jeweils erzeugte Impulse die Feststellung der Abstände zwischen den Extremwerten ermöglichen und Mittel die von diesen fortlaufend die Verhältnisse zueinander messen und diese Größen übertragen bzw. in den Kode aufFenommen werden.
- 11. Einrichtung nach Anspruch 10 dadurch gekennzeichnet,daß mit diesen Einrichtungen Sprache automatisch erkannt wird und diese Vorgänge auslöst die durch das erkannte Signal Schalthandlungen ausführt.
- 12. Einrichtung nach Anspruch 10 und 11 dadurch gekennzeichnet1daß eine Codierung der Laute zu Worten erfolgt und diese eine Auswahl von Kombination trifft und durch diese eine automatische Steuerung durchführt und/oder diese durch synthttische Sprache mitteilt.
- 13. Einrichtung nach Anspruch 1 bis 12 dadurch gekennzeichnet'daß nach Fig. 2,3 und deren Beschreibung verfahren wird.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19691963082 DE1963082C2 (de) | 1969-12-16 | 1969-12-16 | Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19691963082 DE1963082C2 (de) | 1969-12-16 | 1969-12-16 | Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung |
Publications (2)
Publication Number | Publication Date |
---|---|
DE1963082A1 true DE1963082A1 (de) | 1971-06-24 |
DE1963082C2 DE1963082C2 (de) | 1984-08-02 |
Family
ID=5754042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19691963082 Expired DE1963082C2 (de) | 1969-12-16 | 1969-12-16 | Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE1963082C2 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1197638B (de) * | 1958-09-29 | 1965-07-29 | Heinz Kusch | Verfahren zum selbsttaetigen Umsetzen von Lautschwingungen in Lauterkennungs-Signale |
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
DE1487540A1 (de) * | 1966-12-01 | 1969-04-24 | Telefunken Patent | Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information |
DE1802502A1 (de) * | 1967-10-13 | 1969-05-14 | Ibm | Schaltungsanordnung zur Festellung der Anwesenheit von Sprachlauten |
-
1969
- 1969-12-16 DE DE19691963082 patent/DE1963082C2/de not_active Expired
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1197638B (de) * | 1958-09-29 | 1965-07-29 | Heinz Kusch | Verfahren zum selbsttaetigen Umsetzen von Lautschwingungen in Lauterkennungs-Signale |
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
DE1487540A1 (de) * | 1966-12-01 | 1969-04-24 | Telefunken Patent | Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information |
DE1802502A1 (de) * | 1967-10-13 | 1969-05-14 | Ibm | Schaltungsanordnung zur Festellung der Anwesenheit von Sprachlauten |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
Also Published As
Publication number | Publication date |
---|---|
DE1963082C2 (de) | 1984-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2753277C2 (de) | Verfahren und Einrichtung zur Spracherkennung | |
DE3633791A1 (de) | Verfahren und anordnung zur messung des widerstandsverhaeltnisses an einer widerstands-halbbruecke | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
DE1903759A1 (de) | Digitalkorrelator | |
DE2634426A1 (de) | Bandkompressionseinrichtung | |
DE2150180A1 (de) | Vorrichtung zum Auswerten der Steigung eines Signals | |
DE1422040A1 (de) | Verfahren zum automatischen Erkennen gesprochener Worte | |
DE2953968C2 (de) | Integrierende Analog-/Digital-Wandlerschaltung | |
DE1963082A1 (de) | Verfahren und Einrichtung zur automatischen Sprachverarbeitung | |
DE2752522A1 (de) | Abstimmbare tonsignal-detektorschaltung | |
DE2431458C2 (de) | Verfahren und Anordnung zur automatischen Sprechererkennung | |
DE2062589A1 (de) | Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals | |
DE2834751C2 (de) | ||
DE2460079A1 (de) | Verfahren zur bestimmung der stellung des schleifers eines potentiometers und schaltungsanordnung zur durchfuehrung des verfahrens | |
DE1122274B (de) | Verfahren und Anordnung zur automatischen Erkennung von Sprache | |
EP0392049B1 (de) | Verfahren zur Dehnung oder Raffung eines Zeitsignals | |
DE2324692A1 (de) | Digital-analog-wandler | |
DE3533867C2 (de) | ||
DE2003074C3 (de) | Mehr-Flanken-Kodieranordnung | |
AT247018B (de) | Anordnung zur Gewinnung einer digitalisierten Darstellung natürlicher Sprache | |
DE19803722A1 (de) | Austastschaltung | |
DE1940082A1 (de) | Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine | |
DE1951146A1 (de) | Phasenkomparator | |
DE2104012B2 (de) | Elektrische Einrichtung zur Erkennung von Sprachlauten | |
DE3535130A1 (de) | Verfahren und einrichtung zur impedanzmessung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition |