DE1487540C3 - Verfahren für Analyse und Synthese von elektrischen Akustiksignalen - Google Patents
Verfahren für Analyse und Synthese von elektrischen AkustiksignalenInfo
- Publication number
- DE1487540C3 DE1487540C3 DE19661487540 DE1487540A DE1487540C3 DE 1487540 C3 DE1487540 C3 DE 1487540C3 DE 19661487540 DE19661487540 DE 19661487540 DE 1487540 A DE1487540 A DE 1487540A DE 1487540 C3 DE1487540 C3 DE 1487540C3
- Authority
- DE
- Germany
- Prior art keywords
- core
- segments
- maximum
- synthesis
- core segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 title claims description 12
- 230000015572 biosynthetic process Effects 0.000 title claims description 9
- 238000003786 synthesis reaction Methods 0.000 title claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000010355 oscillation Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electric Clocks (AREA)
Description
Die Erfindung betrifft ein Verfahren für die Analyse (automatische Erkennung), Übertragung und Synthese
der in elektrischen Akustiksignalen enthaltenen Information gemäß dem Oberbegriff des Anspruchs 1.
Bei derartiger Signalverarbeitung ist die Ableitung von invarianten Merkmalen erforderlich, die einerseits
für alle drei Signalverarbeitungen einheitlich sind, andererseits ohne Redundanz sind. Die Eindeutigkeit
muß bei allen drei Verarbeitungsarten sichergestellt sein.
Es ist bekannt, unterschiedliche Verfahren und Merkmale für die drei Verarbeitungsarten zu verwenden.
Überwiegend wird mit der Frequenzanalyse im Sinne der Bildung und Auswertung von Frequenzen,
insbesondere Momentan-Ausziige aus dem veränderlichen Frequenzspektrum der Sprachschwingungen,
gearbeitet. Auch sind Vorschläge bekanntgeworden, die Signale ganz oder überwiegend aus extrahierten
■"> Form-Merkmalen der Sprachschwingungen zu gewinnen.
Demgegenüber besteht die zu lösende Aufgabe darin, unabhängig von den Frequenzanteilen im Signal und
unabhängig vom Sprecher einen Typen-Code zu finden.
ι» Gemäß der Erfindung wird die gestellte Aufgabe dadurch gelöst wie in Anspruch 1 angegeben. Hierdurch
wird eine Analyse, Übertragung und Nachbildung der in einer Sprachschwingung enthaltenen Information in
codierter Form in verhältnismäßig einfacher, leicht durchführbarer Weise und weitgehend verlustfreier
Rückgewinnbarkeit der Information ermöglicht.
Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Unteransprüchen.
Mit diesen einheitlichen Merkmalen der Kernsegmente hat man schon alle notwendigen Unterscheidungsmerkmale
für die Erkennung, Übertragung und Synthese des Signals.
Weder der Stand der Technik gemäß der deutschen Auslegeschrift 11 97 638, der französischen Patentschrift
14 45 760, der deutschen Auslegeschrift 12 02517, der NTZ, 1965, H 2, S. 57-62, noch ältere
Patentanmeldungen geben die Lehre, durch Lokalisierung Segmente maximaler Amplituden ausgewählte
Abschnitte, die als Kernsegmente einheitliche Merkma-Ie
für die Erkennung, Übertragung und Synthese liefern, zu bilden, da es nicht erkannt wurde, mit diesen
speziellen Merkmalen der Typen-Code, den Kern aus den fortlaufenden Divisionen der Differenzwerte
zwischen dem Maxima und dem Minima Verlauf zu bestimmen, zu kennzeichnen und die im Signal
enthaltene information z. B. der Laute mit diesen speziellen Merkmalen aus den Kernsegmenten zu
identifizieren. NTZ, H. 2, 1965 beinhaltet zwar die Feststellung der Hüllkurven-Maxima, doch fehlt die
■Ό Aussage, daß darunter ein ganzes Segment, das
Kernsegment, fällt und verwendet werden soll. Auch die dort angegebene Mittelwertbildung zwischen aufeinanderfolgenden
Extremwerten (Maximum/Minimum) entspricht der anwendungsgemäßen Lehre nicht, da dies
keine Differenzen- und Verhältnisbildung darstellt.
Es ist auch vorgeschlagen worden, eine Differenzenbildung zwischen den Endpunkten einer Tonperiode
und dem Anfang der nächsten vorzunehmen, entsprechend FR-PS 14 45 760 und DE-AS 14 72 004. Diese
findet aber nicht bei jedem aufeinanderfolgenden Schwingungs-Maximum und Minimum statt, sondern
nur an den Tonperiodenendpunkten und dient auch einem anderen Zweck, nämlich der Erzeugung eines
Sägezahnes zum Zwecke des Ausgleichs der darauf folgenden Periode. Ferner handelt es sich dort lediglich
um einen Vergleich nur von Maximum zu Maximum zum Speichern des größten Maximums. Beide haben
aber weder mit dem Verhältnis der Hubgrößen, die erfindungsgemäß aus den Differenzen gemessen werfet
den, noch mit der Codierung der Hubgrößen-Verhältnisse oder der Kernsegmente eine Verbindung. Um das
vorliegende Verfahren technisch ausführen zu können, gibt es verschiedene Möglichkeiten.
Ein Ausführungsbeispiel soll dies näher erläutern, siehe auch F i g. 1 bis 8. Zur Unterscheidung der in einem
gesprochenen Laut bzw. Wort enthaltenen Information genügt es schon, nur eine Periode gleichartiger
Perioden, Segmente durch Lokalisierung des größten
Maxima bzw. Minima bzw. größte Gesamtaiislenkung
maximaler Amplituden, deren Umhüllenden festzustellen, um ausgewä+ilte Abschnitte zu bilden (Fig. 5), die
als Kernsegmente einheitliche Merkmale bereitstellen. Als weiteres Kriterium braucht nur noch deren Maxima-
> und Minima-Verlauf, in dem die gegenseitigen Größenverhältnisse
der Hübe, d. h. die Differenzwerte zwischen den Maxima und Minima (Fig.3a) nach fortlaufender
Division zu typischen Reihen zusammengefaßt, als Typen-Code den Kern kennzeichnen. Mit Hilfe dieser i<
> Kriterien kann man z. B. die gesprochenen Laute, Worte eindeutig erkennen, unterscheiden, übertragen und
synthetisch herstellen. In Fig.4 ist ein ßlockschema für
eine mögliche Ausführung eines einfachen Gerätes zur Verwirklichung des genannten Verfahrens dargestellt.
Die Schallschwingungen der gesprochenen Laute werden, wie das Blockschaltbild Fig.4 zeigt, in ein
Mikrophon W eingesprochen, über einen Verstärker V zu einem Scheitel-Detektor SE entsprechend Fig. 1
geleitet. Die Ausgangs-Impulse siM und sim des Detektors steuern über jetzt zusammenfassend mit G
bezeichnete Torschaltungen die Speicherung der Scheitelamplituden in dem Scheitelwertspeicher SS, wie
er anhand von Fi g. 2, 2a beschrieben ist. Mit SD ist der Scheitelamplituden-Differenzbildner nach Fig. 3 bezeichnet.
Dieser gibt in der bereits erläuterten Weise von Fig. 3a die schraffierten, nach Maßgabe der
Scheitelwertdifferenzen modulierten, Impulse HA an. Diese Impulse gelangen auf eine Umsetzungsschaltung
AM/DM, die in bekannter Art die amplitudenmodulier- jo
ten Impulse in dauermodulierte Impulse umsetzt. Dies kann z. B. wie bekannt durch einen Sägezahn SG und
Begrenzer BG erfolgen und so einen Impulsgenerator IG über ein Tor Gl steuern, so daß die Dauer der
Impulse der Anzahl von IG entspricht, der auf einen Impulszähler /Zl Klemme 5 und 6 als Code zur
Verfügung steht, dem Anspruch 2 entsprechend. In dem Blockschaltbild der Fig.4 sind außer der Klemme 6
noch Klemmenl —5 vorgesehen, die mit verschiedenen Zwischenpunkten der bisher angegebenen Schaltung
verbunden sind. Entsprechend den Darstellungen der Fig. 5 wird die Typisierung nach Typen Tj,e nach den
gegenseitigen Größenverhältnissen der Hübe zwischen den Scheiteln vorgenommen, wobei der Verlauf nach
F i g. 3a für die Typisierung an Klemme 3 herangezogen wird. Die Anzahl der Hübe in einem Segment wird an
Klemme 8 angegeben.
Die Lokalisierung von Segmenten maximaler Amplitude erfolgt zunächst durch den Block SEi; er ist im
wesentlichen aufgebaut wie die Schaltung SE, also entsprechend Fig. 1, und zeigt durch den Impuls hsM
das Hüllkurven-Maximum und durch hsm das Hüllkurven-Minimum
an.
Die weitere Stufe SE2, gesteuert durch das Tor G 9 von SEi, arbeitet wiederum wie Fig. 1, so daß
ausgewählte Abschnitte gebildet werden, die als Kernsegmente einheitliche Merkmale darstellen. Die
wiederholte Anwendung dieser Schaltung liefert übergeordnete Hüllkurven. Für die Erkennung werden so an
diesen Stellen AsM die Typen-Code von Klemme 3 bzw.
1 bis 6 abgenommen.
Für die Übertragung werden die zwischen diesen Kernsegmenten liegenden, unwesentlichen Segmente,
Abschnitte durch ein Tor unterdrückt und nur der Kernsegment-Code als Signalkomprimierung übertragen.
Für die Synthese werden die gleichen Kernsegmente-Merkmale durch Wiederholung bis zum jeweils
nächsten Kernsegment wieder aufgefüllt und entsprechend F ig. 8 aus dem Hubgrößenverlauf wie H Fig. 3a
(»Zinnenkurve«) wieder dem zugehörigen Scheitelamplitudenverlauf wie Z in F i g. 2a zurückgewonnen :bzw.
hergestellt. Über einen Tiefpaß TP werden die Impulse zu Schwingungen verschliffen, wie sie in Fig.8b
gestrichelt eingezeichnet ist, und über den Verstärker VL auf einen Lautsprecher L hörbar gemacht.
Wie bereits erwähnt gibt es verschiedene Möglichkeiten, das vorliegende Verfahren technisch auszuführen.
Fig.6 zeigt ein Blockschaltbild, das die Codierung der
Anzahl N der Scheitel und der Typen T für die g- und r-Schwingung Fig.5a ermöglicht und eine Sprachcodier-
und Erkennungsschaltung darstellt. Das Eingangssignal gelangt über den Wandler Wund Verstärker V
auf einen Scheitelwert-Extrahierer SA gemäß 2a und Kernsegmentierung. Danach werden in einem g-r-Separator
Sg/rd\e Scheitelwerte des g- und des r-Anteils des
Signals separiert. In einer nachfolgenden Stufe werden nebeneinander die größten N(g), T(g), N(r) und T(r)
bereitgestellt. Diese Größen werden einer Kodiermatrix Mxzugeführt, an deren Ausgängen ein Lautanzeigespeicher
L Sp angeschlossen ist. Von diesem aus können Lautindikatoren (Taste, Lampen od. dgl.) betätigt
werden.
Eine relativ einfache Schaltung, eine Sprach- oder Signalinformation von vornherein synthetisch zu bilden
entsprechend dem Scheitelverlauf F i g. 2a, ist mit F i g. 7 gegeben. Hier ist ein Ringzähler RZ vorgesehen, in dem
durch die Impulse eines Schiebetaktgenerators RG ein L-Zustand von Stufe zu Stufe (in F i g. 7 nach oben)
weiter- und von der letzten Stufe wieder in die erste Stufe geschoben wird. Wenn das »L« in die erste Stufe
gelangt, gibt diese Stufe über eine Leitung si einen Impuls auf ein bistabiles Flip-Flop FFl, das hierdurch
umgeschaltet wird und über einen Ausgang a I ein Tor G12 durchlässig macht, über welches ein Kondensator
C sich linear aufzuladen beginnt. In den Spalten der Matrix werden von links nach rechts Spannungswerte
eingestellt, die z. B. den Scheitelspannungswerten des Verlaufs Z in F i g. 2a entsprechen. Am Ausgang AS
entsteht eine Folge von amplitudenverschiedenen Impulsen, etwa wie MA und mA in Fig.2a oder H
Fig.3a. Diese Segmente werden über GZgestrichelte
Linie beliebig oft automatisch wiederholt, zweckmäßigerweise bis ein neues anderes Kernsegment eingestellt
ist. Über einen Lautsprecher nach AS können so ganze Folgen von Kernsegmenten d. h. Laute und
Worte hörbar gemacht werden.
Hierzu 6 Blatt Zeichnungen
Claims (6)
1. Verfahren für die Analyse, automatische Erkennung, Übertragung und Synthese der in
elektrischen Akustiksignalen, insbesondere Sprachsignalen enthaltenen Information in der Form von
extrahierten Teilmerkmalen, Segmenten des Signals, das bereits als extrahierte Maxima- und Minima-Folge
vorliegen kann, gekennzeichnet durch folgende Merkmale:
a) daß durch Lokalisierung von Segmenten maximaler und minimaler Amplituden ein ausgewählter
Abschnitt gebildet wird, der als Kernsegment einheitliche Merkmale für die Erkennung durch Bestimmung dessen Maxima-
und Minima-Verlaufs liefert, in dem die Differenzwerte zwischen den Maxima und Minima nach fortlaufender Division zu typischen
Reihen zusammengefaßt und als Kernsegment-Code (Typen-Code) den Kern kennzeichnen;
b) Übertragung durch Weglassen aller Segmente, die zwischen zwei Kernsegmenten liegen, als
Signal-Komprimierung wird nur der Kernsegmente-Code übertragen;
c) Synthese durch Wiederholungen des jeweils letzten Kernsegmentes bis zum nächsten
Kernsegment die Lücken zwischen den Kernsegmenten wieder aufgefüllt werden, wobei die
Wiederholungen der Größe der Kernsegmente als Hüllkurve folgen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß statt aller Amplituden-Maxima und
Minima-Werte die Zeitwerte zwischen diesen verwendet werden und mit diesen entsprechend den
Amplitudenwerten verfahren wird.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß Kernsegmente vom Maximum
bzw. Minimum der Hüllkurven verschiedener Ordnung den Typen-Code kennzeichnen.
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß die Scheitel-Anzahl und -Typen
innerhalb der Kernsegmente codiert werden.
5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß die Kernsegmente zur weiteren
Verarbeitung lokalisiert werden.
6. Verfahren nach Anspruch 1 bis 5, dadurch gekennzeichnet, daß die Frequenzanteile der Kernsegmente
weiterverarbeitet werden.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DET0032642 | 1966-12-01 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1487540A1 DE1487540A1 (de) | 1969-04-24 |
DE1487540B2 DE1487540B2 (de) | 1980-10-30 |
DE1487540C3 true DE1487540C3 (de) | 1981-06-25 |
Family
ID=7557186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19661487540 Expired DE1487540C3 (de) | 1966-12-01 | 1966-12-01 | Verfahren für Analyse und Synthese von elektrischen Akustiksignalen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE1487540C3 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2834751A1 (de) * | 1977-08-09 | 1979-02-22 | Kentron Epistimonikon Ke Efirm | Sprachkodierungs-system |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1963082C2 (de) * | 1969-12-16 | 1984-08-02 | Heinz Dipl.-Phys. 7801 Umkirch Kusch | Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung |
DE2853219A1 (de) * | 1978-12-09 | 1980-09-25 | Heinz Dipl Phys Kusch | Verfahren zur automatischen erkennung der tonhaltigkeit |
DE3329208A1 (de) * | 1983-08-12 | 1985-02-28 | H. Dipl.-Phys. 7801 Umkirch Kusch | Verfahren fuer datenreduktion von sprachsignalen |
-
1966
- 1966-12-01 DE DE19661487540 patent/DE1487540C3/de not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2834751A1 (de) * | 1977-08-09 | 1979-02-22 | Kentron Epistimonikon Ke Efirm | Sprachkodierungs-system |
Also Published As
Publication number | Publication date |
---|---|
DE1487540A1 (de) | 1969-04-24 |
DE1487540B2 (de) | 1980-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2034623C2 (de) | Verfahren für das Erkennen von Sprachsignalen in Rauschen | |
DE2547597C2 (de) | Verfahren und Vorrichtung zur Kompression und Expansion von Digitalcodewörtern | |
DE1487540C3 (de) | Verfahren für Analyse und Synthese von elektrischen Akustiksignalen | |
DE2403651B2 (de) | Schaltungsanordnung für die nichtlineare Umwandlung von digitalen Binärziffern in digitale Signale | |
DE1149745B (de) | Puls-Kode-Nachrichtenuebertragungssystem | |
DE2461581C3 (de) | Adaptives Deltamodulationssystem | |
DE1945782A1 (de) | Geraet zur Umsetzung eines frequenzverschobenen Sprachsignals | |
EP0027233B1 (de) | Verfahren zur Codierung von Analogsignalen | |
DE2702497C2 (de) | Verfahren und Anordnung zur Verminderung von verständlichem Übersprechen zeitlich nacheinander abgetasteter Kanäle in einem Zeitmultiplexsystem | |
DE2139918A1 (de) | Analog Digital Codierer | |
DE4111781A1 (de) | Computersystem zur spracherkennung | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE1069406B (de) | Imtpuilsgruppensortierung | |
DE1290606B (de) | Zeitmultiplex-UEbertragungsverfahren mit lagemodulierten Adressenkodes | |
DE2432976A1 (de) | Codier- und decodiereinrichtung fuer zeitmultiplex-fernsprechsysteme | |
DE1122581B (de) | Verfahren und Schaltungsanordnung zur angenaeherten Nachbildung der Kurzzeitspektren von nach dem Vocoderverfahren uebertragenen Sprachsignalen | |
DE1472011C3 (de) | ||
DE2442674A1 (de) | Mehrfrequenzempfaenger | |
DE2834751C2 (de) | ||
DE2718631A1 (de) | Verfahren zur digitalen uebertragung von qualitativ hochwertigen tonsignalen | |
DE1191124B (de) | Verfahren und Anordnung zur zeitlichen Dehnung oder Verdichtung von Sprachlauten | |
DE978016C (de) | Verfahren zur Übertragung von Signalen nach Art der Delta-Modulation | |
DE3346501C2 (de) | Digitalsignal-Multiplexgerät | |
DE2539769B2 (de) | Digitale Pulsmodulation mit Dynamikbegrenzung | |
DE1512816C (de) | Verfahren und System zum Übertragen eines Sprechfrequenzspektrums von einem Sender zu einem Empfänger |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OF | Willingness to grant licences before publication of examined application | ||
OF | Willingness to grant licences before publication of examined application | ||
C3 | Grant after two publication steps (3rd publication) | ||
8339 | Ceased/non-payment of the annual fee |