DE1487540C3 - Verfahren für Analyse und Synthese von elektrischen Akustiksignalen - Google Patents

Verfahren für Analyse und Synthese von elektrischen Akustiksignalen

Info

Publication number
DE1487540C3
DE1487540C3 DE19661487540 DE1487540A DE1487540C3 DE 1487540 C3 DE1487540 C3 DE 1487540C3 DE 19661487540 DE19661487540 DE 19661487540 DE 1487540 A DE1487540 A DE 1487540A DE 1487540 C3 DE1487540 C3 DE 1487540C3
Authority
DE
Germany
Prior art keywords
core
segments
maximum
synthesis
core segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19661487540
Other languages
English (en)
Other versions
DE1487540A1 (de
DE1487540B2 (de
Inventor
Heinz Dipl.-Phys. 7801 Umkirch Kusch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of DE1487540A1 publication Critical patent/DE1487540A1/de
Publication of DE1487540B2 publication Critical patent/DE1487540B2/de
Application granted granted Critical
Publication of DE1487540C3 publication Critical patent/DE1487540C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electric Clocks (AREA)

Description

Die Erfindung betrifft ein Verfahren für die Analyse (automatische Erkennung), Übertragung und Synthese der in elektrischen Akustiksignalen enthaltenen Information gemäß dem Oberbegriff des Anspruchs 1.
Bei derartiger Signalverarbeitung ist die Ableitung von invarianten Merkmalen erforderlich, die einerseits für alle drei Signalverarbeitungen einheitlich sind, andererseits ohne Redundanz sind. Die Eindeutigkeit muß bei allen drei Verarbeitungsarten sichergestellt sein.
Es ist bekannt, unterschiedliche Verfahren und Merkmale für die drei Verarbeitungsarten zu verwenden. Überwiegend wird mit der Frequenzanalyse im Sinne der Bildung und Auswertung von Frequenzen, insbesondere Momentan-Ausziige aus dem veränderlichen Frequenzspektrum der Sprachschwingungen, gearbeitet. Auch sind Vorschläge bekanntgeworden, die Signale ganz oder überwiegend aus extrahierten ■"> Form-Merkmalen der Sprachschwingungen zu gewinnen.
Demgegenüber besteht die zu lösende Aufgabe darin, unabhängig von den Frequenzanteilen im Signal und unabhängig vom Sprecher einen Typen-Code zu finden.
ι» Gemäß der Erfindung wird die gestellte Aufgabe dadurch gelöst wie in Anspruch 1 angegeben. Hierdurch wird eine Analyse, Übertragung und Nachbildung der in einer Sprachschwingung enthaltenen Information in codierter Form in verhältnismäßig einfacher, leicht durchführbarer Weise und weitgehend verlustfreier Rückgewinnbarkeit der Information ermöglicht.
Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Unteransprüchen.
Mit diesen einheitlichen Merkmalen der Kernsegmente hat man schon alle notwendigen Unterscheidungsmerkmale für die Erkennung, Übertragung und Synthese des Signals.
Weder der Stand der Technik gemäß der deutschen Auslegeschrift 11 97 638, der französischen Patentschrift 14 45 760, der deutschen Auslegeschrift 12 02517, der NTZ, 1965, H 2, S. 57-62, noch ältere Patentanmeldungen geben die Lehre, durch Lokalisierung Segmente maximaler Amplituden ausgewählte Abschnitte, die als Kernsegmente einheitliche Merkma-Ie für die Erkennung, Übertragung und Synthese liefern, zu bilden, da es nicht erkannt wurde, mit diesen speziellen Merkmalen der Typen-Code, den Kern aus den fortlaufenden Divisionen der Differenzwerte zwischen dem Maxima und dem Minima Verlauf zu bestimmen, zu kennzeichnen und die im Signal enthaltene information z. B. der Laute mit diesen speziellen Merkmalen aus den Kernsegmenten zu identifizieren. NTZ, H. 2, 1965 beinhaltet zwar die Feststellung der Hüllkurven-Maxima, doch fehlt die
■Ό Aussage, daß darunter ein ganzes Segment, das Kernsegment, fällt und verwendet werden soll. Auch die dort angegebene Mittelwertbildung zwischen aufeinanderfolgenden Extremwerten (Maximum/Minimum) entspricht der anwendungsgemäßen Lehre nicht, da dies keine Differenzen- und Verhältnisbildung darstellt.
Es ist auch vorgeschlagen worden, eine Differenzenbildung zwischen den Endpunkten einer Tonperiode und dem Anfang der nächsten vorzunehmen, entsprechend FR-PS 14 45 760 und DE-AS 14 72 004. Diese findet aber nicht bei jedem aufeinanderfolgenden Schwingungs-Maximum und Minimum statt, sondern nur an den Tonperiodenendpunkten und dient auch einem anderen Zweck, nämlich der Erzeugung eines Sägezahnes zum Zwecke des Ausgleichs der darauf folgenden Periode. Ferner handelt es sich dort lediglich um einen Vergleich nur von Maximum zu Maximum zum Speichern des größten Maximums. Beide haben aber weder mit dem Verhältnis der Hubgrößen, die erfindungsgemäß aus den Differenzen gemessen werfet den, noch mit der Codierung der Hubgrößen-Verhältnisse oder der Kernsegmente eine Verbindung. Um das vorliegende Verfahren technisch ausführen zu können, gibt es verschiedene Möglichkeiten.
Ein Ausführungsbeispiel soll dies näher erläutern, siehe auch F i g. 1 bis 8. Zur Unterscheidung der in einem gesprochenen Laut bzw. Wort enthaltenen Information genügt es schon, nur eine Periode gleichartiger Perioden, Segmente durch Lokalisierung des größten
Maxima bzw. Minima bzw. größte Gesamtaiislenkung maximaler Amplituden, deren Umhüllenden festzustellen, um ausgewä+ilte Abschnitte zu bilden (Fig. 5), die als Kernsegmente einheitliche Merkmale bereitstellen. Als weiteres Kriterium braucht nur noch deren Maxima- > und Minima-Verlauf, in dem die gegenseitigen Größenverhältnisse der Hübe, d. h. die Differenzwerte zwischen den Maxima und Minima (Fig.3a) nach fortlaufender Division zu typischen Reihen zusammengefaßt, als Typen-Code den Kern kennzeichnen. Mit Hilfe dieser i< > Kriterien kann man z. B. die gesprochenen Laute, Worte eindeutig erkennen, unterscheiden, übertragen und synthetisch herstellen. In Fig.4 ist ein ßlockschema für eine mögliche Ausführung eines einfachen Gerätes zur Verwirklichung des genannten Verfahrens dargestellt. Die Schallschwingungen der gesprochenen Laute werden, wie das Blockschaltbild Fig.4 zeigt, in ein Mikrophon W eingesprochen, über einen Verstärker V zu einem Scheitel-Detektor SE entsprechend Fig. 1 geleitet. Die Ausgangs-Impulse siM und sim des Detektors steuern über jetzt zusammenfassend mit G bezeichnete Torschaltungen die Speicherung der Scheitelamplituden in dem Scheitelwertspeicher SS, wie er anhand von Fi g. 2, 2a beschrieben ist. Mit SD ist der Scheitelamplituden-Differenzbildner nach Fig. 3 bezeichnet. Dieser gibt in der bereits erläuterten Weise von Fig. 3a die schraffierten, nach Maßgabe der Scheitelwertdifferenzen modulierten, Impulse HA an. Diese Impulse gelangen auf eine Umsetzungsschaltung AM/DM, die in bekannter Art die amplitudenmodulier- jo ten Impulse in dauermodulierte Impulse umsetzt. Dies kann z. B. wie bekannt durch einen Sägezahn SG und Begrenzer BG erfolgen und so einen Impulsgenerator IG über ein Tor Gl steuern, so daß die Dauer der Impulse der Anzahl von IG entspricht, der auf einen Impulszähler /Zl Klemme 5 und 6 als Code zur Verfügung steht, dem Anspruch 2 entsprechend. In dem Blockschaltbild der Fig.4 sind außer der Klemme 6 noch Klemmenl —5 vorgesehen, die mit verschiedenen Zwischenpunkten der bisher angegebenen Schaltung verbunden sind. Entsprechend den Darstellungen der Fig. 5 wird die Typisierung nach Typen Tj,e nach den gegenseitigen Größenverhältnissen der Hübe zwischen den Scheiteln vorgenommen, wobei der Verlauf nach F i g. 3a für die Typisierung an Klemme 3 herangezogen wird. Die Anzahl der Hübe in einem Segment wird an Klemme 8 angegeben.
Die Lokalisierung von Segmenten maximaler Amplitude erfolgt zunächst durch den Block SEi; er ist im wesentlichen aufgebaut wie die Schaltung SE, also entsprechend Fig. 1, und zeigt durch den Impuls hsM das Hüllkurven-Maximum und durch hsm das Hüllkurven-Minimum an.
Die weitere Stufe SE2, gesteuert durch das Tor G 9 von SEi, arbeitet wiederum wie Fig. 1, so daß ausgewählte Abschnitte gebildet werden, die als Kernsegmente einheitliche Merkmale darstellen. Die wiederholte Anwendung dieser Schaltung liefert übergeordnete Hüllkurven. Für die Erkennung werden so an diesen Stellen AsM die Typen-Code von Klemme 3 bzw. 1 bis 6 abgenommen.
Für die Übertragung werden die zwischen diesen Kernsegmenten liegenden, unwesentlichen Segmente, Abschnitte durch ein Tor unterdrückt und nur der Kernsegment-Code als Signalkomprimierung übertragen. Für die Synthese werden die gleichen Kernsegmente-Merkmale durch Wiederholung bis zum jeweils nächsten Kernsegment wieder aufgefüllt und entsprechend F ig. 8 aus dem Hubgrößenverlauf wie H Fig. 3a (»Zinnenkurve«) wieder dem zugehörigen Scheitelamplitudenverlauf wie Z in F i g. 2a zurückgewonnen :bzw. hergestellt. Über einen Tiefpaß TP werden die Impulse zu Schwingungen verschliffen, wie sie in Fig.8b gestrichelt eingezeichnet ist, und über den Verstärker VL auf einen Lautsprecher L hörbar gemacht.
Wie bereits erwähnt gibt es verschiedene Möglichkeiten, das vorliegende Verfahren technisch auszuführen. Fig.6 zeigt ein Blockschaltbild, das die Codierung der Anzahl N der Scheitel und der Typen T für die g- und r-Schwingung Fig.5a ermöglicht und eine Sprachcodier- und Erkennungsschaltung darstellt. Das Eingangssignal gelangt über den Wandler Wund Verstärker V auf einen Scheitelwert-Extrahierer SA gemäß 2a und Kernsegmentierung. Danach werden in einem g-r-Separator Sg/rd\e Scheitelwerte des g- und des r-Anteils des Signals separiert. In einer nachfolgenden Stufe werden nebeneinander die größten N(g), T(g), N(r) und T(r) bereitgestellt. Diese Größen werden einer Kodiermatrix Mxzugeführt, an deren Ausgängen ein Lautanzeigespeicher L Sp angeschlossen ist. Von diesem aus können Lautindikatoren (Taste, Lampen od. dgl.) betätigt werden.
Eine relativ einfache Schaltung, eine Sprach- oder Signalinformation von vornherein synthetisch zu bilden entsprechend dem Scheitelverlauf F i g. 2a, ist mit F i g. 7 gegeben. Hier ist ein Ringzähler RZ vorgesehen, in dem durch die Impulse eines Schiebetaktgenerators RG ein L-Zustand von Stufe zu Stufe (in F i g. 7 nach oben) weiter- und von der letzten Stufe wieder in die erste Stufe geschoben wird. Wenn das »L« in die erste Stufe gelangt, gibt diese Stufe über eine Leitung si einen Impuls auf ein bistabiles Flip-Flop FFl, das hierdurch umgeschaltet wird und über einen Ausgang a I ein Tor G12 durchlässig macht, über welches ein Kondensator C sich linear aufzuladen beginnt. In den Spalten der Matrix werden von links nach rechts Spannungswerte eingestellt, die z. B. den Scheitelspannungswerten des Verlaufs Z in F i g. 2a entsprechen. Am Ausgang AS entsteht eine Folge von amplitudenverschiedenen Impulsen, etwa wie MA und mA in Fig.2a oder H Fig.3a. Diese Segmente werden über GZgestrichelte Linie beliebig oft automatisch wiederholt, zweckmäßigerweise bis ein neues anderes Kernsegment eingestellt ist. Über einen Lautsprecher nach AS können so ganze Folgen von Kernsegmenten d. h. Laute und Worte hörbar gemacht werden.
Hierzu 6 Blatt Zeichnungen

Claims (6)

1 -4- ö / Patentansprüche:
1. Verfahren für die Analyse, automatische Erkennung, Übertragung und Synthese der in elektrischen Akustiksignalen, insbesondere Sprachsignalen enthaltenen Information in der Form von extrahierten Teilmerkmalen, Segmenten des Signals, das bereits als extrahierte Maxima- und Minima-Folge vorliegen kann, gekennzeichnet durch folgende Merkmale:
a) daß durch Lokalisierung von Segmenten maximaler und minimaler Amplituden ein ausgewählter Abschnitt gebildet wird, der als Kernsegment einheitliche Merkmale für die Erkennung durch Bestimmung dessen Maxima- und Minima-Verlaufs liefert, in dem die Differenzwerte zwischen den Maxima und Minima nach fortlaufender Division zu typischen Reihen zusammengefaßt und als Kernsegment-Code (Typen-Code) den Kern kennzeichnen;
b) Übertragung durch Weglassen aller Segmente, die zwischen zwei Kernsegmenten liegen, als Signal-Komprimierung wird nur der Kernsegmente-Code übertragen;
c) Synthese durch Wiederholungen des jeweils letzten Kernsegmentes bis zum nächsten Kernsegment die Lücken zwischen den Kernsegmenten wieder aufgefüllt werden, wobei die Wiederholungen der Größe der Kernsegmente als Hüllkurve folgen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß statt aller Amplituden-Maxima und Minima-Werte die Zeitwerte zwischen diesen verwendet werden und mit diesen entsprechend den Amplitudenwerten verfahren wird.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß Kernsegmente vom Maximum bzw. Minimum der Hüllkurven verschiedener Ordnung den Typen-Code kennzeichnen.
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß die Scheitel-Anzahl und -Typen innerhalb der Kernsegmente codiert werden.
5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß die Kernsegmente zur weiteren Verarbeitung lokalisiert werden.
6. Verfahren nach Anspruch 1 bis 5, dadurch gekennzeichnet, daß die Frequenzanteile der Kernsegmente weiterverarbeitet werden.
DE19661487540 1966-12-01 1966-12-01 Verfahren für Analyse und Synthese von elektrischen Akustiksignalen Expired DE1487540C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DET0032642 1966-12-01

Publications (3)

Publication Number Publication Date
DE1487540A1 DE1487540A1 (de) 1969-04-24
DE1487540B2 DE1487540B2 (de) 1980-10-30
DE1487540C3 true DE1487540C3 (de) 1981-06-25

Family

ID=7557186

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19661487540 Expired DE1487540C3 (de) 1966-12-01 1966-12-01 Verfahren für Analyse und Synthese von elektrischen Akustiksignalen

Country Status (1)

Country Link
DE (1) DE1487540C3 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2834751A1 (de) * 1977-08-09 1979-02-22 Kentron Epistimonikon Ke Efirm Sprachkodierungs-system

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1963082C2 (de) * 1969-12-16 1984-08-02 Heinz Dipl.-Phys. 7801 Umkirch Kusch Verfahren und Schaltungsanordnung zur automatischen Sprachverarbeitung
DE2853219A1 (de) * 1978-12-09 1980-09-25 Heinz Dipl Phys Kusch Verfahren zur automatischen erkennung der tonhaltigkeit
DE3329208A1 (de) * 1983-08-12 1985-02-28 H. Dipl.-Phys. 7801 Umkirch Kusch Verfahren fuer datenreduktion von sprachsignalen

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2834751A1 (de) * 1977-08-09 1979-02-22 Kentron Epistimonikon Ke Efirm Sprachkodierungs-system

Also Published As

Publication number Publication date
DE1487540A1 (de) 1969-04-24
DE1487540B2 (de) 1980-10-30

Similar Documents

Publication Publication Date Title
DE2034623C2 (de) Verfahren für das Erkennen von Sprachsignalen in Rauschen
DE2547597C2 (de) Verfahren und Vorrichtung zur Kompression und Expansion von Digitalcodewörtern
DE1487540C3 (de) Verfahren für Analyse und Synthese von elektrischen Akustiksignalen
DE2403651B2 (de) Schaltungsanordnung für die nichtlineare Umwandlung von digitalen Binärziffern in digitale Signale
DE1149745B (de) Puls-Kode-Nachrichtenuebertragungssystem
DE2461581C3 (de) Adaptives Deltamodulationssystem
DE1945782A1 (de) Geraet zur Umsetzung eines frequenzverschobenen Sprachsignals
EP0027233B1 (de) Verfahren zur Codierung von Analogsignalen
DE2702497C2 (de) Verfahren und Anordnung zur Verminderung von verständlichem Übersprechen zeitlich nacheinander abgetasteter Kanäle in einem Zeitmultiplexsystem
DE2139918A1 (de) Analog Digital Codierer
DE4111781A1 (de) Computersystem zur spracherkennung
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE1069406B (de) Imtpuilsgruppensortierung
DE1290606B (de) Zeitmultiplex-UEbertragungsverfahren mit lagemodulierten Adressenkodes
DE2432976A1 (de) Codier- und decodiereinrichtung fuer zeitmultiplex-fernsprechsysteme
DE1122581B (de) Verfahren und Schaltungsanordnung zur angenaeherten Nachbildung der Kurzzeitspektren von nach dem Vocoderverfahren uebertragenen Sprachsignalen
DE1472011C3 (de)
DE2442674A1 (de) Mehrfrequenzempfaenger
DE2834751C2 (de)
DE2718631A1 (de) Verfahren zur digitalen uebertragung von qualitativ hochwertigen tonsignalen
DE1191124B (de) Verfahren und Anordnung zur zeitlichen Dehnung oder Verdichtung von Sprachlauten
DE978016C (de) Verfahren zur Übertragung von Signalen nach Art der Delta-Modulation
DE3346501C2 (de) Digitalsignal-Multiplexgerät
DE2539769B2 (de) Digitale Pulsmodulation mit Dynamikbegrenzung
DE1512816C (de) Verfahren und System zum Übertragen eines Sprechfrequenzspektrums von einem Sender zu einem Empfänger

Legal Events

Date Code Title Description
OF Willingness to grant licences before publication of examined application
OF Willingness to grant licences before publication of examined application
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee