DE1200884B - Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen - Google Patents

Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen

Info

Publication number
DE1200884B
DE1200884B DEJ25601A DEJ0025601A DE1200884B DE 1200884 B DE1200884 B DE 1200884B DE J25601 A DEJ25601 A DE J25601A DE J0025601 A DEJ0025601 A DE J0025601A DE 1200884 B DE1200884 B DE 1200884B
Authority
DE
Germany
Prior art keywords
pulse
speech
interval
pulses
excitation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DEJ25601A
Other languages
English (en)
Inventor
Dipl-Ing Dr Kurt Bandat
Dipl-Ing Erwin Paulus
Dr Wilhelm Spruth
Dipl-Ing Helmut Lamparter
Dipl-Ing Dr Ernst Rothauser
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM Deutschland GmbH
Original Assignee
IBM Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IBM Deutschland GmbH filed Critical IBM Deutschland GmbH
Priority to DEJ25601A priority Critical patent/DE1200884B/de
Priority to AT739264A priority patent/AT269950B/de
Priority to GB1316665A priority patent/GB1093102A/en
Priority to FR11899A priority patent/FR1509916A/fr
Priority to SE444465A priority patent/SE316807B/xx
Publication of DE1200884B publication Critical patent/DE1200884B/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Verfahren zum Glätten der Grundtoninformation in impulserregten Kanalvocodersystemen Die Erfindung betrifft ein Verfahren, welches auf den Anregungskanal eines impulserregten Vocoders angewendet wird, mit dem Ziel, durch Rauschen verursachte Fehler bei der Messung der Periodendauer stimmhafter Abschnitte des Sprachsignals durch die Bildung gewogener Mittelwerte der Periodendauer des Grundtones wesentlich zu verringern.
  • Für impulserregte Kanalvocodersysteme sind schon Methoden beschrieben worden, wie in zweckmäßiger Weise Informationen über die Anregungsfunktion abgeleitet werden können, die für stimmhafte Abschnitte des Sprachsignals auch über kleine Änderungen der Periodendauer des Grundtones, die von Periode zu Periode auftreten können, Aufschluß geben. Bei der späteren Synthese des Sprachsignals kann dadurch die Natürlichkeit der Sprache verbessert werden. Diese Methoden haben ferner den bekannten Vorteil, daß keine Stimmhaft-Stimmlos-Unterscheidung der Sprachlaute erforderlich ist. Der Nachteil dieser bekannten Methoden besteht jedoch vorwiegend darin, daß nur durch Rauschen wenig gestörte Sprachsignale verarbeitet werden können. Der Rauschanteil muß hier so gering gehalten werden, daß alle festgestellten Änderungen der Periodendauer dem Sprachsignal selbst und nicht dem Einfluß von Störungen zugeordnet werden können.
  • Da nicht immer durch Rauschen nur wenig gestörte Sprachsignale vorliegen, ist es die Aufgabe der Erfindung, ein Verfahren anzugeben, welches auch die Verarbeitung stärker durch Rauschen gestörter Sprachsignale gestattet.
  • Es wird daher ein Verfahren zum Glätten der durch Rauschen des Sprachsignals gestörten Grundtoninformation bei impulserregten Kanalvocodersystemen vorgeschlagen, welches erfindungsgemäß dadurch gekennzeichnet ist, daß während stimmhafter Abschnitte des Sprachsignals der durch störendes Rauschen verursachte Fehler bei der Messung der Periodendauer des Grundtones im Analyseteil des Vocoders durch die Bildung gewogener Mittelwerte verringert wird, indem jede Periode des Grundtones innerhalb eines Zeitintervalls entsprechend einer Funktion ihres Abstandes von einem bestimmten Punkt innerhalb des Intervalls bewertet wird und sodann die Summe aller innerhalb dieses Intervalls liegender bewerteter Perioden durch eine effektive Intervallänge dividiert wird, um die mittlere Periodendauer des Grundtones zu erhalten, und indem nach jeder Mittelwertbildung das Intervall um die mittlere Periodendauer verschoben wird.
  • Der Vorteil der Erfindung liegt also darin, daß bei stark verrauschten Sprachsignalen durch Anwendung des Verfahrens auf den Anregungskanal eines impulserregten Kanalvocoders bei der Sprachanalyse die Natürlichkeit der Sprache bei der späteren Synthese weitgehend erhalten bleibt.
  • Im folgenden wird die Erfindung an Hand der Zeichnung beispielsweise näher erläutert.
  • Die Zeichnung zeigt ein Blockschaltbild des Anregungskanals eines impulserregten Kanalvocoders. Wie bereits erwähnt,ist es vorteilhaft,bei der Sprachanalyse stark verrauschter Sprachsignale während stimmhafter Abschnitte des Sprachsignals für die spätere Sprachsynthese Mittelwerte der Periodendauer zu verwenden. Die Mittelwertbildung selbst erfolgt in den nachstehend beschriebenen Verfahrensschritten: Alle innerhalb eines gewissen Zeitintervalls liegenden Perioden des Grundtones werden zunächst gezählt. Dann wird die Anzahl der Perioden durch die Länge dieses Intervalls dividiert. Die durch die Division erhaltene mittlere Periodendauer des Grundtones gilt gemessen von einem bestimmten Zeitpunkt innerhalb des Intervalls. Nach jeder Mittelwertbildung wird das Intervall um den Mittelwert der Periodeadauer zeitlich verschoben. Eine allgemeinere Form der Mittelwertbildung wird ferner dadurch erreicht, daß jede innerhalb eines gewissen Intervalls liegende Periodendauer mit einer bestimmten Funktion ihres Abstandes von einem gewissen Punkt innerhalb des Intervalls bewertet wird. Danach werden die bewerteten Perioden aufaddiert; die Summe muß dann durch eine effektive Intervallänge divi,-diert werden, um die mittlere Periodendauer zu erhalten. Nach jeder Mittelwertbildung wird das Intervall wieder um die mittlere Periodendauer verschoben.
  • Wie die Zeichnung erkennen läßt, wird das Sprachsignal SPS zunächst in üblicher Weise einer Reihe von Spektrumkanälen SPK, die hier nicht weiter behandelt werden, und einem Anregungskanal ANK zugeführt. Ferner ist noch ein Diskriminatorkanal DK vorgesehen, der das Sprachsignal einem Diskriminator D zuführt, welcher feststellt, ob das im Augenblick vorliegende Sprachsignal stimmhaft oder stimmlos ist. Diese Unterscheidung ist erforderlich, da die Messung der Periodendauer nur bei stimmhaften Abschnitten des Sprachsignals vorgenommen wird. Der Anregungskanal ANK enthält in bekannter Weise ein nichtlineares Glied NLG und einen Bandpaß BP zur Eliminierung der Grundwelle des Sprachsignals. Der nachfolgende Schaltkreis ND stellt dann die Nulldurchgänge einer Richtung des Sprachsignals fest und gibt seine Information an einen Impulsformer IF, der je Nulldurchgang einer Richtung einen definierten Rechteckimpuls abgibt. Die Torschaltung Ti übernimmt zusammen mit dem Diskriminator D, über dessen Leitung sh die Stimmhaftinforination zur Torschaltung übertragen wird, die Steuerfunktion für die Messung der Periodendauer nur stimmhafter Abschnitte des Sprachsignals. Die Torschaltun- T2 dagegen schaltet unter Steuerung vom Diskriminator D aus über die Leitung sl die Rechteckimpulse der Anregungsfunktion während der stimmlosen Abschnitte des Sprachsignals direkt auf den Ausgang ANK' des Anregungskanals.
  • Immer, wenn also stimmhafte Sprachsignale festgestellt werden, werden die Anregungsimpulse, die von dem Impulsformer IF über die Torschaltung Ti und die Leitung li geliefert werden, zunächst einer Einrichtung 1 zur Messung der Periodendauer der Anregungsimpulse und anschließenden Speicherun 'g der gemessenen Periodendauer zugeführt. Die in dieser Einrichtung gewonnenen Ergebnisse werden dann zu einer Einrichtung II übertragen, die die Werte der Periodendauer innerhalb eines bestimmten Intervalls aufsummiert und abhängig von den Ergebnissen einer Einrichtung 111 die durch Division der in der Einrichtung 11 durch Summation gewonnenen Ergebnisse durch die Länge des bestimmten Intervalls über die Verbindungsleitung Vl eine Bewertung der mittleren Perlodendauer vornimmt.
  • Die Ausgangssignale der Einrichtung 111 werden einer Einrichtung IV zugeführt, welche die Erzeugung der Anregungsimpulse entsprechend dem berechneten Mittelwert der Peri6dendauer übernimmt. Diese Impulse gelangen über die Leitung 12 zum Ausgang ANK' des Anregungskanals.
  • Die so gewonnenen Mittelwerte der Periodendauer der Anregungsimpulse enthalten allerdings keine Informationen mehr über kleine Änderungen, die im Sprachsignal von Periode zu Periode auftreten. Die Mittelwertbildung wird daher vernünftigerweise nur dort angewendet, wo der Qualitätsverlust der synthetischen Sprache, verursacht durch die Fälschung der Analyseergebnisse infolge Rauschens, gegen den Qualitätsgewinn, verursacht durch die Berücksichtigung kleiner Schwankungen der Periodendauer, überwiegt. Eine aus dem Verfahren resultierende Anordnung zum Glätten der Grundtoninformation kann daher eine Zusatzeinrichtung darstellen, die es ermöglichen soll, auch stark verrauschte Sprachsignal.-zu analysieren, ohne bei der Synthese gegenüber der herkömmlichen Methode eine schlechtere Sprachqualität zu erzielen, mit dem Vorteil, daß das in vieler Hinsicht günstige Konzept des impulserregten Vocoders nicht aufgeaeben werden muß. Zwar erfordert die Zusatzeinrichtuna, eine Stimmhaft-Stimmlos-Unterscheidung, doch wird diese bei der Synthese nicht im üblichen Sinn verwendet. Sie dient nur dazu, für stimmhafte Abschnitte des Sprachsignals die Mittelwertbildun- im Anregungskanal zu veranlassen.
  • C, C

Claims (1)

  1. Patentanspruch: Verfahren zum Glätten der durch Rauschen des Sprachsignals gestörten Grundtoninformation bei impulserregten Kanalvocodersystemen, d a - durch gekennzeichnet, daß während stimmhafter Abschnitte des Sprachsignals der durch störendes Rauschen verursachte Fehler bei der Messung der Periodendauer des Grundtones im Analyseteil des Vocoders durch die Bildung gewogener Mittelwerte verringert wird, indem jede Periode des Grundtones innerhalb eines Zeitintervalls entsprechend einer Funktion ihres Abstandes von einem bestimmten Punkt innerhalb des Intervalls bewertet wird und sodann die Summe aller innerhalb dieses Intervalls liegender bewerteter Perioden durch eine effektive Intervallänge dividiert wird, um die mittlere Periodendauer des Grundtones zu erhalten, und indem nach jeder Mittelwertbildung das Intervall um die mittlere Periodendauer verschoben wird.
DEJ25601A 1964-04-06 1964-04-06 Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen Pending DE1200884B (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DEJ25601A DE1200884B (de) 1964-04-06 1964-04-06 Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen
AT739264A AT269950B (de) 1964-04-06 1964-08-26 Schaltungsanordnung zum Glätten der Grundtoninformation in impulserregten Kanalvocodersystemen
GB1316665A GB1093102A (en) 1964-04-06 1965-03-29 Improvements relating to methods and apparatus for reducing random variations in periodicity in a pulse signal
FR11899A FR1509916A (fr) 1964-04-06 1965-04-05 Méthode pour atténuer les variations accidentelles de la mesure de la composante fondamentale dans les systèmes codeurs de voix
SE444465A SE316807B (de) 1964-04-06 1965-04-06

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DEJ25601A DE1200884B (de) 1964-04-06 1964-04-06 Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen

Publications (1)

Publication Number Publication Date
DE1200884B true DE1200884B (de) 1965-09-16

Family

ID=7202297

Family Applications (1)

Application Number Title Priority Date Filing Date
DEJ25601A Pending DE1200884B (de) 1964-04-06 1964-04-06 Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen

Country Status (5)

Country Link
AT (1) AT269950B (de)
DE (1) DE1200884B (de)
FR (1) FR1509916A (de)
GB (1) GB1093102A (de)
SE (1) SE316807B (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE8106186L (sv) * 1981-10-20 1983-04-21 Hans Olof Kohler Forfarande och anordning for att bestemma en analyssignals overenstemmelse med minst en referenssignal

Also Published As

Publication number Publication date
FR1509916A (fr) 1968-01-19
GB1093102A (en) 1967-11-29
AT269950B (de) 1969-04-10
SE316807B (de) 1969-11-03

Similar Documents

Publication Publication Date Title
DE2233872C2 (de) Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals
DE1248225B (de) Verfahren und Vorrichtung zum genauen Ermitteln der Herzschlagfrequenz
DE3144659A1 (de) Einrichtung zur auswertung von ekg-signalen
DE2607187A1 (de) Verfahren zur laufzeitmessung von impulsen
DE2625162C3 (de) Ultraschall-Impulsechoverfahren zur Bestimmung der Abmessungen, insbesondere der Wanddicke, von Prüfstücken und Schaltvorrichtung zur Ausführung des Verfahrens
DE2034623A1 (de) Verfahren und Vorrichtung fur die Zah lung von Sprachsignalen in Anwesenheit von Rauschen
DE2021126A1 (de) Spracherkennungsvorrichtung
DE2737467A1 (de) Fernsteueranordnung
DE1200884B (de) Verfahren zum Glaetten der Grundtoninformation in impulserregten Kanalvocodersystemen
DE1281718B (de) Verfahren zum Ermitteln der Kornverfeinerung in den Randzonen eines stabfoermigen Metallkoerpers
DE1189745B (de) Verfahren zum Identifizieren von Schallereignissen
EP0185133B1 (de) Verfahren und Vorrichtung zum genauen Ermitteln des zeitlichen Abstandes zweier elektrischer Impulse
DE1929817A1 (de) Echoentzerrer
DE2312356A1 (de) Verfahren und vorrichtung zur bestimmung der grundfrequenz von sprachsignalen
DE1271203B (de) Verfahren und Anordnung zur Gewinnung der Anregungsfunktion bei Kanalvocodern
DE2739609A1 (de) Verfahren und vorrichtung zur schulung und umschulung von weitgehend tauben
DE3009574A1 (de) Verfahren und vorrichtung zur bestimmung der schallgeschwindigkeit in einem material vorgegebener dicke
DE2516001A1 (de) Verfahren zur verbesserung der richtcharakteristik einer echolot- empfangsbasis und vorrichtungen zum ausueben dieses verfahrens
DE3217519C2 (de)
DE1122274B (de) Verfahren und Anordnung zur automatischen Erkennung von Sprache
AT274048B (de) Schaltungsanordnung zum Glätten der Grundtoninformation in impulserregten Kanalvocodersystemen
DE2346920C3 (de) Meßgerät für die Messung der Durchgangsgeschwindigkeit von Ultraschall durch einen zu untersuchenden Werkstoff
DE3229438C2 (de)
DE3210436A1 (de) Verfahren und vorrichtung zur bestimmung des zeitlichen impulsabstandes zweier elektrischer impulse
DE2208050C3 (de) Elektrischer nichtlinearer Verzerrer