DE2939330C2 - - Google Patents

Info

Publication number
DE2939330C2
DE2939330C2 DE19792939330 DE2939330A DE2939330C2 DE 2939330 C2 DE2939330 C2 DE 2939330C2 DE 19792939330 DE19792939330 DE 19792939330 DE 2939330 A DE2939330 A DE 2939330A DE 2939330 C2 DE2939330 C2 DE 2939330C2
Authority
DE
Germany
Prior art keywords
output
value
input
speech signal
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19792939330
Other languages
English (en)
Other versions
DE2939330A1 (de
Inventor
Hermann Dipl.-Phys. 2000 Hamburg De Ney
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Patentverwaltung GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Patentverwaltung GmbH filed Critical Philips Patentverwaltung GmbH
Priority to DE19792939330 priority Critical patent/DE2939330A1/de
Publication of DE2939330A1 publication Critical patent/DE2939330A1/de
Application granted granted Critical
Publication of DE2939330C2 publication Critical patent/DE2939330C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Die Erfindung betrifft ein Verfahren zum Bestimmen der Stimmbandgrundfrequenz eines Sprachsignals, bei dem ein Zeitabschnitt des Sprachsignals gegenüber dem Sprachsignal verschoben und für unterschiedliche Verschiebungen die Beträge der Differenzen zwischen dem Sprachsignal und dem verschobenen Sprachsignal über den Zeitabschnitt aufsummiert werden, wobei die Verschiebung, bei der die Folge der so gebildeten Summen ein Minimum hat, betimmt wird und diese Verschiebung die Periodendauer der Stimmbandgrundfrequenz angibt, sowie eine Anordnung zur Durchführung des Verfahrens.
Ein solches Verfahren ist bekannt aus "IEEE Trans-Acoust, Speech, and Signal Processing", Vol. ASSP-24 (Oct. 1976), Seiten 399 bis 418, und Vol. ASSP-22 (Oct. 1974), Seiten 353 bis 362. Durch Bestimmung der Periodendauer in dieser Art für aufeinanderfolgende Zeitabschnitte des Sprachsignals kann dann der Verlauf der Stimmbandgrundfrequenz ermittelt werden. Die bekannten Verfahren erfordern jedoch eine Vielzahl von Rechenschritten, so daß eine schnelle Verarbeitungsanordnung bzw. Schaltungen mit hoher Taktgeschwindigkeit erforderlich sind, wenn die Verarbeitung in Echtzeit erfolgen soll, d. h., die Periodendauer eines Zeitabschnitts des Sprachsignals während einer Zeit höchstens gleich diesem Zeitabschnitt bestimmt werden soll.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, bei dem die Stimmbandgrundfrequenz mittels möglichst weniger und einfacher Verarbeitungsschritte bestimmt werden kann.
Diese Aufgabe wird bei dem eingangs genannten Verfahren erfindungsgemäß dadurch gelöst, daß zunächst durch Aufsummieren der Beträge des Sprachsignals im Zeitabschnitt die Energie des Sprachsignals im Zeitabschnitt bestimmt wird, daß die Aufsummierung der Differenzen, bei einem vorgegebenen minimalen Wert der Verschiebung beginnend, für jeden Wert der Verschiebung abgebrochen und die Verschiebung um einen Schritt vergrößert wird, sobald während der Aufsummierung ein vorgegebener Bruchteil der Energie überschritten wird, daß nach der ersten Summe kleiner als der Bruchteil der Energie jede folgende Summe mit der kleinsten vorhergehenden Summe verglichen und der Wert der Verschiebung zwischengespeichert wird, wenn die Summe kleiner ist als die Vergleichssumme, und daß die Vergrößerung der Verschiebung mit folgender Aufsummierung der Differenzbeträge beendet wird, wenn die Verschiebung einen vorgegebenen maximalen Wert erreicht hat, wobei der zuletzt zwischengespeicherte Wert der Verschiebung die Periodendauer der Stimmbandgrundfrequenz für den Zeitabschnitt angibt. Mit Differenzbeträgen sind hier und auch im folgenden die Beträge der Differenzen gemeint. Die Energie des Sprachsignals ist hier das Integral bzw. bei zeitdiskreten Signalabtastwerten die Summe des Betrages des Sprachsignals.
Auf diese Weise wird jeder Teilschritt der Verarbeitung nur so weit durchgeführt, bis feststeht, ob er zur Bestimmung des Minimums der Folge der Summen beiträgt oder nicht. So wurde festgestellt, daß die das Minimum bildende Summe und damit auch die in der Umgebung liegenden Summen den Mittelwert der Energie des Sprachsignals im Zeitabschnitt, der bei konstanter Dauer des Zeitabschnitts proportional der Gesamtenergie des Sprachsignals im Zeitabschnitt ist, um einen bestimmten Faktor unterschreiten muß. Daher kann eine Summe, die den bestimmten Bruchteil der Energie bzw. der mittleren Energie überschreitet, nicht in der Nähe des Minimums liegen, so daß die weitere Durchführung der Aufsummierung der Differenzen hierfür sinnlos ist. Durch Vermeidung unnötiger Berechnungen auf diese Weise kann die Bestimmung der Periodendauer erheblich beschleunigt werden. Sobald jedoch eine Summe diesen Bruchteil der Energie unterschreitet, kann durch Vergleich der folgenden Summen mit der jeweils kleinsten vorhergehenden Summe und der Zwischenspeicherung der Verschiebung auf einfache Weise der Wert der Verschiebung festgestellt werden, bei dem die Folge der Summen ein Minimum hat.
Es wurde ferner festgestellt, daß der Bereich in der Folge der Summen, in dem die Summen den Bruchteil der Energie unterschreiten und in dem das Minimum liegt, eine begrenzte maximale Größe hat. Wenn also eine Summe den Bruchteil der Energie unterschreitet, braucht die Suche nach dem Minimum nur während eines bestimmten folgenden Bereiches von Verschiebungen weitergeführt zu werden, d. h., das in diesem Bereich gefundene Minimum ist mit sehr großer Sicherheit auch das tatsächliche Minimum der Folge der Summen. Dies erfolgt nach einer Ausgestaltung des erfindungsgemäßen Verfahrens dadurch, daß der vorgegebene maximale Wert die um einen festen Bereichswert vergrößerte Verschiebung ist, bei der erstmalig die Summe der Differenzen kleiner als der vorgegebene Bruchteil der Energie ist, wenn diese vergrößerte Verschiebung kleiner ist als ein vorgegebener Maximalwert der Verschiebung, und daß der vorgegebene maximale Wert der Maximalwert der Verschiebung ist, wenn dieser kleiner ist als die vergrößerte Verschiebung oder wenn keine Summe kleiner als der vorgegebene Bruchteil der Energie bis zum Erreichen des Maximalwertes der Verschiebung auftritt. Auf diese Weise wird die Bestimmung der Periodendauer weiter beschleunigt.
In einem natürlichen Sprachsignal sind stets auch Abschnitte vorhanden, in denen das Sprachsignal praktisch verschwindet oder zumindest so leise ist, daß es sich nicht wesentlich über das Rauschen oder andere Störgeräusche erhebt. Während solcher Teile ist entweder keine Stimmbandgrundfrequenz vorhanden oder ihre Bestimmung ist zumindest sehr unsicher. Damit diese Teile den Verlauf der Stimmbandgrundfrequenz des Sprachsignals nicht zu sehr verfälschen, ist es zweckmäßig, daß die Energie mit einer vorgegebenen Schwelle verglichen und die nachfolgende Aufsummierung nur dann freigegeben wird, wenn die Schwelle überschritten wird. Dadurch werden solche Teile des Sprachsignals wie stimmlose Teile behandelt.
Um das erfindungsgemäße Verfahren mit einfachen Mitteln zu realisieren, ist eine Anordnung zur Durchführung des erfindungsgemäßen Verfahrens mit einem Sprachsignalspeicher, der die zeitdiskreten Werte eines Sprachsignals von einer Länge mindestens gleich der Summe der Länge eines Zeitabschnitts und dem Maximalwert der Verschiebung enthält, mit einer Adressieranordnung, die an den Adresseneingang des Sprachsignalspeichers angeschlossen ist und Folgen von aufeinanderfolgenden Adressenpaaren aus jeweils einer Adresse eines Wertes des Sprachsignals im Zeitabschnitt und einer um einen bestimmten, nach jeder Folge um eine Einheit vergrößerten Adressenabstand verschobenen Adresse liefert, mit einer Recheneinheit, die an den Datenausgang des Sprachsignalspeichers angeschlossen ist und Differenzbeträge zwischen an den Adressen jeweils eines Adressenpaares gespeicherten Werten über die Folge der Adressenpaare aufsummiert, dadurch gekennzeichnet, daß zu Beginn der Verarbeitung eines Zeitabschnitts eine Steueranordnung die Adressieranordnung ansteuert, um eine erste Folge nur von Adressen der Werte des Sprachsignals in dem Zeitabschnitt zu erzeugen, daß an den Datenausgang des Sprachsignalspeichers ein Akkumulator angeschlossen ist, daß mit dem Ausgang des Akkumulators der eine Eingang eines Multiplizierers verbunden ist, der am anderen Eingang einen festen Wert empfängt, daß die Adressieranordnung nach der Erzeugung der ersten Adressenfolge den Ausgangswert des Multiplizierers in ein Vergleichsregister einschreibt und die Steueranordnung zur Erzeugung von Folgen von Adressenpaaren umschaltet, daß der Ausgang des Vergleichsregisters mit dem einen Eingang eines Minimum- Vergleichers verbunden ist, dessen anderer Eingang mit dem Ausgang der Recheneinheit verbunden ist und der am Ausgang ein Signal erzeugt, wenn der Wert am Ausgang der Recheneinheit größer ist als der Wert am Ausgang des Vergleichsregisters, daß die Adressieranordnung an einem Steuerausgang ein Folgeende-Signal nach jeder beendeten Folge von Adressen bzw. Adressenpaaren erzeugt, daß der Steuerausgang der Adressieranordnung mit dem Einschreib-Eingang des Vergleichsregisters, dessen Datenausgang nach dem Erzeugen der ersten Adressenfolge auf den Ausgang der Recheneinheit umgeschaltet ist, und dem Einschreib-Eingang eines Periodendauer-Registers verbunden ist, dessen Dateneingang an einen den momentanen Wert der Verschiebung liefernden Verschiebungsausgang der Adressieranordnung angeschlossen ist, daß der Steuereingang der Adressieranordnung und der Ausgang des Minimum-Vergleichers gemeinsam mit einem Rückstelleingang der Recheneinheit und einem Erhöhungseingang der Adressieranordnung zum Erhöhen der Verschiebung der Adressen gekoppelt sind, und daß ein Maximum-Vergleicher vorgesehen ist, dessen einer Eingang mit dem Verschiebungsausgang verbunden ist und dessen anderer Eingang einen vorgegebenen maximalen Wert erhält und dessen Ausgang mit einem Sperreingang der Adressieranordnung verbunden ist und ein Signal liefert, wenn der Wert am Verschiebungsausgang größer ist als der maximale Wert, wobei dieses Signal die Erzeugung weiterer Folgen von Adressenpaaren bis zur Verarbeitung des nächsten Zeitabschnittes sperrt und den im Periodendauer- Register enthaltenen Wert als Periodendauer ausgibt.
Ausgestaltungen dieser Anordnung sind in den weiteren Unteransprüchen gekennzeichnet.
Ausführungsbeispiele der Erfindung werden nachstehend anhand der Zeichnung näher erläutert. Es zeigt
Fig. 1a einen Teil eines Sprachsignals,
Fig. 1b ein Beispiel für den Verlauf der Folge der Summen mit einigen charakteristischen Werten,
Fig. 2 bis 4 Blockschaltbilder von Teilen einer vollständigen Anordnung zur Bestimmung der Periodendauer jeweils eines Zeitabschnitts eines Sprachsignals.
Ein Ausschnitt aus einem typischen Sprachsignal ist in Fig. 1a dargestellt. Dieses Signal weist einige hohe Amplituden auf, zwischen denen das Signal mit niedrigerer Amplitude verläuft. Dabei haben die Amplituden zum Zeitpunkt t₁ und t₃ etwa den gleichen Wert, während die dazwischenliegende Amplitude bei t₂ einen kleineren Wert hat. Die Tonhöhe des Sprachsignals, d. h. die Stimmbandgrundfrequenz, wird durch die Periode des Sprachsignals bestimmt, d. h., die Frequenz ist gleich dem Kehrwert der Periode. Zur Bestimmung der Periode kann nun der Abstand dieser hohen Amplituden im Sprachsignal verwendet werden. Es ist jedoch leicht zu erkennen, daß dabei bereits der Abstand zwischen den Amplituden bei t₁ und t₂ fälschlich als Periode erfaßt werden kann.
Da es sich bei einem Sprachsignal allgemein um ein quasi- stationäres Signal handelt, das seinen Verlauf jeweils innerhalb einer Periode eher langsam über mehrere Perioden ändert, ist es zweckmäßiger, Autokorrelationsverfahren zu verwenden. Dabei wird im Falle eines kontinuierlichen Sprachsignals ein Zeitabschnitt dieses Signals gegenüber dem gesamten Sprachsignal verschoben und der Grad der Übereinstimmung bzw. Abweichung bestimmt, und beim Maximum der Übereinstimmung bzw. Minimum der Abweichung gibt die Verschiebung des Sprachsignals im Zeitabschnitt gegenüber dem übrigen Signal die Periodendauer des Signals an. Ein sehr gut brauchbares Maß für die Abweichung zwischen dem Sprachsignal und dem verschobenen Sprachsignal gibt die Summe der Differenzbeträge zwischen diesen beiden Signalen über den Zeitabschnitt an.
Zur Verdeutlichung ist in Fig. 1a ein Zeitabschnitt des Sprachsignals vom Beginn der Darstellung an bis zum Punkt T, der die Länge des Zeitabschnitts angibt, mit einer stärkeren Linie dargestellt. Ferner ist gestrichelt dieser Zeitabschnitt um den Wert Δ t verschoben über dem Sprachsignal als Beispiel dargestellt. Dabei ist zu erkennen, daß nur sehr wenige Teile des Sprachsignals annähernd übereinstimmen, während im allgemeinen sehr große Abweichungen bestehen, d. h., es ergibt sich eine Vielzahl von großen Differenzen zwischen den beiden Sprachsignalen, deren Beträge als Summe einen großen Wert ergeben und eine geringe Übereinstimmung angeben, da die beispielswiese angenommene Verschiebung erheblich von der Periodendauer des Sprachsignals abweicht. Für Sprachsignale stellt ein Zeitabschnitt T von 10 ms und ein Bereich der Verschiebung der beiden Sprachsignale gegeneinander von 2 ms bis 15 ms zweckmäßige Werte dar.
In Fig. 1b ist die Funktion F der Summe über die Differenzen zwischen den beiden Sprachsignalen über den Zeitabschnitt abhängig von der Verschiebung k aufgetragen. Die Differenzen sind dabei selbstverständlich nicht vorzeichenrichtig, sondern nur ihrem Betrag nach aufsummiert, da bei den Unterschieden der Signale nur deren Beträge von Bedeutung sind.
In der Praxis werden die Differenzen an zeitdiskreten Signalen gebildet, d. h., das kontinuierliche Sprachsignal wird periodisch abgetastet, z. B. mit 5 kHz, so daß sich eine Folge von Werten ergibt, die in einem Abstand von 200 µs liegen. Der obenerwähnte, stärker ausgezogene Abschnitt des Sprachsignals enthält dann 50 Abtastwerte. Entsprechend wird die Verschiebung der beiden Sprachsignale gegeneinander auch nur in Schritten entsprechend diesem Abstand der Signalwerte geändert. Die in Fig. 1b dargestellte Funktion F der Summe der Differenzen besteht daher tatsächlich auch nur aus einzelnen, diskreten Punkten, die der Übersichtlichkeit halber hier jedoch durch eine geglättete Kurve verbunden über die Verschiebung k dargestellt sind.
Die Funktion F der Summen ist vom Beginn bei der Verschiebung k=0, bei dem diese Funktion ebenfalls wegen völliger Überdeckung der beiden Sprachsignale den Wert Null hat, bis zum Wert k min gestrichelt dargestellt, da dieser Bereich niemals untersucht wird, denn ein Minimum in diesem Bereich würde eine Stimmbandgrundfrequenz ergeben, die höher ist als in tatsächlichen Sprachsignalen vorkommend, selbst bei Sprachsignalen von kleinen Kindern. Falls sicher ist, daß nur Sprachsignale von erwachsenen Personen vorkommen können, kann dieser Wert k min noch vergrößert werden. Andere Möglichkeiten, diesen Minimalwert k min heraufzusetzen, werden später angedeutet.
Der Verlauf der Funktion F zeigt nach einem Maximum ein relatives Minimum, das jedoch oberhalb der gestrichelten Linie beim Wert pE für den Funktionswert F liegt. Darin bedeutet E den Wert der gesamten Energie des Sprachsignals in dem Zeitabschnitt von 0 bis T in Fig. 1a, d. h., die Summe der Flächen zwischen der Kurve des Sprachsignals und der Abszisse, die bei Division durch die Dauer des Zeitabschnitts die gesamte Energie des Sprachsignals angibt. Der Wert p ist so gewählt, daß das Produkt pE unterhalb der mittleren Energie des Sprachsignals liegt, beispielsweise bei 62,5% der gesamten Energie. Ein gültiges Minimum der Funktion F liegt zumindest ohne Einfluß von Störsignalen praktisch immer unterhalb dieses Wertes, so daß das erste relative Minimum der Funktion F nicht das gesuchte echte Minimum sein kann. Dies liegt vielmehr bei dem Wert kp, und zwar in einem Bereich der Funktion F unterhalb des Wertes pE. Die Funktion F geht auch im Minimum selten auf den Wert Null zurück, da auch zwischen unmittelbar benachbarten Zeitabschnitten eines Sprachsignals fast immer kleine Unterschiede vorhanden sind.
Die Aufsummierung der Differenzen erfolgt schrittweise, d. h., für eine gegebene Verschiebung werden die Differenzbeträge aufeinanderfolgender Punkte gebildet und aufsummiert. Da nun ein gesuchtes Minimum der Kurve F nur unterhalb des Wertes pE liegen kann, kann eine solche Aufsummierung sofort abgebrochen werden, wenn dieser Wert erreicht wird, und die Verschiebung kann um einen Schritt erhöht werden. Wenn dies bei der Funktion F in Fig. 1b beim Verschiebungswert k min beginnend durchgeführt wird, ist sofort erkennbar, daß dabei erheblich Rechenzeit gespart wird. Außerdem wird das erste relative Minimum gar nicht erst erfaßt. Erst beim Verschiebungswert k a wird zum ersten Mal der Funktionswert pE unterschritten, und nun erst beginnt die Prüfung auf ein Minimum. Ein erstes relatives Minimum tritt beim Wert k₁ auf, jedoch wird, um das tatsächliche absolute Minimum zu finden, die Prüfung weiter fortgesetzt, bis das nächste Minimum beim Wert kp gefunden wird. Da auch dieses nur ein relatives Minimum sein kann, solange nicht der Funktionswrrt F an solch einem Minimum den Wert Null erreicht, wird die Prüfung noch weiter fortgesetzt.
Die weitere Suche nach dem Minimum kann bis zum Maximalwert k max der Verschiebung fortgesetzt werden, denn darüber hinausgehende Verschiebungen würden eine Stimmbandgrundfrequenz ergeben, die praktisch nie vorkommt. Tatsächlich kann die weitere Suche nach dem Minimum jedoch früher abgebrochen werden, nämlich beim Wert k a +δ k , denn das Minimum liegt immer innerhalb eines Bereiches w k nach dem Wert k a , nachdem die Funktion F erstmalig den Wert pE unterschritten hat. Auf diese Weise ist eine weitere Verkürzung der Rechenzeit möglich.
In den Fig. 2 bis 4 sind Blockschaltbilder von Teilen einer vollständigen Anordnung zur Bestimmung der Stimmbandgrundfrequenz bzw. deren Periode, auch "pitch period" genannt, dargestellt. Dabei zeigt die Fig. 2 eine Anordnung zur Bestimmung der Gesamtenergie des Sprachsignals im untersuchten Zeitabschnitt sowie zur Bildung des Wertes pE. Der Sprachsignalspeicher 1 enthält die digitalisierten Werte des in aufeinanderfolgenden Zeitpunkten abgetasteten Sprachsignals. Der Adresseneingang dieses Speichers ist mit dem Parallelausgang 2 eines Adressenzählers 3 verbunden, der am Eingang ein Taktsignal Ck von einer nicht dargestellten Taktquelle erhält. Diese Verbindung zwischen dem Parallelausgang 2 des Zählers 3 und dem Adresseneingang des Sprachsignalspeichers 1 besteht tatsächlich aus mehreren parallelen Leitungen entsprechend der Anzahl Stufen des Zählers 3, jedoch sind diese Leitungen in Fig. 2 der Übersichtlichkeit halber nur als eine einfache Verbindung dargestellt. Dies gilt auch für eine Anzahl weiterer Verbindungen zwischen Elementen in dieser sowie den anderen Figuren, insbesondere an Eingängen von Registern, Addierern und Vergleichern.
Der Zähler 3 durchläuft nacheinander alle seine Stellungen und adressiert im Sprachsignalspeicher 1 Speicherstellen mit den Abtastwerten des Sprachsignals, die nacheinander am Ausgang des Sprachsignalspeichers 1 erscheinen und ohne Berücksichtigung des Vorzeichens, d. h. nur dem Betrag nach, dem einen Eingang eines Addierers 5 zugeführt werden. Der Ausgang des Addierers 5 ist mit dem Dateneingang eines Registers 7 verbunden, dessen Ausgang 8 u. a. mit dem anderen Eingang des Addierers 5 verbunden ist. Der Einschreib- Eingang des Registers 7 erhält für jeden adressierten Speicherplatz im Sprachsignalspeicher 1 ein Einschreibsignal, und zwar im dargestellten Beispiel das invertierte Taktsignal das dem um eine halbe Taktperiode verschobenen Taktsignal Ck entspricht. Auf diese Weise bilden Addierer 5 und Register 7 einen Akkumulator, wobei nach dem Durchlaufen des Zählers 3 durch alle Zählerstellungen alle Abtastwerte des Sprachsignals des Zeitabschnitts im Sprachsignalspeicher 1 adressiert worden sind und das Register 7 den Wert der Gesamtenergie des Sprachsignals im Zeitabschnitt enthält.
Der Ausgang 8 des Registers 7 ist mit dem einen Eingang eines Schwellwert-Vergleichers 9 verbunden, dessen anderer Eingang mit einer Quelle 19 zum Liefern eines festen Schwellwertes verbunden ist. Der feste Schwellwert der Quelle 19 kann auch von dem Sprachsignal in einer Sprachpause abgeleitet sein, so daß dieser feste Schwellwert nur das Rauschen berücksichtigt und z. B. das 1,5fache der gesamten Rauschenergie in einem Zeitabschnitt darstellt.
Der Ausgang 8 des Registers 7 ist ferner mit dem einen Eingang eines Multiplizierers 13 verbunden, dessen anderer Eingang mit einer Quelle 6 zum Liefern eines experimentell bestimmten konstanten Faktors p verbunden ist. Dieser Multiplizierer 13 erzeugt an seinem Ausgang 14 nach einem vollständigen Durchlauf des Zählers 3 einen Wert entsprechend einem Bruchteil von z. B. 62,5% der Gesamtenergie des Sprachsignals im Zeitabschnitt.
Wenn der Wert der Gesamtenergie am Ausgang 8 des Registers 7 den von der Quelle 19 gelieferten Schwellwert überschreitet, gibt der Schwellwert-Vergleicher 9 an seinem Ausgang 10 ein Signal ab, das dem einen Eingang eines UND-Gatters 15 und einem Umschalter 19 zugeführt wird, der in eine Stellung entgegengesetzt zur gezeichneten Stellung umgeschaltet wird und den Dateneingang eines Vergleichsregisters 11 mit dem Ausgang 14 des Multiplizierers 13 verbindet. Der Umschalter 19 wird zweckmäßig ebenso wie die anderen Umschalter der Anordnungen nach Fig. 3 und 4 durch elektronische Mittel realisiert. Ferner führt der Ausgang 10 des Schwellwert-Vergleichers 9 auf einen Ausgang c dieser Teilanordnung, der mit einem entsprechenden Eingang der Teilanordnung in Fig. 4 verbunden ist, wie dabei erläutert wird.
Am Ende eines vollständigen Umlaufs des Zählers 3 erscheint am Steuerausgang 4, der vom Übertragsausgang des Zählers 3 abgeleitet sein kann, ein Folgeende-Signal, das dem Einschreib- Eingang des Vergleichsregisters 11 zugeführt wird und dort den Wert am Ausgang 14 des Multiplizierers 13 einschreibt. Ferner ist dieser Steuerausgang 4 mit dem anderen Eingang des UND-Gatters 15 verbunden, so daß nun an dessen Ausgang 16 ein Signal erscheint. Dieser Ausgang 16 führt sowohl auf einen Ausgang b dieser Teilanordnung, der auf einen entsprechenden Eingang der Anordnung nach Fig. 4 führt und dort erläutert wird, als auch auf den J-Eingang eines J-K-Flipflops 17, dessen Takteingang das invertierte Taktsignal erhält, so daß bei einem Signal auf dem Steuerausgang 4, das kurz nach Beginn eines Taktsignals Ck erscheint, eine halbe Taktzeit später das J-K-Flipflop 17 seinen Zustand wechselt und am Ausgang Q ein Signal erzeugt. Dieses Signal wird über die Leitung 18 dem Löscheingang des Registers 7 zugeführt, wodurch dieses auf Null zurückgesetzt wird und damit das Signal am Ausgang 10 des Schwellwert-Vergleichers 9 und dadurch auch das Signal am Ausgang 16 des UND-Gatters 15 verschwindet und das außerdem dem Ausgang a dieser Anordnung zugeführt wird, der mit entsprechenden Eingängen der Anordnungen nach Fig. 3 und 4 verbunden ist.
Damit ist die Bestimmung des Bruchteils der Energie, der von einer Summe für die Berücksichtigung bei der Suche des Minimums nicht überschritten werden darf und der nun im Vergleichsregister 11 gespeichert ist, beendet.
Die in Fig. 3 dargestellte Teilanordnung führt nun die Suche nach dem Minimum einer Folge von Summen durch. Darin sind einige Elemente der Teilanordnung nach Fig. 2 nochmals dargestellt und mit gleichen Bezugszeichen versehen. Der Sprachsignalspeicher 1 wird wieder von dem Zähler 3 über die Leitung 2 adressiert, jedoch nicht direkt, sondern nun über einen Umschalter 27. Außerdem erhält der Zähler 3 seinen Zähltakt nicht direkt, sondern ebenfalls über einen Umschalter 21. Dieser Umschalter 21 wird durch ein Startsignal St auf der Leitung 20, das zu Beginn der Verarbeitung jedes Zeitabschnitts des Sprachsignals, d. h. alle 10 ms, erscheint, in die dargestellte Stellung geschaltet. Damit erhält der Zähler 3 das Taktsignal Ck direkt, wie in Fig. 2 dargestellt wurde. Am Ende des ersten Durchgangs des Zählers 3, d. h. mit dem ersten Folgeende-Signal am Steuerausgang 4, wird der Schalter 21 in die entgegengesetzte Lage umgeschaltet, so daß der Takteingang des Zählers 3 nunmehr mit dem 22 eines J-K-Flipflops 23 verbunden ist.
Der Takteingang dieses J-K-Flipflops 23 erhält das Taktsignal Ck, und die J- und K-Eingänge sind gemeinsam mit dem Eingang a verbunden, der von dem Q-Ausgang des J-K- Flipflops 17 in Fig. 2 abgeleitet ist und der nach dem Ende des ersten Durchlaufs des Zählers ein Signal erzeugt, wie dort beschrieben wurde. Damit wechselt nun das J-K- Flipflop 23 mit jedem Takt des Taktsignals Ck seinen Zustand und führt damit den Leitungen 22 und 24 abwechselnd ein Signal zu.
Der Ausgang 2 des Zählers 3 ist mit dem einen Eingang eines Addierers 25 verbunden, dessen anderer Eingang über die Leitung 30 mit dem Ausgang eines Zählers 29 verbunden ist. Der Ausgang dieses Zählers 29 gibt die Verschiebung der beiden Sprachsignale über eine Verschiebung der Adressen bei der Adressierung des Sprachsignalspeichers 1 an und ist vorher über die Leitung 28 auf einen Anfangswert, z. B. den Wert k min nach Fig. 1b, eingestellt worden. Der Addierer 25 erzeugt somit am Ausgang eine Adresse, die um den Wert der auf der Leitung 30 vorhandenen Verschiebung gegenüber der Adresse auf der Leitung 2 verschoben ist, und führt diese verschobene Adresse der einen Seite des Umschalters 27 zu.
Zu Beginn erzeugt der Zähler 3 nach dem vollendeten Durchgang wieder die Anfangsadresse, so daß im Sprachsignalspeicher 1 die erste Adresse ausgelesen und deren Inhalt einem Register 31 und einem Subtrahierer 33 zugeführt wird. Sobald das J-K-Flipflop 23 umschaltet und auf der Leitung 24, die mit dem Umschalter 27 und dem Einschreib-Eingang des Registers 31 verbunden ist, ein Signal erzeugt, wird dieser erste Inhalt in das Register 31 eingeschrieben und gleichzeitig der Umschalter 27 in die entgegengesetzte Stellung umgeschaltet, so daß nun der Inhalt der verschobenen Adresse ausgelesen und dem Subtrahierer 33 zugeführt wird. Dieser Subtrahierer 33 bildet nun die Differenz zwischen den Inhalten der ersten und der verschobenen Adreesse, und zwar hier nicht in Zweierkomplement-Darstellung, sondern nach Betrag und Vorzeichen, wobei nur die den Betrag angebenden Signale dem einen Eingang eines Addierers 35 zugeführt werden, wie durch die beiden parallelen Striche an dieser Verbindung angedeutet ist, während der Vorzeichenausgang nicht angeschlossen ist.
Der Addierer 35 ist mit seinem Ausgang an ein Register 37 angeschlossen, dessen Ausgang 38 an den anderen Eingang des Addierers 35 angeschlossen ist. Der Einschreib-Eingang des Registers 37 ist über die Leitung 22 mit dem des J-K-Flipflops 23 verbunden, so daß mit dem nächsten Taktsignal Ck der Ausgangswert des Addierers 35 in das Register 37 eingeschrieben wird, wenn gleichzeitig der Umschalter 27 in die dargestellte Stellung zurückgeschaltet wird und der Zähler 3 ein Taktsignal erhält, so daß er die zweite Adresse im Sprachsignalspeicher 1 ansteuert. Da das Register 37 zu Anfang gelöscht war, d. h., den Wert Null enthielt, wie später erläutert wird, werden somit die vom Subtrahierer 33 erzeugten Beträge der Differenzen im Register 37 aufsummiert.
Der Ausgang 38 des Registers 37 ist ferner mit dem einen Eingang eines Vergleichers 41 verbunden, dessen anderer Eingang mit dem Ausgang des Registers 11 verbunden ist, das bereits im Zusammenhang mit der Anordnung nach Fig. 2 erläutert wurde und einen Wert enthält, der einem Bruchteil der Gesamtenergie des Sprachsignals im Zeitabschnitt entspricht.
Sobald nun der Wert am Ausgang 38 des Registers 37 während des Aufsummierens der Differenzen den Wert am Ausgang des Registers 11 überschreitet, erzeugt der Vergleicher 41 ein Ausgangssignal auf der Leitung 42, das den Zähler 3 auf die Anfangsstellung zurücksetzt, bevor dieser einen vollständigen Durchlauf beendet hat. Außerdem erzeugt das Signal auf der Leitung 42 über das ODER-Glied 43 ein Signal auf der Leitung 44, die mit dem Takteingang des Verschiebungszählers 29 und dem Löscheingang des Registers 37 verbunden ist, so daß das Ausgangssignal des Vergleichers 41 dem Verschiebungszähler 29 einen Zähltakt zuführt, so daß der Wert auf der Leitung 30 um eine Einheit erhöht wird und das Register 37 auf den Anfangswert Null zurücksetzt, so daß mit der neuen Adressenverschiebung erneut eine Aufsummierung der Differenzen erfolgt.
Erst wenn während der Aufsummierung der Wert am Ausgang 38 des Registers 37 den Wert am Ausgang des Registers 11 nicht überschreitet, bis der Zähler 3 einen vollständigen Durchlauf beendet und somit alle Differenzen aufsummiertsind, erscheint auf dem Steuerausgang 4 ein Folgeende-Signal, das ebenfalls wie ein Signal auf der Leitung 42 über das ODER- Gatter 43 und die Leitung 44 den Verschiebungszähler 29 um einen Schritt weiterschaltet und das Register 37 löscht. Außerdem erhält nun das Register 11 einen Einschreibtakt, so daß der über den Umschalter 19 zugeführt Wert in das Register 11 eingeschrieben wird. Dieser Umschalter 19, der vom Ausgangssignal des Schwellwert- Vergleichers 9 in Fig. 2 gesteuert wird, befindet sich in der dargestellten Stellung, da das Signal am Ausgang 10 dieses Schwellwert-Vergleichers durch das Signal auf der Leitung 18 bzw. am Ausgang a wieder zum Verschwinden gebracht wird. In das Register 11 wird daher der Wert am Ausgang 38 des Registers 37, d. h., eine Summe kleiner als der Bruchteil der Gesamtenergie bzw. später kleiner als die jeweils vorhergehende Summe, eingeschrieben. Falls danach wieder eine größere Summe auftritt, erzeugt der Vergleicher 41 wieder ein Signal auf dem Ausgang 42, wodurch u. a. der Zähler 3 wieder ohne Vollendung eines vollständigen Durchlaufs auf den Anfangswert zurückgesetzt wird, so daß dann kein Signal auf dem Steuerausgang 4 erscheint. Dadurch enthält das Register 11 schließlich die kleinste aufgetretene Summe, und das letzte Signal am Steuerausgang 4 tritt auch zusammen mit dieser kleinsten Summe, d. h. dem Minimum der Folge von Summen, auf.
Die Leitung 30, die den Wert der Verschiebung der Sprachsignale bzw. der Adressen gegeneinander angibt, führt auf den Ausgang k der Teilanordnung in Fig. 3, und der Steuerausgang 4 führt auf den Ausgang s dieser Teilanordnung. Diese beiden Ausgänge sind mit der Teilanordnung in Fig. 4 verbunden.
Die in Fig. 4 dargestellte Anordnung, in der auch das J-K-Flipflop 17 aus Fig. 2 nochmals dargestellt ist, dient zum Bestimmen und zum Steuern des Endes der Suche nach dem Minimum der Funktion F, d. h. dem Minimum der Folge von Summen.
Der Eingang k, der den Verschiebungswert führt, ist mit dem Dateneingang eines Registers 51 verbunden, dessen Einschreib- Eingang mit dem Eingang s verbunden ist, der das Folgeende-Signal vom Steuerausgang 4 in Fig. 3 erhält. Dadurch enthält das Register 51 jeweils entsprechend wie das Register 11 in Fig. 3 den Wert der Verschiebung, bei dem die kleinste Summe der Differenzen aufgetreten ist und somit auch den Wert k p der Verschiebung beim Minimum der Funktion F in Fig. 1b.
Ferner ist der Eingang k mit dem einen Eingang eines Maximum-Vergleichers 65 verbunden, dessen anderer Eingang mit dem Ausgang 64 eines Registers 63 verbunden ist, der den Wert der maximalen Verschiebung enthält, bis zu dem nach einem Minimum der Funktion F gesucht werden soll. Dieser Wert wird über den Umschalter 61, der mit dem Dateneingang des Registers 63 verbunden ist, auf folgende Weise eingeschrieben.
Nach einem Startsignal erzeugt während des ersten Durchlaufs des Zählers 3, bei dem die Gesamtenergie des Sprachsignals ermittelt wird, der Schwellwert-Vergleicher 9 am Ausgang 10 und damit am Ausgang c ein Signal, wenn diese Energie einen vorgegebenen Schwellwert überschreitet, und der Ausgang c ist in Fig. 4 mit dem einen Eingang eines ODER-Gatters 59 verbunden, das den Umschalter 61 ansteuert und in die Stellung entgegengesetzt zur gezeichneten Stellung umschaltet. Damit wird dem Dateneingang des Registers 63 ein Maximalwert k max der Verschiebung von einer Quelle 55 zugeführt, die aus einer Anzahl fest mit einer der beiden Signalspannungen verbundenen Leitungen bestehen kann. Ferner wird durch das Signal am Ende dieses ersten Durchlaufs auf dem Steuerausgang 4 in Fig. 2 ein Signal über den Ausgang b dem gleich bezeichneten Eingang in Fig. 4 zugeführt, das über das ODER-Gatter 75 dem Einschreib- Eingang des Registers 63 zuführt. Damit enthält dieses Register 63 zu Beginn der Suche nach dem Minimum den Maximalwert k max der Verschiebung, damit bei einem stimmlosen Teil des Sprachsignals, bei dem kein Minimum der Folge der Summe auftritt, die Suche nach dem Minimum beendet werden kann.
Wenn danach eine vollständige Summe der Differenzen kleiner ist als der vorgegebene Bruchteil der Energie, wird auf der Steuerleitung 4 in Fig. 3 wieder ein Folgeende- Signal abgegeben, wie dort beschrieben wurde, und dieses Signal gibt das UND-Gatter 73 frei, da das Flipflop 71 sich in der rückgesetzten Stellung befindet und somit der auf der Leitung 72 ein Signal abgibt, so daß das nächste inverse Taktsignal am Ausgang des UND-Gatters 73 und damit über das ODER-Gatter 75 auch am Einschreib-Eingang des Registers 63 ein Signal erzeugt. Ferner ist der den Verschiebungswert führende Eingang k mit dem einen Eingang eines Addierers 53 verbunden, dessen anderer Eingang einen festen Bereichswert δ k erhält, beispielsweise durch entsprechende feste Verdrahtung mit Signalspannungen. Der Ausgang des Addierers 53 liefert den Wert k a +δ k und führt außer auf den einen Eingang des Umschaltes 61 auch auf den einen Eingang des Vergleichers 57, dessen anderer Eingang mit dem maximalen Verschiebungswert k max der Quelle 55 verbunden ist. Nur wenn der Wert am Ausgang des Addierers 53 größer ist als der von der Quelle 55 gelieferte Wert, erzeugt der Vergleicher 57 ein Ausgangssignal, das über das ODER-Gatter 59 den Umschalter 61 in die entgegengesetzte Stellung umschaltet, so daß in das Register 63 nochmals der Maximalwert k max der Verschiebung eingeschrieben wird. In den meisten Fällen wird jedoch der Wert k a +δ k am Ausgang des Addierers 53 kleiner sein als der Maximalwert, so daß dieser über den nicht umgeschalteten Umschalter 61 in das Register 63 eingeschrieben wird.
Wie bei der Fig. 2 erläutert, wird das J-K-Flipflop 17 erst eine halbe Taktzeit nach dem Auftreten des ersten Signals am Steuerausgang 4 umgeschaltet, so daß erst dann ein Signal am Ausgang a erscheint. Dieser Ausgang a ist über den gleich bezeichneten Eingang mit dem D-Eingang eines D-Flipflops 77 verbunden, das sich zunächst im Ruhezustand befindet, wobei der Q-Ausgang auf der Leitung 78 ein Signal erzeugt, das das Register 51 gelöscht und die bistabile Kippstufe 71 zurückgesetzt hält. Erst mit dem nächsten inversen Taktsignal wenn das Signal am Steuerausgang 4 in Fig. 2 bzw. Fig. 3 und somit auch das Signal am Eingang s in Fig. 4 verschwunden ist, wird das D-Flipflop 77 umgeschaltet, so daß das Signal auf der Leitung 78 verschwindet: Beim nächsten Signal am Eingang s, mit dem das Register 63 zum zweiten Mal eingeschrieben wird, wird das D-Flipflop 71 über den D-Eingang vorbereitet und mit dem nächsten Taktsignal Ck umgeschaltet, so daß nun das Signal am -Ausgang verschwindet und das UND-Gatter 73 gesperrt wird, so daß das Register 63 nicht wieder eingeschrieben wird, bis ein neues Startsignal für einen neuen Zeitabschnitt des Sprachsignals erscheint.
Wenn nun der Verschiebungswert am Eingang k größer wird als der Wert am Ausgang 64 des Registers 63, d. h., wenn das Ende des Bereichs, in dem ein Minimum gesucht wird, oder der Maximalwert der Verschiebung erreicht ist, erzeugt der Vergleicher 65 auf der Ausgangsleitung 66 ein Signal, das den Einschreib-Eingang eines Speichers 69 ansteuert, dessen Dateneingang mit dem Ausgang 52 des Registers 51 verbunden ist, das in diesem Augenblick den Wert der Verschiebung beim Minimum der Funktion F enthält. Dadurch werden im Speicher 69 die Periodendauern aufeinanderfolgender Sprachabschnitte gespeichert. Ferner ist die Leitung 66 mit dem K-Eingang des J-K- Flipflops 17 verbunden, das am Takteingang das inverse Taktsignal erhält, so daß eine halbe Taktzeit nach dem Erreichen des Endpunktes der Suche nach dem Minimum das J-K-Flipflop 17 umschaltet, wodurch das Signal am Q-Ausgang 18 und damit aus Ausgang a verschwindet. Dadurch verschwindet auch das Signal an den J- und K-Eingängen des Flipflops 23 in Fig. 3, so daß dieses in der Stellung stehenbleibt, in der am auf der Leitung 22 ein Signal erzeugt wird, und keine weiteren Signalwechsel mehr erscheinen bis zur Verarbeitung des nächsten Zeitabschnitts des Sprachsignals. Damit ist die Bestimmung der Periodendauer der Stimmbandgrundfrequenz in einem Zeitabschnitt eines Sprachsignals beendet. Die im Speicher 69 schließlich enthaltene Folge von Periodendauern des Sprachsignals kann anschließend noch weiterverarbeitet werden, beispielsweise können einzelne Ausreißer bei den Werten, die durch Periodenverdoppelung bzw. -vervielfachung entstehen können, beseitigt und die durch stimmlose Sprachabschnitte erzeugten Pausen ausgefüllt werden.
Der minimale Wert der Verschiebung, bei dem die Suche nach dem Minimum beginnt und der jeweils in den Zähler 29 in Fig. 3 eingeschrieben wird, muß nicht beim Minimalwert k min beginnen, sondern er kann auch von der Periodendauer des Sprachsignals im vorhergehenden Abschnitt abgeleitet werden, z. B. durch Verminderung um einen festen Wert, sofern dabei nicht der Minimalwert k min unterschritten wird. Hierfür muß dann der in den Speicher 69 eingeschriebene Wert in einem Register zwischengespeichert werden, an das eine Anordnung ähnlich der Anordnung zur Bestimmung der maximalen Verschiebung in Fig. 4 aus den Elementen 53, 55, 57 und 61 angeschlossen wird. Falls das Verfahren zur Stimmbandgrundfrequenz für die Sprecherverifikation verwendet werden soll, wo die aus einem Sprachsignal gewonnenen Daten mit den Referenzdaten des angegebenen Spechers verglichen werden, kann bei diesen Referenzdaten die untere Grenze für die Periode der Stimmbandgrundfrequenz mitgespeichert sein. Dabei ergibt sich eine weitere merkliche Einsparung an Rechenzeit.
In der beschriebenen Anordnung können die angegebenen Elemente, wie Speicher, Register und Rechenelemente in verschiedener bekannter Weise aufgebaut sein. Dabei können beispielsweise die beiden Speicher zu einem einzigen Speicher entsprechender Größe zusammengefaßt werden, und auch die Rechenelemente können durch Mehrfach- Ausnutzung zusammengefaßt werden. Insbesondere können diese Elemente, wie auch die Register und Vergleicher, alle oder zumindest zum Teil durch einen festprogrammierten Mikroprozessor ersetzt werden.

Claims (7)

1. Verfahren zum Bestimmen der Stimmbandgrundfrequenz eines Sprachsignals, bei dem ein Zeitabschnitt (T) des Sprachsignals (s(t)) gegenüber dem Sprachsignal verschoben und für unterschiedliche Verschiebungen (k) die Beträge der Differenzen zwischen dem Sprachsignal und dem verschobenen Sprachsignal über den Zeitabschnitt aufsummiert werden, wobei die Verschiebung (k p ), bei der die Folge der so gebildeten Summen ein Minimum hat, bestimmt wird und diese Verschiebung die Periodendauer der Stimmbandgrundfrequenz angibt, dadurch gekennzeichnet, daß zunächst durch Aufsummieren der Beträge des Sprachsignals (s(t)) im Zeitabschnitt (T) die Energie (E) des Sprachsignals im Zeitabschnitt bestimmt wird, daß die Aufsummierung der Differenzen, bei einem vorgegebenen minimalen Wert (k min ) der Verschiebung beginnend, für jeden Wert (k) der Verschiebung abgebrochen und die Verschiebung um einen Schritt vergrößert wird, sobald während der Aufsummierung ein vorgegebener Bruchteil der Energie (pE) überschritten wird, daß nach der ersten Summe kleiner als der Bruchteil der Energie jede folgende Summe mit der kleinsten vorhergehenden Summe verglichen und der Wert der Verschiebung zwischengespeichert wird, wenn eine Summe kleiner ist als die Vergleichssumme, und daß die Vergrößerung der Verschiebung mit folgender Aufsummierung der Differenzbeträge beendet wird, wenn die Verschiebung einen vorgegebenen maximalen Wert (k max ) erreicht hat, wobei der zuletzt zwischengespeicherte Wert (k p ) der Verschiebung die Periodendauer der Stimmbandgrundfrequenz für den Zeitabschnitt angibt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene maximale Wert die um einen festen Bereichswert (δ k ) vergrößerte Verschiebung (k a ) ist, bei der erstmalig die Summe der Differenzbeträge kleiner als der vorgegebene Bruchteil der Energie (pE) ist, wenn diese vergrößerte Verschiebung (k a +δ k ) kleiner ist als ein vorgegebener Maximalwert der Verschiebung (k max ), und daß der vorgegebene maximale Wert der Maximalwert der Verschiebung (k max ) ist, wenn dieser kleiner ist als die vergrößerte Verschiebung (k a +δ k ) oder wenn keine Summe kleiner als der vorgegebene Bruchteil der Energie bis zum Erreichen des Maximalwertes der Verschiebung auftritt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Energie (E) mit einem vorgegebenen Schwellwert verglichen und die nachfolgende Aufsummierung nur dann freigegeben wird, wenn der Schwellwert überschritten wird.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, mit einem Sprachsignalspeicher, der die zeitdiskreten Werte eines Sprachsignals von einer Länge mindestens gleich der Summe der Länge eines Zeitabschnitts und dem Maximalwert der Verschiebung enthält, mit einer Adressieranordnung, die an den Adresseneingang des Sprachsignalspeichers angeschlossen ist und Folgen von aufeinanderfolgenden Adressenpaaren aus jeweils einer Adresse eines Wertes des Sprachsignals im Zeitabschnitt und einer um einen bestimmten, nach jeder Folge um eine Einheit vergrößerten Adressenabstand verschobenen Adresse liefert, mit einer Recheneinheit, die an dem Datenausgang des Sprachsignalspeichers angeschlossen ist und Differenzbeträge zwischen an den Adressen jeweils eines Adressenpaares gespeicherten Werten über die Folge der Adressenpaare aufsummiert, dadurch gekennzeichnet, daß zu Beginn der Verarbeitung eines Zeitabschnitts eine Steueranordnung (21) die Adressieranordnung (3, 23, 25, 27, 29) ansteuert, um eine erste Folge nur von Adressen der Werte des Sprachsignals in dem Zeitabschnitt zu erzeugen, daß an den Datenausgang des Sprachsignalspeichers(1) ein Akkumulator (5, 7) angeschlossen ist, daß mit dem Ausgang (8) des Akkumulators der eine Eingang eines Multiplizierers (13) verbunden ist, der am anderen Eingang einen festen Wert empfängt, daß die Adressieranordnung nach der Erzeugung der ersen Adressenfolge den Ausgangswert des Multiplizierers in ein Vergleichsregister (11) einschreibt und die Steueranordnung (21) zur Erzeugung von Folgen von Adressenpaaren umschaltet, daß der Ausgang des Vergleichsregisters mit dem einen Eingang eines Minimum-Vergleichers (41) verbunden ist, dessen anderer Eingang mit dem Ausgang der Recheneinheit (31, 33, 35, 37) verbunden ist und der am Ausgang (42) ein Signal erzeugt, wenn der Wert am Ausgang der Recheneinheit größer ist als der Wert am Ausgang des Vergleichsregisters, daß die Adressieranordnung an einem Steuerausgang (4) ein Folgeende-Signal nach jeder beendeten Folge von Adressen bzw. Adressenpaaren erzeugt, daß der Steuerausgang der Adressieranordnung mit dem Einschreib- Eingang des Vergleichsregisters, dessen Datenausgang nach dem Erzeugen der ersten Adressenfolge auf den Ausgang der Recheneinheit umgeschaltet ist, und dem Einschreib- Eingang eines Periodendauer-Registers (51) verbunden ist, dessen Dateneingang an einen den momentanen Wert der Verschiebung liefernden Verschiebungsausgang (30) der Adressieranordnung angeschlossen ist, daß der Steuereingang der Adressieranordnung und der Ausgang des Minimum-Vergleichers gemeinsam mit einem Rückstelleingang der Recheneinheit und einem Erhöhungseingang der Adressieranordnung zum Erhöhen der Verschiebung der Adressen gekoppelt sind, und daß ein Maximum-Vergleicher (65) vorgesehen ist, dessen einer Eingang mit dem Verschiebungsausgang verbunden ist und dessen anderer Eingang einen vorgegebenen maximalen Wert erhält und dessen Ausgang (66) mit einem Sperreingang der Adressieranordnung verbunden ist und ein Signal liefert, wenn der Wert am Verschiebungsausgang größer ist als der maximale Wert, wobei dieses Signal die Erzeugung weiterer Folgen von Adressenpaaren bis zur Verarbeitung des nächsten Zeitabschnittes sperrt und den im Periodendauer-Register enthaltenen Wert der Periodendauer ausgibt.
5. Anordnung nach Anspruch 4, dadurch gekennzeichnet, daß der andere Eingang (64) des Maximum-Vergleichers (65) mit einer Quelle (55) zum Liefern eines Maximalwertes der Verschiebung der Adressen gekoppelt ist und daß das Folgeende-Signal am Steuerausgang (4) der Adressieranordnung (3, 23, 25, 27, 29) nach Erzeugung einer Folge von Adressenpaaren diesen anderen Eingang des Maximum-Vergleichers mit einer Addieranordnung (57), die die Summe des Wertes am Verschiebungsausgang (30) und einem fest vorgegebenen Bereichswert bildet, koppelt, wenn diese Summe kleiner ist als der Maximalwert.
6. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß dem anderen Eingang (64) des Maximum-Vergleichers (65) ein Maximum-Register (63) vorgeschaltet ist.
7. Anordnung nach Anspruch 4 oder einem der folgenden, dadurch gekennzeichnet, daß ein Schwellwert-Vergleicher (9) vorgesehen ist, dessen einer Eingang mit dem Ausgang (8) des Akkumulators (5, 7) verbunden ist und dessen anderer Eingang einen festen Schwellwert erhält und der am Ausgang (10) ein Signal erzeugt, wenn der Wert am Ausgang des Akkumulators den festen Schwellwert überschreitet, wobei dieser Ausgang des Schwellwert-Vergleichers mit dem Sperreingang der Adressieranordnung (3, 23, 25, 27, 29) gekoppelt ist und das Ausgangssignal die Erzeugung von Folgen von Adressenpaaren freigibt.
DE19792939330 1979-09-28 1979-09-28 Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals Granted DE2939330A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19792939330 DE2939330A1 (de) 1979-09-28 1979-09-28 Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19792939330 DE2939330A1 (de) 1979-09-28 1979-09-28 Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals

Publications (2)

Publication Number Publication Date
DE2939330A1 DE2939330A1 (de) 1981-04-16
DE2939330C2 true DE2939330C2 (de) 1987-10-22

Family

ID=6082114

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19792939330 Granted DE2939330A1 (de) 1979-09-28 1979-09-28 Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals

Country Status (1)

Country Link
DE (1) DE2939330A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3732096A1 (de) * 1987-09-24 1989-04-13 Enno Leopold Algorithmus zum schaetzen der stimmbandgrundfrequenz von digitalisierten sprachsignalen mit kriterium fuer die stimmhaft-stimmlos-entscheidung

Also Published As

Publication number Publication date
DE2939330A1 (de) 1981-04-16

Similar Documents

Publication Publication Date Title
DE2536585C3 (de) Anordnung zur statistischen Signalanalyse
DE2702624C2 (de) Verfahren und Vorrichtung zur Erzeugung einer naturgetreuen Digitaldarstellung von Amplitudenänderungen eines Analogsignales
DE3306306A1 (de) Arithmetische verarbeitungsvorrichtung
DE2133638C3 (de) Verfahren zum Betrieb eines lernfähigen Systems aus in Kaskade geschalteten, zur nicht linearen Datenverarbeitung geeigneten lernfähigen Datenverarbeitungseinheiten
DE2504675A1 (de) Analog/digitalwandlergeraet
DE1947792A1 (de) Vier-Quadranten-Impulsbreiten-Multiplikator
DE2432594B2 (de) Rekursives Digitalfilter
DE2355640A1 (de) Anordnung zur spektralanalyse von elektrischen signalen
DE2730662A1 (de) Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors
DE2634426A1 (de) Bandkompressionseinrichtung
EP0036074B1 (de) Syntheseschaltung für periodische Signale, insbesondere als Teil eines Musikinstruments
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
DE2920041C2 (de) Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens
DE2939330C2 (de)
DE4002270C2 (de)
DE2019603A1 (de) Digital-analoge Recheneinrichtung
EP0272723B1 (de) Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens
DE3633461A1 (de) Taktsignalgebervorrichtung
DE3037276C2 (de) Tonsynthesizer
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE3215868A1 (de) Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette
DE3335026C2 (de)
DE3046772C2 (de) Taktgenerator
DE3342739C2 (de) A/D- und D/A-Wandlung
DE2712831C3 (de)

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G10L 9/00

D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee