DE2939330C2 - - Google Patents
Info
- Publication number
- DE2939330C2 DE2939330C2 DE19792939330 DE2939330A DE2939330C2 DE 2939330 C2 DE2939330 C2 DE 2939330C2 DE 19792939330 DE19792939330 DE 19792939330 DE 2939330 A DE2939330 A DE 2939330A DE 2939330 C2 DE2939330 C2 DE 2939330C2
- Authority
- DE
- Germany
- Prior art keywords
- output
- value
- input
- speech signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000006073 displacement reaction Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 25
- 210000001260 vocal cord Anatomy 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 16
- 230000000903 blocking effect Effects 0.000 claims 2
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000006266 hibernation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Die Erfindung betrifft ein Verfahren zum Bestimmen der
Stimmbandgrundfrequenz eines Sprachsignals, bei dem ein
Zeitabschnitt des Sprachsignals gegenüber dem Sprachsignal
verschoben und für unterschiedliche Verschiebungen die Beträge
der Differenzen zwischen dem Sprachsignal und dem
verschobenen Sprachsignal über den Zeitabschnitt aufsummiert
werden, wobei die Verschiebung, bei der die Folge der so
gebildeten Summen ein Minimum hat, betimmt wird und
diese Verschiebung die Periodendauer der Stimmbandgrundfrequenz
angibt, sowie eine Anordnung zur Durchführung des
Verfahrens.
Ein solches Verfahren ist bekannt aus "IEEE Trans-Acoust,
Speech, and Signal Processing", Vol. ASSP-24 (Oct. 1976),
Seiten 399 bis 418, und Vol. ASSP-22 (Oct. 1974), Seiten
353 bis 362. Durch Bestimmung der Periodendauer in dieser
Art für aufeinanderfolgende Zeitabschnitte des Sprachsignals
kann dann der Verlauf der Stimmbandgrundfrequenz
ermittelt werden. Die bekannten Verfahren erfordern jedoch
eine Vielzahl von Rechenschritten, so daß eine
schnelle Verarbeitungsanordnung bzw. Schaltungen mit
hoher Taktgeschwindigkeit erforderlich sind, wenn die
Verarbeitung in Echtzeit erfolgen soll, d. h., die Periodendauer
eines Zeitabschnitts des Sprachsignals während einer
Zeit höchstens gleich diesem Zeitabschnitt bestimmt werden
soll.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren
anzugeben, bei dem die Stimmbandgrundfrequenz mittels möglichst
weniger und einfacher Verarbeitungsschritte bestimmt
werden kann.
Diese Aufgabe wird bei dem eingangs genannten Verfahren erfindungsgemäß dadurch
gelöst, daß zunächst durch Aufsummieren der Beträge des Sprachsignals im Zeitabschnitt die Energie des Sprachsignals
im Zeitabschnitt bestimmt wird, daß die Aufsummierung der
Differenzen, bei einem vorgegebenen minimalen Wert der Verschiebung
beginnend, für jeden Wert der Verschiebung abgebrochen
und die Verschiebung um einen Schritt vergrößert
wird, sobald während der Aufsummierung ein vorgegebener
Bruchteil der Energie überschritten wird, daß nach der
ersten Summe kleiner als der Bruchteil der Energie jede
folgende Summe mit der kleinsten vorhergehenden Summe verglichen
und der Wert der Verschiebung zwischengespeichert
wird, wenn die Summe kleiner ist als die Vergleichssumme,
und daß die Vergrößerung der Verschiebung mit folgender
Aufsummierung der Differenzbeträge beendet wird, wenn die
Verschiebung einen vorgegebenen maximalen Wert erreicht
hat, wobei der zuletzt zwischengespeicherte Wert der Verschiebung
die Periodendauer der Stimmbandgrundfrequenz für
den Zeitabschnitt angibt. Mit Differenzbeträgen sind hier und
auch im folgenden die Beträge der Differenzen gemeint. Die
Energie des Sprachsignals ist hier das Integral bzw. bei
zeitdiskreten Signalabtastwerten die Summe des Betrages des
Sprachsignals.
Auf diese Weise wird jeder Teilschritt der Verarbeitung nur
so weit durchgeführt, bis feststeht, ob er zur Bestimmung
des Minimums der Folge der Summen beiträgt oder nicht. So
wurde festgestellt, daß die das Minimum bildende Summe und
damit auch die in der Umgebung liegenden Summen den Mittelwert
der Energie des Sprachsignals im Zeitabschnitt, der bei
konstanter Dauer des Zeitabschnitts proportional der Gesamtenergie
des Sprachsignals im Zeitabschnitt ist, um einen bestimmten
Faktor unterschreiten muß. Daher kann eine Summe,
die den bestimmten Bruchteil der Energie bzw. der mittleren
Energie überschreitet, nicht in der Nähe des Minimums liegen,
so daß die weitere Durchführung der Aufsummierung der Differenzen
hierfür sinnlos ist. Durch Vermeidung unnötiger Berechnungen
auf diese Weise kann die Bestimmung der Periodendauer
erheblich beschleunigt werden. Sobald jedoch eine Summe
diesen Bruchteil der Energie unterschreitet, kann durch Vergleich
der folgenden Summen mit der jeweils kleinsten vorhergehenden
Summe und der Zwischenspeicherung der Verschiebung
auf einfache Weise der Wert der Verschiebung festgestellt
werden, bei dem die Folge der Summen ein Minimum hat.
Es wurde ferner festgestellt, daß der Bereich in der Folge
der Summen, in dem die Summen den Bruchteil der Energie
unterschreiten und in dem das Minimum liegt, eine begrenzte
maximale Größe hat. Wenn also eine Summe den Bruchteil der
Energie unterschreitet, braucht die Suche nach dem Minimum
nur während eines bestimmten folgenden Bereiches von Verschiebungen
weitergeführt zu werden, d. h., das in diesem
Bereich gefundene Minimum ist mit sehr großer Sicherheit
auch das tatsächliche Minimum der Folge der Summen. Dies
erfolgt nach einer Ausgestaltung des erfindungsgemäßen
Verfahrens dadurch, daß der vorgegebene maximale Wert
die um einen festen Bereichswert vergrößerte Verschiebung
ist, bei der erstmalig die Summe der Differenzen kleiner
als der vorgegebene Bruchteil der Energie ist, wenn diese
vergrößerte Verschiebung kleiner ist als ein vorgegebener
Maximalwert der Verschiebung, und daß der vorgegebene
maximale Wert der Maximalwert der Verschiebung ist, wenn
dieser kleiner ist als die vergrößerte Verschiebung oder
wenn keine Summe kleiner als der vorgegebene Bruchteil der
Energie bis zum Erreichen des Maximalwertes der Verschiebung
auftritt. Auf diese Weise wird die Bestimmung der
Periodendauer weiter beschleunigt.
In einem natürlichen Sprachsignal sind stets auch Abschnitte
vorhanden, in denen das Sprachsignal praktisch verschwindet
oder zumindest so leise ist, daß es sich nicht wesentlich
über das Rauschen oder andere Störgeräusche erhebt.
Während solcher Teile ist entweder keine Stimmbandgrundfrequenz
vorhanden oder ihre Bestimmung ist zumindest sehr
unsicher. Damit diese Teile den Verlauf der Stimmbandgrundfrequenz
des Sprachsignals nicht zu sehr verfälschen, ist
es zweckmäßig, daß die Energie mit einer vorgegebenen
Schwelle verglichen und die nachfolgende
Aufsummierung nur dann freigegeben wird, wenn die Schwelle
überschritten wird. Dadurch werden solche Teile des Sprachsignals
wie stimmlose Teile behandelt.
Um das erfindungsgemäße Verfahren mit einfachen Mitteln
zu realisieren, ist eine Anordnung zur Durchführung des
erfindungsgemäßen Verfahrens mit einem Sprachsignalspeicher,
der die zeitdiskreten Werte eines Sprachsignals von einer
Länge mindestens gleich der Summe der Länge eines Zeitabschnitts
und dem Maximalwert der Verschiebung enthält,
mit einer Adressieranordnung, die an den Adresseneingang
des Sprachsignalspeichers angeschlossen ist und Folgen
von aufeinanderfolgenden Adressenpaaren aus jeweils einer
Adresse eines Wertes des Sprachsignals im Zeitabschnitt
und einer um einen bestimmten, nach jeder Folge um eine
Einheit vergrößerten Adressenabstand verschobenen Adresse
liefert, mit einer Recheneinheit, die an den Datenausgang
des Sprachsignalspeichers angeschlossen ist und Differenzbeträge
zwischen an den Adressen jeweils eines Adressenpaares
gespeicherten Werten über die Folge der Adressenpaare
aufsummiert, dadurch gekennzeichnet, daß zu Beginn
der Verarbeitung eines Zeitabschnitts eine Steueranordnung
die Adressieranordnung ansteuert, um eine erste Folge
nur von Adressen der Werte des Sprachsignals in dem Zeitabschnitt
zu erzeugen, daß an den Datenausgang des Sprachsignalspeichers
ein Akkumulator angeschlossen ist, daß
mit dem Ausgang des Akkumulators der eine Eingang eines
Multiplizierers verbunden ist, der am anderen Eingang
einen festen Wert empfängt, daß die Adressieranordnung
nach der Erzeugung der ersten Adressenfolge den Ausgangswert
des Multiplizierers in ein Vergleichsregister einschreibt
und die Steueranordnung zur Erzeugung von Folgen
von Adressenpaaren umschaltet, daß der Ausgang des Vergleichsregisters
mit dem einen Eingang eines Minimum-
Vergleichers verbunden ist, dessen anderer Eingang mit dem
Ausgang der Recheneinheit verbunden ist und der am Ausgang
ein Signal erzeugt, wenn der Wert am Ausgang der Recheneinheit
größer ist als der Wert am Ausgang des Vergleichsregisters,
daß die Adressieranordnung an einem Steuerausgang
ein Folgeende-Signal nach jeder beendeten Folge
von Adressen bzw. Adressenpaaren erzeugt, daß der Steuerausgang
der Adressieranordnung mit dem Einschreib-Eingang
des Vergleichsregisters, dessen Datenausgang nach dem
Erzeugen der ersten Adressenfolge auf den Ausgang der
Recheneinheit umgeschaltet ist, und dem Einschreib-Eingang
eines Periodendauer-Registers verbunden ist, dessen
Dateneingang an einen den momentanen Wert der Verschiebung
liefernden Verschiebungsausgang der Adressieranordnung
angeschlossen ist, daß der Steuereingang der Adressieranordnung
und der Ausgang des Minimum-Vergleichers
gemeinsam mit einem Rückstelleingang der Recheneinheit
und einem Erhöhungseingang der Adressieranordnung zum Erhöhen
der Verschiebung der Adressen gekoppelt sind, und
daß ein Maximum-Vergleicher vorgesehen ist, dessen einer
Eingang mit dem Verschiebungsausgang verbunden ist und
dessen anderer Eingang einen vorgegebenen maximalen Wert
erhält und dessen Ausgang mit einem Sperreingang der
Adressieranordnung verbunden ist und ein Signal liefert,
wenn der Wert am Verschiebungsausgang größer ist als der
maximale Wert, wobei dieses Signal die Erzeugung weiterer
Folgen von Adressenpaaren bis zur Verarbeitung des nächsten
Zeitabschnittes sperrt und den im Periodendauer-
Register enthaltenen Wert als Periodendauer ausgibt.
Ausgestaltungen dieser Anordnung sind in den weiteren
Unteransprüchen gekennzeichnet.
Ausführungsbeispiele der Erfindung werden nachstehend
anhand der Zeichnung näher erläutert. Es zeigt
Fig. 1a einen Teil eines Sprachsignals,
Fig. 1b ein Beispiel für den Verlauf der Folge der Summen
mit einigen charakteristischen Werten,
Fig. 2 bis 4 Blockschaltbilder von Teilen einer vollständigen
Anordnung zur Bestimmung der Periodendauer jeweils
eines Zeitabschnitts eines Sprachsignals.
Ein Ausschnitt aus einem typischen Sprachsignal ist in
Fig. 1a dargestellt. Dieses Signal weist einige hohe
Amplituden auf, zwischen denen das Signal mit niedrigerer
Amplitude verläuft. Dabei haben die Amplituden zum Zeitpunkt
t₁ und t₃ etwa den gleichen Wert, während die dazwischenliegende
Amplitude bei t₂ einen kleineren Wert
hat. Die Tonhöhe des Sprachsignals, d. h. die Stimmbandgrundfrequenz,
wird durch die Periode des Sprachsignals
bestimmt, d. h., die Frequenz ist gleich dem Kehrwert der
Periode. Zur Bestimmung der Periode kann nun der Abstand
dieser hohen Amplituden im Sprachsignal verwendet werden.
Es ist jedoch leicht zu erkennen, daß dabei bereits der
Abstand zwischen den Amplituden bei t₁ und t₂ fälschlich
als Periode erfaßt werden kann.
Da es sich bei einem Sprachsignal allgemein um ein quasi-
stationäres Signal handelt, das seinen Verlauf jeweils
innerhalb einer Periode eher langsam über mehrere Perioden
ändert, ist es zweckmäßiger, Autokorrelationsverfahren zu
verwenden. Dabei wird im Falle eines kontinuierlichen
Sprachsignals ein Zeitabschnitt dieses Signals gegenüber
dem gesamten Sprachsignal verschoben und der Grad der
Übereinstimmung bzw. Abweichung bestimmt, und beim Maximum
der Übereinstimmung bzw. Minimum der Abweichung gibt die
Verschiebung des Sprachsignals im Zeitabschnitt gegenüber
dem übrigen Signal die Periodendauer des Signals an. Ein
sehr gut brauchbares Maß für die Abweichung zwischen dem
Sprachsignal und dem verschobenen Sprachsignal gibt die
Summe der Differenzbeträge zwischen diesen beiden Signalen
über den Zeitabschnitt an.
Zur Verdeutlichung ist in Fig. 1a ein Zeitabschnitt des
Sprachsignals vom Beginn der Darstellung an bis zum Punkt
T, der die Länge des Zeitabschnitts angibt, mit einer
stärkeren Linie dargestellt. Ferner ist gestrichelt dieser
Zeitabschnitt um den Wert Δ t verschoben über dem Sprachsignal
als Beispiel dargestellt. Dabei ist zu erkennen, daß
nur sehr wenige Teile des Sprachsignals annähernd übereinstimmen,
während im allgemeinen sehr große Abweichungen
bestehen, d. h., es ergibt sich eine Vielzahl von großen
Differenzen zwischen den beiden Sprachsignalen, deren Beträge
als Summe einen großen Wert ergeben und eine geringe
Übereinstimmung angeben, da die beispielswiese angenommene
Verschiebung erheblich von der Periodendauer des Sprachsignals
abweicht. Für Sprachsignale stellt ein Zeitabschnitt
T von 10 ms und ein Bereich der Verschiebung der
beiden Sprachsignale gegeneinander von 2 ms bis 15 ms
zweckmäßige Werte dar.
In Fig. 1b ist die Funktion F der Summe über die Differenzen
zwischen den beiden Sprachsignalen über den Zeitabschnitt
abhängig von der Verschiebung k aufgetragen. Die
Differenzen sind dabei selbstverständlich nicht vorzeichenrichtig,
sondern nur ihrem Betrag nach aufsummiert, da bei
den Unterschieden der Signale nur deren Beträge von Bedeutung
sind.
In der Praxis werden die Differenzen an zeitdiskreten
Signalen gebildet, d. h., das kontinuierliche Sprachsignal
wird periodisch abgetastet, z. B. mit 5 kHz, so daß sich
eine Folge von Werten ergibt, die in einem Abstand von
200 µs liegen. Der obenerwähnte, stärker ausgezogene Abschnitt
des Sprachsignals enthält dann 50 Abtastwerte.
Entsprechend wird die Verschiebung der beiden Sprachsignale
gegeneinander auch nur in Schritten entsprechend diesem Abstand
der Signalwerte geändert. Die in Fig. 1b dargestellte
Funktion F der Summe der Differenzen besteht daher tatsächlich
auch nur aus einzelnen, diskreten Punkten, die der
Übersichtlichkeit halber hier jedoch durch eine geglättete
Kurve verbunden über die Verschiebung k dargestellt sind.
Die Funktion F der Summen ist vom Beginn bei der Verschiebung
k=0, bei dem diese Funktion ebenfalls wegen völliger
Überdeckung der beiden Sprachsignale den Wert Null hat,
bis zum Wert k min gestrichelt dargestellt, da dieser Bereich
niemals untersucht wird, denn ein Minimum in diesem
Bereich würde eine Stimmbandgrundfrequenz ergeben, die
höher ist als in tatsächlichen Sprachsignalen vorkommend,
selbst bei Sprachsignalen von kleinen Kindern. Falls
sicher ist, daß nur Sprachsignale von erwachsenen Personen
vorkommen können, kann dieser Wert k min noch vergrößert
werden. Andere Möglichkeiten, diesen Minimalwert k min
heraufzusetzen, werden später angedeutet.
Der Verlauf der Funktion F zeigt nach einem Maximum ein
relatives Minimum, das jedoch oberhalb der gestrichelten
Linie beim Wert pE für den Funktionswert F liegt. Darin
bedeutet E den Wert der gesamten Energie des Sprachsignals
in dem Zeitabschnitt von 0 bis T in Fig. 1a, d. h., die
Summe der Flächen zwischen der Kurve des Sprachsignals und
der Abszisse, die bei Division durch die Dauer des Zeitabschnitts
die gesamte Energie des Sprachsignals angibt.
Der Wert p ist so gewählt, daß das Produkt pE unterhalb
der mittleren Energie des Sprachsignals liegt, beispielsweise
bei 62,5% der gesamten Energie. Ein gültiges Minimum
der Funktion F liegt zumindest ohne Einfluß von Störsignalen
praktisch immer unterhalb dieses Wertes, so daß das erste
relative Minimum der Funktion F nicht das gesuchte echte
Minimum sein kann. Dies liegt vielmehr bei dem Wert kp,
und zwar in einem Bereich der Funktion F unterhalb des
Wertes pE. Die Funktion F geht auch im Minimum selten auf
den Wert Null zurück, da auch zwischen unmittelbar benachbarten
Zeitabschnitten eines Sprachsignals fast immer
kleine Unterschiede vorhanden sind.
Die Aufsummierung der Differenzen erfolgt schrittweise, d. h.,
für eine gegebene Verschiebung werden die Differenzbeträge
aufeinanderfolgender Punkte gebildet und aufsummiert.
Da nun ein gesuchtes Minimum der Kurve F nur unterhalb des
Wertes pE liegen kann, kann eine solche Aufsummierung
sofort abgebrochen werden, wenn dieser Wert erreicht wird,
und die Verschiebung kann um einen Schritt erhöht werden.
Wenn dies bei der Funktion F in Fig. 1b beim Verschiebungswert
k min beginnend durchgeführt wird, ist sofort
erkennbar, daß dabei erheblich Rechenzeit gespart wird.
Außerdem wird das erste relative Minimum gar nicht erst
erfaßt. Erst beim Verschiebungswert k a wird zum ersten Mal
der Funktionswert pE unterschritten, und nun erst beginnt
die Prüfung auf ein Minimum. Ein erstes relatives Minimum
tritt beim Wert k₁ auf, jedoch wird, um das tatsächliche
absolute Minimum zu finden, die Prüfung weiter fortgesetzt,
bis das nächste Minimum beim Wert kp gefunden wird. Da
auch dieses nur ein relatives Minimum sein kann, solange
nicht der Funktionswrrt F an solch einem Minimum den Wert
Null erreicht, wird die Prüfung noch weiter fortgesetzt.
Die weitere Suche nach dem Minimum kann bis zum Maximalwert
k max der Verschiebung fortgesetzt werden, denn
darüber hinausgehende Verschiebungen würden eine Stimmbandgrundfrequenz
ergeben, die praktisch nie vorkommt.
Tatsächlich kann die weitere Suche nach dem Minimum jedoch
früher abgebrochen werden, nämlich beim Wert k a +δ k ,
denn das Minimum liegt immer innerhalb eines Bereiches
w k nach dem Wert k a , nachdem die Funktion F erstmalig
den Wert pE unterschritten hat. Auf diese Weise ist eine
weitere Verkürzung der Rechenzeit möglich.
In den Fig. 2 bis 4 sind Blockschaltbilder von Teilen
einer vollständigen Anordnung zur Bestimmung der Stimmbandgrundfrequenz
bzw. deren Periode, auch "pitch period"
genannt, dargestellt. Dabei zeigt die Fig. 2 eine Anordnung
zur Bestimmung der Gesamtenergie des Sprachsignals
im untersuchten Zeitabschnitt sowie zur Bildung des Wertes
pE. Der Sprachsignalspeicher 1 enthält die digitalisierten
Werte des in aufeinanderfolgenden Zeitpunkten abgetasteten
Sprachsignals. Der Adresseneingang dieses Speichers
ist mit dem Parallelausgang 2 eines Adressenzählers 3
verbunden, der am Eingang ein Taktsignal Ck von einer
nicht dargestellten Taktquelle erhält. Diese Verbindung
zwischen dem Parallelausgang 2 des Zählers 3 und dem
Adresseneingang des Sprachsignalspeichers 1 besteht
tatsächlich aus mehreren parallelen Leitungen entsprechend
der Anzahl Stufen des Zählers 3, jedoch sind diese Leitungen
in Fig. 2 der Übersichtlichkeit halber nur als eine
einfache Verbindung dargestellt. Dies gilt auch für eine
Anzahl weiterer Verbindungen zwischen Elementen in dieser
sowie den anderen Figuren, insbesondere an Eingängen von
Registern, Addierern und Vergleichern.
Der Zähler 3 durchläuft nacheinander alle seine Stellungen
und adressiert im Sprachsignalspeicher 1 Speicherstellen
mit den Abtastwerten des Sprachsignals, die nacheinander
am Ausgang des Sprachsignalspeichers 1 erscheinen und
ohne Berücksichtigung des Vorzeichens, d. h. nur dem Betrag
nach, dem einen Eingang eines Addierers 5 zugeführt werden.
Der Ausgang des Addierers 5 ist mit dem Dateneingang eines
Registers 7 verbunden, dessen Ausgang 8 u. a. mit dem anderen
Eingang des Addierers 5 verbunden ist. Der Einschreib-
Eingang des Registers 7 erhält für jeden adressierten
Speicherplatz im Sprachsignalspeicher 1 ein Einschreibsignal,
und zwar im dargestellten Beispiel das invertierte
Taktsignal das dem um eine halbe Taktperiode verschobenen
Taktsignal Ck entspricht. Auf diese Weise bilden
Addierer 5 und Register 7 einen Akkumulator, wobei nach dem
Durchlaufen des Zählers 3 durch alle Zählerstellungen alle
Abtastwerte des Sprachsignals des Zeitabschnitts im Sprachsignalspeicher
1 adressiert worden sind und das Register
7 den Wert der Gesamtenergie des Sprachsignals im Zeitabschnitt
enthält.
Der Ausgang 8 des Registers 7 ist mit dem einen Eingang
eines Schwellwert-Vergleichers 9 verbunden, dessen anderer
Eingang mit einer Quelle 19 zum Liefern eines
festen Schwellwertes verbunden ist. Der feste Schwellwert
der Quelle 19 kann auch von dem Sprachsignal in einer
Sprachpause abgeleitet sein, so daß dieser feste Schwellwert
nur das Rauschen berücksichtigt und z. B. das
1,5fache der gesamten Rauschenergie in einem Zeitabschnitt
darstellt.
Der Ausgang 8 des Registers 7 ist ferner mit dem einen
Eingang eines Multiplizierers 13 verbunden, dessen anderer
Eingang mit einer Quelle 6 zum Liefern eines experimentell
bestimmten konstanten Faktors p verbunden ist.
Dieser Multiplizierer 13 erzeugt an seinem Ausgang 14
nach einem vollständigen Durchlauf des Zählers 3 einen
Wert entsprechend einem Bruchteil von z. B. 62,5% der Gesamtenergie
des Sprachsignals im Zeitabschnitt.
Wenn der Wert der Gesamtenergie am Ausgang 8 des Registers
7 den von der Quelle 19 gelieferten Schwellwert überschreitet,
gibt der Schwellwert-Vergleicher 9 an seinem
Ausgang 10 ein Signal ab, das dem einen Eingang eines
UND-Gatters 15 und einem Umschalter 19 zugeführt wird,
der in eine Stellung entgegengesetzt zur gezeichneten
Stellung umgeschaltet wird und den Dateneingang eines
Vergleichsregisters 11 mit dem Ausgang 14 des Multiplizierers
13 verbindet. Der Umschalter 19 wird zweckmäßig
ebenso wie die anderen Umschalter der Anordnungen nach
Fig. 3 und 4 durch elektronische Mittel realisiert. Ferner
führt der Ausgang 10 des Schwellwert-Vergleichers 9 auf
einen Ausgang c dieser Teilanordnung, der mit einem
entsprechenden Eingang der Teilanordnung in Fig. 4 verbunden
ist, wie dabei erläutert wird.
Am Ende eines vollständigen Umlaufs des Zählers 3 erscheint
am Steuerausgang 4, der vom Übertragsausgang des Zählers 3
abgeleitet sein kann, ein Folgeende-Signal, das dem Einschreib-
Eingang des Vergleichsregisters 11 zugeführt wird
und dort den Wert am Ausgang 14 des Multiplizierers 13
einschreibt. Ferner ist dieser Steuerausgang 4 mit dem anderen
Eingang des UND-Gatters 15 verbunden, so daß nun an
dessen Ausgang 16 ein Signal erscheint. Dieser Ausgang 16
führt sowohl auf einen Ausgang b dieser Teilanordnung, der
auf einen entsprechenden Eingang der Anordnung nach Fig. 4
führt und dort erläutert wird, als auch auf den J-Eingang
eines J-K-Flipflops 17, dessen Takteingang das invertierte
Taktsignal erhält, so daß bei einem Signal auf dem
Steuerausgang 4, das kurz nach Beginn eines Taktsignals Ck
erscheint, eine halbe Taktzeit später das J-K-Flipflop 17
seinen Zustand wechselt und am Ausgang Q ein Signal erzeugt.
Dieses Signal wird über die Leitung 18 dem Löscheingang
des Registers 7 zugeführt, wodurch dieses auf
Null zurückgesetzt wird und damit das Signal am Ausgang
10 des Schwellwert-Vergleichers 9 und dadurch auch das
Signal am Ausgang 16 des UND-Gatters 15 verschwindet und
das außerdem dem Ausgang a dieser Anordnung zugeführt
wird, der mit entsprechenden Eingängen der Anordnungen
nach Fig. 3 und 4 verbunden ist.
Damit ist die Bestimmung des Bruchteils der Energie, der
von einer Summe für die Berücksichtigung bei der Suche des
Minimums nicht überschritten werden darf und der nun im
Vergleichsregister 11 gespeichert ist, beendet.
Die in Fig. 3 dargestellte Teilanordnung führt nun die Suche
nach dem Minimum einer Folge von Summen durch. Darin sind
einige Elemente der Teilanordnung nach Fig. 2 nochmals dargestellt
und mit gleichen Bezugszeichen versehen. Der
Sprachsignalspeicher 1 wird wieder von dem Zähler 3 über
die Leitung 2 adressiert, jedoch nicht direkt, sondern
nun über einen Umschalter 27. Außerdem erhält der Zähler 3
seinen Zähltakt nicht direkt, sondern ebenfalls über einen
Umschalter 21. Dieser Umschalter 21 wird durch ein Startsignal
St auf der Leitung 20, das zu Beginn der Verarbeitung
jedes Zeitabschnitts des Sprachsignals, d. h. alle 10 ms,
erscheint, in die dargestellte Stellung geschaltet. Damit
erhält der Zähler 3 das Taktsignal Ck direkt, wie in Fig. 2
dargestellt wurde. Am Ende des ersten Durchgangs des
Zählers 3, d. h. mit dem ersten Folgeende-Signal am
Steuerausgang 4, wird der Schalter 21 in die entgegengesetzte
Lage umgeschaltet, so daß der Takteingang des
Zählers 3 nunmehr mit dem 22 eines J-K-Flipflops
23 verbunden ist.
Der Takteingang dieses J-K-Flipflops 23 erhält das Taktsignal
Ck, und die J- und K-Eingänge sind gemeinsam mit
dem Eingang a verbunden, der von dem Q-Ausgang des J-K-
Flipflops 17 in Fig. 2 abgeleitet ist und der nach dem
Ende des ersten Durchlaufs des Zählers ein Signal erzeugt,
wie dort beschrieben wurde. Damit wechselt nun das J-K-
Flipflop 23 mit jedem Takt des Taktsignals Ck seinen Zustand
und führt damit den Leitungen 22 und 24 abwechselnd
ein Signal zu.
Der Ausgang 2 des Zählers 3 ist mit dem einen Eingang
eines Addierers 25 verbunden, dessen anderer Eingang über
die Leitung 30 mit dem Ausgang eines Zählers 29 verbunden
ist. Der Ausgang dieses Zählers 29 gibt die Verschiebung
der beiden Sprachsignale über eine Verschiebung der Adressen
bei der Adressierung des Sprachsignalspeichers 1 an
und ist vorher über die Leitung 28 auf einen Anfangswert,
z. B. den Wert k min nach Fig. 1b, eingestellt worden. Der
Addierer 25 erzeugt somit am Ausgang eine Adresse, die um
den Wert der auf der Leitung 30 vorhandenen Verschiebung
gegenüber der Adresse auf der Leitung 2 verschoben ist, und
führt diese verschobene Adresse der einen Seite des Umschalters
27 zu.
Zu Beginn erzeugt der Zähler 3 nach dem vollendeten Durchgang
wieder die Anfangsadresse, so daß im Sprachsignalspeicher
1 die erste Adresse ausgelesen und deren Inhalt
einem Register 31 und einem Subtrahierer 33 zugeführt wird.
Sobald das J-K-Flipflop 23 umschaltet und auf der Leitung
24, die mit dem Umschalter 27 und dem Einschreib-Eingang
des Registers 31 verbunden ist, ein Signal erzeugt, wird
dieser erste Inhalt in das Register 31 eingeschrieben und
gleichzeitig der Umschalter 27 in die entgegengesetzte
Stellung umgeschaltet, so daß nun der Inhalt der verschobenen
Adresse ausgelesen und dem Subtrahierer 33 zugeführt
wird. Dieser Subtrahierer 33 bildet nun die Differenz
zwischen den Inhalten der ersten und der verschobenen
Adreesse, und zwar hier nicht in Zweierkomplement-Darstellung,
sondern nach Betrag und Vorzeichen, wobei nur
die den Betrag angebenden Signale dem einen Eingang eines
Addierers 35 zugeführt werden, wie durch die beiden parallelen
Striche an dieser Verbindung angedeutet ist, während
der Vorzeichenausgang nicht angeschlossen ist.
Der Addierer 35 ist mit seinem Ausgang an ein Register 37
angeschlossen, dessen Ausgang 38 an den anderen Eingang des
Addierers 35 angeschlossen ist. Der Einschreib-Eingang des
Registers 37 ist über die Leitung 22 mit dem des
J-K-Flipflops 23 verbunden, so daß mit dem nächsten Taktsignal
Ck der Ausgangswert des Addierers 35 in das Register
37 eingeschrieben wird, wenn gleichzeitig der Umschalter 27
in die dargestellte Stellung zurückgeschaltet wird und der
Zähler 3 ein Taktsignal erhält, so daß er die zweite
Adresse im Sprachsignalspeicher 1 ansteuert. Da das Register
37 zu Anfang gelöscht war, d. h., den Wert Null enthielt,
wie später erläutert wird, werden somit die vom
Subtrahierer 33 erzeugten Beträge der Differenzen im Register
37 aufsummiert.
Der Ausgang 38 des Registers 37 ist ferner mit dem einen
Eingang eines Vergleichers 41 verbunden, dessen anderer
Eingang mit dem Ausgang des Registers 11 verbunden ist, das
bereits im Zusammenhang mit der Anordnung nach Fig. 2 erläutert
wurde und einen Wert enthält, der einem Bruchteil
der Gesamtenergie des Sprachsignals im Zeitabschnitt entspricht.
Sobald nun der Wert am Ausgang 38 des Registers 37 während
des Aufsummierens der Differenzen den Wert am Ausgang des
Registers 11 überschreitet, erzeugt der Vergleicher 41 ein
Ausgangssignal auf der Leitung 42, das den Zähler 3 auf die
Anfangsstellung zurücksetzt, bevor dieser einen vollständigen
Durchlauf beendet hat. Außerdem erzeugt das Signal auf
der Leitung 42 über das ODER-Glied 43 ein Signal auf der
Leitung 44, die mit dem Takteingang des Verschiebungszählers
29 und dem Löscheingang des Registers 37 verbunden
ist, so daß das Ausgangssignal des Vergleichers 41 dem
Verschiebungszähler 29 einen Zähltakt zuführt, so daß der
Wert auf der Leitung 30 um eine Einheit erhöht wird und
das Register 37 auf den Anfangswert Null zurücksetzt, so
daß mit der neuen Adressenverschiebung erneut eine Aufsummierung
der Differenzen erfolgt.
Erst wenn während der Aufsummierung der Wert am Ausgang 38
des Registers 37 den Wert am Ausgang des Registers 11 nicht
überschreitet, bis der Zähler 3 einen vollständigen Durchlauf
beendet und somit alle Differenzen aufsummiertsind,
erscheint auf dem Steuerausgang 4 ein Folgeende-Signal, das
ebenfalls wie ein Signal auf der Leitung 42 über das ODER-
Gatter 43 und die Leitung 44 den Verschiebungszähler 29 um
einen Schritt weiterschaltet und das Register 37 löscht.
Außerdem erhält nun das Register 11
einen Einschreibtakt, so daß der über den Umschalter 19
zugeführt Wert in das Register 11 eingeschrieben wird.
Dieser Umschalter 19, der vom Ausgangssignal des Schwellwert-
Vergleichers 9 in Fig. 2 gesteuert wird, befindet
sich in der dargestellten Stellung, da das Signal am
Ausgang 10 dieses Schwellwert-Vergleichers durch das
Signal auf der Leitung 18 bzw. am Ausgang a wieder zum
Verschwinden gebracht wird. In das Register 11 wird daher
der Wert am Ausgang 38 des Registers 37, d. h., eine Summe
kleiner als der Bruchteil der Gesamtenergie bzw. später
kleiner als die jeweils vorhergehende Summe, eingeschrieben.
Falls danach wieder eine größere Summe auftritt, erzeugt
der Vergleicher 41 wieder ein Signal auf dem Ausgang 42,
wodurch u. a. der Zähler 3 wieder ohne Vollendung eines
vollständigen Durchlaufs auf den Anfangswert zurückgesetzt
wird, so daß dann kein Signal auf dem Steuerausgang 4 erscheint.
Dadurch enthält das Register 11 schließlich die
kleinste aufgetretene Summe, und das letzte Signal am
Steuerausgang 4 tritt auch zusammen mit dieser kleinsten
Summe, d. h. dem Minimum der Folge von Summen, auf.
Die Leitung 30, die den Wert der Verschiebung der Sprachsignale
bzw. der Adressen gegeneinander angibt, führt auf
den Ausgang k der Teilanordnung in Fig. 3, und der Steuerausgang
4 führt auf den Ausgang s dieser Teilanordnung.
Diese beiden Ausgänge sind mit der Teilanordnung in Fig. 4
verbunden.
Die in Fig. 4 dargestellte Anordnung, in der auch das
J-K-Flipflop 17 aus Fig. 2 nochmals dargestellt ist, dient
zum Bestimmen und zum Steuern des Endes der Suche nach dem
Minimum der Funktion F, d. h. dem Minimum der Folge von
Summen.
Der Eingang k, der den Verschiebungswert führt, ist mit dem
Dateneingang eines Registers 51 verbunden, dessen Einschreib-
Eingang mit dem Eingang s verbunden ist, der das
Folgeende-Signal vom Steuerausgang 4 in Fig. 3 erhält.
Dadurch enthält das Register 51 jeweils entsprechend wie
das Register 11 in Fig. 3 den Wert der Verschiebung, bei
dem die kleinste Summe der Differenzen aufgetreten ist
und somit auch den Wert k p der Verschiebung beim Minimum
der Funktion F in Fig. 1b.
Ferner ist der Eingang k mit dem einen Eingang eines
Maximum-Vergleichers 65 verbunden, dessen anderer Eingang
mit dem Ausgang 64 eines Registers 63 verbunden ist,
der den Wert der maximalen Verschiebung enthält, bis zu
dem nach einem Minimum der Funktion F gesucht werden soll.
Dieser Wert wird über den Umschalter 61, der mit dem
Dateneingang des Registers 63 verbunden ist, auf folgende
Weise eingeschrieben.
Nach einem Startsignal erzeugt während des ersten Durchlaufs
des Zählers 3, bei dem die Gesamtenergie des
Sprachsignals ermittelt wird, der Schwellwert-Vergleicher
9 am Ausgang 10 und damit am Ausgang c ein
Signal, wenn diese Energie einen vorgegebenen Schwellwert
überschreitet, und der Ausgang c ist in Fig. 4
mit dem einen Eingang eines ODER-Gatters 59 verbunden,
das den Umschalter 61 ansteuert und in die Stellung
entgegengesetzt zur gezeichneten Stellung umschaltet.
Damit wird dem Dateneingang des Registers 63 ein Maximalwert
k max der Verschiebung von einer Quelle 55 zugeführt,
die aus einer Anzahl fest mit einer der beiden Signalspannungen
verbundenen Leitungen bestehen kann. Ferner
wird durch das Signal am Ende dieses ersten Durchlaufs
auf dem Steuerausgang 4 in Fig. 2 ein Signal über den
Ausgang b dem gleich bezeichneten Eingang in Fig. 4 zugeführt,
das über das ODER-Gatter 75 dem Einschreib-
Eingang des Registers 63 zuführt. Damit enthält dieses
Register 63 zu Beginn der Suche nach dem Minimum den
Maximalwert k max der Verschiebung, damit bei einem stimmlosen
Teil des Sprachsignals, bei dem kein Minimum der
Folge der Summe auftritt, die Suche nach dem Minimum beendet
werden kann.
Wenn danach eine vollständige Summe der Differenzen kleiner
ist als der vorgegebene Bruchteil der Energie, wird
auf der Steuerleitung 4 in Fig. 3 wieder ein Folgeende-
Signal abgegeben, wie dort beschrieben wurde, und dieses
Signal gibt das UND-Gatter 73 frei, da das Flipflop 71
sich in der rückgesetzten Stellung befindet und somit der
auf der Leitung 72 ein Signal abgibt, so daß das
nächste inverse Taktsignal am Ausgang des UND-Gatters 73
und damit über das ODER-Gatter 75 auch am Einschreib-Eingang
des Registers 63 ein Signal erzeugt. Ferner ist der den
Verschiebungswert führende Eingang k mit dem einen Eingang
eines Addierers 53 verbunden, dessen anderer Eingang einen
festen Bereichswert δ k erhält, beispielsweise durch entsprechende
feste Verdrahtung mit Signalspannungen. Der Ausgang
des Addierers 53 liefert den Wert k a +δ k und führt
außer auf den einen Eingang des Umschaltes 61 auch auf
den einen Eingang des Vergleichers 57, dessen anderer Eingang
mit dem maximalen Verschiebungswert k max der Quelle 55
verbunden ist. Nur wenn der Wert am Ausgang des Addierers
53 größer ist als der von der Quelle 55 gelieferte Wert,
erzeugt der Vergleicher 57 ein Ausgangssignal, das über
das ODER-Gatter 59 den Umschalter 61 in die entgegengesetzte
Stellung umschaltet, so daß in das Register 63 nochmals
der Maximalwert k max der Verschiebung eingeschrieben
wird. In den meisten Fällen wird jedoch der Wert k a +δ k
am Ausgang des Addierers 53 kleiner sein als der Maximalwert,
so daß dieser über den nicht umgeschalteten Umschalter
61 in das Register 63 eingeschrieben wird.
Wie bei der Fig. 2 erläutert, wird das J-K-Flipflop 17
erst eine halbe Taktzeit nach dem Auftreten des ersten
Signals am Steuerausgang 4 umgeschaltet, so daß erst dann
ein Signal am Ausgang a erscheint. Dieser Ausgang a
ist über den gleich bezeichneten Eingang mit dem D-Eingang
eines D-Flipflops 77 verbunden, das sich zunächst im
Ruhezustand befindet, wobei der Q-Ausgang auf der Leitung
78 ein Signal erzeugt, das das Register 51 gelöscht und
die bistabile Kippstufe 71 zurückgesetzt hält. Erst mit
dem nächsten inversen Taktsignal wenn das Signal am
Steuerausgang 4 in Fig. 2 bzw. Fig. 3 und somit auch das
Signal am Eingang s in Fig. 4 verschwunden ist, wird das
D-Flipflop 77 umgeschaltet, so daß das Signal auf der
Leitung 78 verschwindet: Beim nächsten Signal am Eingang
s, mit dem das Register 63 zum zweiten Mal eingeschrieben
wird, wird das D-Flipflop 71 über den D-Eingang vorbereitet
und mit dem nächsten Taktsignal Ck umgeschaltet, so
daß nun das Signal am -Ausgang verschwindet und das
UND-Gatter 73 gesperrt wird, so daß das Register 63
nicht wieder eingeschrieben wird, bis ein neues Startsignal
für einen neuen Zeitabschnitt des Sprachsignals
erscheint.
Wenn nun der Verschiebungswert am Eingang k größer wird
als der Wert am Ausgang 64 des Registers 63, d. h., wenn
das Ende des Bereichs, in dem ein Minimum gesucht wird,
oder der Maximalwert der Verschiebung erreicht ist, erzeugt
der Vergleicher 65 auf der Ausgangsleitung 66 ein
Signal, das den Einschreib-Eingang eines Speichers 69
ansteuert, dessen Dateneingang mit dem Ausgang 52 des
Registers 51 verbunden ist, das in diesem Augenblick den
Wert der Verschiebung beim Minimum der Funktion F enthält.
Dadurch werden im Speicher 69 die Periodendauern
aufeinanderfolgender Sprachabschnitte gespeichert.
Ferner ist die Leitung 66 mit dem K-Eingang des J-K-
Flipflops 17 verbunden, das am Takteingang das inverse
Taktsignal erhält, so daß eine halbe Taktzeit nach dem
Erreichen des Endpunktes der Suche nach dem Minimum das
J-K-Flipflop 17 umschaltet, wodurch das Signal am Q-Ausgang
18 und damit aus Ausgang a verschwindet. Dadurch verschwindet
auch das Signal an den J- und K-Eingängen des
Flipflops 23 in Fig. 3, so daß dieses in der Stellung
stehenbleibt, in der am auf der Leitung 22
ein Signal erzeugt wird, und keine weiteren Signalwechsel
mehr erscheinen bis zur Verarbeitung des nächsten Zeitabschnitts
des Sprachsignals. Damit ist die Bestimmung
der Periodendauer der Stimmbandgrundfrequenz in einem
Zeitabschnitt eines Sprachsignals beendet. Die im Speicher
69 schließlich enthaltene Folge von Periodendauern des
Sprachsignals kann anschließend noch weiterverarbeitet
werden, beispielsweise können einzelne Ausreißer bei den
Werten, die durch Periodenverdoppelung bzw. -vervielfachung
entstehen können, beseitigt und die durch stimmlose
Sprachabschnitte erzeugten Pausen ausgefüllt werden.
Der minimale Wert der Verschiebung, bei dem die Suche nach
dem Minimum beginnt und der jeweils in den Zähler 29 in
Fig. 3 eingeschrieben wird, muß nicht beim Minimalwert
k min beginnen, sondern er kann auch von der Periodendauer
des Sprachsignals im vorhergehenden Abschnitt abgeleitet
werden, z. B. durch Verminderung um einen festen Wert,
sofern dabei nicht der Minimalwert k min unterschritten
wird. Hierfür muß dann der in den Speicher 69 eingeschriebene
Wert in einem Register zwischengespeichert werden,
an das eine Anordnung ähnlich der Anordnung zur Bestimmung
der maximalen Verschiebung in Fig. 4 aus den Elementen 53,
55, 57 und 61 angeschlossen wird. Falls das Verfahren
zur Stimmbandgrundfrequenz für die Sprecherverifikation
verwendet werden soll, wo die aus einem Sprachsignal gewonnenen
Daten mit den Referenzdaten des angegebenen Spechers
verglichen werden, kann bei diesen Referenzdaten die
untere Grenze für die Periode der Stimmbandgrundfrequenz
mitgespeichert sein. Dabei ergibt sich eine weitere merkliche
Einsparung an Rechenzeit.
In der beschriebenen Anordnung können die angegebenen
Elemente, wie Speicher, Register und Rechenelemente in
verschiedener bekannter Weise aufgebaut sein. Dabei
können beispielsweise die beiden Speicher zu einem einzigen
Speicher entsprechender Größe zusammengefaßt
werden, und auch die Rechenelemente können durch Mehrfach-
Ausnutzung zusammengefaßt werden. Insbesondere können
diese Elemente, wie auch die Register und Vergleicher, alle
oder zumindest zum Teil durch einen festprogrammierten
Mikroprozessor ersetzt werden.
Claims (7)
1. Verfahren zum Bestimmen der Stimmbandgrundfrequenz eines
Sprachsignals, bei dem ein Zeitabschnitt (T) des Sprachsignals
(s(t)) gegenüber dem Sprachsignal verschoben und für
unterschiedliche Verschiebungen (k) die Beträge der
Differenzen zwischen dem Sprachsignal und dem verschobenen
Sprachsignal über den Zeitabschnitt aufsummiert werden,
wobei die Verschiebung (k p ), bei der die Folge der so gebildeten
Summen ein Minimum hat, bestimmt wird und diese
Verschiebung die Periodendauer der Stimmbandgrundfrequenz
angibt,
dadurch gekennzeichnet, daß zunächst durch Aufsummieren der
Beträge des Sprachsignals (s(t)) im Zeitabschnitt (T) die
Energie (E) des Sprachsignals im Zeitabschnitt bestimmt
wird, daß die Aufsummierung der Differenzen, bei einem
vorgegebenen minimalen Wert (k min ) der Verschiebung beginnend,
für jeden Wert (k) der Verschiebung abgebrochen und die Verschiebung
um einen Schritt vergrößert wird, sobald während
der Aufsummierung ein vorgegebener Bruchteil der Energie (pE)
überschritten wird, daß nach der ersten Summe kleiner als der
Bruchteil der Energie jede folgende Summe mit der kleinsten
vorhergehenden Summe verglichen und der Wert der Verschiebung
zwischengespeichert wird, wenn eine Summe kleiner ist als die
Vergleichssumme, und daß die Vergrößerung der Verschiebung
mit folgender Aufsummierung der Differenzbeträge beendet wird,
wenn die Verschiebung einen vorgegebenen maximalen Wert (k max )
erreicht hat, wobei der zuletzt zwischengespeicherte Wert (k p )
der Verschiebung die Periodendauer der Stimmbandgrundfrequenz
für den Zeitabschnitt angibt.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß der vorgegebene maximale Wert
die um einen festen Bereichswert (δ k ) vergrößerte Verschiebung
(k a ) ist, bei der erstmalig die Summe der
Differenzbeträge kleiner als der vorgegebene Bruchteil
der Energie (pE) ist, wenn diese vergrößerte Verschiebung
(k a +δ k ) kleiner ist als ein vorgegebener Maximalwert der
Verschiebung (k max ), und daß der vorgegebene maximale Wert
der Maximalwert der Verschiebung (k max ) ist, wenn dieser
kleiner ist als die vergrößerte Verschiebung (k a +δ k ) oder
wenn keine Summe kleiner als der vorgegebene Bruchteil der
Energie bis zum Erreichen des Maximalwertes der Verschiebung
auftritt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,
daß die Energie (E) mit einem vorgegebenen Schwellwert verglichen
und die nachfolgende Aufsummierung nur dann freigegeben
wird, wenn der Schwellwert überschritten wird.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1,
mit einem Sprachsignalspeicher, der die zeitdiskreten Werte
eines Sprachsignals von einer Länge mindestens gleich der
Summe der Länge eines Zeitabschnitts und dem Maximalwert
der Verschiebung enthält, mit einer Adressieranordnung,
die an den Adresseneingang des Sprachsignalspeichers
angeschlossen ist und Folgen von aufeinanderfolgenden
Adressenpaaren aus jeweils einer Adresse eines Wertes des
Sprachsignals im Zeitabschnitt und einer um einen bestimmten,
nach jeder Folge um eine Einheit vergrößerten
Adressenabstand verschobenen Adresse liefert, mit einer
Recheneinheit, die an dem Datenausgang des Sprachsignalspeichers
angeschlossen ist und Differenzbeträge zwischen an
den Adressen jeweils eines Adressenpaares gespeicherten
Werten über die Folge der Adressenpaare aufsummiert, dadurch
gekennzeichnet, daß zu Beginn der Verarbeitung
eines Zeitabschnitts eine Steueranordnung (21) die
Adressieranordnung (3, 23, 25, 27, 29) ansteuert, um eine
erste Folge nur von Adressen der Werte des Sprachsignals
in dem Zeitabschnitt zu erzeugen, daß an den Datenausgang
des Sprachsignalspeichers(1) ein Akkumulator (5, 7) angeschlossen
ist, daß mit dem Ausgang (8) des Akkumulators
der eine Eingang eines Multiplizierers (13) verbunden ist,
der am anderen Eingang einen festen Wert empfängt, daß die
Adressieranordnung nach der Erzeugung der ersen Adressenfolge
den Ausgangswert des Multiplizierers in ein Vergleichsregister
(11) einschreibt und die Steueranordnung
(21) zur Erzeugung von Folgen von Adressenpaaren umschaltet,
daß der Ausgang des Vergleichsregisters mit dem einen
Eingang eines Minimum-Vergleichers (41) verbunden ist,
dessen anderer Eingang mit dem Ausgang der Recheneinheit
(31, 33, 35, 37) verbunden ist und der am Ausgang (42)
ein Signal erzeugt, wenn der Wert am Ausgang der Recheneinheit
größer ist als der Wert am Ausgang des Vergleichsregisters,
daß die Adressieranordnung an einem Steuerausgang
(4) ein Folgeende-Signal nach jeder beendeten
Folge von Adressen bzw. Adressenpaaren erzeugt, daß der
Steuerausgang der Adressieranordnung mit dem Einschreib-
Eingang des Vergleichsregisters, dessen Datenausgang
nach dem Erzeugen der ersten Adressenfolge auf den
Ausgang der Recheneinheit umgeschaltet ist, und dem Einschreib-
Eingang eines Periodendauer-Registers (51) verbunden
ist, dessen Dateneingang an einen den momentanen
Wert der Verschiebung liefernden Verschiebungsausgang
(30) der Adressieranordnung angeschlossen ist, daß der
Steuereingang der Adressieranordnung und der Ausgang des
Minimum-Vergleichers gemeinsam mit einem Rückstelleingang
der Recheneinheit und einem Erhöhungseingang der Adressieranordnung
zum Erhöhen der Verschiebung der Adressen gekoppelt
sind, und daß ein Maximum-Vergleicher (65) vorgesehen
ist, dessen einer Eingang mit dem Verschiebungsausgang
verbunden ist und dessen anderer Eingang einen
vorgegebenen maximalen Wert erhält und dessen Ausgang (66)
mit einem Sperreingang der Adressieranordnung verbunden
ist und ein Signal liefert, wenn der Wert am Verschiebungsausgang
größer ist als der maximale Wert, wobei
dieses Signal die Erzeugung weiterer Folgen von Adressenpaaren
bis zur Verarbeitung des nächsten Zeitabschnittes
sperrt und den im Periodendauer-Register enthaltenen
Wert der Periodendauer ausgibt.
5. Anordnung nach Anspruch 4, dadurch gekennzeichnet, daß
der andere Eingang (64) des Maximum-Vergleichers (65) mit
einer Quelle (55) zum Liefern eines Maximalwertes der
Verschiebung der Adressen gekoppelt ist und daß das
Folgeende-Signal am Steuerausgang (4) der Adressieranordnung
(3, 23, 25, 27, 29) nach Erzeugung einer Folge von
Adressenpaaren diesen anderen Eingang des Maximum-Vergleichers
mit einer Addieranordnung (57), die die Summe
des Wertes am Verschiebungsausgang (30) und einem fest
vorgegebenen Bereichswert bildet, koppelt, wenn diese
Summe kleiner ist als der Maximalwert.
6. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß
dem anderen Eingang (64) des Maximum-Vergleichers (65)
ein Maximum-Register (63) vorgeschaltet ist.
7. Anordnung nach Anspruch 4 oder einem der folgenden, dadurch
gekennzeichnet, daß ein Schwellwert-Vergleicher (9)
vorgesehen ist, dessen einer Eingang mit dem Ausgang (8)
des Akkumulators (5, 7) verbunden ist und dessen anderer
Eingang einen festen Schwellwert erhält und der am Ausgang
(10) ein Signal erzeugt, wenn der Wert am Ausgang des
Akkumulators den festen Schwellwert überschreitet, wobei
dieser Ausgang des Schwellwert-Vergleichers mit dem Sperreingang
der Adressieranordnung (3, 23, 25, 27, 29) gekoppelt
ist und das Ausgangssignal die Erzeugung von Folgen
von Adressenpaaren freigibt.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19792939330 DE2939330A1 (de) | 1979-09-28 | 1979-09-28 | Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19792939330 DE2939330A1 (de) | 1979-09-28 | 1979-09-28 | Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2939330A1 DE2939330A1 (de) | 1981-04-16 |
DE2939330C2 true DE2939330C2 (de) | 1987-10-22 |
Family
ID=6082114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19792939330 Granted DE2939330A1 (de) | 1979-09-28 | 1979-09-28 | Verfahren und anordnung zum bestimmen der stimmbandgrundfrequenz eines sprachsignals |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE2939330A1 (de) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3732096A1 (de) * | 1987-09-24 | 1989-04-13 | Enno Leopold | Algorithmus zum schaetzen der stimmbandgrundfrequenz von digitalisierten sprachsignalen mit kriterium fuer die stimmhaft-stimmlos-entscheidung |
-
1979
- 1979-09-28 DE DE19792939330 patent/DE2939330A1/de active Granted
Also Published As
Publication number | Publication date |
---|---|
DE2939330A1 (de) | 1981-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2536585C3 (de) | Anordnung zur statistischen Signalanalyse | |
DE2702624C2 (de) | Verfahren und Vorrichtung zur Erzeugung einer naturgetreuen Digitaldarstellung von Amplitudenänderungen eines Analogsignales | |
DE3306306A1 (de) | Arithmetische verarbeitungsvorrichtung | |
DE2133638C3 (de) | Verfahren zum Betrieb eines lernfähigen Systems aus in Kaskade geschalteten, zur nicht linearen Datenverarbeitung geeigneten lernfähigen Datenverarbeitungseinheiten | |
DE2504675A1 (de) | Analog/digitalwandlergeraet | |
DE1947792A1 (de) | Vier-Quadranten-Impulsbreiten-Multiplikator | |
DE2432594B2 (de) | Rekursives Digitalfilter | |
DE2355640A1 (de) | Anordnung zur spektralanalyse von elektrischen signalen | |
DE2730662A1 (de) | Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors | |
DE2634426A1 (de) | Bandkompressionseinrichtung | |
EP0036074B1 (de) | Syntheseschaltung für periodische Signale, insbesondere als Teil eines Musikinstruments | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE2920041C2 (de) | Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens | |
DE2939330C2 (de) | ||
DE4002270C2 (de) | ||
DE2019603A1 (de) | Digital-analoge Recheneinrichtung | |
EP0272723B1 (de) | Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens | |
DE3633461A1 (de) | Taktsignalgebervorrichtung | |
DE3037276C2 (de) | Tonsynthesizer | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE3215868A1 (de) | Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette | |
DE3335026C2 (de) | ||
DE3046772C2 (de) | Taktgenerator | |
DE3342739C2 (de) | A/D- und D/A-Wandlung | |
DE2712831C3 (de) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10L 9/00 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |