DE1472004C3 - Verfahren und Anordnung zur Aufbereitung von gespeicherten Sprachsignalen - Google Patents

Verfahren und Anordnung zur Aufbereitung von gespeicherten Sprachsignalen

Info

Publication number
DE1472004C3
DE1472004C3 DE1472004A DE1472004A DE1472004C3 DE 1472004 C3 DE1472004 C3 DE 1472004C3 DE 1472004 A DE1472004 A DE 1472004A DE 1472004 A DE1472004 A DE 1472004A DE 1472004 C3 DE1472004 C3 DE 1472004C3
Authority
DE
Germany
Prior art keywords
signal
peak
period
speech
gate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE1472004A
Other languages
English (en)
Other versions
DE1472004B2 (de
DE1472004A1 (de
Inventor
Walter Kennedy Montrose French Ii
Oliver Woodrow Poughkeepsie Johnson Jun.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1472004A1 publication Critical patent/DE1472004A1/de
Publication of DE1472004B2 publication Critical patent/DE1472004B2/de
Application granted granted Critical
Publication of DE1472004C3 publication Critical patent/DE1472004C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Analogue/Digital Conversion (AREA)

Description

Die Erfindung betrifft ein Verfahren und Anordnungen zur Durchführung des Verfahrens für die Aufbereitung von gespeicherten Sprachsignalen, die für die maschinelle Sprachausgabe beliebig aneinandergereiht werden sollen, insbesondere solcher Sprachsignale, die zu verschiedenen Zeiten und/oder von verschiedenen Sprechern gewonnen worden sind. Es sind Sprachausgaben bekannt, welche gespeicherte Sprachinformationen zur Wiedergabe an bestimmten Zeitpunkten oder auf einen Befehl hin bewirken, z. B. bei Reklameansagegeräten. Das Sprachsignal ist dabei auf Magnetbändern oder anderen Speichermitteln aufgezeichnet. Wenn die gespeicherte Information kurz und zusammenhängend ist, so daß sie wiedergegeben werden kann wie sie aufgezeichnet wurde, so hat der Hörer den Eindruck, den Sprecher unmittelbar zu hören.
Normalerweise wird jedoch die gespeicherte Information aus Aufzeichnungen zusammengesetzt, die zu verschiedenen Zeiten oder von verschiedenen Sprechern gemacht wurden und die zudem aus Teilen in der Zeitfolge unzusammenhängender Sprachsignale zu einem einzigen zusammenhängenden Signal verbunden werden. Ein derart aus nicht zusammenhängend gesprochenen Silben oder Teilen bestehendes Sprachsignal erweist sich als schlecht klingend und schwer verständlich, da sich zwischen den einzelnen Sprachsignal-Teilen die Tonhöhe ändert und Un-Stetigkeiten in den Übergängen vorhanden sind.
Es wurde nun gefunden, daß ein solches zusammengesetztes Speichersignal wohlklingender gemacht werden kann, indem der Grundton jedes Signalteiles
3 4
auf einen Standardwert gebracht wird und indem die Sprachsignale, die zu verschiedenen Zeiten und/oder Kurvenform so beeinflußt wird, daß zwischen den von verschiedenen Sprechern gewonnen worden sind, einzelnen Signalteilen ein stetiger Übergang statt- dadurch, daß von einem gegebenen Sprachsignal befindet, grenzter Dauer aufeinanderfolgende Grundton-Auf dem Gebiet der Spracherkennung, bei dem be- 5 perioden und deren Zeitdauer bestimmt werden, daß stimmten Worten eine bestimmte Bedeutung zugeord- diese Grundtonperioden alle wenigstens auf die net oder bei dem durch ein bestimmtes Wort eine Dauer der kürzesten Grundperiode beschnitten wer-Maschinenfunktion ausgelöst werden soll, ist die so- den und daß jeder verkürzten Grundtonperiode eine genannte Normalisierung bekannt (z.B. USA.-Patent allmählich ansteigende oder abfallende Übergangs-2 575 910). Diese Normalisierung hat jedoch den io funktion derart überlagert wird, daß zwischen auf-Zweck, den Vergleich zwischen einem gespeicherten einanderfolgenden verkürzten Grundtonperioden Normal und dem eingegebenen Sprachlaut zu erleich- keine Amplitudensprünge auftreten. Es kann für tern. Eine solche Normalisierung ist für die Erfin- manche Zwecke vorteilhaft sein, die Grundtondung, bei der es um die akustische Qualität der perioden nicht auf einen einzigen, sondern, abhängig Sprachwiedergabe aus Speicherwerten geht, ohne Be- 15 von der Vokalart, auf unterschiedliche Werte zu verdeutung. kürzen. Da die Aufbereitung eines Sprachsignals in Der Grundton eines Sprachlautes wird durch das mehreren Schritten erfolgen muß, ist es vorteilhaft, Verhalten der Stimmbänder festgelegt, welche wegen das Signal zunächst einem zyklisch entnehmbaren ihres anatomischen Baues genauer als Stimmfalten Speicher zuzuführen. Zunächst werden Einrichtungen zu bezeichnen wären. Bei jeder Stimmäußerung be- 20 wirksam, welche das aufzubereitende Stück des wegen sich die Stimmfalten gegeneinander und dann Sprachsignals definieren. Die Grundtonperiode wird voneinander, so daß sich die öffnung zwischen ihnen innerhalb dieses Stückes des Sprachsignals durch ändert. Diese öffnung wird als Stimmritze bezeichnet. größte lokale Spitze-Spitze-Werte definiert, welche Um einen konstanten Grundton zu erzeugen, bewegen durch nacheinander vorgenommene Vergleiche aller sich die Stimmfalten in regelmäßiger Folge gegen- 25 auftretenden Spitze-Spitze-Werte gewonnen werden, und voneinander. Während eines Teils dieses Bewe- Nach Verkürzung der so gewonnenen Grundtongungszyklus ist die Stimmritze vollständig geschlos- periode auf einen gewählten Normalwert, werden die sen, und der Luftnachschub aus der Lunge verursacht nunmehr nicht mehr in ihrer Amplitude übereineinen Druckanstieg, der dann ein Maximum erreicht. stimmenden Enden und Anfänge benachbarter Pe-Wenn sich die Stimmritze öffnet, erfolgt ein schlag- 30 rioden aneinander angeglichen,
artiger Luftaustritt, der den Druck erniedrigt. Die Das nachfolgend beschriebene Ausführungsbeispiel Zeit zwischen diesen Luftaustritten bestimmt die wird durch Zeichnungen erläutert.
Grundtonfrequenz. Fig. 1 und 2 sind Kurvenformen von Sprachin Wirklichkeit ist ein akustisches Netzwerk zwi- Signalen;
sehen der Stimmritze und dem Luftstrom vorgesehen. 35 F i g. 3 A, 3 B und 3 C (zusammengesetzt nach Dieses Netzwerk modifiziert die Art des Luftflusses, F i g. 3) ergeben das Blockschaltbild einer Ausfühindem es höhere Frequenzen überlagert; es ändert rungsform des erfindungsgemäßen Verfahrens zur jedoch nicht den Grundton. Der den stimmhaften Tonhöhensteuerung.
Laut hervorrufende Energiefluß erfolgt also in In Fig. 1 ist als Spannungswert über der Zeit-
Stößen, und bei einem Dehnungsvorgang, bei dem 40 achse ein Sprachsignal aufgezeichnet. Das Signal be- -die Wiedergabegeschwindigkeit geändert wurde, ver- streicht den Bereich von 0 bis 64 V; die Null-Linie ändert sich unvermeidlich der zeitliche Abstand zwi- wurde auf 32 V gelegt.
sehen diesen Stoßen. Der Grundton ändert sich also Unter Berücksichtigung des eingangs Gesagten
proportional der Geschwindigkeitsänderung. geht aus F i g. 1 hervor, daß die vertikalen (strich-
Es ist für eine periodische Welle, auch wenn sie 45 punktierten) Linien a, b, c, d die Grundton-Periode noch so komplex ist, charakteristisch, daß nach einer abgrenzen. Die Kurvenform zwischen jeweils zweien gewissen Zeit der Periodendauer ihre Form eine dieser Linien ist beinahe gleich, ebenso die Länge Wiederholung des Vorhergehenden darstellt. Im der so begrenzten Abschnitte. Da die Länge der Falle einer genau periodischen Welle ist die Wieder- Grundton-Periode den Grundton darstellt, ist der holung genau. Im Falle einer annähernd periodischen 5° Grundton der gesamten Kurvenform gleichförmig. Welle (Silbengeschwindigkeiten der Sprache sind im Außerdem ist der Übergang der Kurve von einer Vergleich mit den hier interessierenden Sprachfre- Grundton-Periode zur anderen weich und gleichquenzen so gering, daß jeder stimmhafte Sprachlaut förmig.
wenigstens annähernd periodisch ist) ist die Wieder- In F i g. 2 ist der Fall dargestellt, daß zwei »künst-
holung ungenau und annähernd, jedoch immer leicht 55 liehe« Kurvenformen von Lauten aufeinanderfolgen, erkennbar. Wenn nachfolgend von der Periodizität Zwei Tatsachen fallen dabei auf:
der Sprache gesprochen wird, so soll damit die tat- L Die Grundton-Periode e-f ist kürzer als die
sachliche Penodizitat gemeint sein; die Sprache be- periode h es fol t also auf e5nen höheren
steht also so verstanden aus annähernd periodischen Grundton ein niedrigerer und
Teilen und aus nicht periodischen Teilen, wobei die 60 2 die A litude der Kurve bei f ist eine andere letzteren von der Anordnung so behandet werden, als als die bei es ergibt sich eine Unstetigkeit,
waren sie ebenso »periodisch«. wenn die bdden Kurvenformen verbunden
Die brnndung will diese eingangs genannten Nach- werden
teile beseitigen. Sie erreicht dies mit einem Verfahren
zur Aufbereitung gespeicherter, eine größere Anzahl 65 Diese beiden unerwünschten Sachverhalte werden' Grundtonperioden- umfassender Sprachsignale, die durch das erfindungsgemäße Verfahren beseitigt. Der für die maschinelle Sprachausgabe beliebig anein- Grundton der gesamten Sprach-Kurvenform wird andergereiht werden sollen, insbesondere solcher gleichartig gemacht, indem jede Grundton-Periode
5 6
auf eine gewünschte Größe gebracht wird. Zunächst usw. Es ist für den Fachmann einleuchtend, daß wird das vorliegende Eingangssignal gespeichert und diese Funktionen von einer Vielzahl bekannter Schal-Anfang und Ende seiner Grundton-Periode fest- tungen ausgeführt werden können. Im Interesse der gestellt. Wenn diese größer ist als die gewünschte, Einfachheit wurde ein Rechner 3 in die Anordnung dann wird ein der Differenz entsprechender Betrag 5 eingefügt; er bildet das Mittel zur Durchführung von am Ende der wirklichen Grundton-Periode entfernt. bekannten rechnerischen und Steuer-Operationen.
Die Grundton-Perioden der Eingangs-Kurvenform, Jeder für allgemeine Zwecke verwendbare Rechner die jetzt den gewünschten Wert haben, werden dann mit Speicher- und Rechen-Einheiten unter Programmvereinigt. Die Amplituden-Differenz zwischen dem steuerung genügt für diesen Zweck. Ende der Kurvenform einer Grundton-Periode und io Der Block 2 in F i g. 3 A dient als Quelle für die dem Anfang der folgenden wird bestimmt; dann wird Sprachsignale. Der zweipolige Schalter 4 ist normalereine Gleichstromübergangsfunktion gebildet, welche weise offen. Beim Schließen dieses Schalters wird von bei Zufügung zur ersten Kurvenform, deren Ende dem monostabilen Multivibrator 6 ein Synchronisierdem Anfang der folgenden Kurvenform angleicht, so Signal erzeugt und zusammen mit dem Sprach-Signal daß ein verhältnismäßig weicher Übergang entsteht. 15 aus der Quelle 2 in den Umlaufspeicher 8 eingege-Zunächst muß also von dem System der Anfang ben. Das Synchronisier-Signal und das Sprach-Signal der Grundton-Periode des betrachteten Sprachsignals werden in getrennten Spuren gespeichert. Nach einer festgestellt werden. Kennzeichnend für den Beginn vorbestimmten Zeit wird der Schalter 4 wieder geeiner Grundton-Periode ist es, daß das Sprachsignal öffnet und das Sprach-Signal mit dem vorauslaufenan dem betreffenden Punkt den höchsten Betrag zwi- 20 den Synchronisier-Signal auf getrennter Spur beginnt sehen positiver und negativer Spitze gemessen auf- im Speicher 8 umzulaufen. Dieses umlaufende weist. Beim vorliegenden System wird das Sprach- Sprach-Signal wird für mehrere Zwecke benutzt. Zusignal in einen Speicher aufgenommen und derart ab- nächst wird das Sprach-Signal aus dem Speicher 8 getastet, daß die Analogwerte von Spitze zu Spitze einer Schaltung zugeführt, die eine Zeitdauer festgemessen gespeichert wurden können. Jeder Spitze- 25 legt, während welcher das Sprach-Signal nach dem Spitze-Wert wird mit dem folgenden verglichen und Anfang einer Grundton-Periode abgetastet wird; der größere von beiden wird zu Vergleichszwecken diese ist, wie schon gesagt, dargestellt durch den mit später folgenden Spitze-Spitze-Werten festgehal- größten Spitze-Spitze-Wert innerhalb dei Abtastten, bis nach einer bestmimten Dauer der Kurven- Periode.
form der höchste festgestellte Wert gespeichert und 3° Die Abtastdauer für das Sprach-Signal nach einem der Punkt, an dem dieser maximale Spitze-Spitze- höchsten Spitze-Spitze-Wert wird als Stimmritzen-Wert auftrat, wird durch einen Zählerwert fest- Periode bezeichnet; diese Periode muß lang genug gehalten. dauern, um das Auftreten eines Grundton-Perioden-
Der größte Spitze-Spitze-Wert stellt den Anfang Anfangs sicherzustellen; sie darf aber nicht so lang jeder Grundtonschwingung des Sprachsignals dar. 35 sein, daß zwei Grundton-Perioden-Anfänge enthalten Jede echte Grundton-Periode des Sprachsignals wird sind. Zur Bestimmung der Zeitdauer durchläuft das dann in ein Register eingegeben und seine Länge mit Sprach-Signal den Umlaufspeicher 8 einmal und wird dem gewünschten Wert der Grundton-Periode ver- dann als Eingangs-Signal einem Hochpaßfilter 10 glichen; dabei wird der Betrag bestimmt, der von der (Fig. 3B) zur Beseitigung der Anteile niedriger Freechten Grundton-Periode abzuziehen, ist. Die echten 40 quenz zugeführt. Die Hochfrequenz-Anteile des Si-Kurvenformen werden dann verkürzt, indem man sie gnals gelangen zum Gleichrichter 12, dessen Ausdurch Torschaltungen leitet, die beim Beginn der gangs-Signal die Umhüllende der Hochfrequenz-Anechten Grundton-Periode öffnen und schließen, wenn teile darstellt. Es schließt sich ein Tiefpaß 14, der die die gewünschte Grundton-Periode vergangen ist. Das Komponenten höherer Frequenz beseitigt und nur die Ende jeder echten Grundton-Periode der Kurven- 45 Einhüllende zurückläßt. Diese Einhüllende ist im form endet dann plötzlich bei irgendeinem zufälligen allgemeinen einem Dreieck ähnlich; sie steigt erst an Amplitudenwert. Die verkürzten Grundton-Perioden und fällt danach ab. Die Grundperiode wird bestimmt könnten dann zur Bildung einer fortlaufenden Kur- durch die Null-Durchgänge der Kurvenform in posivenform vereinigt werden; die End-Amplituden einer tiver Richtung. Das Ausgangs-Signal des Tiefpasses beschnittenen Grundton-Periode und der Anfang der 50 14 wird also einer Einrichtung 16 zur Feststellung nächsten beschnittenen Grundton-Periode haben je- von Null-Durchgängen zugeführt, welche nur ein doch nicht notwendigerweise die gleiche Amplitude, Signal abgibt, wenn die Umhüllende in positiver Richvielmehr wird gewöhnlich ein in F i g. 2 bei / und g tung die Null-Achse überschreitet. Der daran angesichtbarer Zustand eintreten. Um die Kurvenform schlossene Zähler 18 zählt beim Auftreten des ersten stetig und glatt werden zu lassen, werden erfindungs- 55 derartigen Null-Durchganges und stoppt beim Aufgemäß die Amplituden-Differenzen zwischen dem treten des folgenden.
Anfang und dem Ende benachbarter, beschnittener Eine Grundton-Periode ist also im Zähler 18 dar-
Grundton-Perioden bestimmt und ein »Übergangs«- gestellt durch einen von Null aufsteigenden Zählwert, Signal am Ende einer beschnittenen Grundton- der mit Tg bezeichnet werden soll. Diese Periode Periode addiert oder subtrahiert, um die Amplitude 60 stellt etwa die Grundton-Periode dar. Ein weiterer, durch Erhöhung oder Verminderung an die Anfangs- während des ersten Umlaufs des Sprach-Signals im Amplitude der folgenden, berichtigten Grundton- Speicher 8 stattfindender Vorgang ist die Weitergabe Periode anzugleichen. des Synchronisier-Signals aus dem Speicher zu dem
Ein Ausführungsbeispiel zur Durchführung der ge- Synchronisier-Signal-Erkenner 20 und weiter zum nannten Operationen wird durch die kombinierten 65 Zähler 22. Letzterer ist ebenfalls mit einem dauernd Fig. 3A, 3B und 3C dargestellt. Zur Erklärung der schwingenden Oszillator 24 verbunden, welcher den Arbeitsweise sind gewisse Funktionen erforderlich, Zähler zu dauerndem Arbeiten anregt. Das Synchroz. B. Signalvergleich, Signalspeicherung, Taktgebung nisier-Signal aus dem Erkenner 20 stellt den Zähler
Werte. Schließlich ist das Signal Q noch einer Schaltung 54 zum Erkennen abfallender Signale zugeführt (dies ist z. B. ein Differenziator in Serie mit einer Diode), welche das Ende des Signals Q durch ein Ausgangs-Signal anzeigt.
Da die Torschaltung 44 durchlässig ist, gelangt das Sprach-Signal aus dem Speicher 8 zu den Analog-Toren 56, 58, 60 und 62 und zu den Detektoren 64 und 66 zur Feststellung positiver bzw. negativer
Spitzen-Wert des Sprach-Signals; der Detektor 66 arbeitet entsprechend, er liefert das Signal —p. Die Verwendung dieser Signale wird später erläutert.
Der Ausgang des Umlaufspeichers 8, d. h. das Sprach-Signalstück, wird über die Torschaltung 44 zu den Analog-Toren 56, 58, 60 und 62 geleitet. Wie schon erläutert, dienen die Tore 56 und 58 dazu, ein Paar positiver und negativer Kurvenformspitzenwerte
22 auf Null, so daß dieser unmittelbar nach dem Auftreten eines Synchronisier-Signals bei einem Zyklus des Speichers 8 von Null an zu zählen beginnt. Einige Zeit nach dem Auftreten des Synchronisier-Signals erscheint das Sprach-Signal. Die vorliegende Erfindung bezieht sich auf die Grundton-Anpassung; der Grundton ist ein Charakteristikum stimmhafter Laute und nicht so sehr von Reibelauten. Der Ausgang des Speichers 8 ist deshalb weiterhin mit einem
Stimmhaft-Anzeiger 26 verbunden, der ein Ausgangs- io Spitzen-Werte. Der Detektor 64 erzeugt ein weiterhin Signal liefert, wenn ihm vom Speicher 8 ein stimm- mit +p bezeichnetes Signal für jeden positiven haftes Signal zugeführt wird. Das Ausgangs-Signal
des Anzeigers 26 öffnet die Torschaltung 28 und
läßt den Zählerstand des Zählers 22 in diesem Zeitpunkt in das Register 30 einlaufen. Der Zählerstand 15
des Zählers 22 zu Beginn des stimmhaften Lautes
soll mit Tv bezeichnet werden. Das Signal vom Anzeiger 26 zur Zählerzeit Tv wird außerdem der Torschaltung 32 zugeführt, so daß im Addierwerk 34
der Zählerstand für die Grundton-Periode Tg des 20 in die Analogwert-Speicher 46 bzw. 48 zu leiten, Zählers 18 und der Zählerstand für den Beginn des während die Torschaltungen 60 und 62 ein anderes stimmhaften Lautes vom Zähler 22 addiert werden Paar positiver und negativer Spitzenwerte zu den können; das Ergebnis wird im Register 36 unter- Analogwert-Speichern 50 bzw. 52 leiten. Die Register gebracht. Während des ersten Umlaufes des Sprach- 68 und 70 speichern (in Form eines Zählwertes) die Signals im Verzögerungs-Speicher 8 geschieht also 25 Zeiten, an denen die positiven Spitzen auftreten. Die (zusammengefaßt) folgendes: Spitzen-Amplituden (d. h. die Differenz zwischen den
Zunächst wird eine ungefähre Grundton-Periode Tg positiven und negativen Spitzen) werden durch andere in Form eines Zählerstandes bei 18 bestimmt; der Schaltungen verglichen.
Zähler 22 wird durch das Synchronisiersignal im Der Ausgang des Synchromsier-Signal-Erkenners
Speicher 8 rückgestellt, und sein späterer Zähler- 30 20 wird außerdem der bistabilen Schaltung 72 zugestand Tv zur Zeit des Beginns eines stimmhaften mh^> diese wird dadurch auf ihren »1 «-Zustand einSignals wird in das Register 30 eingetragen; die gestellt. Das Ausgangssignal von der »1 «-Seite der Summe der beiden Werte Tv und Tg werden in das Schaltung 72 wird weiterhin als Signal la bezeichnet. Register 36 gebracht. Die Register 30 und 36 ent- Unter anderem gelangt dieses Signal zum Analoghalten also Zählwerte, deren Differenz gleich der 35 Tor s6· Beim Auftreten der ersten positiven Spitze Grundton-Periode, dargestellt durch Tg, ist. Der Aus- des im Speicher 8 enthaltenen und auf das Synchrogang des Zählers 22 ist auch einerseits mit einem nisier-Signal folgenden Sprach-Signals öffnet das ersten Vergleicher 38 (dieser wieder in Verbindung Signal +p aus dem Detektor 64 das Tor 56; der mit dem Register 30) und mit einem zweiten Ver- Analogwert der positiven Spitze kann damit zum gleicher 40 (dieser in Verbindung mit Register 36) 40 Analogwert-Speicher 46 durchlaufen, verbunden. Die Zählwerte des Zählers 22 können Das Signal la aus der Schaltung 72 und das Si-
also mit den Werten in beiden Registern 30 und 36 gnal +p aus dem Spitzen-Detektor 64 werden weiter verglichen werden. der Torschaltung 74 zwischen dem Zähler 22 und
Beim zweiten Umlauf des Speichers 8 ist die An- dem Register 68 zugeführt; dadurch wird die Zeit Ordnung bereit zur Bestimmung des Anfangs der 45 des Auftretens des Signals +p im Register 68 (als Grundton-Periode; das geschieht durch Bestimmung Zählwert) gespeichert. Auch der Oder-Schaltung 76
wird das Signal la zugeführt; zusammen mit dem Signal — ρ kann dadurch die Und-Schaltung 78 durchlässig gemacht und die bistabile Schaltung 80
(aus Register 30) und dem Zeit-Zählwert Tv + Tg 50 eingestellt werden. Das an der »1 «-Seite dieser Schal-(aus Register 36) ermittelt wird. tung auf Leitung 82 entstehende Signal wird als Ein
gangswert den Und-Schaltungen 86 und 88 zugeführt. Der zweite Eingang der Und-Schaltung 86 wird vom Signal la gespeist; das Ausgangssignal dieser Und-
einen neuen Zählvorgang. Sobald der Zähler 22 den 55 Schaltung wird mit 1 b bezeichnet. Es gelangt zur Zählwert Tv erreicht, wird durch den Vergleicher 38 Torschaltung 58, so daß beim Auftreten des folgen-Gleichheit mit dem Inhalt des Registers 30 angezeigt; den negativen Spitzenwertes des Sprach-Signals unter das Ausgangs-Signal des Vergleichers 38 stellt die Mitwirkung des Signals — ρ der Analogwert der negabistabile Schaltung 42 auf »1«. Die Ausgangsklemme tiven Spitze zum Analogwert-Speicher 48 gelangen der bistabilen Schaltung 42 liefert ein Siganal das 60 kann. Die Speicherwerte von 46 und 48 werden dann mit Q bezeichnet wird. im Differenzialverstärker 90 miteinander verglichen.
Das Signal Q wird der Torschaltung 44 (F i g. 3 A) Der Ausgangswert dieses Verstärkers gibt den
- zugeführt, an der als zweites Vorbereitungs-Signal ersten Spitze-Spitze-Wert des Eingangs-Sprachsignals der Ausgang des Stimmhaft-Anzeigers 26 ansteht. an. Dieses Signal wird bei 92 invertiert und dem Diese Torschaltung öffnet also zur Zeit des Zähler- 65 Analog-Addierer 94 zugeführt. Da die Einrichtungen Standes Tv. Das Signal Q gelangt außerdem zu den 46 und 48 Speichereigenschaft haben, bleibt das Ein-(noch zu beschreibenden) Analogwert-Speichern 46, gangssignal zum Addierer 94 bestehen, bis über die 48, 50 und 52 und löscht alle darin etwa enthaltenen Torschaltungen 56 und/oder 58 ein neues Signal ein-
des Zeitpunktes (mittels Zähler 22), an dem der höchste Spitze-Spitze-Wert des Sprach-Signals in der Zeit zwischen dem Anfang des Stimmhaft-Signals Tv
Während des zweiten Umlaufs des Speichers 8 setzt das zweite Auftreten des Synchronisier-Signals den Zähler 22 auf Null, und der Oszillator 24 beginnt
509 635/10
geht. Mit den bisher beschriebenen Vorgängen zeigt der Differentialverstärker 96 noch kein Ausgangssignal, da die dafür nötigen Torsignale 2 a und 2 b für die Torschaltungen 60 und 62 noch nicht gebildet sind. Die Analogwert-Speicher 50 und 52 enthalten also noch den Null-Pegel. Der — negative — Ausgang des Inverters 92 ist also noch das einzige Eingangssignal des Addierers 94. Infolgedessen ist das Ausgangssignal dieses Addierers ebenfalls negativ und kann durch die Diode 96 (Fig. 30) zur Torschaltung 98 durchlaufen. Die Torschaltung 98 wird durch das Signal 1 α geöffnet, und das Ausgangssignal des Addierers 94 kann zur Torschaltung 100 weiterlaufen; diese wird von dem Signal — ρ über die Verzögerungsschaltung 102 geöffnet; der Zeitverzug soll den Analogwert-Speichern 46 und 48 erlauben sich einzustellen. Das Ausgangssignal der Und-Schaltung 100 stellt die bistabile Schaltung 72 zurück; das Signal la endet. ,Die Schaltung 72 liefert jetzt (von ihrer Null-Seite her) das Signal 2 a.
Inzwischen endete auch das Signal Ib von der Und-Schaltung 86 nach einer gewissen, durch die Verzögerungsschaltung 84 bestimmten Zeit. Auch diese Verzögerung ist mit. Rücksicht auf den Speicher 48 gewählt worden.
Da die Signale la und Ib nicht mehr vorhanden sind, bleiben die Torschaltungen 56 und 58 sowie 74 für die Dauer der folgenden positiven und negativen Spitzen des Sprachsignals gesperrt. Die nächste positive Spitze erzeugt ein weiteres Signal +p mittels des Detektors 64; das Signal gelangt zu den Torschaltungen 56, 58, 60 und 62 sowie 74 und 104. Die Torschaltung 104 liegt zwischen dem Zähler 22 und Register 70. Das Signal 2 a aus der bistabilen Schaltung 72 liegt jetzt vor, so daß die Torschaltungen 60 und 104 geöffnet werden. Über 60 gelangt die positive Spitze des Sprachsignals zum Analogwert-Speicher 50, und die öffnung der Torschaltung 104 gestattet die Eintragung des Zählwertes für das Auftreten der positiven Spitze in das Register 70.
Das Signal 2 a aus der Schaltung 72 erzeugt wiederum über die Oder-Schaltung 76 und die Und-Schaltung 78 ein Einstell-Signal für die bistabile Schaltung 80, die diesmal mit Signal 2 a die Und-Schaltung 88 durchlässig werden läßt; der Ausgang der Und-Schaltung ist das Signal 2b. Mangels Signal la liefert die Und-Schaltung 86 diesmal kein Signal 1 b. Das Signal 2b öffnet die Torschaltung 62, sobald die nächste (zweite) negative Spitze des Sprachsignals vom Detektor 66 festgestellt und das Signal — ρ erzeugt ist. Dadurch wird in den Analogwert-Speicher 52 der Analogwert der negativen Spitze aufgenommen.
Infolge der verzögerten Rückstellung der bistabilen Schaltung 80 endet das Signal 2 b nach einer Zeit, die zur Pegeleinstellung in dem Analogwert-Speicher 52 erforderlich ist. Die Analogwert-Speicher 50 (für die zweite positive Spitze) und 52 (für die zweite negative Spitze) speisen den Differentialverstärker 96, dessen Ausgangssignal den zweiten Spitze-Spitze-Wert liefert. Dieser Wert wird in der Addierschaltung 94 mit dem invertierten ersten Spitze-Spitze-Wert aus dem Verstärker 90 addiert.. Wenn das Signal aus dem Inverter 92 größer ist als das Signal aus dem Verstärker 96, ist das Ausgangssignal des Addierers 94 negativ, im anderen Falle positiv. Bei negativem Ausgangssignal der Schaltung 94 kann also angenommen werden, daß der erste Spitze-Spitze-Wert des Sprachsignals den Anfang einer Grundton-Periode darstellt, nicht aber der zweite Spitze-Spitze-Wert. In diesem Falle ist es erwünscht, die Werte in den Analogwert-Speichern 46 und 48 weiter beizubehalten und den dritten Spitze-Spitze-Wert des Sprachsignals in den Speichern 50 und 52 (statt des zweiten Spitze-Spitze-Wertes) aufzunehmen und wiederum zu vergleichen; dieser Vorgang dauert an, bis entweder ein den ersten Spitze-Spitze-Wert überschreitender Wert gefunden oder die Abtast-Periode zu Ende ist.
ίο Ist der zweite Spitze-Spitze-Wert größer als der erste (Ausgangssignal von 94 positiv), so können die Werte in 46 und 48 nicht zum Beginn einer Grundton-Periode gehören, und die Werte in 50 und 52 werden beibehalten. In diesem Falle werden die Analog-Speicher 46 und 48 für den dritten Spitze-Spitze-Wert vorgesehen. Die Vergleichsvorgänge werden also unter Beibehaltung jeweils des höchsten gefundenen Spitze-Spitze-Werts so lange fortgeführt, wie es die in den Registern 30 und 36 enthaltenen Werte bestimmen. Der nach dem Ende der Vergleichs-Periode festgestellte höchste derartige Wert gibt also den Anfang der Grundton-Periode an.
Wenn z. B. der zweite Spitze-Spitze-Wert größer war als der erste, so wird der Ausgang der Addierschaltung 94 positiv und kann die Diode 106 zur Torschaltung 108 passieren. Es ist zu bemerken, daß ein negatives Signal aus 94 über die Diode 96 die Torschaltung 98 nicht passieren könnte, da das Signal la nicht vorliegt. Die Torschaltung 108 ist jedoch durch das Signal 2 a vorbereitet, das positive Signal gelangt zur Torschaltung 100, welche durch das in 102 verzögerte Signal — ρ geöffnet ist. Der Ausgang von 100 stellt die bistabile Schaltung 72 zurück, so daß sie ein Signal la liefern kann, das die Speicherung der nächsten (dritten) Spitzen-Werte in den Speichern 46 und 48 verursacht. Wäre jedoch der erste Spitzen-Wert der größere und damit der Ausgang des Addierers 94 negativ gewesen, so hätte dieses negative Signal wegen des fehlenden Signals la nicht die Torschaltung 98 passieren können; das Signal 2 α hätte fortgedauert, und die folgenden (dritten) Spitzen-Werte wären zu den Speichern 50 und 52 gelaufen.
Während dieser Vergleichsvorgänge läuft der Zähler 22 so lange, bis er den Wert Tv + Tg erreicht, welcher Wert im Register 36 enthalten ist. Dann liefert der Vergleicher 40 ein Signal, das der bistabilen Schaltung 42 zugeführt wird; das Signal β endet damit. Die Torschaltung 44 sperrt bei Abwesenheit von Q und den Torschaltungen 56, 58, 60 oder 62 wird kein weiteres Sprachsignal zugeführt.
Das Signal Q liegt auch an der bereits erwähnten Schaltung 54, welche die abfallende Flanke des Signals feststellt. Das Ausgangssignal von 54 dient zum Auslesen des Zeit-Zählwertes, bei dem der höchste Spitze-Spitze-Wert des Sprachsignals auftrat. Ein solcher Zählwert befindet sich in Register 68 und in Register 70; einer davon bezeichnet den höchsten Spitze-Spitze-Wert des Sprachsignals und damit den Beginn einer Grundton-Periode.
Befindet sich die bistabile Schaltung 72 in der Stellung, die ein Signal 1 α liefert, dann ist der Zählwert des Registers 68 maßgebend. Im anderen Falle (Signal 2 a) ist der Wert im Register 70 maßgebend.
Der Ausgang der Schaltung 54 führt demnach zu zwei Und-Schaltungen 110 und 112, an deren zweiten Eingängen die Signale 1 α bzw. 2 α angeschlossen sind. Die Und-Schaltung 110 bewirkt das Auslesen
des Registers 68, die Und-Schaltung 112 das Auslesen des Registers 70. In jedem Falle stellt der Wert des ausgeleseneo Registers (68 oder 70) den Zeitpunkt dar, in dem eine Grundton-Periode beginnt. Dieser Zählwert wird weiterhin mit T1 bezeichnet; er liegt zwischen den Zählwerten Tv und T„ + Tg. Dieser Zählwert T1 gelangt über eine der Leitungen 114 oder 116 zum Rechner 3. Dort werden die Werte T1 + 1/2 Tg und T1 + 3/2 Tg bestimmt. Die errechneten Beträge gelangen über Leitung 118 (T1 +1/2 Tg) zum Register 30 und über Leitung. 120 (T1 + 3/2 Tg) zum Register 36.
Was bisher geschah ist die Auswahl (in Form eines Zählwertes) des Anfangs einer Grundton-Periode des Sprachsignals, während dieses Sprachsignal einmal im Speicher 8 umlief. Die Anfangsstelle der Grundton-Periode T1 wurde, entsprechend dem Entwurf der Anlage, zwischen Tv und Tv + Tg festgestellt. Mit dem nun ermittelten Anfang der Grundton-Periode bei T1 wird nun der Anfang der nächsten Grundton-Periode bestimmt; er wird zwischen den Werten T1 + 1/2 Tg (im Register 30 enthalten) und T1 + 3/2 Tg (im Register 36 enthalten) gesucht, weil der Anfang der zweiten Grundton-Periode etwa in der Mitte dieses Bereiches zu erwarten ist.
Zunächst geschieht nichts, ehe nicht der Umlauf des Speichers 8 endet und ein neuer Umlauf beginnt. Mit Beginn des neuen Umlaufs des Speichers 8 stellt der dem Sprachsignal vorauslaufende Synchronisierimpuls den Zähler 22 zurück und stellt die bistabile Schaltung72 so ein, daß ein Signal la am Ausgang »1« vorliegt. Dieses Signal gelangt wieder zu dea Torschaltungen 56 und 74. Der Zähler 22 zählt wieder bis zu einem Wert T1 + 1/2 Tg, der im Register 30 gespeichert ist. Dann wird vom Vergleicher 38 die bistabile Schaltung 42 so umgeschaltet, daß das Signal Q am Ausgang der Seite »1« entsteht. Dieses Signal löscht den Inhalt der Analogwert-Speicher 46, 48, 50 und 52 und öffnet die Torschaltung 44. Durch diese treten daraufhin Sprachsignale aus dem Speicher 8 zu den Torschaltungen 56, 58, 60 und 62 sowie zu den Detektoren für positive und negative Spitzenwerte 64 und 66. Dies geschieht also zum Zählwert T1 + 1/2 Tg. Bei der nächstfolgenden positiven Spitze entsteht das Signal +p aus 64, das zusammen mit dem schon vorliegenden Signal 1 a die Torschaltung 56 öffnet; der Analogwert der positiven Spitze kann dann im Speicher 46 aufgenommen werden.
Das Signal 1 α bereitet die Und-Schaltung 78 vor, so daß beim Auftreten der nächsten negativen Spitze über 66 das Signal — ρ die bistabile Schaltung 80 umschalten und über die Und-Schaltung 86 das Signal Ib erzeugen kann. Mit Ib und — ρ wird die Torschaltung 48 durchlässig zur Speicherung des negativen Spitzenwertes im Speicher 48. Der Differenzialverstärker 90 liefert dann den Spitze-Spitze-Wert des Sprachsignals.
Im Addierer 94 wird das invertierte Signal des Verstärkers 90 mit dem Ausgang des Verstärkers 96 (das derzeit Null ist) verglichen. Das Ausgangssignal von 94 ist also negativ und durchläuft die Diode 96 zur Torschaltung 98.
Diese wird durch das Signal 1 α von 72 geöffnet, und das Ausgangssignal des Addierers 94 gelangt zur Torschaltung 100> wo es durch das verzögerte Signal —ρ zur Umschaltung der bistabilen Schaltung 72 weitergeleitet wird. Letztere liefert nun von ihrer Seite »0« das Signalla. Das SignalIb wurde mittlerweile durch Rückschalten der bistabilen Schaltung 80 beendet.
In Abwesenheit der' Signale 1 α und 1 b bleiben jetzt die Torschaltungen 56 und 58 sowie 74 während des Auftretens der folgenden positiven und negativen Spitzen des Sprachsignals gesperrt. Letztere erzeugen über den Detektor 64 ein neues Signal +p, das zu den Torschaltungen 56, 58, 60 und 62 sowie 74 und
ίο 104 gelangt. Da jetzt das Signal la vorhanden ist, werden die Torschaltungen 60 und 104 durchlässig. Über 60 kann der positive Spitzenwert 'des Sprachsignals in den Analogwert-Speicher 50 eintreten und über 104 wird der Zeitpunkt seines Auftretens im Register 70 gespeichert. Das Signal la ruft außerdem die Schaltungen 76, 78, 80 und 88 das Signal 2 b hervor. Letzteres bewirkt zusammen mit dem bei der nächsten negativen Spitze des Sprachsignals erzeugten Signal —p das öffnen der Torschaltung 62, so
ao daß der Wert der negativen Spitze in dem Analogwert-Speicher 52 aufgenommen werden kann. Die Differenz der beiden Speicherwerte von 50 und 52 gelangt zum Differentialverstärker 96 und wird im Addierer 94 mit dem Wert aus dem Differentialverstärker 90 in Beziehung gesetzt.
Die Schaltung arbeitet dann wie früher beschrieben; der jeweils größte Spitze-Spitze-Wert der Analogwert-Speicher wird erhalten und mit den folgenden Werten verglichen bis ein größerer auftritt.
Der einzige Unterschied gegenüber dem früheren Zyklus ist der, daß das Sprachsignal zwischen den Zählzeiten T1 ■+ 1/2 Tg und T1 + 3/2 Tg abgetastet wird, während beim früheren Zyklus die Abtastzeit zwischen den Zählwerten Tv und Tv + Tg lag.
Wenn der Zähler 22 den Zählwert T1 + 3/2 Tg erreicht hat, stimmt dieser Wert mit dem Wert im Register 36 überein, und der Vergleicher 40 beendet durch Einwirkung auf die bistabile Schaltung 42 das Signal Q. Dadurch wird die Torschaltung 44 geschlossen und über 54 das Auslesen eines der Register 68 oder 70 bewirkt. Der ausgelesene Zählwert stellt die Zeit des Auftretens des höchsten Spitze-Spitze-Wertes des Sprachsignals in der Zeit zwischen T1 + 1/2 Tg und T1 und T1 + 3/2 Tg dar, also den
Beginn der zweiten Grundton-Periode. Dieser Zählwert soll als T2 bezeichnet werden. Er gelangt in den Rechner 3, wo die Werte T2 + 1/2 Tg und T2 +' 3/2 Tg errechnet werden. Diese Werte gelangen dann wieder in die Register 30 bzw. 36.
Während des nächsten Umlaufes des Speichers 8 wird das Sprachsignal zwischen den durch die beiden Zählwerte gekennzeichneten Zeitpunkten wiederum und in gleicher Weise nach dem Beginn einer neuen Grundton-Periode abgesucht. Der zugehörige Zählwert sei Mit T3 bezeichnet; er wird in den Rechner 3 eingetragen und mit dessen Hilfe eine neue Abtastperiode errechnet, die von T3 +1/2 Tg bis T3+ 3/2 Tg läuft. Innerhalb letzterer Zeitperiode wird ein Wert T4 bestimmt. Das Ergebnis der ganzen Abtastung des im Speicher 8 enthaltenen Sprachsignals ist eine Reihe von Zeitzählwerten T1, T2, T3... Tn, welche den Anfangspunkt aller Grundton-Perioden darstellen; diese Werte gelangen in den Rechner 3.
Der zeitliche Abstand zwischen den Anfängen der Grundton-Perioden sind die wirklichen Perioden-längen, die den Grundton des Lautes bilden. Die verschiedenen Grundton-Perioden, d. h. von T1 bis T2, von T2 bis T3 usw., sind von verschiedener Länge.
Wie eingangs festgestellt wurde, sollen diese Grundton-Perioden auf gleiche Länge gebracht werden, die gleich der gewünschten, weiterhin mit Td bezeichneten Grundton-Periode ist.
Zu diesem Zweck wird nun von jeder Grundton-Periode ein Stück entfernt, so daß die verkürzte Periode gleich der gewünschten Td wird. Infolge dieses Beschneidens »paßt« das Ende einer Kurvenform nicht mehr mit dem Anfang der nächsten zusammen.
Perioden T1, T2.. .Tn dem Rechner 3 zugeführt; sobald der Zähler 22 den Wert T1 erreicht hat, stellt der Rechner in Übereinstimmung mit dem gespeicherten Wert T1 fest und öffnet über 126 und 124 die
5 Torschaltung 122, so daß das Sprachsignal aus dem Speicher 8 durchtreten kann. Zum Zeitpunkt T1+^ wird die bistabile Schaltung 124 rückgeschaltet und die Torschaltung 122 geschlossen. Die Torschaltung 122 war also während der Zeitdauer Td, welche die
Die Amplituden können z. B. solche Unterschiede io gewünschte Grundton-Periode darstellt, geöffnet und aufweisen, wie es die Punkte / und g der F i g. 2 ein dieser gewünschten Grundton-Periode Td entzeigen. Zusätzlich zu dem Verkürzen der wirklichen sprechendes Stück des Sprachsignals wurde durch-Grundton-Periode zur Anpassung an Td müssen also gelassen. Das Signalstück gelangt zur Addierschaldie Amplituden der Kurvenformenden unter Um- tung 130, deren Ausgang den Analog-Digital-Wandständen vergrößert oder verkleinert werden, um zu- 15 ler 132 speist. Während dieses ersten Umlaufs des sammenzupassen. · Speichers 8 (von T1 bis T1 + Td) und bei jedem
Praktischerweise wird der Wert der gewünschten folgenden ungeraden Umlauf ist der Wandler 132 Grundton-Periode Td gleich dem kleinsten der ge- durch ein Signal vom Rechner 3 gesperrt. Der Ausmessenen wirklichen Grundton-Perioden T1 bis T2, gang der Verzögerungsstrecke 128 führt nämlich ~ '' T3 usw. gemacht. Dadurch ist sichergestellt, 20 auch zur Torschaltung 134, die den Analogwert des
Sprachsignals zur Zeit T1 + Td zu dem Analogwert-Speicher 136 überträgt. Kurz nach der eben genannten Zeit erreicht der Zähler 22 den Zählwert T2. Der
T2 bis _
daß jede der wirklichen Grundton-Perioden entweder gleich oder größer als die gewünschte ist.
Nach der folgenden Beschreibung werden alle
Grundton-Perioden an eine einzige gewünschte Rechner 3 stellt die Übereinstimmung mit einem bei Grundton-Periode Td ar-spaßt; es wäre jedoch auch 25 ihm gespeicherten Wert fest und liefert auf Leitung möglich, die verschiedenen Grundton-Perioden an 138 einen Impuls zum öffnen des Analog-Tores 140, verschiedene gewünschte Grundton-Perioden anzu- welches den Analogwert des Sprachsignals zum passen. Zum Beispiel könnte eine gewünschte Grund- Analog-Speicher 142 durchläßt. Jetzt benndet sich ton-Periode für offene Vokale und eine andere für der Analogwert des Sprachsignals zur Zeit T1 + Td geschlossene Vokale vorgesehen werden. Dazu wären 30 (Ende der ersten gewünschten Grundton-Periode) im geringfügige Änderungen der Anordnung nach Speicher 130 und der Analogwert des ,Sprachsignale Fig. 3 erforderlich. Nach der Bestimmung aller zur Zeit T2 (Anfang der nächsten Gründton-Periode) Grundton-Perioden-Anfänge T1 bis Tn setzt der im Speicher 142. Beide Werte werden im Differential-Speicher 8 die Umläufe fort. Beim ersten der Be- verstärker 144 verglichen, dessen Ausgang die Difstimmung von Tn folgenden Umlauf werden die Am- 35 ferenz der beiden Analogwerte darstellt. Diese Diffeplitudendifferenzen zwischen dem Ende der ersten renz-Spannung wird weiter als Vd bezeichnet, gewünschten Grundton-Periode bei T1 + Td und dem Diese Spannung Vd dient als Eingangsspannung
Anfang der folgenden Grundton-Periode bei T2 be- für die Integrierschaltung 146, die einen Eingangsstimmt. Beim zweiten Umlauf wird eine Übergangs- widerstand 148 und einen Verstärker 150 enthält, funktion der Amplitudendifferenzen zu der Kurven- 40 letzterer mit einem Rückkoppelungskondensator 152, form der ersten Grundton-Periode addiert und diese dessen zweiter Beleg über den Ruhekontakt 154 eines dann im Rechner 3 gespeichert. Beim dritten Umlauf Relais an Masse liegt. Der Kontakt 154 wird durch des Speichers 8 (nach der Bestimmung von Tn) wird die Relaisspule 156 betätigt, die an Leitung 126 und die Amplitudendifferenz zwischen dem Ende der den Ausgang der Verzögerungsstrecke 128 angezweiten gewünschten Grundton-Periode bei T2 + Td 45 schlossen ist. Der Kontakt 154 wird deshalb zur Zeit und dem Anfang der dritten Grundton-Periode bei T3
bestimmt. Beim vierten Umlauf wird diese Amplitudendifferenz zur Kurvenform der zweiten gewünschten Grundton-Periode addiert und letztere in
den Rechner 3 eingegeben. Ebenso werden alle wei- 50 funktion, eine am Anfang jeder Grundion-Periode teren Kurvenformen der gewünschten Grundton- T1, T2, T3 usw. bei Null beginnende Spannung, die Perioden bei den folgenden geradzahligen Zyklen zu der zugeordneten Spannung Vd in der Zeit Td ankorrigiert und im Rechner 3 abgespeichert. wächst. Was im bisher beschriebenen Zyklus geschah
Hier folgt eine genauere Beschreibung dieser Vor- ist der Durchlaß eine Stückes des Sprachsignals durch gänge. Beim nächsten Umlauf des Speichers 8 nach 55 die Torschaltung 122 zwischen den Zeiten T1 und der Bestimmung von Tn wird der Zähler 22 durch T1 + Td. Das Kurvenform-Stück gelangt über die den Synchronisierimpuls vom Speicher 8 wieder auf Addierschaltung 130 zum Digital-Analog-Konverter Null gestellt. Der Ausgang des Speichers 8 liegt auch 132, der während dieses ersten Umlaufes (und wähan der Torschaltung 122, die von der bistabilen rend aller folgenden ungeraden Umläufe) gesperrt Schaltung 124 gesteuert wird. Wenn sich letztere in 60 ist. Zur Zeit T1 + Td wird die dann herrschende Amihrem Zustand »1« befindet, wird die Torschaltung plitude des Sprachsignals im Analogwert-Speicher 122 durchlässig. Die bistabile Schaltung wird durch 136 aufgenommen und zur Zeit T2 der zu diesem ein Signal auf Leitung 126 vom Rechner 3 in ihren Zeitpunkt vorhandene Analogwert des Sprachsignals »1 «-Zustand und durch das von der Verzögerungs- im Analog-Wert-Speicher 136 aufgenommen und zur strecke 128 um den Betrag Td verzögerte Signal der- 65 Zeit T2 beiden Amplitudenwerte (Vd) wird bestimmt selben Leitung in den »0«-Zustand gebracht. Das und der Integrierschaltung 146 zugeführt. Ausgangssignal des Zählers 22 wird zum Vergleich Der Umlaufspeicher 8 beendet seinen Umlauf, ohne
mit den Zählwerten für den Beginn der Grundton- daß noch etwas geschieht. Beim nächsten (zweiten)
T1 geöffnet und zur Zeit T1 + Td wieder geschlossen; er öffnet wieder zur Zeit T2 und schließt zur Zeit T2 + Td usw. Das Ausgangssignal der Integrierschaltung 145 ist die früher besprochene Übergangs-
Umlauf dieses Speichers wird der Zähler 22 zurückgesetzt und beginnt wieder zu zählen. Zur Zeit T1 läßt ein Signal vom Rechner 3 über Leitung 126 und die bistabile Schaltung 124 die Torschaltung 122 durchlässig werden, so daß das Sprachsignal zur Und-Schaltung 130 passieren kann. Gleichzeitig ist der Schalter 154 geöffnet, so daß sich an deren Ausgangsklemme eine Übergangsfunktion aufbauen kann. Der Ausgang der Integrierschaltung 146 ist der zweite Eingang des Addierers 130. Diesem wird das Sprachsignal in der Zeit von T1 bis T1 + Td zugeführt. Während der gleichen Zeit wächst das Ausgangssignal der Integrierschaltung 146 von Null bis zum Wert Vd. Das Ausgangssignal der Und-Schaltung 130 ist also eine Signalform mit der gewünschten Grundton-Periode Td und einer Amplitude, die zum Zeitpunkt T1 + Td um den Betrag Vd erhöht ist; sie erreicht, also damit an ihrem Ende die gleiche Amplitude, wie sie die nächste Grundton-Periode an ihrem Anfang zur Zeit T2 hat. Da dieses ein ungerader Umlauf des Speichers 8 ist, ist der Ausgang des Analog-Digital-Konverters 132 nicht mehr gesperrt, und er gibt demnach das digitale Äquivalent des Sprachsignals während der ersten gewünschten Grundton-Periode T1 bis T1 + Td mit korrigierter End-Amplitude ab. Dieses digitale Signal wird im Rechner 3 gespeichert.
In gleicher Weise wird bei den folgenden ungeraden Umläufen der übrige Teil des Sprachsignals jeweils beim Beginn einer der folgenden Grundton-Perioden (zu den Zeitpunkten T2, T3 ... Tn) während der Zeitdauer Td durch die Torschaltung 122 geschleust, so daß die Spannungsdifferenz zwischen dem Ende einer gewünschten Grundton-Periode und dem Anfang der nächsten Grundton-Periode (d. h. die Spannung Vd) errechnet werden kann. Bei den jeweils folgenden geradzahligen Umläufen werden die so bestimmten Amplitudendifferenzen (Vd) zwischen den Kurvenformen am Ende einer Grundton-Periode und dem Anfang der nächsten Grundton-Periode zu dem Sprachsignal addiert; durch die Addition eines Spannungswertes erhält damit das Ende jeder Grundton-Periode und der Anfang der folgenden Grundton-Periode die gleiche Amplitude. Die so bei aufeinanderfolgenden geradzahligen Umläufen berichtigten gewünschten Grundton-Perioden werden durch den Konverter 132 in Digitalwerte verwandelt und zum Rechner 3 gegeben.
Diese digitalen Eingangswerte des Rechners 3 stellen das Sprachsignal mit Grundton-Perioden gewünschter Länge und mit in der Spannung angepaßten End- bzw. Anfangswerten dar. Wie schon früher
ίο festgestellt, werden diese Grundton-Perioden bei jedem zweiten Umlauf des Speichers während dieser Operationsphase erzeugt. Die Grundton-Perioden-Eingangssignale des Rechners 3 haben also zeitlichen Abstand voneinander und bilden eine fortlaufende Kurvenform. Der Rechner 3 hat die entsprechenden Speicher- und Schalt-Möglichkeiten, um die getrennten Grundton-Perioden in digitaler Form aneinander zu fügen.
Im Rechner wird also ein vollständiges Sprach-
ao signal in Digitalform gespeichert. Alle so digital gespeicherten Grundton-Perioden sind gleich der gewünschten Grundton-Perioden-Länge Td und zeigen zwischen Ende und Anfang aufeinanderfolgender Grundton-Perioden keine Unstetigkeiten. Das gespeicherte Sprachsignal kann aus dem Rechner 3 entnommen und als Sprachsignal zu praktischem Gebrauch auf Magnetband übernommen werden.
Zusammenfassend kann gesagt werden, daß ein System beschrieben wurde, in dem Abschnitte verschiedener Sprachsignale zu einem einzigen Sprachsignal vereinigt werden können. Um die Tonhöhenunterschiede zwischen den Abschnitten zu beseitigen, wird jede Grundton-Periode des Gesamtsprachsignals einer gewählten, normierten Grundton-Periode angepaßt. Gleichzeitig werden die Amplitudenunterschiede zwischen den Enden und den Anfängen der einzelnen Grundton-Perioden durch Addition einer berechneten Übergangsfunktion, d. h. eines ansteigenden Spannungswertes, ausgeglichen.
Das resultierende Sprachsignal hat einen gleichförmigen Grundton und zeigt keine Unstetigkeiten mehr. Für das menschliche Ohr wird es wie ein normaler Sprachlaut klingen.
Hierzu 4 Blatt Zeichnungen
509 635/10

Claims (7)

Patentansprüche:
1. Verfahren zur Aufbereitung gespeicherter, eine größere Anzahl Grundtonperioden umfassender Sprachsignale, die für die maschinelle Sprachausgabe beliebig aneinandergereiht werden sollen, insbesondere solcher Sprachsignale, die zu verschiedenen Zeiten und/oder von verschiedenen Sprechern gewonnen worden sind, dadurch gekennzeichnet, daß von einem gegebenen Sprachsignal begrenzter Dauer . aufeinanderfolgende Grundtonperioden und deren Zeitdauer bestimmt werden, daß diese Grundtonperioden alle wenigstens auf die Dauer der kürzesten Grundtonperioden beschnitten werden und daß jeder verkürzten Grundtonperiode eine allmählich ansteigende oder abfallende Übergangsfunktion derart überlagert wird, daß zwischen aufeinanderfolgenden verkürzten Grundtonperioden keine Amplitudensprünge auftreten.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß Grundton-Perioden mit offenen bzw. mit geschlossenen Vokalen auf unterschiedliche Dauer verkürzt werden.
3. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, gekennzeichnet durch einen Umlaufspeicher (8) zur die zyklische Entnahme, gestattenden Speicherung eines Sprachsignals, durch Einrichtungen (10, 12, 14, 16, 18) zur Bestimmung des der Aufbereitung zu unterwerfenden Teiles des gespeicherten Sprachsignals; durch Schaltungen (64, 66; 46, 48; 50, 52; 90, 92) zur Ermittlung der größten den Anfang einer Grundton-Periode definierenden Spitze-Spitze-Werte des Sprachsignals innerhalb des untersuchten Bereichs; durch Vergleichseinrichtungen (136, 142, 144) zur Bestimmung der Amplitudendifferenz zwischen Ende bzw. Anfang benachbarter, auf gleiche Länge verkürzter Grundton-Perioden und durch eine Integrierschaltung (146) zur Erzeugung eines der Amplitudendifferenz entsprechenden Spannungsverlaufs, der in einer Addierschaltung (130) dem Amplitudenwert einer Grundton-Periode hinzugefügt wird.
4. Anordnung nach Anspruch 3 zur Bestimmung des der Aufbereitung zu unterwerfenden Teiles des Sprachsignals, gekennzeichnet durch einen Hochpaß (10), einen Gleichrichter (12) und einen Tiefpaß (14), welche die Umhüllende des dem Umlaufspeicher (8) entnommenen Sprachsignals bilden; durch einen Detektor (16) für die Nulldurchgänge der Umhüllenden; durch einen Zähler (18) zur Bestimmung des Zeitabstandes zweier Nulldurchgänge; durch einen weiteren Zähler (22) zur Bestimmung des Zeitabstandes zwischen einem dem Sprachsignal im Speicher (8) vorausgehenden Synchronisiersignal und dem ersten stimmhaften Laut des Sprachsignals; sowie durch zwei Register (30, 36) zur Aufnahme des Zählwertes des weiteren Zählers (22) bzw. der Summe der Zählwerte beider Zähler (22 und 18).
5. Anordnung zur Lokalisierung einer Grundton-Periode nach Anspruch 3, dadurch gekennzeichnet, daß zwei Spitzendetektoren (64, 66) innerhalb des vom Inhalt der Register (30, 36) definierten Zeitabschnittes die Amplituden von Spitzenwert-Paaren des Sprachsignals ermitteln und nacheinander in Analogwert-Speicherpaare (46, 48; 50, 52) eingeben, daß die Spitze-Spitze-Werte jedes Paares durch Differentialverstärker (90, 96) bestimmt und der durch Subtraktion (92, 94) gefundene größere Wert festgehalten und mit weiter bestimmten Werten verglichen werden, daß der Zeitpunkt des Auftretens jedes Spitzenwert-Paares in Registern (68, 70) gespeichert und daß der dem schließlich größten gefundenen Wert zugeordnete Registerwert als Anfangspunkt einer Grundton-Periode einer Auswerte-Einheit (3) zugeführt wird.
6. Anordnung nach den Ansprüchen 3 bis 5, dadurch gekennzeichnet, daß der Inhalt der einen Auswerte-Zeitabschnitt definierenden Register (30, 36) unter Benutzung des Anfangszeitpunktes bereits bestimmter Grundton-Perioden zur Festlegung des folgenden Auswerte-Zeitabschnittes durch die Auswerte-Einheit (3) neu eingestellt wird.
7. Anordnung nach den Ansprüchen 3 bis 6, dadurch gekennzeichnet, daß die auf die gewünschte Dauer verkürzte und durch Addition einer Übergangsfunktion in der Amplitude berichtigte Grundton-Periode einem Analog-Digital-Wandler (132) zugeführt und die digitale Darstellung jeder Grundton-Periode in der Auswerte-Einheit (3) gespeichert wird.
DE1472004A 1964-06-09 1965-06-03 Verfahren und Anordnung zur Aufbereitung von gespeicherten Sprachsignalen Expired DE1472004C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US373751A US3369077A (en) 1964-06-09 1964-06-09 Pitch modification of audio waveforms

Publications (3)

Publication Number Publication Date
DE1472004A1 DE1472004A1 (de) 1969-10-09
DE1472004B2 DE1472004B2 (de) 1975-01-16
DE1472004C3 true DE1472004C3 (de) 1975-08-28

Family

ID=23473721

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1472004A Expired DE1472004C3 (de) 1964-06-09 1965-06-03 Verfahren und Anordnung zur Aufbereitung von gespeicherten Sprachsignalen

Country Status (3)

Country Link
US (1) US3369077A (de)
DE (1) DE1472004C3 (de)
GB (1) GB1068282A (de)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3828132A (en) * 1970-10-30 1974-08-06 Bell Telephone Labor Inc Speech synthesis by concatenation of formant encoded words
JPS5331323B2 (de) * 1972-11-13 1978-09-01
DE2349626C2 (de) 1973-10-03 1984-06-07 Robert Bosch Gmbh, 7000 Stuttgart Sprachaudiometer mit einem Tonwiedergabegerät
US3982070A (en) * 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
JPS6017120B2 (ja) * 1981-05-29 1985-05-01 松下電器産業株式会社 音素片編型音声合成方式
JPS602680B2 (ja) * 1981-06-18 1985-01-23 三洋電機株式会社 音声合成装置
US4601052A (en) * 1981-12-17 1986-07-15 Matsushita Electric Industrial Co., Ltd. Voice analysis composing method
US4618984A (en) * 1983-06-08 1986-10-21 International Business Machines Corporation Adaptive automatic discrete utterance recognition
US4757540A (en) * 1983-10-24 1988-07-12 E-Systems, Inc. Method for audio editing
JPH0754440B2 (ja) * 1986-06-09 1995-06-07 日本電気株式会社 音声分析合成装置
US5216744A (en) * 1991-03-21 1993-06-01 Dictaphone Corporation Time scale modification of speech signals
DE69231266T2 (de) * 1991-08-09 2001-03-15 Koninkl Philips Electronics Nv Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
EP0527527B1 (de) * 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
WO1993009531A1 (en) * 1991-10-30 1993-05-13 Peter John Charles Spurgeon Processing of electrical and audio signals
DE4425767C2 (de) * 1994-07-21 1997-05-28 Rainer Dipl Ing Hettrich Verfahren zur Wiedergabe von Signalen mit veränderter Geschwindigkeit
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US6775372B1 (en) 1999-06-02 2004-08-10 Dictaphone Corporation System and method for multi-stage data logging
US6252947B1 (en) 1999-06-08 2001-06-26 David A. Diamond System and method for data recording and playback
US6252946B1 (en) 1999-06-08 2001-06-26 David A. Glowny System and method for integrating call record information
US6246752B1 (en) 1999-06-08 2001-06-12 Valerie Bscheider System and method for data recording
US6249570B1 (en) * 1999-06-08 2001-06-19 David A. Glowny System and method for recording and storing telephone call information
US6869644B2 (en) * 2000-10-24 2005-03-22 Ppg Industries Ohio, Inc. Method of making coated articles and coated articles made thereby
FR2907586A1 (fr) * 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
CN109102821B (zh) * 2018-09-10 2021-05-25 思必驰科技股份有限公司 时延估计方法、系统、存储介质及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2921133A (en) * 1958-03-24 1960-01-12 Meguer V Kalfaian Phonetic typewriter of speech
US3133268A (en) * 1959-03-09 1964-05-12 Teleregister Corp Revisable data storage and rapid answer back system
US3158685A (en) * 1961-05-04 1964-11-24 Bell Telephone Labor Inc Synthesis of speech from code signals
US3183303A (en) * 1961-12-21 1965-05-11 Ibm System for voice answer-back from data processor

Also Published As

Publication number Publication date
DE1472004B2 (de) 1975-01-16
GB1068282A (en) 1967-05-10
US3369077A (en) 1968-02-13
DE1472004A1 (de) 1969-10-09

Similar Documents

Publication Publication Date Title
DE1472004C3 (de) Verfahren und Anordnung zur Aufbereitung von gespeicherten Sprachsignalen
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
DE2524497C3 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
DE2050512A1 (de) Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen
DE2104622C3 (de) Verfahren und Schaltungsanordnung zur Synchronisation von Signalen
DE1937464B2 (de) Sprachanalysiergeraet
DE2921012C2 (de) Vorrichtung zum Bestimmen der Fertigkeit des Sprechens einer zu untersuchenden Person
DE3246712C2 (de)
DE2649540A1 (de) Verfahren und anordnung zur sprachsynthese
EP0282779B1 (de) Verfahren und Vorrichtung zum Bearbeiten von Folgen von Werten, die auf einem Aufzeichnungsträger aufgezeichnet sind
EP0677835B1 (de) Verfahren zum Ermitteln einer Folge von Wörtern
DE1422056A1 (de) Phonetische Schreibmaschine
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE1549504A1 (de) Schaltanordnung fuer Datenuebertragungsgeraete
DE3232835C2 (de)
DE1160660B (de) Verfahren zur Umwandlung gesprochener Worte in eine optische Darstellung
DE69119005T2 (de) Verfahren und Einrichtung zur Kodierung eines Analogsignals mit Wiederholeigenschaft
DE1191124B (de) Verfahren und Anordnung zur zeitlichen Dehnung oder Verdichtung von Sprachlauten
DE2238136A1 (de) Gesteuerter signalprozessor mit verzoegerungsleitung fuer die klangreproduktion
EP0834860B1 (de) Verfahren zur Spracherkennung mit kontexabhängig modellierten Hidden Markov Modellen
DE1954436C3 (de) Verfahren zur verschlüsselten Sprachübertragung
EP0902417B1 (de) Verfahren und Einrichtung zur Spracherkennung von verwirrenden Wörtern
DE1940384C3 (de) Elektrisches Verfahren zum Harmonisieren des Grundtonverlaufs bei der Sprachsynthese und Schaltungsanordnung
DE10210978C1 (de) Verfahren und eine Vorrichtung zur Veränderung der zeitlichen Dauer und/oder der Tonhöhe eines diskreten Audiosignals, Computerprogramm und Datenträger

Legal Events

Date Code Title Description
SH Request for examination between 03.10.1968 and 22.04.1971
C3 Grant after two publication steps (3rd publication)