DE3855972T2 - Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen - Google Patents

Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen

Info

Publication number
DE3855972T2
DE3855972T2 DE3855972T DE3855972T DE3855972T2 DE 3855972 T2 DE3855972 T2 DE 3855972T2 DE 3855972 T DE3855972 T DE 3855972T DE 3855972 T DE3855972 T DE 3855972T DE 3855972 T2 DE3855972 T2 DE 3855972T2
Authority
DE
Germany
Prior art keywords
signal
speech
voice
toneless
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE3855972T
Other languages
English (en)
Other versions
DE3855972D1 (de
Inventor
Yoshiji Fujimoto
Atsunori Kitoh
Tomokazu Morio
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP62008783A external-priority patent/JP2582763B2/ja
Priority claimed from JP62008806A external-priority patent/JP2585241B2/ja
Application filed by Sharp Corp filed Critical Sharp Corp
Application granted granted Critical
Publication of DE3855972D1 publication Critical patent/DE3855972D1/de
Publication of DE3855972T2 publication Critical patent/DE3855972T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Sprachaufzeichnungsvorrichtung, bei der tonlose Teile eines Sprachsignals komprimiert werden, wenn das Sprachsignal zur Aufzeichnung analysiert und kodiert wird.
  • Im allgemeinen ist eine große Menge an Informationsgehalt erforderlich, um Sprachsignale auszudrücken. Da jedoch Sprachsignale eine erheblich Redundanz aufweisen, können sie, wenn sie komprimiert werden, mit hoher Effizienz übertragen und mit geringem Platzbedarf aufgezeichnet werden.
  • Sprachsignale weisen tonlose Pausenabschnitte auf, in denen kein Ton während des Sprechens gebildet wird. Wenn die Informationen in den tonlosen Abschnitten komprimiert werden, können die Sprachsignale daher mit hoher Effizienz übertragen werden und die Aufzeichnungskapazität des Speichers kann verkleinert werden. Genauer gesagt erstreckt sich bei normaler Sprechgeschwindigkeit der Tonabschnitt, in dem die Sprache tatsächlich erzeugt wird, über ungefähr 68% der gesamten Sprechzeit, und daher kann das Komprimieren der tonlosen Abschnitte eine erhebliche Menge an Sprachvolumen komprimieren. Bei herkömmlichen Sprachaufzeichnungs- und Wiedergabevorrichtungen wird pro einzelnem Datensatz durch eine Tonbeurteilungseinrichtung beurteilt, ob das Sprachsignal ein Tonsignal oder ein tonloses Signal ist, und anschließend wird der tonlose Abschnitt komprimiert. Wenn das Sprachsignal, dessen tonloser Abschnitt komprimiert ist, wiedergegeben wird, wird daher nachteihgerweise der Anfang oder das Ende eines Worts in der Sprachäußerung ausgelassen. Ferner kann es bei der herkömmlichen Vorrichtung vorkommen, daß ein schwacher kurzzeitiger Abschnitt des eingegebenen Sprachsignals (beispielsweise ein Doppelkonsonant im japanischen "Gakko", etc., oder ein assimilierter Ton) fälschlicherweise als tonlos beurteilt und entsprechend fälschlicherweise komprimiert wird. Daher wird bei der Wiedergabe der Doppelkonsonantenteil als vollkommen tonloser Abschnitt (beispielsweise Ga-ko im Japanischen) behandelt, wodurch fremdartige und merkwürdige Laute zu hören sind.
  • Um tonlose Pausenabschniffe ohne fremdartige und merkwürdige Hörerlehnisse zu komprimieren, schlägt DE-A-34 25 026 ein Verfahren und eine Vorrichtung vor, wobei die Vorrichtung einen Kodierer zum Analysieren und Kodieren von Sprachsignalen, eine Tonbeurteilungseinrichtung zum Beurteilen, ob es sich bei einem Sprachsignal um ein Tonsignal oder ein tonloses Signal handelt, und einen Sprachcodespeicher zum Aufzeichnen eines Sprachsignals aufweist. Die Vorrichtung nach DE-A-34 25 026 weist eine Verzögerungsschaltung auf, so daß der Anfang eines Worts nicht wegfällt. Ferner ist nach der Vorrichtung gemäß DE-A-34 25 026 eine Aufrechterhaltungsschaltung vorgesehen, die das Speichern eines Sprachsignals als Tonsignal über eine bestimmte Zeit nach dem letzten Tonsignal fortsetzt, so daß auch das Ende eines Worts nicht wegfällt.
  • Ein weiteres Verfahren und eine weitere Vorrichtung zum Komprimieren und Aufzeichnen von Sprachsignalen ist in US-A-4 376 874 bezeichnet. US-A-4 376 874 offenbart ein System zum Beurteilen eines Signals als über eine bestimmte Zeitspanne hinaus fortgesetzt tonlos, um das Ende jedes Wortes zu bestimmen.
  • Beide Verfahren und Vorrichtungen weisen noch immer den Nachteil auf, daß ihre kodierten Signale erheblichen Platz beanspruchen.
  • Es ist die Aufgabe der vorliegenden Erfindung, eine verbesserte Sprachaufzeichnungsvorrichtung zu schaffen, bei der der tonlose Abschnitt des Sprachsignals durch Echtzeit weiter komprimiert werden kann, und bei der gleichzeitig selbst der Anfang oder das Ende eines Wortes oder eines kurzzeitigen schwachen Abschnitts nicht als tonloser Abschnitt aufgezeichnet wird, so daß das Sprachsignal ohne ungewöhnlichen Klang für den Hörer wiedergegeben werden kann.
  • Diese Aufgabe wird erfindungsgemäß mit den Merkmalen des Patentanspruchs 1 gelöst.
  • Nach der vorliegenden Erfindung weist die Sprachaufzeichnungsvorrichtung mit Kompression tonloser Abschnitte auf: einen Kodierer zum Analysieren und Kodieren eines Sprachsignals, eine Tonbeurteilungseinrichtung zum Beurteilen, ob das Sprachsignal ein Tonsignal oder ein tonloses Signal ist, einem Sprachkodespeicher zum Aufzeichnen von Sprachsignalen, zwei Arten von Adressenzählern die von der Tonbeurteilungseinrichtung derart gesteuert werden, daß, wenn das Sprachsignal ein Tonsignal ist, die Adresse des Sprachkodespeichers weitergesetzt wird, während bei einem tonlosen Sprachsignal die Adresse des Sprachkodespeichers zurückgesetzt wird.
  • Die ertindungsgemäße Sprachaufzeichnungsvorrichtung mit Kompression des tonlosen Abschnitts weist ferner auf: eine Verzögerungseinrichtung zum Verzögern des in dem Sprachkodespeicher zu speichernden kodierten Signals, dessen Adresse durch den Adresserhähler bestimmt ist, in bezug zu einem vorliegenden, in die Beurteilungseinrichtung eingegebenen Sprachsignal, wobei die Verzögerungseinrichtung durch Verwendung eines Teils des Sprachkodespeichers als zirkulierenden Speicher ausgebildet sein kann, so daß das Speichern des vorhergehenden Sprachsignals in den Sprachkodespeicher durch die Tonbeurteilungseinrichtung gesteuert wird. Wenn das Sprachsignal eingegeben wird, erkennt die Tonbeurteilungseinrichtung, ob das eingegebene Sprachsignal ein Tonsignal oder ein tonloses Signal ist. Als Ergebnis dieser Beurteilung wird, wenn das Sprachsignal als tonlos beurteilt wird, die Adresse des Sprachkodespeichers zurückgesetzt und nicht weitergesetzt, und daher wird das kodierte Sprachsignal des tonlosen Abschnitts nicht im Sprachkodespeicher gespeichert. Somit kann der tonlose Abschnitt im Sprachkodespeicher in Echtzeit komprimiert werden, um so die Aufzeichnungsmenge im Speicher zu verringern. Wenn das nach dem tonlosen Signal eingegebene Sprachsignal von der Tonbeurteilungseinrichtung als Tonsignal erkannt wird, wird das Sprachsignal, das von der Verzögerungseinrichtung über den Zeitpuhkt der Beurteilung durch die Tonbeurteilungseinrichtung verzögert wurde, durch den Kodierer kodiert, das heißt, das Sprachsignal wird zu dem Zeitpunkt vor dem Zeitpunkt zurückgesetzt, zu dem das nach dem tonlosen Signal eingegebene Sprachsignal als Tonsignal erkannt wurde, um zur Aufzeichnung im Sprachkodespeicher kodiert zu werden, wobei die Adresse des Sprachkodespeichers durch den Adressenzähler weitergesetzt wird. Daher kann bei der erfindungsgemäßen Sprachaufzeichnungsvorrichtung mit Kompression tonloser Signale das Sprachsignal ohne Wegfall des Anfangs eines Wortes aufgezeichnet werden, wodurch sich keine ungewöhnlichen Laute bei der Wiedergabe des Sprachsignals ergeben.
  • Diese und andere Aufgaben und Merkmale der vorliegenden Erfindung ergeben sich aus der nachfolgenden Beschreibung bevorzugter Ausfürungsbeispiele derselben unter Bezugnahme auf die zugehörigen Zeichnungen, welche zeigen:
  • Fig. 1 - ein Blockdiagramm einer zum Komprimieren tonloser Signale ausgebildeten Sprachaufzeichnungsvorrichtung, und
  • Fig. 2 - ein Diagramm zur Erläuterung der Funktionsweise der Vorrichtung von Fig. 1.
  • Vor der weiteren Beschreibung der vorliegenden Erfindung sei darauf hingewiesen, daß gleiche Teile in sämtlichen zugehörigen Zeichnungen mit gleichen Bezugszeichen versehen sind.
  • In folgenden wird unter Bezugnahme auf die Fign. 1 und 2 eine erfindungsgemäße Sprachaufzeichnungsvorrichtung mit Kompression tonloser Signale beschrieben.
  • Fig. 1 zeigt den schematischen Aufbau einer Sprachaufzeichnungsvorrichtung mit Kompression tonloser Signale, die aufweist: eine Verzögerungseinrichtung 111, einen Kodierer 112, einen ersten Adressenzähler 113, einen Sprachkodespeicher 114, eine Tonbeurteilungseinrichtung 115, einen Zeitzähler 116, eine Zustandsspeicherschaltung 117 und einen zweiten Adressenzähler 119. Der erste Adressenzähler 113 ist derart ausgebildet, daß er die Adresse des Sprachkodespeichers 114 bestimmt. Bei jeder Eingabe des Sprachkodes in den Sprachkodespeicher 114 wird die Adresse des Sprachkodespeichers 114 um die Bitlänge des Sprachkodes weitergesetzt. Der zweite Adressenzähler 119 ist ein Register, das ausschließlich zum Speichern des Adressenwertes vorgesehen ist. Ferner beurteilt die Beurteilung 115 nicht blockweise, sondern pro Abtastung beispielsweise auf der Basis eines Vergleichs zwischen dem Amplitudenwert der eingegebenen Sprachwellenform und dem Schwellenwert als einer Erkennungsreferenz.
  • Die Sprachaufzeichnungsvorrichtung mit dem zuvor beschriebenen Aufbau arbeitet wie folgt.
  • Vor dem Aufzeichnen werden sowohl der erste als auch der zweite Adressenzähler 113 und 119 auf die Startposition des Sprachkodespeichers 114 initialisiert. Anschließend wird der Zeitzähler 116 initialisiert, um die Zustandsspeicherschaltung 117 auf die Tonlos-Position einzustellen. Befindet sich die Zustandsspeicherschaltung 117 in der Tonlos-Position, wird der Kodierer 112 im angehaltenen Zustand gehalten.
  • A) Erkennung des Anfangs eines Wortes
  • Wenn die Sprachwellenform in den Eingabeanschluß eingegeben wird, werden die Daten um die eingegebene Sprachwellenform in die Verzögerungseinrichtung 111 und gleichzeitig auch in die Tonbeurteilungseinrichtung 115 eingegeben. Der Zeitzähler 116 zählt die Tonlose Zeit, bis die Tonbeurteilungseinrichtung 115 erkennt, daß das eingegebene Sprachsignal ein Tonsignal ist. Wenn die Tonbeurteilungseinrichtung 115 erkennt, daß die Amplitude der Wellenform in dem Tonbereich höher ist als der Schwellenwert, und das eingegebene Sprachsignal daher ein Tonsignal ist, wird die Zustandsspeicherschaltung 117 auf die Tonposition eingestellt. Gleichzeitig werden ein Signal (beispielsweise eine Tonlos-Markierung), das angibt, das die Wellenform tonlos ist, bis ein Ton erkannt wird, und der Inhalt, d.h. die Länge des tonlosen Zeitraums, kodiert, um diese an einer vorbestimmten Adresse des Sprachkodespeichers 114 gemäß einem Befehl des ersten Adressenzählers 113 zu speichern. Anschließend wird der Zeitzähler 116 initialisiert und gleichzeitig ein Startsignal an den Kodierer 112 ausgegeben. Demzufolge kodiert der Kodierer 112 ein Sprachsignal, das die Verzögerungseinrichtung 111 passiert hat, als um beispielsweise eine Verzögerungszeit zu verzögerndes Signal. Dementsprechend wird ein Signal das um die Verzögerungszeit τ vorausgeht, kodiert. In der zuvor beschriebenen Art wird die Kodierung von der Wellenform an begonnen, die um die Verzögerungszeit τ vor dem Zeitpunkt vorliegt, zu dem die Wellenform als Tonwellenform erkannt wird, und dementsprechend wird verhindert, daß der Wortanfang wegfällt (das heißt, es wird verhindert, daß der Anfang eines Wortes fälschlicherweise beim Kodieren als tonlos beurteilt wird).
  • Eine genauere Beschreibung der Operationen zum Erkennen des Anfangs eines Wortes werden in Zusammenhang mit Figur 2 beschrieben. Der Amplitudenwert der eingegebenen Wellenform überschreitet den Schwellenwert am Punkt A und die Tonbeurteilungseinrichtung 115 stellt fest, daß das eingegebene Sprachsignal ein Tonsignal ist, das den Kodierer 112 startet. Obwohl der Kodierer 112 mit dem Kodieren vom Zeitpunkt A an beginnt, beginnt die Kodierung des eingegebenen Sprachsignals aufgrund der Verzögerung des in den Kodierer 112 eingegebenen Sprachsignals um den Zeitraum τ zu einem Zeitpunkt A', der um die Zeit τ Nach dem Zeitpunkt A liegt. Daher werden die Sprachsignale unterhalb des Schwellenwertes zwischen den Zeitpunkten A und A' als Tonsignale kodiert, ohne wegzufallen.
  • Während der Kodierer 112 die Kodierung durchführt, sobald die Tonbeurteilungseinrichtung 115 das eingegebene Sprachsignal als Tonsignal erkennt, erkennt die Tonbeurteilungseinrichtung 115, ob die gegenwärtig eingegebene Sprachäußerung, die nicht verzogert ist (nämlich, die gegenüber dem gerade kodiert werdenden Signal um den Zeitraum τ vorausliegende Sprachäußerung) ein Tonsignal oder tonlos ist. Wenn die gegenwartig eingegebene Sprachäußerung von der Tonbeurteilungseinrichtung 115 als tonlos beurteilt wird, beginnt der Zeitzähler 116 mit dem Aufwärtszählen, welches eine der Infomationen darüber darstellt, daß das Sprachsignal tonlos ist. Wenn andererseits das gegenwärtige Sprachsignal als Tonsignal erkannt wird, wird der Inhalt des Zeitzählers 116 initialisiert. Selbst wenn der Amplitudenwert durch die Schwingung der Sprachsignalwelle im efekiiven Ton-Intervall, beispielsweise zwischen den Punkten A und B der Fig. 2, zeitweilig geringer als der Schwellenwert ist, wie am Punkt E, so wird der Amplitudenwert am nächsten Punkt F unmittelbar wieder höher als der Schwellenwert, und daher beendet der Zeitzähler 116 sofort das Aufwärtszählen, um so eine falsche Beurteilung des Ton-Intervalls als tonlos zu verhindern.
  • B) Erkennung des Wortendes
  • Zum Zeitpunkt B wird das eingegebene Sprachsignal, da der Amplitudenwert niedriger als der Schwellenwert ist, als tonlos beurteilt, und dementsprechend beginnt der Zeitzähler 116 die tonlose Zeit zu zählen. Wenn der Amplitudenwert der eingegebenen Wellenform über einen Zeitraum ta weiterhin niedriger als der Schwellenwert ist, stellt die Tonbeurteilungseinrichtung 115 fest, daß das vorliegende Sprachsignal ein mögliches Ende eines Wortes darstellt, weshalb sie ein Signal an die Zustandsspeicherschaltung 117 ausgibt, um einen Schalter 118 mit einem Anschluß a zu verbinden. Infolgedessen geht der gegenwärtige Inhalt des ersten Adressenzählers 113 in den zweiten Adressenzähler 119 über. Wenn das Sprachsignal für einen Zeitraum tb weiterhin als tonlos erkannt wird, stellt die Tonbeurteilungseinrichtung 115 anschließend fest, daß der Zeitpunkt nach dem Zeitraum ta das Ende des Wortes ist. Daher wird der Zeitzähler 116 initialisiert und gleichzeitig die Zustandsspeicherschaltung 117 auf die Tonlos-Position eingestellt, um so den Kodierer 112 zu stoppen. Ferner wird der Schalter 118 mit einem Anschluß b verbunden, um den Adressenwert, der dem Zeitpunkt entspricht, zu dem das eingegebene Sprachsignal als ein mögliches Ende des Wortes beurteilt wurde (der Wert befindet sich im zweiten Adressenzähler 119), in den ersten Adressenzähler 113 zurückzuführen.
  • Im folgenden wird das Erkennen des Endes eines Wortes unter Bezugnahme auf Fig. 2 genauer beschrieben. Die Tonbeurteilungseinrichtung 115 stellt anhand der Sprachwellenform desselben zum Zeitpunkt B fest, daß das eingegebene Sprachsignal tonlos ist. Der Inhalt des ersten Adressenzählers 113 ist zum Zeitpunkt C geschützt, welcher um den Zeitraum ta gegenüber dem Zeitpunkt B für das mögliche Ende des Wortes später liegt. Zu diesem Zeitpunkt C ist die gegenwärtig kodierte Sprachäußerung um den Zeitraum verzögert und dementsprechend ist der Inhalt des ersten Adressenzählers 113 eine Adresse, die einem Zeitpunkt C' entspricht, die um den Zeitraum τ gegenüber dem Zeitpunkt C nach dem Ablauf des Zeitraums ta seit dem Zeitpunkt B versetzt ist. Wenn das eingegebene Sprachsignal über den Zeitraum tb weiterhin als tonlos beurteilt wird, wird der Inhalt des ersten Adressenzählers 113 auf eine Adresse weitergesetzt, die einem Zeitpunkt D' entspricht, der um den Zeitraumτvom Zeitpunkt D versetzt ist, welcher um den Zeitraum tb nach dem Zeitpunkt C folgt. Zu diesem Zeitpunkt D wird das genannte mögliche Ende des Worts als das Ende des Wortes bestimmt, wobei der Inhalt des zweiten Adressenzählers 119 an den ersten Adressenzähler 113 übertragen wird, so daß der Inhalt des ersten Adressenzählers 113, der auf den Sprachkodespeicher 114 Zugriff hat, zu der dem Zeitpunkt C' entsprechenden Adresse zurückgeführt wird. Dementsprechend wird im Sprachkodespeicher 114, in dem der Sprachkode geschrieben ist, die Adresse zum Zeitpunkt D', der um den Zeitraum τ vom Zeitpunkt D versetzt ist, nach Ablauf der Zeitspanne (ta + tb) auf die Adresse zum Zeitpunkt C' rückgesetzt Anschließend wird der Vorgang auf den Wortanfang gerichtet. Auf diese Weise kann der tonlose Abschnitt zwischen den Zeitpunkten C' und D' in Echtzeit komprimiert werden und die Speicherkapazität kann verringert oder der Speicher in größerem Umfang effektiv genutzt werden.
  • Darüber hinaus wird selbst das Sprachsignal unterhalb des Schwellenwerts zwischen den Zeitpunkten B und C' nicht ausgelasen und wird als Tonsignal kodiert. In einem solchen zuvor beschriebenen Fall ist es erforderlich, um das Sprachsignal im Abschnitt zwischen den Zeitpunkten B und C' ohne Auslassung zu kodieren, daß die Zeiträume τ und ta das Verhältnis ta> τ bilden, und daß die Differenz ta-τ zwischen diesen (nämlich der Zeitraum zwischen den Zeitpunkten B und C') unter Berücksichtigung der Länge des Wortendes eingestellt wird. Ferner wird aufgrund der Einstellung des Zeitraums ta selbst ein solch kurzer und schwacher Abschnitt wie der Doppelkonsonant im Tonabschnitt nicht als tonloser Abschnitt beurteilt.
  • Bei der Wiedergabe des im Sprachkodespeicher aufgezeichneten Sprachkodes wird der Sprachkode aus dem Sprachkodespeicher 114 ausgelesen, um zu beurteilen, ob es sich um eine Tonlos-Markierung handelt. Handelt es sich bei dem ausgelesenen Kode um eine Tonlos-Markierung, wird der nächste zu speichernde Datensatz als ein Kode ausgelesen, der die Länge der tonlosen Zeit angibt. Als Wiedergabesignal für die Länge der tonlosen Zeit wird Null ausgegeben. Ist der ausgelesene Kode keine Tonlos-Markierung, wird der ausgelesene Kode in den Dekodierer zur Ausgabe einer synthetisierten Wellenform eingegeben.
  • Wie zuvor beschrieben, kann der tonlose Abschnitt einer Sprachäußerung im Sprachkodespeicher 114 erfindungsgemäß in Echtzeit komprimiert werden, um so die Speicherkapazität zu verringern. Ferner fällt selbst der schwache Anfang eines Wortes nicht weg, sondern wird kodiert, so daß sich bei der Wiedergabe des Sprachkodes kein ungewöhnlicher Klang einstellt.
  • Da die Tonbeurteilungseinrichtung 115 das Ende des Wortes feststellt, wenn der tonlose Zustand über einen bestimmten Zeitrum länger als die Verzögerungszeit der Verzögerungseinrichtung anhält, wird bei dem vorhergehenden Ausführungsbeispiel selbst das Ende des Worts oder ein Doppelkonsonantabschnitt nicht als tonlos beurteilt und ausgelassen, sondern als ein Tonabschnitt kodiert. Ferner kann die Verzögerungseinrichtung durch gemeinsame Verwendung eines Teils des Sprachkodespeichers realisiert werden, wodurch die Hardware der Vorrichtung vereinfacht wird.
  • Wie sich aus der vorhergehenden Beschreibung ergibt, sind bei der Sprachaufzeichnungsvorrichtung mit Komprimierung von tonlosen Signalen eine Tonbeurteilungseinrichtung, ein Sprachkodespeicher und Adressenzähler vorgesehen, die durch die Tonbeurteilungseinrichtung derart gesteuert sind, daß die Adresse des Sprachkodespeichers weitergesetzt wird, wenn das Sprachsignal ein Tonsignal ist, während die Adresse des Sprachkodespeichers rückgesetzt wird, wenn das Sprachsignal ein tonloses Signal ist. Daher kann der tonlose Abschnitt in Echtzeit komprimiert werden. Ferner ist eine Verzögerungseinrichtung vorgesehen, die das kodierte Signal im Sprachkodespeicher, dessen Adresse durch den Adressenzähier bestimmt ist, gegenüber dem in die Tonbeurteilungseinrichtung eingegebenen Sprachsignal verzögert, und die Tonbeurteilungseinrichtung kann somit das Speichern des vorhergehenden Sprachsignals in den Sprachkodespeicher steuern. Somit kann selbst ein schwacher Anfang eines Wortes als Tonabschnitt kodiert werden. Vorteilhafterweise kann das Sprachsignal ohne ungewöhnlichen Klang wiedergegeben werden.

Claims (2)

1. Sprachaufzeichnungsvorrichtung, die in der Lage ist, tonlose Signale zu komprimieren, mit:
- einem Kodierer (112) zum Analysieren und Kodieren eines Sprachsignals,
- einer Tonbeurteilungseinrichtung (115) zum Beurteilen, ob das Sprachsignal ein Tonsignal oder ein tonloses Signal ist,
- einem Sprachkodespeicher (114) zum Aufzeichnen des kodierten Sprachsignals,
- einem ersten Adressenzähler (113) zum Bestimmen der Adresse des Sprachkodespeichers (114), der von der Tonbeurteilungseinrichtung (115) derart gesteuert ist, daß, wenn das Sprachsignal ein Tonsignal ist, die Adresse des Sprachkodespeichers (114) weitergesetzt wird, während bei einem tonlosen Sprachsignal die Adresse des Sprachkodespeichers (114) nicht weitergesetzt wird, und
- einer Verzögerungseinrichtung (111) zum Verzögern des in dem Sprachkodespeicher (114) zu speichernden kodierten Signals, dessen Adresse durch den ersten Adressenzähler (113) bestimmt ist, in bezug zu einem vorliegenden, in die Beurteilungseinrichtung (115) eingegebenen Sprachsignal, wobei der Sprachkodespeicher (114) derart ausgebildet ist, daß er das Sprachsignal speichert, das zu einem Zeitpunkt eingegeben wurde, der dem vorliegenden Sprachsignal um einen Zeitraum voraus liegt, welcher der von der Verzögerungseinrichtung bewirkten Verzögerung entspricht,
gekennzeichnet durch
einen zweiten Adressenzähler (119), welcher ein Register ist, das mit dem ersten Adressenzähler (113) zusammenarbeitet, um den Inhalt des ersten Adressenzählers (113) entsprechend einer von der Tonbestimmungseinrichtung (115) gelieferten Angabe, daß das Sprachsignal ein mögliches tonloses Signal ist, zu speichern, wobei der zweite Adressenzähler (119) derart ausgebildet ist, daß er seinen Inhalt an den ersten Adressenzähler (113) entsprechend einer anderen von der Tonbeurteilungseinrichtung (115) gelieferten Angabe, daß das Sprachsignal als tonloses Signal bestätigt wurde, zurückführt, wobei die Tonbeurteilungseinrichtung (115) derart ausgebildet ist, daß sie die Angabe, daß das Sprachsignal ein mögliches tonloses Signal ist, liefert, wenn das Sprachsignal während einer ersten Zeitspanne (ta) als tonlos beurteilt wurde, und daß sie die andere Angabe, daß das Sprachsignal als tonloses Signal bestatigt wird, liefert, wenn das mögliche Signal während einer zweiten Zeitspanne (tb) nach Ablauf der ersten Zeitspanne (ta) weiterhin als tonlos erkannt wird.
2. Sprachaufzeichnungsvorrichtung nach Anspruch 1, bei der die Verzögerungseinrichtung (111) durch Verwendung eines Teils des Sprachkodespeichers (114) als zirkulierender Speicher gebildet ist.
DE3855972T 1987-01-16 1988-01-14 Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen Expired - Fee Related DE3855972T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP62008783A JP2582763B2 (ja) 1987-01-16 1987-01-16 音声分析合成装置
JP62008806A JP2585241B2 (ja) 1987-01-17 1987-01-17 無音圧縮音声録音装置

Publications (2)

Publication Number Publication Date
DE3855972D1 DE3855972D1 (de) 1997-09-04
DE3855972T2 true DE3855972T2 (de) 1998-03-05

Family

ID=26343372

Family Applications (2)

Application Number Title Priority Date Filing Date
DE3855972T Expired - Fee Related DE3855972T2 (de) 1987-01-16 1988-01-14 Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen
DE3888547T Expired - Fee Related DE3888547T2 (de) 1987-01-16 1988-01-14 Gerät zur Sprachanalyse und -synthese.

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE3888547T Expired - Fee Related DE3888547T2 (de) 1987-01-16 1988-01-14 Gerät zur Sprachanalyse und -synthese.

Country Status (3)

Country Link
US (1) US4944012A (de)
EP (2) EP0537804B1 (de)
DE (2) DE3855972T2 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0314383A (ja) * 1989-06-13 1991-01-23 Canon Inc 符号化装置
US5271089A (en) * 1990-11-02 1993-12-14 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
JPH04285765A (ja) * 1991-03-13 1992-10-09 Casio Comput Co Ltd デジタルレコーダ
JPH0512896A (ja) * 1991-07-08 1993-01-22 Sharp Corp 音声録音再生装置
US5621857A (en) * 1991-12-20 1997-04-15 Oregon Graduate Institute Of Science And Technology Method and system for identifying and recognizing speech
JPH06232826A (ja) * 1993-02-08 1994-08-19 Hitachi Ltd 音声差分pcmデータ伸長方法
US6205097B1 (en) 1999-01-06 2001-03-20 Visteon Global Technologies, Inc. Method of enhanced data compression rate for a CD player
US6243329B1 (en) 1999-01-06 2001-06-05 Visteon Global Technologies, Inc. Method of enhanced compression rate for a multi-disc CD player
JP4407305B2 (ja) * 2003-02-17 2010-02-03 株式会社ケンウッド ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム
GB2399176B (en) * 2003-03-05 2006-01-04 Boc Group Plc Event detection algorithm
EP1513137A1 (de) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Sprachverarbeitungssystem und -verfahren mit Multipuls-Anregung

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2355676C3 (de) * 1973-11-07 1979-01-18 Standard Elektrik Lorenz Ag, 7000 Stuttgart Schaltungsanordnung zur Übertragung von Signalen mit Differenz-Pulscodemodulation (DPCM)
US4280192A (en) * 1977-01-07 1981-07-21 Moll Edward W Minimum space digital storage of analog information
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
JPS6016019B2 (ja) * 1977-11-22 1985-04-23 日本ビクター株式会社 音声信号の時間圧縮、伸長装置
JPS5550738A (en) * 1978-10-05 1980-04-12 Nec Corp Decoding method of adaptability forecasting type differential pulse code and its unit
US4376874A (en) * 1980-12-15 1983-03-15 Sperry Corporation Real time speech compaction/relay with silence detection
US4586191A (en) * 1981-08-19 1986-04-29 Sanyo Electric Co., Ltd. Sound signal processing apparatus
US4449190A (en) * 1982-01-27 1984-05-15 Bell Telephone Laboratories, Incorporated Silence editing speech processor
CA1208789A (en) * 1983-11-25 1986-07-29 Peter E. Chow Adpcm encoder/decoder with improved tracking
DE3411485A1 (de) * 1984-03-28 1985-10-03 Siemens AG, 1000 Berlin und 8000 München Verfahren zur erfassung der grenzen von signalen, die vor einem hintergrundsignalgemisch auftreten
DE3425026C2 (de) * 1984-07-06 1987-01-08 Siemens AG, 1000 Berlin und 8000 München Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen
US4751736A (en) * 1985-01-31 1988-06-14 Communications Satellite Corporation Variable bit rate speech codec with backward-type prediction and quantization
US4802221A (en) * 1986-07-21 1989-01-31 Ncr Corporation Digital system and method for compressing speech signals for storage and transmission

Also Published As

Publication number Publication date
DE3888547D1 (de) 1994-04-28
EP0537804B1 (de) 1997-07-23
EP0275099B1 (de) 1994-03-23
EP0537804A3 (en) 1993-06-09
DE3888547T2 (de) 1994-06-30
EP0537804A2 (de) 1993-04-21
EP0275099A2 (de) 1988-07-20
EP0275099A3 (en) 1990-09-19
US4944012A (en) 1990-07-24
DE3855972D1 (de) 1997-09-04

Similar Documents

Publication Publication Date Title
DE3534064C2 (de)
DE3117920C2 (de) Verfahren und Vorrichtung zur angenäherten Darstellung eines Analogsignals mit reduzierter Datenmenge
DE3202913C2 (de) Verfahren und Vorrichtung zur Verarbeitung eines Grauwertkomponenten enthaltenden Faksimilesignals
DE3855972T2 (de) Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen
DE69005010T2 (de) Einrichtung zur Sprachkodierung und -Dekodierung.
DE3742098A1 (de) Verfahren und vorrichtung zur kompression und rekonstruktion von daten
DE2034623C2 (de) Verfahren für das Erkennen von Sprachsignalen in Rauschen
DE3927580C2 (de)
DE69127134T2 (de) Sprachkodierer
DE9006717U1 (de) Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
DE3426877A1 (de) Verfahren und schaltungsanordnung zum aufzeichnen von adressensignalen auf einem magnetband zur kennzeichnung von progammsegmenten
DE3411881A1 (de) Verfahren und schaltungsanordnung zum uebertragen von mit einer ersten bitrate auftretenden datensignalbits in einem bitstrom mit einer gegenueber der ersten bitrate hoeheren zweiten bitrate
DE69324732T2 (de) Selektive Anwendung von Sprachkodierungstechniken
DE69623771T2 (de) Verfahren und vorrichtung zur kodierung von audiosignalen und verfahren und vorrichtung zur dekodierung von audiosignalen
DE3149134A1 (de) Verfahren und vorrichtung zur bstimmung von sprachendpunkten
DE3785685T2 (de) Anordnung zur Dekodierung eines digitalen Signals.
DE69415571T2 (de) Verfahren und Vorrichtung zur Detektion von pulsförmigen Interferenzsignalen in einen Tonsignal
AT403969B (de) Verfahren zur kompression eines analogen signals
DE3853369T2 (de) Steuerungssystem für einen Speicher.
DE3215868C2 (de)
DE69614799T2 (de) Übertragungssystem und -verfahren für die sprachkodierung mit verbesserter detektion der grundfrequenz
DE2838228B2 (de) Verfahren zum Synchronisieren einer Datenbitfolge
DE69229679T2 (de) Übertragungssystem für kodierte sprachsignale und/oder sprachbanddaten
DE4342425A1 (de) Verfahren und Anordnung zum Übertragen von Sprachsignalen
EP0189860B1 (de) Verfahren zur Bildfehlerkorrektur

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee