DE19629184A1 - Sprachgesteuertes Aufzeichnungsgerät - Google Patents

Sprachgesteuertes Aufzeichnungsgerät

Info

Publication number
DE19629184A1
DE19629184A1 DE19629184A DE19629184A DE19629184A1 DE 19629184 A1 DE19629184 A1 DE 19629184A1 DE 19629184 A DE19629184 A DE 19629184A DE 19629184 A DE19629184 A DE 19629184A DE 19629184 A1 DE19629184 A1 DE 19629184A1
Authority
DE
Germany
Prior art keywords
recording
voice
speech
setting
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19629184A
Other languages
English (en)
Other versions
DE19629184C2 (de
Inventor
Hideo Okano
Yuichi Saito
Masatoshi Tobinai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP7198741A external-priority patent/JPH0950655A/ja
Priority claimed from JP7201933A external-priority patent/JPH0950364A/ja
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Publication of DE19629184A1 publication Critical patent/DE19629184A1/de
Application granted granted Critical
Publication of DE19629184C2 publication Critical patent/DE19629184C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/20Driving; Starting; Stopping; Control thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

Die Erfindung betrifft ein sprachgesteuertes Aufzeichnungsgerät, insbesondere ein sprachgesteuertes Aufzeichnungsgerät, das einen Aufzeichnungsvorgang in Abhängigkeit von einem vorbestimmten Sprachpegel startet bzw. stoppt.
In den letzten Jahren wurde ein Aufzeichnungsgerät zur Verfügung gestellt, bei dem ein durch ein Mikrophon oder dergleichen erhaltenes Sprachsignal in ein digitales Signal umgewandelt, das digitale Signal z. B. in einem Halbleiterspeicher abgespeichert, das Sprachsignal aus dem Halbleiterspeicher zur Umwandlung in ein analoges Signal bei einem Wiedergabevorgang ausgelesen und das analoge Signal mittels eines Lautsprechers oder dergleichen als Sprache ausgegeben wird (vergleiche japanische Patentveröffentlichung Nr. 63-259700).
Bei dem vorstehend beschriebenen Aufzeichnungsgerät wird die Menge an erzeugten Daten so weit wie möglich reduziert, in dem eine hocheffiziente Codierung bezüglich des digitalen Sprachsignals durchgeführt wird, um die im Halbleiterspeicher aufgezeichnete Datenmenge zu verringern.
Um eine hocheffiziente Codierung zu erhalten, wird auch ein Komprimierungsprozeß in Bezug auf einen geräuschlosen Teil durchgeführt. Es ist allgemein bekannt, daß ein üblicher Dialog einen geräuschlosen Teil einschließt und die Bitrate durch Komprimieren des geräuschlosen Teils um etwa 30% verringert werden kann.
Als Sprachaufzeichnungsgerät, z. B. als Bandaufzeichnungsgerät für die Aufnahme einer Konferenz, ist ein Aufzeichnungsgerät bekannt, das automatisch den Aufzeichnungsvorgang in Erwiderung auf die Sprache startet und diesen nach einer vorbestimmten Zeitperiode stoppt, nachdem die Sprache unterbrochen wurde. In einem Aufzeichnungsbereitschaftszustand startet das Aufzeichnungsgerät einen Aufzeichnungsvorgang, falls dieses eine Sprache empfängt, die einen vorbestimmten Startpegel (durch den Benutzer einstellbar) aufweist. Hat die eingegebene Sprache einen Pegel, der niedriger als der vorbestimmte Pegel ist, so unterbricht das Aufzeichnungsgerät nach 3 bis 4 Sekunden den Aufzeichnungsvorgang.
Falls die Sprache im einzelnen einen Pegel aufweist, der gleich oder höher als der vorbestimmte Startpegel ist, so bestimmt das Aufzeichnungsgerät daß ein "Ton" vorliegt, und der Aufzeichnungsvorgang beginnen soll. Weist die eingegebene Sprache jedoch einen Pegel auf, der niedriger als der vorbestimmte Pegel ist, so bestimmt das Aufzeichnungsgerät, daß eine "Tonpause" vorliegt und der Aufzeichnungsvorgang gestoppt werden soll.
Bei dem vorstehend beschriebenen Aufzeichnungsgerät treten jedoch die folgenden Nachteile auf; so wird z. B. der Aufzeichnungsvorgang durch ein Umgebungsgeräusch, wie z. B. den beim Schließen bzw. Öffnen einer Tür oder Husten erzeugten Ton, irrtümlicherweise gestartet und das Aufzeichnungsgerät kann nicht gestoppt werden, falls dieses in Folge des Umgebungsgeräusches gestoppt werden müßte. Zusätzlich wird ungünstigerweise der Anfangsteil beim Start eines Aufzeichnungsvorgangs abgeschnitten.
Bei einem sprachgesteuerten Aufzeichnungsgerät mit automatischer Sprachstartfunktion wird der Start/Stopp- Pegel des Aufzeichnungsvorganges in dem Gerät selbst festgelegt oder der Benutzer muß einen Lautstärke- oder Empfindlichkeitseinstellschalter im voraus auf den gewünschten Startpegel einstellen.
Mit Hilfe einer Start/Stopp-Pegeleinstelleinrichtung ist es jedoch nicht einfach einen geeigneten Pegel durch Erfassen der sich stets ändernden Sprache festzulegen, so daß versuchsweise ein Aufzeichnungsvorgang durchgeführt werden muß, um den geeigneten Startpegel zu finden.
Bei dem vorstehend beschriebenen sprachgesteuerten Aufzeichnungsgerät muß als Einstellschalter zur Inbetriebsetzung der sprachgesteuerten Aufzeichnungsfunktion ein eigenes Betätigungselement vorgesehen werden. Falls kein eigenes Betätigungselement verwendet wird, so wird als Schalter zum Einstellen der sprachgesteuerten Aufzeichnungsfunktion auch ein Einstellschalter verwendet, der ansonsten einer schnellen Abhörwiedergabe dient. In diesem Fall muß ein vorbestimmter Vorgang zum Inbetriebsetzen der sprachgesteuerten Aufzeichnungsfunktion ausgeführt werden.
Falls den oben beschriebenen Funktionen entsprechende, eigene Betätigungselemente unabhängig angeordnet werden, nimmt die Größe des Geräts zu, was ein kompaktes Design begrenzt. Außerdem wird bei einer Zunahme der Bauteile die Verarbeitbarkeit beim Zusammenbauvorgang verschlechtert, so daß die Herstellungskosten in nachteiliger Weise steigen.
Falls das Betätigungselement oder dergleichen für die sprachgesteuerte Aufzeichnungsfunktion auch als Betätigungselement für eine weitere Funktion verwendet wird, wird bei Benutzung des Geräts die Bedienbarkeit jedes Betätigungselements verschlechtert.
Falls das Betätigungselement oder dergleichen für die sprachgesteuerte Aufzeichnungsfunktion auch als Betätigungselement für eine weitere Funktion verwendet wird, wird im allgemeinen ein mechanischer Schiebeschalter mit festen Kontakten oder dergleichen verwendet. In diesem Fall ist das Aufzeichnungsgerät auf einen Betriebsartzustand festgelegt, der durch das vorstehende Betätigungselement eingestellt ist, falls kein Vorgang, wie z. B. ein Betriebsartumschaltvorgang durchgeführt wird.
Demzufolge muß, falls die Benutzung des obigen Aufzeichnungsgerätes in einer anderen Betriebsart, als der Betriebsart, in der das Aufzeichnungsgerät vorher verwendet wurde, begonnen werden soll, vor Beginn der Benutzung ein Schaltvorgang oder dergleichen zum Einstellen der gewünschten Betriebsart durchgeführt werden. D. h. der Vorbereitungsvorgang vor Beginn der Benutzung des Aufzeichnungsgeräts ist in nachteiliger Weise mühsam.
Es ist Aufgabe der Erfindung, ein sprachgesteuertes Aufzeichnungsgerät vorzuschlagen, das durch Umgebungsgeräusche nicht irrtümlicherweise in Betrieb gesetzt wird.
Ferner sollen der Sprachstartpegel und der Aufzeichnungsbereitschaftspegel zuverlässig und leicht einstellbar sein. Außerdem soll die Einstellung der Betriebsart "sprachgesteuerte Aufzeichnung" leicht möglich sein, ohne daß hierzu speziell ein eigenes Betätigungselement vorgesehen werden muß.
Die vorstehende Aufgabe wird durch die im Patentanspruch 1 angegebenen Merkmale gelöst.
Vorteilhafte Ausgestaltungen der Erfindungen sind in den Unteransprüchen 2 bis 16 angegeben.
Die Erfindung wird nachstehend anhand der Zeichnung näher erläutert. Es zeigen:
Fig. 1 ein Blockdiagramm, das den Aufbau eines sprachgesteuerten Aufzeichnungsgeräts gemäß einem ersten Ausführungsbeispiel wiedergibt;
Fig. 2 eine Ansicht, die die Aufzeichnungsanordnung eines Halbleiterspeicherabschnitts beim sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel wiedergibt;
Fig. 3 ein Flußdiagramm, das die wesentliche Betriebsweise des sprachgesteuerten Aufzeichnungsgeräts gemäß dem ersten Ausführungsbeispiel verdeutlicht;
Fig. 4 ein Flußdiagramm, das ein Unterprogramm eines Aufzeichnungsprozesses bei dem sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel wiedergibt;
Fig. 5 ein Flußdiagramm, das ein Unterprogramm eines Aufzeichnungsbetriebsart-Erfassungsprozesses bei dem sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel wiedergibt;
Fig. 6 ein Schaubild, das die Beziehung zwischen einer Sprachenergiewellenform und einer Sprachwellenform aufzeigt, wenn von dem sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel ein von der Sprache herrührender Ton (Sprechton), ein nicht von der Sprache herrührender Ton (Ton ohne Sprache) und eine Tonpause (Ruhe) festgestellt wird;
Fig. 7 ein Flußdiagramm, das eine Routine eines Prozesses zur Bestimmung eines von der Sprache herrührenden Tons, eines nicht von der Sprache herrührenden Tons und der Tonpause sowie einen Codierprozeß bei dem sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel wiedergibt;
Fig. 8 ein Flußdiagramm, das ein Unterprogramm bzw. eine Subroutine eines Wiedergabeprozesses bei dem sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel aufzeigt;
Fig. 9 ein Blockdiagramm, das den Aufbau eines sprachgesteuerten Aufzeichnungsgeräts gemäß einem zweiten Ausführungsbeispiel wiedergibt;
Fig. 10 ein Flußdiagramm, das ein Unterprogramm eines Aufzeichnungsprozesses bei dem sprachgesteuerten Aufzeichnungsgerät gemäß dem zweiten Ausführungsbeispiel wiedergibt;
Fig. 11 ein Flußdiagramm, das den Betrieb eines digitalen Signalprozessors bei einem Aufzeichnungsprozeß des sprachgesteuerten Aufzeichnungsgeräts gemäß dem zweiten Ausführungsbeispiel wiedergibt;
Fig. 12 ein Flußdiagramm, das den Betrieb einer Systemsteuereinheit beim Durchführen eines Aufzeichnungsvorganges bei einem dritten Ausführungsbeispiel verdeutlicht;
Fig. 13 ein Flußdiagramm, das den Betrieb einer Systemsteuereinheit beim Durchführen eines Aufzeichnungsvorganges bei einem vierten Ausführungsbeispiel wiedergibt; und
Fig. 14 ein Flußdiagramm, das den Betrieb einer Systemsteuereinheit beim Durchführen eines Aufzeichnungsvorganges bei einem fünften Ausführungsbeispiel verdeutlicht.
Fig. 1 stellt ein Blockdiagramm dar, das den Aufbau des sprachgesteuerten Aufzeichnungsgeräts gemäß dem ersten Ausführungsbeispiel wiedergibt.
Wie aus Fig. 1 ersichtlich, weist das sprachgesteuerte Aufzeichnungsgerät dieses Ausführungsbeispiels ein Mikrophon 1 auf. Ein Sprachsignal vom Mikrophon 1 wird über einen Verstärker 2 (AMP), ein Tiefbaßfilter 3 (LPF) und einen analogen Schalter 26 in einen Analog/Digital- (A/D-)Wandler 4 eingegeben. Eine Ausgangsklemme des A/D-Wandlers 4 steht mit einer ersten Klemme D1 einer Systemsteuereinheit 6 in Verbindung.
Diese Systemsteuereinheit 6 weist eine Sprachkomprimier/Dekom­ primiereinrichtung, eine Zeitachsen- Komprimierungseinrichtung, eine Einrichtung zum Erfassen oder Voraussagen eines Eingangsignalpegels und einen digitalen Signalprozessor 5 auf, der als Bauelement einer Datenverarbeitungseinrichtung dient. Die erste Klemme D1 ist mit dem digitalen Signalprozessor 5 in der Systemsteuereinheit 6 verbunden.
Die Systemsteuereinheit 6 funktioniert auch als Sprachpegel-Feststelleinrichtung, die feststellt, ob ein eingegebener Sprachpegel ein Sprachpegel ist, der vorbestimmten Bedingungen genügt. Der Sprachpegel, der den vorbestimmten Bedingungen genügt, stellt einen Sprachpegel dar, der gleich oder höher als ein Bezugspegel ist oder der niedriger als der Bezugspegel ist. Z. B. wird bei diesem Ausführungsbeispiel der Zustand "Ton" feststellt, falls der Pegel gleich oder höher als der Bezugspegel ist und "Tonpause (Ruhe)" feststellt, falls der Pegel niedriger als der Bezugspegel ist. Wenn der Bezugspegel wie oben beschrieben festgelegt wird, kann somit festgestellt werden, ob die eingegebene Sprache einen "Ton" oder eine "Tonpause" darstellt.
"Tonpause" bedeutet nicht immer, daß der Sprachpegel den Wert Null aufweist. Wie oben beschrieben, wird ein bestimmter Bezugspegel festgelegt. Falls ein Eingangspegel niedriger als der Bezugspegel ist, wird festgestellt, daß "kein Ton" vorliegt und "kein Ton" kann als "Tonpause" erkannt werden.
Außerdem bestimmt die Systemsteuereinheit 6 die Sprachpegel in den Einheiten von Rahmen, von denen jeder ein codiertes Sprachsignal ist.
Die Systemsteuereinheit 6 funktioniert auch als eine Kontinuitäts-Überwachungseinrichtung, die die Kontinuität eines Rahmens eines Sprachpegels überwacht, der den vorbestimmten Bedingungen genügt, z. B. ein Ton-Rahmen oder ein Tonpause-Rahmen. Die obigen Rahmeneinheiten werden später beschrieben.
Auf der Basis des Kontinuitäts-Überwachungsergebnisses funktioniert die Systemsteuereinheit 6 auch als eine Aufzeichnungssteuereinrichtung zum Steuern des Starts oder Anhaltens eines Aufzeichnungsvorganges. Es ist zu bemerken, daß die Einzelheiten der Aufzeichnungssteuereinrichtung später beschrieben werden. In diesem Fall kann ein seitens der Kontinuitäts-Überwachungseinrichtung durchgeführter Überwachungsvorgang für die Kontinuität eines Ton-Rahmens oder eines Tonpause-Rahmens auf die folgende Weise durchgeführt werden. Wie bei dem später zu beschreibenden Verfahren wird anstelle der tatsächlichen Zählung der Anzahl von Rahmen z. B. die Zeit unter Verwendung eines Zeitgebers gemessen und es wird überwacht, ob der Ton- Rahmen oder der Tonpause-Rahmen für eine vorbestimmte Zeitperiode oder länger beibehalten wird.
Das sprachgesteuerte Aufzeichnungsgerät dieses Ausführungsbeispiels weist einen Lautsprecher 13 auf, der als Sprachausgabeeinrichtung dient. Der Lautsprecher 13 steht über einen analogen Schalter 30, einen Verstärker 12 (AMP) und einen Digital/Analog (DA)-Wandler 11 mit einer zweiten Klemme D2 der Systemsteuereinheit 6 in Verbindung.
Der Analogschalter 26 ist mit einer Steuerklemme E1 der Systemsteuereinheit 6 verbunden und wird so gesteuert, daß er bei einem Aufzeichnungsvorgang eingeschaltet wird. Der analoge Schalter 30 ist mit einer Steuerklemme E2 der Systemsteuereinheit 6 verbunden und wird so gesteuert, daß er bei einem Wiedergabevorgang eingeschaltet wird.
Ein analoger Schalter 27 ist einerseits mit einem Verbindungspunkt zwischen dem Verstärker 12 und dem analogen Schalter 30 und andererseits mit einer Spannungsversorgungsklemme eines veränderbaren Widerstands 28 (VR) verbunden. Der analoge Schalter 27 ist ferner mit einer Steuerklemme E3 der Systemsteuereinheit 6 verbunden und wird so gesteuert, daß er eingeschaltet wird, wenn der Zustand des veränderbaren Widerstands 28 erfaßt wird.
Ein analoger Schalter 29 steht einerseits mit einem Verbindungspunkt zwischen dem A/D-Wandler 4 und dem analogen Schalter 26 und andererseits mit der Zwischenabgriffsklemme des veränderbaren Widerstands 28 in Verbindung. Der analoge Schalter 29 ist ferner mit einer Steuerklemme E4 der Systemsteuereinheit 6 verbunden und wird so gesteuert, daß er eingeschaltet wird, wenn der Zustand des veränderbaren Widerstands 28 erfaßt wird.
Der veränderbare Widerstand 28 wird verwendet, um den Schwellenwert eines Bezugspegels zu verändern, wenn die Systemsteuereinheit 6, die als Sprachpegelfeststelleinrichtung dient, feststellt, ob der Pegel einem "Ton" oder einer "Tonpause" zuzuordnen ist. Zu diesem Zeitpunkt funktionieren die Systemsteuereinheit 6 und der veränderbare Widerstand 28 als Schwellwert- Einstelleinrichtung.
Wenn die Zeitgabe für den Start oder das Anhalten eines Aufzeichnungsvorganges geändert wird, indem die Anzahl von vorbestimmten Rahmen geändert wird, die fortwährend erfaßt werden, wird der veränderbare Widerstand 28 zur Änderung der Zeitgabe verwendet. Zu diesem Zeitpunkt funktionieren die Systemsteuereinheit 6 und der veränderbare Widerstand 28 als Aufzeichnungszeitgabe-Änderungseinrichtung.
Eine dritte Klemme D3 der Systemsteuereinheit 6 ist mit einer Speichersteuerschaltung 7 und eine vierte Klemme D4 ist mit einem Halbleiterspeicherabschnitt 10 verbunden, der von der Aufzeichnungs/Wiedergabe-Einrichtung abnehmbar ist.
Eine fünfte Klemme D5 der Systemsteuereinheit 6 ist mit einer Leuchtdiode 17 verbunden, die als Datenübertragungseinrichtung zum Übertragen von Daten, die im Halbleiterspeicherabschnitt 10 aufgezeichnet sind, oder als Ausgabeeinrichtung zum Ausgeben eines Signals, das die Aufnahmebereitschaft anzeigt, dient. Falls die Leuchtdiode 17 zum Übertragen von Daten verwendet wird, wird als Leuchtdiode 17 eine Infrarot-Leuchtdiode verwendet. Die Leuchtdiode 17 wird jedoch auch als Anzeigeeinheit verwendet, die Licht abstrahlt, falls während eines Aufzeichnungs- bzw. Wiedergabevorganges in das Mikrophon ein Ton (Sprache) eingegeben bzw. von diesem wiedergegeben wird.
Demzufolge wird als Leuchtdiode 17 eine Infrarot- Leuchtdiode verwendet, die einen großen Anteil an sichtbarem Licht und eine relativ kurze Wellenlänge aufweist, mit einem Maximalwert bei einer Wellenlänge z. B. von 500 mm bis 1000 mm, vorzugsweise von 600 mm bis 800 mm.
Ferner ist eine sechste Klemme D6 der Systemsteuereinheit 6 über eine Treiberschaltung 9 mit einer Anzeigeeinheit 8 verbunden.
Eine siebte Klemme D7 der Systemsteuereinheit 6 ist über einen Spannungsvergleicher 16 (COMP) mit einem zwischen einer PIN-Diode 14 und einem Widerstand 15 liegenden Kontaktpunkt in verbunden. In diesem Fall bilden die PIN-Diode 14 und der Spannungsvergleicher 16 eine Datenempfangseinrichtung oder eine Einrichtung zum Empfang eines Datenübertragungs-Startsignals.
Eine achte Klemme D8 der Systemsteuereinheit 6 ist über einen Gleichspannungs/Gleichspannungsumsetzer 20 (DC/DC-Um­ setzer) und einen Stromversorgungs-Hauptschalter 19 mit einer Batterie 18 verbunden. Der Gleichspannungs/Gleichspannungsumsetzer 20 gibt eine gegenüber der Batterie 18 erhöhte Spannung ab und liefert eine stabile Versorgungsspannung an jede Einrichtung. Gleichzeitig überträgt der Gleichspannungs/Gleichspannungsumsetzer 20 ein Signal, das anzeigt, daß die Spannung der Batterie 18 niedriger als ein vorbestimmter Wert ist. Auf diese Weise erfaßt die Systemsteuereinheit 6 den Verbrauchszustand der Batterie 18.
Dem Stromversorgungs-Hauptschalter 19 ist ein Relais 25 parallel geschaltet, so daß verhindert wird, daß die Stromversorgung unterbrochen wird, selbst wenn der Stromversorgungs-Hauptschalter 19 in den AUS-Zustand gebracht wird. Um festzustellen, daß der Stromversorgungs- Hauptschalter 19 ausgeschaltet ist, steht der Stromversorgungs-Hauptschalter 19 mit der Systemsteuereinheit 6 so in Verbindung, daß die Spannung der Batterie 18 erfaßt werden kann, falls der Stromversorgungs-Hauptschalter 19 ausgeschaltet ist.
Außerdem ist die Anode einer Diode 21 mit einer neunten Klemme D9 der Systemsteuereinheit 6 verbunden und eine Parallelschaltung aus einem Kondensator 22 und einem Widerstand 23 ist zwischen die Kathode der Diode 21 und Erde bzw. Masse geschaltet. Die Kathode der Diode 21 ist mit der Basis eines Transistors 24 verbunden. Der Kollektor des Transistors 24 ist mit einem Kontaktpunkt zwischen dem Mikrophon 1 und dem Mikrophonverstärker 2 verbunden, während der Emitter mit Erde verbunden ist. Liese Bauteile bilden eine AVR (automatische Verstärkungsregelungs-)- Schaltung, um die Erzeugung von Verzerrungen, die durch ein zu großes Eingangssignal hervorgerufen werden, zu reduzieren.
Außerdem sind mit der Systemsteuereinheit 6 Betätigungsknöpfe bzw. -tasten verbunden, wie z. B. eine Aufnahme-Taste (REC), eine Wiedergabe-Taste (PLAY), eine Stopp-Taste (STOP), eine Taste (FF) für schnelles Vorspulen, eine Taste (REW) für schnelles Rückspulen, eine Instruktionsmarkierungs-Taste (I), eine Endmarkierungstaste (E) und eine Sprachstart (Sprach-Aktiv-Detektor)-Taste (VAD).
Wie aus Fig. 1 ersichtlich, weist der Halbleiterspeicherabschnitt 10 ein Aufzeichnungsmediumteil 100a für zeitweises Aufzeichnen sowie ein Hauptaufzeichnungsmediumteil 100b auf. Obwohl als Hauptaufzeichnungsmediumteil 100b im allgemeinen ein Flash- Speicher verwendet wird, kann dafür auch eine magnetooptische Platte, eine Magnetplatte oder ein Magnetband verwendet werden. Als Aufzeichnungsmediumteil 100a für zeitweises Aufzeichnen kann ein SRAM, ein DRAM, ein EEPROM, ein Hochdielektrikum-Speicher oder ein Flash- Speicher verwendet werden, die das Lesen bzw. Schreiben mit einer Geschwindigkeit durchführen können, die höher als die des Hauptaufzeichnungsmediumteils 100b ist. Bei diesem Ausführungsbeispiel wird als Aufzeichnungsmediumteil 100a für zeitweises Aufzeichnen ein SRAM und als Hauptaufzeichnungsmediumteil 100b ein Flash-Speicher verwendet.
Fig. 2 verdeutlicht die Aufzeichnungsanordnung beim Halbleiterspeicherabschnitt 10.
Wie aus Fig. 2 ersichtlich, wird der Speicherraum des Halbleiterspeicherabschnitts 10 grob in einen Indexteil 10A und einen Sprachdatenteil 10B unterteilt. n dem Indexteil 10A sind mehrere Sprachnachrichtendateien 10B1, 10B2, 10B3, . . . , 10Bm aufgezeichnet, deren Sprachdaten im Sprachdatenteil 10B aufgezeichnet sind.
In diesem Indexteil 10A sind die folgenden Informationen aufgezeichnet. D. h., der Indexteil 10A ist so aufgebaut, daß Startadressenpositionsinformationen 10A1 der nächsten Sprachdatei; Informationen 10A2 für die Größe einer Datei; Dateilöschinformationen 10A3; eine Aufzeichnungsdateinummer 10A4; Sprachcodierungsschema-Erkennungsinformationen 10A5; Informationen 10A6, die einen Dateizustand darstellen, Maximalwertinformationen 10A7 einer Datei, die editiert bzw. aufbereitet (eingefügt) werden kann; Informationen 10A8, die eine Länge bis zu einer einfügbaren Datei darstellen; eine Aufbereitungsstartpositionsadresse 10A9 der ersten Aufbereitung; eine Startpositionsadresse 10A10 einer eingefügten Sprachdatei der ersten Aufbereitung; und Dateigrößeninformationen 10A11; . . . ; eine Aufbereitungsstartpositionsadresse 10A12 der n-ten Aufbereitung, bei der höchst mögliche (letzte) Informationen zum sequentiellen Aufzeichnen von Informationen durchgeführt werden können, die ähnlich den Informationen 10A9 bis 10A11 sind; eine Startpositionsadresse 10A13 einer eingefügten Sprachdatei der n-ten Aufbereitung, bei der eine höchst mögliche (letzte) Einfügung durchgeführt werden kann; und eine Startpositionsadresse 10A14 einer eingefügten Sprachdatei der n-ten Aufbereitung gespeichert sind, bei der die höchst mögliche (letzte) Einfügung ausgeführt werden kann.
Die Sprachrahmendaten 10B1 bis 10Bm sind in dem Sprachdatenteil 10B aufgezeichnet. Bei jeden Rahmendaten des Sprachdatenteils 10B sind Informationen aufgezeichnet, die angeben, ob eine Anfangseinstellung durchgeführt wird, wenn der Sprachcodierungsprozeß durchgeführt wird.
Die Position, an der die Information aufgezeichnet ist, ist dem obersten oder dem untersten Bit des ersten Byte jeder Rahmendatei oder dem obersten oder dem untersten Bit des letzten Byte der Rahmendatei zugeordnet. Bei diesem Ausführungsbeispiel ist die Information beim vierten Bit des ersten Byte der Rahmendatei aufgezeichnet.
In dem lösbaren Halbleiterspeicherabschnitt 10 ist eine Adresse abgespeichert, die als Information dient, die eine Aufzeichnungsposition der Sprachinformationen anzeigt. Die Adresse kann jedoch in einem Halbleiterspeicher (nicht gezeigt) aufgezeichnet werden, der von der Speichersteuerschaltung 7 gesteuert wird, die auf der Aufnahme-/Wiedergabeseite angeordnet ist.
Im vorliegenden Fall haben die Instruktionsmarkierung und die Endmarkierung folgende Funktion. Wird z. B. während eines Aufzeichnungsvorganges die Instruktionsmarkierungstaste I von einer Person, die ein Dokument aufzeichnet, betätigt, so kann eine Indexmarkierung zum Anzeigen für eine Schreibkraft oder eine Sekretärin aufgezeichnet werden. Die das Dokument aufzeichnende Person kann praktisch durch Verwendung der Instruktionsmarkierung auf Aufmerksamkeit beim Schreiben oder auf die Priorität mittels Sprache hinweisen.
Um die Trennung zwischen der Vielzahl von Dokumenten anzuzeigen, wird die Endmarkierungstaste E betätigt, um eine als Endmarkierung bezeichnete Indexmarkierung aufzuzeichnen.
Nachfolgend wird kurz ein Aufnahme-/Wiedergabevorgang wie beim ersten Ausführungsbeispiel beschrieben.
Falls ein Aufnahmevorgang durchgeführt werden soll, wird ein vom Mikrophon 1 erhaltenes analoges Sprachsignal mit Hilfe des Mikrophonverstärkers 2 verstärkt und zur Begrenzung des Frequenzbandes des analogen Sprachsignals durch ein Tiefpaßfilter 3 geschickt, woraufhin das analoge Signal durch den A/D-Wandler 4 in ein digitales Signal umgewandelt und in den digitalen Signalprozessor 5 (DSP) der Systemsteuereinheit 6 eingegeben wird.
Wenn in diesem Fall ein über das Mikrophon 1 eingegebenes Signal höher als ein Bezugspegel z. B. höher als -6 dB des maximalen Bereichs des A/D-Wandlers 4 ist, wird ein Impuls an die Diode 21 abgegeben, die mit der neunten Klemme D9 der Systemsteuereinheit 6 verbunden ist, und werden Ladungen in dem Kondensator 22 gespeichert, um eine Spannung an den Transistor 24 anzulegen. Zu diesem Zeitpunkt ändert sich die Impedanz zwischen Mikrophonverstärker 2 und Transistor 24 und somit der Verstärkungsgrad, wodurch das in den Mikrophonverstärker 2 eingegebene Signal begrenzt wird. Es ist zu bemerken, daß die im Kondensator 22 abgespeicherten Ladungen allmählich über den Widerstand 23 entladen werden.
In Erwiderung auf die Betätigung einer Vielzahl von Bedienungstasten und Schaltern der Systemsteuereinheit 6 werden Sprachdaten, die durch Komprimieren eines Digitalsignals durch den digitalen Signalprozessor 5 erhalten werden, über die dritte Klemme D3 und die vierte Klemme D4 der Systemsteuereinheit 6 im Halbleiterspeicherabschnitt 10 aufgezeichnet.
Beim Wiedergabevorgang liest die Systemsteuereinheit 6 die im Halbleiterspeicherabschnitt 10 aufgezeichneten Daten aus und führt diese Daten dem digitalen Signalprozessor 5 zu, um die Daten zu dekomprimieren. Die vom digitalen Signalprozessor 5 dekomprimierten Sprachdaten werden mit Hilfe des D/A-Wandlers 11 in ein analoges Signal umgewandelt, das daraufhin vom Verstärker 12 verstärkt und als Sprache vom Lautsprecher 13 abgegeben wird. Die Systemsteuereinheit 6 steuert den Treiberschaltkreis 9 an, so daß die Anzeigeeinheit 8 verschiedene Informationen anzeigt, wie z. B. die Betriebsart.
Nachfolgend wird die Betriebs- bzw. Punktionsweise des sprachgesteuerten Aufzeichnungsgeräts dieses Ausführungsbeispiels mit dem oben beschriebenen Aufbau erläutert.
Fig. 3 stellt ein Flußdiagramm dar, das die Hauptbetriebsweise des sprachgesteuerten Aufzeichnungsgeräts dieses Ausführungsbeispiels verdeutlicht. Der Betrieb wird nachfolgend als Betrieb der Systemsteuereinheit 6 beschrieben.
Wird von der Batterie 18 Energie geliefert, so beginnt die Systemsteuereinheit 6 ihren Betrieb, der im Flußdiagramm verdeutlicht ist. D. h. die externen Bedingungen bzw. Zustände der Systemsteuereinheit 6 werden überprüft und die Anfangseinstellung des Speicherabschnitts in der Systemsteuereinheit 6 wird vorgenommen (Schritt S1).
Nach Abschluß der Anfangseinstellung überprüft die Systemsteuereinheit 6, ob die von der Batterie 18 zugeführte Versorgungsspannung den Nennwert aufweist (Schritt S2). Der Nennwert ist auf 1 V eingestellt und die Systemsteuereinheit 6 ermittelt auf der Grundlage der Information vom Gleichspannungs-/Gleichspannungs-Umsetzer 20, ob die Versorgungsspannung von der Batterie 1 V oder höher ist oder ob die Impedanz der Batterie 18 größer als der Nennwert ist, und zwar anhand eines Stromes, der in der Batterie 18 fließt. Zu diesem Zeitpunkt wird ein Signal, das durch Bestimmung des Zustandes der Batterie 18 erhalten wird, der achten Klemme D8 der Systemsteuereinheit 6 eingegeben, so daß die Systemsteuereinheit 6 feststellen kann, ob die Batterie 18 eine ausreichende Kapazität hat (Schritt S2).
Stellt die Systemsteuereinheit 6 als Ermittlungsergebnis beim Schritt S2 fest, daß die Batterie 18 nicht verwendet werden kann, so wird die Stromzufuhr zum gesamten sprachgesteuerten Aufzeichnungsgerät unterbunden und werden Schalter (nicht gezeigt), die zwischen der Batterie 18 und entsprechenden Schaltungen angeordnet sind, in den AUS-Zustand gebracht und wird über die Treiberschaltung 9 und die Anzeigeeinheit 8 eine Anzeige ausgegeben, die darauf hinweist, daß die Batterie 18 keine ausreichende Kapazität aufweist.
Falls die Systemsteuereinheit 6 als Ermittlungsergebnis beim Schritt S2 feststellt, daß die Batterie 18 verwendet werden kann, wird der Relaisschalter 25 eingeschaltet. Anschließend prüft die Systemsteuereinheit 6, ob der Relaisschalter 25 eingeschaltet ist oder die Stopp-Taste STOP und die Taste FF für schnelles Vorspulen gleichzeitig gedrückt werden, wodurch bestimmt wird, ob eine Datenübertragung durchgeführt wird (Schritt S3). Lautet die Antwort beim Schritt S3 JA, so wird ein Datenübertragungsprozeß gestartet.
Lautet die Antwort beim Schritt S3 jedoch NEIN, so lädt die Systemsteuereinheit 6 die Informationen des Indexteils 10A im Halbleiterspeicherabschnitt 10, der als Aufzeichnungsmedium (Speicherabschnitt) dient. Im einzelnen lädt die Systemsteuereinheit 6 die Betriebsstartpositionsinformationen 10A1, die Betriebsendpositionsinformationen 10A2, andere Codierbetriebsarten, Betriebszustände und dergleichen (siehe Fig. 2).
Anschließend bestimmt die Systemsteuereinheit 6 auf der Grundlage der vom Halbleiterspeicherabschnitt 10 geladenen Daten, ob der Halbleiterspeicherabschnitt 10 normal aufgezeichnete Indizes aufweist, d. h. ob das Format des Halbleiterspeicherabschnitts 10 normal ist (Schritt S4).
Falls der Halbleiterspeicherabschnitt 10 beim Schritt S4 nicht formatiert ist, so wird festgestellt, daß das Format des Halbleiterspeicherabschnitts 10 nicht normal ist. Informationen, die die Zustände der Verwendung darstellen, werden in den Indexteil 10A des Halbleiterspeicherabschnitts 10 eingegeben und es wird geprüft, ob eine Speicherformatierung (Initialisierung) durchgeführt wird (Schritt S5), die als ein Prozeß der Eingabe von "0" in den Sprachdatenteil 10B dient. Im einzelnen wird die Treiberschaltung 9 so gesteuert, daß die Anzeigeeinheit 8 eine Bestätigung dafür anzeigt, ob die Speicherformatierung durchgeführt wird.
Wenn in diesem Fall eine Taste, (die auch als Aufnahmetaste REC verwendet wird) zum Anzeigen und Bestätigen, daß der Speicherformatierungsprozeß durchgeführt wird, gedrückt wurde, wird die Formatierung (Initialisierung) des Halbleiterspeicherabschnitts 10 durchgeführt (Schritt S6).
Nach Abschluß der Formatierung wird die Treiberschaltung 9 so gesteuert, daß die Anzeigeeinheit 8 den Abschluß der Anfangseinstellung anzeigt (Schritt S7).
Wenn eine Taste (die auch als Stopp-Taste STOP verwendet wird) zum Anzeigen und Bestätigen, daß der Speicherformatierungsprozeß durchgeführt ist, gedrückt wurde, steuert die Systemsteuereinheit 6 die Treiberschaltung 9 so, daß die Anzeigeeinheit 8 anzeigt, daß der Halbleiterspeicherabschnitt 10 nicht normal ist und somit ausgetauscht werden muß. Außerdem werden die Schalter (nicht dargestellt), die zwischen der Batterie 18 für die Leistungszufuhr zum gesamten sprachgesteuerten Aufzeichnungsgerät und den jeweiligen Schaltungen angeordnet sind, ausgeschaltet (Schritt S8).
Daraufhin wartet die Systemsteuereinheit 6 bis der Stromversorgungs-Hauptschalter 19 ausgeschaltet ist (Schritt S9), um den Halbleiterspeicherabschnitt 10 auszutauschen. Stellt die Systemsteuereinheit 6 fest, daß der Stromversorgungs-Hauptschalter 19 ausgeschaltet ist, so schreitet der Ablauf zum Schritt S22 fort.
Wenn die Anfangseinstellung für den Halbleiterspeicherabschnitt 10 normal abgeschlossen ist, wird nach dem Ende der Anzeige des Abschlusses der Anfangseinstellung auf der Basis der vom Indexteil 10A ausgelesenen Informationen ein vorhandener Vorgang durchgeführt (Schritt S10). Anschließend setzt die Systemsteuereinheit 6 die jeweiligen Schaltungen in den Bereitschaftszustand, während eine spezielle Betätigungstaste des sprachgesteuerten Aufzeichnungsgeräts erfaßt wird, die gedrückt wurde (Schritt S11).
Stellt die Systemsteuereinheit 6 fest, daß beim Schritt S11 irgendeine Bedienungstaste gedrückt wurde, so prüft die Systemsteuereinheit 6 ob die gedrückte Taste die Aufzeichnungs-Taste REC ist (Schritt S12). Falls die Aufzeichnungs-Taste REC gedrückt wurde, steuert die Systemsteuereinheit 6 den digitalen Signalprozessor 5 an, um die vom A/D-Wandler 4 eingegebene Sprachinformation zu komprimieren, und steuert die Speichersteuerschaltung 7 an, um einen Aufzeichnungsvorgang für den Sprachdatenteil 10B des Halbleiterspeicherabschnitts 10 durchzuführen (Unterprogramm eines Aufzeichnungsprozesses bei einem Schritt S13). Dieses Aufzeichnungsprozeß-Unterprogramm wird später beschrieben.
Wird die Aufzeichnungs-Taste REC nicht betätigt, so ermittelt die Systemsteuereinheit 6 als nächstes, ob die Wiedergabe-Taste PLAY betätigt wurde (Schritt S14). Falls in diesem Fall die Wiedergabe-Taste PLAY gedrückt wurde, steuert die Systemsteuereinheit 6 die Speichersteuerschaltung 7 an, um aufgezeichnete Daten vom Sprachdatenteil 10B des Halbleiterspeicherabschnitts 10 auszulesen. Die Systemsteuereinheit 6 sendet diese Daten zur Durchführung einer Dekomprimierung zum digitalen Signalprozessor 5 und startet einen Wiedergabevorgang, in dem Sprachinformationen dem D/A-Wandler 11 zugeführt werden (Schritt S15). Die Subroutine bzw. das Unterprogramm des Wiedergabeprozesses wird später beschrieben.
Wurde die Wiedergabetaste PLAY nicht gedrückt, so überprüft die Systemsteuereinheit 6 die Zustände der Tasten, um festzustellen, ob die Taste FF für schnelles Vorspulen gedrückt wurde (Schritt S16). Falls die Taste FF für schnelles Vorspulen gedrückt wurde, startet die Systemsteuereinheit 6 einen Prozeß für schnelles Vorspulen, bei dem Betriebspositionen sequentiell mit geeigneter Geschwindigkeit bewegt werden (Schritt S17), z. B. einer Geschwindigkeit, die dem zwanzig-fachen der Wiedergabegeschwindigkeit entspricht.
Falls die Taste FF für schnelles Vorspulen nicht gedrückt wurde, so überprüft die Systemsteuereinheit 6 die Zustände der Tasten, um festzustellen, ob die Taste REW für schnelles Rückspulen gedrückt wurde (Schritt S18). Falls die Taste REW für schnelles Rückspulen gedrückt wurde, so startet die Systemsteuereinheit 6 einen Prozeß für schnelles Rückspulen, bei dem Betriebspositionen sequentiell mit einer Geschwindigkeit bewegt werden, die der Geschwindigkeit beim Prozeß des schnellen Vorspulens entspricht (Schritt 19).
Falls bei irgendeinem der Prozesse bei den Schritten S13, S15, S17 und S19 die Stopp-Taste STOP gedrückt wurde, stoppt die Systemsteuereinheit 6 den betreffenden Prozeß, woraufhin zum Schritt S11 zurückgekehrt wird.
Wird die Aufzeichnungs-Taste, die Wiedergabe-Taste, die Taste für schnelles Vorspulen, die Taste für schnelles Rückspulen oder dergleichen nicht betätigt, so schaltet die Systemsteuereinheit 6 die Versorgungsspannunauszufuhr aus oder erfaßt die Zustände von Einstelltasten oder -knöpfen verschiedener Art (Schritt S20). Ist beim Schritt S20 der Stromversorgungs-Hauptschalter 19 ausgeschaltet, so steuert die Systemsteuereinheit 6 die Speichersteuerschaltung 7 an, um die Indexinformation, die in einem Speicherabschnitt (nicht gezeigt) in der Systemsteuereinheit 6 abgespeichert ist, im Indexteil 10A des Halbleiterspeicherabschnitts 10 aufzuzeichnen, um damit die Information im Indexteil 10A des Halbleiterspeicherabschnitts 10 zu aktualisieren (Schritt S21).
Nach Beendigung des Indexübertragungsprozesses schaltet die Systemsteuereinheit 6 das gesamte sprachgesteuerte Aufzeichnungsgerät ab, d. h. den Relaisschalter 25 für die Stromversorgung für die jeweiligen Schaltungen (Schritt S22).
Stellt die Systemsteuereinheit 6 beim Schritt 20 fest, daß sich der Halbleiterspeicherabschnitt 10 im AUS-Zustand befindet, so prüft die Systemsteuereinheit 6 eine Einstelltaste und speichert den Zustand der Einstelltaste im Speicherabschnitt in der Systemsteuereinheit 6. Daraufhin kehrt der Ablauf zum Schritt S11 zurück.
Bei diesem Ausführungsbeispiel sind die obigen Einstelltasten keine eigenen (Extra-) Tasten. Werden mehrere Tasten, die unter der Aufzeichnungs-Taste REC, der Wiedergabe-Taste PLAY, der Stopp-Taste STOP, der Taste FF für schnelles Vorspulen, der Taste REW für schnelles Zurückspulen, der Instruktionsmarkierungstaste I, der Endmarkierungstaste E und einer Sprachstart- (Tonpause- Komprimierung) Taste VAT ausgewählt werden, gleichzeitig gedrückt, so können Funktionen der Einstelltasten erhalten werden.
Das Unterprogramm des beim Schritt S13 gezeigten Aufzeichnungsprozesses wird nachfolgend mit Bezug auf das Flußdiagramm in Fig. 4 näher beschrieben.
Stellt die Systemsteuereinheit 6 fest, daß die Aufzeichnungstaste REC gedrückt wurde, so führt die Systemsteuereinheit 6 den Aufzeichnungsprozeß durch. Zu diesem Zeitpunkt werden Sprachaufzeichnungsbedingungen (z. B. der Sprachstart, die Verwendung eines variablen Typs der Anwendung der Tonpause-Komprimierungsrate oder einer Sprach-Komprimierungsrate oder dergleichen) erfaßt (Schritt S31).
Eine Routine zum Erfassen der Betriebsbedingungen des Aufzeichnungsmodus, die beim Schritt S31 vorgenommen wird, wird nachfolgend mit Bezug auf Fig. 5 beschrieben.
Die Systemsteuereinheit 6 verschiebt den Programmablauf zu Beginn der Operation bzw. des Betriebs zu dieser Routine, um einen Eingangspegelwert festzulegen, bei dem der Sprach- Start oder die Tonpause-Komprimierung durchgeführt wird. Die Systemsteuereinheit 6 schaltet die Schalter 26 und 30 aus (siehe Fig. 1), so daß verhindert wird, daß Tonsignale erzeugt werden (Schritt S50). Mit Bezug auf Fig. 5 entspricht der analoge Schalter A bzw. B dem analogen Schalter 26 bzw. 30.
Die Systemsteuereinheit 6 schaltet die analogen Schalter 27 und 29 ein, um eine Stromversorgung für den veränderbaren Widerstand bzw. Stellwiderstand 28 auf der Basis eines Ausgangssignals vom D/A-Wandler 11 vorzusehen und um es zu ermöglichen, daß ein Spannungswert erfaßt wird, der in eine veränderbare Position des veränderbaren Widerstands 28 auf der Basis eines Ausgangssignals vom A/D-Wandler 4 umgewandelt wird (Schritt S51). Es ist mit Bezug auf Fig. 5 zu bemerken, daß der analoge Schalter C bzw. D dem analogen Schalter 27 bzw. 29 entspricht.
Die Systemsteuereinheit 6 sendet eine Instruktion, die den digitalen Signalprozessor 5 veranlaßt, daß vom D/A-Wandler 11 eine Sägezahnwelle mit einem Zyklus von 3 kHz abgegeben wird (Schritt 52).
Die Systemsteuereinheit 6 erfaßt einen Proben- bzw. Abtastwert, der 12,5 µs nach dem Instruieren des digitalen Signalprozessors 5, eine Sägezahnwelle mit einem Zyklus 3 kHz abzugeben, erhalten wird, und sendet eine Instruktion, so daß der digitale Signalprozessor 5 den Abtastwert vom A/D-Wandler 4 empfängt (Schritt S53).
Dieser Abtastwert stellt eine Ausgangsgröße vom Zwischenabgriff des veränderbaren Widerstands 28 dar und ist von der Position des Zwischenabgriffs auf dem Widerstand des veränderbaren Widerstands 28 abhängig. Aus diesem Grund legt die Systemsteuereinheit 6 die Erfassung von Ton/Tonpause oder den Einstellwert des Sprachstartprozesses unter Verwendung eines Wertes fest, der durch Umwandeln des Abtastwertes erhalten wird (Schritt S54).
Anschließend schaltet die Systemsteuereinheit 6 die analogen Schalter 27 und 29 aus und stoppt die Stromzufuhr zum veränderbaren Widerstand (Regelwiderstand) 28 auf der Basis eines Ausgangssignals vom D/A-Wandler 11 (Schritt S55). Ferner schaltet die Systemsteuereinheit 6 die analogen Schalter 26 und 30 ein, so daß die über das Mikrophon 1 eingegebene Sprache erfaßt werden kann (Schritt S56), woraufhin zurückgesprungen wird.
Kehrt man zu Fig. 4 zurück, so sendet die Systemsteuereinheit 6 ein Sprachaufzeichnungszustands- Betriebsartsignal an den digitalen Signalprozessor 5 auf der Basis der Zustände bzw. Bedingungen, die bei der Aufzeichnungsmodus-Erfassungsroutine erfaßt wurden, um einen Eingangsstartpegel für den Start durch Sprache sowie einen Erfassungswert für die Bestimmung eines Tons/einer Tonpause festzulegen (Schritt 32).
Wenn der digitale Signalprozessor 5 bei diesem Ausführungsbeispiel den Tonpause-Zustand bestimmt, führt die Systemsteuereinheit 6 keinen Aufzeichnungsvorgang im Halbleiterspeicherabschnitt 10 durch. Da jedoch Sprachdaten fehlerhafterweise durch den Eingangspegel eines Konsonanten oder einen Ton-/Tonpause-Feststellpegel gelöscht werden können, kann ein Tonpause-Korrekturprozeß hinzugefügt werden, bei dem Sprachdaten nicht im Halbleiterspeicherabschnitt 10 aufgezeichnet werden, falls in der Systemsteuereinheit 6 der Tonpause-Zustand für 3 bis 500 Rahmen anhält.
Die Rahmenfeststellnummer, bei der Sprachdaten in dem Speicherabschnitt gespeichert werden, falls der Tonpause- Zustand für 3 bis 500 Rahmen bei dem Tonpause- Korrekturprozeß der Systemsteuereinheit 6 anhält, wird in Abhängigkeit von den Zuständen bzw. Bedingungen festgelegt, die bei der vorstehend beschriebenen Aufzeichnungsmodus- Erfassungsroutine erfaßt wurden.
Die Systemsteuereinheit 6 lädt den Zustand des Speichers in den Speichermanagement-Adreßinformations- (Betriebspositionsinformations-) Bereich, um die Sprachmanagementinformationen im Speicherabschnitt der Systemsteuereinheit 6 festzulegen. Die Systemsteuereinheit 6 zeichnet in dem Indexteil 10A Attributinformationen auf, wie z. B. die Information 10A1 für die Startadressenposition der nächsten Sprachdatei, die Information 10A2 über die Größe einer Datei, Dateilöschinformationen 10A3, eine Aufzeichnungsdateinummer 10A4, eine Sprachcodierschema-Erkennungsinformation 10A5, eine Information 10A6, die den Dateizustand darstellt, und eine Information 10A7 über die maximale Anzahl der in den Indexteil 10A editierbaren (einfügbaren) Dateien. Außerdem werden Sprachrahmendaten 10B1, 10B2, 10B3, . . . , ab den Sprachrahmendaten 10B1 sequentiell in dem Sprachdatenteil 10B aufgezeichnet. Werden in diesem Fall neue Sprachdaten mittels eines Editiervorganges eingefügt, werden die eingefügten Sprachdaten als neue Sprachdatei aufgezeichnet und Informationen 10A8, die die Länge bis zu einer einfügbaren Datei darstellen, eine Aufbereitungs- (Editier-) Startpositionsadresse 10A9 der ersten Aufbereitung, eine Startpositionsadresse 10A10 einer eingefügten Sprachdatei der ersten Aufbereitung und die Informationen 10A11 über die Größe der Datei der ersten Aufbereitung werden im Indexteil 10A aufgezeichnet. Bei diesem Ausführungsbeispiel kann der gleiche Einfügungsaufzeichnungsprozeß wie oben beschrieben höchstens n-mal durchgeführt werden.
Die Speichermanagementinformationen, wie z. B. eine Position, an der Sprachcodierdaten aufgezeichnet sind, oder die Dateigröße wird in die Systemsteuereinheit 6 geladen oder in der Systemsteuereinheit 6 berechnet (Schritt S33) Ein Tonpause-Zählwert zum Messen einer Tonpausen- Zeitperiode wird auf den Wert "0" gesetzt, der den anfänglichen Einstellwert darstellt (Schritt S34). Ein Wert VF, der die Schaltinformation eines Sprachstartmodus des sprachgesteuerten Aufzeichnungsgeräts darstellt, wird auf den Wert "0" gesetzt, der den anfänglichen Einstellwert darstellt (Schritt S35).
Daten, die durch Komprimieren und Codieren von Sprache mittels des digitalen Signalprozessors 5 erhalten werden, werden von der Systemsteuereinheit 6 zum Halbleiterspeicherabschnitt 10 als Sprachaufzeichnungsdaten übertragen (Schritt S36).
Bei diesem Ausführungsbeispiel wird im digitalen Signalprozessor 5 vorzugsweise ein Analyse-/Synthese- Sprachcodierschema, wie z. B. ein CELP- Code Excited Linear Predictive = Code-erregtes, lineares, prädiktives) Codierschema verwendet, bei dem ein erregtes Signal (Restsignal) unter Verwendung eines Code-Buches Vektor­ quantisiert wird. Ein Wellenformcodier-Komprimierungsschema wie z. B. ein ADPCM-Schema kann gleichfalls verwendet werden.
Bei der Sprachcodierung unter Verwendung des CELP-Codier­ schemas, wird ein eingegebenes Sprachsignal als ein Rahmen in einer vorbestimmten Zeitperiode (z. B. 20 ms) erkannt (z. B. werden 160 Datenwerte als Daten eines Rahmens erkannt, falls die Abtastfrequenz 8 kHz beträgt), wobei die folgenden Parameter unter Verwendung der Daten eines Rahmens eingeführt werden.
Der digitale Signalprozessor 5 berechnet einen linearen Prädiktionskoeffizienten (LPC) (Kurzzeit-Prädiktions- Filterkoeffizient, Reflektionskoeffizient oder dergleichen) und quantisiert den Koeffizienten, um einen Parameter zu erhalten. Um das ähnlichste Modell zu finden, wird eine Ähnlichkeit des von mehreren Stücken von Tonquelleninformation erregten (Rest-) Signalmodells (Codebuch) als Tonquelleninformationsdaten festgelegt. Insbesondere wird das am besten mit der eingegebenen Sprache (aus den Stücken der Sprachquellinformation) übereinstimmende Modell ermittelt, mit dem die "Töne" auf eingegebene Sprache geprüft werden. Die Nummer (Index) des erregten (Rest-) Signalmodells der Tonquelleninformationen zu diesem Zeitpunkt und die Verstärkungsinformationen werden quantisiert, wodurch ein Codierungsprozeß ausgeführt wird.
Bei diesem Codierungsprozeß analysiert der digitale Signalprozessor 5, ob ein Rahmen eine Tonpause ist, und sendet beim Schritt S36 codierte Daten. Als Verfahren zum Feststellen, ob ein Rahmen eine Tonpause ist, wird das folgende Verfahren verwendet. Dabei wird die Energie der Daten eines Rahmens (die Summe der Quadrate der Abtastdaten) oder die Korrelation zwischen dem Maximalwert oder einem Sprachsignal und einem Restsignal in einem Rahmen berechnet, um festzustellen, ob der Rahmen eine Tonpause ist. Zum Ausgeben wird eine Tonpause mit "0" codiert und ein Ton mit "1".
Auf der Grundlage der durch die Datenübertragung, die durch den digitalen Signalprozessor 5 ausgeführt wird, ausgegebenen Daten stellt die Systemsteuereinheit 6 fest, ob die Daten Tonpausen sind (Schritt S37).
Ist beim Schritt S37 die Antwort JA, wird "1" dem Tonpausen-Zeitzählwert n hinzuaddiert, um den Tonpausen- Zeitzählwert n zu inkrementieren (Schritt S38). Ist beim Schritt S37 die Antwort NEIN, wird der Tonpausen- Zeitzählwert n zurückgesetzt, um den Anfangseinstellwert auf "0" einzustellen (Schritt S39).
Um festzustellen, ob die Tonpause eine festgesetzte Zeitdauer oder länger anhält, stellt die Systemsteuereinheit 6 fest, ob der Tonpausen-Zeitzählwert n z. B. LIM = 500 oder höher ist (dies bedeutet, daß die Tonpause 500 Rahmen lang andauert, was einer Tonpause von 10 Sekunden entspricht) (Schritt S40). Dieser Feststellwert LIM liegt im Bereich von 5 bis 65.535, vorzugsweise von 100 bis 3000 und am besten von 150 bis 500.
Bei diesem Ausführungsbeispiel ist der Feststellwert auf 500 eingestellt.
Falls beim Schritt S40 der Feststellwert LIM 500 oder höher ist, addiert die Systemsteuereinheit 6 "1" zu einem Schaltinformationswert VF (Schritt S41). Der auf "0" eingestellte Informationswert VF zeigt einen Anfangseinstellzustand an und der auf "1" eingestellte Informationswert VF zeigt einen Sprachstart- Tonpause- Komprimierungs-) Modus an. Wenn der Informationswert VF "2" oder höher ist, wird ein Schaltvorgang in einen Stopp- Zustand ausgeführt. Wenn die Tonpause ständig auftritt, kann der Feststellwert LIM mit der Häufigkeit des Auftretens der Tonpause geändert werden. Z. B. kann der Feststellwert LIM abhängig vom Informationswert VF geändert werden. D. h., wenn der Informationswert VF "0" ist, wird der Feststellwert LIM auf 500 eingestellt; und wenn der Informationswert VF "1" ist, wird der Feststellwert LIM auf 50 eingestellt.
Da als Feststellwert LIM ein veränderlicher Wert verwendet wird, wird ein Vorgang zum automatischen Schalten einen Modus (Betriebsart) in einen Aufzeichnungsmodus, in dem ein Aufzeichnungsmedium effizient verwendet wird, ausgeführt, wenn ein Sprecher mit vielen Zwischenräumen spricht (z. B. wenn das Diktataufzeichnen während des Denkens ausgeführt wird).
Die Systemsteuereinheit 6 stellt fest, ob der Informationswert VF "0" ist oder ob der Tonpausen- Korrekturprozeß ausgeführt wird (Schritt S42), bei dem verhindert wird, daß Sprachdaten im Halbleiterspeicherabschnitt 10 gespeichert werden. Wenn in diesem Fall der Informationswert VF "0" ist oder die Datenaufzeichnung ausgeführt wird, gibt die Systemsteuereinheit 6 Sprachcodierungsdaten, die vom digitalen Signalprozessor 5 übertragen wurden, zusammen mit einer Steuerinstruktion an den Speichersteuerschaltkreis 7 aus (Schritt S43), und die Codierungsdaten werden durch den Speichersteuerschaltkreis 7 im Halbleiterspeicherabschnitt 10 aufgezeichnet.
Die im Speicherabschnitt in der Systemsteuereinheit 6 gespeicherte Betriebspositionsinformation wird aktualisiert. Als die zu aktualisierenden Werte, werden die Betriebsendposition des Indexteils 10A (die nächste Startpositions-Information 10A1 und die Sprachdateigrößeninformation 10A2) aktualisiert (Schritt S44).
Die Systemsteuereinheit 6 erfaßt, ob die Stopp- (STOPP-) Taste STOP gedrückt wurde (Schritt S45). Im Falle von NEIN beim Schritt S45, kehrt der Ablauf zum Schritt S36 zurück, um den obigen Vorgang zu wiederholen. Im Falle von JA beim Schritt S45, wird die im Speicherabschnitt gespeicherte Betriebspositionsinformation auf dem Indexteil 10A aufgezeichnet und dieser Aufzeichnungsprozeß ist abgeschlossen.
Wenn die Systemsteuereinheit 6 beim Schritt S42 feststellt, daß der Informationswert VF nicht "0" ist oder das Datenaufzeichnen nicht ausgeführt wird, wird der Ablauf zu einem Schritt S45 verlagert (Schritt S46), wenn der Informationswert VF "1" ist.
Wenn die Systemsteuereinheit 6 beim Schritt S46 feststellt, daß der Informationswert VF nicht "1" ist, wird die im Speicherabschnitt der Systemsteuereinheit 6 gespeicherte Betriebspositionsinformation aktualisiert (Schritt S47). Die Systemsteuereinheit 6 zeichnet die im Speicherabschnitt des Indexteils 10A gespeicherte Betriebspositionsinformation auf und der Aufzeichnungsprozeß ist abgeschlossen.
Das oben beschriebene Tonpausen-Erfassungsverfahren wird unten weiter beschrieben. Bei diesem Ausführungsbeispiel ist ein Sprachaufzeichnungsprozeß auszuführen, wobei im digitalen Signalprozessor 5 ein CELP-Schema (Code-erregtes LPC-Codierungs-Schema; Codierung des Analyse/Synthese-Typs) verwendet wird, um Sprachdaten zu codieren.
Gemäß dem CELP-Schema kann ein Tonquellensignal von einem LPC- (linearen Prädiktionskoeffizienten-) Synthesefilter sehr effektiv Vektor-quantisiert werden, indem ein Codebuch verwendet wird, das aus verschiedenen Wellenformmustern besteht.
Beim ersten Ausführungsbeispiel wird eine Differenz zwischen einem Prädiktionswellenformmuster, das durch dieses Schema extrahiert wird, und einem Sprachsignal in einer vorbestimmten Zone (Zeitabschnitt) als ein Restsignal verwendet, weiterhin wird eine Kreuzkorrelation zwischen dem Restsignal und dem Sprachsignal in der vorbestimmten Zone berechnet und die Kreuzkorrelation wird durch Autokorrelation dividiert. Wenn in diesem Fall der resultierende Wert 0,81 oder kleiner ist, ist das Ergebnis "Ton ohne Sprache"; wenn der resultierende Wert 0,81 übersteigt, ist das Ergebnis "Ton ohne Sprache" oder "Tonpause". Wenn jedoch festgestellt wird, daß im Sprachstart-Aufzeichnungsmodus ein Aufzeichnungsvorgang gestartet wird, werden der "Sprechton" und der "Ton ohne Sprache" als "Ton" behandelt (gleich behandelt) Tonpausen und Töne ohne Sprache werden durch den Autokorrelationspegel eines Sprachsignals festgestellt. Im einzelnen ähnelt zunächst ein Restsignal einem zufallsmäßig erzeugten Signal (weißes Rauschen). Wenn das Sprachsignal mit dem Restsignal korreliert, bedeutet dies, daß das Sprachsignal dem weißen Rauschen ähnlich ist. Auf diese Weise kann festgestellt werden, ob das Sprachsignal ein Sprechton oder ein Ton ohne Sprache ist.
Die Autokorrelation kann durch eine Sprachenergiewellenform dargestellt werden und die Beziehung zwischen einer Sprachwellenform und einer Energiewellenform ist in Fig. 6 dargestellt. Da das obige Verfahren die Sprachenergie (Fig. 6) verwendet, werden, wenn der Ton-Teil ohne Sprache berücksichtigt wird, die vor und nach dem "Sprechton" gelegenen Zeitabschnitte (Zonen) (t1, t2 und t3) als Geräuschpegel ermittelt, da ein Muster der Sprache (Sprachmuster) eines Menschen einen dem Rauschen ähnlichen "Ton ohne Sprache" enthalten kann.
Wie dies in Fig. 7 dargestellt ist, werden durch den digitalen Signalprozessor 5 (DSP) und die Systemsteuereinheit 6 die Ermittlung des Tons mit Sprache, des Tons ohne Sprache und der Tonpause gleichzeitig mit einem Codierungsprozeß ausgeführt.
Insbesondere empfängt der digitale Signalprozessor 5 vom A/D-Wandler 4 Sprachdaten, um einen Rahmenprozeß auszuführen (Daten, die 20 ms lang abgetastet wurden, werden als ein Rahmen definiert) (Schritt S81). Der digitale Signalprozessor 5 führt an den abgetasteten Daten Vorprozesse, wie ein Vorbetonungsprozeß oder einen Hamming- Fenster-Prozeß aus (Schritt S82). Der Codierungsprozeß vom Analyse-/Synthesetyp wird ausgeführt (Schritt S83).
Wenn dieser Codierungsprozeß vom Analyse-/Synthesetyp ausgeführt wird, kann durch die Systemsteuereinheit 6 die Sprachenergie (Autokorrelation) eines vorliegenden Rahmens oder die Kreuzkorrelation mit einer Restwellenform erhalten werden (Schritt S84). Zu diesem Zeitpunkt stellt die Systemsteuereinheit 6 unter Verwendung des oben beschriebenen Verfahrens auf der Grundlage der Sprachenergie fest, ob der Ton ein Sprechton mit einem Pegel gleich oder höher als ein Geräuschpegel ist (Schritt S85). Im Fall von JA beim Schritt S85, wird festgestellt, ob der vorige Rahmen oder eine vorbestimmte Anzahl von vorigen Rahmen Tonpausen sind (Schritt S86).
Im Falle von JA beim Schritt S86, wird der Rahmen des vorigen Rahmen oder die Rahmen der vorbestimmten Anzahl von vorherigen Rahmen den Tonrahmen ohne Sprache zugeordnet (Schritt S87). Ein Code (Sprachmerker, der einen Tonrahmen mit Sprache anzeigt) wird dem vorliegenden Rahmen hinzugefügt (Schritt S88) und dieser Prozeß ist abgeschlossen.
Im Falle von NEIN beim Schritt S86, springt der Ablauf zu einem Schritt S88.
Falls die Systemsteuereinheit 6 beim Schritt S85 feststellt, daß der vorliegende Rahmen ohne Sprache ist, stellt die Systemsteuereinheit 6 fest, ob der vorherige Rahmen einer Tonpause entspricht (Schritt S89). Falls in diesem Fall die Steuereinheit 6 feststellt, daß der vorherige Rahmen keiner Tonpause entspricht, stellt die Systemsteuereinheit 6 fest, ob der vorherige Rahmen Sprache enthält (Schritt S90). Falls die Systemsteuereinheit 6 feststellt, daß der vorherige Rahmen Sprache enthält, wird beim internen Zähler n "5" eingestellt, um die Rahmennummer zu zählen (Schritt S91).
Die Systemsteuereinheit 6 fügt den Sprachcodierungsdaten einen Code hinzu, der einen Rahmen ohne Sprache anzeigt (Sprach-Merker V = 1), und dieser Prozeß ist abgeschlossen.
Beim sprachgesteuerten Aufzeichnungsgerät gemäß dem ersten Ausführungsbeispiel wird ein Code verwendet, der anzeigt, ob die eingegebene Sprache ein Ton mit Sprache oder eine Tonpause ist. Insbesondere wird den Sprachcodierungsdaten ein Code ("Ton ohne Sprache"-Merker) hinzugefügt, der einen Ton ohne Sprache anzeigt und ein Tonteil ohne Sprache kann leicht gehört werden, wenn die Zeitachsenkompression bei einem Wiedergabebetrieb durchgeführt wird. Wenn ein Ton ohne Sprache als Sprache behandelt werden soll, kann ein Sprachmerker V = 1 einem Tonrahmen ohne Sprache hinzugefügt werden.
Falls die Steuereinheit 6 beim Schritt S90 feststellt, daß der vorige Rahmen ohne Sprache ist, wird "1" vom Wert des Rahmennummerzählers n subtrahiert, wobei der Rahmennummerzähler wird um 1 erniedrigt (Schritt S93). Es wird festgestellt, ob der Wert des Zählers n kleiner als "0" ist (Schritt S94). Im Falle von JA beim Schritt S94 wird ein Code, der einen Ton ohne Sprache darstellt, den Sprachcodierungsdaten hinzugefügt (Schritt S95) und dieser Prozeß ist abgeschlossen.
Falls die Systemsteuereinheit 6 beim Schritt S89 feststellt, daß der vorige Rahmen eine Tonpause ist, wird ein Code (Tonpause-Merker V = 0) hinzugefügt, der anzeigt, daß der vorliegende Rahmen eine Tonpause ist (Schritt S96) und dieser Prozeß ist abgeschlossen.
Auf diese Weise werden Sprache V = 1, Tonpause V = 0 und Ton ohne Sprache voneinander unterschieden und ein Code, der dies anzeigt, wird den Sprachcodierungsdaten hinzugefügt. Nun wird ein Aufbau beschrieben, in dem Daten auf dem Hauptaufzeichnungsmediumsteil 100b (Speicher) im Halbleiterspeicherabschnitt 10 aufgezeichnet werden. Der in Fig. 2 dargestellte Sprachdatenteil 10B führt einen Aufzeichnungsvorgang aus, so daß ein Signal C (z. B. ausgedrückt durch ein 1-Bit-Signal) zum Initialisieren des Codierens dem Anfang aller Rahmendaten zugewiesen wird und ein Signal V (z. B. ausgedrückt durch ein 1-Bit-Signal), das Sprache/Tonpause anzeigt, wird einer Position direkt hinter den Rahmendaten zugewiesen.
Wenn ein Tonpause-Komprimierungsvorgang ausgeführt werden soll, wird nur ein Teil, bei dem Sprache festgestellt wurde, als Sprachdaten aufgezeichnet. Es wird jedoch der folgende Prozeß ausgeführt, bei dem 1 bis 3 Tonpause-Rahmen direkt nach einem Wechsel von Sprache zu einer Tonpause und eine Zeitdauer der Tonpause aufgezeichnet werden, und, wenn ein Tonpause-Teil wiedergegeben wird, wird der Tonpause- Teil für die Zeitdauer der Tonpause wiederholt.
Das Unterprogramm des beim Schritt S15 gezeigten (siehe Fig. 3) Wiedergabeprozesses wird unten unter Bezugnahme auf das in Fig. 8 dargestellte Ablaufdiagramm beschrieben.
Wenn die Systemsteuereinheit 6 feststellt, daß die Wiedergabetaste PLAY gedrückt wurde, wird das Unterprogramm des Wiedergabeprozesses gestartet. Die Systemsteuereinheit 6 erfaßt zu diesem Zeitpunkt die Zustände (Tonpause- Kompression, schnelle Wiedergabe, Geräuschunterdrückung und dergleichen) für die Sprachwiedergabe und setzt den internen Zähler zum Zählen der Anzahl von gelesenen Blöcken zurück (Schritt S61). Gemäß den erfaßten Zuständen wird ein Zustandsmodus der Sprachwiedergabe an den digitalen Signalprozessor 5 (DSP) übertragen (Schritt S62).
Danach berechnet die Systemsteuereinheit 6 eine Sprachdatenleseposition und steuert den Treiberschaltkreis 9 an, um die Position auf der Anzeigeeinheit 8 anzuzeigen (Schritt S63). Um eine Sprachnachrichtdatei im Sprachdatenteil 10B des Halbleiterspeicherabschnitts 10 zu laden, werden die Betriebsstartpositionsinformation, die im internen Speicherabschnitt gespeichert ist, und eine Adresse, die durch den Indexteil 10A berechnet wird, an den Speichersteuerschaltkreis 7 ausgegeben (Schritt S64).
Auf diese Weise werden 1-Blockdaten (z. B. Daten, die durch Unterteilen der Sprache in 20 ms-Blöcke erhalten werden) vom Sprachdatenteil 10B des Halbleiterspeicherabschnitts 10 in die Systemsteuereinheit 6 geladen (Schritt S65).
In diesem Fall stellt die Systemsteuereinheit 6 fest, ob ein schneller Abhörprozeß ausgeführt wird (Schritt S66). Im Falle von JA beim Schritt S66, wird ein weiterer 1-Block mit Daten vom Halbleiterspeicherabschnitt 10 geladen (Schritt S67).
Die Systemsteuereinheit 6 stellt fest, ob ein Zeitachsenkomprimierungsprozeß ausgerührt wird (Schritt S68). Im Falle von NEIN beim Schritt S68, wird ein Datenübertragungsprozeß zum digitalen Signalprozessor 5 (DSP) ausgeführt (Schritt S69).
Im Falle von JA beim Schritt S68, gibt die Systemsteuereinheit 6 einen Befehl zum Ausführen des Zeitachsenkomprimierungsprozesses an den digitalen Signalprozessor 5 aus (Schritt S70) und eine Datenübertragung zum digitalen Signalprozessor 5 wird ausgeführt (Schritt S69). Beim Zeitachsenkomprimierungsprozeß wird zu diesem Zeitpunkt z. B. ein TDHS-Schema (Oberwellensyntheseschema im Zeitbereich) verwendet.
Die Systemsteuereinheit 6 berechnet die Positions- (Betriebspositions-) Information von Daten, die auf der Grundlage von Daten im Indexteil 10A oder von Wiedergabepositionsdaten, die im internen Speicherabschnitt gespeichert sind, als nächstes wiedergegeben werden sollen, wodurch die im internen Speicherabschnitt gespeicherten Wiedergabepositionsdaten aktualisiert werden (Schritt S71).
Danach erfaßt die Systemsteuereinheit 6 einen Zustand, der anzeigt, ob die Stopp-Taste STOP (Stopp-Taste) gedrückt wurde (Schritt S72). Im Falle von JA beim Schritt S72, ist der Wiedergabeprozeß abgeschlossen; andernfalls kehrt der Ablauf zum Schritt S64 zurück, um den Wiedergabeprozeß unterbrechungsfrei auszuführen.
Gemäß dem sprachgesteuerten Aufzeichnungsgerät des ersten Ausführungsbeispiels kann auf diese Weise verhindert werden, daß ein Aufzeichnungsvorgang irrtümlicherweise durch Umgebungsgeräusche gestartet wird, wie z. B. einem Ton vom Türöffnen/-schließen oder vom Husten, und es kann verhindert werden, daß der Aufzeichnungsvorgang irrtümlich durch die Geräusche oder dergleichen aktiviert bleibt, wenn der Aufzeichnungsvorgang angehalten werden soll.
Ein Nachteil, wie z. B. ein Abschneiden eines Anfangsteils am Anfang eines Aufzeichnungsvorgangs kann verhindert werden, wobei eine verschwenderische Verwendung des Aufzeichnungsmediums unterbleibt, und ein Sprecher, der mit vielen Zwischenräumen spricht, kann das Aufzeichnungsmedium effizient verwenden.
Beim ersten Ausführungsbeispiel ist der digitale Signalprozessor 5 in der Systemsteuereinheit 6 eingeschlossen. Der digitale Signalprozessor 5 kann jedoch unabhängig von der Systemsteuereinheit 6 angeordnet werden.
Das zweite Ausführungsbeispiel wird unten beschrieben.
Fig. 9 ist ein Blockschaltbild, das den Aufbau eines sprachgesteuerten Aufzeichnungsgerätes gemäß dem zweiten Ausführungsbeispiel darstellt.
Wie dies in Fig. 9 dargestellt ist, weist das sprachgesteuerte Aufzeichnungsgerät gemäß dem zweiten Ausführungsbeispiel ein Mikrophon 1 zum Umwandeln von Sprache in ein elektrisches Signal wie beim ersten Ausführungsbeispiel auf. Ein Sprachausgangssignal vom Mikrophon 1 wird durch einen mit dem Mikrophon 1 verbundenen Mikrophonverstärker 2 (AMP) verstärkt. Ein Ausgabesignal vom Mikrophonverstärker 2 wird über einen Tiefpaßfilter 3 (LPF) in einen A/D-Wandler 4 eingegeben und ein unnötiges Frequenzband des durch den Mikrophonverstärker 2 verstärkten Sprachsignals wird abgeschnitten, um das Erzeugen von auslöschenden Geräuschen zu verhindern, und das analoge Sprachsignal wird in den A/D-Wandler 4 eingegeben.
Das analoge Sprachsignal wird durch den A/D-Wandler 4 in ein Digitalsignal umgewandelt und das Digitalsignal wird in einen digitalen Signalprozessor 5 (DSP) eingegeben. Der digitale Signalprozessor 5 wird durch eine Systemsteuereinheit 6A (die unten beschrieben werden soll) gesteuert, um auf der Grundlage einer vorbestimmten Formatierung einen Prozeß zur Komprimierungs-Umwandlung (Codierung) der digital umgewandelten Sprachsignaldaten oder einen Prozesses zur Dekomprimierungs-Konvertierung (Decodierung) der komprimierten Daten auszuführen.
Die Systemsteuereinheit 6A steuert den digitalen Signalprozessor 5 (DSP), um die komprimierten Sprachsignaldaten in einem Speicher 10A aufzuzeichnen. Der Aufbau und die Wirkungsweise der Systemsteuereinheit 6A wird später beschrieben.
Das Mikrophon 1, der Mikrophonverstärker 2, das Tiefpaßfilter 3, der A/D-Wandler 4 und der digitale Signalprozessor 5 bilden eine Sprachpegel- Erfassungseinrichtung.
Andererseits werden die Sprachsignaldaten, die Gegenstand eines vorbestimmten Prozesses in der Systemsteuereinheit 6A sind, durch den digitalen Signalprozessor 5 dekomprimiert und in einen D/A-Wandler 11 eingegeben.
Das durch den D/A-Wandler 11 in ein Analogsignal umgewandelte Sprachsignal läuft durch ein Tiefpaßfilter (nicht dargestellt), um ein unnötiges Frequenzband abzuschneiden und um das Quantisierungsrauschen zu reduzieren, und wird in einen Leistungsverstärker 12 (AMP) zum Verstärken des Sprachsignals eingegeben, um einen Lautsprecher anzutreiben. Das durch den AMP 12 verstärkte Sprachsignal wird durch den Lautsprecher 13 mitgeteilt.
Die Systemsteuereinheit 6A weist einen Mikroprozessor (CPU) auf, wirkt wie eine Steuereinrichtung zum Steuern der Vorgänge der jeweiligen Teile des sprachgesteuerten Aufzeichnungsgerätes und wirkt als eine Schwellwert- Einstelleinrichtung.
Der digitale Signalprozessor 5 und der Speicher 10A (Aufzeichnungsmedium) sind mit der Systemsteuereinheit 6A verbunden.
Ein Betriebseingabeabschnitt 32 zum Anzeigen eines Betriebsmodus oder dergleichen des sprachgesteuerten Aufzeichnungsgerätes ist mit der Systemsteuereinheit 6A verbunden und eine Anzeigeeinheit 8 zum Anzeigen eines Betriebsmodus, einer Aufzeichnungszeit und dergleichen ist über einen Treiberschaltkreis 9 mit der Systemsteuereinheit 6a verbunden.
Zusätzlich ist eine Stromversorgungssteuereinheit 31 zur Stromversorgung der Schaltkreise mit der Systemsteuereinheit 6A verbunden, wodurch die Schaltkreise gesteuert werden.
Der Betriebseingabeabschnitt 32 weist mehrere Betätigungstasten und Schalter auf, z. B. eine Aufzeichnungstaste REC, die als eine Aufzeichnungs- Einstell-Betriebseinrichtung dient, eine Wiedergabetaste PLAY, eine Stopp-Taste Stopp, die als eine Stoppmodus- Eingabe-Betriebseinrichtung dient, eine Taste FF für schnelles Vorspulen, eine erste Zurückspul-Taste REW, eine Taste SET, die als eine Sprachstart- Empfindlichkeitseinstell-Betriebseinrichtung dient, eine Taste STANDBY (STANDBY), die als eine Aufzeichnungsbereitschafts-Empfindlichkeitseinstell- Betriebseinrichtung dient, und eine Taste VAD, die als eine Sprachstart-Aufzeichnungsmodus-Einstelleinrichtung dient.
Beim zweiten Ausführungsbeispiel sind die Sprachstart- Empfindlichkeits-Einstelltaste SET und die Aufzeichnungsbereitschafts-Empfindlichkeits-Einstelltaste STANDBY im sprachgesteuerten Aufzeichnungsgerät angeordnet. Es können jedoch nicht nur diese, tatsächlich im Gerät angeordneten Tasten verwendet werden, sondern es können ebenso die Aufzeichnungstaste REC, die Wiedergabe-Taste PLAY, die Stopp-Taste STOPP, die Taste FF zum schnellen Vorspulen, die Schnellrückspul-Taste REW und die Sprachstart-Aufzeichnungsmodus-Einstelltaste VAD an Stelle der Sprachstart-Empfindlichkeits-Einstelltaste SET und der Aufzeichnungsbereitschafts-Empfindlichkeits-Einstelltaste STANDBY verwendet werden, oder die Sprachstart- Empfindlichkeits-Einstelltaste SET und die Aufzeichnungsbereitschafts-Empfindlichkeits-Einstelltaste STANDBY können durch eine gleichzeitige Betätigung einer Vielzahl von Tasten ersetzt werden.
Ein Betrieb des oben beschriebenen, so aufgebauten, sprachgesteuerten Aufzeichnungsgerätes wird unten beschrieben.
Da die Grundvorgänge, wie z. B. ein Aufzeichnungsvorgang, ein Wiedergabevorgang, ein Schnellvorspulvorgang, ein Schnellrückspulvorgang und dergleichen des zweiten Ausführungsbeispiels die gleichen wie diejenigen beim ersten Ausführungsbeispiel sind, wird eine Beschreibung hiervon ausgelassen. Das Verfahren des Feststellens von Ton/Tonpausen gemäß dem ersten Ausführungsbeispiel wird auch beim zweiten Ausführungsbeispiel verwendet. Das zweite Ausführungsbeispiel ist jedoch nicht auf das Feststellverfahren beschränkt.
Ein Unterprogramm eines Aufzeichnungsprozesses wird unten unter Bezugnahme auf das in Fig. 10 dargestellte Ablaufdiagramm beschrieben.
Wenn die Systemsteuereinheit 6A feststellt, daß die Aufzeichnungstaste REC gedrückt wurde, startet die Systemsteuereinheit 6A das Unterprogramm des Aufzeichnungsprozesses, um zu diesem Zeitpunkt den Zustand des VAD-Schalters zu erfassen (Schritt S121). Falls der VAD-Schalter in einen AUS-Zustand versetzt ist, steuert die Systemsteuereinheit 6A den digitalen Signalprozessor 5 an, um eine Sprachinformation, die vom A/D-Wandler 4 eingegeben wird, zu komprimieren, und die Systemsteuereinheit 6A startet den Aufzeichnungsbetriebsprozeß zum Ausführen eines Aufzeichnungsvorgangs zum Speicher 10A (Schritte S122 und S123).
Falls beim Schritt S121 der VAD-Schalter in einen AN-Zustand versetzt ist, erfaßt die Systemsteuereinheit 6A, ob die Sprachstart-Empfindlichkeits-Einstelltaste SET gedrückt wurde (S124). Im Falle von JA beim Schritt S124, lädt die Systemsteuereinheit 6A einen Energiepegel der durch den digitalen Signalprozessor 5 erfaßten Sprache (Schritt S125) und stellt den Pegel oder einen Pegel ein, der geringfügig kleiner als der Pegel eines ersten Schwellwerts TH1 ist (Schritt S126).
Gleichzeitig steuert die Systemsteuereinheit 6A den digitalen Signalprozessor 5 an, um die vom A/D-Wandler 4 eingegebene Sprachinformation zu komprimieren und startet einen Aufzeichnungsvorgangsprozeß zum Ausführen eines Aufzeichnungsvorgangs zum Speicher 10A (Schritte S122 und S123).
Falls beim Schritt S124 die SET-Taste nicht gedrückt wurde, erfaßt die Systemsteuereinheit 6A, ob die Aufzeichnungsbereitschafts-Empfindlichkeits-Einstelltaste STANDBY gedrückt wurde (S127). Im Falle von JA beim Schritt S127, lädt die Systemsteuereinheit 6A einen Energiepegel der durch den digitalen Signalprozessor 5 erfaßten Sprache (Schritt S128) und stellt den Pegel oder einen Pegel ein, der leicht niedriger als der Pegel eines zweiten Schwellwerts TH2 ist (Schritt S129).
Gleichzeitig hält die Systemsteuereinheit 6A den Vorgang des Aufzeichnens der komprimierten Sprachdaten zum Speicher 10A an und startet einen Aufzeichnungsbereitschaftsprozeß (Schritte S130 und S131).
Falls beim Schritt S127 die STANDBY-Taste nicht gedrückt wurde, lädt die Systemsteuereinheit 6A einen Energiepegel EL der vorliegenden, durch den digitalen Signalprozessor 5 erfaßten Sprache (Schritt S132) und vergleicht den Pegel EL mit dem Schwellwert TH1 oder TH2, um festzustellen, ob ein Aufzeichnungsprozeß gestartet ist oder der Aufzeichnungsbereitschaftszustand eingestellt ist (Schritte S133 bis S135).
Gemäß dem zweiten Ausführungsbeispiel werden auf diese Weise der Schwellwert zum Feststellen des Starts eines Aufzeichnungsvorgangs und der Schwellwert zum Feststellen eines Aufzeichnungsbereitschaftszustands beliebig und unabhängig voneinander eingestellt. Zu diesem Zeitpunkt können der Schwellwert zum Feststellen des Starts eines Aufzeichnungsvorgangs und der Schwellwert zum Feststellen eines Aufzeichnungsbereitschaftszustands verschieden voneinander sein oder gleich sein.
Wie oben beschrieben, werden bei diesem Ausführungsbeispiel die beiden Schwellwerte durch die SET-Taste bzw. die STANDBY-Taste eingestellt. Jedoch können der Schwellwert zum Feststellen des Starts eines Aufzeichnungsvorgangs und der Schwellwert zum Feststellen eines Aufzeichnungsbereitschaftszustands durch irgendeinen von diesen Tasten oder eine Betätigung einer weiteren Taste als gleichhohe Schwellwerte eingestellt werden.
Auf ähnliche Weise wird ein vorbestimmter Bezugswert durch einen Vorgang eingestellt, wobei der Schwellwert zum Feststellen des Anfangs eines Aufzeichnungsvorgangs und der Schwellwert zum Feststellen eines Aufzeichnungsbereitschaftszustands auf der Grundlage des Bezugswerts eingestellt werden können.
Wie dies in Fig. 11 dargestellt ist, führt der digitale Signalprozessor 5 beim Aufzeichnungsprozeß gleichzeitig eine Erfassung der Sprachenergie und ein Codierungsprozeß aus. Insbesondere unterteilt der digitale Signalprozessor 5 die vom A/D-Wandler 4 eingegebenen Sprachdaten in Einheiten von Rahmen (Daten, die 20 ms lang abgetastet wurden, werden als ein Rahmen definiert) (Schritt S141).
Ein Vorbetonungsprozeß und ein Hamming-Fenster-Prozeß werden an den Sprachdaten von jedem Rahmen ausgeführt (Schritt S142). Ein Sprachcodierungsprozeß wird ausgeführt (Schritt S143). Gemäß dem Prozeß wird die Sprachenergie für jeden Rahmen oder die Sprachenergie in Einheiten einer Vielzahl von Rahmen berechnet (Schritt S144). Der Energiewert wird an die Systemsteuereinheit 6A übertragen (Schritt S145) und dieser Prozeß ist abgeschlossen.
Gemäß dem sprachgesteuerten Aufzeichnungsgerät des zweiten Ausführungsbeispiels kann, wie oben beschrieben, beim Sprachstartaufzeichnungsmodus ein Schwellwert, der als ein Bezugswert zum Feststellen des Starts/der Bereitschaft des Aufzeichnungsvorgangs dient, auf der Grundlage eines Sprachpegels eingestellt werden, wenn die Sprachstart- Empfindlichkeits-Einstelltaste SET oder die Aufzeichnungsbereitschafts-Empfindlichkeits-Einstelltaste STANDBY gedrückt wurde. Aus diesem Grund muß im voraus kein Versuchsaufzeichnungsvorgang ausgeführt werden und mit dem Sprachstartpegel oder dem Aufzeichnungsbereitschaftspegel kann zuverlässig und einfach gestartet werden.
Beim zweiten Ausführungsbeispiel stellt die Systemsteuereinheit 6A die Schwellwerte ein und vergleicht jeden Schwellwert und den momentanen Sprachenergiepegel. Das Einstellen und der Vergleich können jedoch durch den digitalen Signalprozessor 5 ausgeführt werden.
Wie im ersten Ausführungsbeispiel kann der digitale Signalprozessor 5 in der Systemsteuereinheit 6A eingeschlossen sein.
Beim zweiten Ausführungsbeispiel können der obige Schwellwert und dergleichen nicht eingestellt werden, bis der Sprachstartaufzeichnungsmodus eingestellt ist. D. h., das Einstellen wird nur ausgeführt, wenn beim Schritt S121 der VAD-Schalter in einem AN-Zustand ist. Selbst wenn der Sprachstartaufzeichnungsmodus eingestellt ist, können jedoch die Schwellwerte und dergleichen im voraus durch Betätigung, z. B. einer eigenen Taste oder eines Schalters, oder der Aufzeichnungstaste REC, der Stopp-Taste STOPP und dergleichen eingestellt werden.
Wenn der Sprachstartaufzeichnungsmodus eingestellt ist, können auf diese Weise der Start und der Bereitschaftszustand des Gerätes auf der Grundlage der vorbestimmten Schwellwerte gesteuert werden.
Die obigen Betätigungselemente werden durch Anlegen einer Betätigungskraft an die Betätigungselemente betätigt, so daß die Betätigungselemente nach unten gedrückt oder verschoben werden. Die Betätigungselemente sind so ausgelegt, daß die Betätigungselemente automatisch in die ursprünglichen Zustände (Positionen) durch eine Federkraft oder dergleichen zurückkehren, wenn die Betätigungskraft zurückgenommen wird. Zusätzlich wird ein Signal, das erzeugt wird, wenn die Betätigungselemente betätigt werden, an die Systemsteuereinheit 6A ausgegeben.
Die sprachgesteuerten Aufzeichnungsgeräte gemäß dem dritten, vierten und fünften Ausführungsbeispiel, von denen jedes die gleiche Schaltkreisanordnung wie das sprachgesteuerte Aufzeichnungsgerät gemäß dem zweiten Ausführungsbeispiel aufweisen, demgegenüber aber einen Systemsteuereinheitsbetrieb aufweisen, der sich vom sprachgesteuerten Aufzeichnungsgerät gemäß dem zweiten Ausführungsbeispiel unterscheidet, werden unten nacheinander beschrieben.
Ein Betrieb einer Systemsteuereinheit 6A, wenn ein Aufzeichnungsvorgang beim sprachgesteuerten Aufzeichnungsgerät gemäß dem dritten Ausführungsbeispiel ausgeführt wird, wird unten unter Bezugnahme auf das Ablaufdiagramm in Fig. 12 beschrieben.
Im Anfangszustand befindet sich das sprachgesteuerte Aufzeichnungsgerät in Fig. 12 im EIN-Zustand, in dem seine Hauptstromversorgung angeschaltet ist und es wird angenommen, daß sich das Aufzeichnungsgerät in einem Stopp- Zustand oder einem anderen als dem Aufzeichnungszustand befindet.
Wie dies in Fig. 12 dargestellt ist, stellt die Systemsteuereinheit 6 in diesem Anfangszustand bei einem Schritt S201 fest, ob eine Aufzeichnungstaste REC zum Einstellen eines Aufzeichnungsmodus (Aufzeichnungsbetriebsart) in einen AN-Zustand versetzt ist, um einen Aufzeichnungsvorgang im Betriebseingabeabschnitt 32 auszuführen. Falls in diesem Zustand die Systemsteuereinheit 6A feststellt, daß die Aufzeichnungstaste REC gedrückt wurde, startet die Systemsteuereinheit 6A bei einem Schritt S202 einen Prozeß.
Wenn die Systemsteuereinheit 6A beim Schritt S201 feststellt, daß die Aufzeichnungstaste REC noch nicht gedrückt wurde, daß z. B. der Anfangszustand beibehalten wird, wird beim in Fig. 12 gezeigten Ablaufdiagramm eine Reihe von Abläufen (Aufzeichnungsvorgänge) beendet.
Beim Schritt S202 stellt die Systemsteuereinheit 6A fest, ob die Aufzeichnungstaste REC für eine vorbestimmte Zeitdauer oder länger gedrückt wurde, z. B. ob die Aufzeichnungstaste REC für 1 Sekunde oder länger kontinuierlich gedrückt wurde. Im Falle von NEIN beim Schritt S202, wird der Ablauf zu einem Schritt S208 verlagert, um das Gerät in einen gewöhnlichen Aufzeichnungsmodus zu versetzen und die Reihe von Abfolgen ist beendet.
Falls die Systemsteuereinheit 6A beim Schritt S202 feststellt, daß die Aufzeichnungstaste REC 1 Sekunde lang oder länger kontinuierlich gedrückt wurde, z. B. feststellt, daß ein vorbestimmter Vorgang ausgeführt wurde, der sich von einem Vorgang zum Einstellen eines Aufzeichnungsmodus durch die Aufzeichnungstaste REC unterscheidet, wird das Aufzeichnungsgerät dieses Ausführungsbeispiels in einen Sprachstartaufzeichnungsmodus versetzt, um den Betrieb der Sprachstart- Aufzeichnungseinrichtung auszuführen, und der Ablauf wird zu einem Schritt S203 verlagert.
Beim Schritt S203 wird ein Eingangspegel eines in das Mikrophon 1 eingegebenen Sprachsignals oder dergleichen festgestellt. Falls in diesem Fall festgestellt wird, daß der Eingangspegel des ins Mikrophon 1 eingegebenen Sprachsignals oder dergleichen gleich oder höher als ein vorbestimmter Pegel ist, wird der Ablauf zum Prozeß bei einem Schritt S205 verlagert. Beim Schritt S205 wird der Sprachstartaufzeichnungszustand eingestellt, es wird z. B. ein Aufzeichnungsvorgang automatisch gestartet.
Der Prozeß bei einem Schritt S206 wird gestartet. Beim Schritt S206 wird festgestellt, ob beim Betriebseingabeabschnitt 32 eine andere als die Aufzeichnungstaste REC gedrückt wurde.
Falls beim Schritt S203 festgestellt wird, daß der Eingangspegel des in das Mikrophon 1 eingegebenen Sprachsignals oder dergleichen niedriger als ein vorbestimmter Pegel ist, z. B. daß der Eingabepegel den vorbestimmten Pegel nicht erreicht, wird der Prozeß bei einem Schritt S204 gestartet.
Im Schritt S204 wird der Sprachstart- Aufzeichnungsbereitschaftszustand eingestellt, z. B. wird der Aufzeichnungsvorgang vorübergehend in einem Zustand angehalten, in dem der Sprachstartaufzeichnungsmodus eingestellt ist, kund ebenso wird der Aufzeichnungsbetriebsbereitschaftszustand eingestellt ist.
Der Prozeß beim Schritt S206 wird gestartet und es wird festgestellt, ob beim Betriebseingabeabschnitt 32 eine andere als die Aufzeichnungstaste gedrückt wurde.
Wenn beim Schritt S206 festgestellt wird, daß im Betriebseingabeabschnitt 32 keine andere als die Aufzeichnungstaste REC gedrückt wurde, bleibt der Sprachstartaufzeichnungsmodus eingestellt, der Ablauf kehrt zum Schritt S203 zurück und die auf den Schritt S203 folgenden Prozesse werden wiederholt.
Wenn beim Schritt S206 festgestellt wird, daß beim Betriebseingabeabschnitt 32 eine andere als die Aufzeichnungstaste REC gedrückt wurde, wird die Einstellung des Sprachstartaufzeichnungsmodus abgebrochen und der Prozeß bei einem Schritt S207 wird gestartet.
Beim Schritt S207 wird der Modus in einen anderen Modus umgeschaltet, der der beim Schritt S206 gedrückten Taste entspricht, die wiederum eine andere als die Aufzeichnungstaste REC ist, und eine Reihe von Abfolgen des Aufzeichnungsvorgangs wird beendet.
Wenn beim Betriebseingabeabschnitt 32 die Aufzeichnungstaste REC 1 Sekunde oder länger gedrückt wurde, wird, wie oben beim sprachgesteuerten Aufzeichnungsgerät gemäß dem dritten Ausführungsbeispiel beschrieben, der Sprachstartaufzeichnungsmodus eingestellt (Schritte S202 und S203).
Wenn beim Betriebseingabeabschnitt 32 die Aufzeichnungstaste REC kürzer als 1 Sekunde kontinuierlich betätigt wurde, wird der gewöhnliche Aufzeichnungsmodus eingestellt (Schritte S202 und S208).
Durch kontinuierliches Drücken der Aufzeichnungstaste REC für eine vorbestimmte Zeitdauer oder länger, wird ein Schaltvorgang in den Sprachstartaufzeichnungsmodus ausgeführt. Wenn andererseits der Sprachstartaufzeichnungsmodus eingestellt ist und die Aufzeichnungstaste REC kürzer als eine vorbestimmte Zeitdauer gedrückt wird (Schritt S7), wird der Sprachstartaufzeichnungsmodus abgebrochen.
Gemäß dem dritten Ausführungsbeispiel muß, wie oben beschrieben, keine eigene Taste speziell angeordnet werden, um einen Schaltvorgang in den Aufzeichnungsmodus auszuführen, und eine lästige Betätigung muß nicht ausgeführt werden. Zusätzlich kann durch willkürliches Betätigen der Aufzeichnungstaste REC zum Ausführen des Aufzeichnungsvorgangs eine Modusschaltbetätigung zwischen dem Sprachstartaufzeichnungsmodus und dem gewöhnlichen Aufzeichnungsmodus einfach ausgeführt werden.
Da die Anzahl von Teilen nicht erhöht werden muß, kann daher das dritte Ausführungsbeispiel zu einer Verkleinerung des Gerätes selbst und zu einer Verringerung der Herstellungskosten beitragen.
Da kein spezieller, eigener Schalter oder dergleichen zum Modusumschalten angeordnet ist, kann das folgende Mißgeschick verhindert werden: eine Schaltbetätigung in den Sprachstartaufzeichnungsmodus, die durch einen Bedienungsfehler oder dergleichen unerwartet ausgeführt wird, könnte verursacht werden, wenn der eigene Schalter betätigt wird.
Ein Betrieb eines sprachgesteuerten Aufzeichnungsgerätes gemäß dem vierten Ausführungsbeispiel der Erfindung wird unten unter Bezugnahme auf Fig. 13 beschrieben.
Fig. 13 ist ein Ablaufdiagramm, das einen Betrieb einer Systemsteuereinrichtung 6A darstellt, wenn im sprachgesteuerten Aufzeichnungsgerät gemäß dem vierten Ausführungsbeispiel der Erfindung ein Aufzeichnungsvorgang ausgeführt wird. Eine Betriebsabfolge (in Fig. 13 dargestellte Vorgänge vom Schritt S301 bis S303) eines Aufzeichnungsvorgangs beim vierten Ausführungsbeispiel ist identisch mit der Betriebsabfolge der Schritte S201 bis S203 des in Fig. 12 dargestellten Flußdiagramms. Deshalb wird eine Beschreibung der Vorgänge ausgelassen und die auf den Schritt S303 folgenden Vorgänge werden unten beschrieben.
Wie dies in Fig. 13 dargestellt ist, wird bei einem Schritt S302, wie beim in Fig. 12 dargestellten Schritt S202, das sprachgesteuerte Aufzeichnungsgerät gemäß dem vierten Ausführungsbeispiel in einen Sprachstartaufzeichnungsmodus versetzt, so daß eine Sprachstartaufzeichnungseinrichtung betätigt werden kann und der Prozeß beim Schritt S303 gestartet wird.
Beim Schritt S303 wird eine Feststellung des Eingabepegels eines am Mikrophon 1 eingegebenen Sprachsignals ausgeführt. Falls in diesem Fall festgestellt wird, daß der Eingabepegel des ins Mikrophon 1 eingegebenen Sprachsignals gleich oder höher als ein vorbestimmter Pegel ist, wird der Prozeß bei einem Schritt S307 gestartet.
Beim Schritt S307 wird der Sprachstartaufzeichnungszustand eingestellt, z. B. wird ein Aufzeichnungsvorgang automatisch gestartet. Der Prozeß bei einem Schritt S308 wird gestartet.
Beim Schritt S308 wird festgestellt, ob eine Aufzeichnungstaste REC gedrückt wurde.
Falls beim Schritt S303 festgestellt wird, daß der Eingangspegel des ins Mikrophon 1 eingegebenen Sprachsignals oder dergleichen niedriger als ein vorbestimmter Pegel ist, z. B. daß der Eingangspegel nicht den vorbestimmten Pegel erreicht, wird der Prozeß bei einem Schritt S304 gestartet.
Beim Schritt S304 wird der Sprachstart- Aufzeichnungsbereitschaftszustand eingestellt, z. B. ein Aufzeichnungsbetriebsbereitschaftszustand, bei dem der Aufzeichnungsvorgang vorübergehend in einem Zustand angehalten wird, in dem der Sprachstartaufzeichnungsmodus eingestellt wird. Der Ablauf wird zu einem Schritt S305 verlagert, um festzustellen, ob die Aufzeichnungstaste REC gedrückt wurde.
Im Falle von NEIN beim Schritt S305 oder S308, wird der Prozeß bei einem Schritt S309 gestartet.
Beim Schritt S309 wird festgestellt, ob eine andere als die Aufzeichnungstaste REC gedrückt wurde. Falls in diesem Fall festgestellt wird, daß keine andere als die Aufzeichnungstaste REC gedrückt wurde, wird der Sprachstartaufzeichnungsmodus beibehalten und der Prozeß beim Schritt S303 wieder gestartet, um die nachfolgenden Prozesse zu wiederholen.
Wenn beim Schritt S308 festgestellt wird, daß die Aufzeichnungstaste REC gedrückt wurde, wird die Einstellung des Sprachstartaufzeichnungsmodus abgebrochen während der Aufzeichnungsvorgang weiterhin ausgeführt wird und der Prozeß bei einem Schritt S311 gestartet wird.
Beim Schritt S311 wird ein Schaltvorgang in einen gewöhnlichen Aufzeichnungsmodus ausgeführt und die Reihe von Abfolgen wird beendet.
Wenn beim Schritt S305 festgestellt wird, daß die Aufzeichnungstaste REC gedrückt wurde, wird der Sprachstartaufzeichnungsbereitschaftszustand abgebrochen, die Einstellung des Sprachstartaufzeichnungsmodus wird abgebrochen und der Prozeß bei einem Schritt S306 wird gestartet. Beim Schritt S306 wird der eingestellte Modus des Gerätes in einen Stoppmodus umgeschaltet und die Reihe von Abfolgen wird beendet.
Wenn beim Schritt S309 festgestellt wird, daß beim Betriebseingabeabschnitt 32 eine andere als die Aufzeichnungstaste REC gedrückt wurde, wird der Prozeß bei einem Schritt S310 gestartet. Die Einstellung des Sprachstartaufzeichnungsmodus wird abgebrochen und der Modus wird in einen anderen Modus umgeschaltet, der der beim Schritt S306 gedrückten Taste entspricht, die wiederum eine andere als die Aufzeichnungstaste REC ist, und die Reihe von Abfolgen des Aufzeichnungsvorgangs werden beendet.
Wie oben beschrieben kann beim vierten Ausführungsbeispiel, wie beim dritten Ausführungsbeispiel, durch eine vorbestimmte Betätigung der Aufzeichnungstaste REC zum Ausführen des Aufzeichnungsvorgangs ein Modusumschaltvorgang zwischen dem Sprachstartaufzeichnungsmodus und dem gewöhnlichen Aufzeichnungsmodus einfach ausgeführt werden.
Da daher die Anzahl von Teilen nicht erhöht werden muß, kann das vierte Ausführungsbeispiel zu einer Verkleinerung des Gerätes selbst und zu einer Verringerung der Herstellungskosten beitragen.
Ein Betrieb des sprachgesteuerten Aufzeichnungsgerätes gemäß dem fünften Ausführungsbeispiel der Erfindung wird unten unter Bezugnahme auf Fig. 14 beschrieben.
Fig. 14 ist ein Flußdiagramm, das einen Betrieb einer Systemsteuereinheit 6A darstellt, wenn im sprachgesteuerten Aufzeichnungsgerät gemäß dem fünften Ausführungsbeispiel der Erfind 06115 00070 552 001000280000000200012000285910600400040 0002019629184 00004 05996ung ein Aufzeichnungsvorgang ausgeführt wird.
Im Anfangszustand ist das sprachgesteuerte Aufzeichnungsgerät in Fig. 14 in einen AN-Zustand versetzt, in dem seine Hauptstromversorgung angeschaltet ist und es wird angenommen, daß das Aufzeichnungsgerät in einen Stopp- Zustand oder einen anderen als den Aufzeichnungszustand versetzt ist.
Wie dies in Fig. 14 dargestellt ist, wird in diesem Anfangszustand bei einem Schritt S401 die Häufigkeit des Drückens einer Aufzeichnungstaste REC zum Einstellen eines Aufzeichnungsmodus beim Betriebseingabeabschnitt 32 innerhalb einer vorbestimmten Zeitdauer von z. B. 1 Sekunde geprüft, um einen Aufzeichnungsvorgang auszuführen. Falls in diesem Fall die Aufzeichnungstaste REC zweimal (oder häufiger) innerhalb einer vorbestimmten Zeitdauer (1 Sekunde) gedrückt wurde, wird das Gerät in einen Sprachstartaufzeichnungsmodus versetzt und der Prozeß bei einem Schritt S402 wird gestartet.
Wenn beim Schritt S401 die Aufzeichnungstaste DEC nur einmal innerhalb einer vorbestimmten Zeitdauer (1 Sekunde) gedrückt wurde, wird der Ablauf zu einem Schritt S407 verlagert. Beim Schritt S407 wird das Gerät in einen gewöhnlichen Aufzeichnungsmodus versetzt und die Reihe der Abläufe wird beendet.
Wenn beim Schritt S401 festgestellt wird, daß die Aufzeichnungstaste REC innerhalb einer vorbestimmten Zeitdauer (1 Sekunde) 0-mal gedrückt wurde, z. B. daß die Aufzeichnungstaste REC nicht gedrückt wurde, wird die in diesem Flußdiagramm dargestellte Abfolge von Aufzeichnungsvorgängen beendet.
Wenn, wie oben beschrieben, beim Schritt S401 festgestellt wird, daß die Aufzeichnungstaste REC zweimal (oder häufiger) innerhalb der vorbestimmten Zeitdauer (1 Sekunde) gedrückt wurde, wird das Gerät in den Sprachstartaufzeichnungsmodus versetzt. Danach wird der Ablauf zu einem Schritt S402 verlagert.
Beim Schritt S402 wird eine Feststellung des Eingabepegels des ins Mikrophon 1 eingegebenen Sprachsignals oder dergleichen ausgeführt. Falls in diesem Fall festgestellt wird, daß der Eingabepegel des ins Mikrophon 1 eingegebenen Sprachsignals oder dergleichen gleich oder höher als ein vorbestimmter Pegel ist, wird der Ablauf zu einem Schritt S404 verlagert. Beim Schritt S404 wird automatisch ein Sprachstartaufzeichnungszustand, z. B. ein Aufzeichnungsvorgang, gestartet. Bei einem Schritt S405 wird festgestellt, ob eine andere als die Aufzeichnungstaste REC gedrückt wurde.
Wenn beim Schritt S402 festgestellt wird, daß der Eingangspegel des ins Mikrophon 1 eingegebenen Sprachsignals niedriger als ein vorbestimmter Pegel ist, z. B. daß der Eingangspegel nicht den vorbestimmten wert erreicht, wird der Ablauf zu einem Schritt S403 verlagert. Beim Schritt S403 wird der Sprachstart- Aufzeichnungsbereitschaftszustand eingestellt, z. B. ein Aufzeichnungsbetriebsbereitschaftszustand, bei dem der Aufzeichnungsvorgang vorübergehend in einem Zustand angehalten wird, in dem der Sprachstartaufzeichnungsmodus eingestellt wird. Der Ablauf wird zum Schritt S405 verlagert, um festzustellen, ob die Aufzeichnungstaste REC gedrückt wurde.
Falls im Schritt S405 festgestellt wird, daß keine andere als die Aufzeichnungstaste REC gedrückt wurde, bleibt der Sprachstartaufzeichnungsmodus eingestellt und der Ablauf kehrt zum Schritt S402 zurück, um die darauffolgenden Prozesse zu wiederholen.
Wenn beim Schritt S405 festgestellt wird, daß eine andere als die Aufzeichnungstaste REC gedrückt wurde, wird die Einstellung des Sprachstartaufzeichnungsmodus abgebrochen und der Ablauf wird zu einem Schritt S406 verlagert. Der Modus wird in einen anderen Modus umgeschaltet, der der beim Schritt S405 gedrückten Taste entspricht, die wiederum eine andere als die Aufzeichnungstaste REC ist, und die Reihe von Abfolgen des Aufzeichnungsvorgangs wird beendet.
Wie dies oben beschrieben ist, wird beim sprachgesteuerten Aufzeichnungsgerät gemäß dem fünften Ausführungsbeispiel in Abhängigkeit der Häufigkeit des Drückens der Aufzeichnungstaste REC beim Betriebseingabeabschnitt 32 innerhalb der vorbestimmten Zeitdauer (z. B. 1 Sekunde) ein Modusumschaltvorgang zwischen dem gewöhnlichen Aufzeichnungsmodus und dem Sprachstartaufzeichnungsmodus (die Aufzeichnungsmodi oder Aufzeichnungsbetriebsarten) ausgeführt. Der Betrieb der Sprachstart- Aufzeichnungseinrichtung kann durch mehrfaches Drücken der Aufzeichnungstaste REC ausgeführt werden.
Im einzelnen wird der gewöhnliche Aufzeichnungsmodus eingestellt, wenn beim Betriebseingabeabschnitt 32 die Aufzeichnungstaste REC innerhalb 1 Sekunde einmal gedrückt wurde. Andererseits wird der Sprachstartaufzeichnungsmodus eingestellt, wenn die Aufzeichnungstaste REC mehrmals innerhalb 1 Sekunde gedrückt wurde.
Wenn im Sprachstartaufzeichnungsmodus eine andere als die Aufzeichnungstaste REC gedrückt wurde, z. B. in einem Zustand, in dem die Sprachstartaufzeichnungseinrichtung betätigt werden kann, wird der Sprachstartaufzeichnungsmodus abgebrochen. In diesem Fall wird der Modus in einen anderen Modus umgeschaltet, wie z. B. in einen Stoppmodus oder einen gewöhnlichen Aufzeichnungsmodus.
Wie oben beschrieben kann gemäß dem fünften Ausführungsbeispiel dieselbe Wirkung wie beim dritten oder vierten Ausführungsbeispiel erreicht werden.
Beim dritten bis fünften Ausführungsbeispiel wird ein digitales Aufzeichnungsgerät als das sprachgesteuerte Aufzeichnungsgerät verwendet. Jedoch ist das sprachgesteuerte Aufzeichnungsgerät nicht auf das digitale Aufzeichnungsgerät beschränkt und die Erfindung kann auf ein analoges Aufzeichnungsgerät angewendet werden, das ein Magnetband oder dergleichen als ein Aufzeichnungsmedium verwendet. In diesem Fall kann die gleiche Wirkung wie oben beschrieben leicht erreicht werden.

Claims (16)

1. Sprachgesteuerte Aufzeichnungsvorrichtung mit:
einer Sprachpegel-Feststelleinrichtung (6), um festzustellen, ob eine eingegebene Sprache in den Einheiten von Rahmen, von denen jeder ein codiertes Sprachsignal enthält, ein Ton oder eine Tonpause ist;
einer Kontinuitäts-Überwachungseinrichtung (6) zum Überwachen einer Kontinuität eines Ton-Rahmens oder eines Tonpause-Rahmens; und
einer Aufzeichnungs-Steuereinrichtung (6), um auf der Grundlage eines Ausgangssignals von der Kontinuitäts- Überwachungseinrichtung den Start und das Anhalten eines Aufzeichnungsvorgangs zu steuern.
2. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 1, bei der ein Aufzeichnungsvorgang gestartet wird, wenn in einem Aufzeichnungs-Bereitschaftszustand kontinuierlich eine vorbestimmte Anzahl von Ton-Rahmen durch die Kontinuitäts-Überwachungseinrichtung erfaßt wird, und der Aufzeichnungsvorgang angehalten wird, wenn beim Aufzeichnungsvorgang kontinuierlich eine vorbestimmte Anzahl von Tonpause-Rahmen erfaßt wird.
3. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 2, die weiterhin eine Schwellwert- Einstelleinrichtung (6) aufweist, die es ermöglicht, in der Sprachpegel-Feststelleinrichtung einen Schwellwert zum Feststellen, ob die Sprache ein Ton oder eine Tonpause ist, einzustellen.
4. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 3, die weiterhin eine Aufzeichnungszeit-Ablauf- Änderungseinrichtung (6) zum Ändern der vorbestimmten Anzahl der kontinuierlich erfaßten Rahmen aufweist, um einen Zeitablauf des Starts oder Anhaltens des Aufzeichnungsvorgangs zu ändern.
5. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 1, bei der die Sprachpegel-Feststelleinrichtung auf der Grundlage des Pegels der eingegebenen Sprache feststellt, ob die eingegebene Sprache ein Ton oder eine Tonpause ist.
6. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 3, die weiterhin aufweist:
eine Sprachpegel-Erfassungseinrichtung (5) zum Erfassen des Pegels der eingegebenen Sprache; und
eine Sprachstart-Empfindlichkeitseinstell- Betriebseinrichtung, bei der die Schwellwerteinstelleinrichtung auf der Grundlage eines Sprachpegels einen Schwellwert einstellt, wenn ein Sprachstart-Empfindlichkeits-Einstellvorgang ausgeführt wird.
7. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 3, die weiterhin aufweist:
eine Sprachpegel-Erfassungseinrichtung (5) zum Erfassen des Pegels der eingegebenen Sprache; und
einer Sprachbereitschafts-Empfindlichkeitseinstell- Betriebseinrichtung, bei der die Schwellwert- Einstelleinrichtung auf der Grundlage eines Sprachpegels einen Schwellwert einstellt, wenn ein Sprachbereitschafts- Empfindlichkeits-Einstellvorgang ausgeführt wird.
8. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 3, die weiterhin aufweist:
eine Sprachpegel-Erfassungseinrichtung (5) zum Erfassen des Pegels der eingegebenen Sprache;
eine Sprachstart-Empfindlichkeitseinstell- Betriebseinrichtung; und
eine Sprachbereitschafts-Empfindlichkeitseinstell- Betriebseinrichtung, bei der die Schwellwert- Einstelleinrichtung auf der Grundlage eines Sprachpegels einen Schwellwert einstellt, wenn ein Sprachstart- Empfindlichkeits-Einstellvorgang oder ein Sprachbereitschafts-Empfindlichkeits-Einstellvorgang ausgeführt wird.
9. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 8, bei der sich ein Schwellwert zum Festlegen eines Pegels, bei dem ein Aufzeichnungsvorgang gestartet wird, von einem Schwellwert zum Festlegen eines Pegels unterscheidet, bei dem ein Aufzeichnungsvorgang in Bereitschaft ist.
10. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 9, bei der ein Schwellwert zum Festlegen eines Pegels, bei dem ein Aufzeichnungsvorgang gestartet wird, gleich einem Schwellwert zum Festlegen eines Pegels ist, bei dem ein Aufzeichnungsvorgang in Bereitschaft ist.
11. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 6, die weiterhin eine Aufzeichnungsbetriebsart- Einstell-Betriebseinrichtung zum Einstellen einer Aufzeichnungsbetriebsart aufweist, bei der ein Sprachstart- Empfindlichkeits-Einstellvorgang durch die Aufzeichnungsbetriebsart-Einstell-Betriebseinrichtung ausgeführt wird.
12. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 7, die weiterhin eine Stoppbetriebsart-Einstell- Betriebseinrichtung zum Einstellen einer Stopp-Betriebsart aufweist, bei der durch die Stoppbetriebsart-Einstell- Betriebseinrichtung ein Sprachbereitschafts- Empfindlichkeits-Einstellvorgang ausgeführt wird.
13. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 1, die weiterhin eine Aufzeichnungsbetriebsart- Einstell-Betriebseinrichtung zum Einstellen einer Aufzeichnungsbetriebsart aufweist, bei der eine Sprachstart-Aufzeichnungsbetriebsart eingestellt wird, wenn durch die Betriebsart-Einstell-Betriebseinrichtung ein vorbestimmter Vorgang ausgeführt wird, der nicht ein Vorgang zum Einstellen einer Aufzeichnungsbetriebsart ist.
14. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 13, bei der die Sprachstart- Aufzeichnungsbetriebsart eingestellt wird, indem die Aufzeichnungsbetriebsart-Einstell-Betriebseinrichtung für eine vorbestimmte Zeitdauer oder länger kontinuierlich und extern betätigt wird.
15. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 13, bei der die Sprachstart- Aufzeichnungsbetriebsart eingestellt wird, indem die Aufzeichnungsbetriebsart-Einstell-Betriebseinrichtung innerhalb einer vorbestimmten Zeitdauer extern mehrere Male betätigt wird.
16. Sprachgesteuerte Aufzeichnungsvorrichtung gemäß Anspruch 13, bei der die Sprachstart- Aufzeichnungsbetriebsart gelöscht wird, wenn die Aufzeichnungsbetriebsart-Einstell-Betriebseinrichtung betätigt wird während die Sprachstart- Aufzeichnungsbetriebsart eingestellt ist.
DE19629184A 1995-07-19 1996-07-19 Sprachgesteuerte Aufzeichnungsvorrichtung Expired - Lifetime DE19629184C2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP18307395 1995-07-19
JP7198741A JPH0950655A (ja) 1995-08-03 1995-08-03 録音装置
JP7201933A JPH0950364A (ja) 1995-08-08 1995-08-08 音声起動録音装置

Publications (2)

Publication Number Publication Date
DE19629184A1 true DE19629184A1 (de) 1997-01-30
DE19629184C2 DE19629184C2 (de) 2001-05-17

Family

ID=27325246

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19629184A Expired - Lifetime DE19629184C2 (de) 1995-07-19 1996-07-19 Sprachgesteuerte Aufzeichnungsvorrichtung

Country Status (3)

Country Link
US (1) US6031915A (de)
DE (1) DE19629184C2 (de)
GB (1) GB2303471B (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19735254A1 (de) * 1997-08-14 1999-02-18 Cohausz Helge B Vorrichtung zum Aufzeichnen von Bildinformationen von Ereignissen vor einem fahrenden Kraftfahrzeug
DE19808585A1 (de) * 1998-02-28 1999-09-02 Hoermansdoerfer Verfahren und Vorrichtung für die Zurverfügungstellung von Informationen für Vortragende
DE10120168A1 (de) * 2001-04-18 2002-10-24 Deutsche Telekom Ag Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4397054B2 (ja) * 1996-06-13 2010-01-13 株式会社ニコン 情報入力装置
JP3593814B2 (ja) * 1996-09-18 2004-11-24 ソニー株式会社 記録再生装置
US7610109B2 (en) * 1996-09-18 2009-10-27 Sony Corporation Recording and/or reproducing apparatus and recording apparatus
US7415315B2 (en) * 1996-09-18 2008-08-19 Sony Corporation Recording and/or reproducing apparatus and recording apparatus
US7409252B2 (en) * 1996-09-18 2008-08-05 Sony Corporation Recording and/or reproducing apparatus and recording apparatus
JPH10336711A (ja) * 1997-03-31 1998-12-18 Fujitsu Ltd アナログ・ディジタル統合加入者回路
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method
KR100287366B1 (ko) * 1997-11-24 2001-04-16 윤순조 엠피이지 방식을 이용한 휴대용 음향 재생장치 및 방법
US6321129B1 (en) * 1998-03-17 2001-11-20 Dictaphone Corporation Enhanced user control operations for portable digital audio recorder
US6314331B1 (en) * 1998-03-17 2001-11-06 Dictaphone Corporation Enhanced user control operations for sound recording system
US6621834B1 (en) * 1999-11-05 2003-09-16 Raindance Communications, Inc. System and method for voice transmission over network protocols
US6606281B2 (en) * 2000-06-15 2003-08-12 Digital Networks North America, Inc. Personal audio player with a removable multi-function module
WO2002023373A1 (en) * 2000-09-11 2002-03-21 The Marketing Store Worldwide, L.P. Sound activated circuit
GB2400667B (en) * 2003-04-15 2006-05-31 Hewlett Packard Development Co Attention detection
US20040264938A1 (en) * 2003-06-27 2004-12-30 Felder Matthew D. Audio event detection recording apparatus and method
JP2006014150A (ja) * 2004-06-29 2006-01-12 Matsushita Electric Ind Co Ltd 端末、ネットワークカメラとプログラム、及びネットワークシステム
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
KR100677554B1 (ko) * 2005-01-14 2007-02-02 삼성전자주식회사 비임형성 방식을 이용한 녹음 장치 및 그 방법
KR100714721B1 (ko) * 2005-02-04 2007-05-04 삼성전자주식회사 음성 구간 검출 방법 및 장치
JP2007183410A (ja) * 2006-01-06 2007-07-19 Nec Electronics Corp 情報再生装置および方法
TW200744068A (en) * 2006-05-30 2007-12-01 Inventec Appliances Corp Voice file retrieving method
CN101025981B (zh) * 2007-01-23 2010-04-07 无敌科技(西安)有限公司 一种数字录音系统及方法
US20080199015A1 (en) * 2007-02-16 2008-08-21 Kenna Okko Infant speech recording device
JP2009277278A (ja) * 2008-05-13 2009-11-26 Funai Electric Co Ltd 音声処理装置
JP2010093624A (ja) * 2008-10-09 2010-04-22 Panasonic Corp 音声出力装置
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
SG189182A1 (en) 2010-10-29 2013-05-31 Anhui Ustc Iflytek Co Ltd Method and system for endpoint automatic detection of audio record
CN102456343A (zh) * 2010-10-29 2012-05-16 安徽科大讯飞信息科技股份有限公司 录音结束点检测方法及系统
US8996059B2 (en) 2012-07-19 2015-03-31 Kirusa, Inc. Adaptive communication mode for recording a media message
CN103778925B (zh) * 2012-10-22 2017-09-22 爱国者电子科技有限公司 录音电路关闭状态下控制录音的录音装置
US10297283B2 (en) * 2014-01-06 2019-05-21 Gibson Brands, Inc. Selective sound storage device
US10558334B2 (en) * 2014-03-31 2020-02-11 Htc Corporation Electronic device and method for messaging
CN110827845B (zh) * 2019-11-18 2022-04-22 西安闻泰电子科技有限公司 录音方法、装置、设备及存储介质
DE102019133684A1 (de) * 2019-12-10 2021-06-10 Sennheiser Electronic Gmbh & Co. Kg Vorrichtung zur Konfiguration einer Drahtlos-Funkverbindung und Verfahren zur Konfiguration einer Drahtlos-Funkverbindung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3873772A (en) * 1971-01-07 1975-03-25 Compur Werk Gmbh & Co Speech controlled switching arrangement
DE3149134A1 (de) * 1980-12-19 1982-07-29 Western Electric Co., Inc., 10038 New York, N.Y. Verfahren und vorrichtung zur bstimmung von sprachendpunkten

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4006309A (en) * 1975-10-20 1977-02-01 The United States Of America As Represented By The Secretary Of The Navy Voice operated relay
DE3236000A1 (de) * 1982-09-29 1984-03-29 Blaupunkt-Werke Gmbh, 3200 Hildesheim Verfahren zum klassifizieren von audiosignalen
JPH0670756B2 (ja) * 1987-04-17 1994-09-07 三洋電機株式会社 音声録音再生装置の録音制御回路
JP2551050B2 (ja) * 1987-11-13 1996-11-06 ソニー株式会社 有音無音判定回路
US4893197A (en) * 1988-12-29 1990-01-09 Dictaphone Corporation Pause compression and reconstitution for recording/playback apparatus
US5293273A (en) * 1990-08-28 1994-03-08 Touchstone Applied Science Associates, Inc. Voice actuated recording device having recovery of initial speech data after pause intervals
FR2677828B1 (fr) * 1991-06-14 1993-08-20 Sextant Avionique Procede de detection d'un signal utile bruite.
US5259035A (en) * 1991-08-02 1993-11-02 Knowles Electronics, Inc. Automatic microphone mixer
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
US5563952A (en) * 1994-02-16 1996-10-08 Tandy Corporation Automatic dynamic VOX circuit
US5619554A (en) * 1994-06-08 1997-04-08 Linkusa Corporation Distributed voice system and method
US5598466A (en) * 1995-08-28 1997-01-28 Intel Corporation Voice activity detector for half-duplex audio communication system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3873772A (en) * 1971-01-07 1975-03-25 Compur Werk Gmbh & Co Speech controlled switching arrangement
DE3149134A1 (de) * 1980-12-19 1982-07-29 Western Electric Co., Inc., 10038 New York, N.Y. Verfahren und vorrichtung zur bstimmung von sprachendpunkten

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19735254A1 (de) * 1997-08-14 1999-02-18 Cohausz Helge B Vorrichtung zum Aufzeichnen von Bildinformationen von Ereignissen vor einem fahrenden Kraftfahrzeug
DE19808585A1 (de) * 1998-02-28 1999-09-02 Hoermansdoerfer Verfahren und Vorrichtung für die Zurverfügungstellung von Informationen für Vortragende
DE10120168A1 (de) * 2001-04-18 2002-10-24 Deutsche Telekom Ag Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen
US7277847B2 (en) 2001-04-18 2007-10-02 Deutsche Telekom Ag Method for determining intensity parameters of background noise in speech pauses of voice signals

Also Published As

Publication number Publication date
GB2303471A (en) 1997-02-19
GB2303471B (en) 2000-03-22
US6031915A (en) 2000-02-29
DE19629184C2 (de) 2001-05-17
GB9615041D0 (en) 1996-09-04

Similar Documents

Publication Publication Date Title
DE19629184C2 (de) Sprachgesteuerte Aufzeichnungsvorrichtung
DE69730556T2 (de) Vorrichtung zur Sprachaufnahme und -wiedergabe
DE3534064C2 (de)
DE69829802T2 (de) Spracherkennungsapparat zum Übertragen von Sprachdaten auf einem Datenträger in Textdaten
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE10053732B4 (de) Gerät und Verfahren zum Schreiben und Wiedergeben von Daten
DE3888631T2 (de) System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen.
DE3943353A1 (de) Pausesteuerung fuer eine aufzeichnungs/wiedergabevorrichtung
DE69534561T2 (de) Sender-empfänger
DE69721404T2 (de) Diktiersystem
DE10040404A1 (de) Verfahren und Vorrichtung zur Aufzeichnung/Wiedergabe von Daten
WO1999053742A2 (de) Hörgerät-anpasseinrichtung
DE3430850C2 (de)
DE69222578T2 (de) Tonaufnahme- und Wiedergabegerät
DE19835851A1 (de) Speicher- und Wiedergabevorrichtung
DE69326191T2 (de) Plattenaufzeichnungsgerät und Plattenaufzeichnungsverfahren
DE69317134T2 (de) Methode und Gerät zum Schneiden eines Tonsignals
DE3942718A1 (de) Diktier-/abschreibsteuerung fuer ein digitales diktiersystem
DE69318494T2 (de) Plattenaufzeichnungsgerät
DE69809464T2 (de) Verfahren und anordnung zur vereinfachten aufnahme und wiedergabe von analogen signalen
EP0372639A2 (de) System zur Spracherkennung
DE60302333T2 (de) Optimierung der Wiedergabe einer MIDI-Datei
DE60022269T2 (de) Sprachbasiertes Manipulationsverfahren und -gerät
EP2273506B1 (de) Aufnahme-, Verarbeitungs- und Übertragungsvorrichtung zum Speichern, Verarbeiten und Übertragen von Audio-Signalen
EP1252626B1 (de) Abspielgerät für komprimierte audiodaten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
R071 Expiry of right