DE60038535T2

DE60038535T2 - Verfahren und vorrichtung, speicherverfahren und - vorrichtung zur informationsbeschaffung und verarbeitung

Info

Publication number: DE60038535T2
Application number: DE60038535T
Authority: DE
Inventors: Masayoshi Shinagawa-ku MIURA; Susumu Shinagawa-ku YABE
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-08-26
Filing date: 2000-08-25
Publication date: 2009-07-02
Anticipated expiration: 2020-08-26
Also published as: US20070127735A1; WO2001016935A1; US8165306B2; US7260226B1; CN1327573A; CN1178201C; EP1132890B1; EP1132890A4; EP1887561A2; DE60038535D1; EP1132890A1; KR20010089358A; KR100782286B1; EP1887561A3

Description

Technisches Gebiet
Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Einrichtung zum Beschaffen des Tons eines spezifischen Instruments, einer Person oder eines Tiers von einem Audiosignal und/oder des Bilds einer spezifischen Person oder einer spezifischen Szene von einem Videosignal. Die vorliegende Erfindung bezieht sich außerdem auf ein Verfahren und eine Vorrichtung, um Information zu speichern, wobei ein derartiges Beschaffungsverfahren verwendet wird.
Technischer Hintergrund
Es kann Notwendigkeiten geben, um beispielsweise ein spezifisches Teil des Audiosignals sich zu beschaffen, welches die aufgezeichnete Diskussion einer Konferenz zeigt.
Üblicherweise kann beispielsweise ein spezifisches Teil des Audiosignals, welches die aufgezeichnete Diskussion einer Konferenz zeigt und durch den Benutzer einer Aufzeichnung erwünscht wird, durch Setzen eines Markierers auf das spezifische Teil im Zeitpunkt der Aufzeichnung beschafft werden, so dass der Benutzer dieses Teil zu irgendeinem Zeitpunkt, den er wünscht, sich beschaffen kann.
Es ist ein Verfahren zum Aufzeichnen eines Tonsignals bekannt, wobei Zählerstände oder Zeitpunkte (normalerweise ausgedrückt in Sekunden, Minuten und Stunden) vom Start der Aufzeichnung gelesen werden, so dass irgendein Teil des Tonsignals einen entsprechenden numerischen Wert hat, der zu diesem hinzugefügt ist.
Der Benutzer muss jedoch eines der obigen Verfahren auswählen, sei es ein Verfahren, um Markierer zu setzen, oder das, um Zählerstände aufzuzeichnen, um abzuwägen, welches Teil des aufgezeichneten Audiosignals er zu beschaffen wünscht und später zu verwenden wünscht. Diese Verfahren sind daher mit den folgenden Problemen behaftet:

1. Der Benutzer muss einen unabhängigen und mühsamen Betrieb auszuführen, um Markierer zu setzen oder Zählerstände oder Zeitgaben aufzuzeichnen.
2. Der Benutzer kann nicht irgendein Teil des Audiosignals sich beschaffen, bei dem kein Markierer gesetzt ist oder kein Zählerstand aufgezeichnet ist.
3. Das Teil des Signals einer Sprache eines spezifischen Sprechers einer Konferenz oder eine Abstimmung eines spezifischen Instruments eines Konzerts kann nicht beschafft werden. Anders ausgedrückt können die Sprachen eines spezifischen Sprechers einer Konferenz oder die Abstimmungen eines spezifischen Instruments eines Konzerts nicht aussortiert werden.
4. Da das eigene Audiosignal mit Markierern oder Zählerständen aufzuzeichnen ist, ist es nicht möglich, ein Teil eines Audiosignals mittels mehrerer Beschaffungen, ohne dies aufzuzeichnen, sich zu beschaffen und zu sortieren.

WILCOX L ET AL: "Annotation and segmentation for multimedia indexing and retrieval" SYSTEMS SCIENCES, 1998, PROCEEDINGS OF THE THIRTY-FIRST HAWAII INTERNATIONAL, CONFERENCE ON KOHALA COAST, HI, USA 6–9. JAN. 1998, LOS ALAMITOS, CA, USA, IEEE COMPUT. COS, US, Band 2, 6. Januar 1998 (06.01.1998), Seite 259-266.
Im Hinblick auf die obigen Umstände ist es daher eine Aufgabe der vorliegenden Erfindung, ein Verfahren nach Anspruch 1 und eine Vorrichtung nach Anspruch 19 bereitzustellen, mit denen das Teil einer Sprache eines spezifischen Sprechers oder eine Abstimmung eines spezifischen Instruments von dem aufgezeichneten Audiosignal beschafft werden kann, ohne einen Betrieb erforderlich zu machen, Markierungen zu setzen oder Zählerstände oder Zeitgaben im Zeitpunkt der Aufzeichnung des Audiosignals aufzuzeichnen.
Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, ein Verfahren und eine Vorrichtung bereitzustellen, welche ein spezifisches Teil eines Audiosignals sich beschaffen können, welches von einer spezifischen Tonquelle erzeugt wird, wobei das Teil des Signals als Beschaffungsstichwort verwendet wird.
Gemäß der Erfindung werden die obigen Aufgaben und weiteren Aufgaben der Erfindung durch Bereitstellen eines Tonbeschaffungsverfahrens erreicht, um einen Teil eines Audiosignals sich zu beschaffen, welches zu analysieren ist, welches einem oder mehr als einem der Audiosignale ähnelt, die so wie viele Beschaffungsschlüssel arbeiten, wobei jeder der Beschaffungsschlüssel-Tonkenndaten-Parameter, welche von den entsprechenden Audiosignalen erlangt werden, welche als Beschaffungsschlüssel und unabhängig von strukturellen Faktoren der Tonquelle der Audiosignale arbeiten, mit dem Tonkenndatenparameter verglichen wird, welche durch Analysieren des Audiosignals, welches zu analysieren ist, erlangt wird und rechnerisch die Ähnlichkeit zwischen diesen bestimmt wird.
Gemäß der Erfindung wird außerdem ein Toninformations-Speicherverfahren nach Anspruch 12, der beigefügt ist, geliefert.
Weitere andere Gesichtspunkte und/oder Merkmale sind in den angehängten Ansprüchen beschrieben.
1 ist ein schematisches Blockdiagramm einer ersten Ausführungsform einer Tonbeschaffungseinrichtung nach der Erfindung;
2A bzw. 2B zeigen ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform der Sprache eines Manns;
3A bzw. 3B zeigen eine typische Frequenzkomponenten-Musterverteilung und eine Zeitschwingungsform der Sprache einer Frau;
4A und 4B zeigen ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform eines Saxophons;
5A und 5B zeigen ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform einer Bassgitarre;
6 ist ein Flussdiagramm der Arbeitsweise zum Registrieren eines Beschaffungsschlüssels der ersten Ausführungsform;
7 ist ein Flussdiagramm zum Abrufen eines Betriebs der ersten Ausführungsform;
8A und 8B sind Beispiele von Anzeigen des Ergebnisses des Abrufbetriebs der ersten Ausführungsform;
9 ist ein weiteres Beispiel einer Anzeige des Ergebnisses des Beschaffungsbetriebs der ersten Ausführungsform;
10 ist ein noch weiteres Beispiel einer Anzeige des Ergebnisses des Beschaffungsbetriebs der ersten Ausführungsform;
11 ist ein schematisches Blockdiagramm einer zweiten Ausführungsform der Tonbeschaffungseinrichtung nach der Erfindung;
12 ist ein schematisches Blockdiagramm einer dritten Ausführungsform der Tonbeschaffungseinrichtung nach der Erfindung;
13 ist ein schematisches Blockdiagramm einer vierten Ausführungsform einer Tonbeschaffungseinrichtung nach der Erfindung;
14 ist eine schematische Darstellung eines Hauptteils einer fünften Ausführungsform der Tonbeschaffungseinrichtung nach der Erfindung;
15 ist ein Flussdiagramm des Betriebs eines Hauptteils der fünften Ausführungsform der Tonbeschaffungseinrichtung nach der Erfindung;
16 ist ein schematisches Blockdiagramm einer ersten Ausführungsform der Ton-/Bildinformations-Beschaffungseinrichtung nach Erfindung;
17 ist eine schematische Darstellung einer ersten Ausführungsform der Ton-/Bild-Informationsbild-Beschaffungseinrichtung nach der Erfindung.
Anschließend wird die vorliegende Erfindung unter Bezug auf die beiliegenden Zeichnungen beschrieben, welche die meisten bevorzugten Ausführungsformen der Erfindung zeigen.
Einige bevorzugte Ausführungsformen der Erfindung werden unter Bezug auf die Zeichnungen beschrieben.
1. Ausführungsform
1 ist ein schematisches Blockdiagramm einer ersten Ausführungsform der Erfindung. Die erste Ausführungsform wird angewandt, um das zugeführte Audiosignal, welches zu prüfen ist, welches üblicherweise einen Ton zeigt, welcher über ein Mikrofon aufgenommen wird, aufzuzeichnen, und das Aufzeichnungssignal wiederzugeben. Die Ausführungsform ist außerdem eingerichtet, Wiedergabe-Audiosignale sich zu beschaffen. Außerdem ist die Ausführungsform eingerichtet, Audiosignale, welche als Beschaffungsschlüssel dienen, von den zugeführten oder reproduzierten Audiosignal, welches zu prüfen ist, zu extrahieren, diese zu speichern und aktuell das zugeführte oder reproduzierte Audiosignal zu prüfen, wobei die gespeicherten Audiosignale verwendet werden, welche als Beschaffungsschlüssel arbeiten, sowie das Resultat der Prüfung auf einem Anzeigeabschnitt der Ausführungsform anzuzeigen.
Ein zugeführtes Audiosignal wird einer Schaltschaltung SW1 über den Eingangsanschluss 11 zugeführt. Die Schaltschaltung SW1 wird auf die Seite des Anschlusses a, wobei ein Schaltsteuersignal, welches vom Steuerabschnitt 10 zugeführt wird, wenn das Aufzeichnen des zugeführten Audiosignals durchgeführt wird, und auf die Seite des Anschlusses b umgeschaltet, durch ein Schaltsignal, welches auch vom Steuerabschnitt 10 zugeführt wird, wenn die Audiosignale, welche als Beschaffungsschlüssel arbeiten, von dem zugeführten Audiosignal extrahiert werden.
Das Audiosignal, welches auf der Seite des Anschlusses a der Schaltschaltung SW1 erlangt wird, wird auf einem Aufzeichnungsmedium 13, welches üblicherweise eine Speicherkarte, eine Magnetplatte, eine optische Platte, beispielsweise eine magneto-optische Platte oder eine Festplatte ist, über den Audiosignal-Aufzeichnungsabschnitt 12 aufgezeichnet. Der Audiosignal-Aufzeichnungsabschnitt 12 der Ausführungsform wird aktiv geschaltet, um einen Aufzeichnungsbetrieb durch ein Steuersignal durchzuführen, welches vom Steuerabschnitt 10 zugeführt wird, wenn eine Aufzeichnungsinstruktion zu ihm durch den Benutzer über den Tastenbetätigungsabschnitt 20 geliefert wird.
Das zugeführte Audiosignal, welches über den Eingangsanschluss 11 zugeführt wird, wird außerdem dem Eingangsanschluss IN der Schaltschaltung SW2 zugeführt. Ein Audioverstärker 15 und ein Lautsprecher 16 sind stromabwärts angeordnet und mit der Schaltschaltung SW2 verbunden, welche auf die Seite des Eingangsanschlusses IN geschaltet ist, durch ein Schaltsteuersignal vom Steuerabschnitt 10 mit der Ausnahme, wenn die Ausführungsform für die Signalwiedergabe, wie später beschrieben wird, betrieben wird. Daher, wenn die Ausführungsform nicht für die Signalwiedergabe betrieben wird, wird das zugeführte Audiosignal dem Lautsprecher 16 über den Audioverstärker 15 zugeführt, um den Ton des Audiosignals wiederzugeben.
Wenn eine Instruktion durch den Benutzer zur Signalwiedergabe über den Tastenbetätigungsabschnitt 20 gegeben wird, wird der Audiosignal-Wiedergabeabschnitt 14 durch das Steuersignal vom Steuerabschnitt 10 der Ausführungsform aktiviert, und das wiedergegebene Audiosignal, und welches vom Aufzeichnungsmedium 13 gelesen wird, wird dem Eingangsanschluss PB der Schaltschaltung SW2 zugeführt. Während des Betriebs der Signalwiedergabe wird die Schaltschaltung SW2 auf die Seite des Eingangsanschlusses PB durch das Schaltsteuersignal vom Steuerabschnitt 10 geschaltet. Daher wird das Wiedergabeaudiosignal zum Lautsprecher 16 über den Audioverstärker 15 geführt, um den Ton des Audiosignals wiederzugeben.
Das zugeführte Audiosignal, welches auf der Seite des Anschlusses a der Schaltschaltung SW1 erlangt wird, wird außerdem zu einem der Eingangsanschlüsse oder zum Eingangsschluss d der Schaltschaltung SW3 geführt. Der andere Eingangsanschluss oder der Eingangsanschluss c der Schaltschaltung SW3 wird mit dem Wiedergabeaudiosignal vom Audiosignal-Wiedergabeabschnitt 14 beliefert.
Die Schaltschaltung SW3 ist eingerichtet, das Audiosignal, welches zu prüfen ist, gemäß der Instruktion auszuwählen, um das Audiosignal zur Prüfung auszuwählen, welche durch den Benutzer über den Tastenbetätigungsabschnitt 20 gegeben wird.
Das Audiosignal, welches zu prüfen ist, wenn dies von der Schaltschaltung SW3 erlangt wird, wird dann zum Tonkenndatenparameter-Analyseabschnitt 21 geführt, der typisch die Tonkenndatenparameter analysiert, welche von strukturellen Faktoren von Tonquellen abhängig sind, beispielsweise den Strukturen und den Resonanzsystemen der Tonaussender, welche normalerweise voneinander verschieden sind. Die Tonkenndatenparameter, welche für den Zweck der Erfindung verwendet werden können, umfassen die Tonhöhenfrequenz, höhere harmonische Frequenzen der Tonhöhenfrequenz, Format-Frequenzen, Cepstrum-Information, lineare Vorhersagekoeffizienten und dessen Restsignal sowie einen PARCOR-Koeffizient.
2A und 2B zeigen entsprechend ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform der Stimme eines Manns, während 3A und 3B entsprechend ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform der Stimme einer Frau zeigen. 4A und 4B zeigen ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform eines Saxophons, während 5A und 5B ein typisches Frequenzkomponenten-Verteilungsmuster und eine Zeitschwingungsform einer Bassgitarre zeigen.
Obwohl 2A bis 5B einfache Frequenzkomponenten-Verteilungsmuster und Zeitschwingungsformen zeigen, können andere akustische Kenndaten in meisten Tönen hinsichtlich der Tonhöhenfrequenz, höherer harmonischen Frequenzen der Tönhöhenfrequenz, Formatfrequenzen usw. gefunden werden.
Neben eines Frequenzkomponenten-Verteilungsmusters können auch Tonkenndatenparameter, beispielsweise ein linearer Vorhersagekoeffizient und dessen Restsignal für den Zweck der Erfindung verwendet werden.
Es ist außerdem bekannt, dass intonierende Parameter, welche als Zeitschwankungen der Tonhöhenfrequenz erlangt werden, wirksam verwendet werden können, um Audiosignale zu charakterisieren. Unterschiedliche Situationen von der Sprache einer gleichen Person können auf Basis der Intonation identifiziert werden. Beispielsweise kann eine Person mit einer niedrigen Tonhöhe und niedriger Intonation sprechen, während sie traurig ist und/oder beunruhig ist. Daher kann Information bezüglich der Intonation auch als Tonkenndatenparameter zum Zwecke der Erfindung verwendet werden.
Die Tonkenndatenparameter vom Tonkenndatenparameter-Analyseabschnitt 21 werden zum Ähnlichkeitsbestimmungsabschnitt 22 geführt, wobei der Ähnlichkeitsbestimmungsabschnitt 22 rechnerisch die Ähnlichkeit (den Grad davon) jedes Tonkenndatenparameters des Audiosignals bestimmt, der als Beschaffungsschlüssel arbeitet (als Beschaffungsschlüssel-Tonkenndatenparameter bezeichnet), und dessen Gegenstück des Audiosignals, welches vom Tonkenndatenparameter-Analyseabschnitt 21 geprüft wird.
Die Arbeitsweise zum rechnerischen Bestimmen der Ähnlichkeit von zwei Tonkenndatenparametern des Ähnlichkeitsbestimmungsabschnitts 22 ist nicht eine auf Basis der Verwendung von Zeitserien-Schwingungsmustern von Tönen im Fall der Spracherkennung, sondern zur rechnerischen Bestimmung, wenn einige der strukturellen Faktoren der Tonquelle, beispielsweise die Struktur und das Resonanzsystem eines Tonsenders, ähnlich sind wie die Gegenstücke des Audiosignals, welches als Beschaffungsschlüssel dient (auch als Beschaffungsschlüssel-Audiosignal bezeichnet). Dieser Betrieb zum rechnerischen Bestimmen der Ähnlichkeit von zwei Tonkenndatenparametern kann ausgeführt werden, wenn das Audiosignal mit hoher Geschwindigkeit wiedergegeben wird.
Es sei nun angenommen, dass drei Parameter (x, y, z), welche üblicherweise eine Tonhöhenfrequenz und eine Formant-Frequenz aufweisen, als Tonkenndatenparameter für den Betrieb der Ähnlichkeitsbestimmung verwendet werden.
Außerdem sei angenommen, dass die Beschaffungsschlüssel-Tonkenndatenparameter des Audiosignals, welche als Beschaffungsschlüssel arbeiten, während einer Zeitperiode TW gleich (x0, y0, z0) sind, und die entsprechenden Töne des Audiosignals, welches zu prüfen ist, (xi, yi, zi) sind. Dann bestimmt der Ähnlichkeitsbestimmungsabschnitt 22 rechnerisch den Abstand S, welcher diese trennt, als Ähnlichkeit zwischen diesen. Die Zeitperiode TW wird vorher ausgewählt, wobei die Anzahl und die Arten der Parameter, die zu verwenden sind, und die Zeit, welche für den Betrieb der Ähnlichkeitsbestimmung erforderlich sind, in betracht gezogen werden: S = sqrt {(xi – x0)2 + (yi – y0)2 + (zi – z0)2}wobei sqrt das Quadrat des Werts in der Klammer ist.
Man wird es als vorteilhaft ansehen, dass, umso kleiner der Wert S ist, desto größer die Ähnlichkeit der beiden Audiosignale ist. Bei dieser Ausführungsform bestimmt der Ähnlichkeitsbestimmungsabschnitt 22 rechnerisch den Abstand S für jede vorgewählte Zeitperiode TW und beurteilt, ob das Audiosignal, welches zu prüfen ist, ähnlich dem Audiosignal ist, welches in Betrieb ist, als Beschaffungsschlüssel für die Zeitperiode TW, wenn der rechnerisch bestimmte Abstand S kleiner ist als ein vorgegebener Wert Sth, jedoch nicht ähnlich dem letzteren ist, wenn der bestimmte S nicht kleiner ist als der vorgegebene Wert Sth.
Da der Wert S selbst den Grad der Ähnlichkeit der beiden Audiosignale zeigt, ist es auch denkbar, unmittelbar den Abstand S auszugeben.
Das Ausgangsignal des Ähnlichkeitsbestimmungsabschnitts 22 hinsichtlich der Beurteilung der Ähnlichkeit der beiden Audiosignale wird dann dem Anzeigeabschnitt 24 über den Anzeigesteuerabschnitt 23 zugeführt. Der Anzeigesteuerabschnitt 23 bewirkt, dass der Anzeigebildschirm des Anzeigeabschnitts 24 das Ausgangssignal des Ähnlichkeitsbestimmungsabschnitts 22 hinsichtlich der Ähnlichkeitsbeurteilung hinsichtlich der Zeit vom Start des Audiosignals, welches zu prüfen ist, anzeigt. Insbesondere kann dieser üblicherweise einen Balken anzeigen, wie in 8A und 8B gezeigt ist, was später beschrieben wird.
Anschließend wird der Beschaffungsschlüssel dieser Ausführungsform beschrieben. Bei dieser Ausführungsform wird das Audiosignal, welches als Beschaffungsschlüssel zu verwenden ist, vom zugeführten Audiosignal oder vom reproduzierten Audiosignal extrahiert und vorher im Speicherabschnitt 32 gespeichert.
Das zugeführte Audiosignal, welches am Anschluss b der Schaltschaltung SW1 erlangt wird, wird dem Eingangsanschluss f der Schaltschaltung SW4 zugeführt, und das reproduzierte Audiosignal vom Audiosignal-Wiedergabeabschnitt 14 wird dem Eingangsanschluss e der Schaltschaltung SW4 zugeführt, wobei die Schaltschaltung SW4 eingerichtet ist, das Audiosignal, welche als Beschaffungsschlüssel arbeitet, entweder vom zugeführten Audiosignal oder vom reproduzierten Audiosignal zu extrahieren und gemäß der Instruktion umgeschaltet wird, um eines von diesen auszuwählen, welche durch den Benutzer über den Tastenbetätigungsabschnitt 20 über ein Steuersignal vom Steuerabschnitt 10 zugeführt wird.
Das Audiosignal von der Schaltschaltung SW4 wird zum Beschaffungsschlüssel-Audiosignal-Extraktion-/Speicherabschnitt 31 geliefert. Der Beschaffungsschlüssel-Audiosignal-Extraktions-/Speicherabschnitt 31 wird mit einem Steuersignal vom Steuerabschnitt 10 gemäß der Tastenbetätigung des Benutzers im Tastenbetätigungsabschnitt 20 beliefert.
Der Benutzer dieser Ausführungsform hört dem wiedergegebenen Ausgabeton des zugeführten Audiosignals oder des wiedergegebenen Audiosignals zu, welches vom Lautsprecher herkommt und betätigt die Beschaffungsschlüssel-Spezifizierungstaste (nicht gezeigt) des Tastebetätigungsabschnitts 20, wenn das Teil, welches er zu verwenden wünscht, als Beschaffungsschlüssel ankommt. Danach extrahiert die Ausführungsform ein Teil des Audiosignals entsprechend der vorgegebenen Zeitperiode TW einschließlich der Zeit der Tastenbetätigung und speichert das Teil im Beschaffungsschlüsselspeicher 32, wo der Beschaffungsschlüsselspeicher 32 Speicherbereiche hat, welche jeweils eine Größe haben, welche der eines Beschaffungsschlüssels entsprechen, so dass die Beschaffungsschlüssel in den entsprechenden Speicherbereichen gespeichert werden.
Der Beschaffungsschlüssel-Audiosignal-Extraktions-/Speicherabschnitt 31 hat einen Pufferspeicher, so dass die Zeitperiode TW etwas vor der Zeit der Tastenbetätigung beginnt. Danach wird das Teil des Audiosignals, welches der Zeitperiode TW entspricht, welche durch den Benutzer spezifiziert wird, im Beschaffungsschlüsselspeicher 32 als Beschaffungsschlüssel-Audiosignal gespeichert.
Der Beschaffungsschlüsselspeicher 32 kann mehrere Beschaffungsschlüssel speichern, und die Beschaffungsschlüssel-Speicherbereiche des Beschaffungsschlüsselspeichers 32 werden durch ein Steuersignal vom Steuerabschnitt 10 aktualisiert, jedes Mal dann, wenn ein neues Beschaffungsschlüssel-Audiosignal durch den Benutzer spezifiziert wird. Somit wird das Beschaffungsschlüssel-Audiosignal für die Zeitperiode TW, welche von dem Beschaffungsschlüssel-Extraktions-/Speicherabschnitt 31 gemäß der Instruktion des Benutzers extrahiert wird, in einem Beschaffungsschlüssel-Speicherbereich des Beschaffungsschlüsselspeichers 32 gemäß einem Schaltsteuersignal vom Steuerabschnitt 10 synchron mit der Aktualisierung der Beschaffungsschlüssel-Speicherbereiche gespeichert.
Obwohl nicht dargestellt können die Beschaffungsschlüssel-Speicherbereiche des Beschaffungsschlüsselspeichers 32, welche die entsprechenden Beschaffungsschlüssel-Audiosignale speichern, auch als Memo-Eingabe über den Tastenbetätigungsabschnitt 20 zugeführt werden, und die Memo-Eingabe kann auf den Anzeigeabschnitt 24 in Form einer Tabelle angezeigt werden, welche die Zahlen zeigt, welche den Speicherbereichen zugeordnet sind, welche die Beschaffungsschlüssel-Audiosignale speichern. Daher kann der Benutzer einen gewünschten Beschaffungsschlüssel verwenden, um ein Audiosignal sich zu beschaffen, wobei er die Zahl des Beschaffungsschlüssel-Speicherbereichs spezifiziert, der den Beschaffungsschlüssel speichert, den er zu verwenden wünscht.
Wenn insbesondere der Benutzer einen Beschaffungsmodus auswählt und die Nummer des Beschaffungsschlüssel-Speicherbereichs, welcher das Beschaffungsschlüssel-Audiosignal speichert, welches er zu verwenden wünscht, über den Tastenbetätigungsabschnitt 20 spezifiziert, wird die Schaltschaltung SW6 durch ein Steuersignal vom Steuerabschnitt 10 betätigt, und das Audiosignal, welches als Beschaffungsschlüssel arbeitet, wird von dem spezifizierten Beschaffungsschlüssel-Speicherbereich des Beschaffungsschlüsselspeichers 32 durch den Beschaffungsschlüssel-Audiosignal-Leseabschnitt 33 gelesen.
Das gelesene Beschaffungsschlüssel-Audiosignal wird dann zu einem Beschaffungsschlüssel-Tonkenndatenparameter-Analyseabschnitt 34 geführt und durch diesen analysiert, um einen Beschaffungsschlüssel-Tonkenndatenparameter für das Audiosignal zu erlangen, welches als Beschaffungsschlüssel arbeitet. Der erlangte Beschaffungsschlüssel-Tonkenndatenparameter wird dann zum oben beschriebenen Ähnlichkeitsbestimmungsabschnitt 22 geführt und verwendet, um das Audiosignal, welches zu prüfen ist, für die vorgegebene Zeitperiode TW zu beschaffen.
Anschließend wird die Arbeitsweise der Audiosignal- Beschaffungseinrichtung, welche den oben beschriebenen Aufbau hat, ausführlich erläutert.
Registrierung des Beschaffungsschlüssels
In dem Fall der oben beschriebenen Ausführungsform wird jeder Beschaffungsschlüssel registriert, bevor er für einen tatsächlichen Beschaffungsbetrieb verwendet wird. Wie oben beschrieben wird jeder Beschaffungsschlüssel im Beschaffungsschlüsselspeicher 32 gespeichert und als Audiosignal registriert. 6 ist ein Flussdiagramm des Betriebs zum Registrieren eines Beschaffungsschlüssels, wo der Steuerabschnitt 10 eine Hauptrolle spielt. Die Verarbeitungsroutine von 6 wird begonnen, wenn der Benutzer den Beschaffungsschlüssel-Registrierungsmodus über den Tastenbetätigungsabschnitt 20 auswählt. Anschließend wird der Betrieb zum Registrieren eines Beschaffungsschlüssels unter Bezug auf 6 beschrieben.
Zunächst bestimmt der Steuerabschnitt 10 die Modusauswahl des Benutzers, welche durch den Tastenbetätigungsabschnitt 20 ausgeführt wurde. Insbesondere bestimmt er, ob der Benutzer den Modus zum Extrahieren von Beschaffungsschlüsseln von einem zugeführten Audiosignal auswählt oder den Modus zum Extrahieren von Beschaffungsschlüsseln von einem wiedergegebenen Audiosignal (Schritt S101).
Wenn bestimmt wird, dass die Beschaffungsschlüssel vom zugeführten Audiosignal zu extrahieren sind, schaltet der Steuerabschnitt 10 die Schaltschaltung SW1, SW2 und SW4 entsprechend auf die Seite des Ausgangsanschlusses b, auf die des Eingangsanschlusses IN und die des Eingangsanschlusses f (Schritt S102).
Wenn dagegen bestimmt wird, dass Beschaffungsschlüssel von dem wiedergegeben Audiosignal zu extrahieren sind, schaltet der Steuerabschnitt 10 die Schaltschaltungen SW1, SW2 bzw. SW4 auf die Seite des Ausgangsanschlusses a, auf die des Eingangsanschlusses PB und die des Eingangsanschlusses 3 (Schritt S103).
Nach dem Schritt S102 oder S103 läuft der Steuerabschnitt 10 weiter zum Schritt S104, wo er auf die Instruktion des Benutzers wartet, welche über den Tastenbetätigungsabschnitt 20 eingegeben wird, welche das Teil des Audiosignals, welches als Beschaffungsschlüssel zu verwenden ist, spezifiziert. Im gleichen Zeitpunkt wird das Audiosignal, von welchem die Beschaffungsschlüssel zu extrahieren sind, dem Lautsprecher 16 über den Audioverstärker 15 zugeführt, und der Ursprungston wird vom Lautsprecher 16 reproduziert, so dass der Benutzer seine Instruktion über die Tastenbetätigungseinheit 10 eingeben kann, um jedes Teil des Audiosignals, welches als Beschaffungsschlüssel zu verwenden ist, zu spezifizieren, welches Teil einer Sprache eines spezifischen Lautsprechers einer Konferenz sein kann.
Nach Ermitteln der Instruktion, welche durch den Benutzer zugeführt wird, um ein Teil des Audiosignals als Beschaffungsschlüssel im Schritt S104 zu extrahieren, extrahiert der Steuerabschnitt 10 die Beschaffungsschlüssel-Speicherbereiche des Beschaffungsschlüsselspeichers 32 (Schritt S105) und steuert den Beschaffungsschlüssel-Audiosignal-Extraktions-/Speicherabschnitt 31, um zu veranlassen, dass er das Teil des Audiosignals, welches der vorgegebenen Zeitperiode TW entspricht, extrahiert (Schritt S106). Danach steuert der Steuerabschnitt den Betrieb zum Schreiben des extrahierten Teils des Audiosignals in einen aktualisierten spezifischen Beschaffungsschlüssel-Speicherbereich des Beschaffungsschlüsselspeichers 32 als Beschaffungsschlüssel (Schritt S107).
Danach bestimmt der Steuerabschnitt 10, ob eine Instruktion zum Beenden des aktuellen Modus zum Registrieren von Beschaffungsschlüsseln durch den Benutzer über den Tastenbetätigungsabschnitt 20 oder nicht ausgegeben wurde (Schritt S108). Wenn eine solche Instruktion vorhanden ist, beendet der Steuerabschnitt 20 die Verarbeitungsroutine des Modus zum Registrieren von Beschaffungsschlüsseln. Wenn dagegen eine Instruktion nicht vorhanden ist, kehrt der Steuerabschnitt 20 zurück zum Schritt S104, wo er auf eine andere Instruktion des Benutzers wartet, um einen Beschaffungsschlüssel zu extrahieren, um die obigen Schritte zu wiederholen.
Auf diese Weise können die Audiosignale, welche durch den Benutzer vom zugeführten Audiosignal oder vom wiedergegebenen Audiosignal extrahiert werden, als Beschaffungsschlüssel im Beschaffungsschlüsselspeicher 32 registriert und gespeichert werden. Wenn der Beschaffungsschlüsselspeicher 32 eine Speicherkapazität hat, die groß genug ist, diese neuen Beschaffungsschlüssel zu speichern, müssen die Audiosignale, welche schon im Speicher als Beschaffungsschlüssel gespeichert sind, nicht gelöscht werden und können dort verbleiben.
Gemäß der Erfindung kann, da die Ähnlichkeit von zwei Audiosignalen rechnerisch unter Verwendung eines Tonkenndatenparameters bestimmt wird, jedes Audiosignal, welches als Beschaffungsschlüssel im Beschaffungsschlüsseispeicher 32 gespeichert ist, nicht nur für Beschaffungsteile des ursprünglichen Audiosignals verwendet werden, welches diesem ähnelt, sondern auch für das Beschaffen von Teil von Audiosignalen, von denen die Beschaffungsschlüssel nicht extrahiert werden, wenn diese Teile diesem ähneln.
In dem Fall der Ausführungsform von 1 daher, wenn der Benutzer im Beschaffungsschlüsselspeicher 32 Audiosignale speichert, welche für eine vorgegebene Zeitperiode TW andauern und er wünscht, die Beschaffungsschlüssel zu verwenden, um einen spezifische Tonquelle zu prüfen, kann der Benutzer diese zu irgendeiner Zeit als Beschaffungsschlüssel, welche er wünscht, verwenden.
Beschaffungsbetrieb
Die Audiosignale, welche im Beschaffungsschlüsselspeicher 32 als Beschaffungsschlüssel gespeichert sind, werden für einen Beschaffungsbetrieb in der nachstehend beschriebenen Weise verwendet. 7 zeigt schematisch die Verarbeitungsroutine für einen Beschaffungsbetrieb. Die Verarbeitungsroutine von 7 wird begonnen, wenn der Benutzer den Beschaffungsbetriebsmodus über den Tastenbetätigungsabschnitt 20 auswählt. Anschließend wird der Beschaffungsbetrieb mit Hilfe von 7 erläutert.
Zunächst bestimmt der Steuerabschnitt 10 die Modusauswahl des Benutzers, welche über den Tastenbetätigungsabschnitt 20 ausgeführt wird. Insbesondere bestimmt er, ob der Benutzer den Modus eines Beschaffungsbetriebs auswählt, der hinsichtlich eines zugeführten Audiosignals durchzuführen ist, oder den Modus des Beschaffungsbetriebs, welcher in Bezug auf ein Wiedergabeaudiosignal auszuführen ist (Schritt 201).
Wenn bestimmt wird, dass ein Beschaffungsbetrieb hinsichtlich des zugeführten Audiosignals auszuführen ist, dreht der Steuerabschnitt 10 die Schaltschaltung SW1, SW2 und SW3 entsprechend auf die Seite des Ausgangsanschlusses a, auf die des Eingangsanschlusses IN und die des Eingangsanschlusses d (Schritt S202).
Wenn dagegen bestimmt wird, dass ein Beschaffungsbetrieb hinsichtlich des wiedergegebenen Audiosignals auszuführen ist, dreht der Steuerabschnitt 10 die Schaltschaltungen SW2 und SW3 entsprechend auf die Seite des Eingangsanschlusses PB und die des Eingangsanschlusses c (Schritt S203).
Nach dem Schritt S202 oder S203 läuft der Steuerabschnitt 10 weiter zum Schritt S204, wo er das Audiosignal erkennt, welches als Beschaffungsschlüssel durch den Benutzer ausgewählt wurde (Schritt S204) und steuert den Betrieb der Ausführungsform so, um das Audiosignal, welches als Beschaffungsschlüssel vom Beschaffungsschlüsselspeicher 32 ausgewählt wurde, zu lesen (Schritt S205).
Dann wird das Audiosignal, welches aus dem Speicher 32 als Beschaffungsschlüssel gelesen wird, zum Beschaffungsschlüssel-Tonkenndaten-Parameteranalyseabschnitt 34 geführt und dann zum Ähnlichkeitsbestimmungsabschnitt 22 als Beschaffungsschlüssel-Tonkenndatenparameter, wobei der Ähnlichkeitsbestimmungsabschnitt 22 die Ähnlichkeit zwischen dem Tonkenndatenparameter jeder Zeitperiode TW des Audiosignals, welches zu prüfen ist, auf Ähnlichkeit, und dem des Tonkenndatenparameters des Beschaffungsschlüssels, welcher ihm zugeführt ist, der rechnerisch bestimmt, prüft (Schritt S206). Wie oben beschrieben wird die Ähnlichkeit auf Basis des Abstandes S zwischen diesen in diesem Fall bestimmt.
Damit wird bestimmt, ob der Abstand S, der den Ähnlichkeitsgrad zeigt, kleiner ist als ein vorgegebener Schwellenwert Sth oder nicht (Schritt S207), und das Teil des ursprünglichen Audiosignals wird bestimmt, dass es dem Beschaffungsschlüssel ähnlich ist, wenn der Abstand S kleiner ist als der vorgegebene Schwellenwert Sth (Schritt S208), während das Teil als das bestimmt wird, dass es nicht dem Beschaffungsschlüssel ähnelt, wenn der Abstand S nicht kleiner ist als der Schwellenwert Sth (Schritt S209). Das Ergebnis der rechnerischen Bestimmung wird dann auf dem Anzeigebildschirm des Anzeigeabschnitts 24 über den Anzeigesteuerabschnitt 23 angezeigt (Schritt S210).
Wenn das Audiosignal, welches zu prüfen ist, vorbei ist oder wenn eine Instruktion zum Beenden des Beschaffungsbetriebs durch Benutzer angegeben wird, bestimmt der Steuerabschnitt 10, ob der Beschaffungsbetrieb beendet wird oder nicht (Schritt S211). Wenn der Betrieb beendet wird, wird die Verarbeitungsroutine beendet. Ansonsten kehrt der Steuerabschnitt 10 zurück zum Schritt S206, um den Beschaffungsbetrieb unter Verwendung von Beschaffungsschlüsseln fortzusetzen.
8A und 8B zeigen schematisch ein Ergebnis, welches durch einen Betrieb zum Beschaffen von Audiosignalen gemäß der Erfindung von dem Wiedergabeaudiosignal einer elektronischen Audioaufzeichnung einer Konferenz erlangt werden kann, wenn der Beschaffungsschlüssel von der Sprache eines speziellen Sprechers ausgewählt wird. Im Fall von 8A und 8B können die Zeitspannen, wo der spezifische Sprecher spricht, in der gesamten Audioaufzeichnung der Konferenz identifiziert werden.
Wenn lediglich ein einzelner Beschaffungsschlüssel in der obigen Beschreibung eines Beschaffungsbetriebs verwendet wird, muss nicht ausgeführt werden, dass auch mehrere Beschaffungsschlüssel spezifiziert werden können und zum Bestimmen des Ähnlichkeitsgrads zwischen zwei Sprachen verwendet werden können. Wenn dies der Fall ist, kann man dies so einrichten, dass die Beschaffungsschlüssel sequentiell durch Umschalten von einer oder einer anderen durch jeweils 10 bis mehrere Sekunden verwendet werden, so das der Ähnlichkeitsbestimmungsabschnitt 22 die Ähnlichkeit von zwei Sprachen auf Basis von jedem der Beschaffungsschlüssel rechnerisch bestimmt.
Alternativ können mehrere Ähnlichkeitsbestimmungsabschnitte vorgesehen werden und sie können simultan parallel verwendet werden, um die Ähnlichkeit von zwei Sprachen unter Verwendung der entsprechenden Beschaffungsschlüssel rechnerisch zu bestimmen.
9 zeigt schematisch ein Ergebnis, welches erlangt werden kann, wenn mehrere Beschaffungsschlüssel ausgewählt werden und für einen Beschaffungsbetrieb verwendet werden. Im Fall von 9 können die Zeitspannen, wo drei spezifische Sprecher A, B und C sprechen, bei der gesamten Audioaufzeichnung der Konferenz identifiziert werden.
Bei der oben beschriebenen Ausführungsform können somit in einer Konferenz, wo mehrere Besucher anwesend sind, die Teile der Sprachen aller Sprecher der Konferenz identifiziert, sortiert und angezeigt werden aus der gesamten elektronischen Audioaufzeichnung der Konferenz, wenn die Audiosignale vorher als Beschaffungsschlüssel für alle Besucher der Konferenz registriert sind.
Das Ergebnis der Ähnlichkeitsbestimmung wird in Binärwerten in der obigen Beschreibung ausgedrückt. Anders ausgedrückt wird die Ähnlichkeit auf Basis davon bestimmt, ob ein vorgegebener Schwellenwert überstiegen wird oder nicht. Die Ähnlichkeit kann jedoch auch hinsichtlich des Abstandes S ausgedrückt werden, welcher zwei Signalteile trennt. Umso kürzer der Abstand S ist, desto mehr ähneln zwei Signalteile einander. Dann kann der Ähnlichkeitsgrad durch den Grad der Schattierungsstärke angezeigt werden, wie in 8B gezeigt ist. Gemäß 8B gilt, dass, umso dunkler die Schattierung ist, desto größer der Ähnlichkeitsgrad ist. Alternativ können unterschiedliche Farben verwendet werden, um den Ähnlichkeitsgrad anzuzeigen.
Wenn mehrere Beschaffungsschlüssel verwendet werden, kann das Ergebnis der Ähnlichkeitsbestimmung unter Verwendung einer spezifischen Farbe für jeden Beschaffungsschlüssel angezeigt werden, und der Ähnlichkeitsgrad kann durch Ändern des Dichtegrads der Farbe angezeigt werden.
Es sei angemerkt, dass das Ergebnis der Ähnlichkeitsbestimmung auf dem Anzeigebildschirm des Anzeigeabschnitts ausgegeben und angezeigt wird als eine Funktion der Ablaufzeit vom Beginn des Audiosignals, welches zu prüfen ist, in der obigen Beschreibung. Wenn dagegen das zu prüfende Audiosignal ein Wiedergabeaudiosignal ist, kann die Position des Audiosignals auf dem Aufzeichnungsmedium 13, welche einer vorgegebenen Ablaufzeit entspricht, leicht erkannt werden. Wenn daher das Ausgangssignal eines Ähnlichkeitsbestimmungsbetriebs für eine Zeitspanne des Wiedergabeaudiosignals erlangt wird, kann die Position des Audiosignals, welches aktuell wiedergegeben wird, üblicherweise mittels eines Wiedergabeposition-Indikatorcursors gemeinsam mit dem Ergebnis der Ähnlichkeitsbestimmung für diese Zeitspanne angezeigt werden, wie in 10 gezeigt ist.
Umgekehrt ist es möglich, die Wiedergabe des zu prüfenden Audiosignals zu beginnen, vom Wiedergabepositions-Anzeigecursor, wie in 10 gezeigt ist, wenn dieser so angeordnet ist, dass der Benutzer die Startposition des Cursors spezifizieren kann. Dann ist es auch möglich, dass Teile des Audiosignals, welches mittels eines Beschaffungsschlüssels sortiert wird, zu extrahieren und diese simultan wiederzugeben.
Da ein Tonkenndatenparameter verwendet wird, um die Ähnlichkeit des Teils eines Audiosignals, welches zu prüfen ist, und des Audiosignals, welches zu verwenden ist, als Beschaffungsschlüssel gemäß der Erfindung rechnerisch zu bestimmen, kann der Betrieb der Ähnlichkeitsbestimmung nacheinander ausgeführt werden, wenn das wiederzugebende Audiosignal auf Prüfung nicht mit der passenden Geschwindigkeit wiedergegeben wird, sondern mit einer doppelten oder dreifachen Geschwindigkeit, da die Schwingungsform des Audiosignals nicht auf Zeit serieller Basis verwendet wird, ungleich dem Fall der Spracherkennung, wo die Ähnlichkeit von zwei Schwingungsformmustern in einem Verarbeitungsbetrieb geprüft wird, welcher für die Musterübereinstimmung durchgeführt wird.
Daher kann gemäß der Erfindung der Ähnlichkeitsbestimmungsbetrieb durchgeführt werden, während das Audiosignal mit hoher Geschwindigkeit wiedergegeben wird, und, wenn ein Teil, der dem Beschaffungsschlüssel ähnelt, der verwendet wird, ermittelt wird, kann dieses Teil mit einer geeigneten Geschwindigkeit wiedergegeben werden, so dass lediglich das Teil, welches dem Beschaffungsschlüssel ähnelt, extrahiert werden kann und für den Benutzer wiedergegeben werden kann.
Da außerdem das Ergebnis des Beschaffungsbetriebs so gemacht werden kann, dass es einer spezifischen Adresse auf dem Aufzeichnungsmedium nach dem Beschaffungsbetrieb entspricht, ist es auch möglich, lediglich die Teile des ursprünglichen Audiosignals zu extrahieren, welche einem spezifischen Beschaffungsschlüssel ähneln und die extrahierten Teile auf Basis des Beschaffungsbetriebs zu wiederzugeben.
Obwohl die obigen Vorteile der vorliegenden Erfindung im Hinblick auf ein wiedergegebenes Audiosignal herausgestellt sind, ist es gemäß der Erfindung auch möglich, Teile eines Audiosignals sich zu beschaffen, welche einem spezifischen Beschaffungsschlüssel entsprechen, der vorher registriert wurde. Mit dieser Anordnung können Teile eines zugeführten Audiosignals unter Verwendung einer Anzahl von Beschaffungsschlüsseln sortiert werden. Beispielsweise können Audiosignale mehrerer Instrumente vorher als Beschaffungsschlüssel registriert sein, so dass ein zugeführtes Audiosignal in Teile unterteilt werden kann und die Teile aussortiert werden können und für jedes oder alle Instrumente angezeigt werden können.
Obwohl Beschaffungsschlüssel von einem zugeführten Audiosignal extrahiert werden oder einem wiedergegebenen Audiosignal und im Beschaffungsschlüsselspeicher 32 bei der obigen Beschreibung der ersten Ausführungsform gespeichert werden, kann man so verfahren, dass mehrere Audiosignale vorher im Beschaffungsschlüsselspeicher 32 gespeichert werden, um eine Beschaffungsschlüsselbibliothek zu bilden.
Obwohl der Ähnlichkeitsbestimmungsbetrieb auf Basis des geometrischen Abstandes S von zwei Tonkenndatenparametern in der obigen Beschreibung durchgeführt wird, kann man alternativ so verfahren, dass ein neuer Parameter auf Basis mehrerer bekannter Parameter bestimmt wird und der Abstand zwischen zwei Tonkenndatenparameter unter Verwendung des neu bestimmten Parameters bestimmt wird.
Wenn beispielsweise drei Tonkenndatenparameter x, y und z verwendet werden, um einen neuen Parameter k zu bestimmen, unter Verwendung einer Formel: k = ay + bzkann der Abstand der Tonkenndatenparameter des Audiosignals, welches zu prüfen ist, und der eines Beschaffungsschlüssels unter Verwendung von zwei Parametern (x, k) oder des Parameters x und des neuen Parameters k bestimmt werden. Zusätzlich kann jeder Tonkenndatenparameter gewichtet werden, und die Ähnlichkeit von zwei Teilen von Audiosignalen kann bestimmt werden, wobei eine Priorität den schwergewichteten Parametern gegeben wird.
Der Beschaffungsschlüsselspeicher 32 kann ein Speicher sein, der in der Ausführungsform enthalten ist, oder ein lösbarer Speicher, der üblicherweise in Form einer Speicherkarte realisiert ist. Wenn eine Speicherkarte als Beschaffungsschlüsselspeicher 32 verwendet wird, können mehrere Speicherkarten verwendet werden, um mehrere Arten von Beschaffungsschlüsseln zu speichern, so dass ein geeigneter Schlüssel, der Beschaffungsschlüssel enthält, wirksam zum Prüfen eines spezifischen Audiosignals zur Verwendung ausgewählt werden kann.
Zusätzlich kann man so verfahren, dass eine Tonquelle für ein Audiosignal, welche als Beschaffungsschlüssel zu verwenden ist, vorgesehen sein kann, und ein Audiosignal von der Tonquelle über den Eingangsanschluss 11 zugeführt wird und im Beschaffungsschlüsselspeicher 32 vorher gespeichert wird. Alternativ kann ein Audiosignal von der Tonquelle zugeführt werden und vorübergehend in einem Pufferspeicher als Beschaffungsschlüssel gespeichert werden, jedes Mal, wenn ein Audiosignal geprüft wird. Dann besteht nicht länger die Notwendigkeit, den Beschaffungsschlüsselspeicher 32 zu verwenden.
Ein Beschaffungsschlüssel ist nicht auf ein Audiosignal von einer einzelnen Tonquelle beschränkt. Wie früher beschrieben kann dieser ein Audiosignal sein, welches für einen spezifische Zeitspanne von einem zugeführten Audiosignal oder einem wiedergegebenen Audiosignal extrahiert wird.
Wenn ein Audiosignal, welches durch ein Bild begleitet ist, beteiligt ist, kann das Bild auch auf dem Anzeigebildschirms des Anzeigeabschnitts angezeigt werden. Die Verwendung von Bildern wird den Betrieb zum Sortieren des Ergebnisses eines Beschaffungsbetriebs erleichtern. Beispielsweise kann ein aufgezeichnetes Videosignal geprüft und unter Verwendung von Audiosignalen sortiert werden.
Zweite Ausführungsform
11 ist ein schematisches Blockdiagramm einer zweiten Ausführungsform der Audiosignal-Beschaffungseinrichtung gemäß der Erfindung. Obwohl die obige beschriebene erste Ausführungsform eingerichtet ist, Audiosignale als registrierte Beschaffungsschlüssel zu speichern, ist die zweite Ausführungsform eingerichtet, Tonkenndatenparameter im Beschaffungsschlüsselspeicher 32 als registrierte Beschaffungsschlüssel zu speichern. Ansonsten hat die zweite Ausführungsform einen Aufbau gleich wie die erste Ausführungsform, und daher sind die Komponenten dieser Ausführungsform, welche gleich denen der ersten Ausführungsform sind, entsprechend mit den gleichen Bezugszeichen versehen.
Die zweite Ausführungsform umfasst einen Beschaffungsschlüssel-Audiosignal-Extraktionsabschnitt 35, welcher auf der Abgabeseite der Schaltschaltung SW4 angeordnet ist. Dieser Beschaffungsschlüssel-Audiosignal-Extraktionsabschnitt 35 entspricht dem Teil des Beschaffungsschlüssel-Audiosignal-Extraktions- /Speicherabschnitts 21, der eingerichtet ist, das Teil eines Audiosignals zu extrahieren, welches durch den Benutzer als Beschaffungsschlüssel spezifiziert ist.
Das Beschaffungsschlüssel-Audiosignal, welches durch den Beschaffungsschlüssel-Audiosignal-Extraktionsabschnitt 35 extrahiert wird, wird durch den Beschaffungsschlüssel-Tonkenndatenparameter-Analyseabschnitt 36 analysiert, um einen Tonkenndatenparameter für das Audiosignal zu erlangen, wobei der Tonkenndatenparameter dann im Beschaffungsschlüssel-Tonkenndatenparameter-Speicherabschnitt 37 sowie im Beschaffungsschlüsselspeicher 32 über die Schaltschaltung SW5 gespeichert wird. Es ist vorteilhaft, dass der Beschaffungsschlüssel-Tonkenndatenparameter-Speicherabschnitt 37 der Einrichtung entspricht, um die Teile des Audiosignals zu speichern, welche als Beschaffungsschlüssel des Beschaffungsschlüssel-Extraktion-/Speicherabschnitt 31 von 1 extrahiert werden, und die Beschaffungsschlüssel-Tonkenndatenparameter anstelle des Audiosignals speichert, welches als Beschaffungsschlüssel zu verwenden ist. Somit werden Beschaffungsschlüssel (welche Tonkenndatenparameter bei dieser Ausführungsform sind) in den jeweiligen Beschaffungsschlüssel-Speicherbereichen des Beschaffungsschlüsselspeichers 32 gespeichert.
Irgendeiner der Tonkenndatenparameter, welcher im Beschaffungsschlüsselspeicher 32 gespeichert ist und als Beschaffungsschlüssel arbeitet, wird durch die Schaltschaltung SW6 und durch den Beschaffungsschlüssel-Tonkenndatenparameter-Leseabschnitt 38 gemäß einem Steuersignal vom Steuerabschnitt 10 gelesen, welches gemäß einer Instruktion erzeugt wird, welche durch den Benutzer über den Schlüsselbetätigungsabschnitt 20 zugeführt wird. Da ein Tonkenndatenparameter vom Beschaffungsschlüsselspeicher 32 im Fall der zweiten Ausführungsform gelesen wird, wird dieser direkt dem Ähnlichkeitsbestimmungsabschnitt 22 zugeführt und für den Berechnungsbetrieb zum Bestimmen der Ähnlichkeit des Audiosignals verwendet, welches als Beschaffungsschlüssel arbeitet, und des Teils eines Audiosignals, welches zu prüfen ist.
Wie aus der obigen Beschreibung ersichtlich ist, unterscheidet sich die zweite Ausführungsform gegenüber der ersten Ausführungsform lediglich dahingehend, dass der Beschaffungsschlüsselspeicher 32 Beschaffungsschlüssel-Tonkenndatenparameter anstelle von Audiosignalen speichert, während die Arbeitsweise zum Registrieren von Beschaffungsschlüsseln und des Beschaffungsbetriebs unter Verwendung der Beschaffungsschlüssel gleich der der ersten Ausführungsform ist. Daher liefert die zweite Ausführungsform Vorteile gleich denen, welche oben unter Bezug auf die erste Ausführungsform beschrieben wurden. Zusätzlich kann die zweite Ausführungsform in verschiedener Weise in einer Weise modifiziert werden, die nachstehend unter Verwendung der ersten Ausführungsform beschrieben wird.
Da schließlich der Beschaffungsschlüsselspeicher 32 keine Audiosignale speichert, sondern die Beschaffungsschlüssel-Tonkenndatenparameter als Beschaffungsschlüssel bei der zweiten Ausführungsform, ist die Speicherkapazität des Beschaffungsschlüsselspeichers bei dieser Ausführungsform, welche zum Speichern erforderlich ist, eines Beschaffungsschlüssels, kleiner als die des Beschaffungsschlüsselspeichers der ersten Ausführungsform. Anders ausgedrückt kann eine größere Anzahl an Beschaffungsschlüsseln bei dieser Ausführungsform gespeichert werden.
Dritte Ausführungsform
Eine dritte Ausführungsform der Erfindung zeichnet sich dadurch aus, dass bei dieser Tonkenndatenparameter verwendet werden, um Audiosignale synthetisch wiederzugeben. Da Tonkenndatenparameter verwendet werden können, um Audiodaten synthetisch wiederzugeben, können die Audiosignale in Form von Tonkenndatenparameter aufgezeichnet werden. Somit werden wie bei der zweiten Ausführungsform Tonkenndatenparameter als Beschaffungsschlüssel im Beschaffungsschlüsselspeicher 32 dieser dritten Ausführungsform gespeichert.
12 ist ein schematisches Blockdiagramm der dritten Ausführungsform der Audiosignal-Beschaffungseinrichtung gemäß der Erfindung. In 12 sind die Komponenten dieser Ausführungsform, welche gleich denen der vorhergehenden Ausführungsformen sind, entsprechend mit den gleichen Bezugszeichen versehen. Bei dieser dritten Ausführungsform können Parameter eines Vocoders üblicherweise als Tonkenndatenparameter verwendet werden.
Wie in 12 gezeigt ist, wird ein Eingangsaudiosignal zum Tonkenndatenparameter-Analyseabschnitt 41 über den Eingangsanschluss 11 geliefert und üblicherweise auf Tonkenndatenparameter eines Vocoders-Systems analysiert. Die Tonkenndatenparameter des zugeführten Audiosignals vom Tonkenndatenparameter-Analyseabschnitt 41 werden dann zum Tonkenndatenparameter-Aufzeichnungsabschnitt 42 über die Schaltschaltung SW1 geführt, wobei der Tonkenndatenparameter-Aufzeichnungsabschnitt 42 die Tonkenndatenparameter, welche ihm zugeführt werden, auf einem Aufzeichnungsmedium unter der Steuerung des Steuerabschnitts 10 aufzeichnet.
Die Tonkenndatenparameter des zugeführten Audiosignals, welche auf dem Aufzeichnungsmedium 13 aufgezeichnet sind, werden durch den Tonkenndatenparameter-Wiedergabeabschnitt 43 unter der Steuerung des Steuerabschnitts 10 wiedergegeben und dem Audiosignal-Syntheseabschnitt 44 zugeführt, wobei der Audiosignal-Syntheseabschnitt 44 das ursprüngliche Audiosignal unter Verwendung der Tonkenndatenparameter synthetisch wiedergibt.
Das wiedergegebene Audiosignal, welches durch den Audiosignal-Syntheseabschnitt 44 erlangt wird, wird dann zum Lautsprecher 16 über den Eingangsanschluss PB der Schaltschaltung SW2 und den Audioverstärker 15 geführt, und der ursprüngliche Ton wird vom Lautsprecher 16 wiedergegeben. Es ist als vorteilhaft anzusehen, dass der Prozess, wo das zugeführte Audiosignal, welches über den Eingangsanschluss 11 hereinkommt, zum Lautsprecher 16 über den Eingangsanschluss IN der Schaltschaltung SW2 und den Audioverstärker 15 geführt wird, um den ursprünglichen Ton wiederzugeben, gleich ist wie die entsprechenden Teile der ersten und zweiten Ausführungsformen.
Bei dieser dritten Ausführungsform ist kein Tonkenndatenparameter-Analyseabschnitt 21 vorgesehen, und die Schaltschaltung SW3 ist eingerichtet, entweder den Tonkenndatenparameter des zugeführten Audiosignals, welches über den Ausgangsanschluss a der Schaltschaltung SW1 hereinkommt, oder den Tonkenndatenparameter des Wiedergabeaudiosignals, welches über den Tonkenndatenparameter-Wiedergabeabschnitt 43 hereinkommt, mittels eines Schaltsteuersignals auszuwählen, welches durch den Steuerabschnitt 10 erzeugt wird, gemäß der Instruktion, welche durch den Benutzer über den Tastenbetätigungsabschnitt 20 abgegeben wird, und dieses zum Ähnlichkeitsbestimmungsabschnitt 22 geliefert wird.
Dagegen werden die Beschaffungsschlüssel-Tonnkenndatenparameter im Beschaffungsschlüsselspeicher 32 dieser dritten Ausführungsform als Beschaffungsschlüssel wie im Fall der zweiten Ausführungsform gespeichert. Daher wird bei dieser dritten Ausführungsform der Tonkenndatenparameter, welcher vom Tonkenndatenparameter-Analyseabschnitt 41 herkommt, zu einem der Eingangsanschlüsse oder zum Eingangsanschluss f der Schaltschaltung SW4 über den Ausgangsanschluss b der Schaltschaltung SW1 geführt, während der Tonkenndatenparameter, welcher vom Tonkenndatenparameter-Wiedergabeabschnitt 43 kommt, zum anderen Eingangsanschluss oder zum Eingangsanschluss e der Schaltschaltung SW4 geführt wird.
Dann wird die Schaltschaltung SW4 entweder auf die Seite des Eingangsanschlusses e oder auf die des Eingangsanschlusses f gemäß dem Schaltsteuersignal vom Steuerabschnitt 10 gedreht, um zu zeigen, ob ein Tonkenndatenparameter vom Eingangsaudiosignal oder vom Wiedergabeaudiosignal extrahiert werden soll.
Dann wird der Tonkenndatenparameter von der Schaltschaltung SW4 zum Beschaffungsschlüssel-Tonkenndatenparameter-Extraktions-/Speicherabschnitt 45 geführt. Wie im Fall der ersten Ausführungsform betätigt der Benutzer die Beschaffungstaste, welche den Schlüssel (nicht gezeigt) der Tastenbetätigungseinheit 20 spezifiziert, wenn das Teil, welches er zu verwenden wünscht, als Beschaffungsschlüssel kommt. Dann extrahiert der Beschaffungsschlüssel-Tonkenndatenparameter-Extraktion-/Speicherabschnitt 45 der Ausführungsform ein Teil des Audiosignals, welches der vorgegebenen Zeitperiode TW entspricht, einschließlich der Zeit der Tastenbetätigung und speichert das Teil im Beschaffungsschlüsselspeicher 32.
Somit speichert der Beschaffungsschlüsselspeicher 32 den Tonkenndatenparameter des Audiosignals, der entweder vom zugeführten Audiosignal oder vom Wiedergabeaudiosignal extrahiert wird, als Beschaffungsschlüssel. Wie im Fall der zweiten Ausführungsform wird irgendeiner der Beschaffungsschlüssel-Tonkenndatenparameter, welcher im Beschaffungsschlüsselspeicher 32 gespeichert ist, der durch den Benutzer spezifiziert ist, durch den Beschaffungsschlüssel-Tonkenndatenparameter-Leseabschnitt 38 gelesen und zum Ähnlichkeitsbestimmungsabschnitt 22 geführt.
Die Arbeitsweise zum Registrieren und zum Beschaffen eines Beschaffungsschlüssels ist die gleiche wie die der ersten und zweiten Ausführungsform und wird daher hier nicht weiter beschrieben. Somit ist mit der Ausnahme, dass der Beschaffungsschlüsselspeicher 32 Beschaffungsschlüssel-Tonkenndatenparameter speichert, die Arbeitsweise zum Registrieren und Abrufen eines Beschaffungsschlüssels der dritten Ausführungsform die gleiche wie bei der ersten und zweiten Ausführungsform. Daher liefert die dritte Ausführungsform Vorteile gleich denen, welche oben unter Bezug auf die erste und zweite Ausführungsform beschrieben wurden. Zusätzlich kann die dritte Ausführungsform in verschiedener Weise in einer Weise wie oben beschrieben unter Bezug auf die erste und zweite Ausführungsform modifiziert werden.
Außerdem kann im Fall dieser dritten Ausführungsform, da Tonkenndatenparameter auf einem Aufzeichnungsmedium anstelle von Audiosignalen gespeichert sind, die Speicherkapazität des Aufzeichnungsmediums wirksam ausgenutzt werden. Da außerdem ein gleicher Tonkenndatenparameter-Analyseabschnitt der dritten Ausführungsform gemeinsam für sowohl das zu prüfende Audiosignal als auch für das zu verwendende Audiosignal als Beschaffungsschlüssel verwendet werden kann, kann die dritte Ausführungsform ausgeführt werden, um einen Aufbau zu zeigen, der einfacher ist als der bei der ersten und zweiten Ausführungsform.
Spezifische Beispiele von synthetisch-wiedergebbaren Tonkenndatenparametern, welche für den Zweck der Erfindung verwendet werden können, umfassen Audiodaten eines Kompressionssystems (MPEG-Audio-Lager 1, Lager II, Lager III) gemäß MPEG (Moving Picture Experts Group)-Standards und die des ATRAC-Systems (Adaptive Transform Acoustic Coding).
Gemäß den MPEG-Audiostandards und dem ATRAC-System wird das Audioband in mehrere Hilfsbänder zum Codieren unterteilt, um effektiv die psychologischen Kenndaten des menschlichen Hörsinns zu nutzen. Beispielsweise wird im Fall von MPEG Audio-Lager I das gesamte Band eines Audiosignals in 32 Hilfsbänder unterteilt, welche eine gleiche Frequenzbreite haben, und jedes der erlangten Signale wird mit einer Abtastfrequenz 1/32 zum Codieren abgetastet.
Wenn daher Daten eines Audiokompressionssystems gemäß MPEG-Standards oder Daten des ATRAC-Systems (audio-komprimierte/codierte Daten) geprüft werden, werden Arbeitsweisen, beispielsweise Bestimmen der Bandpegelverteilung und der Hauptbandfrequenz und das Ermitteln der harmonischen Struktur und die Änderung mit der Zeit der Hauptbandfrequenz unter Verwendung der Hilfsbanddaten durchgeführt, und die Beschaffungsschlüssel-Tonkenndatenparameter werden auf Basis dieses Betriebs erlangt.
Wenn ein Verfahren zum Verwenden von Daten eines Audiokompressionssystems gemäß den MPEG-Standards oder denen des ATRAC-Systems bei der Ausführungsform von 12 angewandt wird, und das zugeführte Audiosignal, welches über den Eingangsanschluss 1 hereinkommt, ein Analogsignal oder ein lineares PCM-Signal ist, erzeugt der Tonkenndatenparameter-Analyseabschnitt 41 Daten eines Audiokompressionssystems gemäß den MPEG-Standards oder dem ATRAC-System. Dann zeichnet der Aufzeichnungsabschnitt 42 die Daten des Audiokompressionssystems auf dem Aufzeichnungsmedium 13 auf.
Dann erzeugt der Beschaffungsschlüssel-Tonkenndatenparameter-Extraktions-/Speicherabschnitt 45 Hilfsbanddaten von den Daten des Audiokompressionssystems vom Tonkenndatenparameter-Analyseabschnitt 41 oder vom Tonkenndatenparameter-Wiedergabeabschnitt 43 und führt einen Betrieb aus, beispielsweise Bestimmen der Bandpegelverteilung und der Hauptbandfrequenz und des Ermittelns der harmonischen Struktur und der Änderung mit der Zeit der Hauptbandfrequenz wie oben beschrieben. Dann wird das Ergebnis dieses Betriebs im Beschaffungsschlüsselspeicher 32 als Beschaffungsschlüssel-Tonkenndatenparameter gespeichert.
Wie im Fall von 1 und 11 ist ein Tonkenndatenparameter-Analyseabschnitt stromaufwärts in Bezug auf den Ähnlichkeitsbestimmungsabschnitt 22 vorgesehen, und Subbanddaten werden von den Daten des Audiokompressionssystems vom Schalter SW1 oder vom Tonkenndatenparameter-Wiedergabeabschnitt 43 erzeugt. Dann wird der Betrieb, beispielsweise das Bestimmen der Bandpegelverteilung und der Hauptbandfrequenz und das Ermitteln der harmonischen Struktur und die Änderung mit der Zeit der Hauptbandfrequenz hinsichtlich der Hilfsbanddaten durchgeführt. Bei dieser Anordnung kann der Tonkenndatenparameter-Analyseabschnitt einen einfachen Aufbau haben. Der Ähnlichkeitsbestimmungsabschnitt 22 vergleicht dann den Tonkenndatenparameter, der als Ergebnis der Analyse erlangt wird, und den Beschaffungsschlüssel-Tonkenndatenparameter vom Beschaffungsschlüssel-Tonkenndatenparameter-Leseabschnitt 38 und bestimmt den Ähnlichkeitspegel zwischen diesen.
Obwohl das zugeführte Audiosignal, welches über den Eingangsanschluss 11 eingegeben wird, ein Analogsignal oder ein lineares PCM-Signal in der obigen Beschreibung ist, können Daten eines Audiokompressionssystems gemäß den MPEG-Standards oder des ATRAC-Systems erlangt werden, wenn serielle Digitaldaten, welche über eine Schnittstelle zugeführt werden, gemäß IEEE-1394-Standards oder ein digitales Audiokompressionssignal, welches durch ein digitales Rundfunkempfangsgerät empfangen wird, zugeführt werden, so dass der Tonkenndatenparameter-Analyseabschnitt 41 von 12 nicht erforderlich ist.
Das oben beschriebene Verfahren zum Analysieren eines komprimierten Audiosignals zum Beschaffen eines Tonkenndatenparameters kann die Verzögerung für den Beschaffungsbetrieb minimieren und außerdem die Menge an Rechnungsoperationen, verglichen mit dem Fall, wenn Daten eines digitalen Audiokompressionssystems decodiert werden, um ein lineares PCM-Audiosignal vor der Analyse zu erlangen.
Vierte Ausführungsform
Obwohl Tonkenndatenparameter auf einem Aufzeichnungsmedium anstelle von Audiosignalen bei der oben beschriebenen dritten Ausführungsform aufgezeichnet werden, werden Audiosignale und entsprechende Tonkenndatenparameter wechselseitig gleichzeitig auf einem Aufzeichnungsmedium bei der vierten Ausführungsform der Erfindung aufgezeichnet. Da sowohl Audiosignale als auch Tonkenndatenparameter bei dieser vierten Ausführungsform aufgezeichnet werden, sind die Tonkenndatenparameter, welche bei der vierten Ausführungsform aufgezeichnet werden können, nicht auf die beschränkt, welche verwendet werden, um Audiosignale synthetisch wiederzugeben.
Bei der vierten Ausführungsform werden Tonkenndatenparameter auf einem Aufzeichnungsmedium aufgezeichnet, beispielsweise einer Magnetplatte, einer magneto-optischen Platte, einer optischen Platte oder einer Speicherkarte gleichzeitig mit Bezug auf die Audiosignale. Anders ausgedrückt werden Audiosignale und Tonkenndatenparameter auf einem Aufzeichnungsmedium durch die Aufzeichnungseinheit des Audiosignals (beispielsweise als Packung, Paket oder Sektor) aufgezeichnet, und die Daten einer Aufzeichnungseinheit des Audiosignals und die entsprechenden Tonkenndatenparameter der Einheit werden hinsichtlich des Aufzeichnungsbereichs im Aufzeichnungsmedium verknüpft, in einer Weise, dass deren wechselseitige Entsprechung deutlich sichtbar sein kann. Beispielsweise können sie in benachbarten Aufzeichnungsbereichen des Aufzeichnungsmediums aufgezeichnet sein.
13 ist ein schematisches Blockdiagramm der vierten Ausführungsform der Audiosignal-Beschaffungseinrichtung nach der Erfindung. In 13 sind die Komponenten dieser Ausführungsform, welche gleich sind wie die der vorherigen Ausführungsformen, entsprechend mit gleichen Bezugszeichen versehen und werden nicht weiter beschrieben.
Bei der vierten Ausführungsform wird das zugeführte Audiosignal, welches über den Audioeingangsanschluss 11 zugeführt wird, zum Audiosignal-Aufzeichnungsabschnitt 12 über die Schaltschaltung SW7 geführt. Die Schaltschaltung SW7 wird für einen Aufzeichnungsbetrieb durch ein Schaltsteuersignal vom Steuerabschnitt 10 eingeschaltet. Danach wird das zugeführte Audiosignal, welches zum Audiosignal-Aufzeichnungsabschnitt 12 geliefert wird, weiter zum Datenaufzeichnungs-Steuerabschnitt 51 der vierten Ausführungsform geführt.
Das zugeführte Audiosignal, welches über den Eingangsanschluss 11 zugeführt wird, wird außerdem zum Tonkenndatenparameter-Analyseabschnitt 41 geführt und analysiert, um einen Tonkenndatenparameter zu erlangen. Der Tonkenndatenparameter vom Tonkehndatenparameter-Analyseabschnitt 41 wird zum Eingangsanschluss der Schaltschaltung SW3 als Tonkenndatenparameter des zugeführten Audiosignals geführt, welches zu prüfen ist, und auch zum Eingangsanschluss f der Schaltschaltung SW4, um einen Tonkenndatenparameter vom zugeführten Audiosignal als Beschaffungsschlüssel zu extrahieren. Außerdem wird der Tonkenndatenparameter vom Tonkenndatenparameter-Analyseabschnitt 41 zum Datenaufzeichnungs-Steuerabschnitt 51 geführt.
Bei einem Aufzeichnungsbetrieb zeichnet der Datenaufzeichnungs-Steuerabschnitt 51 das Audiosignal und den entsprechenden Tonkenndatenparameter in einem vorgegebenen Aufzeichnungsformat in einer Weise, dass deren gegenseitige Entsprechung deutlich sichtbar sein kann, unter der Steuerung des Steuerabschnitts 10 auf. In diesem Beispiel zeichnet, wie oben beschrieben, der Datenaufzeichnungs-Steuerabschnitt 51 das Audiosignal auf dem Aufzeichnungsmedium 13 auf, durch die Aufzeichnungseinheit des Audiosignals, und auch die entsprechenden Tonkenndatenparameter der Einheit an einer Position des Aufzeichnungsmediums 13, welche dem Audiosignal benachbart ist.
Das zugeführte Audiosignal und der entsprechende Tonkenndatenparameter, welche auf dem Aufzeichnungsmedium 13 im oben beschriebenen Aufzeichnungsformat aufgezeichnet werden, werden danach durch den Datenlese-Steuerabschnitt 52 unter der Steuerung des Steuerabschnitts 10 wiedergegeben. Das Audiosignal, welches vom Aufzeichnungsmedium 13 durch den Datenlese-Steuerabschnitt 52 wiedergegeben wird, wird dann zum Audiosignal- Wiedergabeabschnitt 14 und dann weiter zum Lautsprecher 16 über den Eingangsanschluss PB der Schaltschaltung SW2 des Audioverstärkers 15 geführt, so dass der ursprüngliche Ton vom Lautsprecher 16 wiedergegeben wird.
Dagegen wird der entsprechende Tonkenndatenparameter, der durch den Datenlese-Steuerabschnitt 52 vom Aufzeichnungsmedium 13 wiedergegeben wird, dann zum Eingangsanschluss c der Schaltschaltung SW3 geführt, als Tonkenndatenparameter des Wiedergabeaudiosignals, welches zu prüfen ist, und außerdem zum Eingangsanschluss e der Schaltschaltung SW4, um einen Tonkenndatenparameter vom Wiedergabeaudiosignal als Wiedergabeschlüssel zu extrahieren.
Außerdem können das Audiosignal und der Tonkenndatenparameter, welche durch den Datenlese-Steuerabschnitt 52 vom Aufzeichnungsmedium 13 wiedergegeben werden, nach außen hinüber einen externen Ausgangsanschluss (nicht gezeigt) geführt werden, um einen Beschaffungsbetrieb durchzuführen, der hinsichtlich des Audiosignals durch eine andere Einrichtung auszuführen ist. Anders ausgedrückt ist die andere Einrichtung nicht erforderlich, mit einem Tonkenndatenparameter-Analyseabschnitt versehen zu sein, um Tonkenndatenparameter vorzubereiten.
Somit werden bei dieser vierten Ausführungsform von den vorhergehenden Ausführungsformen dahingehend, dass ein zugeführtes Audiosignal und die entsprechenden Tonkenndatenparameter verknüpft sind, wenn auf dem Aufzeichnungsmedium durch den Datenaufzeichnungs-Steuerabschnitt 51 aufgezeichnet, sowohl das Audiosignal als auch der entsprechende Tonkenndatenparameter durch den Datenlese-Steuerabschnitt 52 aufgezeichnet. Diese Ausführungsform arbeitet jedoch wie die dritte Ausführungsform dahingehend, dass Tonkenndatenparameter verwendet werden, für Beschaffungsoperationen und Beschaffungsschlüssel-Tonkenndatenparameter von den zugeführten Audiosignalen und den Wiedergabeaudiosignalen extrahiert werden können.
Daher liefert die vierte Ausführungsform Vorteile gleich denen, welche oben unter Bezug auf die erste Ausführungsform beschrieben wurden. Zusätzlich kann die vierte Ausführungsform in verschiedener Weise in einer Weise wie oben beschrieben unter Bezug auf die erste Ausführungsform modifiziert werden.
Noch weiter kann wie im Fall der dritten Ausführungsform, da ein gleicher Tonkenndatenparameter-Analyseabschnitt der vierten Ausführungsform gemeinsam für sowohl das Audiosignal, welches zu prüfen ist, als auch für das Audiosignal, welches als Beschaffungsschlüssel zu verwenden ist, verwendet werden kann, die dritte Ausführungsform so ausgebildet sein, um einen Aufbau zu zeigen, der einfacher ist als die erste und die zweite Ausführungsform. Außerdem können Tonkenndatenparameter zu einer anderen Beschaffungseinrichtung geführt werden. Folglich ist die weitere Einrichtung nicht dazu erforderlich, mit einem Tonkenndatenparameter-Analyseabschnitt versehen zu sein, um Tonkenndatenparameter vorzubereiten.
Es sei angemerkt, dass das aufzuzeichnende Audiosignal und der entsprechende Tonkenndatenparameter miteinander verknüpft werden können und auf einem Aufzeichnungsmedium aufgezeichnet werden können, wenn sie nicht benachbart in Bezug zueinander aufgezeichnet sind. Beispielsweise kann das Aufzeichnungsmedium mit einem Aufzeichnungsbereich versehen sein, um Audiosignale aufzuzeichnen, und einem Aufzeichnungsbereich, um Tonkenndatenparameter und ein Audiosignal aufzuzeichnen, und der entsprechende Tonkenndatenparameter kann an entsprechenden Positionen der Aufzeichnungsbereiche aufgezeichnet werden, welche miteinander hinsichtlich von Adressen verknüpft sind. Alternativ kann die Verknüpfungsinformation zum Verknüpfen des Audiosignals und des entsprechenden Tonkenndatenparameters zusätzlich aufgezeichnet werden, so dass sie zusammen unter Verwendung der Verknüpfungsinformation wiedergegeben werden können.
Fünfte Ausführungsform
Wie oben beschrieben ist es gemäß der Erfindung möglich, einen Beschaffungsbetrieb in Bezug auf ein Audiosignal, welches zu prüfen ist, auszuführen, wobei die Ähnlichkeit des Audiosignals, welches zu prüfen ist, und eines Audiosignals, welches als Beschaffungsschlüssel wirkt, bestimmt wird, wobei ein Tonkenndatenparameter verwendet wird. Daher ist es nun möglich, das zu prüfende Audiosignal aufzuzeichnen, während das Audiosignal analysiert wird, wobei der spezifizierte Beschaffungsschlüssel verwendet wird. Somit wird das Ergebnis des Beschaffungsbetriebs, der hinsichtlich des zu prüfenden Audiosignals durchgeführt wird, wobei der Beschaffungsschlüssel verwendet wird, durch die Zeit verfügbar, wenn der Aufzeichnungsbetrieb vorbei ist. Somit ist es möglich, das Ergebnis des Beschaffungsbetriebs auf dem Aufzeichnungsmedium in einem Bereich aufzuzeichnen, der von dem Bereich getrennt ist, wo das Audiosignal aufgezeichnet ist.
Das Ergebnis des Beschaffungsbetriebs, der hinsichtlich eines Wiedergabeaudiosignals durchgeführt wird, kann auch auf dem Aufzeichnungsmedium etwas später aufgezeichnet werden, wobei das Aufzeichnungsmedium mit einem Bereich versehen ist, der von dem Bereich getrennt ist, wo das Audiosignal aufgezeichnet ist.
Im Hinblick auf die obigen Vorteile wird bei der fünften Ausführungsform der vorliegenden Erfindung das Ergebnis des Beschaffungsbetriebs, welcher hinsichtlich des Audiosignals durchgeführt wird, welches zu prüfen ist, auch auf einem Aufzeichnungsmedium aufgezeichnet.
Insbesondere werden bei der fünften Ausführungsform der Erfindung ein oder mehrere als einender Beschaffungsschlüssel, welche vorher registriert wurden, verwendet, um das zugeführte Audiosignal, welches während des Betriebs zum Aufzeichnen des Audiosignals aufgezeichnet wird, zu analysieren.
Beispielsweise wird ein plattenförmiges Aufzeichnungsmedium, beispielsweise eine Magnetplatte, eine optische Platte oder eine magneto-optische Platte oder eine Speicherkarte für das Aufzeichnungsmedium 13 verwendet. Dann wird ein Audiosignal auf dem Aufzeichnungsmedium aufgezeichnet, wobei die Adressen des Aufzeichnungsmediums überwacht werden. Bei der fünften Ausführungsform wird die Adresse (die Speicherposition) jedes Teils des Audiosignals, welche bestimmt wird, um ähnlich dem Audiosignal zu sein, welches als Beschaffungsschlüssel arbeitet, gemeinsam mit der identifizierenden Information des Beschaffungsschlüssels aufgezeichnet. Das Schaltsteuersignal (entsprechend dem Speicherbereich des Beschaffungsschlüssels oder der Anzahl der Beschaffungsschlüssel) der Schaltschaltung SW6 wird üblicherweise als Identifizierungsinformation des Beschaffungsschlüssels verwendet.
14 ist eine Tabelle, welche das Ergebnis eines Beschaffungsbetriebs zeigt, welches nachdem Ende des Betriebs zum Aufzeichnen und zum Prüfen des Audiosignals bei der fünften Ausführungsform erlangt wird. Die Tabelle wird als Beschaffungsindextabelle für das Audiosignal verwendet, welches auf dem Aufzeichnungsmedium aufgezeichnet ist.
Gemäß 14 sind die Namen der Beschaffungsschlüssel denen vorher im Zeitpunkt der Registrierung gegeben, und, wenn das Audiosignal die Sprache und die Diskussionen einer Konferenz darstellt, können sie üblicherweise die Namen der Teilnehmer/Sprecher sein. Die Zeitspannendaten sind Daten hinsichtlich jeder Zeitspanne, wo das entsprechende Teil des Audiosignals dem spezifischen Beschaffungsschlüssels ähnelt, der für den Beschaffungsbetrieb verwendet wird. Jede Zeitspanne ist durch die Startadresse ST und die Endadresse ED definiert. In 14 zeigt ADRi (i zeigt eine ganze Zahl) einen Adressenwert auf dem Aufzeichnungsmedium.
Somit wird bei der fünften Ausführungsform die Information der Beschaffungsindextabelle in dem vorausgewählten Aufzeichnungsbereich auf dem Aufzeichnungsmedium aufgezeichnet, der von dem Bereich des Aufzeichnungsaudiosignals getrennt ist.
Bei der fünften Ausführungsform kann ein Teil des Audiosignals, welches einem spezifischen Abrufungsschlüssel ähnelt, leicht unter Verwendung der Beschaffungsindextabelle extrahiert und wiedergegeben werden (Beschaffungs-/Wiedergabebetrieb).
15 zeigt schematisch die Verarbeitungsroutine für einen Beschaffungs-/Wiedergabebetrieb der fünften Ausführungsform. Die Verarbeitungsroutine von 15 wird begonnen, wenn der Benutzer eine Instruktion für einen Beschaffungs-/Wiedergabebetrieb über den Tastenbetätigungsabschnitt 20 ausgibt.
Zunächst werden Indexdaten, welche für den Beschaffungsbetrieb zu verwenden sind, aus dem Aufzeichnungsmedium gelesen, um eine Beschaffungsindextabelle vorzubereiten (Schritt S301). Der Steuerabschnitt 10 bereitet eine Beschaffungsindextabelle, wie in 14 gezeigt ist, auf Basis der gelesenen Daten vor und zeigt diese auf dem Anzeigebildschirm an (Schritt S302).
Danach gibt der Benutzer den Beschaffungsschlüssel, den er zu verwenden wünscht, für den Beschaffungs-/Wiedergabebetrieb über den Tastenbetätigungsabschnitt ein, wobei die angezeigte Beschaffungsindextabelle befragt wird. Der Steuerabschnitt 10 erkennt den Beschaffungsschlüssel, der durch den Benutzer spezifiziert wird (Schritt S303). Er erkennt dann die Daten der Zeitspanne von jedem Teil des Audiosignals, für welche bestimmt wird, dass sie dem Beschaffungsschlüssel ähneln, wobei auf die Beschaffungsindextabelle bezuggenommen wird (Schritt S304). Danach liest der Steuerabschnitt 10 sequentiell die Teile des Audiosignals mit den Adressen, welche durch die Daten der erkannten Zeitspannen angezeigt werden (Schritt S305).
Somit können bei der fünften Ausführungsform die Teile des Audiosignals, welche dem spezifizierenden Abrufungsschlüssel ähneln, mit Leichtigkeit extrahiert und wiedergegeben werden. Man wird es vorteilhaft erkennen, dass es bei der fünften Ausführungsform auch möglich ist, einen Beschaffungsschlüssel zu spezifizieren, der auf der Beschaffungsindextabelle nicht aufgelistet ist, vom Beschaffungsschlüsselspeicher und einen Beschaffungsbetrieb unter Verwendung des spezifizierenden Beschaffungsschlüssels auszuführen.
Obwohl die Beschaffungsindextabelle die identifizierende Information und die Namen der Beschaffungsschlüssel enthält, können die Audiosignale der Beschaffungsschlüssel auch auf der Beschaffungsindextabelle anstelle von oder zusätzlich zu den Namen der Beschaffungsschlüssel aufgelistet sein. Dann kann der Benutzer leicht das Audiosignal des Beschaffungsschlüssels, welches er spezifiziert, realisieren, wobei der ursprüngliche Ton des Audiosignals wiedergegeben wird.
Obwohl das Ergebnis des Beschaffungsbetriebs auf dem Aufzeichnungsmedium in der obigen Beschreibung aufgezeichnet ist, kann dies zusätzlich in einem Speicher aufgezeichnet werden, der durch den Steuerabschnitt gesteuert wird, in einer Weise, dass die Daten, welche im Speicher gespeichert sind und diejenigen, welche im Aufzeichnungsmedium gespeichert sind, eine deutliche Korrespondenz zeigen.
Weitere Ausführungsformen
Obwohl Beschaffungsschlüssel in einem Speicher vorher registriert sind oder separat in der obigen Beschreibung vorbereitet werden, können diese alternativ so eingerichtet sein, dass ein Beschaffungsbetrieb beginnt, wenn der Benutzer ein Teil des Audiosignals, den er zum Aufzeichnen wünscht, spezifiziert und während des Aufzeichnungsbetriebs weitergeht. Bei dieser Anordnung ist es nicht notwendig, einen Beschaffungsschlüssel vorher zu registrieren.
Es ist nicht notwendig, einen Beschaffungsschlüssel, der im Beschaffungsschlüsselspeicher zu registrieren ist, von einem Eingangsaudiosignals oder einem Wiedergabeaudiosignal zu extrahieren. Beispielsweise kann eine Tonquelle vorgesehen sein, um einen Beschaffungsschlüssel zu erzeugen, und das Audiosignal, welches von der Tonquelle erlangt wird, kann verwendet werden und als Beschaffungsschlüssel registriert werden.
Außerdem ist es möglich, ein Audiosignal oder einen Tonkenndatenparameter, der als Beschaffungsschlüssel zu registrieren ist, über das Internet oder ein Kommunikationsnetzwerk zu erlangen. Dann wird das Audiosignal oder der Tonkenndatenparameter als Beschaffungsschlüssel registriert.
Alternativ kann man dies so einrichten, dass, wenn ein Aufzeichnungsmedium, welches ein aufgezeichnetes Audiosignal enthält, vermarktet wird, auch Kandidatenbeschaffungsschlüssel auf dem Aufzeichnungsmedium aufgezeichnet sind. Noch alternativ kann man dies so einrichten, dass, wenn ein Aufzeichnungsmedium, welches ein aufgezeichnetes Audiosignal enthält vermarktet wird, dieses durch eine Speicherkarte bekleidet ist, welche Kandidatenbeschaffungsschlüssel speichert.
Erste Ausführungsform der Audio-/Video-Beschaffungseinrichtung und der Audio-/Video-Speichereinrichtung
Obwohl sich die oben beschriebenen Ausführungsformen lediglich mit einem Audiosignal als zugeführtes Signal, welches zu prüfen ist, befasst, kann ein Audio-/Videosignal, welches aufgezeichnet und wiedergegeben werden soll, als Objekt eines Beschaffungsbetriebs verwendet werden, wenn das Signal ein Audiosignal enthält, welches mit einem Videosignal verknüpft ist.
16 ist ein schematisches Blockdiagramm einer Aufzeichnungs-/Wiedergabevorrichtung, die ausgebildet ist, ein Audio-/Videosignal aufzuzeichnen und wiederzugeben, welches gemäß dem MPEG2-Standard komprimiert wurde, für welche eine Ausführungsform der Audio-/Videobeschaffungseinrichtung und die der Audio-Videospeichereinrichtung angewandt werden.
Es sei angemerkt, dass die Aufzeichnungs-/Wiedergabeeinrichtung von 1 eingerichtet ist, ein Videosignal und ein Audiosignal gemäß dem MPEG2-Standard zu komprimieren und zu codieren, das codierte Signal zu multiplexen und das Signal auf einer Festplatte in einem Festplattenlaufwerk (HDD) als Transportstrom (TS) des MPEG-Systems aufzuzeichnen, so dass die aufgezeichneten Signale von der Festplatte wiedergegeben werden können.
In der nachfolgenden Beschreibung werden ein analoges Videosignal und ein analoges Audiosignal entsprechend als Videosignal und Audiosignal bezeichnet, während ein digitales Videosignal und ein digitales Audiosignal entsprechend als digitale Videodaten und digitale Audiodaten bezeichnet werden, oder einfach als Videodaten und Audiodaten.
Die Aufzeichnungs-/Wiedergabevorrichtung 70 ist mit einer Antenne 61 verbunden, um analoge Fernsehsendungen zu empfangen und umfasst analoge Eingangsanschlüsse 71V, 71A, 71S, analoge Ausgangsanschlüsse 72V, 72A, 72S, einen digitalen Eingangs-/Ausgangsanschluss 73, eine digitale Schnittstelle 74, einen Eingangsverarbeitungsabschnitt 80, einen Ausgangsverarbeitungsabschnitt 90, einen Multiplexer/Demultiplexer 100, eine Puffersteuerung 110, ein Festplattenlaufwerk 120, eine Synchronisationssteuerschaltung 130, eine Systemsteuerung 140, einen Audiobeschaffungsabschnitt 150 und einen Betätigungseingabeabschnitt 160.
Das Festplattenlaufwerk 120 der oben beschriebenen Anordnung enthält drei Festplatten 121, 122, 123, und ein Transportstrom wird in jeder von diesen aufgezeichnet und in jeder von diesen wiedergegeben.
Die Systemsteuerung 140 umfasst eine CPU (Zentralverarbeitungseinheit) 141 zusammen mit einem ROM (Nur-Lese-Speicher) 143 und einem RAM (Speicher mit wahlfreiem Zugriff) 144, welche mit ihrem Systembus 142 verbunden sind.
Der ROM 143 speichert vorher Programme, welche durch die CPU 141 auszuführen sind, wobei die CPU 141 daraus ein geeignetes der Programme liest, welche im ROM 143 gespeichert sind und die Komponenten der Aufzeichnungs-/Wiedergabevorrichtung 70 steuert. Der RAM 144 wird verwendet, weitere Programme und Daten zu speichern, welche für die CPU 141 notwendig sind, um die Komponenten der Aufzeichnungs-/Wiedergabevorrichtung 70 zu steuern.
Der Betätigungseingabeabschnitt 160 weist üblicherweise eine Tastatur, eine Maus, Tasten, Schalter und eine Fernsteuerung auf und ist mit dem Systembus 142 der Systemsteuerung 140 über eine Eingangs-/Ausgangsschnittstelle verbunden (nicht gezeigt).
Der Audiobeschaffungsabschnitt 150 wird unter Verwendung einer der oben beschriebenen ersten bis fünften Ausführungsformen realisiert. Vom Standpunkt jedoch, dass diese Ausführungsform der Audio-/Videobeschaffungseinrichtung eingerichtet ist, Daten sich zu beschaffen, welche gemäß dem MPEG-Standards komprimiert und codiert wurden, ist die dritte Ausführungsform am vorteilhaftesten.
Es sollte angemerkt sein, dass das Aufzeichnungsmedium 113 durch die Festplatten des Festplattenlaufwerks 120 gebildet wird, und daher der Aufzeichnungsabschnitt 12 oder 42 und der Wiedergabeabschnitt 14 oder 44, welche auch immer geeignet ist, durch die Puffersteuerung 110 gebildet werden. Anders ausgedrückt umfasst der Audiobeschaffungsabschnitt 150 die Komponenten von einer der oben beschriebenen Ausführungsformen, welche für Audiobeschaffungsoperationen angepasst sind, und schließt die Komponenten aus, welche für das Aufzeichnen/Wiedergeben von Audiodaten als Hauptdaten angepasst sind.
Der Beschaffungsschlüsselspeicher 32 kann im Audiobeschaffungsabschnitt 150 angeordnet sein oder unter Verwendung eines Teils des Speicherbereichs der Festplatten des Festplattenlaufwerks 120 realisiert werden.
Außerdem sei angemerkt, dass Rahmennummern, Feldnummern, PTSs (Darstellungszeitstempel) und/oder Paketnummern als Verknüpfungsadressinformation verwendet werden, welche die Zeitspannen zum Beschaffen und Registrieren von Operationen für digitale audio-komprimierte Signale verwendet werden, und die Audio-/Videodaten, welche die Audiodaten enthalten, und die Videodaten, welche abwechselnd zum Aufzeichnen und Wiedergeben verknüpft sind.
Analoge Eingabe und Aufzeichnen
Das Signal eines analogen Fernsehrundfunks wird über die Antenne 61 empfangen und durch den Tuner 81 ausgewählt, gemäß der Betätigung des Betätigungseingabeabschnitts 160 unter der Steuerung der Systemsteuerung 140. Dann werden das zusammengesetzte Videosignal und Audiosignal vom ausgewählten Kanal von dem empfangenen Signal durch den Tuner 81 erzeugt und zu einem der Eingangsanschlüsse der Eingangsschaltschaltung 82 geführt.
Dagegen wird ein zusammengesetztes Videosignal von einer externen Einrichtung und ein Audiosignal ebenfalls von einer externen Einrichtung entsprechend zum Eingangsanschluss 71V und zum Eingangsanschluss 71A geführt, während ein getrenntes Videosignal (welches ein Helligkeitssignal und ein Farbdifferenzsignal aufweist, welche voneinander getrennt sind) auch von einer externen Einrichtung zum Eingangsanschluss 71S geführt wird.
Das zusammengesetzte Videosignal vom Eingangsanschluss 71V und das Audiosignal vom Eingangsanschluss 71A werden zum anderen Eingangsanschluss der Eingangsschaltschaltung 82 geführt. Dann wird die Eingangsschaltschaltung 82 durch die Systemsteuerung 140 betätigt, so dass entweder die zusammengesetzten Videosignale oder das entsprechende Audiosignal ausgewählt werden und daraus herausgenommen werden.
Das zusammengesetzte Videosignal von der Eingangsschaltschaltung 82 wird in ein Helligkeitssignal und ein Farbdifferenzsignal durch die YC-Trennschaltung 83 getrennt, welche dann zu einem der Eingangsanschlüsse der anderen Eingangsschaltschaltung 84 gerührt werden. Dagegen wird ein getrenntes Videosignal (Helligkeitssignal und Farbdifferenzsignal) vom Eingangsanschluss 71S zum anderen Eingangsanschluss der Eingangsschaltschaltung 84 geführt. Der Schaltbetrieb der Eingangsschaltschaltung 84 wird durch die Systemsteuerung 140 so gesteuert, dass einer der beiden Sätze von einem Helligkeitssignal und einem Farbdifferenzsignal ausgewählt werden und von der Eingangsschaltschaltung 84 herausgenommen werden.
Das Helligkeitssignal und das Farbdifferenzsignal, welche von der Eingangsschaltschaltung 84 herausgenommen werden, werden einem AD-Umsetzungsprozess durch den NTSC-Decoder 85 unterworfen und dann einem Chromacodierprozess unterworfen, so dass Komponentenvideodaten von dem NTSC-Decoder 85 erlangt werden.
Der NTSC-Decoder 85 trennt außerdem ein vertikales Synchronsignal und ein horizontales Synchronsignal vom Helligkeitssignal, welche von der Eingangsschaltschaltung 84 herausgenommen werden, und es wird ein Takt- und Feldunterscheidungssignal auf Basis dieser Synchronsignale erzeugt. Die Synchronsignale und das Takt-Feldunterscheidungssignal werden dann zu einer Synchronsteuerschaltung 130 geführt, wobei die Synchronsteuerschaltung 130 wiederum Takt- und Zeitablaufsignale erzeugt, welche für die jeweiligen Komponentenabschnitte der Aufzeichnungs-/Wiedergabeeinrichtung 70 notwendig sind, wobei auf diese Signale bezuggenommen wird, und die erzeugten Takt- und Zeitgabesignale zu den jeweiligen Komponentenabschnitten liefert.
Die Videodaten vom NTSC-Decoder 85 werden einer Reihe von Vorverarbeitungsoperationen unterworfen, einschließlich einer Vorfilterungsoperation durch eine Vorverarbeitungsschaltung 86 und nachfolgend dem MPEG-Videocodierer 87 und der Videonachverarbeitungsschaltung 92 des Ausgabeverarbeitungsabschnitts 90 zugeführt.
Der MPEG-Videocodierer 87 führt einen Codierbetrieb aus, beispielsweise die Block-DCT (diskrete Kosinustransformation) hinsichtlich der Videodaten von der Videovorverarbeitungsschaltung 86, um einen Videoelementarstrom (ES) zu erzeugen, wobei dieser Videoelementarstrom dann zum Multiplexer/Demultiplexer 100 geführt wird.
Dagegen wird das Audiosignal von der Eingangsschaltschaltung 82 in digitale Audiodaten durch den A/D-Umsetzer 88 transformiert und nachfolgend zum MPEG-Audiocodierer 89 und zur Ausgabeschaltschaltung 95 des Ausgabeverarbeitungsabschnitts 90 geführt.
Der MPEG-Audiocodierer 89 komprimiert und codiert die Audiodaten vom A/D-Umsetzer 88 mittels des MPEG-Systems, um einen Audioelementarstrom zu erzeugen, wobei der Audioelementarstrom dann zum Multiplexer/Demultiplexer 100 geführt wird.
Der Multiplexer/Demultiplexer 100 multiplext den Audioelementarstrom von dem MPEG-Videocodierer 87 und dem Audioelementarstrom vom MPEG-Audiocodierer 89 gemeinsam mit verschiedenen Steuersignalen, um einen Transportstrom des MPEG-Systems in seinem Multiplexer zu erzeugen. Der erzeugte Transportstrom wird dann zur Puffersteuerung 110 ausgesendet.
Die Puffersteuerung 110 sendet intermittierend den Transportstrom aus, der fortlaufend vom Multiplexer/Demultiplexer 100 zugeführt wird, zum Festplattenlaufwerk 120. Da insbesondere das Festplattenlaufwerk 120 keinen Schreibbetrieb ausführen kann, wenn dies einen Suchbetrieb ausführt, speichert die Puffersteuerung 110 vorübergehend den Transportstrom, der zu ihm zugeführt wird, im Puffer. Dann liest die Puffersteuerung 110 den Transportstrom, der im Puffer gespeichert ist, mit einer Rate, welche höher ist als die Rate, mit der dieser zugeführt wurde und sendet diesen zum Festplattenlaufwerk 120, wenn das Festplattenlaufwerk Daten schreiben kann. Als Ergebnis wird der Transportstrom, welcher fortlaufend der Puffersteuerung 110 zugeführt wird, in den Festplatten 121 bis 123 ohne Unterbrechung aufgezeichnet.
Das Festplattenlaufwerk 120 ist eingerichtet, einen Transportstrom auf die Festplatten 121 bis 123 unter der Steuerung der Systemsteuerung 140 zu schreiben. Üblicherweise wird DIE (integrated drive electronics) als Protokoll (Schnittstelle) zwischen der Puffersteuerung 110 und dem Festplattenlaufwerk 120 verwendet.
Wiedergabe und Analogausgabe
Für einen Wiedergabebetrieb liest das Festplattenlaufwerk 120 den Transportstrom von den Festplatten 121 bis 123 und sendet diesen zur Puffersteuerung 110 unter der Steuerung der Systemsteuerung 140. Im Gegensatz zu dem Aufzeichnungsbetrieb transformiert die Puffersteuerung 110 den zugeführten Transportstrom intermittierend von dem Festplattenlaufwerk 120 in einen fortlaufenden Transportstrom und führt diesen dem Multiplexer/Demultiplexer 100 zu.
Der Multiplexer/Demultiplexer 100 analysiert den Datenkopf des fortlaufenden Transportstroms in seinem Demultiplexer, um den PES (paketierter Elementarstrom) vom Transportstrom zu isolieren, und führt den isolierten PES dem MPEG-Audio-/Videodecoder 91 zu.
Der MPEG-Audio-/Videodecoder 91 unterteilt den PES vom Multiplexer/Demultiplexer 100 in einen Videoelementarstrom und einen Audioelementarstrom, von denen der Videoelementarstrom durch den MPEG-Videodecoder decodiert wird und in Videodaten des Basisbands transformiert wird, während der Audioelementarstrom durch den MPEG-Audiodecoder decodiert wird und in Audiodaten des Basisbands transformiert wird. Nach der Transformation werden die Videodaten der Videonachverarbeitungsschaltung 92 zugeführt, während die Audiodaten der Audionachverarbeitungsschaltung 95 zugeführt werden.
Die Videonachverarbeitungsschaltung 92 führt Operationen durch, beispielsweise das Umschalten von den Videodaten, welche vom MPEG-Audio-/Videodecoder 91 geliefert werden; auf die Videodaten, welche von der Videovorarbeitungsschaltung 96 geliefert werden, oder umgekehrt, wobei die beiden Videodaten synthetisch kombiniert werden und/oder nachgefiltert werden.
Die Videonachverarbeitungsschaltung 92 führt außerdem einen Kompression-Standbild-Anzeigebetrieb zum Erzeugen mehrerer repräsentativer Bilder (Standbilder) für die GUI (Grafikbenutzerschnittstelle) durch, wobei die repräsentativen Bilder komprimiert werden, und diese in ein Fenster geklebt werden. Die Videodaten der verarbeiteten Bilder werden dann der OSD-Verarbeitungsschaltung (on screen display) 93 zugeführt.
Repräsentative Bilder, welche für den Zweck der Erfindung verwendet werden können, können eine beeindruckende Szene des Titels eines Programms und einen Indexpunkt (eine Szene) des Programms aufweisen, wodurch es für den Benutzer (Zuschauer) erleichtert wird, auf die Szene, die zu sehen gewünscht, schnell zuzugreifen.
Die OSD-Verarbeitungsschaltung 93 erzeugt Videodaten entsprechend der Textinformation, welche ihr zugeführt wird, und überlagert diese den Videodaten des Fensters, welche von der Videonachverarbeitungsschaltung 92 gesendet werden, unter der Steuerung der Systemsteuerung 140. Danach sendet sie die verarbeiteten Bilddaten zum NTSC-Codierer 34. 17 zeigt typische repräsentative Standbilder, welche durch Kompression der entsprechenden Originalbilder erzeugt werden. In 17 ist eine Gesamtzahl von 16 komprimierten Standbildern 200 auf das Fenster aufgeklebt.
Der NTSC-Codierer 94 fuhrt einen Betrieb einer D/A-Umsetzung hinsichtlich der Videodaten (Komponentenvideodaten) von der OSD-Verarbeitungsschaltung 93 durch, nachdem oder ohne diese in Helligkeitsdaten und Farbdifferenzdaten zu transformieren, um ein Trennvideosignal und ein zusammengesetztes Videosignal zu erzeugen, welche Analogsignale sind, von denen das Trennvideosignal zum Ausgangsanschluss 72S geführt wird, während das zusammengesetzte Videosignal zum Ausgangsanschluss 72V geführt wird.
Dagegen nimmt die Ausgangsschaltschaltung 95 selektiv entweder die Audiodaten vom MPEG-Audio-/Videodecoder 91 oder die Audiodaten vom A/D-Umsetzer 88 unter der Steuerung der Systemsteuerung 140 heraus. Die ausgewählten Audiodaten werden dann in ein analoges Audiosignal durch den D/A-Umsetzer 36 umgesetzt und dem Ausgangsanschluss 72A zugeführt.
Das Trennvideosignal, welches denn Ausgangsanschluss 72S zugeführt wird, das zusammengesetzte Videosignal, welches dem Ausgangsanschluss 72V zugeführt wird, und das Audiosignal, welches dem Ausgangsanschluss 72A zugeführt wird, werden dann zum Monitor 2 eines externen Fernsehempfangsgeräts gesendet, so dass der Benutzer/Betrachter das entsprechende Bild betrachten kann, welches auf dem Monitor 2 angezeigt wird, und dem Ton zuhören kann, der auch vom Monitor 2 ausgegeben wird.
Aufzeichnungs-/Wiedergabe von Audio-/Videodaten von einer externen Vorrichtung
Der digitale Eingangs-/Ausgangsanschluss 73 und der Hauptkörper 100 ist miteinander durch die digitale Schnittstelle 74 in der Aufzeichnungs-/Wiedergabevorrichtung 70 verbunden, so dass der Transportstrom, der von der externen Vorrichtung 63 zugeführt wird, auf den Festplatten 121 bis 123 aufgezeichnet werden kann, und der Transportstrom, welcher von den Festplatten 121 bis 123 wiedergegeben wird, an die externe Vorrichtung 63 ausgegeben werden kann, wobei der digitale Eingangs-/Ausgangsanschluss 73 mit der externen Vorrichtung 63 verbunden wird.
Die externe Vorrichtung 63 kann ein IRD (integrierte Empfänger-Decoder) oder ein Personalcomputer sein. Eine IEEE-1394-Digitalschnittstelle wird üblicherweise für die digitale Schnittstelle 74 verwendet, während ein IEEE-1394-Seriell-Bus üblicherweise für den seriellen Bus 64 verwendet wird, welcher die externe Vorrichtung 63 und den digitalen Eingangs-/Ausgangsanschluss 73 verbindet.
Der Transportstrom, welcher von der externen Vorrichtung 63 dem digitalen Eingangs-/Ausgangsanschluss 73 über den seriellen Bus 64 zugeführt wird, wird dann durch die digitale Schnittstelle 74 verarbeitet und zum Multiplexer/Demultiplexer 100 gesendet, und dann weiter vom Multiplexer/Demultiplexer 100 zur Puffersteuerung 110, so dass er auf den Festplatten 121 bis 123 durch das Festplattenlaufwerk 120 aufgezeichnet wird.
Im gleichen Zeitpunkt wird der PES im aufzeichnenden Transportstrom von letzterem durch den Demultiplexer des Multiplexers/Demultiplexers 100 isoliert und dem MPEG-Audio-/Videodecoder 91 zugeführt, so dass das analoge Videosignal und das analoge Audiosignal, welche wiedergegeben werden, entsprechend an den Ausgangsanschlüssen 72V, 72S und 72A erlangt werden können.
Für einen Wiedergabebetrieb wird der Transportstrom von den Festplatten 121 bis 123 über das Festplattenlaufwerk 120 gelesen, und der Wiedergabetransportstrom wird zur Puffersteuerung 110 und weiter von der Puffersteuerung 110 zum Multiplexer/Demultiplexer 100 gesendet. Danach wird dieser durch die digitale Schnittstelle 74 verarbeitet, und an den digitalen Eingangs-/Ausgangsanschluss 73 ausgegeben, und weiter vom digitalen Eingangs-/Ausgangsanschluss 73 an die externe Vorrichtung 63 über den seriellen Bus 64, so dass der Benutzer/Zuschauer das entsprechende Bild, welches auf dem Monitor 7 angezeigt wird, welches mit der externen Vorrichtung 63 verbunden ist, beobachten kann, und außerdem dem Ton, der vom Monitor 7 ausgegeben wird, zuhören kann.
Im gleichen Zeitpunkt ist der PES des Wiedergabetransportstroms von letzterem durch den Demultiplexer des Multiplexers/Demultiplexers 100 isoliert und wird zum MPEG-Audio-/Videodecoder 91 geführt, so dass das analoge Videosignal und das analoge Audiosignal, welche wiedergegeben werden, entsprechend an den Ausgangsanschlüssen 72V, 72S und 72A erlangt werden können.
Audiobeschaffung
Wie oben beschrieben arbeitet der Audiobeschaffungsabschnitt 150 wie einer der ersten bis fünften Ausführungsformen der Erfindung, um Tonsegmente sich zu beschaffen. Insbesondere kann der Audiobeschaffungsabschnitt 150 nicht nur das Audiosignal extrahieren, welches durch Spezifizieren eines Beschaffungsschlüssel-Tonkenndatenparameters erlangt wird, sondern auch das Teil des Videosignals, welches dem beschafften Audiosignal entspricht, auf Basis von dessen verknüpfter Beziehung. Wenn insbesondere das zu prüfende Audiosignal das eines Musikprogramms ist, ist es möglich, nur die Szenen des Parameters zu extrahieren, wo eine spezielle Musik ertönt.
Wie oben beschrieben ist das zu prüfende Audiosignal nicht auf die Signale beschränkt, welche im Festplattenlaufwerk 120 aufgezeichnet sind, und kann von den Audiodaten ausgewählt werden, welche empfangen werden oder welche von außen zugeführt werden. Im Fall dieser Ausführungsform ist es, da mehrere zugeführte Audiodaten verfügbar sind, für den Benutzer möglich, das Audiosignal, welches in einem der zugeführten Audio-/Videosignale enthalten ist, zu analysieren, und die beschafften Bilder im Fenster des Anzeigebildschirms anzuzeigen, wobei er das Bild beobachtet und den Ton von irgendeinem anderen zugeführten Audiosignal auf dem Monitor 62 hören kann (das Fenster kann so ausgeführt werden, dass es konstant erscheint oder lediglich, wenn ein Bild beschafft wird). Beispielsweise kann ein Sprachabdruck eines Favoriten Schauspielers oder Schauspielerin als Beschaffungsschlüssel-Tonkenndatenparameter verwendet werden, und, wenn der Schauspieler oder die Schauspielerin eingefangen ist, kann die entsprechende Szene im Fenster angezeigt werden.
Es ist außerdem möglich, einen Beschaffungsschlüssel-Tonkenndatenparameter für jedes der komprimierten Standbilder 200 zu registrieren, wie in 17 gezeigt ist, so dass, wenn der Benutzer irgendeines der komprimierten Standbilder 200 spezifiziert, ein Betrieb der Audiobeschaffung beginnt, wobei der Beschaffungsschlüssel-Tonkenndatenparameter entsprechend dem spezifizierten Bild 200 verwendet wird.
Es sei beispielsweise angenommen, dass das komprimierte Standbild, welches den Benutzer spezifiziert wird, eine Person zeigt und ein Sprachabdruck der Person im Beschaffungsschlüsselspeicher als Beschaffungsschlüssel-Tonkenndatenparameter gespeichert ist. Wenn dann der Beschaffungsschlüssel für die Person im komprimierten Standbild spezifiziert ist, kann die Ausführungsform unmittelbar mit dem extrahieren der Szenen beginnen, wo die Person erscheint und spricht. Somit können die komprimierten Standbilder als Indexe verwendet werden, um Arbeitsweisen abzurufen, wenn ein Beschaffungsschlüssel-Tonkenndatenparameter vorher für jedes der komprimierten Standbilder registriert ist.
Umgekehrt ist es auch möglich, eine Szene, welche durch einen spezifischen Beschaffungsschlüssel-Tonkenndatenparameter extrahiert wurde, zu registrieren, um somit diesen als komprimiertes Standbild auf dem Anzeigebildschirm anzuzeigen. Beispielsweise kann eine Szene in Verbindung mit einem charakteristischen Ton einer Person als Sprachabdruck als komprimiertes Standbild registriert werden, um somit auf dem Anzeigebildschirm angezeigt zu werden, wenn die Person nicht in der Szene erscheint.
Außerdem ist es möglich, Audiosignale, welche als Beschaffungsschlüssel arbeiten, oder Beschaffungsschlüssel-Tonkenndatenparameter auf ein Rundfunksignal zum Multiplexen einzustellen. Dann kann der Benutzer ein gewünschtes der Audiosignale auswählen und verwenden, wobei er Beschaffungsschlüssel oder Beschaffungsschlüssel-Tonkenndatenparameter betätigt oder geeignete im Beschaffungsschlüsselspeicher 32 registriert und speichert.
Zweite Ausführungsform der Audio-/Videobeschaffungseinrichtung und der Audio-/Videospeichereinrichtung
Obwohl die oben beschriebene erste Ausführungsform eingerichtet ist, Beschaffungsschlüssel lediglich zum Beschaffen von Audiosignalen zu verwenden, ist diese zweite Ausführungsform eingerichtet, die Beschaffungsschlüssel nicht nur für Audiosignale zu verwenden, sondern auch für Videosignale.
Bei der zweiten Ausführungsform werden die Beschaffungsschlüssel-Tonkenndatenparameter, welche als Beschaffungsschlüssel verwendet werden können, um Videosignale von charakteristischen Bildern zu beschaffen, vorher registriert. Die Beschaffungsschlüssel-Tonkenndatenparameter, welche für den Zweck der Erfindung verwendet werden können, können die Helligkeit und deren Änderungen umfassen, den Farbton und deren Änderungen und eine Szene, welche eine Person ein Objekt zeigt, sowie deren Änderungen.
Wie das Beschaffen von Schlüsseltonkenndatenparametern kann das Beschaffen von aktuellen Bildkenndatenparametern durch Analyse der Zeitspanne des Videosignals erlangt werden, welche durch den Benutzer spezifiziert wird, von dem zugeführten Audio-/Videosignal oder durch Analyse eines Videosignals, welches speziell der Ausführungsform zugeführt wird, um somit als Beschaffungsschlüssel zu arbeiten. Außerdem ist es möglich, Beschaffungsschlüssel vorher üblicherweise mittels eines Personalcomputers zu erlangen und diese bei der Ausführungsform zu registrieren.
Dann kann ein Bild, welches dem Bild des Beschaffungsschlüssels ähnelt, von dem Videosignal, welches zu prüfen ist, beschafft werden, wobei der Bildkenndatenparameter, welcher durch Analyse des Videosignals, welches zu prüfen ist, erlangt wird, und der Beschaffungsschlüssel-Bildkenndatenparameter verglichen werden, und über Berechnung die Ähnlichkeit von diesen bestimmt wird. Dann kann ein gewünschtes Teil des zugeführten Audio-/Videosignals auf Basis des Ergebnisses des Beschaffungsbetriebs beschafft werden, der hinsichtlich des Audiosignals ausgeführt wird, und dem des Beschaffungsbetriebs, der hinsichtlich des Videosignals durchgeführt wird.
Für den Zweck der Erfindung können ein Beschaffungsschlüssel-Bildkenndatenparameter und ein entsprechender Beschaffungsschlüssel-Tonkenndatenparameter separat registriert werden so viele wie Beschaffungsschlüssel oder miteinander zur Registrierung verknüpft sein. Beispielsweise kann ein Beschaffungsschlüssel-Bildkenndatenparameter eines Bilds einer Person und ein Beschaffungsschlüssel-Tonkenndatenparameter des Sprachabdrucks der Person zur Registrierung verknüpft sein.
Bei dieser zweiten Ausführungsform ist es möglich, separat einen Beschaffungsschlüssel-Bildkenndatenparameter und einen Beschaffungsschlüssel-Tonkenndatenparameter zu spezifizieren und entsprechende Beschaffungsoperationen auszuführen. Außerdem ist es möglich, einen Beschaffungsschlüssel zu spezifizieren, um einen Beschaffungsschlüssel-Bildkenndatenparameter und einen Beschaffungsschlüssel-Tonkenndatenparameter zu verwenden, welche miteinander verknüpft sind.
Wenn ein Beschaffungsbetrieb ausgeführt wird, können unter Verwendung von sowohl eines Beschaffungsschlüssel-Tonkenndatenparameters als auch eines Beschaffungsschlüssel-Kenndatenparameters alle Teile des Audio-/Videosignals, welche dem Beschaffungsschlüssel ähneln und welche durch einen der Parameter beschafft wurden, ausgegeben werden, oder die Teile eines Audio-/Videosignals, welche dem Beschaffungsschlüssel ähneln, und beschafft werden, unter Verwendung der beiden Parameter, so dass sie zumindest einiges gemeinsam haben.
Als Ergebnis des Beschaffungsbetriebs können die Teile, welche beschafft werden, unter Verwendung von deren Adressinformation angezeigt werden. Soweit das Bild betroffen ist, können die Anfangszenen der Teile, welche beschafft werden, als komprimierte Standbilder in einer Weise wie früher beschrieben angezeigt werden. Außerdem ist es möglich, sequentiell die beschafften Teile der Signale wie in dem Fall der oben beschriebenen Ausführungsformen zur Audiobeschaffung wiederzugeben. Weiter ist es auch möglich, das Ergebnis des Beschaffungsbetriebs und den Beschaffungsschlüssel, welcher für den Betrieb verwendet wird, zu verknüpfen und diese in einem Speicher zu speichern, so dass das Ergebnis unter Verwendung des Beschaffungsschlüssels wiedergegeben werden kann.
Bei dieser zweiten Ausführungsform, wo sowohl eine Zeitspanne eines Videosignals unter Verwendung eines Bildkenndatenparameters ermittelt wird, als auch eine Zeitspanne eines Audiosignals unter Verwendung eines Tonkenndatenparameters ermittelt wird, kann ein Beschaffungsbetrieb sehr bedeutungsvoll ausgeführt werden. Beispielsweise ist es möglich, ein Teil eines Audio-/Videosignals, wo unterschiedliche Szenen auftreten können, wobei jedoch eine Erzählung fortdauert, sich zu beschaffen.
Wenn ein Beschaffungsschlüssel spezifiziert wird, um einen Beschaffungsschlüssel-Bildkenndatenparameter und einen Beschaffungsschlüssel-Tonkenndatenparameter sich zu beschaffen, welche miteinander verknüpft sind und Teile eines Audio-/Videosignals, welche unter Verwendung des Beschaffungsschlüssels angezeigt werden, so viele wie komprimierte Standbilder, werden die angezeigten Bilder nicht nur hinsichtlich des Bilds, sondern auch hinsichtlich des Tons bedeutungsvoll.
Wie oben ausführlich beschrieben wird, wird gemäß der Erfindung ein Verfahren und eine Vorrichtung bereitgestellt, welche das Teil der Sprache eines spezifischen Sprechers sich beschaffen kann oder ein Instrument des aufgezeichneten Audiosignals abgestimmt wird, ohne eine Betätigung zum Setzen von Markierungen erforderlich zu machen oder Zählerstände oder Zeitgaben im Zeitpunkt des Aufzeichnens des Audiosignals aufzuzeichnen. Insbesondere werden das zu prüfende Audiosignal und das zu verwendende Audiosignal als Beschaffungsschlüssel analysiert, um entsprechende Tonkenndatenparameter zu erlangen, und die erlangten Tonkenndatenparameter werden verglichen, um die Ähnlichkeit von zwei Signalen zu bestimmen.
Gemäß der Erfindung können Beschaffungsschlüssel vorher registriert werden, so dass ein Beschaffungsbetrieb einfach unter Auswahl von einem der registrierten Beschaffungsschlüssel durchgeführt werden kann.
Ungleich dem Fall, bei dem Markierer verwendet werden, kann jegliches Teil des Audiosignals außerdem unter Verwendung eines Beschaffungsschlüssels geprüft werden, der vorher vorbereitet ist, ohne das Audiosignal aufzuzeichnen.
Wenn schließlich eine gewünschte Szene eines Audio-/Videosignals beschafft wird, kann die Verlässlichkeit des Beschaffungsbetriebs verbessert werden, indem ein Tonkenndatenparameter und ein Bildkenndatenparameter verwendet wird. Dann wird die beschaffte Szene sowohl hinsichtlich des Bilds als auch hinsichtlich des Tons deutlich.

Claims

Tonbeschaffungsverfahren zum Beschaffen eines Teils eines Audiosignals, welches zu analysieren ist, welches einem oder mehr als einem Audiosignal ähnelt, welches so wie viele Beschaffungsschlüssel wirkt, indem jeder der Beschaffungsschlüssel-Tonkenndatenparameter, die von den jeweiligen Audiosignalen erlangt werden, die als Beschaffungsschlüssel wirken und von strukturellen Faktoren der Tonquelle der Audiosignale abhängig sind, mit dem charakteristischen Parameter verglichen wird, der durch Analysieren des zu analysierenden Audiosignals und durch rechnerisches Bestimmen einer Ähnlichkeit zwischen ihnen erlangt wird, dadurch gekennzeichnet, dass die Ähnlichkeit auf Basis einer Differenz zwischen einer Kombination der Tonhöhenfrequenz und der Formantfrequenz des zu analysierenden Audiosignals während einer Zeitperiode und der Tonhöhenfrequenz und der Formantfrequenz der Audiosignale, die als Beschaffunngsschlüssel wirken, bestimmt wird.
Tonbeschaffungsverfahren nach Anspruch 1, wobei das eine oder mehr als ein Audiosignal vorher vorbereitet sind und die Tonkenndatenparameter, welche durch Analysieren der Audiosignale erlangt werden, die als Beschaffungsschlüssel wirken und von der Tonquelle erzeugt werden, von den vorbereiteten Audiosignalen als Beschaffungsschlüssel-Tonkenndatenparameter für diesen Prozess zum rechnerischen Bestimmen der Ähnlichkeit verwendet werden.
Tonbeschaffungsverfahren nach Anspruch 2, wobei die Audiosignale, die als Beschaffungsschlüssel arbeiten, von dem zu analysierenden Audiosignal extrahiert und gespeichert werden.
Tonbeschaffungsverfahren nach Anspruch 1, wobei die Beschaffungsschlüssel-Tonkenndatenparameter durch den Benutzer erlangt werden, indem der Teil des zu analysierenden Audiosignals wie durch den Benutzer spezifiziert und das zu analysierende Audiosignal unter Verwendung der Beschaffungsschlüssel-Tonkenndatenparameter analysiert werden.
Tonbeschaffungsverfahren nach Anspruch 1, wobei der eine oder mehr als ein Beschaffungsschlüssel-Tonkenndatenparameter vorher gespeichert sind, und die, welche von den gespeicherten Beschaffungsschlüssel-Tonkenndatenparametern während des Beschaffungsprozesses gelesen werden, für diesen Prozess zum rechnerischen Bestimmen der Ähnlichkeit verwendet werden.
Tonbeschaffungsverfahren nach Anspruch 5, wobei die Beschaffungsschlüssel-Tonkenndatenparameter diejenigen sind, welche durch Analysieren des Audiosignals erlangt werden, welches als Beschaffungsschlüssel wirkt, welcher von dem zu analysierenden Audiosignal extrahiert wird.
Tonbeschaffungsverfahren nach einem der Ansprüche 1 bis 5, wobei mehr als ein Beschaffungsschlüssel sequentiell auf Einzelbasis gemäß einer vorgegebenen Zeiteinheit für den Prozess zum rechnerischen Bestimmen der Ähnlichkeit verwendet werden.
Tonbeschaffungsverfahren nach einem der Ansprüche 1 bis 6, wobei das Ergebnis jedes Beschaffungsprozesses unter Verwendung eines Beschaffungsschlüssels für das zu analysierende Audiosignal auf zeitlicher Basis angezeigt wird.
Tonbeschaffungsverfahren nach Anspruch 7, wobei das Ergebnis jedes Beschaffungsprozesses unter Verwendung eines Beschaffungsschlüssels für das zu analysierende Audiosignal auf zeitlicher Basis angezeigt wird.
Tonbeschaffungsverfahren nach einem der Ansprüche 1 bis 6, wobei lediglich das Teil oder die Teile des zu analysierenden Audiosignals, welche den Beschaffungsschlüsseln ähneln, extrahiert werden und als Ergebnis des Beschaffungsprozesses wiedergegeben werden.
Tonbeschaffungsverfahren nach Anspruch 7, wobei lediglich das Teil oder die Teile des zu analysierenden Audiosignals, welche den Beschaffungsschlüsseln ähneln, extrahiert werden und als Ergebnis des Beschaffungsprozesses wiedergegeben werden.
Verfahren zum Speichern einer Toninformation zum Aufzeichnen eines zugeführten Audiosignals auf einem Aufzeichnungsmedium (13) und zum Beschaffen eines Teils eines zu analysierenden Audiosignals, welches einem oder mehr als einem Audiosignal ähnelt, welche so wirken wie viele Beschaffungsschlüssel, nach einem Tonbeschaffungsverfahren nach Anspruch 1, um das Ergebnis des Beschaffungsprozesses wenn mit den Beschaffungsschlüsseln verknüpft, und die Position, welche zum Aufzeichnen des zugeführten Audiosignals verwendet wird, auf dem Aufzeichnungsmedium aufzuzeichnen.
Verfahren zum Speichern einer Toninformation nach Anspruch 12, wobei das Ergebnis des Beschaffungsprozesses mit dem Audiosignal auf dem Aufzeichnungsmedium aufgezeichnet wird.
Verfahren zum Speichern einer Toninformation nach Anspruch 12 oder 13, wobei jeder der Beschaffungsschlüssel-Tonkenndatenparameter, welche von den jeweiligen Audiosignalen erlangt werden, welche als Beschaffungsschlüssel wirken, als Ergebnis eines Analyseprozesses erlangt wird, der in Bezug auf ein Teil des zugeführten Audiosignals durchgeführt wird, welches gemäß einer Instruktion des Benutzers ausgewählt und extrahiert wird.
Verfahren zum Speichern einer Toninformation nach Anspruch 14, wobei die Beschaffungsschlüssel-Tonkenndatenparameter des einen oder mehr als des einen Audiosignals, die als Beschaffungsschlüssel wirken, die als Ergebnis des Analyseprozesses erlangt werden, welcher in Bezug auf ein Teil des Audiosignals ausgeführt wird, welches gemäß einer Instruktion des Benutzers ausgewählt und extrahiert wird, in unterschiedlichen entsprechenden Speicherbereichen eines Pufferspeichers gespeichert werden und hintereinander gelesen werden und für den Prozess zum Beschaffen eines Teils des zugeführten Audiosignals verwendet werden, wobei die Ähnlichkeit rechnerisch bestimmt wird.
Verfahren zum Speichern einer Toninformation nach Anspruch 14, wobei das eine oder mehr als das eine Teil des zugeführten Audiosignals, welches gemäß entsprechenden Instruktionen des Benutzers ausgewählt und extrahiert wird, in unterschiedlichen entsprechenden Speicherbereichen eines Pufferspeichers als Audiosignale gespeichert werden, die als Beschaffungsschlüssel wirken, und das eine oder mehr als das eine Audiosignal, welche als Beschaffungsschlüssel wirken, von dem Pufferspeicher gelesen werden und analysiert werden, um entsprechende Beschaffungsschlüssel-Tonkenndatenparameter zu erzeugen, so dass der Prozess zum Beschaffen eines Teils des zugeführten Audiosignals durch rechnerisches Bestimmen der Ähnlichkeit unter Verwendung der Audiosignale ausgeführt wird, die als Beschaffungsschlüssel wirken.
Verfahren zum Speichern einer Toninformation nach Anspruch 12 oder 13, wobei die Tonkenndatenparameter der Audiosignale, die als Beschaffungsschlüssel wirken, oder die Audiosignale, die als Beschaffungsschlüssel wirken, mit dem Ergebnis des Beschaffungsprozesses auf dem Aufzeichnungsmedium aufgezeichnet werden.
Verfahren zum Speichern einer Toninformation nach Anspruch 14, wobei die Tonkenndatenparameter der Audiosignale, welche als Beschaffungsschlüssel wirken, oder die Audiosignale, welche als Beschaffungsschlüssel wirken, mit dem Ergebnis des Beschaffungsprozesses auf dem Aufzeichnungsmedium aufgezeichnet werden.
Toninformation-Beschaffungseinrichtung, welche eine Tonkenndatenparameter-Analyseeinrichtung (21) aufweist, um ein zu analysierendes Audiosignal zu analysieren und einen Tonkenndatenparameter in Abhängigkeit von strukturellen Faktoren der Tonquelle des Audiosignals zu erlangen, eine Beschaffungseinrichtung (32) zum Vergleichen der Tonkenndatenparameter der Audiosignale, die als Beschaffungsschlüssel wirken, mit dem Tonkenndatenparameter des zu analysierenden Audiosignals, welches von der Tonkenndatenparameter-Analysierungseinrichtung (21) erlangt wird, und zum Beschaffen eines Teils des zu analysierenden Audiosignals, welches den Audiosignalen ähnelt, welche als Beschaffungsschlüssel wirken und von der Tonquelle der Beschaffungsschlüssel erlangt werden, wobei die Einrichtung durch einen Ähnlichkeitsbestimmungsabschnitt (22) gekennzeichnet ist, der betriebsfähig ist, eine Ähnlichkeit zwischen dem zu analysierenden Audiosignal und den Audiosignalen zu bestimmen, welche als Beschaffungsschlüssel wirken, wobei die Ähnlichkeit auf Basis einer Differenz zwischen einer Kombination der Tonhöhenfrequenz und der Formantfrequenz des zu analysierenden Audiosignals während einer Periode und der Tonhöhenfrequenz und der Formantfrequenz der Audiosignale, die als Beschaffungsschlüssel wirken, bestimmt wird.
Toninformation-Beschaffungseinrichtung nach Anspruch 19, welche außerdem eine Ergebnisanzeigeeinrichtung aufweist, um das Ergebnis des Beschaffungsprozesses der Beschaffungseinrichtung anzuzeigen.
Toninformations-Beschaffungseinrichtung nach Anspruch 19, wobei die Ergebnisanzeigeeinrichtung das ähnelnde Teil, wenn es durch die Beschaffungseinrichtung bestimmt wird, simultan mit dem zeitlichen Fortgang des zu analysierenden Audiosignals anzeigt.
Toninformations-Beschaffungseinrichtung nach Anspruch 19, welche außerdem eine Halteeinrichtung aufweist, um das eine oder mehr als das eine Audiosignal zu halten, die als Beschaffungsschlüssel wirken, eine Leseeinrichtung zum Lesen der ausgewählten Audiosignale, welche als Beschaffungsschlüssel wirken, von der Halteeinrichtung im Zeitpunkt des Beschaffungsprozesses, und eine Beschaffungsschlüssel-Tonkenndatenparameter-Analyseeinrichtung zum Analysieren der Audiosignale, die als Beschaffungsschlüssel wirken, wenn diese durch die Leseeinrichtung gelesen werden, und zum Erlangen der Beschaffungsschlussel-Tonkenndatenparameter, welche zur Ähnlichkeitsbestimmungseinrichtung geliefert werden.
Toninformation-Beschaffungseinrichtung nach Anspruch 19, welche außerdem eine Halteinrichtung zum Halten des einen oder mehr als den einen Beschaffungsschlüssel-Tonkennzeichenparameter und eine Leseeinrichtung zum Lesen ausgewählter Beschaffungsschlüssel-Tonkennzeichenparameter von der Halteeinrichtung und zum deren Liefern zur Ähnlichkeitsbestimmungseinrichtung umfasst.
Toninformation-Beschaffungseinrichtung nach Anspruch 23, welche außerdem eine Beschaffungsschlüssel-Registriereinrichtung aufweist, um Tonkenndatenparameter als Beschaffungsschlüssel vom zu analysierenden Audiosignal zu extrahieren, wobei das Audiosignal gemäß einer Instruktion des Benutzer analysiert wird, und um diese in der Halteeinrichtung zu halten.
Toninformation-Beschaffungseinrichtung nach Anspruch 19, wobei mehr als ein Beschaffungsschlüssel sequentiell auf Einzelbasis gemäß einer vorgegebenen Zeiteinheit für den Prozess zur rechnerischen Bestimmung der Ähnlichkeit verwendet wird.
Toninformation-Beschaffungseinrichtung nach Anspruch 19, welche außerdem eine Wiedergabeeinrichtung aufweist, um lediglich das ähnelnde Teil gemäß dem Ergebnis des Beschaffungsprozesses der Beschaffungseinrichtung zu extrahieren und wiederzugeben.
Toninformation-Beschaffungseinrichtung nach Anspruch 26, welche außerdem eine Halteeinrichtung zum Halten des einen oder von mehr als des einen Audiosignals, die als Beschaffungsschlüssel wirken, eine Leseeinrichtung zum Lesen ausgewählter Audiosignale, die als Beschaffungsschlüssel wirken, von der Halteeinrichtung im Zeitpunkt des Beschaffungsprozesses, und eine Beschaffungsschlüssel-Tonkenndaten-Parameteranalysierungseinrichtung zum Analysieren der Audiosignale, die als Beschaffungsschlüssel wirken, wenn durch die Leseeinrichtung gelesen, und zum Erlangen der Beschaffungsschlüssel-Tonkenndatenparameter, die zur Ähnlichkeitsbestimmungseinrichtung geliefert werden, aufweist.
Toninformation-Beschaffungseinrichtung nach Anspruch 27, welche außerdem eine Beschaffungsschlüssel-Registriereinrichtung zum Extrahieren der Audiosignale, die als Beschaffungsschlüssel wirken, von dem zu analysierenden Audiosignal gemäß einer Instruktion des Benutzers und zum Halten von diesen in der Halteeinrichtung aufweist.
Toninformation-Beschaffungseinrichtung nach Anspruch 26, welche außerdem eine Halteeinrichtung zum Halten des einen oder mehr als des einen Beschaffungsschlüssel-Tonkenndatenparameters und eine Leseeinrichtung zum Lesen ausgewählter Beschaffungsschlüssel-Tonkenndatenparameter von der Halteeinrichtung und zum Liefern von diesen zur Ähnlichkeitsbestimmungseinrichtung aufweist.
Toninformation-Beschaffungseinrichtung nach Anspruch 29, welche außerdem eine Beschaffungsschlüssel-Registriereinrichtung aufweist, die Tonkenndatenparameter als Beschaffungsschlüssel von dem zu analysierenden Audiosignal extrahiert, indem das Audiosignal gemäß einer Instruktion des Benutzers analysiert wird, und diese in der Halteeinrichtung hält.
Toninformation-Beschaffungseinrichtung nach Anspruch 26, wobei mehr als ein Beschaffungsschlüssel sequentiell auf Einzelbasis gemäß einer vorgegebenen Zeiteinheit für den Prozess zum rechnerischen Bestimmen der Ähnlichkeit verwendet werden.
Toninformation-Speichereinrichtung, welche eine Aufzeichnungseinrichtung (12) zum Aufzeichnen eines zugeführten Audiosignals auf einem Aufzeichnungsmedium (13) und eine Toninformation-Beschaffungseinrichtung nach Anspruch 19 aufweist, wobei das Ergebnis des Beschaffungsprozesses der Beschaffungseinrichtung (32) so aufgezeichnet ist, dass es mit den Beschaffungsschlüsseln verknüpft ist, und die Position, um das zugeführte Audiosignals auf dem Aufzeichnungsmedium (13) aufzuzeichnen, verwendet wird.
Toninformation-Speichereinrichtung nach Anspruch 32, wobei das Ergebnis des Beschaffungsprozesses mit dem Audiosignal auf dem Aufzeichnungsmedium aufgezeichnet ist.
Toninformation-Speichereinrichtung nach Anspruch 32 oder 33, welche außerdem eine Beschaffungsschlüssel-Tonkenndatenparameter- Analyseeinrichtung zum Analysieren eines Teils des Audiosignals aufweist, welches gemäß einer Instruktion des Benutzers extrahiert wird, um die Beschaffungsschlüssel-Tonkenndatenparameter für das eine oder mehr als das eine Audiosignal zu erlangen, welche als Beschaffungsschlüssel wirken, und eine Beschaffungsschlüssel-Tonkenndatenparameter-Halteeinrichtung zum Halten der Beschaffungsschlüssel-Tonkenndatenparameter, welche durch die Beschaffungsschlüssel-Tonkenndatenparameter-Analyseeinrichtung als Beschaffungsschlüssel erlangt werden.
Toninformation-Speichereinrichtung nach Anspruch 32 oder 33, welche außerdem eine Beschaffungsschlüssel-Extraktionseinrichtung zum Extrahieren eines Teil des zugeführten Audiosignals als Audiosignal aufweist, welches als Beschaffungsschlüssel wirkt, gemäß einer Instruktion des Benutzers, eine Beschaffungsschlüssel-Tonsignalhalteeinrichtung zum Speichern des Beschaffungsschlüssel-Audiosignals, welches durch die Beschaffungsschlüssel-Extraktionseinrichtung extrahiert wird, und eine Beschaffungsschlüssel-Tonkenndatenparameter-Analyseeinrichtung zum Erlangen eines Beschaffungsschlüssel-Tonkenndatenparameters von dem Beschaffungsschlüssel-Audiosignal, welches von der Beschaffungsschlüssel-Audiosignalhalteeinrichtung gelesen wird, wobei die Beschaffungseinrichtung eingerichtet ist, den Beschaffungsschlüssel-Tonkenndatenparameter, der durch die Beschaffungsschlüssel-Tonkenndatenparameter-Analyseeinrichtung erlangt wird, mit dem Tonkenndatenparameter für das zugeführte Audiosignal zu vergleichen.
Toninformation-Speichereinrichtung nach Anspruch 35, welche außerdem eine Beschaffungsschlüssel-Registiereinrichtung aufweist, um Tonkenndatenparameter als Beschaffungsschlüssel zu erlangen, indem ein Teil des zu analysierenden Audiosignals gemäß einer Instruktion des Benutzers extrahiert wird, und diese in der Halteeinrichtung zu halten.
Toninformation-Speichereinrichtung nach Anspruch 32 oder 33, wobei mehr als ein Beschaffungsschlüssel sequentiell auf Einzelbasis gemäß einer vorgegebenen Zeiteinheit für den Prozess zum rechnerischen Bestimmen der Ähnlichkeit verwendet wird.
Beschaffungsverfahren für eine Ton-Bildinformation zum Beschaffen eines Teils eines zugeführten Signals, welches ein Videosignal und ein Audiosignal umfasst, welches mit dem Videosignal verknüpft ist, wobei das Verfahren ein Tonbeschaffungsverfahren nach Anspruch 1 aufweist, wobei ein Teil eines zu analysierenden Audiosignals beschafft wird, welches einem oder mehr als einem Audiosignal ähnelt, welche so wirkt wie viele Beschaffungsschlüssel, und außerdem zum Beschaffen eines Teils des Videosignals des zugeführten Signals, welches zu analysieren ist, welches einem oder mehr als einem Bild ähnelt, die so wirken wie viele Beschaffungsschlüssel, durch Vergleichen jedes der Beschaffungsschlüssel-Bildkenndatenparameter, welche als Beschaffungsschlüssel wirken und zum Zeigen der Kenndaten des Bilds des Videosignals, mit dem Bildkenndatenparameter, der durch Analysieren des Videos des zu analysierenden zugeführten Signals erlangt wird, wobei ein Teil des zugeführten Signals auf Basis des Ergebnisses des Beschaffungsprozesses beschafft wird, der in Bezug auf das Audiosignal durchgeführt wird, und des Ergebnisses des Beschaffungsprozesses, der in Bezug auf das Videosignal durchgeführt wird.
Ton-Bildinformation-Speicherverfahren zum Aufzeichnen eines zugeführten Signals, welches ein Videosignal und ein Audiosignal umfasst, welches mit dem Videosignal verknüpft ist, auf einem Aufzeichnungsmedium, wobei ein Teil eines zu analysierenden Audiosignals, welches einem oder mehr als einem Audiosignal ähnelt, welches so wie viele Beschaffungsschlüssel wirkt, gemäß einem Tonbeschaffungsverfahren nach Anspruch 1 beschafft wird, und zum Aufzeichnen auch der Beschaffung eines Teils des Videosignals des zu analysierenden zugeführten Signals, welches einem oder mehr als einem Bild ähnelt, welches so wie viele Beschaffungsschlüssel wirkt, indem jeder der Beschaffungsschlüssel-Bildkenndatenparameter, welche als Beschaffungsschlüssel wirkt und die Kenndaten des Bilds des Videosignals zeigt, mit dem Bildkenndatenparameter, der durch Analysieren des zu analysierenden Eingangssignals erlangt wird, verglichen wird, und zum Aufzeichnen des Ergebnisses des Beschaffungsprozesses, der in Bezug auf das Audiosignal und das Videosignal durchgeführt wird, so dass sie mit den Beschaffungsschlüsseln verknüpft sind, und der Position, welche zum Aufzeichnen des zugeführten Audiosignals verwendet wird, auf dem Aufzeichnungsmedium.
Ton-Bildinformation-Beschaffungseinrichtung nach Anspruch 20, wobei das Audiosignal mit einem Videosignal verknüpft ist, und wobei die Ergebnisanzeigeeinrichtung das Bild eines Teils des Videosignals anzeigt, welches dem Teil des Audiosignals entspricht, welches durch die Beschaffungseinrichtung beschafft wird.
Ton-/Bildinformations-Beschaffungseinrichtung, welche eine Tonkenndatenparameter-Analyseeinrichtung aufweist, um das Audiosignal eines zugeführten Signals zu analysieren, welches ein Videosignal und ein Audiosignal, welches mit dem Videosignal verknüpft ist, aufweist, und um einen Tonkenndatenparameter in Abhängigkeit von strukturellen Faktoren der Tonquelle des Audiosignals zu erlangen, eine Tonteil-Beschaffungseinrichtung zum Vergleichen der Tonkenndatenparameter der Audiosignale, welche als Beschaffungsschlüssel wirken, wobei die Einrichtung außerdem einen Ähnlichkeitsbestimmungsabschnitt (22) aufweist, der betriebsfähig ist, eine Ähnlichkeit zwischen dem zu analysierenden Audiosignal und den Audiosignalen, welche als Beschaffungsschlüssel wirken, zu bestimmen, wobei die Ähnlichkeit auf Basis einer Differenz zwischen einer Kombination der Tonhöhenfrequenz und der Formantfrequenz des zu analysierenden Audiosignals während einer Zeitperiode bestimmt wird, und der Tonhöhenfrequenz und der Formantfrequenz der Audiosignale, welche als Beschaffungsschlüssel wirken, und der Tonkenndatenparameter des zu analysierenden Audiosignals, das von der Tonkenndatenparameter-Analyseeinrichtung erlangt wird, und ein Teil des zu analysierenden Audiosignals beschafft wird, welches den Audiosignalen ähnelt, welche als Beschaffungsschlüssel wirken und von der Tonquelle der Beschaffungsschlüssel erlangt wird, eine Bildteil-Beschaffungseinrichtung zum Beschaffen eines Teils des Videosignals vom zu analysierenden Eingangssignal, welches einem oder mehr als einem Bild ähnelt, das so wirkt wie viele Beschaffungsschlüssel, indem jeder der Beschaffungsschlüssel-Bildkenndatenparameter, welcher als Beschaffungsschlüssel wirkt, und die Kenndaten des Bilds des Videosignals zeigt, mit dem Bildkenndatenparameter verglichen wird, der durch Analysieren des Videos des zu analysierenden Eingangssignals erlangt wird, und eine Ergebnisanzeigeeinrichtung zum Anzeigen des Ergebnisses des Beschaffungsprozesses der Tonteil-Beschaffungseinrichtung und des Beschaffungsprozesses der Bildteil-Beschaffungseinrichtung.
Ton-Bildinformations-Beschaffungseinrichtung nach Anspruch 41, wobei die Ergebnisanzeigeeinrichtung das Teil des zugeführten Signals, wenn dies auf Basis des Ergebnisses des Beschaffungsprozesses der Tonteil-Beschaffungseinrichtung und des Ergebnisses des Beschaffungsprozesses der Bildteilbeschaffungseinrichtung bestimmt wird, extrahiert und wiedergibt.