DE69828849T2

DE69828849T2 - Signalverarbeitungsgerät und -verfahren sowie Informationsaufzeichnungsgerät

Info

Publication number: DE69828849T2
Application number: DE69828849T
Authority: DE
Inventors: Yoshihiko Tokorozawa-shi Takenaka; Junichi Tokorozawa-shi Imamura
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 1997-08-29
Filing date: 1998-08-28
Publication date: 2006-04-27
Anticipated expiration: 2018-08-29
Also published as: EP0899892B1; DE69828849D1; JP3925993B2; US6034315A; JPH1173726A; EP0899892A2; EP0899892A3

Description

Hintergrund der Erfindung
1. Bereich der Erfindung
Die vorliegende Erfindung bezieht sich auf ein Signalverarbeitungsgerät und ein Signalverarbeitungsverfahren, und speziell auf ein Signalverarbeitungsgerät und ein Signalverarbeitungsverfahren zum Verarbeiten eines Signals während des Aufzeichnens eines Audiosignals auf einem Informationsaufzeichnungsmedium, wie z.B. einer MD (Mini-Disc) in einem Informationsaufzeichnungsgerät.
2. Beschreibung des Standes der Technik
In der EP 0612158 A1 wird ein Verfahren zum Bestimmen der Blockgröße eines Wandlungscoders beschrieben, bei welchem die digitalen Audiosignale, welche eine spektrale und zeitliche Struktur aufweisen, in viele spektrale Rahmen bzw. Datenübertragungsblöcke zerlegt werden. Das Verfahren beinhaltet das Definieren des Audiosignals in Zeitintervalle entsprechend der zeitlichen Maskierungseigenschaften eines menschlichen Hörsystems; das Erhalten eines Spitzenwertes in jedem dieser Zeitintervalle; das Berechnen von Unterschieden innerhalb der Spitzenwerte; und das Auswählen der Blockgröße basierend auf einem Vergleich der Unterschiede gegenüber einem vorher festgelegten Wert.
Um den Informationsbetrag oder das Informationsvolumen der MD auf ungefähr ein Fünftel desselben einer CD (Compact-Disc) zu komprimieren, wird ein hocheffizientes Codierverfahren für Audiodaten angewendet, welches als ein ATRAC (Adaptive Transform Acoustic Coding) genannt wird. Die Theorie des ATRAC besteht darin, eine Kompression der Information durchzuführen, indem ein redundanter Teil des Informationssignales entfernt wird, welcher für einen Menschen nicht erfassbar ist, unter Beachtung des Hörsinnes der Ohren des Menschen. Mit anderen Worten, unter der Annahme, dass ein Unterschied zwischen dem Originalsignal und dem Signal nach der Kompression erzeugt wird (d.h. das Quantisierrauschen erzeugt wird), wird die Kompression durchgeführt, während das Quantisierrauschen so gesteuert wird, dass es für den Menschen nicht hörbar ist.
Konkreter ausgedrückt, bei dem ATRAC wird ein sehr effizientes Codierverfahren durch Benutzen des Maskierungseffektes und der Lautstärkecharakteristik durchgeführt, bezogen auf die Hörsinn-Charakteristik des Menschen (d.h. der minimalen Hörschwellenkurve). Dieses Verfahren wird anhand eines Beispiels erklärt. In 7A wird eine minimale Hörschwellenkurve 100 aufgezeigt. Der Hörschall bei einem Pegel unterhalb der Kurve 100 kann nicht mit den Ohren des Menschen gehört werden. Nun, unter der Annahme, dass ein Ton A und ein Ton B, welche in dem Graphen der 7A gezeigt werden, in dem Eingangssignal beinhaltet sind, ist der Ton B für den Menschen hörbar, aber der Ton A ist für den Menschen nicht hörbar, da er in dem Graphen an einer Stelle unterhalb der minimalen Hörschwellenkurve 100 positioniert ist. Deshalb wird in dem ATRAC der Ton B als das effektive Signal aufgezeichnet. Auf der anderen Seite wird der Ton A nicht aufgezeichnet (ausgedünnt), oder er wird codiert, während der Quantisierbitwert drastisch reduziert wird.
In 7B wird zusätzlich zur minimalen Hörschwellenkurve 100 eine Maskierungsmerkmalskurve 110 entsprechend einem Ton C aufgezeigt. Obwohl der Ton B in dem Graphen an einer Position oberhalb der minimalen Hörschwellenkurve 100 platziert ist, kann der Ton B von den Ohren des Menschen nicht gehört werden, da er durch den Ton C maskiert ist, welcher in der Nähe des Tones B in dem Graphen platziert ist. Deshalb wird in dem ATRAC der Ton B auch als die redundante Komponente entfernt und wird dann komprimiert.
Wie oben an dem Beispiel erklärt, hängt das Signalkomprimierverfahren in dem ATRAC davon ab, wie die minimale Hörschwellenkurve, das Maskierungsmerkmal usw. gesetzt sind, welche die Parameter in dem Komprimiervorgang darstellen. Hier wird der Komprimiercodiervorgang mit Hilfe des ATRAC durch Verwenden gerade einer Einstellung der minimalen Hörschwellenkurve, des Maskierungsmerkmals usw. durchgeführt, welche im Voraus bestimmt werden.
Jedoch ist das Aufzeichnungssignal oder der Musikeindruck für den Menschen ganz unterschiedlich, abhängig von der Einstellung der minimalen Hörschwellenkurve und/oder des Maskierungsmerkmals, welches zum Ausführen des Komprimiercodiervorgangs mit Hilfe des ATRAC benutzt wird. Wenn daher eine Vielzahl von Musikkompositionen in verschiedenen Musikklängen oder -genres bzw. -gattungen durch Verwenden nur einer festen Einstellung dieser Charakteristika aufgezeichnet wird, kann ein optimaler Komprimiercodiervorgang nicht immer an den Originaltönen angewendet werden (d.h. der originalen Musikkomposition), so dass der Fall auftreten kann, dass ein Aufzeichnungsvorgang, der für jede Musikkomposition geeignet ist, nicht ausgeführt werden kann, z.B. dass die einmal aufgezeichnete und wiedergegebene Musikkomposition keinerlei Überzeugung oder guten Eindruck bei der Zuhörerschaft hinterlässt, oder die Hochfrequenzkomponente der aufgenommenen und wiedergegebenen Musikkomposition den Ohren des Menschen weh tut.
Zusammenfassung der Erfindung
Es ist deshalb eine Aufgabe der vorliegenden Erfindung, ein Signalverarbeitungsgerät, ein Signalverarbeitungsverfahren und ein Audio-Informationsaufnahmegerät zu liefern, wobei das Sig nalverarbeitungsgerät beinhaltet ist, welches den Komprimiercodiervorgang ausführen kann, indem eine Charakteristik bzw. ein Merkmal genutzt wird, wie z.B. eine minimale Hörschwellenkurve, ein Maskierungsmerkmal o.Ä., welche für jeden Musikklang oder -genre einer individuellen Musikkomposition geeignet ist, welche auf einem Informationsaufzeichnungsmedium, wie z.B. einer MD, aufzuzeichnen sind.
Die obige Aufgabe der vorliegenden Erfindung kann mit einem Signalverarbeitungsgerät entsprechend dem Anspruch 1 erreicht werden.
Ein Audio- bzw. Toninformations-Aufzeichnungsgerät ist im Anspruch 8 definiert. Ein Audioinformations-Aufzeichnungs- und -Wiedergabegerät ist im Anspruch 9 definiert, und ein Signalverarbeitungsverfahren ist im Anspruch 10 definiert.
Entsprechend dem Signalverarbeitungsgerät der vorliegenden Erfindung wird der Musikklang oder -genre der Musikkomposition, welche aus dem Eingangs-Audiosignal zusammengesetzt ist, durch die Musikklang-Beurteilungsvorrichtung beurteilt (oder analysiert), wenn das Eingangs-Audiosignal an das Signalverarbeitungsgerät eingegeben wird. Dann wird auf der Grundlage des Beurteilungsergebnisses der Musikklang-Beurteilungsvorrichtung eines aus einer Vielzahl von Merkmalen, welche vorher für jeden Parameter vorbereitet wurden, welcher für das Komprimiercodierverfahren benutzt wird, durch die Auswahlvorrichtung selektiert. Dann wird durch die Codiervorrichtung das Spektralsignal aus dem Eingangs-Audiosignal generiert, und das erzeugte Spektralsignal wird auf der Grundlage des ausgewählten Merkmals kompressionscodiert.
Deshalb ist es möglich, den Komprimiercodiervorgang durch Benutzen des geeigneten Merkmales für den Musikklang oder -genres des Eingangs-Audiosignals durchzuführen.
Nach einem Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung beurteilt die Musikklang-Beurteilungsvorrichtung fortlaufend den Musikklang oder -genre, und die Selektiervorrichtung wählt eines der Merkmale in einem Echtzeit- bzw. Real-Time-Verfahren aus, während das Eingangs-Audiosignal eingegeben wird.
Entsprechend diesem Gesichtspunkt wird der Musikklang oder -genre durch die Musikklang-Beurteilungsvorrichtung fortlaufend beurteilt (oder analysiert), während das Eingangs-Audiosignal in das Signalverarbeitungsgerät eingegeben wird, und eines der Merkmale wird in Echtzeit durch die Auswahlvorrichtung selektiert. Deshalb ist es möglich, den Komprimiercodiervorgang durch Verfolgen der Änderung im Musikklang oder -genre und durch Benutzen des optimalen Merkmals auszuführen, sogar wenn der Musikklang oder -genre in der Mitte der Musikkomposition verändert wird.
Gemäß einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung ist die Musikklang-Beurteilungsvorrichtung ausgestattet mit: einer Bandteiler- bzw. Bandtrennvorrichtung zur Aufteilung des Eingangs-Audiosignals in Signalkomponenten in eine Vielzahl von Frequenzbändern; eine Spitzenwert-Abtastvorrichtung zum Abtasten eines Spitzenwertes einer jeden der Signalkomponenten; und einer auf einem Spitzenwert basierenden Beurteilungsvorrichtung zum Beurteilen des Musikklanges oder -genres auf der Grundlage des abgetasteten Spitzenwertes.
Entsprechend diesem Gesichtspunkt wird in der Musikklang-Beurteilungsvorrichtung durch die Bandtrennvorrichtung zuerst das Eingangs-Audiosignal in die Signalkomponenten, in einer Vielzahl von Frequenzbändern aufgeteilt. Dann wird der Spitzenwert jeder Signalkomponente durch die Spitzenwertabtastvorrichtung abgetastet. Dann wird durch die Spitzenwert-basierte Beurteilungsvorrichtung der Musikklang oder -genre auf der Grundlage des abgetasteten Spitzenwertes beurteilt. Deshalb kann der Musikklang oder -genre auf der Grundlage der Signalkomponenten in jedem Frequenzband fein beurteilt werden. Da die Beurteilung des Musikklangs oder -genres auf der Grundlage des Spitzenwertes erfolgt, kann das Signalverarbeitungsgerät zusätzlich durch Benutzen eines verhältnismäßig einfachen Aufbaus konstruiert werden.
Nach einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung beinhalten die Merkmale wenigstens eine minimale Hör-Grenzcharakteristik oder ein Maskierungsmerkmal.
Entsprechend diesem Gesichtspunkt wird wenigstens die minimale Hörschwellenkurve oder das Maskierungsmerkmal durch die Auswahlvorrichtung selektiert. Dann wird das erzeugte Spektralsignal auf der Grundlage des ausgewählten Merkmals durch die Codiervorrichtung kompressionscodiert. Deshalb kann auf der Grundlage der minimalen Hörschwellenkurve und/oder des Maskierungsmerkmals, welches optimal für den Musikklang oder -genre des Eingangs-Audiosignals ausgewählt wurde, der Komprimiercodiervorgang ausgeführt werden.
Nach einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung weisen die Merkmale wenigstens eine Bitzuweisung oder eine Zeitlänge einer Zeiteinheit auf, mit welcher die Codierungsvorrichtung eine Kompressionscodierung des erzeugten Spektralsignals vornimmt.
Entsprechend diesem Gesichtspunkt wird wenigstens eine der Bitzuweisung und der Zeitlänge der Zeiteinheit, wie z.B. eine Tongruppe oder Ähnliches, durch die Auswahlvorrichtung selektiert. Dann wird durch die Codiervorrichtung das erzeugte Spektralsignal auf der Grundlage des ausgewählten Merkmals kompressionscodiert. Auf der Grundlage der Bitzuweisung und/oder der Zeitlänge einer Zeiteinheit, welche optimal für den Musikklang oder -genre des Eingangs-Audiosignals ausgewählt ist, kann deshalb der Komprimiercodiervorgang ausgeführt werden.
Nach einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung ist die Codiervorrichtung mit einem ATRAC-Codierer ausgestattet.
Entsprechend diesem Gesichtspunkt ist es möglich, den Komprimiercodiervorgang mit Hilfe des ATRAC-Verfahrens auszuführen.
Nach einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der vorliegenden Erfindung weisen die Merkmale wenigstens eines von zwei Merkmalen auf, ein minimales Hörschwellenmerkmal oder ein Maskierungsmerkmal.
Deshalb kann der Komprimiercodiervorgang auf der Grundlage des minimalen Hörschwellenmerkmals und/oder des Maskierungsmerkmals, welches optimal für den Musikklang oder -genre des Eingangs-Audiosignals ausgewählt wurde, durchgeführt werden.
Nach einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der vorliegenden Erfindung weisen die Merkmale wenigstens eines von zwei Merkmalen auf, nämlich eine Bitzuweisung und eine Zeitlänge einer Zeiteinheit, mit welcher die Codiervorrichtung das erzeugte Spektralsignal kompressionscodiert.
Deshalb kann der Komprimiercodiervorgang auf der Grundlage der Bitzuweisung und/oder der Zeitlänge der Zeiteinheit, welche optimal für den Musikklang oder -genre des Eingangs-Audiosignals ausgewählt wurde, ausgeführt werden.
In einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der vorliegenden Erfindung besteht der Codiervorgang aus einem Vorgang mit Hilfe eines ATRAC-Verfahrens.
Entsprechend diesem Gesichtspunkt ist es möglich, den Komprimiercodiervorgang mit Hilfe des ATRAC-Verfahrens auszuführen.
Die Art, der Nutzen und weitere Merkmale dieser Erfindung werden noch klarer aus der folgenden detaillierten Beschreibung mit Bezug auf bevorzugte Ausführungsformen der Erfindung offensichtlich, wenn diese in Zusammenhang mit den beigefügten Zeichnungen gelesen werden, welche kurz nachfolgend beschrieben werden.
Kurze Beschreibung der Zeichnungen
1 ist ein Blockschaltbild eines MD-Aufzeichnungsgerätes mit einem Signalverarbeitungsgerät als eine Ausführungsform der vorliegenden Erfindung;
2 ist ein Blockschaltbild einer Analysiereinheit für den Musikklang des Signalverarbeitungsgerätes der 1;
3A ist ein Graph, welcher einen Komprimiercodiervorgang mit Hilfe des ATRAC mit einer Bitzuweisung zeigt;
3B ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einer anderen Bitzuweisung zeigt;
4A ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einer Bitzuweisung für eine Tongruppe zeigt;
4B ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einer anderen Bitzuweisung für die Tongruppe zeigt;
5A ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einer Zeitlänge für die Tongruppe zeigt;
5B ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einer anderen Zeitlänge für die Tongruppe zeigt;
6A ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einem Maskierungsmerkmal zeigt;
6B ist ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC mit einem anderen Maskierungsmerkmal zeigt;
7A ist ein Graph, welcher die minimale Hörschwellenkurve zeigt; und
7B ist ein Graph, welcher die minimale Hörschwellenkurve und ein Maskierungsmerkmal zeigt.
Detaillierte Beschreibung der bevorzugten Ausführungsform Mit Bezug auf die beigefügten Zeichnungen wird nun eine Ausführungsform der vorliegenden Erfindung erklärt.
(Prinzip)
Zunächst wird das Prinzip der vorliegenden Erfindung in Kürze erklärt. Wie oben erwähnt, ist es im Falle des Komprimiercodiervorganges mit Hilfe des ATRAC wichtig, die Parameter einzustellen, welche für den Komprimiercodiervorgang benutzt werden. Konkreter ausgedrückt, ist es wichtig, die minimale Hör schwellenkurve bzw. -grenze, das Maskierungsmerkmal, die Zeitlänge, wenn das Signal zeitgeteilt wird, welches in Signalabschnitte codiert wird (z.B. in eine Vielzahl von Tongruppen, welche später beschrieben werden), usw. aktuell einzustellen. Abhängig von diesen Einstellungen variiert der Eindruck der Musikkomposition in weiten Bereichen. In Anbetracht des Obigen wird in der vorliegenden Erfindung der Musikklang oder -genre des Musiksignals, welches aufzuzeichnen ist, analysiert und in Echtzeit beurteilt, so dass das optimale Merkmal für den Parameter in dem Komprimiercodiervorgang aus einer Vielzahl von Merkmalen für jeden Parameter, welcher im Voraus präpariert wurde, ausgewählt und aktuell für den Komprimiercodiervorgang benutzt wird. Dadurch kann der optimale Komprimiercodiervorgang durch Benutzen der optimalen Merkmale entsprechend dem Musikklang oder -genre der Musikkombination, welche aufzunehmen ist, durchgeführt werden.
(MD-Aufnahmegerät)
Als Nächstes wird eine bevorzugte Ausführungsform der vorliegenden Erfindung mit Bezug auf die Zeichnungen erklärt. 1 ist ein Blockschaltbild eines MD-Aufzeichnungsgerätes, welches ein Signalverarbeitungsgerät der vorliegenden Erfindung aufweist.
In 1 weist ein MD-Aufzeichnungsgerät 1 ein Signalverarbeitungsgerät 2 auf. Das Signalverarbeitungsgerät 2 ist mit einem A/D-(Analog-zu-Digital-)Wandler 8, einem ATRAC-Codierer 10, einer Musikklang-Analysiereinheit 12 und einer CPU (Central Processing Unit) 14 ausgestattet. Das MD-Aufzeichnungsgerät 1 weist auch eine Aufzeichnungseinheit 16, eine Wiedergabeeinheit 30, einen ATRAC-Codierer 31 und einen D/A-(Digital-zu-Analog-)Wandler 32 auf.
Zum Zeitpunkt des Aufzeichnens des Audiosignals wird ein Eingangssignal S1, welches auf einer MD 18 aufzuzeichnen ist, an den A/D-Wandler 8 eingegeben, mit einer Abtastfrequenz von 44,1 kHz abgetastet und wird in 16 bis 20 Bits beispielsweise quantisiert, welche als ein Digitalsignal S2 auszugeben sind. Dann wird das Digitalsignal S2 an den ATRAC-Codierer 10 und die Musikklang-Analysiereinheit 12 gesandt.
Auf der anderen Seite wird das kompressionscodierte Digitalsignal zum Zeitpunkt der Wiedergabe des Audiosignals von der MD 18 durch das MD-Aufzeichnungsgerät 1 von der MD 18 durch die Wiedergabeeinheit 30 ausgelesen, durch den ATRAC-Decoder 31 expansionsdecodiert und durch den D/A-Wandler 32 D/A-gewandelt, so dass der analoge Ausgang, welcher dem Eingangssignal S1 entspricht, über einen Lautsprecher oder einen Kopfhörer ausgegeben wird.
2 zeigt eine Struktur der Musikklang-Analysiereinheit 12. Die Musikklang-Analysiereinheit 12 ist mit einem Tiefpassfilter 20 und einer Vielzahl von Bandpassfiltern 21, 22, ... ausgestattet, um so das Digitalsignal S2 in Bänder aufzuteilen (d.h. das Digitalsignal S2 in eine Vielzahl von Frequenzkomponenten unterschiedlicher Frequenzbänder aufzuteilen), welches von dem A/D-Wandler 8 eingegeben wurde. Vorzugsweise fallen die Frequenzbänder für diesen Teilvorgang mit 3 Frequenzbändern zusammen, welche in dem ATRAC-Codierer 10 in Bänder getrennt sind (z.B. ungefähr 0 bis 5,5 kHz für das tiefe Frequenzband, ungefähr 5,5 bis 11 kHz für das mittlere Frequenzband und ungefähr 11 bis 22 kHz für das Hochfrequenzband). Dies ist so, da der Komprimiercodiervorgang in den ATRAC-Codierer 10 durch das in Bändertrennen des Digitalsignals S2 in Signalkomponenten in diese 3 Frequenzbänder durchgeführt wird und dann die minimale Hörschwellenkurve o.Ä. darauf angewandt wird. Es ist auch möglich, die Analyse für jedes feine Frequenzband auszuführen, nachdem das Digitalsignal S2 in die Signalkomponenten in den Frequenzbändern feiner als die 3 Frequenzbänder aufgeteilt wurde. Vorzugsweise sollte für jedes Filter ein QMF (Quadrature Mirror Filter) angewendet werden. Dies rührt daher, dass signalverfälschende Komponenten, welche durch den Bandteilungsvorgang erzeugt werden, während des Synthetisierens der Frequenzbänder aufgehoben werden können. Es ist auch möglich, verschiedene Arten, anders als das QMF, als Filterstrukturen zu verwenden.
Die Signalkomponenten, welche in Bänder geteilt wurden, werden in Pegel- bzw. Schwellwertabtastschaltungen 23, 24, 25, ... jeweils eingegeben. Jede der Pegelabtastschaltungen 23, 24, 25, ... tastet den Spitzenwert (Maximalwert) der eingegebenen Signalkomponente in jeweils einem der Frequenzbänder für jede vorher festgelegte Zeitlänge ab und sendet den abgetasteten Spitzenschwellwert an die CPU 14. Zu diesem Zeitpunkt wird die Zeitlänge für das Abtasten des Schwellwerts vorzugsweise auf eine "Tongruppe" eingestellt, welche eine Minimaleinheit zum Zeitaufteilen des Musiksignals innerhalb des ATRAC-Codierers 10 ist (welcher auch als ein "Codierblock" bezeichnet wird und bei einer Zeitlänge von 11,6 msec im Maximum ist). Dies rührt daher, dass der ATRAC-Codierer 10 auf der letzteren Stufe den Komprimiercodiervorgang des Signals ausführt, indem die Tongruppeneinheit benutzt wird und dass diese geeignet ist, den Musikklang oder -genre durch Nutzen der Zeiteinheit, welche hierfür die gleiche ist, zu analysieren. Nichtsdestotrotz, falls die Analyse durch eine Tongruppeneinheit schwierig oder unmöglich ist, da eine beträchtliche Zeitdauer für die Übertragung eines jeden der Mikrocomputer, der LSIs und Ähnlichem erforderlich ist, können die Analyse und die Beurteilung durchgeführt werden, indem als Einheit eine Zeitlänge angewandt wird, welche mit einer Vielzahl von Tongruppen korrespondiert.
Die CPU 14 empfängt die Abtastsignale von den Pegelabtastschaltungen 23, 24, 25, ... und bestimmt das Merkmal jedes Parameters (z.B. die Bitzuweisung und die Zeitlänge der Tongruppe, die minimale Hörschwellwertgrenzkurve, das Maskierungsmerkmal), welcher für den Codiervorgang in dem ATRAC-Codierer 10 auf der Grundlage des Inhalts der empfangenen Abtastsignale zu nutzen ist, und sendet ein Auswahlsignal Sc aus, um die geeigneten Merkmale an den ATRAC-Codierer 10 auszuwählen.
Die CPU 14 beurteilt den Musikklang oder -genre. Beispielsweise beurteilt die CPU 14, ob ein großer oder kleiner Wert der Signalkomponente mit einem niedrigen Pegel in dem hohen Band außerhalb des Digitalsignals S2 vorliegt, ob die Pegeländerung der Signalkomponente im mittleren Band groß oder klein ist usw., und bestimmt die Bitzuweisung und die Zeitlänge der Tongruppe, die minimale Hörschwellenmerkmalskurve, das Maskierungsmerkmal u.Ä., von welchen jedes als optimal für jeden individuellen Fall eingestuft wird. Das konkrete Feststellverfahren hierfür wird nachfolgend im Detail beschrieben.
Der ATRAC-Codierer 10 bereitet eine Vielzahl von Merkmalen vor, welche bezüglich jedes Parameters für den Codiervorgang im Voraus benutzbar sind, und er ist so angepasst, dass er eines der Merkmale entsprechend dem Auswahlsignal Sc von außen auswählen kann. Z.B. wird eine Vielzahl von Merkmalen für jeden Parameter wie folgt vorbereitet. Zuerst ist es nämlich möglich, als eine Zeitlänge 11,6 msec auszuwählen, welche der Maximalwert ist, welcher auf dem ATRAC vorgeschrieben bzw. festgelegt ist, und andere Zeitlängen, kürzer als dieser Maximalwert als Zeitlänge der Tongruppe. Die Bitzuweisung kann willkürlich bestimmt werden. Eine Vielzahl von minimalen Hörschwellwertkurven wird vorbereitet, wie z.B. eine Kurve, deren Pegel im Allgemeinen hoch ist, eine Kurve, deren Pegel im Allgemeinen niedrig ist, eine Kurve, deren Pegel mehr oder weniger hoch (oder niedrig) auf der Hochfrequenzseite ist, usw..
Eine Vielzahl von Maskierungsmerkmalen wird vorbereitet, wie z.B. eine Merkmalskurve, welche steil ist (d.h. mit welcher es schwierig ist, das Signal in der Nähe derselben zu maskieren), eine Merkmalskurve, welche leicht ist (d.h. mit welcher es leicht ist, das Signal in der Nähe derselben zu maskieren), usw.. Dann wird auf der Grundlage des Auswahlsignals Sc, welches durch die CPU 14 geliefert wird, der Komprimiercodiervorgang in dem ATRAC-Codierer 10 ausgeführt, während die optimalen Merkmale für jeden Parameter eines nach dem anderen ausgewählt werden. Deshalb werden auf der Grundlage des Musikklangs oder -genres des eingegebenen Signals die Merkmale, welche in dem ATRAC-Codierer 10 benutzt werden, in jedem Moment geändert, wenn die Gelegenheit zur Zeit des aktuellen Ausführens des Kompressionscodiervorgangs dies erfordert.
Ein codiertes Signal S3, welches in der oben beschriebenen Weise kompressionscodiert wurde, wird an die Aufzeichnungseinheit 16 gesandt und wird auf der MD 18 aufgezeichnet.
Als Nächstes wird das Verfahren des Bestimmens des Merkmals für jeden Parameter, welcher durch die Musikklang-Analysiereinheit 12 und die CPU 14 ausgeführt wird, erklärt. Die Merkmale, welche in dem ATRRC-Codierer 10 wechselbar sind, sind: (i) die Bitzuweisung und die Zeitlänge der Tongruppe, (ii) die minimale Hörschwellenkurve und (iii) das Maskierungsmerkmal in der vorliegenden Ausführungsform. Diese werden entsprechend der Reihenfolge erklärt.
(i) Bitzuweisung und Zeitlänge der Tongruppe
Im Falle des ATRAC wird das Eingangssignal, welches zu codieren ist, in Signalabschnitte für jede vorher festgelegte Zeitlänge aufgeteilt. Eine Einheit einer solchen aufgeteilten Zeitlänge oder eines Zeitfensters wird als eine Tongruppe (oder ein Codierblock) bezeichnet. Die Tongruppe wird als eine Zeitlänge von 11 msec und als Maximalwert davon entsprechend dem ATRAC vorgeschrieben. Deshalb ist es möglich, den Komprimiercodiervorgang durch Benutzen einer Vielzahl von Zeitlängen innerhalb des Bereiches, welcher nicht größer (weiter) als dieser Maximalwert ist, durchzuführen. Außerdem ist es möglich, willkürlich die Zuweisung der Quantisierbitzahl mit Bezug auf jede Tongruppe zu bestimmen.
3A zeigt ein Beispiel der Bitzuweisung der Ton- bzw. Tongruppe in einem Zustand, bei dem die Bitzuweisung verhältnismäßig klein ist, während 3B ein Beispiel der Bitzuweisung der Tongruppe bei einem Zustand zeigt, bei dem die Bitzuweisung verhältnismäßig groß ist. Durch Erhöhen der Bitzuweisung vom Zustand, wie er in 3A gezeigt wird, auf den Zustand, wie er in 3B gezeigt wird, ist es möglich, den Codierprozess mit einem niedrigeren Quantisierrauschen durchzuführen.
4A zeigt ein Beispiel der Zeitlänge der Tongruppe, welche verhältnismäßig weit ist, während 4B ein Beispiel der Zeitlänge der Tongruppe zeigt, welche verhältnismäßig eng ist. Durch Erniedrigen der Zeitlänge der Tongruppe von dem Wert, welcher in 4A angezeigt wird, auf den, welcher in 4B angezeigt wird, wird der Betrag der Bitzuweisung in der Pegelrichtung erhöht, so dass die codierten Daten (d.h. die Aufzeichnungsdaten), welche einen Pegel dichter an dem des Originalklanges haben, erhalten werden können. Deshalb ist es z.B. möglich, im Fall, dass die Echos oder Nachhalle der Musikkomposition als ein wichtiger Faktor in dem klassischen Musikklang oder -genre betrachtet werden, die codierten Daten, in welchem die Echos oder Nachhalle gemacht sind, präzise entsprechend dem Originalklang aufzuzeichnen. Folglich kann der Musikklang mit einer kleinen Herabsetzung in der Qualität erhalten werden, indem diese Zeitdauer enger gesetzt wird.
[ii] Minimale Hörschwellenkurve
Die minimale Hörschwellenkurve ist eine Kurve, welche durch Drucken des Schalldruckpegels, welcher für die Ohren des Menschen hörbar ist, in Abhängigkeit von der Frequenz erhalten wird. Die Klangkomponente, deren Pegel niedriger als diese Kurve ist, wird nämlich nicht vom Ohr des Menschen gehört. Der ATRAC-Codierer bereitet eine Vielzahl von minimalen Hörschwellenkurven im Voraus vor und führt den Komprimiercodiervorgang durch Auswählen einer der Kurven aus. Zum Zeitpunkt des Codierens wird der Klang (d.h. das Klangsignal), dessen Pegel niedriger als die ausgewählte Kurve ist, grundlegend entfernt oder wird durch Benutzen einer beträchtlich kleinen Quantisierbitzahl codiert. Gegebenenfalls werden sowohl die Signalkomponente, welche überhaupt nicht codiert wurde, als auch die Signalkomponente, welche nicht mit einer geeigneten Quantisierbitzahl codiert wurde, aufgrund dieser minimalen Hörschwellenkurve oder des Maskierungsmerkmals, welches später beschrieben wird, als das Signal, welches "nicht eincodiert" ist, in der nachfolgenden Beschreibung ausgedrückt.
5A und 5B zeigen Beispiele von Codiersignalen, welche einander gleich sind (d.h. die Signale, deren Spektren gegenseitig gleich sind), indem minimale Hörschwellkurven unterschiedlich voneinander benutzt werden. Spezieller ausgedrückt, 5A zeigt das Beispiel des Codierens des Signals, indem die minimale Hörschwellkurve benutzt wird, deren Pegel relativ hoch ist, während 5B das Beispiel des Codierens des Signals zeigt, indem die minimale Hörschwellkurve benutzt wird, deren Pegel relativ niedrig ist. Aus diesen Figuren ist zu ersehen, dass die Signalkomponente, welche nicht codiert ist, indem die minimale Hörschwellkurve benutzt wird, wie sie in 5A gezeigt wird, aktuell durch das Benutzen der minimalen Hörschwellkurve codiert wird, wie sie in 5B gezeigt wird. Da im Falle des ATRAC das Eingangssignal nach dem Aufteilen des Eingangssignals in die Signalkomponenten in den 3 Fre quenzbändern, d.h. dem niedrigen Band, dem mittleren Band und dem hohen Band, kompressionscodiert wird, ist es möglich, die Signalkomponente besser in einem speziellen Band aufzuzeigen, indem die minimale Hörschwellkurve, welche für dieses spezielle Band genutzt wird, niedrig gesetzt wird. Z.B. ist es im Allgemeinen bei gewöhnlichen Musikkompositionen so, dass der Pegel der Signalkomponente in dem hohen Band verglichen mit dem Pegel der Signalkomponente in dem mittleren oder niedrigen Band niedrig ist (d.h. der Pegel der Signalkomponente in dem hohen Band ist verhältnismäßig niedrig). Deshalb ist es im Falle, dass die Signalkomponente in dem hohen Band als wichtiger Faktor in dem Rockmusikklang oder -genre z.B. erachtet wird, möglich, einen Aufzeichnungsvorgang derart durchzuführen, dass das Signal, welches einen hohen Anteil an Signalkomponente in dem hohen Band besitzt, erhalten werden und durch Auswählen der minimalen Höherschwellkurve, welche für das hohe Band benutzt wird, dessen Pegel verhältnismäßig niedrig ist, aufgezeichnet werden kann. Alternativ ist es möglich, im Falle, dass die Signalkomponente in dem hohen Band nicht wirklich wichtig ist, zum Beispiel in dem klassischen Musikklang oder -genre, einen derartigen Aufzeichnungsvorgang auszuführen, dass das Signal, welches einen hohen Anteil an Signalkomponente in dem mittleren Band hat, erhalten werden und durch Auswählen der minimalen Höherschwellkurve, welche für das mittlere Band benutzt wird, dessen Pegel verhältnismäßig niedrig ist, aufgezeichnet werden kann, während die minimale Hörschwellkurve für das hohe Band stattdessen hochgesetzt wird.
Die Beurteilung des Musikklanges oder -genres, z.B. die Beurteilung, ob es sich um Rockmusikklang oder -genre oder ob es sich um klassischen Musikklang oder -genre handelt, wird durch die CPU 14 auf der Grundlage der Daten durchgeführt, welche von der Musikklang-Analysiereinheit 12 erhalten werden. Wenn z.B. das Signal, welches einen Schwellwert besitzt, welcher verhältnismäßig hoch im hohen Band ist, periodisch auftritt, wird beurteilt, dass der Musikklang oder -genre dem Rock-Musikklang oder -genre zugeordnet ist. Oder, falls das Signal mit einem Pegel, welcher im Durchschnitt im mittleren Band verhältnismäßig hoch ist, ohne jegliche drastische Veränderung kontinuierlich auftritt, wird beurteilt, dass der Musikklang oder -genre zum klassischen Musikklang oder -genre gehört. Nebenbei bemerkt, sind dies nur Beispiele, und es gibt viele andere Wege, um den Musikklang oder -genre entsprechend verschiedener Standards zu beurteilen.
(iii) Maskierungsmerkmal
Das Maskierungsmerkmal ist ein derartiges Merkmal, dass in dem Fall, dass ein Ton C und ein Ton D, welcher in der Frequenz dicht am Ton C und groß im Pegel ist, gleichzeitig existieren, wie dies in 6A und 6B gezeigt wird, kann der Ton C vom Ohr des Menschen nicht gehört werden, da der Ton D existiert. 6A und 6B zeigen Beispiele, bei welchen Maskierungsmerkmale unterschiedlich voneinander an die Signale, welche gegenseitig das gleiche Spektrum besitzen, angelegt werden. 6A zeigt das Beispiel, bei welchem das Maskierungsmerkmal verhältnismäßig flach ist, während 6B das Beispiel zeigt, bei dem das Maskierungsmerkmal verhältnismäßig steil ist. Wie aus diesen Figuren hervorgeht, wird der Ton C nicht durch Benutzen des flachen Merkmals codiert, wie dies in 6A aufgezeigt wird, sondern wird bestimmt durch Nutzen des steilen Merkmals codiert, wie dies durch 6B gezeigt wird. Deshalb kann es, im Falle, dass die Signalkomponente, deren Pegel verhältnismäßig hoch ist, häufig auftritt, wie dies in der Musikkomposition im Rockmusikklang oder -genre der Fall ist, vorgezogen werden, das Maskierungsmerkmal steil zu setzen, wie dies durch 6B aufgezeigt wird, um so den Ton in der Nähe des Signals, welches den hohen Pegel besitzt, nicht zu leicht zu maskieren.
Wie oben beschrieben, wird entsprechend der vorliegenden Erfindung der Musikklang oder -genre des Signals, welches auf der MD aufzuzeichnen ist, beurteilt, und das optimale Merkmal für jeden Parameter, welcher für die ATRAC benutzt wird, wird ausgewählt und, wenn es die Gegebenheit erfordert, auf der Grundlage des Ergebnisses der Beurteilung geändert. Außerdem wird die Beurteilung des Musikklanges oder -genres und die Auswahl der Merkmale kontinuierlich für jede vorher festgelegte Zeitlänge ausgeführt, welche vorzugsweise mit einer Tongruppe koinzidiert. Deshalb werden, sogar im Falle, dass der Musikklang oder -genre in der Mitte einer Musikkomposition gewechselt wird, die Merkmale entsprechend von Zeit zu Zeit geändert, um so diesem Wechsel zu folgen. Folglich ist es möglich, das Codieren und die Aufzeichnungsvorgänge in Einklang mit dem Musikklang oder -genre jeder individuellen Musikkomposition durchzuführen.

Claims

Signalverarbeitungsgerät (2), dadurch gekennzeichnet, dass das Signalverarbeitungsgerät Folgendes aufweist: – eine Musikklang-Analysevorrichtung (12) zur Bandaufteilung eines Eingangs-Audiosignals in eine Vielzahl von Frequenzkomponenten und zur Abtastung eines Spitzenwerts einer jeden Frequenzkomponente; – eine Musikklang-Beurteilungsvorrichtung (14) zur kontinuierlichen Ausführung der Beurteilung eines Musikklangs oder -genres bzw. -gattung einer individuellen Musikkomposition, die aus dem Eingangs-Audiosignal auf der Grundlage der abgetasteten Spitzenwerte zusammengesetzt ist, und zur Ausgabe eines Auswahlsignals (Sc) auf der Grundlage des beurteilten Musikklangs oder -genres; und – eine Kodierungsvorrichtung (10) zur Auswahl eines von einer Vielzahl von Merkmalen, die im Voraus für jeden Parameter vorbereitet sind, der für ein Kompressionskodierverfahren benutzt wird, auf der Grundlage des von der Musikklang-Beurteilungsvorrichtung (14) ausgegebenen Auswahlsignals (Sc) und zur Kompressionskodierung des Eingangs-Audiosignals auf der Grundlage der ausgewählten Merkmale, wobei die Merkmale mindestens eines von zwei Merkmalen aufweisen, nämlich ein minimales Hörschwellenmerkmal oder ein Maskierungsmerkmal.
Signalverarbeitungsgerät (2) nach Anspruch 1, dadurch gekennzeichnet, dass die Kodierungsvorrichtung (10) eines der Merkmale in einer Realtime-Methode auswählt, während das Eingangs-Audiosignal eingegeben wird.
Signalverarbeitungsgerät (2) nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Musikklang-Analysevorrichtung (12) Folgendes aufweist: – eine Bandteilereinrichtung (20, 21, 22) zur Aufteilung des Eingangs-Audiosignals in Signalkomponenten in eine Vielzahl von Frequenzbändern; und – eine Spitzenwertabtasteinrichtung (23, 24, 25) zur Abtastung eines Spitzenwerts einer jeden der Signalkomponenten.
Signalverarbeitungsgerät (2) nach Anspruch 3, dadurch gekennzeichnet, dass die Bandteilereinrichtung (20, 21, 22) eine Vielzahl von Filtern aufweist, von denen jedes nur zum Durchlass der Signalkomponente in einem zugehörigen der Frequenzbänder ausgebildet ist, und dass die Spitzenwertabtasteinrichtung (23, 24, 25) eine Vielzahl von Spitzenwertabtastschaltkreisen aufweist, von denen jeder zur Abtastung des Spitzenwertes ausgebildet ist.
Signalverarbeitungsgerät (2) nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Merkmale mindestens eines von den folgenden aufweisen, nämlich eine Bitzuweisung oder eine Zeitlänge einer Zeiteinheit, wo mit die Kodierungsvorrichtung (10) eine Kompressionskodierung des erzeugten Spektrumsignals vornimmt.
Signalverarbeitungsgerät (2) nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Kodierungsvorrichtung (10) einen ATRAC-Kodierer (Adaptive TRansform Acoustic Coding) aufweist.
Signalverarbeitungsgerät (2) nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Gerät weiterhin einen A/D (analog zu digital) -Umsetzer zur Umsetzung des Eingangs-Audiosignals von einer analogen Form in eine digitale Form und zur Ausgabe des Eingangs-Audiosignals in dem digitalen Format an die Musikklang-Beurteilungsvorrichtung (14) und an die Kodierungsvorrichtung (10) aufweist.
Audioinformationsaufzeichnungsgerät (1), welches ein Signalverarbeitungsgerät (2) nach einem der Ansprüche 1 bis 7 aufweist, und welches eine Aufzeichnungseinheit (16) zur Aufzeichnung des verarbeiteten Audiosignals auf einem Informationsaufzeichnungsmedium bzw. -träger (18) aufweist.
Audioinformationsaufzeichnungs- und reproduktionsgerät (1), welches ein Signalverarbeitungsgerät (2) nach einem der Ansprüche 1 bis 7 aufweist, und welches weiterhin eine Aufzeichnungseinheit (16) zur Aufzeichnung des verarbeiteten Audiosignals auf einem Informationsaufzeichnungsmedium bzw. -träger (18) und einen Reproduktionsabschnitt (30, 31, 32) zur Reproduktion des aufgezeichne ten Audiosignals von dem Informationsaufzeichnungsmedium bzw. -träger (18) aufweist.
Signalverarbeitungsverfahren, welches folgende Verfahrensschritte aufweist: – Analysieren eines Musikklangs zum Bandaufteilen eines Eingangs-Audiosignals in eine Vielzahl von Frequenzkomponenten und zum Abtasten eines Spitzenwerts einer jeden Frequenzkomponente; – Beurteilen eines Musikklangs zum kontinuierlichen Ausführen des Beurteilens eines Musikklangs oder -genres bzw. -gattung einer individuellen Musikkomposition, die aus dem Eingangs-Audiosignal auf der Grundlage der abgetasteten Spitzenwerte zusammengesetzt ist, und zum Ausgeben eines Auswahlsignals (Sc) auf der Grundlage des beurteilten Musikklangs oder -genres; und – Kodieren zum Auswählen eines von einer Vielzahl von Merkmalen, die im Voraus für jeden Parameter vorbereitet sind, der für ein Kompressionskodierverfahren benutzt wird, auf der Grundlage des von der Musikklang-Beurteilungsvorrichtung (14) ausgegebenen Auswahlsignals (Sc) und zum Kompressionskodieren des Eingangs-Audiosignals auf der Grundlage der ausgewählten Merkmale, wobei die Merkmale mindestens eines von zwei Merkmalen aufweisen, nämlich ein minimales Hörschwellenmerkmal oder ein Maskierungsmerkmal.
Signalverarbeitungsverfahren nach Anspruch 10, dadurch gekennzeichnet, dass der Verfahrensschritt des Kodierens eines der Merkmale in einer Realtime-Methode auswählt, während das Eingangs-Audiosignal eingegeben wird.
Signalverarbeitungsverfahren nach einem der Ansprüche 10 oder 11, dadurch gekennzeichnet, dass die Merkmale mindestens eine Bitzuweisung oder eine Zeitlänge einer Zeiteinheit beinhalten, womit das erzeugte Spektrumsignal in dem Verfahrensschritt Kodieren kompressionskodiert wird.
Signalverarbeitungsverfahren nach einem der Ansprüche 10 bis 12, dadurch gekennzeichnet, dass der Verfahrensschritt des Kodierens einen Verfahrensschritt mittels eines ATRAC-Kodierens (Adaptive Transform Acoustic Coding) aufweist.