-
Hintergrund der Erfindung
-
1. Bereich der Erfindung
-
Die
vorliegende Erfindung bezieht sich auf ein Signalverarbeitungsgerät und ein
Signalverarbeitungsverfahren, und speziell auf ein Signalverarbeitungsgerät und ein
Signalverarbeitungsverfahren zum Verarbeiten eines Signals während des
Aufzeichnens eines Audiosignals auf einem Informationsaufzeichnungsmedium,
wie z.B. einer MD (Mini-Disc) in einem Informationsaufzeichnungsgerät.
-
2. Beschreibung des Standes
der Technik
-
In
der
EP 0612158 A1 wird
ein Verfahren zum Bestimmen der Blockgröße eines Wandlungscoders beschrieben,
bei welchem die digitalen Audiosignale, welche eine spektrale und
zeitliche Struktur aufweisen, in viele spektrale Rahmen bzw. Datenübertragungsblöcke zerlegt
werden. Das Verfahren beinhaltet das Definieren des Audiosignals
in Zeitintervalle entsprechend der zeitlichen Maskierungseigenschaften
eines menschlichen Hörsystems;
das Erhalten eines Spitzenwertes in jedem dieser Zeitintervalle;
das Berechnen von Unterschieden innerhalb der Spitzenwerte; und
das Auswählen
der Blockgröße basierend
auf einem Vergleich der Unterschiede gegenüber einem vorher festgelegten
Wert.
-
Um
den Informationsbetrag oder das Informationsvolumen der MD auf ungefähr ein Fünftel desselben
einer CD (Compact-Disc) zu komprimieren, wird ein hocheffizientes
Codierverfahren für
Audiodaten angewendet, welches als ein ATRAC (Adaptive Transform
Acoustic Coding) genannt wird. Die Theorie des ATRAC besteht darin,
eine Kompression der Information durchzuführen, indem ein redundanter
Teil des Informationssignales entfernt wird, welcher für einen
Menschen nicht erfassbar ist, unter Beachtung des Hörsinnes
der Ohren des Menschen. Mit anderen Worten, unter der Annahme, dass
ein Unterschied zwischen dem Originalsignal und dem Signal nach
der Kompression erzeugt wird (d.h. das Quantisierrauschen erzeugt
wird), wird die Kompression durchgeführt, während das Quantisierrauschen
so gesteuert wird, dass es für
den Menschen nicht hörbar
ist.
-
Konkreter
ausgedrückt,
bei dem ATRAC wird ein sehr effizientes Codierverfahren durch Benutzen des
Maskierungseffektes und der Lautstärkecharakteristik durchgeführt, bezogen
auf die Hörsinn-Charakteristik
des Menschen (d.h. der minimalen Hörschwellenkurve). Dieses Verfahren
wird anhand eines Beispiels erklärt.
In 7A wird eine minimale Hörschwellenkurve 100 aufgezeigt.
Der Hörschall
bei einem Pegel unterhalb der Kurve 100 kann nicht mit den
Ohren des Menschen gehört
werden. Nun, unter der Annahme, dass ein Ton A und ein Ton B, welche in
dem Graphen der 7A gezeigt werden, in dem Eingangssignal
beinhaltet sind, ist der Ton B für
den Menschen hörbar,
aber der Ton A ist für
den Menschen nicht hörbar,
da er in dem Graphen an einer Stelle unterhalb der minimalen Hörschwellenkurve 100 positioniert
ist. Deshalb wird in dem ATRAC der Ton B als das effektive Signal
aufgezeichnet. Auf der anderen Seite wird der Ton A nicht aufgezeichnet (ausgedünnt), oder
er wird codiert, während
der Quantisierbitwert drastisch reduziert wird.
-
In 7B wird
zusätzlich
zur minimalen Hörschwellenkurve 100 eine
Maskierungsmerkmalskurve 110 entsprechend einem Ton C aufgezeigt.
Obwohl der Ton B in dem Graphen an einer Position oberhalb der minimalen
Hörschwellenkurve 100 platziert
ist, kann der Ton B von den Ohren des Menschen nicht gehört werden,
da er durch den Ton C maskiert ist, welcher in der Nähe des Tones
B in dem Graphen platziert ist. Deshalb wird in dem ATRAC der Ton
B auch als die redundante Komponente entfernt und wird dann komprimiert.
-
Wie
oben an dem Beispiel erklärt,
hängt das Signalkomprimierverfahren
in dem ATRAC davon ab, wie die minimale Hörschwellenkurve, das Maskierungsmerkmal
usw. gesetzt sind, welche die Parameter in dem Komprimiervorgang
darstellen. Hier wird der Komprimiercodiervorgang mit Hilfe des
ATRAC durch Verwenden gerade einer Einstellung der minimalen Hörschwellenkurve,
des Maskierungsmerkmals usw. durchgeführt, welche im Voraus bestimmt werden.
-
Jedoch
ist das Aufzeichnungssignal oder der Musikeindruck für den Menschen
ganz unterschiedlich, abhängig
von der Einstellung der minimalen Hörschwellenkurve und/oder des
Maskierungsmerkmals, welches zum Ausführen des Komprimiercodiervorgangs
mit Hilfe des ATRAC benutzt wird. Wenn daher eine Vielzahl von Musikkompositionen
in verschiedenen Musikklängen
oder -genres bzw. -gattungen durch Verwenden nur einer festen Einstellung dieser
Charakteristika aufgezeichnet wird, kann ein optimaler Komprimiercodiervorgang
nicht immer an den Originaltönen
angewendet werden (d.h. der originalen Musikkomposition), so dass
der Fall auftreten kann, dass ein Aufzeichnungsvorgang, der für jede Musikkomposition
geeignet ist, nicht ausgeführt
werden kann, z.B. dass die einmal aufgezeichnete und wiedergegebene
Musikkomposition keinerlei Überzeugung
oder guten Eindruck bei der Zuhörerschaft hinterlässt, oder
die Hochfrequenzkomponente der aufgenommenen und wiedergegebenen
Musikkomposition den Ohren des Menschen weh tut.
-
Zusammenfassung
der Erfindung
-
Es
ist deshalb eine Aufgabe der vorliegenden Erfindung, ein Signalverarbeitungsgerät, ein Signalverarbeitungsverfahren
und ein Audio-Informationsaufnahmegerät zu liefern, wobei das Sig nalverarbeitungsgerät beinhaltet
ist, welches den Komprimiercodiervorgang ausführen kann, indem eine Charakteristik
bzw. ein Merkmal genutzt wird, wie z.B. eine minimale Hörschwellenkurve,
ein Maskierungsmerkmal o.Ä.,
welche für
jeden Musikklang oder -genre einer individuellen Musikkomposition
geeignet ist, welche auf einem Informationsaufzeichnungsmedium,
wie z.B. einer MD, aufzuzeichnen sind.
-
Die
obige Aufgabe der vorliegenden Erfindung kann mit einem Signalverarbeitungsgerät entsprechend
dem Anspruch 1 erreicht werden.
-
Ein
Audio- bzw. Toninformations-Aufzeichnungsgerät ist im Anspruch 8 definiert.
Ein Audioinformations-Aufzeichnungs- und -Wiedergabegerät ist im
Anspruch 9 definiert, und ein Signalverarbeitungsverfahren ist im
Anspruch 10 definiert.
-
Entsprechend
dem Signalverarbeitungsgerät der
vorliegenden Erfindung wird der Musikklang oder -genre der Musikkomposition,
welche aus dem Eingangs-Audiosignal zusammengesetzt ist, durch die Musikklang-Beurteilungsvorrichtung
beurteilt (oder analysiert), wenn das Eingangs-Audiosignal an das Signalverarbeitungsgerät eingegeben
wird. Dann wird auf der Grundlage des Beurteilungsergebnisses der
Musikklang-Beurteilungsvorrichtung eines aus einer Vielzahl von
Merkmalen, welche vorher für
jeden Parameter vorbereitet wurden, welcher für das Komprimiercodierverfahren
benutzt wird, durch die Auswahlvorrichtung selektiert. Dann wird
durch die Codiervorrichtung das Spektralsignal aus dem Eingangs-Audiosignal
generiert, und das erzeugte Spektralsignal wird auf der Grundlage
des ausgewählten
Merkmals kompressionscodiert.
-
Deshalb
ist es möglich,
den Komprimiercodiervorgang durch Benutzen des geeigneten Merkmales
für den
Musikklang oder -genres des Eingangs-Audiosignals durchzuführen.
-
Nach
einem Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung
beurteilt die Musikklang-Beurteilungsvorrichtung
fortlaufend den Musikklang oder -genre, und die Selektiervorrichtung
wählt eines
der Merkmale in einem Echtzeit- bzw. Real-Time-Verfahren aus, während das
Eingangs-Audiosignal eingegeben wird.
-
Entsprechend
diesem Gesichtspunkt wird der Musikklang oder -genre durch die Musikklang-Beurteilungsvorrichtung
fortlaufend beurteilt (oder analysiert), während das Eingangs-Audiosignal in
das Signalverarbeitungsgerät
eingegeben wird, und eines der Merkmale wird in Echtzeit durch die Auswahlvorrichtung
selektiert. Deshalb ist es möglich,
den Komprimiercodiervorgang durch Verfolgen der Änderung im Musikklang oder
-genre und durch Benutzen des optimalen Merkmals auszuführen, sogar
wenn der Musikklang oder -genre in der Mitte der Musikkomposition
verändert
wird.
-
Gemäß einem
anderen Gesichtspunkt des Signalverarbeitungsgerätes der vorliegenden Erfindung
ist die Musikklang-Beurteilungsvorrichtung ausgestattet mit: einer
Bandteiler- bzw. Bandtrennvorrichtung zur Aufteilung des Eingangs-Audiosignals
in Signalkomponenten in eine Vielzahl von Frequenzbändern; eine
Spitzenwert-Abtastvorrichtung zum Abtasten eines Spitzenwertes einer
jeden der Signalkomponenten; und einer auf einem Spitzenwert basierenden
Beurteilungsvorrichtung zum Beurteilen des Musikklanges oder -genres
auf der Grundlage des abgetasteten Spitzenwertes.
-
Entsprechend
diesem Gesichtspunkt wird in der Musikklang-Beurteilungsvorrichtung
durch die Bandtrennvorrichtung zuerst das Eingangs-Audiosignal in
die Signalkomponenten, in einer Vielzahl von Frequenzbändern aufgeteilt.
Dann wird der Spitzenwert jeder Signalkomponente durch die Spitzenwertabtastvorrichtung abgetastet.
Dann wird durch die Spitzenwert-basierte Beurteilungsvorrichtung
der Musikklang oder -genre auf der Grundlage des abgetasteten Spitzenwertes
beurteilt. Deshalb kann der Musikklang oder -genre auf der Grundlage
der Signalkomponenten in jedem Frequenzband fein beurteilt werden.
Da die Beurteilung des Musikklangs oder -genres auf der Grundlage
des Spitzenwertes erfolgt, kann das Signalverarbeitungsgerät zusätzlich durch
Benutzen eines verhältnismäßig einfachen Aufbaus
konstruiert werden.
-
Nach
einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der
vorliegenden Erfindung beinhalten die Merkmale wenigstens eine minimale Hör-Grenzcharakteristik
oder ein Maskierungsmerkmal.
-
Entsprechend
diesem Gesichtspunkt wird wenigstens die minimale Hörschwellenkurve
oder das Maskierungsmerkmal durch die Auswahlvorrichtung selektiert.
Dann wird das erzeugte Spektralsignal auf der Grundlage des ausgewählten Merkmals durch
die Codiervorrichtung kompressionscodiert. Deshalb kann auf der
Grundlage der minimalen Hörschwellenkurve
und/oder des Maskierungsmerkmals, welches optimal für den Musikklang
oder -genre des Eingangs-Audiosignals ausgewählt wurde, der Komprimiercodiervorgang
ausgeführt
werden.
-
Nach
einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der
vorliegenden Erfindung weisen die Merkmale wenigstens eine Bitzuweisung oder
eine Zeitlänge
einer Zeiteinheit auf, mit welcher die Codierungsvorrichtung eine
Kompressionscodierung des erzeugten Spektralsignals vornimmt.
-
Entsprechend
diesem Gesichtspunkt wird wenigstens eine der Bitzuweisung und der
Zeitlänge der
Zeiteinheit, wie z.B. eine Tongruppe oder Ähnliches, durch die Auswahlvorrichtung
selektiert. Dann wird durch die Codiervorrichtung das erzeugte Spektralsignal
auf der Grundlage des ausgewählten
Merkmals kompressionscodiert. Auf der Grundlage der Bitzuweisung
und/oder der Zeitlänge
einer Zeiteinheit, welche optimal für den Musikklang oder -genre des
Eingangs-Audiosignals ausgewählt
ist, kann deshalb der Komprimiercodiervorgang ausgeführt werden.
-
Nach
einem anderen Gesichtspunkt des Signalverarbeitungsgerätes der
vorliegenden Erfindung ist die Codiervorrichtung mit einem ATRAC-Codierer ausgestattet.
-
Entsprechend
diesem Gesichtspunkt ist es möglich,
den Komprimiercodiervorgang mit Hilfe des ATRAC-Verfahrens auszuführen.
-
Nach
einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der
vorliegenden Erfindung weisen die Merkmale wenigstens eines von zwei
Merkmalen auf, ein minimales Hörschwellenmerkmal
oder ein Maskierungsmerkmal.
-
Deshalb
kann der Komprimiercodiervorgang auf der Grundlage des minimalen
Hörschwellenmerkmals
und/oder des Maskierungsmerkmals, welches optimal für den Musikklang
oder -genre des Eingangs-Audiosignals ausgewählt wurde, durchgeführt werden.
-
Nach
einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der
vorliegenden Erfindung weisen die Merkmale wenigstens eines von zwei
Merkmalen auf, nämlich
eine Bitzuweisung und eine Zeitlänge
einer Zeiteinheit, mit welcher die Codiervorrichtung das erzeugte
Spektralsignal kompressionscodiert.
-
Deshalb
kann der Komprimiercodiervorgang auf der Grundlage der Bitzuweisung
und/oder der Zeitlänge
der Zeiteinheit, welche optimal für den Musikklang oder -genre
des Eingangs-Audiosignals ausgewählt
wurde, ausgeführt
werden.
-
In
einem anderen Gesichtspunkt des Signalverarbeitungsverfahrens der
vorliegenden Erfindung besteht der Codiervorgang aus einem Vorgang
mit Hilfe eines ATRAC-Verfahrens.
-
Entsprechend
diesem Gesichtspunkt ist es möglich,
den Komprimiercodiervorgang mit Hilfe des ATRAC-Verfahrens auszuführen.
-
Die
Art, der Nutzen und weitere Merkmale dieser Erfindung werden noch
klarer aus der folgenden detaillierten Beschreibung mit Bezug auf
bevorzugte Ausführungsformen
der Erfindung offensichtlich, wenn diese in Zusammenhang mit den
beigefügten
Zeichnungen gelesen werden, welche kurz nachfolgend beschrieben
werden.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
ein Blockschaltbild eines MD-Aufzeichnungsgerätes mit einem Signalverarbeitungsgerät als eine
Ausführungsform
der vorliegenden Erfindung;
-
2 ist
ein Blockschaltbild einer Analysiereinheit für den Musikklang des Signalverarbeitungsgerätes der 1;
-
3A ist
ein Graph, welcher einen Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer Bitzuweisung zeigt;
-
3B ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer anderen Bitzuweisung zeigt;
-
4A ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer Bitzuweisung für
eine Tongruppe zeigt;
-
4B ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer anderen Bitzuweisung für
die Tongruppe zeigt;
-
5A ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer Zeitlänge
für die
Tongruppe zeigt;
-
5B ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einer anderen Zeitlänge
für die
Tongruppe zeigt;
-
6A ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einem Maskierungsmerkmal zeigt;
-
6B ist
ein Graph, welcher den Komprimiercodiervorgang mit Hilfe des ATRAC
mit einem anderen Maskierungsmerkmal zeigt;
-
7A ist
ein Graph, welcher die minimale Hörschwellenkurve zeigt; und
-
7B ist
ein Graph, welcher die minimale Hörschwellenkurve und ein Maskierungsmerkmal zeigt.
-
Detaillierte
Beschreibung der bevorzugten Ausführungsform Mit Bezug auf die
beigefügten Zeichnungen
wird nun eine Ausführungsform
der vorliegenden Erfindung erklärt.
-
(Prinzip)
-
Zunächst wird
das Prinzip der vorliegenden Erfindung in Kürze erklärt. Wie oben erwähnt, ist
es im Falle des Komprimiercodiervorganges mit Hilfe des ATRAC wichtig,
die Parameter einzustellen, welche für den Komprimiercodiervorgang
benutzt werden. Konkreter ausgedrückt, ist es wichtig, die minimale
Hör schwellenkurve
bzw. -grenze, das Maskierungsmerkmal, die Zeitlänge, wenn das Signal zeitgeteilt
wird, welches in Signalabschnitte codiert wird (z.B. in eine Vielzahl
von Tongruppen, welche später beschrieben
werden), usw. aktuell einzustellen. Abhängig von diesen Einstellungen
variiert der Eindruck der Musikkomposition in weiten Bereichen.
In Anbetracht des Obigen wird in der vorliegenden Erfindung der
Musikklang oder -genre des Musiksignals, welches aufzuzeichnen ist,
analysiert und in Echtzeit beurteilt, so dass das optimale Merkmal
für den
Parameter in dem Komprimiercodiervorgang aus einer Vielzahl von
Merkmalen für
jeden Parameter, welcher im Voraus präpariert wurde, ausgewählt und
aktuell für
den Komprimiercodiervorgang benutzt wird. Dadurch kann der optimale
Komprimiercodiervorgang durch Benutzen der optimalen Merkmale entsprechend
dem Musikklang oder -genre der Musikkombination, welche aufzunehmen
ist, durchgeführt
werden.
-
(MD-Aufnahmegerät)
-
Als
Nächstes
wird eine bevorzugte Ausführungsform
der vorliegenden Erfindung mit Bezug auf die Zeichnungen erklärt. 1 ist
ein Blockschaltbild eines MD-Aufzeichnungsgerätes, welches ein Signalverarbeitungsgerät der vorliegenden
Erfindung aufweist.
-
In 1 weist
ein MD-Aufzeichnungsgerät 1 ein
Signalverarbeitungsgerät 2 auf.
Das Signalverarbeitungsgerät 2 ist
mit einem A/D-(Analog-zu-Digital-)Wandler 8, einem ATRAC-Codierer 10,
einer Musikklang-Analysiereinheit 12 und einer CPU (Central Processing
Unit) 14 ausgestattet. Das MD-Aufzeichnungsgerät 1 weist
auch eine Aufzeichnungseinheit 16, eine Wiedergabeeinheit 30,
einen ATRAC-Codierer 31 und einen D/A-(Digital-zu-Analog-)Wandler 32 auf.
-
Zum
Zeitpunkt des Aufzeichnens des Audiosignals wird ein Eingangssignal
S1, welches auf einer MD 18 aufzuzeichnen ist, an den A/D-Wandler 8 eingegeben,
mit einer Abtastfrequenz von 44,1 kHz abgetastet und wird in 16
bis 20 Bits beispielsweise quantisiert, welche als ein Digitalsignal
S2 auszugeben sind. Dann wird das Digitalsignal S2 an den ATRAC-Codierer 10 und
die Musikklang-Analysiereinheit 12 gesandt.
-
Auf
der anderen Seite wird das kompressionscodierte Digitalsignal zum
Zeitpunkt der Wiedergabe des Audiosignals von der MD 18 durch
das MD-Aufzeichnungsgerät 1 von
der MD 18 durch die Wiedergabeeinheit 30 ausgelesen,
durch den ATRAC-Decoder 31 expansionsdecodiert und durch den
D/A-Wandler 32 D/A-gewandelt, so dass der analoge Ausgang,
welcher dem Eingangssignal S1 entspricht, über einen Lautsprecher oder
einen Kopfhörer
ausgegeben wird.
-
2 zeigt
eine Struktur der Musikklang-Analysiereinheit 12. Die Musikklang-Analysiereinheit 12 ist
mit einem Tiefpassfilter 20 und einer Vielzahl von Bandpassfiltern 21, 22,
... ausgestattet, um so das Digitalsignal S2 in Bänder aufzuteilen
(d.h. das Digitalsignal S2 in eine Vielzahl von Frequenzkomponenten
unterschiedlicher Frequenzbänder aufzuteilen),
welches von dem A/D-Wandler 8 eingegeben wurde. Vorzugsweise
fallen die Frequenzbänder
für diesen
Teilvorgang mit 3 Frequenzbändern zusammen,
welche in dem ATRAC-Codierer 10 in Bänder getrennt sind (z.B. ungefähr 0 bis
5,5 kHz für das
tiefe Frequenzband, ungefähr
5,5 bis 11 kHz für das
mittlere Frequenzband und ungefähr
11 bis 22 kHz für
das Hochfrequenzband). Dies ist so, da der Komprimiercodiervorgang
in den ATRAC-Codierer 10 durch das in Bändertrennen des Digitalsignals
S2 in Signalkomponenten in diese 3 Frequenzbänder durchgeführt wird
und dann die minimale Hörschwellenkurve
o.Ä. darauf
angewandt wird. Es ist auch möglich,
die Analyse für
jedes feine Frequenzband auszuführen,
nachdem das Digitalsignal S2 in die Signalkomponenten in den Frequenzbändern feiner
als die 3 Frequenzbänder
aufgeteilt wurde. Vorzugsweise sollte für jedes Filter ein QMF (Quadrature
Mirror Filter) angewendet werden. Dies rührt daher, dass signalverfälschende
Komponenten, welche durch den Bandteilungsvorgang erzeugt werden,
während
des Synthetisierens der Frequenzbänder aufgehoben werden können. Es
ist auch möglich,
verschiedene Arten, anders als das QMF, als Filterstrukturen zu verwenden.
-
Die
Signalkomponenten, welche in Bänder geteilt
wurden, werden in Pegel- bzw. Schwellwertabtastschaltungen 23, 24, 25,
... jeweils eingegeben. Jede der Pegelabtastschaltungen 23, 24, 25,
... tastet den Spitzenwert (Maximalwert) der eingegebenen Signalkomponente
in jeweils einem der Frequenzbänder
für jede
vorher festgelegte Zeitlänge
ab und sendet den abgetasteten Spitzenschwellwert an die CPU 14.
Zu diesem Zeitpunkt wird die Zeitlänge für das Abtasten des Schwellwerts
vorzugsweise auf eine "Tongruppe" eingestellt, welche
eine Minimaleinheit zum Zeitaufteilen des Musiksignals innerhalb
des ATRAC-Codierers 10 ist (welcher auch als ein "Codierblock" bezeichnet wird
und bei einer Zeitlänge von
11,6 msec im Maximum ist). Dies rührt daher, dass der ATRAC-Codierer 10 auf
der letzteren Stufe den Komprimiercodiervorgang des Signals ausführt, indem
die Tongruppeneinheit benutzt wird und dass diese geeignet ist,
den Musikklang oder -genre durch Nutzen der Zeiteinheit, welche
hierfür
die gleiche ist, zu analysieren. Nichtsdestotrotz, falls die Analyse durch
eine Tongruppeneinheit schwierig oder unmöglich ist, da eine beträchtliche
Zeitdauer für
die Übertragung
eines jeden der Mikrocomputer, der LSIs und Ähnlichem erforderlich ist,
können
die Analyse und die Beurteilung durchgeführt werden, indem als Einheit
eine Zeitlänge
angewandt wird, welche mit einer Vielzahl von Tongruppen korrespondiert.
-
Die
CPU 14 empfängt
die Abtastsignale von den Pegelabtastschaltungen 23, 24, 25,
... und bestimmt das Merkmal jedes Parameters (z.B. die Bitzuweisung
und die Zeitlänge
der Tongruppe, die minimale Hörschwellwertgrenzkurve,
das Maskierungsmerkmal), welcher für den Codiervorgang in dem ATRAC-Codierer 10 auf
der Grundlage des Inhalts der empfangenen Abtastsignale zu nutzen
ist, und sendet ein Auswahlsignal Sc aus, um die geeigneten Merkmale
an den ATRAC-Codierer 10 auszuwählen.
-
Die
CPU 14 beurteilt den Musikklang oder -genre. Beispielsweise
beurteilt die CPU 14, ob ein großer oder kleiner Wert der Signalkomponente
mit einem niedrigen Pegel in dem hohen Band außerhalb des Digitalsignals
S2 vorliegt, ob die Pegeländerung der
Signalkomponente im mittleren Band groß oder klein ist usw., und
bestimmt die Bitzuweisung und die Zeitlänge der Tongruppe, die minimale
Hörschwellenmerkmalskurve,
das Maskierungsmerkmal u.Ä., von
welchen jedes als optimal für
jeden individuellen Fall eingestuft wird. Das konkrete Feststellverfahren hierfür wird nachfolgend
im Detail beschrieben.
-
Der
ATRAC-Codierer 10 bereitet eine Vielzahl von Merkmalen
vor, welche bezüglich
jedes Parameters für
den Codiervorgang im Voraus benutzbar sind, und er ist so angepasst,
dass er eines der Merkmale entsprechend dem Auswahlsignal Sc von
außen
auswählen
kann. Z.B. wird eine Vielzahl von Merkmalen für jeden Parameter wie folgt
vorbereitet. Zuerst ist es nämlich
möglich,
als eine Zeitlänge
11,6 msec auszuwählen,
welche der Maximalwert ist, welcher auf dem ATRAC vorgeschrieben
bzw. festgelegt ist, und andere Zeitlängen, kürzer als dieser Maximalwert
als Zeitlänge
der Tongruppe. Die Bitzuweisung kann willkürlich bestimmt werden. Eine
Vielzahl von minimalen Hörschwellwertkurven
wird vorbereitet, wie z.B. eine Kurve, deren Pegel im Allgemeinen hoch
ist, eine Kurve, deren Pegel im Allgemeinen niedrig ist, eine Kurve,
deren Pegel mehr oder weniger hoch (oder niedrig) auf der Hochfrequenzseite
ist, usw..
-
Eine
Vielzahl von Maskierungsmerkmalen wird vorbereitet, wie z.B. eine
Merkmalskurve, welche steil ist (d.h. mit welcher es schwierig ist,
das Signal in der Nähe
derselben zu maskieren), eine Merkmalskurve, welche leicht ist (d.h.
mit welcher es leicht ist, das Signal in der Nähe derselben zu maskieren),
usw.. Dann wird auf der Grundlage des Auswahlsignals Sc, welches
durch die CPU 14 geliefert wird, der Komprimiercodiervorgang
in dem ATRAC-Codierer 10 ausgeführt, während die optimalen Merkmale
für jeden
Parameter eines nach dem anderen ausgewählt werden. Deshalb werden
auf der Grundlage des Musikklangs oder -genres des eingegebenen
Signals die Merkmale, welche in dem ATRAC-Codierer 10 benutzt
werden, in jedem Moment geändert,
wenn die Gelegenheit zur Zeit des aktuellen Ausführens des Kompressionscodiervorgangs
dies erfordert.
-
Ein
codiertes Signal S3, welches in der oben beschriebenen Weise kompressionscodiert
wurde, wird an die Aufzeichnungseinheit 16 gesandt und wird
auf der MD 18 aufgezeichnet.
-
Als
Nächstes
wird das Verfahren des Bestimmens des Merkmals für jeden Parameter, welcher durch
die Musikklang-Analysiereinheit 12 und die CPU 14 ausgeführt wird,
erklärt.
Die Merkmale, welche in dem ATRRC-Codierer 10 wechselbar
sind, sind: (i) die Bitzuweisung und die Zeitlänge der Tongruppe, (ii) die
minimale Hörschwellenkurve
und (iii) das Maskierungsmerkmal in der vorliegenden Ausführungsform.
Diese werden entsprechend der Reihenfolge erklärt.
-
(i) Bitzuweisung und Zeitlänge der
Tongruppe
-
Im
Falle des ATRAC wird das Eingangssignal, welches zu codieren ist,
in Signalabschnitte für jede
vorher festgelegte Zeitlänge
aufgeteilt. Eine Einheit einer solchen aufgeteilten Zeitlänge oder
eines Zeitfensters wird als eine Tongruppe (oder ein Codierblock)
bezeichnet. Die Tongruppe wird als eine Zeitlänge von 11 msec und als Maximalwert
davon entsprechend dem ATRAC vorgeschrieben. Deshalb ist es möglich, den
Komprimiercodiervorgang durch Benutzen einer Vielzahl von Zeitlängen innerhalb
des Bereiches, welcher nicht größer (weiter)
als dieser Maximalwert ist, durchzuführen. Außerdem ist es möglich, willkürlich die
Zuweisung der Quantisierbitzahl mit Bezug auf jede Tongruppe zu
bestimmen.
-
3A zeigt
ein Beispiel der Bitzuweisung der Ton- bzw. Tongruppe in einem Zustand,
bei dem die Bitzuweisung verhältnismäßig klein
ist, während 3B ein
Beispiel der Bitzuweisung der Tongruppe bei einem Zustand zeigt,
bei dem die Bitzuweisung verhältnismäßig groß ist. Durch
Erhöhen
der Bitzuweisung vom Zustand, wie er in 3A gezeigt
wird, auf den Zustand, wie er in 3B gezeigt
wird, ist es möglich,
den Codierprozess mit einem niedrigeren Quantisierrauschen durchzuführen.
-
4A zeigt
ein Beispiel der Zeitlänge
der Tongruppe, welche verhältnismäßig weit
ist, während 4B ein
Beispiel der Zeitlänge
der Tongruppe zeigt, welche verhältnismäßig eng
ist. Durch Erniedrigen der Zeitlänge
der Tongruppe von dem Wert, welcher in 4A angezeigt
wird, auf den, welcher in 4B angezeigt
wird, wird der Betrag der Bitzuweisung in der Pegelrichtung erhöht, so dass
die codierten Daten (d.h. die Aufzeichnungsdaten), welche einen
Pegel dichter an dem des Originalklanges haben, erhalten werden
können.
Deshalb ist es z.B. möglich,
im Fall, dass die Echos oder Nachhalle der Musikkomposition als
ein wichtiger Faktor in dem klassischen Musikklang oder -genre betrachtet
werden, die codierten Daten, in welchem die Echos oder Nachhalle
gemacht sind, präzise
entsprechend dem Originalklang aufzuzeichnen. Folglich kann der
Musikklang mit einer kleinen Herabsetzung in der Qualität erhalten
werden, indem diese Zeitdauer enger gesetzt wird.
-
[ii] Minimale Hörschwellenkurve
-
Die
minimale Hörschwellenkurve
ist eine Kurve, welche durch Drucken des Schalldruckpegels, welcher
für die
Ohren des Menschen hörbar
ist, in Abhängigkeit
von der Frequenz erhalten wird. Die Klangkomponente, deren Pegel
niedriger als diese Kurve ist, wird nämlich nicht vom Ohr des Menschen gehört. Der
ATRAC-Codierer bereitet eine Vielzahl von minimalen Hörschwellenkurven
im Voraus vor und führt
den Komprimiercodiervorgang durch Auswählen einer der Kurven aus.
Zum Zeitpunkt des Codierens wird der Klang (d.h. das Klangsignal),
dessen Pegel niedriger als die ausgewählte Kurve ist, grundlegend
entfernt oder wird durch Benutzen einer beträchtlich kleinen Quantisierbitzahl
codiert. Gegebenenfalls werden sowohl die Signalkomponente, welche überhaupt
nicht codiert wurde, als auch die Signalkomponente, welche nicht
mit einer geeigneten Quantisierbitzahl codiert wurde, aufgrund dieser
minimalen Hörschwellenkurve
oder des Maskierungsmerkmals, welches später beschrieben wird, als das Signal,
welches "nicht eincodiert" ist, in der nachfolgenden
Beschreibung ausgedrückt.
-
5A und 5B zeigen
Beispiele von Codiersignalen, welche einander gleich sind (d.h.
die Signale, deren Spektren gegenseitig gleich sind), indem minimale
Hörschwellkurven
unterschiedlich voneinander benutzt werden. Spezieller ausgedrückt, 5A zeigt
das Beispiel des Codierens des Signals, indem die minimale Hörschwellkurve
benutzt wird, deren Pegel relativ hoch ist, während 5B das
Beispiel des Codierens des Signals zeigt, indem die minimale Hörschwellkurve
benutzt wird, deren Pegel relativ niedrig ist. Aus diesen Figuren
ist zu ersehen, dass die Signalkomponente, welche nicht codiert
ist, indem die minimale Hörschwellkurve
benutzt wird, wie sie in 5A gezeigt
wird, aktuell durch das Benutzen der minimalen Hörschwellkurve codiert wird,
wie sie in 5B gezeigt wird. Da im Falle
des ATRAC das Eingangssignal nach dem Aufteilen des Eingangssignals
in die Signalkomponenten in den 3 Fre quenzbändern, d.h. dem niedrigen Band,
dem mittleren Band und dem hohen Band, kompressionscodiert wird,
ist es möglich,
die Signalkomponente besser in einem speziellen Band aufzuzeigen,
indem die minimale Hörschwellkurve,
welche für
dieses spezielle Band genutzt wird, niedrig gesetzt wird. Z.B. ist
es im Allgemeinen bei gewöhnlichen
Musikkompositionen so, dass der Pegel der Signalkomponente in dem
hohen Band verglichen mit dem Pegel der Signalkomponente in dem
mittleren oder niedrigen Band niedrig ist (d.h. der Pegel der Signalkomponente
in dem hohen Band ist verhältnismäßig niedrig).
Deshalb ist es im Falle, dass die Signalkomponente in dem hohen Band
als wichtiger Faktor in dem Rockmusikklang oder -genre z.B. erachtet
wird, möglich,
einen Aufzeichnungsvorgang derart durchzuführen, dass das Signal, welches
einen hohen Anteil an Signalkomponente in dem hohen Band besitzt,
erhalten werden und durch Auswählen
der minimalen Höherschwellkurve,
welche für
das hohe Band benutzt wird, dessen Pegel verhältnismäßig niedrig ist, aufgezeichnet werden
kann. Alternativ ist es möglich,
im Falle, dass die Signalkomponente in dem hohen Band nicht wirklich
wichtig ist, zum Beispiel in dem klassischen Musikklang oder -genre,
einen derartigen Aufzeichnungsvorgang auszuführen, dass das Signal, welches
einen hohen Anteil an Signalkomponente in dem mittleren Band hat,
erhalten werden und durch Auswählen
der minimalen Höherschwellkurve,
welche für
das mittlere Band benutzt wird, dessen Pegel verhältnismäßig niedrig
ist, aufgezeichnet werden kann, während die minimale Hörschwellkurve
für das hohe
Band stattdessen hochgesetzt wird.
-
Die
Beurteilung des Musikklanges oder -genres, z.B. die Beurteilung,
ob es sich um Rockmusikklang oder -genre oder ob es sich um klassischen Musikklang
oder -genre handelt, wird durch die CPU 14 auf der Grundlage
der Daten durchgeführt,
welche von der Musikklang-Analysiereinheit 12 erhalten
werden. Wenn z.B. das Signal, welches einen Schwellwert besitzt,
welcher verhältnismäßig hoch
im hohen Band ist, periodisch auftritt, wird beurteilt, dass der Musikklang
oder -genre dem Rock-Musikklang
oder -genre zugeordnet ist. Oder, falls das Signal mit einem Pegel,
welcher im Durchschnitt im mittleren Band verhältnismäßig hoch ist, ohne jegliche
drastische Veränderung
kontinuierlich auftritt, wird beurteilt, dass der Musikklang oder
-genre zum klassischen Musikklang oder -genre gehört. Nebenbei
bemerkt, sind dies nur Beispiele, und es gibt viele andere Wege,
um den Musikklang oder -genre entsprechend verschiedener Standards
zu beurteilen.
-
(iii) Maskierungsmerkmal
-
Das
Maskierungsmerkmal ist ein derartiges Merkmal, dass in dem Fall,
dass ein Ton C und ein Ton D, welcher in der Frequenz dicht am Ton
C und groß im
Pegel ist, gleichzeitig existieren, wie dies in 6A und 6B gezeigt
wird, kann der Ton C vom Ohr des Menschen nicht gehört werden,
da der Ton D existiert. 6A und 6B zeigen
Beispiele, bei welchen Maskierungsmerkmale unterschiedlich voneinander
an die Signale, welche gegenseitig das gleiche Spektrum besitzen,
angelegt werden. 6A zeigt das Beispiel, bei welchem
das Maskierungsmerkmal verhältnismäßig flach
ist, während 6B das
Beispiel zeigt, bei dem das Maskierungsmerkmal verhältnismäßig steil
ist. Wie aus diesen Figuren hervorgeht, wird der Ton C nicht durch
Benutzen des flachen Merkmals codiert, wie dies in 6A aufgezeigt
wird, sondern wird bestimmt durch Nutzen des steilen Merkmals codiert,
wie dies durch 6B gezeigt wird. Deshalb kann
es, im Falle, dass die Signalkomponente, deren Pegel verhältnismäßig hoch ist,
häufig
auftritt, wie dies in der Musikkomposition im Rockmusikklang oder
-genre der Fall ist, vorgezogen werden, das Maskierungsmerkmal steil
zu setzen, wie dies durch 6B aufgezeigt
wird, um so den Ton in der Nähe
des Signals, welches den hohen Pegel besitzt, nicht zu leicht zu
maskieren.
-
Wie
oben beschrieben, wird entsprechend der vorliegenden Erfindung der
Musikklang oder -genre des Signals, welches auf der MD aufzuzeichnen
ist, beurteilt, und das optimale Merkmal für jeden Parameter, welcher
für die
ATRAC benutzt wird, wird ausgewählt
und, wenn es die Gegebenheit erfordert, auf der Grundlage des Ergebnisses
der Beurteilung geändert.
Außerdem
wird die Beurteilung des Musikklanges oder -genres und die Auswahl
der Merkmale kontinuierlich für
jede vorher festgelegte Zeitlänge ausgeführt, welche
vorzugsweise mit einer Tongruppe koinzidiert. Deshalb werden, sogar
im Falle, dass der Musikklang oder -genre in der Mitte einer Musikkomposition
gewechselt wird, die Merkmale entsprechend von Zeit zu Zeit geändert, um
so diesem Wechsel zu folgen. Folglich ist es möglich, das Codieren und die
Aufzeichnungsvorgänge
in Einklang mit dem Musikklang oder -genre jeder individuellen Musikkomposition
durchzuführen.