WO2005083702A1 - Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd - Google Patents

Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd Download PDF

Info

Publication number
WO2005083702A1
WO2005083702A1 PCT/EP2005/001650 EP2005001650W WO2005083702A1 WO 2005083702 A1 WO2005083702 A1 WO 2005083702A1 EP 2005001650 W EP2005001650 W EP 2005001650W WO 2005083702 A1 WO2005083702 A1 WO 2005083702A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
channels
audio
channel
parametric
Prior art date
Application number
PCT/EP2005/001650
Other languages
English (en)
French (fr)
Inventor
Harald Popp
Stefan Geyersberger
Wolfgang Fiesel
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority to CN2005800060514A priority Critical patent/CN1934640B/zh
Priority to EP05707480A priority patent/EP1719128A1/de
Publication of WO2005083702A1 publication Critical patent/WO2005083702A1/de
Priority to US11/465,742 priority patent/US8989881B2/en

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • G11B27/3063Subcodes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/004Recording, reproducing or erasing methods; Read, write or erase circuits therefor
    • G11B7/0045Recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs

Definitions

  • the present invention relates to stereo audio CD technology and in particular to devices and methods for writing to audio CDs and corresponding methods and devices for recovering data from CDs.
  • Multichannel audio reproduction technology has become increasingly important lately. This may be due to the fact that audio compression / coding techniques such as the well known MP3 technique have made it possible to transmit audio data over the Internet or other transmission channels with a limited bandwidth.
  • the MP3 coding technology has become so famous due to the fact that it enables the distribution of all recordings in a stereo format, i. H. in a digital representation of the audio recording comprising a first or left stereo channel and a second or right stereo channel.
  • the known audio CDs are alternative media for distributing stereo data.
  • the digital compact disk developed from the collaboration between Philips and Sony is based on non-contact optical scanning using a laser from a one-sided record as an information carrier.
  • the beam of a semiconductor laser reflected from the disk and modulated in intensity is received by a photodiode for reading. Their exits output signal is converted into a serial data signal and the clock signal is obtained therefrom.
  • the synchronization characters are then separated and the channel code is converted back into data, check characters and control / display bits.
  • the control / display decoder supplies the signals for motor speed, focusing and tracking as well as for finding certain music passages and displaying them.
  • the test bits are used to supplement disturbed signal information. After the data stream has been separated by means of the multiplexer, the digital / analog conversion back to the analog audio signal of the left and right channels takes place.
  • the standardized CD frame structure which all audio CDs with stereo information have, and are set to the usual CD player, there are six consecutive samples of the left and right channels in one frame.
  • the transmission starts with the left channel.
  • Each 16-bit sample begins with the MSB and is divided into two audio symbols of 8 bits each.
  • the stereo data is subjected to error protection coding using a two-stage CIRC process.
  • a recommended multi-channel surround representation includes, in addition to the two stereo channels L and R, an additional center channel C and two surround channels Ls, Rs.
  • This reference sound format is also referred to as 3/2 stereo, which means that three front channels and two Surround channels exist.
  • 5 transmission channels are required.
  • at least five speakers are attached to the respective five different places needed to get an optimal so-called "sweet spot" at a certain distance from five precisely placed speakers.
  • So-called DVDs have become established in the field of CD technology. These typically contain a complete 5.1 or 7.1 recording, i.e. a complete representation of each individual sound channel.
  • DVDs are the fact that they require their own DVD players and that conventional audio CD players cannot be used to play DVDs. Furthermore, there is also no possibility of "upgrading" such normal audio CD players with simple measures, so that they would be able to play not only audio CDs but also DVDs.
  • Coded multichannel representations contained on the Internet or from other sources could also be burned to CDs if there are no license rights in the way. Even burned CDs of this kind are not compatible with normal CD players, since they contain encoded information. ten, while the stereo data contained on the audio CDs are only uncompressed 16-bit PCM data, which are only subjected to error protection coding, which leads to an increase in the data rate, and are not subjected to any data compression, which leads to a Data rate reduction would result.
  • FIG. 3 shows a joint stereo device 60.
  • This device can be a device that implements, for example, the intensity stereo (IS) technique or the binaural cue coding technique (BCC).
  • IS intensity stereo
  • BCC binaural cue coding technique
  • Such a device usually receives at least two channels CH1, CH2, .... CHn as an input signal and outputs a single carrier channel and parametric multi-channel information.
  • the parametric data are defined in such a way that an approximation of an origin channel (CH1, CH2, ..., CHn) can be calculated in a decoder.
  • the carrier channel will contain subband samples, spectral coefficients, time domain samples, etc., which provide a relatively fine representation of the underlying signal, while the parametric data do not include such samples or spectral coefficients, but rather control parameters for controlling a specific reconstruction algorithm, such as weights by multiplying, by time shifting, by frequency shifting, etc.
  • the parametric multichannel information therefore comprises a relatively rough representation of the signal or the assigned channel.
  • the amount of data required by a carrier channel is approximately 60 to 70 kbit / s, while the amount of data required by parametric page information for a channel ranges from 1.5 to 2.5 kbit /s is. It should be noted that the above numbers apply to compressed data.
  • an uncompressed CD channel requires data rates in the range of about ten times.
  • An example of parametric data are the known scale factors, intensity stereo information or BCC parameters, as will be explained below.
  • intensity stereo coding is described in AES preprint 3799, “Intensity Stereo Coding”, J. Herre, KH Brandenburg, D. Lederer, February 1994, Amsterdam.
  • concept of intensity stereo is based on a major axis transformation, which is to be performed on data from both stereophonic audio channels.
  • the transmitted signal i. H. the carrier channel is generated from the sum signal of the left channel and the right channel instead of the rotation of both components.
  • this processing i.e. H. the generation of intensity stereo parameters for performing the scaling operations is performed in a frequency-selective manner, d. H. independently for each scale factor band, d. H. for each encoder frequency partition.
  • Both channels are preferably combined to form a combined or “carrier” channel and, in addition to the combined channel, the intensity stereo information.
  • the intensity stereo information depends on the energy of the first channel, the energy of the second Channel or the energy of the combined channel.
  • the BCC technique is described in the AES convention paper 5574 "Binaural Cue Coding applied to stereo and multichannel audio compression", T. Faller, F. Baumgarte, May 2002, Kunststoff.
  • the BCC coding uses a Converted number of audio input channels into a spectral representation using a DFT-based transform with overlapping windows. The resulting spectrum is divided into non-overlapping sections, each of which has an index. Each partition has a bandwidth proportional to the equivalent rectangular bandwidth ( ERB)
  • ERB equivalent rectangular bandwidth
  • the ICLD and ICTD are quantized and encoded to finally come into a BCC bit stream as page information.
  • the inter-channel level differences and the inter-channel time differences are given for each channel relative to a reference channel. Then the parameters are calculated according to predetermined formulas which depend on the determined partitions of the signal to
  • the decoder On the decoder side, the decoder typically receives a mono signal and the BCC bit stream.
  • the mono signal is transformed into the frequency domain and entered into a spatial synthesis block (spatial synthesis block), which also receives decoded ICLD and ICTD values.
  • a spatial synthesis block spatial synthesis block
  • the BCC parameters ICLD and ICTD are used to perform a weighting operation on the mono signal to synthesize the multichannel signals, which after frequency / time conversion represent a reconstruction of the original multichannel audio signal.
  • the joint stereo module 60 operates to output the channel side information such that the parametric channel data are quantized and encoded ICLD or ICTD parameters, using one of the original channels as a reference channel to encode the channel side information becomes.
  • the carrier signal is normally formed from the sum of the participating origin channels.
  • a typical BCC scheme for multi-channel audio coding is shown in more detail below, with reference to FIGS. 4 to 6.
  • the multichannel audio input signal at an input 110 of a BCC encoder 112 is downmixed in a so-called downmix block 114.
  • the original multichannel signal at input 110 is a 5-channel surround signal with a front left channel, a front right channel, a left surround channel, a right surround channel and a center channel.
  • downmix block 114 generates a sum signal by simply adding these five channels into a mono signal.
  • the BCC analysis block calculates interchannel level differences (ICLD) and interchannel time differences (ICTD) as described above. Recently, the BCC analysis block 116 has also been able to calculate inter-channel correlation values (ICC values).
  • ICLD interchannel level differences
  • ICTD interchannel time differences
  • ICC values inter-channel correlation values
  • the sum signal and side information are transmitted to a BCC decoder 120 in a quantized and encoded format.
  • the BCC decoder breaks down the transmitted sum signal into a number of subbands and carries out scaling, delays and other processing steps in order to deliver the subbands of the multichannel audio channels to be output.
  • the BCC decoder 120 includes a BCC synthesis block 122 and a page information revision block 123.
  • the internal structure of the BCC synthesis block 122 is illustrated below with reference to FIG. 6.
  • the sum signal on line 115 is fed into a time / frequency conversion unit or filter bank FB 125.
  • filter bank FB 125 At the output of block 125, there is a number N of subband signals or, in an extreme case, a block of spectral coefficients if the audio filter bank 125 carries out a 1: 1 transformation, ie a transformation that N Spectral coefficients generated from N time domain samples.
  • the BCC synthesis block 122 further comprises a delay stage 126, a level modification stage 127, a correlation processing stage 128 and an inverse filter bank stage IFB 129.
  • stage 129 the reconstructed multi-channel audio signal with, for example, five channels in the case of a 5-channel surround system can be converted into one set are output by loudspeakers 124, as shown in FIG. 5 or FIG. 4.
  • the input signal sn is converted into the frequency range or the filter bank range by means of the element 125.
  • the signal output from element 125 is copied such that multiple versions of the same signal are obtained, as represented by copy node 130.
  • the number of versions of the original signal is equal to the number of output channels in the output signal.
  • each version of the original signal at node 130 is subjected to a certain delay di, d 2 , ..., di, ... d N.
  • the delay parameters are calculated by the side information processing block 123 in FIG. 5 and derived from the interchannel time differences as calculated by the BCC analysis block 116 of FIG. 5.
  • the multiplication parameters ai, a 2 , ..., ai, ..., a N which are also processed by the side information processing block 123 based on the interchannel level differences as calculated by the BCC analysis block 116. be calculated.
  • the ICC parameters calculated by the BCC analysis block 116 are used to control the functionality of block 128 so that certain correlations between the delayed and level-manipulated signals at the outputs of block 128 are obtained. It should be noted here that the order of the stages 126, 127, 128 may differ from the order shown in FIG. 6.
  • the BCC analysis is also carried out frame-by-frame, that is to say variable in time, and that a frequency-wise BCC analysis is also obtained, as can be seen from the filter bank division from FIG.
  • the BCC parameters are obtained for each spectral band.
  • the BCC analysis block receives a set of BCC parameters for each of the 32 bands.
  • the BCC synthesis block 122 of FIG. 5, which is shown in detail in FIG. 6, carries out a reconstruction which is also based on the 32 bands mentioned by way of example.
  • ICLD integrated low-density dielectric
  • ICTD integrated low-density dielectric
  • ICC parameters can be defined in different ways. Generally speaking, ICC parameters can be determined in the encoder between all possible pairs of channels, as shown in Figure 4B. However, it has been proposed to only calculate ICC parameters between the strongest two channels at a time, as shown in FIG. 4C, where an example is shown in which an ICC parameter between channels 1 and 2 is at a time is calculated, and at another time an ICC parameter between channels 1 and 5 is calculated.
  • the decoder then synthesizes the inter-channel correlation between the strongest channels in the decoder and uses certain heuristic rules to calculate and synthesize the inter-channel coherence for the remaining channel pairs.
  • the multiplication parameters ai, a N represent an energy distribution of an original multi-channel signal. Without loss of generality, it is preferred, as shown in FIG. 4A, to take four ICLD parameters which represent the energy difference between the respective channels and the front left channel .
  • the multiplication parameters ai, ..., a N are derived from the ICLD parameters so that the total energy of all reconstructed output channels is the same (or is proportional to the energy of the transmitted sum signal).
  • the object of the present invention is to create a flexible and potentially high market acceptance concept for distributing and generating multichannel audio data.
  • the present invention is based on the finding that subchannels are provided on a conventional audio CD in accordance with the normal CD format and are defined in accordance with the CD standard in order to transmit meta information, such as data and text or a video image. According to the invention these subchannels are used to write parameter information onto the normal stereo audio CD, so that a normal stereo audio CD contains enough information for multi-channel playback.
  • An advantage of this concept is that it is compatible with common CD players. Conventional CD players then still provide a stereo sound representation of the normal audio CD stereo data, which are not influenced by the inventive concept. However, if a CD player is equipped according to the invention, that is to say by means of a small additional module which receives the stereo data on the CD player's output side in addition to the sub-channel data, that is to say the multi-channel parameter data, and using the underlying reconstruction algorithm, the parameter data and the If stereo data is offset against one another, a multichannel representation of the original multichannel signal is provided.
  • Player to which he has become accustomed and with which he is satisfied can be kept and only needs the additional module to read the multichannel audio CDs, which, however, can be easily connected to the CD player, since every CD player has a stereo output. So that the additional module does not have to intervene in the CD player, but can simply be plugged into the connection provided anyway by the CD player.
  • This connection or output of the CD player is preferably a digital output.
  • an analog / digital converter would also be required in the additional multi-channel module.
  • the present invention is also advantageous in that when the multichannel information is backwards compatible, the CD is backwards compatible, so it can also be played back on a conventional conventional stereo CD player.
  • the CD according to the invention can therefore be played both on a normal CD player and on a multichannel-expanded CD player.
  • the multi-channel parameter information can also be accommodated at other locations on the audio CD that are not occupied by the two-channel display, for example at a vacant location on the CD, on a data partition of a hybrid CD, at a separate session at the end the CD etc.
  • the concept according to the invention is also advantageous in that the amount of data is sufficiently compressed by displaying the multi-channel information using parametric multi-channel data, so that the channel capacity of the subchannels on the CD is sufficiently large. Of course, it would not be possible to store non-parameter information as found on the DVD on these subchannels.
  • Another advantage of the present invention is that existing CD writing devices can be used, since these were already designed to write data to the user subchannels anyway.
  • a multi-channel CD with at least 3 and preferably 5, 7 or even more channels can be made from a stereo CD with minimal effort on the part of the CD manufacturer, with regard to the CD itself and on the part of the user. All of this is achieved with the tried and tested audio CD technology, which has been mature, proven and accepted for years, which, at least for the time being, cannot be said unreservedly with newer technologies, in particular from the DVD sector.
  • FIG. 1 shows a block diagram of the device according to the invention for writing a compact disk
  • FIG. 2 shows a block diagram of a device according to the invention for playing a compact disc
  • Figure 4 is an illustration of a scheme for determining ICLD, ICTD and ICC parameters
  • FIG. 5 is a block diagram representation of a BCC encoder / decoder chain
  • FIG. 6 is a block diagram of an implementation of the BCC synthesis block of FIG. 5.
  • FIG. 1 shows a device according to the invention for writing to a compact disc with audio information from which a multi-channel audio representation can be reconstructed, with a device for writing parametric multi-channel information at one or more locations on the CD, which are not for two basic channels, which are a two-channel representation of the audio information include, are provided.
  • the parametric multi-channel information which is not written to the CD by the device 10, is designed in such a way that, together with the two basic channels, it enables a multi-channel audio display with more than two audio channels.
  • the parametric multichannel information is preferably BCC parameters or intensity stereo parameters or other parametric data, which, in contrast to the two stereo basic channels, is only a rough representation of one channel of the original multichannel audio signal.
  • the CD is provided with normal stereo data with the parametric multi-channel information even before it is written to. This would be the case if the multichannel information was subsequently written to the CD.
  • the device according to the invention also has a device 12 for writing stereo data according to the CD standard.
  • the two devices for writing are shown in FIG. 1 as separate devices. Of course, they can be implemented by the same physical CD writer.
  • the product of the device according to the invention is a CD 14, which provides the completely normal stereo base channels for the stereo information. Spaces on the CD include, as shown at 16a.
  • multi-channel parameter information such as 5.1 parameter information, 7.1 parameter information, etc., is available at locations that are not described by the stereo information, that is to say at a place 16b.
  • this parameter information is preferably BCC parameter data.
  • the parameter data are stored on the audio CD in sectors in synchronism with the normal stereo data in the “sub-channels”, R, S, T, U, V, W available there.
  • a description of the sub-channels and the CD data format can be found in the textbook “Audio-Handbuch der Kunststoffstechnik", Paul Skritek, Franzis-Verlag, 1988, Chapter 17 "Kompakt-Disk-Technik", pages 329-338.
  • these subchannels are designed to provide information about the CD including the table of contents and the current time of the track Save playback device.
  • these channels can also be used to save graphics display with low resolution and to output them on corresponding playback devices.
  • These sub-channels or the sub-codes stored on the sub-channels can also be used to store additional information, such as is required for karaoke CDs.
  • these subchannels are now used to "upgrade" the useful data itself, that is to say the basic stereo information, by storing parametric multi-channel information in the subchannels.
  • the gross data rate that is available is 7 , 36 kbps
  • there is a total of 44.1 kbps data rate available which is a value that is even greater than the amount of data typically required by the BCC parameters, which is required for 5.1 -Multichannel information is only about half of the available bit rate of 44.1 kbps. 10.1 multichannel information would require the entire space in the subchannels.
  • error protection coding is therefore used in order to subject the additional data, which are normally not coded error protection, to an error protection coding before writing into the subchannels, which coding is undone again during playback and in particular serves to Correct reading errors.
  • FIG. 2 shows a playback device according to the invention which, like a normal CD player, initially comprises a device 20 for reading out the stereo channels. Furthermore, in addition to a normal CD player, a device 22 is provided for reading out the multi-channel parameter information, but this is only an additional device if the CD player has not yet been configured for reading out the subchannels, or if the parameter information is located elsewhere stored on the CD, i.e. not on the sub-channels but on one or more separate sessions at the end of the CD or in a data area of a hybrid CD or hybrid partition etc.
  • a device 24 for reconstructing a multichannel output Downstream of the device 22 is a device 24 for reconstructing a multichannel output, which is provided at a multichannel output 26. Furthermore, a CD recognition device or an external manual control 28 or a control 28 adopted by another device is provided in order to actuate a changeover switch 30. If it is recognized that the CD only contains stereo information, the output of the device 20 for reading out the stereo channels is switched directly to a stereo output 32 by the switch 30. However, the CD recognition device 28 recognizes that this is an audio CD with multichannel data, eg. B. acts in the sub-channels, the output of the device 20 for reading out the stereo channels is switched by the switch 30 and fed to the device 24 for reconstruction in such a way that a multi-channel output is generated and no or only an additional stereo output is delivered at output 32.
  • a CD recognition device or an external manual control 28 or a control 28 adopted by another device is provided in order to actuate a changeover switch 30. If it is recognized that the CD only contains stereo information
  • the switch 30 in FIG. 2 can also be replaced by a branch, so that both the normal stereo signal (for example via an analog output of the player or via a first digital output of the player) and the stereo signal are connected in parallel including multi- nal information is output via a digital output normally provided for this purpose on CD players.
  • the expansion box according to the invention is attached to this digital output, which then outputs the reconstructed multi-channel sound with more than two channels on the output side.
  • Such a player is thus able to reproduce a sound with more than two channels, for example a 5th I-surround sound, either stereophonically or when the parametric multi-channel data is decoded.
  • the method according to the invention for writing a compact disk or for playing a contact disk can be implemented in hardware or in software.
  • the implementation can take place on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which can cooperate with a programmable computer system so that the method is carried out.
  • the invention thus also consists in a computer program product with a program code stored on a machine-readable carrier for carrying out a method according to the invention when the computer program product runs on a computer.
  • the invention can thus be implemented as a computer program with a program code for carrying out the method if the computer program runs on a computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Abstract

Eine normale standardgemäße Audio-Kompakt-Disk wird z. B. in den User-Subchannels mit parametrischen Mehrkanal-Informationen (16 b)beschrieben, so daß die CD eine normale Stereo-Wiedergabe mit einem normalen Wiedergabegerät ermöglicht, oder aber eine Multikanalwiedergabe mit einem einfach anschließbaren Zusatzgerät, das sowohl die Stereoinformationen(16 a) als auch die parametrischen Mehrkanal-Informationen (16 b) aus der an sich standardkonformen Audio-CD ausliest und daraus mehr als zwei Audiokanäle rekonstruiert.

Description

Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
Beschreibung
Die vorliegende Erfindung bezieht sich auf die Stereo- Audio-CD-Technik und insbesondere auf Vorrichtungen und Verfahren zum Beschreiben von Audio-CDs sowie entsprechende Verfahren und Vorrichtungen zum Wiedergewinnen von Daten von CDs.
In letzter Zeit wird die Multikanal-Audio- Reproduktionstechnik immer wichtiger. Dies kann auf die Tatsache zurückzuführen sein, daß Audiokompressions- /Codier-Techniken, wie beispielsweise die bekannte MP3- Technik, es möglich gemacht haben, Audiodaten über das Internet oder andere Übertragungskanäle mit einer begrenzten Bandbreite zu übertragen. Die MP3-Codiertechnik ist auf- grund der Tatsache so berühmt geworden, daß sie die Verteilung aller Aufzeichnungen in einem Stereoformat ermöglicht, d. h. in einer digitalen Darstellung der Audioaufzeichnung, die einen ersten oder linken Stereokanal und einen zweiten oder rechten Stereokanal umfaßt.
Alternative Medien zum Verteilen von Stereo-Daten sind die bekannten Audio-CDs. Die aus der Zusammenarbeit von Philips und Sony entwickelte digitale Kompakt-Disk basiert auf einer berührungslosen optischen Abtastung mittels Laser von einer einseitig bespielten Platte als Informationsträger. Im CD-Spieler wird zum Auslesen der von der Platte reflektierte und in seiner Intensität modulierte Strahl eines Halbleiterlasers von einer Photodiode empfangen. Deren Aus- gangssignal wird in ein serielles Datensignal umgewandelt und das Taktsignal daraus gewonnen. Es folgt die Abtrennung der Synchronisationszeichen und die Rückumwandlung des Kanalcodes in Daten, Prüfzeichen und Steuerungs-/Anzeige- Bits. Der Steuerungs-/Anzeige-Decoder liefert die Signale für Motordrehzahl, Fokussierung und Spurnachführung sowie für das Auffinden bestimmter Musikstellen und deren Anzeige. Im Fehlerschutz-Decodierer erfolgt mit Hilfe der Prüfbits eine allfällige Ergänzung gestörter Signalinformatio- nen. Nach der Trennung des Datenstroms mittels des Multi- plexers erfolgt die Digital-/Analog-Rückwandlung in das a- naloge Audiosignal des linken und rechten Kanals.
Gemäß dem standardisierten CD-Rahmenaufbau, den sämtliche Audio-CDs mit Stereoinformationen haben, und auf den übliche CD-Spieler eingestellt sind, sind je sechs aufeinanderfolgende Abtastwerte des linken und des rechten Kanals in einem Rahmen. Die Übertragung beginnt jeweils mit dem linken Kanal. Jeder 16-Bit-Abtastwert beginnt mit dem MSB und wird in zwei Audiosymbole zu je 8 Bit unterteilt. Die Stereodaten sind einer Fehlerschutzcodierung mit einem zweistufigen sogenannten CIRC-Verfahren unterzogen.
Trotzdem existieren grundsätzliche Nachteile herkömmlicher 2-Kanal-Tonsysteme. Daher wurde die sogenannte Surround- Technik entwickelt. Eine empfohlene Multikanal-Surround- Darstellung umfaßt zusätzlich zu den zwei Stereokanälen L und R einen zusätzlichen Mittenkanal C und zwei Surround- Kanäle Ls, Rs. Dieses Referenztonformat wird auch als 3/2- Stereo bezeichnet, was bedeutet, daß drei vordere Kanäle und zwei Surround-Kanäle existieren. Allgemein werden fünf Übertragungskanäle benötigt. In einer Wiedergabeumgebung werden zumindest fünf Lautsprecher an den jeweiligen fünf unterschiedlichen Plätzen benötigt, um einen optimalen sogenannten „Sweet-Spot" in einem bestimmten Abstand von fünf genau plazierten Lautsprechern zu erhalten.
Im Bereich der CD-Technik haben sich die sogenannte DVDs durchgesetzt. Diese enthalten typischerweise eine komplette vollständige 5.1- oder 7.1-AufZeichnung, also eine komplette Darstellung jedes einzelnen Tonkanals.
Nachteilig an DVDs ist jedoch die Tatsache, daß für sie eigene DVD-Spieler benötigt werden, und daß also herkömmliche Audio-CD-Abspielgeräte nicht dazu verwendet werden können, DVDs abzuspielen. Darüber hinaus existiert ferner keine Möglichkeit, solche normalen Audio-CD-Spieler mit einfachen Maßnahmen „upzugraden", so daß sie in der Lage wären, nicht nur Audio-CDs abzuspielen, sondern auch DVDs.
Dies ist insbesondere bedauerlich, da eine große Anzahl von CD-Spielern im Umlauf ist, mit denen keine Multikanal- Wiedergabe erreichbar ist. Andererseits scheuen jedoch viele Kunden davor zurück, den komplett funktionsfähigen CD- Player, mit dem sie vertraut und rundum zufrieden sind, „auszumustern", um nunmehr nur noch auf DVDs umzusteigen, obgleich die Kunden vielleicht an den auf den DVDs typi- scherweise enthaltenen Videoinformationen überhaupt nicht interessiert sind, sondern nur einfach einen guten 5-Kanal- Sound haben wollen.
Auch über das Internet oder von anderen Quellen enthaltene codierte Multikanaldarstellungen könnten zwar auf CDs gebrannt werden, wenn keine Lizenzrechte im Wege stehen. Doch auch solche gebrannten CDs sind nicht mit normalen CD- Playern kompatibel, da sie codierte Informationen enthal- ten, während die auf den Audio-CDs enthaltenen Stereodaten lediglich un-komprimierte 16-Bit-PCM-Daten sind, die lediglich einer Fehlerschutzcodierung unterzogen sind, die zu einer Erhöhung der Datenrate führt, und keiner Datenkomp- rimierung unterzogen sind, die zu einer Reduktion der Datenrate führen würde.
So existieren in der Technik viele Techniken zum Reduzieren der Datenmenge, die zur Übertragung eines Multikanal- Audiosignals benötigt wird. Solche Techniken werden Joint- Stereo-Techniken genannt. Zu diesem Zweck wird auf Fig. 3 verwiesen, die eine Joint-Stereo-Vorrichtung 60 zeigt. Diese Vorrichtung kann eine Vorrichtung sein, die beispielsweise die Intensity-Stereo- (IS-) Technik oder die Binaural Cue Codiertechnik (BCC) implementiert. Ein solches Gerät empfängt üblicherweise als Eingangssignal zumindest zwei Kanäle CH1, CH2, .... CHn, und gibt einen einzigen Trägerkanal sowie parametrische Multikanalinformationen aus. Die parametrischen Daten sind so definiert, daß in einem Deco- dierer eine Approximation eines ürsprungskanals (CH1, CH2, ..., CHn) berechnet werden kann.
Normalerweise wird der Trägerkanal Subband-Abtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte etc. u fas- sen, die eine relativ feine Darstellung des zugrundeliegenden Signals liefern, während die parametrischen Daten keine solchen Abtastwerte oder Spektralkoeffizienten umfassen, sondern Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus, wie beispielsweise Gewichten durch Multiplizieren, durch Zeitverschieben, durch Frequenzverschieben, etc. Die parametrischen Multikanalinformationen umfassen daher eine relativ grobe Darstellung des Signals oder des zugeordneten Kanals. In Zahlen ausgedrückt beträgt die Menge an Daten, die von einem Trägerkanal benötigt wird, eine Menge von etwa 60 bis 70 kBit/s, während die Menge an Daten, die durch parametrische Seiteninformationen für einen Kanal benötigt wird, im Bereich von 1,5 bis 2,5 kBit/s ist. Es sei darauf hingewiesen, daß die vorstehenden Zahlen für komprimierte Daten gelten. Selbstverständlich benötigt ein nicht-komprimierter CD-Kanal Datenraten im Bereich von etwa dem Zehnfachen. Ein Beispiel für parametrische Daten sind die bekannten Skalenfaktoren, Intensity- Stereo-Informationen oder BCC-Parameter, wie es nachfolgend dargelegt wird.
Die Technik der Intensity-Stereo-Codierung ist in dem AES- Preprint 3799, „Intensity Stereo Coding", J. Herre, K.H. Brandenburg, D. Lederer, Februar 1994, Amsterdam beschrieben. Allgemein basiert das Konzept von Intensity Stereo auf einer Hauptachsentransformation, die auf Daten beider stereophoner Audiokanäle durchzuführen ist. Wenn die meisten Datenpunkte um die erste Hauptachse herum konzentriert sind, kann ein Codiergewinn erreicht werden, indem beide Signale um einen bestimmten Winkel gedreht werden, bevor die Codierung stattfindet. Dies ist jedoch nicht immer für reale stereophone Reproduktionstechniken gegeben. Daher wird diese Technik dahingehend modifiziert, daß die zweite orthogonale Komponente von der Übertragung in dem Bitstrom ausgeschlossen wird. Somit bestehen die rekonstruierten Signale für den linken und den rechten Kanal aus unterschiedlich gewichteten oder skalierten Versionen desselben übertragenen Signals. Dennoch unterscheiden sich die rekon- struierten Signale in ihrer Amplitude, sie sind jedoch i- dentisch im Hinblick auf ihre Phaseninformationen. Die E- nergie-Zeit-Hüllkurven beider ursprünglicher Audiokanäle werden jedoch durch die selektive Skalierungsoperation bei- behalten, die typischerweise auf frequenzselektive Art und Weise arbeitet. Dies entspricht der menschlichen Wahrnehmung des Schalls bei hohen Frequenzen, wo die dominanten räumlichen Informationen durch die Energiehüllkurven be- stimmt werden.
Zusätzlich wird bei praktischen Implementierungen das übertragene Signal, d. h. der Trägerkanal aus dem Summensignal des linken Kanals und des rechten Kanals anstatt der Rota- tion beider Komponenten erzeugt. Ferner wird diese Verarbeitung, d. h. das Erzeugen von Intensity-Stereo-Parametern zum Durchführen der Skalierungsoperationen frequenzselektiv durchgeführt, d. h. unabhängig für jedes Skalenfaktorband, d. h. für jede Codiererfrequenzpartition. Vorzugsweise wer- den beide Kanäle kombiniert, um einen kombinierten oder „Träger"-Kanal und zusätzlich zu dem kombinierten Kanal die Intensity-Stereo-Informationen zu bilden. Die Intensity- Stereo-Informationen hängen von der Energie des ersten Kanals, der Energie des zweiten Kanals oder der Energie des kombinierten Kanals ab.
Die BCC-Technik ist in dem AES-Convention-Paper 5574 „Bi- naural Cue Coding applied to stereo and multichannel audio compression", T. Faller, F. Baumgarte, Mai 2002, München, beschrieben. Bei der BCC-Codierung wird eine Anzahl von Audioeingangskanälen in eine Spektraldarstellung umgewandelt, und zwar unter Verwendung einer DFT-basierten Transformation mit überlappenden Fenstern. Das resultierende Spektrum wird in nicht-überlappende Abschnitte eingeteilt, von denen jeder einen Index hat. Jede Partition hat eine Bandbreite proportional zu der äquivalenten Rechteckbandbreite (ERB) . Die Inter-Kanal-Pegelunterschiede (ICLD; ICLD = Inter Channel Level Differences) und die Interkanal-Zeitunterschiede (ICTD; ICTD = Inter Channel Time Differences) werden für jede Partition und für jeden Frame k ermittelt. Die ICLD und ICTD werden quantisiert und codiert, um schließlich als Seiteninformationen in einen BCC-Bitstrom zu kommen. Die Interkanal-Pegelunterschiede und die Interkanal- Zeitunterschiede sind für jeden Kanal relativ zu einem Referenzkanal gegeben. Dann werden die Parameter gemäß vorbestimmter Formeln berechnet, die von den bestimmten Partiti- onen des zu verarbeitenden Signals abhängen.
Auf Decodiererseite empfängt der Decodierer typischerweise ein Monosignal und den BCC-Bitstrom. Das Monosignal wird in den Frequenzbereich transformiert und in einen Raumsyntheseblock (Spatial-Syntheseblock) eingegeben, der auch deco- dierte ICLD- und ICTD-Werte empfängt. In dem Spatial- Syntheseblock werden die BCC-Parameter (ICLD und ICTD) verwendet, um eine Gewichtungsoperation des Monosignals durchzuführen, um die Multikanalsignale zu synthetisieren, die, nach einer Frequenz-/Zeit-Ümwandlung eine Rekonstruktion des ursprünglichen Multikanal-Audiosignals darstellen.
Im Fall von BCC ist das Joint-Stereo-Modul 60 wirksam, um die kanalseitigen Informationen so auszugeben, daß die parametrischen Kanaldaten quantisierte und codierte ICLD- o- der ICTD-Parameter sind, wobei einer der ursprünglichen Kanäle als Referenzkanal zum Codieren der Kanalseiteninformationen verwendet wird.
Normalerweise wird der Trägersignal aus der Summe der teil- nehmenden ürsprungskanäle gebildet.
Natürlich liefern die obigen Techniken nur eine Monodar- stellung für einen Decodierer, der nur den Trägerkanal ver- arbeiten kann, der jedoch nicht in der Lage ist, die parametrischen Daten zur Erzeugung von einer oder mehreren Approximationen von mehr als einem Eingangskanal zu verarbeiten.
Die BCC-Technik ist auch in den US-Patentveröffentlichungen US 2003/0219130 AI, US 2003/0026441 AI und US 2003/0035553 AI beschrieben. Zusätzlich wird auf die Fachveröffentlichung „Binaural Cue Coding. Part II: Schemes and Applica- tions", T. Faller und F. Baumgarte, IEEE Trans. On Audio and Speech Proc. Bd. 11, Nr. 6, November 2003 verwiesen.
Nachfolgend wird ein typisches BCC-Schema zur Multikanalau- diocodierung detaillierter dargestellt, und zwar Bezug neh- mend auf die Fig. 4 bis 6.
Fig. 5 zeigt ein solches BCC-Schema zur Codierung/Übertragung von Multikanalaudiosignalen. Das Multika- nalaudioeingangssignal an einem Eingang 110 eines BCC- Codierers 112 wird in einem sogenannten Downmix-Block 114 heruntergemischt. Bei diesem Beispiel ist das ursprüngliche Multikanalsignal an dem Eingang 110 ein 5-Kanal-Surround- Signal mit einem vorderen linken Kanal, einem vorderen rechten Kanal, einem linken Surround-Kanal, einem rechten Surround-Kanal und einem Mittenkanal. Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung erzeugt der Downmix-Block 114 ein Summensignal durch eine einfache Addition dieser fünf Kanäle in ein Monosignal.
Andere Downmixing-Schemen sind in der Technik bekannt, so daß unter Verwendung eines Multikanal-Eingangssignals ein Downmix-Kanal mit einem einzigen Kanal erhalten wird. Dieser einzige Kanal wird an einer Summensignalleitung 115 ausgegeben. Eine Seiteninformation, die von dem BCC- Analyseblock 116 erhalten wird, wird auf einer Seiteninformationsleitung 117 ausgegeben.
Bei dem BCC-Analyseblock werden Interkanal- Pegelunterschiede (ICLD) und Interkanal-Zeitunterschiede (ICTD) berechnet, wie es vorstehend dargestellt worden ist. Neuerdings ist der BCC-Analyseblock 116 auch in der Lage, Interkanal-Korrelationswerte (ICC-Werte) zu berechnen. Das Summensignal und die Seiteninformationen werden in einem quantisierten und codierten Format zu einem BCC-Decodierer 120 übertragen. Der BCC-Decodierer zerlegt das übertragene Summensignal in eine Anzahl von Subbändern und führt Ska- lierungen, Verzögerungen und andere Verarbeitungsschritte aus, um die Subbänder der auszugebenden Multikanal- Audiokanäle zu liefern. Diese Verarbeitung wird so durchgeführt, daß die ICLD-, ICTD- und ICC-Parameter (Cues) eines rekonstruierten Multikanalsignals am Ausgang 121 mit den entsprechenden Cues für das ursprüngliche Multikanalsignal am Eingang 110 in dem BCC-Codierer 112 übereinstimmen. Zu diesem Zweck umfaßt der BCC-Decodierer 120 einen BCC- Syntheseblock 122 und einen Seiteninformationenüberarbei- tungsblock 123.
Nachfolgend wird der interne Aufbau des BCC-Syntheseblocks 122 Bezug nehmend auf Fig. 6 dargestellt. Das Summensignal auf der Leitung 115 wird in eine Zeit-/Frequenz- Umwandlungseinheit oder Filterbank FB 125 eingespeist. Am Ausgang des Blocks 125 existiert eine Anzahl N von Subband- signalen oder, in einem Extremfall, ein Block von Spektralkoeffizienten, wenn die Audio-Filterbank 125 eine 1:1- Transformation durchführt, d. h. eine Transformation, die N Spektralkoeffizienten aus N Zeitbereichsabtastwerten erzeugt.
Der BCC-Syntheseblock 122 umfaßt ferner eine Verzögerungs- stufe 126, eine Pegelmodifikationsstufe 127, eine Korrelationsverarbeitungsstufe 128 und eine Inversfilterbankstufe IFB 129. Am Ausgang der Stufe 129 kann das rekonstruierte Multikanalaudiosignal mit beispielsweise fünf Kanälen im Falle eines 5-Kanal-Surroundsystems zu einem Satz von Laut- Sprechern 124 ausgegeben werden, wie sie in Fig. 5 oder Fig. 4 dargestellt sind.
Das Eingangssignal sn wird in den Frequenzbereich oder den Filterbankbereich mittels des Elements 125 umgewandelt. Das Signal, das vom Element 125 ausgegeben wird, wird derart kopiert, daß mehrere Versionen desselben Signals erhalten werden, wie es durch den Kopierknoten 130 dargestellt ist. Die Anzahl der Versionen des ursprünglichen Signals ist gleich der Anzahl der Ausgangskanäle in dem Ausgangssignal. Dann wird jede Version des ursprünglichen Signals am Knoten 130 einer bestimmten Verzögerung di, d2, ..., di, ... dN unterzogen. Die Verzögerungsparameter werden durch den Seiteninformationsverarbeitungsblock 123 in Fig. 5 berechnet und von den Interkanal-Zeitunterschieden, wie sie durch den BCC-Analyseblock 116 von Fig. 5 berechnet worden sind, abgeleitet.
Dasselbe gilt für die Multiplikationsparameter ai, a2, ..., ai, ..., aN, die ebenfalls durch den Seiteninformationsver- arbeitungsblock 123 basierend auf den Interkanal- Pegelunterschieden, wie sie durch den BCC-Analyseblock 116 berechnet worden sind, berechnet werden. Die durch den BCC-Analyseblock 116 berechneten ICC- Parameter werden zum Steuern der Funktionalität des Blocks 128 verwendet, so daß bestimmte Korrelationen zwischen den verzögerten und in ihren Pegeln manipulierten Signalen an den Ausgängen des Blocks 128 erhalten werden. Es sei hier darauf hingewiesen, daß die Reihenfolge der Stufen 126, 127, 128 von der in Fig. 6 gezeigten Reihenfolge abweichen kann.
Es sei darauf hingewiesen, daß bei einer rahmenweisen Verarbeitung des Audiosignals auch die BCC-Analyse rahmenweise durchgeführt wird, also zeitlich variabel, und daß ferner eine frequenzweise BCC-Analyse erhalten wird, wie es durch die Filterbank-Aufteilung aus Fig. 6 ersichtlich ist. Dies bedeutet, daß die BCC-Parameter für jedes Spektralband erhalten werden. Dies bedeutet ferner, daß in dem Fall, in dem die Audiofilterbank 125 das Eingangssignal in beispielsweise 32 Bandpaßsignale zerlegt, der BCC-Analyseblock einen Satz von BCC-Parametern für jedes der 32 Bänder er- hält. Natürlich führt der BCC-Syntheseblock 122 von Fig. 5, der detailliert in Fig. 6 dargestellt ist, eine Rekonstruktion durch, die auch auf den beispielhaft genannten 32 Bändern basiert.
Nachfolgend wird Bezug nehmend auf Fig. 4 ein Szenario dargestellt, das dazu verwendet wird, um einzelne BCC- Parameter zu bestimmen. Normalerweise können die ICLD-, ICTD- und ICC-Parameter zwischen Kanalpaaren definiert werden. Es wird jedoch bevorzugt, die ICLD- und ICTD-Parameter zwischen einem Referenzkanal und jedem anderen Kanal zu bestimmen. Dies ist in Fig. 4A dargestellt. ICC-Parameter können auf verschiedene Arten und Weisen definiert werden. Allgemein gesagt kann man ICC-Parameter in dem Codierer zwischen allen möglichen Kanalpaaren bestimmen, wie es in Fig. 4B dargestellt ist. Es wurde jedoch vorgeschlagen, nur ICC-Parameter zwischen den stärksten zwei Kanälen zu einem Zeitpunkt zu berechnen, wie es in Fig. 4C dargestellt ist, wo ein Beispiel gezeigt ist, bei dem zu einem Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 2 berechnet wird, und zu einem anderen Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 5 berechnet wird. Der Decodierer synthetisiert dann die Interkanalkor- relation zwischen den stärksten Kanälen in dem Decoder und verwendet bestimmte heuristische Regeln zum Berechnen und Synthetisieren der Interkanalkohärenz für die restlichen Kanalpaare.
Bezüglich der Berechnung beispielsweise der Multiplikationsparameter ai, aN basierend auf den übertragenen ICLD- Parametern wird auf das AES-Convention-Paper Nr. 5574 Bezug genommen. Die ICLD-Parameter stellen eine Energieverteilung eines ursprünglichen Mehrkanalsignals dar. Ohne Verlust der Allgemeinheit wird es bevorzugt, wie es in Fig. 4A gezeigt, vier ICLD-Parameter zu nehmen, die die Energiedifferenz zwischen den jeweiligen Kanälen und dem vorderen linken Ka- nal darstellen. In dem Seiteninformationsverarbeitungsblock 122 werden die Multiplikationsparameter ai, ... , aN von den ICLD-Parametern so abgeleitet, daß die gesamte Energie aller rekonstruierter Ausgangskanäle dieselbe ist (oder proportional zu der Energie des übertragenen Summensignals ist) .
Um Multikanalinformationen auf CDs zu bringen, kann außer den vorgesehenen DVDs auch auf spezielle Audio-CDs zurück- gegriffen werden, die mit Hilfe von Audiocodierverfahren, wie beispielsweise DTS, die Tonkanäle in datenreduzierter Form speichern. Diese speziellen Audio-CDs lassen sich auf normalen Audio-CD-Spielern nicht wiedergeben, sondern er- fordern einen meistens extern an den digitalen Ausgang des normalen Audio-CD-Spieler anzuschließenden eigenen Decodierer.
Ferner existieren Hybrid-SACDs, die mit Hilfe von zwei Schichten auf der CD sowohl den herkömmlichen Stereoton zur Wiedergabe auf Audio-CD-Spielern (in der einen Schicht) als auch den Mehrkanalton im DSC-Format (in der anderen Schicht) zur Wiedergabe auf SACD-Spielern bieten.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein flexibles und eine potentiell hohe Marktakzeptanz erreichendes Konzept zum Verbreiten und Erzeugen von Multikanal- Audiodaten zu schaffen.
Diese Aufgabe wird durch eine Vorrichtung zum Beschreiben einer Kompakt-Disk gemäß Patentanspruch 1, eine Kompakt- Disk gemäß Patentanspruch 9, eine Vorrichtung zum Abspielen einer Kompakt-Disk nach Patentanspruch 10, ein Verfahren zum Beschreiben einer Kompakt-Disk nach Patentanspruch 12, ein Verfahren zum Abspielen einer Kompakt-Disk nach Patentanspruch 13 oder ein Computer-Programm nach Patentanspruch 14 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß auf einer üblichen Audio-CD gemäß dem normalen CD- Format Subchannels vorgesehen sind, die gemäß dem CD- Standard definiert sind, um Metainformationen, wie Daten und Text bzw. ein Videobild zu übertragen. Erfindungsgemäß werden diese Subchannels dazu genutzt, um Parameterinformationen mit auf die normale Stereo-Audio-CD zu schreiben, so daß eine normale Stereo-Audio-CD genug Informationen für eine Multikanal-Wiedergabe umfaßt.
Ein Vorteil dieses Konzepts besteht darin, daß es mit üblichen CD-Playern kompatibel ist. Übliche CD-Player liefern dann nach wie vor eine Stereo-Klangdarstellung der normalen Audio-CD-Stereodaten, die durch das erfindungsgemäße Kon- zept nicht beeinflußt werden. Ist ein CD-Player jedoch erfindungsgemäß ausgestattet, also durch ein kleines Zusatzmodul, das an dem CD-Player ausgangsseitig die Stereodaten neben den Sub-Channel-Daten, also den Multikanal- Parameterdaten empfängt und unter Verwendung des zugrunde- liegenden Rekonstruktionsalgorithmus die Parameterdaten und die Stereodaten miteinander verrechnet, so wird eine Multi- kanaldarstellung des ursprünglichen Multikanalsignals geliefert.
Damit wird erreicht, daß ein Benutzer seinen normalen CD-
Player, an den er sich gewöhnt hat, und mit dem er zufrieden ist, behalten kann und zum Lesen der Multikanal-Audio- CDs lediglich noch das Zusatzmodul benötigt, das jedoch ohne weiteres an den CD-Player anschließbar ist, da jeder CD- Player einen Stereo-Ausgang hat. Damit muß das Zusatzmodul nicht in den CD-Player eingreifen, sondern kann einfach an dem ohnehin von dem CD-Player vorgesehenen Anschluß angesteckt werden. Vorzugsweise ist dieser Anschluß bzw. Ausgang des CD-Players ein digitaler Ausgang. Hat ein CD- Player jedoch lediglich einen analogen Ausgang, was bei ganz alten Modellen der Fall sein kann, so würde zusätzlich noch ein Analog-/Digital-Wandler in dem Zusatz-Mehrkanal- Modul benötigt werden. Die vorliegende Erfindung ist ferner dahingehend vorteilhaft, dass bei einer rückwärtskompatiblen Aufzeichnung der Mehrkanalinformationen die CD rückwärtskompatibel ist, also genauso auch auf einem Stereo-CD-Player herkömmlicher Natur abgespielt werden kann. Die erfindungsgemäße CD kann also sowohl auf einem normalen CD-Player als auch auf ein Multi- kanal-erweiterten CD-Player abgespielt werden.
Alternativ können die Mehrkanal-Parameterinformationen auch an anderen Stellen der Audio-CD untergebracht werden, die nicht von der Zweikanaldarstellung belegt sind, beispielsweise an einer noch freien Stelle der CD, auf einer Daten- Partition einer Hybrid-CD, an einer getrennten Session am Ende der CD etc.
Bevorzugt wird jedoch, die Parameterdaten bereits auf die Subchannels, die ohnehin bereits vom normalen Audio-CD- Standard vorgesehen sind, zu „verstecken", da dann keiner- lei Eingriffe in CDs vorgesehen sind, und da die CDs trotz der Tatsache, daß sie nun Multikanal-Toninformationen haben, dennoch komplett standardgemäß sind und somit auch keine Probleme in Abspielgeräten verursachen.
Das erfindungsgemäße Konzept ist fern dahingehend vorteilhaft, daß durch Darstellung der Multikanalinformation durch parametrische Multikanal-Daten die Datenmenge ausreichend komprimiert wird, so daß die Kanalkapazität der Subchannels auf der CD ausreichend groß ist. Selbstverständlich wäre es nicht möglich, auf diesen Subchannels Nicht-Parameter- Informationen, wie sie auf der DVD zu finden sind, zu speichern. Ein weiterer Vorteil der vorliegenden Erfindung besteht darin, daß bestehende CD-Beschreibgeräte verwendet werden können, da diese ohnehin schon dafür ausgelegt waren, Daten in die User-Subchannels zu schreiben.
Ferner können bereits bestehende CD-Abspielgeräte verwendet werden, die für das Lesen von Subchannels ausgelegt sind.
Damit kann mit minimalem Aufwand auf Seiten des CD- Herstellers, im Hinblick auf die CD selbst sowie auf Seiten des Benutzers aus einer Stereo-CD eine Multikanal-CD mit zumindest 3 und vorzugsweise 5, 7 oder noch mehr Kanälen gemacht werden. Dies alles wird mit der bewährten Audio-CD- Technik erreicht, die seit Jahren ausgereift, bewährt und akzeptiert ist, was bei neueren Techniken insbesondere aus dem DVD-Bereich zumindest derzeit noch nicht uneingeschränkt gesagt werden kann.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Figuren detailliert erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Schreiben einer Kompakt-Disk;
Fig. 2 ein Blockdiagramm einer erfindungsgemäßen Vorrichtung zum Abspielen einer Kompakt-Disk;
Fig. 3 einen bekannten Joint-Stereo-Codierer zum Erzeu- gen von Kanaldaten und parametrischen Multikanalinformationen; Fig. 4 eine Darstellung eines Schemas zum Bestimmen von ICLD-, ICTD- und ICC-Parametern;
Fig. 5 eine Blockdiagrammdarstellung einer BCC-Codierer- /Decodierer-Kette; und
Fig. 6 ein Blockdiagramm einer Implementierung des BCC- Synthese-Blocks von Fig. 5.
Fig. 1 zeigt eine erfindungsgemäße Vorrichtung zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit einer Einrichtung zum Schreiben von parametrischen Mehrkanalinformationen an einer oder mehreren Stellen der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, vorgesehen sind.
Insbesondere sind die parametrischen Mehrkanalinformationen, die nicht durch die Einrichtung 10 auf die CD ge- schrieben werden, derart ausgebildet, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen. Vorzugsweise sind die parametrischen Mehrkanal-Informationen BCC-Parameter oder Intensity-Stereo-Parameter oder andere parametrische Daten, die im Gegensatz zu den zwei Stereo-Basiskanälen lediglich eine grobe Darstellung eines Kanals des ursprünglichen Multikanal-Audiosignals ist.
Je nach Ausführungsbeispiel ist die CD bereits vor dem Be- schreiben mit den parametrischen Mehrkanal-Informationen mit normalen Stereodaten versehen. Dies wäre dann der Fall, wenn nachträglich die Multikanal-Informationen auf die CD geschrieben werden. Es wird jedoch bevorzugt, in die erfin- dungsgemäße Vorrichtung zum Beschreiben unbeschriebene Audio-CDs einzubringen, derart, daß die erfindungsgemäße Vorrichtung auch eine Einrichtung 12 zum Schreiben von Stereodaten gemäß dem CD-Standard aufweist. Lediglich aus Dar- Stellungsgründen sind die beiden Einrichtungen zum Schreiben in Fig. 1 als getrennte Einrichtungen dargestellt. Selbstverständlich können sie durch dieselbe physische CD- Beschreibvorrichtung implementiert sein.
Das Produkt der erfindungsgemäßen Vorrichtung ist eine CD 14, die die ganz normalen Stereo-Basiskanäle an für die Stereo-Informationen vorgesehenen. Plätzen auf der CD umfaßt, wie es bei 16a dargestellt ist. Im Gegensatz zu einer normalen CD sind jedoch an Plätzen, die durch die Stereoin- formationen nicht beschrieben sind, also an einem Platz 16b, Multikanal-Parameterinformationen, wie beispielsweise 5.1-Parameterinformationen, 7.1-Parameterinformationen etc. vorhanden. Diese Parameterinformationen sind, wie es bereits ausgeführt worden ist, vorzugsweise BCC- Parameterdaten.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden die Parameterdaten synchron zu den normalen Stereodaten auf der Audio-CD sektorweise in den dort verfügbaren „Sub-Channels", R, S, T, U, V, W abgespeichert. Eine Beschreibung der Sub-Channels und des CD-Datenformats findet sich in dem Lehrbuch „Audio-Handbuch der Schaltungstechnik", Paul Skritek, Franzis-Verlag, 1988, Kapitel 17 „Kompakt-Disk-Technik", Seiten 329-338.
Normalerweise sind diese Sub-Channels dazu vorgesehen, Informationen über die CD einschließlich des Inhaltsverzeichnisses und der aktuellen Zeit der Spur für die Angabe des Wiedergabegeräts zu speichern. Alternativ können diese Kanäle auch verwendet werden, um Graphikdarstellung mit niedriger Auflösung zu speichern und auf entsprechenden Wiedergabegeräten auszugeben. Diese Sub-Channels bzw. die auf den Sub-Channels gespeicherten Sub-Codes können auch dazu verwendet werden, Zusatzinformationen zu speichern, wie sie beispielsweise für Karaoke-CDs benötigt werden.
Erfindungsgemäß werden diese Sub-Channels nunmehr jedoch dazu verwendet, die Nutzdaten selbst, also die Stereo- Basisinformationen „aufzuwerten", indem parametrische Mul- tikanal-Informationen in den Sub-Channels gespeichert werden. Datenratenmäßig beträgt die Bruttodatenrate, die zur Verfügung steht, 7,36 kbps. Da sechs User-Datenkanäle vor- handen sind, stehen insgesamt also 44,1 kbps an Datenrate zur Verfügung. Dies ist ein Wert, der sogar größer ist als die von den BCC-Parametern sogar typischerweise benötigte Datenmenge, die für 5.1-Mehrkanalinformationen etwa lediglich gleich der Hälfte der verfügbaren Bitrate von 44,1 kbps ist. Für 10.1-Mehrkanalinformationen würde der gesamte Platz in den Subchannels benötigt werden.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird daher eine Fehlerschutzcodierung verwendet, um die Zusatzdaten, die normalerweise nicht Fehlerschutz- codiert werden, vor dem Schreiben in die Sub-Channels einer Fehlerschutzcodierung zu unterziehen, die beim Abspielen wieder rückgängig gemacht wird und insbesondere dazu dient, Auslesefehler zu korrigieren.
Fig. 2 zeigt ein erfindungsgemäßes Widergabegerät, das zunächst, wie ein normaler CD-Spieler, eine Einrichtung 20 zum Auslesen der Stereokanäle umfaßt. Ferner ist jedoch, zusätzlich zu einem normalen CD-Player eine Einrichtung 22 zum Auslesen der Mehrkanal-Parameterinformationen vorgesehen, die jedoch lediglich eine Zusatzeinrichtung ist, wenn der CD-Player noch nicht zum Auslesen der Sub-Kanäle konfi- guriert ist, oder wenn die Parameterinformationen an anderen Stellen der CD gespeichert werden, also nicht an den Sub-Kanälen sondern an einer oder mehreren getrennten Ses- sions am Ende der CD oder in einem Datenbereich einer Hyb- rid-CD bzw. Hybrid-Partition etc.
Der Einrichtung 22 nachgeschaltet ist eine Einrichtung 24 zum Rekonstruieren einer Multikanalausgabe, die an einem Multikanal-Ausgang 26 bereitgestellt wird. Ferner ist eine CD-Erkennungseinrichtung oder eine externe manuelle oder von einem anderen Gerät übernommene Steuerung 28 vorgesehen, um einen Umschalter 30 zu betätigen. Wird erkannt, daß die CD lediglich Stereo-Informationen umfaßt, so wird der Ausgang der Einrichtung 20 zum Auslesen der Stereokanäle direkt zu einem Stereoausgang 32 durch den Schalter 30 durchgeschaltet. Erkennt die CD-Erkennungseinrichtung 28 jedoch, daß es sich hier um eine Audio-CD mit Multikanalda- ten z. B. in den Sub-Channels handelt, so wird der Ausgang der Einrichtung 20 zum Auslesen der Stereokanäle durch den Schalter 30 umgeschaltet und der Einrichtung 24 zum Rekon- struieren zugeführt, derart, daß eine Multikanalausgabe erzeugt wird, und keine oder lediglich eine zusätzliche Stereoausgabe am Ausgang 32 geliefert wird.
Es sei darauf hingewiesen, dass der Schalter 30 in Fig. 2 auch durch eine Verzweigung ersetzt werden kann, so dass parallel sowohl das normale Stereosignal (z. B. über einen Analogausgang des Players oder über einen ersten Digitalausgang des Players) als auch das Stereosignal samt Mehrka- nalinformationen über einen hierfür vorgesehen bei CD- Playern normalerweise vorhandenen Digitalausgang ausgegeben werden. An diesem Digitalausgang wird das die erfindungsgemäße Erweiterungsbox angebracht, die dann ausgangsseitig den rekonstruierten Mehrkanalton mit mehr als zwei Kanälen ausgibt.
Ein solcher Abspieler ist somit in der Lage, entweder stereophon oder bei Decodierung der parametrischen Multikanal- daten einen Ton mit mehr als zwei Kanälen, also beispielsweise einen 5. I-Surround-Ton wiederzugeben.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Schreiben einer Kompakt-Disk oder zum Abspie- len einer Kontakt-Disk in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm- Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung eines erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims

Patentansprüche
1. Vorrichtung zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit folgenden Merkmalen: einer Einrichtung (10) zum Schreiben von parametri- sehen Mehrkanal-Informationen an einer oder mehreren Stellen (lβb) der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, verwendet werden, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.
2. Vorrichtung nach Anspruch 1, bei der die CD bereits die Basiskanäle aufweist, bevor die parametrischen Mehrkanalinformationen durch die Einrichtung (10) zum Schreiben geschrieben werden.
3. Vorrichtung nach Anspruch 1, bei der die Einrichtung (10) zum Schreiben ferner ausgebildet ist, um ausgehend von einer CD ohne Audioinformationen sowohl die zwei Basiskanäle als auch die parametrischen Mehrkanal-Informationen zu schreiben.
4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Basiskanäle Stereokanäle sind und gemäß dem CD-Standard auf der CD geschrieben sind, so daß eine Wiedergabe der zwei Basiskanäle in Stereo mit ei- nem CD-Wiedergabegerät möglich ist, das gemäß dem CD- Standard ausgebildet ist.
5. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Schreiben (10) einen Codierer zur Fehlerschutzcodierung der parametrischen Mehrkanal-Informationen umfaßt, so daß die Einrichtung zum Schreiben ausgebildet ist, um fehlerschutzcodierte parametrische Mehrkanal-Informationen auf die Kompakt- Disk zu schreiben.
6. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal-Informationen in einen R-, S-, T-, U-, V- oder W-Subchannel gemäß dem CD-Standard zu schreiben.
7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal-Informationen an einen freien Bereich nach einem Ende oder vor einem Anfang einer Datenaufzeichnung, die durch die zwei Basiskanäle eingenommen wird, zu schreiben.
8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die CD eine Hybrid-CD mit einem Datenbereich ist, und bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal- Informationen in den Datenbereich der CD zu schreiben, während die Basiskanäle in einem Audio-CD-Bereich geschrieben sind.
9. Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal- Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal- Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.
10. Vorrichtung zum Abspielen einer Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal-Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen, mit folgenden Merkmalen: einer Einrichtung (20, 22) zum Auslesen der zwei Basiskanäle und zum Auslesen der parametrischen Mehrkanal-Informationen; und einer Einrichtung (24) zum Rekonstruieren einer Mehrkanaldarstellung aufgrund der zwei Basiskanäle und der parametrischen Mehrkanal-Informationen.
11. Verfahren zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit folgendem Schritt: Schreiben (10) von parametrischen Mehrkanal- Informationen an einer oder mehreren Stellen (16b) der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, vorge- sehen sind, wobei die parametrischen Mehrkanal- Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.
12. Verfahren zum Abspielen einer Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal-Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen, mit folgenden Schritten:
Auslesen (20, 22) der zwei Basiskanäle und Auslesen der parametrischen Mehrkanal-Informationen; und
Rekonstruieren (24) einer Mehrkanaldarstellung auf- grund der zwei Basiskanäle und der parametrischen Mehrkanal-Informationen.
13. Computer-Programm mit einem Programmcode zum Durchführen des Verfahrens zum Beschreiben einer Kompakt-Disk gemäß Patentanspruch 11 oder zum Durchführen des Verfahrens zum Abspielen einer Kompakt-Disk gemäß Patentanspruch 12, wenn das Programm auf einem Computer abläuft.
PCT/EP2005/001650 2004-02-27 2005-02-17 Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd WO2005083702A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2005800060514A CN1934640B (zh) 2004-02-27 2005-02-17 用于写入到音频cd的设备和方法以及音频cd
EP05707480A EP1719128A1 (de) 2004-02-27 2005-02-17 Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd
US11/465,742 US8989881B2 (en) 2004-02-27 2006-08-18 Apparatus and method for writing onto an audio CD, and audio CD

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004009628A DE102004009628A1 (de) 2004-02-27 2004-02-27 Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
DE102004009628.7 2004-02-27

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/465,742 Continuation US8989881B2 (en) 2004-02-27 2006-08-18 Apparatus and method for writing onto an audio CD, and audio CD

Publications (1)

Publication Number Publication Date
WO2005083702A1 true WO2005083702A1 (de) 2005-09-09

Family

ID=34894881

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2005/001650 WO2005083702A1 (de) 2004-02-27 2005-02-17 Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd

Country Status (6)

Country Link
US (1) US8989881B2 (de)
EP (1) EP1719128A1 (de)
KR (1) KR100813192B1 (de)
CN (1) CN1934640B (de)
DE (1) DE102004009628A1 (de)
WO (1) WO2005083702A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
EP3067885A1 (de) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verschlüsselung oder entschlüsselung eines mehrkanalsignals
US11212631B2 (en) * 2019-09-16 2021-12-28 Gaudio Lab, Inc. Method for generating binaural signals from stereo signals using upmixing binauralization, and apparatus therefor

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4033993A1 (de) * 1989-10-27 1991-05-02 Pioneer Electronic Corp Aufzeichnungsmedium fuer digitale informationssignale und dafuer geeignete abspielvorrichtung
EP0540329A2 (de) * 1991-10-30 1993-05-05 Salon Televisiotehdas Oy Verfahren zum Aufzeichnen eines mehrkanaligen Audiosignals auf einer Compact Disc
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI89439C (fi) * 1991-10-30 1993-09-27 Salon Televisiotehdas Oy Foerfarande foer att dekoda en audiosignal i vilken annan information aer infoerd med anvaendning av maskningseffekt
US5583308A (en) * 1993-10-14 1996-12-10 Maestromedia, Inc. Musical effects apparatus and tone control process for a musical instrument
JP3118189B2 (ja) * 1996-07-25 2000-12-18 インターナショナル・ビジネス・マシーンズ・コーポレ−ション Cd−rom再生装置及びその制御方法
US6298025B1 (en) * 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
CA2859333A1 (en) * 1999-04-07 2000-10-12 Dolby Laboratories Licensing Corporation Matrix improvements to lossless encoding and decoding
US6591392B1 (en) * 1999-11-24 2003-07-08 Oak Technology, Inc. Compact disc subcode packing and error correction detection
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
WO2002019768A2 (en) * 2000-08-31 2002-03-07 Dolby Laboratories Licensing Corporation Method for apparatus for audio matrix decoding
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP2003303488A (ja) 2002-04-05 2003-10-24 Pioneer Electronic Corp データ処理装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP3971635B2 (ja) * 2002-04-08 2007-09-05 株式会社ソニー・ディスクアンドデジタルソリューションズ データ記録媒体、データ記録方法および装置
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
JP2006065944A (ja) * 2004-08-26 2006-03-09 Funai Electric Co Ltd 光ディスク装置
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4033993A1 (de) * 1989-10-27 1991-05-02 Pioneer Electronic Corp Aufzeichnungsmedium fuer digitale informationssignale und dafuer geeignete abspielvorrichtung
EP0540329A2 (de) * 1991-10-30 1993-05-05 Salon Televisiotehdas Oy Verfahren zum Aufzeichnen eines mehrkanaligen Audiosignals auf einer Compact Disc
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KATE W R TH TEN ET AL: "DIGITAL AUDIO CARRYING EXTRA INFORMATION", SPEECH PROCESSING 2, VLSI, AUDIO AND ELECTROACOUSTICS. ALBUQUERQUE, APR. 3 - 6, 1990, INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH & SIGNAL PROCESSING. ICASSP, NEW YORK, IEEE, US, vol. VOL. 2 CONF. 15, 3 April 1990 (1990-04-03), pages 1097 - 1100, XP000146962 *

Also Published As

Publication number Publication date
US20070121448A1 (en) 2007-05-31
KR100813192B1 (ko) 2008-03-13
EP1719128A1 (de) 2006-11-08
US8989881B2 (en) 2015-03-24
CN1934640B (zh) 2010-08-18
KR20060134973A (ko) 2006-12-28
CN1934640A (zh) 2007-03-21
DE102004009628A1 (de) 2005-10-06

Similar Documents

Publication Publication Date Title
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69214523T3 (de) Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
KR0171100B1 (ko) 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
EP1864279B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung
DE602004002390T2 (de) Audiocodierung
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
EP2005421B1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
DE69827775T2 (de) Tonkanalsmischung
DE60020663T2 (de) Verfahren zur Formatierung eines Audiodatenstroms
CN102171754A (zh) 编码装置以及解码装置
DE4225434A1 (de) Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
DE60024729T2 (de) System und verfahren zum effizienten antialiasing im zeitbereich (tdac)
EP1719128A1 (de) Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd
DE202004003000U1 (de) Vorrichtung zum Beschreiben einer Audio-CD und Audio-CD

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPEN Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 11465742

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1020067016733

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2005707480

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 200580006051.4

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2005707480

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067016733

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 11465742

Country of ref document: US