WO1992017942A1 - Procede de codage de signaux numeriques - Google Patents

Procede de codage de signaux numeriques Download PDF

Info

Publication number
WO1992017942A1
WO1992017942A1 PCT/JP1992/000237 JP9200237W WO9217942A1 WO 1992017942 A1 WO1992017942 A1 WO 1992017942A1 JP 9200237 W JP9200237 W JP 9200237W WO 9217942 A1 WO9217942 A1 WO 9217942A1
Authority
WO
WIPO (PCT)
Prior art keywords
band
critical band
critical
block
bits
Prior art date
Application number
PCT/JP1992/000237
Other languages
English (en)
French (fr)
Inventor
Kenzo Akagiri
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP3091187A external-priority patent/JP3060576B2/ja
Priority claimed from JP3091188A external-priority patent/JP3060577B2/ja
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to DE69225100T priority Critical patent/DE69225100T2/de
Priority to RU92016428/09A priority patent/RU2090973C1/ru
Priority to AU13383/92A priority patent/AU654533B2/en
Priority to BR9204799A priority patent/BR9204799A/pt
Priority to EP92906204A priority patent/EP0531538B1/en
Priority to DK92906204T priority patent/DK0531538T3/da
Publication of WO1992017942A1 publication Critical patent/WO1992017942A1/ja
Priority to NO92924552A priority patent/NO924552L/no
Priority to FI925400A priority patent/FI109627B/fi

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Definitions

  • the present invention relates to a digital signal high-efficiency encoding method or apparatus for encoding an input digital signal.
  • input signals such as audio and audio are divided into signal components of multiple channels on the time axis or frequency axis, and each channel has its own signal.
  • bit allocation There is a coding technique based on bit allocation (bit allocation) that adaptively allocates the number of bits.
  • bit allocation bit allocation
  • the above-mentioned coding technology based on bit allocation of audio signals and the like includes band division coding (sub-band coding) in which an audio signal or the like on the time axis is divided into signal components of a plurality of frequency bands and encoded.
  • So-called adaptive transform coding (ABC) which transforms a signal on the time axis into a signal on the frequency axis (orthogonal transform), divides it into multiple frequency bands, and adaptively codes each band.
  • APC adaptive predictive coding
  • an audio signal on the time axis or the like is time-transformed at predetermined unit time intervals by an orthogonal transform such as a fast Fourier transform (FFT) or DCT. It is converted to an axis (frequency axis) orthogonal to the axis, then divided into a plurality of bands, and the coefficient data of each of these divided bands is encoded by adaptive bit allocation. This encoded data is transmitted.
  • an orthogonal transform such as a fast Fourier transform (FFT) or DCT.
  • the configuration for later decoding includes the coefficient data that has been subjected to the above-described band division and block-blocking processing for each block, and the floating coefficient and the number of allocated bits for each block.
  • the present invention has been proposed in view of the above situation, and has as its object to provide a digital signal encoding method capable of higher bit compression.
  • a digital signal encoding method has been proposed to achieve the above-mentioned object.
  • An input digital signal is orthogonally transformed and divided into critical bands, and the digital signal is set based on the energy of each critical band.
  • the signal component of each critical band is encoded with the number of bits according to the level of the difference between the allowable noise level of each critical band and the energy of each critical band, and the signal component after the orthogonal transformation is encoded.
  • This is a digital signal encoding method for performing block floating processing for each block, performing block floating processing for each block, and transmitting floating coefficients for each block.
  • the present invention When performing the block floating processing in units of small blocks in a band narrower than the critical band, information on the permissible noise level is transmitted instead of the floating coefficient for each critical band, and assigned to each small block. Word length information according to the number of bits Is transmitted. Further, when performing the block floating process in units of large blocks having a band wider than the critical band, the present invention transmits information on the floating coefficient of each large block and allocates the information to each of the critical bands. The information of the code length according to the number of bits to be transmitted is transmitted.
  • the block floating process when the block floating process is performed in small blocks in a band narrower than the critical band, the node length according to the number of bits allocated to one of the small blocks in each critical band is set. It is designed to transmit information.
  • the block floating process when the block floating process is performed in a large block having a band wider than the critical band, the code length information of one of the critical bands in the large block and the allowable noise level of each critical band are used. It is also possible to transmit information about and transmission.
  • information on an allowable noise level may be transmitted by shifting a specified range lower by a predetermined level from a signal level range in the critical band.
  • a so-called masking amount is determined from the energy of each critical band in consideration of human auditory characteristics, and each critical amount is determined using an allowable noise level based on the masking amount. It is desirable to determine the number of bits allocated to the band.
  • DISCLOSURE OF THE INVENTION when the block floating process is performed on a small block in a band narrower than the critical band, a plurality of small blocks exist in one critical band. Without transmitting the floating coefficient for each small block By transmitting the information on the allowable noise level and the word length information for each critical band, the number of bits for the floating coefficient can be reduced.
  • the other small blocks within this critical band can be transmitted. Therefore, the number of bits for transmitting the guide length information can be reduced.
  • FIG. 1A is a diagram for explaining a case where the floating process of the present invention is performed with a block narrower than a critical band.
  • FIG. 1B is a diagram for explaining a case where the floating process of the present invention is performed on a block wider than the critical band.
  • FIG. 2 is a flowchart of the embodiment of the present invention.
  • FIG. 3 is a block circuit diagram showing a specific configuration for setting an allowable noise level.
  • FIG. 4 is a diagram showing a bark spectrum.
  • FIG. 5 is a diagram showing a masking spectrum.
  • Figure 6 is a diagram that combines the minimum audible curve and the masking spectrum.
  • FIG. 7 is a diagram for explaining an allowable noise level transmitted by each block according to the present embodiment.
  • the digital signal encoding method performs a quadrature transform of an input digital signal by, for example, a fast Fourier transform (FFT) or a DCT, and a higher frequency band considering human hearing characteristics.
  • FFT fast Fourier transform
  • DCT digital to analog converter
  • critical bands B B1 to B4 that increase the width, and the allowable noise level NL for each critical band set based on the energy for each critical band and the critical band for each critical band
  • the signal components (coefficient data) of each of the critical bands are encoded with the number of bits corresponding to the level of the difference from the energy of each block, and the signal components after the orthogonal transform are converted into the signal components of each block, so that each block b
  • This is a digital signal encoding method in which block floating processing is performed in advance, and a floating coefficient Fc for each block b is transmitted.
  • step S1 the signal components after the orthogonal transformation are divided into blocks, and block floating processing is performed for each block to determine a floating coefficient (floating level) for each block.
  • step S2 the allowable noise level for each critical band is determined based on the energy for each critical band as described later.
  • step S3 the allowable noise level for each critical band and each critical band are determined.
  • the information on the code length is determined according to the number of allocated bits set based on the level of the difference from each energy. In this embodiment, for example, as shown in FIG.
  • FIG. 1A shows one extracted critical band B on the high band side where the bandwidth of the critical band is wide.
  • FIG. 1B shows the band on the low band side where the bandwidth is narrow.
  • Each band is shown.
  • FIGS. 1A and 1B since the level difference for obtaining the number of allocated bits and the code lengths W1 to W4 correspond to each other, the code lengths W1 to W4 are referred to for convenience. Is shown in the figure.
  • encoding processing of FFT coefficient data by adaptive bit allocation is performed. That is, the encoding process by adaptive bit allocation in the present embodiment obtains a so-called masking amount in consideration of human auditory characteristics as described later on the basis of the energy of each critical band.
  • the number of allocated bits is determined according to the level of the difference between the allowable noise level set based on the amount of noise (that is, the substantially constant allowable noise level for each critical band) and the energy of each critical band.
  • Encoding is performed in accordance with the number of allocated bits for each.
  • each of a plurality of coefficient Blocks are configured, and so-called block floating processing is performed for each block to perform bit compression. Therefore, as shown in the example of FIG.
  • a plurality of the blocks (for example, the four small blocks b1 to b4) exist in the high critical band, that is, the critical band B having a wide bandwidth.
  • the bandwidth is narrow (lower than the critical band) as in the example of Fig. 1B, multiple critical bands (for example, four critical bands B1 to B4) exist in one large block b. I will be.
  • the floating coefficient of the floating process and the word length information according to the above allocated bit number are required. Become. That is, for the configuration for later decoding, usually, the information of the floating coefficient for each block is used.
  • a system configuration for transmitting information of a code length corresponding to the number of allocated bits based on the level difference between the level of the floating coefficient and the allowable noise level of the critical band In other words, at the time of subsequent decoding, the most significant bit (MSB) in the block floating processing is determined from the information of the floating coefficient, and the least significant bit (LSB) is determined from the word length information. Thus, the allowable noise level is determined. Further, the coefficient data (main data) of each block and the magnitude of the signal are determined.
  • the information of the floating coefficient is represented by, for example, 6 bits
  • the information of the above-described code length is represented by, for example, 4 bits.
  • the orthogonal transform is DFOT (discrete Fourier transform)
  • the word length information indicates the magnitude (amplitude) and phase or the real part and the imaginary part by the four bits. Therefore, for example, when one critical band is divided by a plurality of floating blocks, the total number of transmission bits in the critical band according to the number of blocks of the block floating process (that is, the number of divided bands) is , As shown in Table 1.
  • the information of the floating coefficients Fc1 to Fc4 of the small blocks in the critical band B is not transmitted, and the information is transmitted to the critical band B.
  • information of the allowable noise level NL which is set only once, and information of the word lengths W1 to W4 corresponding to the number of allocated bits are transmitted. That is, in the subsequent decoding process, the information of the allowable noise level NL of the critical band B is Is transmitted, based on the information of the permissible noise level NL and the information of the code lengths W 1 to W 4 of the small blocks b 1 to b 4, respectively, for each of the small blocks b 1 to b 4.
  • the permissible noise level NL is determined for each critical band in consideration of human auditory characteristics, as described above.
  • the permissible noise level is substantially constant within one critical band. It is something that can be considered. Therefore, in each of the small blocks bl to b4 in the critical band B in FIG. 1A, the allowable noise level NL can be considered to be the same level.
  • the entire dynamic range is, for example, 120 dB and the floating coefficient is represented by the 6 bits
  • the floating coefficient has an accuracy of about 2 dB
  • the word length information is When represented by the above 4 bits, the code length information has an accuracy of about 6 dB. For this reason, in each of the small blocks b1 to b4 in FIG.
  • the tolerance noise level NL determined from the above has a deviation of about 2 dB steps as shown in FIG.
  • the allowable noise level NL usually falls within a range of about ⁇ 3 dB.
  • the allowable noise level NL is set in two steps: a rough coarse quantization common in the critical band, a fine level of each small block of the floating process in the critical band, and a quantization.
  • the permissible noise level NL expressed by quantization is set as a common value with high accuracy.
  • the allowable noise level NL is a 4-bit 1 og level
  • the allowable noise level NL that cannot be expressed by the 4-bit 10 g is finely expressed by the 2-bit 10 g. Therefore, in this embodiment, it is possible to divide about 6 dB into four parts to achieve 1.5 dB accuracy.
  • the number of bits can be reduced by selecting the high-precision parameter from the floating coefficient and the allowable noise level as shown in Will come. Table 2 shows how the number of bits is reduced in the example of FIG. 1A in comparison with Table 1 above.
  • the quantization of the information of the lengths W1 to W1 is not adaptive but uniform.
  • the block floating process is performed with a large block having a band wider than the critical band.
  • the block floating coefficient for each critical band and the information of the word length obtained for each critical band are required.
  • the block floating process is performed on a large block b having a band wider than the critical band as shown in FIG. 1B, the one large block b is used as information on the floating coefficient.
  • the allowable noise level NL can be obtained from the floating coefficient Fc1 and the word length W1
  • the remaining word length W2 is obtained from the allowable level NL and the floating coefficients Fc2 to Fc4.
  • ⁇ W4 will be able to know. For this reason, it is possible to adopt a high efficiency method that does not transmit the information of the remaining code lengths W2 to W4, and therefore, for the critical band B, the above three code lengths are used. The number of bits for transmitting the information of W2 to W4 can be reduced.
  • Table 3 shows how the number of bits is reduced in the example of FIG. 1B in comparison with Table 1 above.
  • a total of 22 bits, ie, 6 bits for c and 4 X 4 16 bits for code length W, will be transmitted. Therefore, when the number of transmission bits in the example in Table 2 is set to 100% and compared with the example in Table 3, in the example in Table 3, one band is 100% similarly, while 70% for 3 bands, 60% for 3 bands, 55% for 4 bands, etc. The lapse rate is improved. Therefore, it can be understood that the method of this embodiment is very effective.
  • step S4 when the block floating processing is performed in units of small blocks in a band narrower than the critical band, in the step S4, one step according to the number of bits allocated to each small block is performed.
  • step S5 and step S6 instead of the floating coefficient for each critical band, a predetermined level from the signal level range within the critical band is used in step S5 and step S6. (Based on the level based on the information), the information about the permissible noise level that is shifted to the lower side is calculated and transmitted. Specifically
  • the specified range of the allowable noise level is shifted for the following 5 reasons.
  • the allowable noise level is determined based on the masking amount in consideration of the human auditory characteristics, as described later, so that the allowable noise level is always a certain level with respect to the maximum 0 of the actual signal level. It will be low. For example, the permissible noise level may be taken about 26 dB lower than the signal level.
  • the signal level in the critical band is In this case, a quantization table is used which shifts the prescribed range toward the lower level by a predetermined level from the target range. This makes it possible to express the allowable noise level even with a small number of bits. In other words, even with a small number of bits, the allowable noise level can be expressed with the same resolution (accuracy) as when the above shift is not performed. Therefore, it is possible to reduce the number of bits for transmitting an allowable noise level.
  • the difference between the transmission noise level of the small block b1 given the above-mentioned code length W1 and the level closest to the above-mentioned allowable noise level NL is transferred together. . That is, the information indicating the difference from the level closest to the allowable noise level NL indicates which level within the range of approximately ⁇ 3 dB in FIG. 7 or the transmission noise level of each small block comes.
  • the information may be transmitted using, for example, the determination bit information of a 2-bit determination bit.
  • the transmission noise level of the small block b1 is obtained from the information of the floating coefficient Fc1 and the word length W1, and the difference between the transmission noise level and the level closest to the allowable noise level N (represented by the judgment bit) is obtained. Level difference), the level closest to the allowable noise level NL can be obtained.
  • the transmitted noise level of each of the small blocks bl to b4 is closest to the allowable noise level NL and does not deviate beyond the level of the noise level.
  • Table 4 shows how the number of bits is reduced in the example of FIG. 1 in comparison with Table 1 above, which makes it possible to obtain the word lengths W2 to W4. [Table 4]
  • the level that can be taken as the allowable noise level NL is smaller than the dynamic range. That is, since the minimum value of SZN is about 30 dB, the allowable noise level does not come from the peak value of the dynamic range (0 dB) to about 30 dB. Can be set to g.
  • FIG. 3 shows an example of a configuration to which the above-described allowable noise level is obtained, and further based on the allowable noise level, the signal is encoded with the above-mentioned number of allocated bits, to which the encoding method of the present embodiment is applied.
  • the digital audio data on the time axis supplied to the input terminal 1 is transmitted to the orthogonal transformation circuit 11.
  • the audio data on the time axis is converted into data on the frequency axis for each unit time (unit block), and a coefficient composed of a real component value Re and an imaginary component value Im is obtained. Data is obtained.
  • These coefficient data are transmitted to the amplitude / phase information generation circuit 12, and the amplitude / phase information generation circuit 12 obtains amplitude information Am and phase information Ph from the real component value Re and the imaginary component value Im. As a result, only the information of the amplitude information Am is output.
  • the above-mentioned allocated bit number information is obtained using only the amplitude information Am. I have to.
  • the amplitude information Am is first transmitted to the band division circuit 13.
  • the band dividing circuit 13 converts the input digital signal represented by the amplitude information Am into a so-called critical band. It is divided into widths (critical bands).
  • This critical bandwidth takes into account human auditory characteristics (frequency analysis capability). For example, the frequency band of 0 to 22 kHz is divided into 25 bands, and the higher the frequency band, the more the bandwidth is increased. It has been widely selected. That is, human hearing has characteristics like a kind of band pass filter, and the band divided by each filter is called a critical band.
  • the amplitude information Am for each band divided into the critical bands by the band division circuit 13 is transmitted to the sum detection circuit 14, respectively.
  • the energy for each band is the sum of the amplitude information Am in each band (peak or average of amplitude information Am or energy sum).
  • the output of the sum detection circuit 14, that is, the spectrum o of the sum of each band.
  • the bark spectrum SB of each band is as shown in FIG. 4, for example.
  • FIG. 4 which represent the number of bands of the critical bands 1 second band (B> ⁇ B 1 2).
  • the filter circuit 15 includes, for example, a plurality of delay elements for sequentially delaying input data, and a plurality of multipliers for multiplying the output from these delay elements by a filter coefficient (weighting function). 25 multipliers), and a sum adder for summing the outputs of the multipliers. The following multiplication is performed in each multiplier of the filter circuit 15.
  • a multiplier M corresponding to an arbitrary band has a filter coefficient of 1
  • a multiplier M-1 has a filter coefficient of 0.15
  • a multiplier M-2 has a filter coefficient of 0.019
  • M is any integer from 1 to 25.
  • the masking refers to a phenomenon in which a certain signal masks another signal and makes it inaudible due to human auditory characteristics.
  • This masking effect includes a masking effect for an audio signal on a time axis. And a masking effect for signals on the frequency axis. That is, even if noise is applied to the masked portion due to the masking effect, this noise will not be heard. For this reason, in the actual audio signal, the noise in the masked portion is regarded as an acceptable noise.
  • the subtracter 16 obtains a level corresponding to an allowable noise level described later in the convolved area.
  • the level corresponding to the permissible noise level is, as described later, a level at which the permissible noise level of each critical band is obtained by performing inverse convolution processing. It is.
  • the subtractor 16 is supplied with an allowance function (a function expressing a masking level) for obtaining the level H.
  • the level control is performed by increasing or decreasing the allowable function.
  • the permissible function is supplied from a function generating circuit 29 described later.
  • the level corresponding to the allowable noise level can be calculated by the following equation, where i is a number sequentially given from the lower band of the critical bandwidth.
  • n and a are constants, a> 0, and S is the intensity of the convolution processed bark vector, where (n ⁇ ai) is an allowable function.
  • the divider 17 is for decomposing the level ⁇ in the convolved region. Therefore, by performing the inverse composition processing, a masking spectrum can be obtained from the level. That is, this masking spectrum becomes an allowable noise spectrum. Note that the above inverse convolution process requires a complicated operation, but in this embodiment, the inverse convolution is performed using a simplified divider 17.
  • the masking spectrum is transmitted to the subtractor 19 via the combining circuit 18.
  • the output of the sum detection circuit 14, that is, the bark vector SB from the sum detection circuit 14 described above is supplied to the subtracter 19 via the delay circuit 21.
  • the bark spectrum SB is converted to the level of the masking spectrum MS. Below the indicated level will be masked.
  • the output of the subtracter 19 is sent to the ROM 30 via the allowable noise level correction circuit 20.
  • the ROM 30 stores a plurality of pieces of assigned bit number information used for quantization of the amplitude information Am.
  • the output of the subtraction circuit 19 (the energy of each band and the noise level setting means)
  • the number of bits allocated is output according to the level of the difference from the output. Therefore, in the quantization circuit 24, the amplitude information Am is quantized based on the allocated bit number information, and the output is output from the output terminal 2.
  • the delay circuit 21 delays the bark vector SB from the sum detection circuit 14 in consideration of the delay amount of each circuit before the synthesis circuit 18, and the delay circuit 23 It is provided to delay the amplitude information Am in consideration of the delay amount in each circuit before 0.
  • the minimum audible curve generation circuit 22 It is possible to combine the masking spectrum MS with the data indicating the human auditory characteristics as shown in FIG. At this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Further, the minimum audible curve differs depending on, for example, the reproduction volume at the time of reproduction even if the coding is the same. However, in a realistic digital signal system, there is not much difference in the way music enters the 16-bit dynamic range, for example, so that the most audible sound around 4 kHz, If quantization noise is not heard, it is considered that quantization noise below the level of this minimum audible curve is not heard in other frequency bands.
  • the minimum audible curve RC and the masking vector MS are combined together.
  • the allowable noise level in this case can be set to a portion indicated by oblique lines in the drawing.
  • the 4 kHz level of the minimum audible curve is adjusted to the lowest level corresponding to, for example, 20 bits.
  • FIG. 6 also shows the signal spectrum SS.
  • the permissible noise level correction circuit 20 corrects the permissible noise level from the subtracter 19 based on information of a so-called equal loudness curve sent from the correction value determination circuit 28. That is, the correction value determination circuit 28 outputs correction value data for correcting the allowable noise level from the subtractor 19 based on information of a so-called equal loudness curve. The data is transmitted to the allowable noise level correction circuit 20. In this way, the allowable noise level from the subtractor 19 is corrected in consideration of the equal loudness curve.
  • the above equal loudness curve relates to human auditory characteristics.For example, the sound pressure of each frequency that sounds as loud as a pure tone of 1 kHz is obtained and connected by a curve. — 9—
  • the equal loudness curve is substantially the same as the minimum audible curve RC shown in FIG.
  • the sound pressure is 8 to 10 dB below 1 kHz and the same as 1 kHz.
  • the sound cannot be heard at the same level unless it is higher than the sound pressure at 1 kHz by about 15 dB. Therefore, it can be seen that noise exceeding the level of the minimum audible curve (allowable noise level) preferably has a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be understood that the correction of the allowable noise level in consideration of the equal loudness curve is suitable for human auditory characteristics.
  • a configuration in which the above-described minimum audible curve synthesizing process is not performed may be adopted. That is, in this case, the minimum audible curve generating circuit 22 and the synthesizing circuit 18 are not required, and the output from the subtracter 16 is immediately decomposed by the divider 17 and immediately thereafter. It will be transmitted to the subtractor 19.
  • the input digital signal is orthogonally transformed and divided into critical bands, and the signal component of each critical band is adaptively allocated based on the allowable noise level of each critical band.
  • the floating coefficients obtained by block-processing the signal components after the orthogonal transformation are transmitted.
  • Reduces the number of bits for the floating coefficient by transmitting the information on the allowable noise level for each critical band and the code length information of each small block instead of the floating coefficient for each critical band. If the block floating process is performed on a large block with a band wider than the critical band, By the this which is adapted to transmit information relating to floating coefficients every lock, it is possible to reduce the number of transmission bits.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

明 細 書 ディジタル信号符号化方法 技 術 分 野 本発明は、 入力ディジタル信号の符号化を行うディジタル信号の高能率符号化 方法あるいは装置に関するものである。 i o 背 景 技 術 オーディオ. 音声等の信号の高能率符号化においては、 オーディオ, 音声等の 入力信号を時間軸又は周波数軸上の複数のチャンネルの信号成分に分割すると共 に、 各チャンネル毎にビット数を適応的に割当てるビットアロケーション (ビッ ト割当て) による符号化技術がある。 例えば、 オーディオ信号等の上記ビット割 当てによる符号化技術には、 時間軸上のオーディオ信号等を複数の周波数帯域に の信号成分に分割して符号化する帯域分割符号化(サブ ·バンド · コ一ディング : SBC) や、 時間軸の信号を周波数軸上の信号に変換 (直交変換) して複数の 周波数帯域に分割し各帯域毎で適応的に符号化するいわゆる適応変換符号化(A
20 TC)、 或いは、 上記 SB Cといわゆる適応予測符号化 (APC) とを組み合わ せ、 時間軸の信号を帯域分割して各帯域信号をベースバンド (低域) に変換した 後複数次の線形予測分析を行って予測符号化するいわゆる適応ビット割当て (A PC-AB)符号化等の符号化技術がある。
上記高能率符号化においては、 時間軸上のオーディオ信号等を、 所定の単位時 5 間毎に例えば高速フーリエ変換 (FFT)又は DCT等の直交変換によって時間 軸に直交する軸 (周波数軸) に変換し、 その後複数の帯域に分割して、 これら分 割された各帯域の係数データを適応的なビット割り当てによって符号化している 。 この符号化データが伝送される。
ところで、 この各帯域毎の係数データを上記適応ビット割り当てにより符号化 する際には、 例えば、 上記周波数軸上の係数データをブロック化し、 このブロッ ク毎にいわゆるブロックフローティング処理を施すことで、 更にビット圧縮を行 う場合が多い。 このため、 後の復号化のための構成には、 上記帯域分割されると 共に上記プロック毎にプロックフ口一ティング処理された係数データと、 当該各 プロック毎のフローティング係数及び割り当てビット数に応じたヮ一ド長情報か i o らなるサブ情報とが伝送されるシステム構成が採用されることになる。
し力、し、 上記高能率符号化においては、 更に圧縮効率を高めることが望まれて いる。
そこで、 本発明は、 上述のような実情に鑑みて提案されたものであり、 より高 いビット圧縮が可能なディジタル信号符号化方法を提供することを目的とするも 5 のである。
本発明のディジタル信号符号化方法は、 上述の目的を達成するために提案され たものであり、 入力ディジタル信号を直交変換して臨界帯域に分割し、 当該臨界 帯域毎のエネルギに基づいて設定した各臨界帯域毎の許容ノイズレベルと当該各 臨界帯域毎のエネルギとの差分のレベルに応じたビット数で上記各臨界帯域の信 0 号成分を符号化すると共に、 上記直交変換後の信号成分をプロック化してこのブ ロック毎にブロックフローテイング処理を行レ、当該ブロック毎のフローテイング 係数を伝送するディジタル信号符号化方法である。 上記ブロックフローティング 処理を上記臨界帯域よりも狭い帯域の小プロック単位で行う場合には、 上記臨界 帯域毎のフローテイング係数の代わりに許容ノイズレベルに関する情報を伝送す ると共に、 上記小ブロック毎に割り当てられるビット数に応じたワード長の情報 を伝送するようにしたものである。 また、 本発明は、 上記ブロックフローテイン グ処理を上記臨界帯域よりも広い帯域の大ブロック単位で行う場合には、 上記大 ブロック毎のフローティング係数に関する情報を伝送すると共に、 上記臨界帯域 毎に割り当てられるビット数に応じたヮード長の情報を伝送するようにしたもの である。
更に上記プロックフローティング処理を上記臨界帯域よりも狭い帯域の小プロ ックで行う場合には、 各臨界帯域内の小プロックのうち 1つの小プロックについ ての割り当てビット数に応じたヮ一ド長情報を伝送するようにしたものである。 一方、 上記ブロックフローティング処理を上記臨界帯域よりも広い帯域の大ブロ ックで行う場合には、 大ブロック内の臨界帯域のうち 1つの臨界帯域のヮード長 情報と、 各臨界帯域の許容ノイズレベルに関する情報とを伝送することを伝送す ることも可能である。
更に、 上記臨界帯域毎のフローティング係数に関する情報を伝送する代わりに 上記臨界帯域内の信号レベル範囲から所定レベル分だけ低い指定範囲をずらした 許容ノイズレベルに関する情報を伝送するようにしてもよい。
ここで、 上記割当ビット数決定の際には、 例えば、 各臨界帯域毎のエネルギか ら人間の聴覚特性を考慮していわゆるマスキング量を求め、 このマスキング量に 基づく許容ノイズレベルを用いて各臨界帯域の割当ビット数を決定することが望 ましい。 発 明 の 開 示 本発明によれば、 ブロックフローティング処理が臨界帯域よりも狭い帯域の小 プロックについて行われる場合は、 1つの臨界帯域内に複数の小プロックが存在 することになり、 この場合、 各小ブロック毎のフローティング係数を伝送せずに 、 臨界帯域毎の許容ノイズレベルに関する情報及びワード長情報を送るようにす ることで、 フローティング係数のためのビット数を減らすことができる。 また、 臨界帯域よりも広い大ブロックでフローティング処理を行う場合は、 1つの大ブ ロック内に複数の臨界帯域が存在することになり、 この場合、 各臨界帯域毎のフ ローティング係数の情報を送らずに、 大ブロックで 1つのフローティング係数に 関する情報を伝送するようにすることで、 各臨界帯域毎のフローティング係数の 情報を伝送するためのビット数を低減することができる。
又は、 1つの臨界帯域内の全ての小プロックのヮード長の情報を伝送せずに、 1つの小プロックのヮード長情報のみを伝送するようにすることで、 この臨界帯 域内の他の小プロックのヮ一ド長情報を伝送するためのビット数を減らすことが できる。
更に、 許容ノイズレベルの指定範囲を臨界帯域内の信号レベル範囲から所定レ ベル分だけ低い方へずらすことで、 この許容ノイズレベルに関する情報を更に低 減することが可能となる。
】 5
図面の簡単な説明 図 1 Aは、 本発明のフローティング処理を臨界帯域よりも狭いプロックで行う 場合を説明するための図である。
0 図 1 Bは、 本発明のフローティング処理を臨界帯域よりも広いブロックで行う 場合を説明するための図である。
図 2は、 本発明実施例のフローチャートである。
図 3は、 許容ノイズレベル設定のための具体的構成を示すプロック回路図であ る。
5 図 4は、 バークスペクトルを示す図である。 図 5は、 マスキングスペクトルを示す図である。
図 6は、 最小可聴カーブ, マスキングスペクトルを合成した図である。
図 7は、 本実施例の各プロックの伝送される許容ノイズレベルを説明するため の図である。 発明を実施するための最良の形態 以下、 本発明を適用した実施例について図面を参照しながら説明する。
本発明のディジタル信号符号化方法は、 図 1 A、 Bに示すように、 入力ディジ タル信号を例えば高速フーリエ変換 (F F T) 又は D C Tで直交変換して人間の 聴覚特性を考慮した高域ほど帯域幅が広くなるようないわゆる臨界帯域 (クリテ イカルバンド) B ( B 1〜B 4 ) に分割し、 当該臨界帯域毎のエネルギに基づい て設定した各臨界帯域毎の許容ノィズレベル N Lと当該各臨界帯域毎のエネルギ との差分のレベルに応じたビット数で上記各臨界帯域の信号成分 (係数データ) を符号化すると共に、 上記直交変換後の信号成分をプロック毎の信号成分にして このブロック b毎にブロックフローテイング処理を行 、当該ブロック b毎のフ口 一ティング係数 F cを伝送するディジタル信号符号化方法である。
換言すれば、 本実施例では、 図 2のフローチャートに示すような処理を行う。 先ず、 ステップ S 1では上記直交変換後の信号成分をブロック化してこのブロッ ク毎にブロックフローティング処理を行い当該ブロック毎のフローティング係数 (フローティングレベル) を決定する。 ステップ S 2では後述するような臨界帯 域毎のエネルギに基づレ、て設定した各臨界帯域毎の許容ノィズレベルを決定し、 ステップ S 3では上記各臨界帯域毎の許容ノィズレベルと当該各臨界帯域毎のェ ネルギとの差分のレベルに基づいて設定される割り当てビット数に応じたヮード 長の情報を決定するようにしている。 ここで、 本実施例は、 例えば図 1 Aのように、 上記ブロックフローティング処 理を上記臨界帯域 Bよりも狭い帯域の小プロック単位 (小プロック b 1〜b 4 ) で行う場合には、 上記臨界帯域 B毎のフローティング係数の代わりに、 許容ノィ ズレベル NLに関する情報を伝送すると共に、 上記小ブロック b l〜b 4毎に割 り当てられるビット数に応じたヮ一ド長 W 1〜W 4の情報を伝送するようにした ものである。
また、 例えば図 1 Bに示すように、 上記ブロックフローティング処理を臨界帯 域 B 1〜B 4よりも広い帯域の大ブロック単位 (大ブロック b ) で行う場合には 、 当該大ブロック b毎のフローティング係数に関する情報を伝送すると共に、 上 記臨界帯域 B 1〜B 4毎に割り当てられるビット数に応じたワード長 W 1〜W 4 の情報を伝送するようにしたものである。
なお、 図 1 Aの例は、 当該臨界帯域の帯域幅の広い高域側の 1つの臨界帯域 B を抜き出して示したものであり、 図 1 Bの例は、 帯域幅の狭い低域側の各帯域を 示したものである。 また、 図 1 A、 Bには、 上記割り当てビット数を求めるため のレベル差とヮード長 W 1〜W 4とが対応するものであるため、 該ヮ一ド長 W 1 〜W 4を便宜的に図中に示している。
また、 本実施例では前述したように、 適応的なビット割り当てによる F F T係 数データの符号化処理を行うようにしている。 すなわち、 本実施例での適応的な ビット割り当てによる符号化処理は、 各臨界帯域毎のエネルギに基づいて後述す るような人間の聴覚特性を考慮したレ、わゆるマスキング量を求め、 このマスキン グ量に基づいて設定される許容ノイズレベル (すなわち各臨界帯域毎に略一定の 許容ノイズレベル) と各臨界帯域のエネルギとの差分のレベルに応じた割り当て ビット数を求めて、 当該各臨界帯域毎の割り当てビット数に応じて符号化を行う 更に、 本実施例においては上記各臨界帯域内の複数の係数デ一夕の一定数毎に プロックを構成し、 このブロック毎にいわゆるプロックフローテイング処理を施 して、 ビット圧縮を行うようにしている。 したがって、 上記図 1 Aの例のように 、 臨界帯域の高域すなわち帯域幅の広い臨界帯域 B内には複数の上記ブロック ( 例えば 4つの上記小プロック b 1〜b 4 ) が存在するようになり、 また図 1 Bの 例のように帯域幅が狭い (臨界帯域の低域) 場合には、 1つの大ブロック b内に 複数臨界帯域 (例えば 4つの臨界帯域 B 1〜B 4 ) が存在するようになる。
ところで、 通常、 このようにブロックフローティング処理を施すようにすると 、 後の復号化処理の際には、 該フローティング処理のフローティング係数と、 上 記割り当てビット数に応じたワード長の情報とが必要となる。 すなわち、 後の復 号化のための構成に対しては、 通常、 上記ブロック毎のフローティング係数の情
】 o
報及び、 該フローティング係数のレベルと該臨界帯域の許容ノイズレベルとのレ ベル差に基づく割り当てビット数に応じたヮード長の情報を伝送するシステム構 成が必要となる。 換言すれば、 後の復号化の際には、 上記フローティング係数の 情報から、 上記ブロックフローティング処理における最上位ビット (MS B) が 5 決まり、 上記ワード長の情報から最下位ビット (L S B) が決まって上記許容ノ ィズレベルが決定される。 更に各ブロックの係数データ (メインデータ) 力、ら信 号の大きさが決まるようになる。
ここで、 通常、 上記フローティング係数の情報は例えば 6ビットで表され、 上 記ヮード長の情報はそれぞれ例えば 4ビットで表される。 なお、 直交変換が D F 0 T (離散的フーリエ変換) の場合、 上記ワード長情報は、 大きさ (振幅) と位相 若しくは実数部と虚数部を上記 4ビットで表すことになる。 このため、 例えば、 1つの臨界帯域を複数のフローティングブ口ックで分割した場合、 当該プロック フローティング処理のブロック数 (すなわち帯域の分割数) に応じた当該臨界帯 域の全体の伝送ビット数は、 表 1に示すようになる。
5 【表 1】
Figure imgf000010_0001
この表 1において、 臨界帯域を 1つのブロックで表した場合 (1分割) は、 フ ローティング係数に 6ビットで、 ヮ一ド長に 4ビットの合計 1 0ビッ卜が伝送さ れることになる。 また、 臨界帯域を 2つのブロックで表した場合 (2分割) は、 フローティング係数に 6 X 2 (= 1 2ビット) 、 ワード長に 4 X 2 (= 8ビット ) で合計 2 0ビットが伝送されることになる。 以下同様に、 3分割した場合はフ 口一ティング係数に 6 X 3 (= 1 8ビット) でヮード長に 4 X 3 (= 1 2ビット ) の合計 3 0ビット、 また、 4分割(図 1 Aの例) の場合はフローティング係数 に 6 X 4 (= 2 4ビット) でヮ一ド長に 4 X 4 (= 1 6ビット) の合計 4 0ビッ トが伝送される。 上述のように、 1つの臨界帯域内のプロック数が増加するほど 伝送されるビット数も増加することになる。
これに対し、 本発明実施例の上記図 1 Aの例においては、 臨界帯域 B内の上記 各小プロックのフローティング係数 F c 1〜F c 4の情報を伝送せずに、 臨界帯 域 Bに対して 1つのみ設定される上記許容ノイズレベル N Lの情報と上記割り当 てビット数に応じたワード長 W 1〜W 4の情報を伝送するようにしている。 すな わち、 後の復号化処理の際には、 上記臨界帯域 Bの許容ノイズレベル N Lの情報 が伝送されて来れば、 当該許容ノイズレベル N Lの情報と上記各小ブロック b 1 〜b 4のヮード長 W 1〜W 4の情報とに基づいて、 上記各小プロック b 1〜b 4 毎のフローティング係数 F c 1〜F c 4の情報を求めることができる。 このため 、 このフローティング係数 F c l〜F c 4の情報を伝送しないようにしている。 これにより、 上記臨界帯域 Bに対して 4つ必要な上記フローティング係数 F c 1 〜F c 4を伝送するためのビット数が低減できるようになる。
ここで、 上記許容ノイズレベル N Lは、 上述したように、 人間の聴覚特性を考 慮した臨界帯域毎に求められており、 当該臨界帯域では、 1つの臨界帯域内で許 容ノイズレベルが略一定と考えることができるものである。 したがって、 上記図 1 Aの臨界帯域 B内の各小ブロック b l〜b 4においても、 許容ノイズレベル N Lは同レベルであると考えることができる。 ただし、 全体のダイナミックレンジ を例えば 1 2 0 d Bとし、 上記フローティング係数を上記 6ビットで表すと、 該 フローティング係数は約 2 d Bの精度を持つことになり、 また、 上記ワード長情 報を上記 4ビットで表すと、 該ヮード長情報は約 6 d Bの精度となる。 このため 、 上記図 1 Aの各小プロック b 1〜b 4において、 後の復号化の際には、 フロー ティング係数 F c 1〜F c 4と、 上記ヮード長 W 1〜W 4の情報とから決まる許 容ノィズレベル N Lは、 図 7に示すように約 2 d Bステツプのズレを持つように なる。 し力、し、 許容ノイズレベル NLは、 通常、 略 ± 3 d Bの範囲内に収まる。 このようなことから、 本実施例では、 許容ノイズレベル N Lを臨界帯域内で共通 の荒い量子化と、 臨界帯域内のフローティング処理の各小プロックそれぞれの持 つ細かレ、量子化との 2段階量子化で表して当該許容ノイズレベル N Lを精度高く 共通値として設定している。 すなわち、 本実施例では、 許容ノイズレベル N Lが 4ビット 1 o gレベルであるため、 この 4ビット 1 0 gで表しきれなかった許容 ノイズレベル N Lを 2ビット 1 0 gで細かく表すようにしている。 したがって本 実施例では、 約 6 d Bを 4分割して 1 . 5 d B精度とすることが可能となる。 こ のように、 上記許容ノイズレベル N Lが複数の小プロックに渡って略等しいこと を利用して、 上記高精度のパラメータを上記フローティング係数と許容ノイズレ ベルから選択する事でビット数を低減することがてきることになる。 このような 図 1 Aの例におけるビット数低減の様子を上記表 1と比較して表 2に示す。
【表 2】
Figure imgf000012_0001
この表 2において、 臨界帯域 Bを 1つのブロックで表した場合 (1分割) は、 上記許容ノイズレベル N Lに対して 4ビットで、 ヮード長 Wに対して 4ビッ卜で 伝送する。 ただし、 上記許容ノイズレベル N Lにおいては、 上述したように、 2 d B分のズレを補償するための 2ビットを加えて (4 + 2ビット) いる。 このた め、 該 1分割では合計 1 0ビットカ伝送されることになる。 同じく、 臨界帯域 B を 2つの小ブロックで表した場合 (2分割) は、 許容ノイズレベル NLに 4 + 2 X 2 = 8ビット、 ヮ一ド長 Wに 4 X 2 = 8ビットで合計 1 6ビッ卜が伝送される ことになる。 以下同様に、 3分割した場合は許容ノイズレベル N Lに 4 + 2 X 3 二 1 0ビット、 ヮード長 Wに 4 X 3= 1 2ビットの合計 22ビット、 4分割 (図 1 Aの例) の場合は許容ノイズレベル NLに 4 + 2 X 4 = 1 2ビット、 ワード長 Wに 4 X 4 = 1 6ビットの合計 28ビットが伝送されることになる。 このため、 表 1の例の伝送ビット数を 1 00%としてこの表 2の例と比較すると、 表 2の例 の場合、 1分割では同じく 1 00%となるのに対し、 2分割では 80%、 3分割 では 73%、 4分割では 70%のように、 分割数 (ブロック数) が増加する程、 ビット低減率が向上するようになる。 したがって、 本実施例の方法は非常に有効 であることが理解できる。
なお、 ヮ一ド長の W 1〜W の情報の量子化は適応的でなく一様な量子化とさ れている。
また、 上述した図 1 Aのように臨界帯域よりも狭い帯域の小プロックでフロー ティング処理を行う場合に比較して、 例えば、 ブロックフローティング処理を上 記臨界帯域よりも広い帯域の大ブロックで行う場合には、 後の復号化の際にも、 通常は、 各臨界帯域毎のブロックフローティング係数と、 各臨界帯域毎に求めら れる上記ワード長の情報が必要となる。 これに対し、 本実施例においては、 図 1 Bのようにブロックフローテイング処理を臨界帯域よりも広い帯域の大ブロック bで行う場合には、 前記フローティング係数に関する情報として当該 1つの大ブ ロック bのフローティング係数 F cの情報と、 臨界帯域 B 1〜B 4毎に求められ るワード長 W1〜W4の情報とを伝送するようにする。 なお、 各臨界帯域 B l〜 B4の許容ノイズレベル NL 1〜NL4の情報は伝送しない。 すなわち、 各臨界 帯域 B 1〜B 4ではフローティング係数 F cが等しいため、 該 1つのフローティ ング係数 F cの情報と各臨界帯域毎のヮード長 W 1〜W4の情報から、 上記許容 ノイズレベル NL 1〜NL 4を求めることができる。 したがって上記フローティ ング係数 F cの情報と各ヮード長 W 1〜W 4の情報のみをサブ情報として伝送す ることにより、 通常よりもサブ情報のためのビット数を減らすことが可能となる — 1 —
/17942 Αώ PCT/JP92/00237
更に、 上記図 1 Αの例においては、 1つの臨界帯域 B内の上記各ヮ一ド長 W 1 〜W 4の情報のうちで伝送するのをヮ一ド長 W 1の情報のみとし、 他のヮ一ド長 W2〜W4の情報を伝送しないようにすることも可能である。 すなわち、 伝送す るのは、 該臨界帯域 B内の各フローティング係数 Fc l〜Fc 4の情報と、 上記 ワード長 W1の情報とする。 換言すれば、 後の複号化処理の際には、 1つのヮー ド長 W1の情報が伝送されて来れば、 各フローティング係数 Fc l〜Fc 4の情 報に基づいて、 残りのワード長 W2〜W4の情報を求めることができる。 具体的 には、 上記フローティング係数 F c 1とワード長 W1とで許容ノイズレベル NL を求めることができれば、 許容レベル NLと上記フローティング係数 F c 2〜F c 4とから、 上記残りのワード長 W2〜W4を知ることができるようになる。 こ のようなことから、 上記残りのヮード長 W 2〜W 4の情報を伝送しないような高 能率方採を採用することができ、 したがって、 臨界帯域 Bに対して上記 3つのヮ ―ド長 W 2〜W 4の情報の伝送のためのビット数が低減できるようになる。
該図 1 Bの例の場合のビット数低減の様子を上記表 1と比較して表 3に示す。
【表 3】
Figure imgf000015_0001
この表 3において、 1つのブロック b内に統合される臨界帯域の数 (統合数) 用いて説明すると、 1ブロック b内に統合される帯域が 1つの場合 (1帯域) は 、 上記フローティング係数 F cのレベルに対する情報に 6ビット、 ワード長 Wに 4ビットとして合計 1 0ビットを伝送する。 同じく、 臨界帯域数が 2つ (2帯域 ) の場合は、 フローティング係数 F cに 6ビッ ト、 ワード長 Wに 4 X 2 = 8ビッ 卜で合計 1 4ビットが伝送されることになる。 以下同様に、 3帯域とした場合は フローティング係数 F cに 6ビット、 ヮード長 Wに 4 X 3 = 1 2ビットの合計 1 8ビット、 4帯域 (図 1 Bの例) の場合はフローティング係数 F cに 6ビット、 ヮード長 Wに 4 X 4 = 1 6ビッ卜の合計 2 2ビットが伝送されることになる。 こ のため、 表 2の例の伝送ビット数を 1 0 0 %としてこの表 3の例と比較すると、 表 3の例の場合、 1帯域は同じく 1 0 0 %となるのに対し、 2帯域では 7 0 %、 3帯域では 6 0 %、 4帯域では 5 5 %のように、 帯域数が増加する程、 ビット低 減率が向上するようになる。 したがって、 本実施例の方法は非常に有効であるこ とが理解できる。
ここで、 本発明実施例において上記プロックフローティング処理を上記臨界帯 域よりも狭い帯域の小プロック単位で行う場合には、 上記ステップ S 4では上記 小プロック毎に割り当てられるビット数に応じたヮ一ド長の情報を求めて伝送す ると共に、 ステップ S 5及びステップ S 6においては上記臨界帯域毎のフローテ ィング係数の代わりに上記臨界帯域内の信号レベル範囲から所定レベル分 (後述 するマスキング量に基づくレベル分) だけ低い方へ指定範囲をずらすようになさ れた許容ノィズレベルに関する情報を求めて伝送するようにしている。 具体的に
】 o いうと、 上記臨界帯域内の信号レベル範囲から上記所定レベル分だけ低い方に指 定範囲をシフトするような値が格納された量子化テーブルを用い、 この量子化テ —ブルから上記ステップ S 2で求められた許容ノイズレベルに対応する値を出力 して伝送するようにしている。
上述のように、 許容ノイズレベルの指定範囲をシフトさせるのは、 次のような ί 5 理由からである。 先ず、 上記ステップ S 2で求めた許容ノイズレベルに関する情 報をそのまま伝送するようにした場合、 実際の信号の取り得るダイナミックレン ジと同じ指標を当該許容ノイズレベルに対して用いるのはムダが多い。 すなわち 、 許容ノイズレベルというのは、 後述するように、 人間の聴覚特性を考慮したマ スキング量に基づいて求められるものであるため、 上記実際の信号レベルの最大 0 値に対して必ずある一定レベル低いものとなるものである。 例えば、 上記許容ノ ィズレベルは、 上記信号レベルに対して薬 2 6 d B程度低く取られるのもである 。 このように、 上記信号レベルよりも、 必ずある一定レベル低く取られる許容ノ ィズレベルに対して、 当該信号レベルの取りうるダイナミックレンジをそのまま 用いることは、 非常にムダであり、 ビット数低減の観点からも好ましくない。 こ 5 のようなことから、 本実施例では、 上述したように、 上記臨界帯域内の信号レべ ル範囲から所定レベル分だけ低レ、方へ措定範囲をずらすようになされた量子化テ 一ブルを用いるようにしている。 これにより、 少ないビット数でも許容ノイズレ ベルを表現することが可能となる。 換言すれば、 少ないビット数でも上記シフト を行わない場合と同じ分解能 (精度) で許容ノイズレベルを表すことができるよ うになる。 したがって、 許容ノイズレベルの伝送のためのビット数を低減するこ とが可能となる。
ところで後の復号化処理のために、 上記ヮード長 W 1を与えた小ブロック b 1 の伝送ノィズレベルと、 上記許容ノィズレベル N Lに一番近レ、レベルとの差を一 緖に転送するようにする。 すなわち、 上記許容ノイズレベル NLに一番近いレべ ルとの差を示す情報として、 上記図 7の略 ±3 dBの範囲内の何れのレベルか各 小ブロックの伝送ノイズレベルが来るかを示す情報を、 例えば 2ビットの判定ビ ッ卜の判定ビット情報を用いて伝送するようにすることもできる。 例えば、 当該 2ビットのん判定ビット "00" のときに +側にズレている (+ 1) ことを示し 、 "0 1 " のときズレがない (0) ことを示し、 " 1 0" —側にズレている (一 1) のことを示すようにする。 なお、 " 1 1 " は用いないか或いは変わらないこ とを示す。
これにより、 上記フローティング係数 Fc 1とワード長 W1の情報から、 小ブ ロック b 1の伝送ノイズレベルが求められ、 更に、 上記許容ノイズレベル Nしに 一番近いレベルとの差 (判定ビットにより表されるレベル差) を加算して、 上記 許容ノイズレベル NLに一番近いレベルを得ることができる。 この時、 上述した ように、 各小ブロック b l〜b 4の伝送されるノイズレベルは、 上記許容ノイズ レベル N Lに一番近レ、レベルのレベル以上には離れないので、 上記各フ口一ティ ング係数 F c 2〜F c 4力、ら、 各ワード長 W2〜W4を求めることが可能となる 図 1の例におけるビット数低減の様子を上記表 1と比較して表 4に示す。 【表 4】
Figure imgf000018_0001
この表 4において、 臨界帯域 Bを 1つの小ブロックで表した場合 (1分割) は 、 上記フローティング係数を 6ビットで、 ヮード長 Wを 4ビッ卜で伝送する。 た だし、 この場合上記判定ビット (2ビット) は用いない。 このため、 該 1分割で は合計 1 0ビットが伝送されることになる。 同じく、 臨界帯域 Bを 2つの小プロ ック bで表した場合 (2分割) は、 フローティング係数に 6 X 2 = 1 2ビット、 ヮ一ド長 Wに 4ビット、 判定ビットに 2ビッ卜で合計 1 8ビットが伝送されるこ とになる。 以下同様に、 3分割した場合はフローティング係数に 6 X 3 = 1 8ビ ット、 ワード長 Wに 4ビット、 判定ビットに 2ビットの合計 2 4ビット、 4分割 (図 1の例) の場合はフローティング係数に 6 X 4 = 2 4ビット、 ワード長 Wに 4ビット、 判定ビットに 2ビットの合計 3 0ビットが伝送されることになる。 こ のため、 表 1の例に伝送ビット数を 1 0 0 %としてこの表 4の例と比較すると、 表 4の例の場合、 1分割では同じく 1 0 0 %となるのに対し、 2分割では 9 0 % 、 3分割では 8 0 %、 4分割では 7 5 %のように、 分割数 (小ブロック数) が増 加する程、 ビット低減率が向上するようになる。 したがって、 本実施例の方法は 非常に有効であることが理解できる。
なお、 上記各実施例において、 許容ノイズレベル N Lとして取り得るレベルは ダイナミックレンジよりも小さい。 すなわち、 SZNの最小値が約 3 0 d B程度 なのでダイナミックレンジのピーク値 (0 d B ) から約 3 0 d Bの領域には、 許 容ノィズレベルが来ることがなく、 ェンコ一ダではこのように設定することが可 倉 gとなる。
上述した許容ノィズレベルを求め、 更にこの許容ノィズレベルに基づし、た上記 割当ビット数で信号を符号化する本実施例の符号化方法が適用される構成の例を 図 3に示す。
すなわちこの図 3において、 入力端子 1に供給された時間軸上のディジタルォ 一ディォデータが、 直交変換回路 1 1に伝送される。 この直交変換回路 1 1では 、 上記時間軸上のオーディオデータが単位時間毎(単位ブロック) に周波数軸上 のデ一夕に変換され、 実数成分値 R eと虚数成分値 I mとからなる係数データが 得られる。 これら係数データは振幅位相情報発生回路 1 2に伝送され、 当該振幅 位相情報発生回路 1 2では上記実数成分値 R eと虚数成分値 I mとから振幅情報 Amと位相情報 P hとが得られて、 該振幅情報 Amの情報のみが出力されるよう になる。 すなわち、 一般に人間の聴覚は周波数領域の振幅 (パワー) には敏感で あるが、 位相についてはかなり鈍感であるため、 本実施例では上記振幅情報 Am のみを用いて上記割当ビット数情報を得るようにしている。
上記振幅情報 Amは、 先ず帯域分割回路 1 3に伝送される。 該帯域分割回路 1 3では、 上記振幅情報 Amで表現された入力ディジタル信号をいわゆる臨界帯域 幅(クリティカルバンド) に分割している。 この臨界帯域幅とは、 人間の聴覚特 性 (周波数分析能力) を考慮したものであり、 例えば 0〜2 2 k H zの周波数帯 域を 2 5帯域に分け、 高い周波数帯域ほど帯域幅を広く選定しているものである 。 すなわち人間の聴覚は、 一種のバンドパスフィルタのような特性を有していて 、 この各フィル夕によって分けられたバンドを臨界帯域と呼んでいる。
上記帯域分割回路 1 3で臨界帯域に分割された各帯域毎の上記振幅情報 Amは 、 各々上記総和検出回路 1 4に伝送される。 この総和検出回路 1 4では、 各帯域 毎のエネルギ (各帯域でのスぺクトル強度) が、 各帯域内のそれぞれの振幅情報 Amの総和 (振幅情報 Amのピーク又は平均或いはエネルギ総和) をとることに より求められる。 該総和検出回路 1 4の出力すなわち各帯域の総和のスぺクトル o
は、 一般にバークスペクトルと呼ばれ、 この各帯域のバークスペクトル S Bは例 えば図 4に示すようになる。 ただし、 図 4では図示を簡略化するため、 上記クリ ティカルバンドのバンド数を 1 2の帯域 ( B > 〜B 1 2) で表現している。
ここで、 上記バークスぺクトル S Bのいわゆるマスキングに於ける影響を考慮 するため、 該バークスぺクトル S Bに所定の重みづけの関数を畳込む (コンポリ ユーシヨン) 。 このため、 上記総和検出回路 1 4の出力すなわち該バークスぺク トル S Bの各値は、 フィルタ回路 1 5に送られる。 該フィルタ回路 1 5は、 例え ば、 入力データを順次遅延させる複数の遅延素子と、 これら遅延素子からの出力 にフィルタ係数 (重みづけの関数) を乗算する複数の乗算器 (例えば各帯域に対 応する 2 5個の乗算器) と、 各乗算器出力の総和をとる総和加算器とから構成さ れるものである。 このフィルタ回路 1 5の各乗算器において以下のような乗算が 行われる。 例えば、 任意の帯域に対応する乗算器 Mでフィルタ係数 1を、 乗算器 M— 1でフィルタ係数 0 . 1 5を、 乗算器 M— 2でフィルタ係数 0 . 0 0 1 9を 、 乗算器 M— 3でフィルタ係数 0 . 0 0 0 0 0 8 6を、 乗算器 M+ 1でフィル夕 係数 0 . 4を、 乗算器 M+ 2でフィル夕係数 0 . 0 6を、 乗算器 M+ 3でフィル 夕係数 0 . 0 0 7を各遅延素子の出力に乗算することにより、 上記バークスぺク トル S Bの畳込み処理が行われる。 ただし、 Mは 1〜2 5の任意の整数である。 この畳込み処理により、 図 4中点線で示す部分の総和がとられる。 なお、 上記マ スキングとは、 人間の聴覚上の特性により、 ある信号によって他の信号がマスク されて聞こえなくなる現象をいうものであり、 このマスキング効果には、 時間軸 上のオーディオ信号に対するマスキング効果と周波数軸上の信号に対するマスキ ング効果とがある。 すなわち、 該マスキング効果により、 マスキングされる部分 にノイズがあつたとしても、 このノイズは聞こえないことになる。 このため、 実 際のオーディォ信号では、 このマスキングされる部分内のノィズは許容可能なノ ィズとされる。
その後、 上記フィル夕回路 1 5の出力は引算器 1 6に送られる。 該引算器 1 6 は、 上記畳込んだ領域での後述する許容可能なノイズレベルに対応するレベルひ を求めるものである。 なお、 当該許容可能なノイズレベル (許容ノイズレベル) に対応するレベルひは、 後述するように、 逆コンボリューシヨン処理を行うこと によって、 臨界帯域の各帯域毎の許容ノイズレベルとなるようなレベルである。 ここで、 上記引算器 1 6には、 上記レベルひを求めるための許容関数 (マスキン グレベルを表現する関数) が供給される。 この許容関数を増減させることで上記 レベルひの制御を行っている。 当該許容関数は、 後述する関数発生回路 2 9から 供給されているものである。
すなわち、 許容ノイズレベルに対応するレベルひは、 臨界帯域幅の帯域の低域 から順に与えられる番号を iとすると、 次の式で求めることができる。
a = S - ( n - a i
この式において、 n, aは定数で a > 0、 Sは畳込み処理されたバークスぺクト ルの強度であり、 該式中 (n— a i ) が許容関数となる。 本実施例では n = 3 8 , a = lとしており、 この時の音質劣化はなく、 良好な符号化が行えた。 このようにして、 上記レベル が求められ、 このデータは、 割算器 1 7に伝送 される。 当該割算器 1 7では、 上記畳込みされた領域での上記レベル αを逆コン ポリューションするためのものである。 したがって、 この逆コンポリューシヨン 処理を行うことにより、 上記レベルひからマスキングスぺクトルが得られるよう になる。 すなわち、 このマスキングスペクトルが許容ノイズスペクトルとなる。 なお、 上記逆コンボリューシヨン処理は、 複雑な演算を必要とするが、 本実施例 では簡略化した割算器 1 7を用いて逆コンボリューシヨンを行っている。
次に、 上記マスキングスペクトルは、 合成回路 1 8を介して減算器 1 9に伝送 される。 ここで、 当該減算器 1 9には、 上記総和検出回路 1 4の出力すなわち前 述した総和検出回路 1 4からのバークスぺクトル S Bが、 遅延回路 2 1を介して 供給されている。 この減算器 1 9で上記マスキングスペクトルとバークスぺク下 ル S Bとの減算演算が行われることで、 図 5に示すように、 上記バークスぺクト ル S Bは、 該マスキングスぺクトル MSのレベルで示すレベル以下がマスキング されることになる。
当該減算器 1 9の出力は、 上記許容ノイズレベル補正回路 2 0を介して R OM 3 0に送られる。 該 R OM 3 0には、 上記振幅情報 Amの量子化に用いる複数の 割当ビット数情報が格納されており、 上記減算回路 1 9の出力 (上記各帯域のェ ネルギと上記ノイズレベル設定手段の出力との差分のレベル) に応じた割当ビッ ト数情報を出力するようになっている。 したがって、 量子化回路 2 4では、 この 割当ビット数情報に基づいて、 上記振幅情報 Amの量子化処理が行われ、 この出 力が出力端子 2から出力される。 なお、 遅延回路 2 1は上記合成回路 1 8以前の 各回路での遅延量を考慮して上記総和検出回路 1 4からのバークスぺクトル S B を遅延させ、 上記遅延回路 2 3は上記 R OM 3 0以前の各回路での遅延量を考慮 して上記振幅情報 Amを遅延させるために設けられている。
また、 上述した合成回路 1 8での合成の際には、 最小可聴カーブ発生回路 2 2 から供給される図 6に示すような人間の聴覚特性であるレ、わゆる最小可聴力一ブ R Cを示すデータと、 上記マスキングスぺクトル M Sとを合成することができる 。 この最小可聴カーブにおいて、 雑音絶対レベルがこの最小可聴カーブ以下なら ば該雑音は聞こえないことになる。 更に、 該最小可聴カーブは、 コーディングが 同じであっても例えば再生時の再生ボリユームの違いで異なるものとなる。 ただ し、 現実的なディジ夕ルシステムでは、 例えば 1 6ビットダイナミックレンジへ の音楽のはいり方にはさほど違いがないので、 例えば 4 k H z付近の最も耳に聞 こえやすレ、周波数帯域の量子化雑音が聞こえないとすれば、 他の周波数帯域では この最小可聴カーブのレベル以下の量子化雑音は聞こえないと考えられる。 した がって、 このように例えばシステムの持つヮードレングスの 4 k H z付近の雑音 が閬こえない使レ、方をすると仮定し、 この最小可聴カーブ R Cとマスキングスぺ クトル MSとを共に合成することで許容ノイズレベルを得るようにすると、 この 場合の許容ノィズレベルは、 図中斜線で示す部分までとすることができるように なる。 なお、 本実施例では、 上記最小可聴カーブの 4 k H zのレベルを、 例えば 2 0ビット相当の最低レベルに合わせている。 また、 この図 6は、 信号スぺクト ル S Sも同時に示している。
ここで、 上記許容ノイズレベル補正回路 2 0では、 補正値決定回路 2 8から送 られてくるいわゆる等ラウドネス曲線の情報に基づいて、 上記減算器 1 9からの 許容ノイズレベルを補正している。 すなわち、 上記補正値決定回路 2 8からは、 上記減算器 1 9からの許容ノイズレベルを、 いわゆる等ラウドネス曲線の情報に 基づ 、て補正するための補正値デー夕が出力され、 この補正値デー夕が上記許容 ノイズレベル補正回路 2 0に伝送される。 このように、 上記減算器 1 9からの許 容ノイズレベルの等ラウドネス曲線を考慮した補正がなされるようになる。 なお 、 上記等ラウドネス曲線とは、 人間の聴覚特性に関するものであり、 例えば 1 k H zの純音と同じ大きさに聞こえる各周波数での音の音圧を求めて曲線で結んだ — 9—
/17942 L L PCT/JP92/00237
もので、 ラウドネスの等感度曲線とも呼ばれる。 また、 該等ラウドネス曲線は、 図 6に示した最小可聴カーブ R Cと略同じ曲線である。 該等ラウドネス曲線にお いては、 例えば 4 k H z付近では 1 k H zのところより音圧が 8〜1 0 d B下が つても 1 k H zと同じ大きさに聞こえ、 逆に 5 0 k H z付近では 1 k H zでの音 圧よりも約 1 5 d B高くないと同じ大きさに聞こえない。 このため、 上記最小可 聴カーブのレベルを越えた雑音(許容ノイズレベル) は、 該等ラウドネス曲線に 応じたカーブで与えられる周波数特性を持つようにするのが良いことがわかる。 このようなことから、 上記等ラウドネス曲線を考慮して上記許容ノイズレベルを 補正することは、 人間の聴覚特性に適合していることがわかる。
なお、 本実施例においては、 上述した最小可聴カーブの合成処理を行わない構 成とすることもできる。 すなわち、 この場合には、 最小可聴カーブ発生回路 2 2 , 合成回路 1 8が不要となり、 上記引算器 1 6からの出力は、 割算器 1 7で逆コ ンポリューションされた後、 すぐに減算器 1 9に伝送されることになる。
本発明のディジタル信号符号化方法においては、 入力ディジタル信号を直交変 換して臨界帯域に分割し、 各臨界帯域毎の許容ノイズレベルに基づいた適応的な 割り当てビット数で各臨界帯域の信号成分を符号化すると共に、 直交変換後の信 号成分をプロックフ口一ティング処理して得たフローテイング係数を伝送するも のであり、 フローティング処理を臨界帯域よりも狭い帯域の小ブロックで行う場 合には、 各臨界帯域毎のフローティング係数の代わりに、 各臨界帯域毎の許容ノ ィズレベルに関する情報及び各小プロックのヮード長情報を伝送するようにした ことにより、 フローティング係数のためのビット数を減らすことができ、 また、 ブロックフローティング処理を臨界帯域よりも広い帯域の大ブロックで行う場合 には、 大ブロック毎のフローティング係数に関する情報を伝送するようにしたこ とにより、 伝送ビット数を低減することができるようになる。
また、 フローティング処理を臨界帯域よりも狭い帯域の小ブロックで行う場合 には、 各臨界帯域内の小プロックのうち 1つの小プロックのヮード長情報を伝送 することにより、 ワード長情報のためのビット数を減らすことができ、 したがつ て、 より高いビット圧縮が可能となる。
更に、 フローティング処理を臨界帯域よりも狭い帯域の小ブロックで行う場合 には、 小ブロック毎に割り当てられるビット数に応じたワード長の情報を伝送す ると共に、 臨界帯域毎のフローティング係数の代わりに臨界帯域内の信号レベル 範囲から所定レベル分だけ低い方へ指定範囲をずらした許容ノイズレベルに関す る情報を伝送するようにしたことで、 許容ノィズレベルに関する情報伝送のため のビット数を減らすことができ、 したがって、 より高いビット圧縮が可能となる o

Claims

請 求 の 範 囲 . 入力ディジ夕ル信号を直交変換して臨界帯域に分割し、 当該臨界帯域毎の 信号の大きさに基づいて設定した各臨界帯域毎の許容ノイズレベルと当該各臨 界帯域毎の信号の大きさとの差分のレベルに応じたビット数で上記各臨界帯域 の信号成分を符号化すると共に、 上記直交変換後の信号成分をプロック化して このブロック毎にブロックフローテイング処理を行レ、当該プロック毎のフロー ティング係数を伝送するディジタル信号符号化方法であって、
上記ブロックフローティング処理を上記臨界帯域よりも狭い帯域の小ブロッ ク単位で行う場合には、 上記臨界帯域毎のフローティング係数の代わりに許容 ノイズレベルに関する情報を伝送すると共に、 上記小ブロック毎に割り当てら れるビット数に応じたヮ一ド長の情報を伝送することを特徴とするディジタル 信号符号化方法。
. 入力ディジ夕ル信号を直交変換して臨界帯域に分割し、 当該臨界帯域毎の 信号の大きさに基づいて設定した各臨界帯域毎の許容ノイズレベルと当該各臨 界帯域毎の信号の大きさとの差分のレベルに応じたビット数で上記各臨界帯域 の信号成分を符号化すると共に、 上記直交変換後の信号成分をプロック化して このプロック毎にプロックフ口一ティング処理を行い当該ブロック毎のフロー ティング係数を伝送するディジタル信号符号化方法であって、
上記プロックフ口一ティング処理を上記臨界帯域よりも広い帯域の大ブロッ ク単位で行う場合には、 上記大ブロック毎のフローティング係数に関する情報 を伝送すると共に、 上記臨界帯域毎に割り当てられるビット数に応じたワード 長の情報を伝送することを特徵とするディジタル信号符号化方法。
. 入力ディジ夕ル信号を直交変換して臨界帯域に分割し、 当該臨界帯域毎の 信号の大きさに基づいて設定した各臨界帯域毎の許容ノイズレベルと当該各臨 界帯域毎の信号の大きさとの差分のレベルに応じたビット数で上記各臨界帯域 の信号成分を符号化すると共に、 上記直交変換後の信号成分をプロック化して このブロック毎にプロックフローティング処理を行い当該ブロック毎のフロー ティング係数を伝送するディジタル信号符号化方法であって、
上記プロックフローテイング処理を上記臨界帯域よりも狭い帯域の小プロッ ク単位で行う場合には、 各記臨界帯域内の小プロックのうち 1つの小プロック についての割り当てビット数に応じたヮ一ド長情報を伝送することを特徴とす るディジタル信号符号化方法。
4 . 入力ディジタル信号を直交変換して臨界帯域に分割し、 当該臨界帯域毎の
I 0 信号の大きさに基づレ、て設定した各臨界帯域毎の許容ノイズレベルと当該各臨 界帯域毎の信号の大きさとの差分のレベルに応じたビット数で上記各臨界帯域 の信号成分を符号化すると共に、 上記直交変換後の信号成分をプロック化して このブロック毎にプロックフローティング処理を行い当該ブロック毎のフロー ティング係数を伝送するディジタル信号符号化方法であって、
1 5 上記プロックフローティング処理を上記臨界帯域よりも狭い帯域の小プロッ ク単位で行う場合には、 上記小ブロック毎に割り当てられるビット数に応じた ワード長の情報を伝達すると共に、 上記臨界帯域のフローティング係数の代わ りに上記臨界帯域内の信号レベル範囲から所定レベル分だけ低レ、方へ指定範囲 をずらした許容ノイズレベルに関する情報を伝送することを特徴とするディジ 0 夕ル信号符号化方法。
5 . 上記直交変換は D C Tであることを特徵とする、 上記請求項 1乃至 4記載 のディジタル信号符号化方法。
6 . 上記臨界帯域は、 0〜2 2 k H zを 2 5の帯域に分割してあり、 高い周波 数帯域程、 帯域幅を広く選定してあることを特徴とする、 上記請求項 1乃至 4 5 記載のディジ夕ル信号符号化方法。
7 . 上記臨界帯域毎の信号の大きさは、 各帯域毎でのスペクトル強度の振幅情 報の総和であることを特徴とする、 上記請求項 1乃至 4記載のディジタル信号 符号化方法。
8 . 上記振幅情報の総和は、 更に所定の重み付けの関数が畳み込まれ、 聴覚の マスキング効果が加味されていることを特徵とする、 上記請求項 7記載のディ ジタル信号符号化方法。
o
PCT/JP1992/000237 1991-03-29 1992-02-28 Procede de codage de signaux numeriques WO1992017942A1 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
DE69225100T DE69225100T2 (de) 1991-03-29 1992-02-28 Reduzierung der Zusaztinformation bei Teilbandkodierungsverfahren
RU92016428/09A RU2090973C1 (ru) 1991-03-29 1992-02-28 Способ кодирования сигналов
AU13383/92A AU654533B2 (en) 1991-03-29 1992-02-28 Method of encoding digital signals
BR9204799A BR9204799A (pt) 1991-03-29 1992-02-28 Processo de codificacao para um sinal digital
EP92906204A EP0531538B1 (en) 1991-03-29 1992-02-28 Reduction of the size of side-information for Subband coding
DK92906204T DK0531538T3 (da) 1991-03-29 1992-02-28 Fremgangsmåde til indkodning af digitale signaler
NO92924552A NO924552L (no) 1991-03-29 1992-11-25 Fremgangsmaate og anordning for koding av digitalt audiosignal
FI925400A FI109627B (fi) 1991-03-29 1992-11-27 Menetelmä digitaalisten signaalien koodausta varten

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP3091187A JP3060576B2 (ja) 1991-03-29 1991-03-29 ディジタル信号符号化方法
JP3/91187 1991-03-29
JP3/91188 1991-03-29
JP3091188A JP3060577B2 (ja) 1991-03-29 1991-03-29 ディジタル信号符号化方法

Publications (1)

Publication Number Publication Date
WO1992017942A1 true WO1992017942A1 (fr) 1992-10-15

Family

ID=26432649

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1992/000237 WO1992017942A1 (fr) 1991-03-29 1992-02-28 Procede de codage de signaux numeriques

Country Status (17)

Country Link
US (1) US5311561A (ja)
EP (1) EP0531538B1 (ja)
KR (1) KR100312664B1 (ja)
CN (1) CN1032102C (ja)
AT (1) ATE165198T1 (ja)
AU (1) AU654533B2 (ja)
BR (1) BR9204799A (ja)
CA (1) CA2083709A1 (ja)
CS (1) CS92692A3 (ja)
DE (1) DE69225100T2 (ja)
DK (1) DK0531538T3 (ja)
FI (1) FI109627B (ja)
HU (1) HU213592B (ja)
NO (1) NO924552L (ja)
PL (1) PL168474B1 (ja)
RU (1) RU2090973C1 (ja)
WO (1) WO1992017942A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0615349A2 (en) * 1993-03-09 1994-09-14 Sony Corporation Methods and apparatus for recording, reproducing, transmitting and/or receiving compressed data and recording medium therefor

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
DE69231369T2 (de) * 1991-09-30 2001-03-29 Sony Corp Verfahren und Einrichtung zur Audiodatenkompression
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3278900B2 (ja) * 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
EP0653846B1 (en) * 1993-05-31 2001-12-19 Sony Corporation Apparatus and method for coding or decoding signals, and recording medium
JP3721582B2 (ja) * 1993-06-30 2005-11-30 ソニー株式会社 信号符号化装置及び方法並びに信号復号化装置及び方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
WO1995010886A1 (fr) * 1993-10-08 1995-04-20 Sony Corporation Processeur de signaux numeriques, procede de traitement de signaux numeriques et support d'enregistrement de donnees
AU689506B2 (en) * 1993-11-04 1998-04-02 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
CN1111959C (zh) * 1993-11-09 2003-06-18 索尼公司 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JPH07261797A (ja) * 1994-03-18 1995-10-13 Mitsubishi Electric Corp 信号符号化装置及び信号復号化装置
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
EP0713295B1 (en) * 1994-04-01 2004-09-15 Sony Corporation Method and device for encoding information, method and device for decoding information
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
EP0775389B1 (en) * 1994-05-02 2002-12-18 Koninklijke Philips Electronics N.V. Encoding system and encoding method for encoding a digital signal having at least a first and a second digital signal component
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
TW295747B (ja) * 1994-06-13 1997-01-11 Sony Co Ltd
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
US5940437A (en) * 1995-01-03 1999-08-17 Intel Corporation System and method for reducing the peak load on the processor of a block processing modem
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5734677A (en) * 1995-03-15 1998-03-31 The Chinese University Of Hong Kong Method for compression of loss-tolerant video image data from multiple sources
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3580444B2 (ja) * 1995-06-14 2004-10-20 ソニー株式会社 信号伝送方法および装置、並びに信号再生方法
JP3082625B2 (ja) * 1995-07-15 2000-08-28 日本電気株式会社 音声信号処理回路
JPH0969781A (ja) * 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
EP0764939B1 (en) * 1995-09-19 2002-05-02 AT&T Corp. Synthesis of speech signals in the absence of coded parameters
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6026348A (en) * 1997-10-14 2000-02-15 Bently Nevada Corporation Apparatus and method for compressing measurement data correlative to machine status
US6507804B1 (en) 1997-10-14 2003-01-14 Bently Nevada Corporation Apparatus and method for compressing measurement data corelative to machine status
EP0966109B1 (en) * 1998-06-15 2005-04-27 Matsushita Electric Industrial Co., Ltd. Audio coding method and audio coding apparatus
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US20020009000A1 (en) * 2000-01-18 2002-01-24 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
PL1706866T3 (pl) * 2004-01-20 2008-10-31 Dolby Laboratories Licensing Corp Kodowanie dźwięku w oparciu o grupowanie bloków
JP4979694B2 (ja) 2005-06-14 2012-07-18 バーゼル・ポリオレフィン・ゲーエムベーハー 向上した特性を有する多層プラスチック耐食コーティング
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
GB201004667D0 (en) 2010-03-22 2010-05-05 Optimized Systems And Solution Method and apparatus for compression and de-compression of spectral data
RU2517356C2 (ru) * 2012-09-10 2014-05-27 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Мордовский государственный университет им. Н.П. Огарёва" Способ снижения нелинейных искажений тока в нелинейной комплексной нагрузке и устройство для его осуществления
CN104703093B (zh) * 2013-12-09 2018-07-17 中国移动通信集团公司 一种音频输出方法及装置
CN112019220B (zh) * 2020-08-21 2023-07-04 广东省新一代通信与网络创新研究院 一种基于差值偏置检测的块浮点数据压缩方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60237738A (ja) * 1984-05-11 1985-11-26 Sony Corp デイジタル信号伝送装置
JPH0360529A (ja) * 1989-07-29 1991-03-15 Sony Corp 量子化装置及び量子化方法
JPH03117921A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化方法
JPH03121624A (ja) * 1989-10-05 1991-05-23 Sony Corp 信号符号化装置
JPH03132218A (ja) * 1989-10-18 1991-06-05 Sony Corp ディジタルデータの高能率符号化装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0064119B1 (fr) * 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60237738A (ja) * 1984-05-11 1985-11-26 Sony Corp デイジタル信号伝送装置
JPH0360529A (ja) * 1989-07-29 1991-03-15 Sony Corp 量子化装置及び量子化方法
JPH03117921A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化方法
JPH03121624A (ja) * 1989-10-05 1991-05-23 Sony Corp 信号符号化装置
JPH03132218A (ja) * 1989-10-18 1991-06-05 Sony Corp ディジタルデータの高能率符号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0615349A2 (en) * 1993-03-09 1994-09-14 Sony Corporation Methods and apparatus for recording, reproducing, transmitting and/or receiving compressed data and recording medium therefor
EP0615349A3 (en) * 1993-03-09 1998-06-03 Sony Corporation Methods and apparatus for recording, reproducing, transmitting and/or receiving compressed data and recording medium therefor

Also Published As

Publication number Publication date
EP0531538B1 (en) 1998-04-15
HU213592B (en) 1997-08-28
KR100312664B1 (ko) 2002-12-26
FI925400A (fi) 1992-11-27
BR9204799A (pt) 1993-07-13
NO924552D0 (no) 1992-11-25
FI925400A0 (fi) 1992-11-27
US5311561A (en) 1994-05-10
PL168474B1 (pl) 1996-02-29
CN1065565A (zh) 1992-10-21
ATE165198T1 (de) 1998-05-15
HUT63278A (en) 1993-07-28
DK0531538T3 (da) 1998-10-19
CS92692A3 (en) 1992-10-14
CA2083709A1 (en) 1992-09-30
AU654533B2 (en) 1994-11-10
EP0531538A4 (en) 1994-09-21
EP0531538A1 (en) 1993-03-17
RU2090973C1 (ru) 1997-09-20
HU9203759D0 (en) 1993-04-28
CN1032102C (zh) 1996-06-19
DE69225100D1 (de) 1998-05-20
FI109627B (fi) 2002-09-13
PL294003A2 (en) 1992-11-30
AU1338392A (en) 1992-11-02
DE69225100T2 (de) 1998-08-06
NO924552L (no) 1993-01-22

Similar Documents

Publication Publication Date Title
WO1992017942A1 (fr) Procede de codage de signaux numeriques
US5490170A (en) Coding apparatus for digital signal
JP3134338B2 (ja) ディジタル音声信号符号化方法
US5264846A (en) Coding apparatus for digital signal
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
US5157760A (en) Digital signal encoding with quantizing based on masking from multiple frequency bands
JPH03117919A (ja) ディジタル信号符号化装置
JPH0435123A (ja) ディジタル信号符号化装置
JP3041967B2 (ja) ディジタル信号符号化装置
JP3336619B2 (ja) 信号処理装置
JP3060578B2 (ja) ディジタル信号符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JP3060576B2 (ja) ディジタル信号符号化方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP2913695B2 (ja) ディジタル信号符号化方法
JP3134335B2 (ja) ディジタル信号符号化方法及びディジタル信号復号化装置
JP3033157B2 (ja) ディジタル信号符号化装置
JP2913696B2 (ja) ディジタル信号符号化方法
JP3132031B2 (ja) ディジタル信号の高能率符号化方法
JPH04302538A (ja) ディジタル信号符号化方法
JPH03117922A (ja) デイジタル信号符号化方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU BR CA FI HU KR NO RU

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK FR GB IT LU NL SE

WWE Wipo information: entry into national phase

Ref document number: 1992906204

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2083709

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 925400

Country of ref document: FI

WWP Wipo information: published in national office

Ref document number: 1992906204

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 1992906204

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 925400

Country of ref document: FI