JP2000267699A - Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device - Google Patents

Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device

Info

Publication number
JP2000267699A
JP2000267699A JP11075557A JP7555799A JP2000267699A JP 2000267699 A JP2000267699 A JP 2000267699A JP 11075557 A JP11075557 A JP 11075557A JP 7555799 A JP7555799 A JP 7555799A JP 2000267699 A JP2000267699 A JP 2000267699A
Authority
JP
Japan
Prior art keywords
encoding
audio signal
sound
frame
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11075557A
Other languages
Japanese (ja)
Inventor
Kenichi Minami
憲一 南
Akito Akutsu
明人 阿久津
Yoshinobu Tonomura
佳伸 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11075557A priority Critical patent/JP2000267699A/en
Publication of JP2000267699A publication Critical patent/JP2000267699A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To make performable a high-quality and high efficiency coding in accordance with the kind of an acoustic signal. SOLUTION: An input acoustic signal is classified into the acoustic of a music, a voice or the like by analyzing the frequency of it by an acoustic classifying part 102, and a selecting part 103 selects a proper coding method in accordance with this classification and also generates classification information indicating the selection. When the classification is a music, the acoustic signal is coded by the coding part 1041 with coding methods of a TwinVQ (frequency area weighted interleave quantization) and MPEG1, 2 or the like and when the classification is a voice, the signal is coded by a coding part 1042 with the coding method of a PSI-CELP (pitch synchronous stimulated source code driving linear predictive coding) and a CS-CELP or the like. These coded acoustic signals and classification information are collectively filed for every frame, otherwise classification information is collectively field in proper unit as coded data.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は音声や音楽などの
音響信号をフレームに分割し、フレームごとあるいは連
続する複数のフレームごとに符号化方法を選択して符号
化する可変ビットレート符号化方法および装置およびそ
のプログラムを記録した記録媒体、復号装置に関するも
のであり、音響信号の蓄積や伝送に適用される。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a variable bit rate encoding method for dividing an audio signal such as voice or music into frames and selecting and encoding an encoding method for each frame or for a plurality of continuous frames. The present invention relates to a device, a recording medium on which the program is recorded, and a decoding device, and is applied to storage and transmission of an audio signal.

【0002】[0002]

【従来の技術】通信やマルチメディアの分野において、
音声や音楽等の音響信号を蓄積したり伝送する際には、
記録媒体や伝送路の効率的な利用を実現するために音声
あるいは音楽の高能率な符号化方法が利用されている。
例えば、音声の符号化に関しては、ピッチ同期励振源符
号駆動線形予測符号化(PSI−CELP:Pitch Sync
hronous Innovation Code Excited Linear Predictive
Coding)方法があり、自動車・携帯電話で日本の標準方
式として用いられている。この符号化方式の詳細は「自
動車電話用ハーフレート音声コーデックの検討」(間
野、他:信学技報、SP−92−133、1993)に
記載されている。この方式は、音声信号を一定の長さの
フレームに分割し、各フレームに一定のビットレートを
割り当てる固定ビットレート符号化方式を用いている
が、フレームごとあるいは同じ特徴を持つ複数のフレー
ムごとにビットレートを選択して符号化を行う可変ビッ
トレート符号化方式も提案されている。可変ビットレー
トPSI−CELP音声符号化はその一例であり、詳細
は「PSI−CELP音声符号化の可変ビットレート化
に関する検討」(大室、他:信学技報、SP−93−1
39、1994−02)に記載されている。
2. Description of the Related Art In the field of communication and multimedia,
When storing or transmitting audio signals such as voice or music,
2. Description of the Related Art In order to realize efficient use of a recording medium and a transmission path, a highly efficient encoding method of voice or music is used.
For example, regarding speech encoding, pitch synchronous excitation source code driven linear prediction encoding (PSI-CELP: Pitch Sync
hronous Innovation Code Excited Linear Predictive
Coding) method, which is used as a standard system in Japan for automobiles and mobile phones. The details of this encoding method are described in "Study of Half-rate Voice Codec for Mobile Phone" (Mano et al., IEICE Technical Report, SP-92-133, 1993). This method divides the audio signal into frames of a fixed length, and uses a fixed bit rate coding method in which a fixed bit rate is assigned to each frame, but for each frame or a plurality of frames having the same characteristics. A variable bit rate encoding system that performs encoding by selecting a bit rate has also been proposed. Variable bit rate PSI-CELP speech coding is one example, and details are described in "Study on Variable Bit Rate PSI-CELP Speech Coding" (Omuro, et al .: IEICE Technical Report, SP-93-1).
39, 1994-02).

【0003】一方、音楽の符号化に関しては、周波数領
域重み付けインタリーブベクトル量子化(TwinVQ:Tr
ansform-domain Weighted Interleave Vector Quantiza
tion)方式があり、広帯域の音響信号を低ビットレート
で符号化することが可能である。TwinVQは、スケーラ
ブル符号化用の量子化としてISO標準符号化規格であ
るMPEGに採用されている。この符号化方式の詳細は
「周波数領域重み付けインタリーブベクトル量子化(Tw
inVQ)による楽音符号化」(岩上、他:信学論A、Vo
l.80、No. 5、pp. 830−837)に記載されてい
る。
On the other hand, regarding music encoding, frequency domain weighted interleaved vector quantization (TwinVQ: Tr
ansform-domain Weighted Interleave Vector Quantiza
) method, and it is possible to encode a wideband audio signal at a low bit rate. TwinVQ is employed in MPEG, which is an ISO standard coding standard, as quantization for scalable coding. For details of this encoding method, refer to “Frequency-domain weighted interleave vector quantization (Tw
inVQ), (Iwagami, et al .: IEICE A, Vo
l.80, No. 5, pp. 830-837).

【0004】ところで、音響信号の符号化に用いられる
ビットレートは、2kbps〜64kbpsと幅広い範囲に渡っ
ているため、ビットレートに応じて適当な符号化方式が
用いられるが、一般に音声のほうが時間変化が早く、時
間分解能が必要なのに対し、音楽は周波数分解能が必要
であるから、単にビットレートだけでなく、音響信号の
種類によっても符号化方式を選択した方が復号化したと
きに高品質な結果が得られる。この場合、対象とする音
響信号が音声主体か、音楽主体かを人が判断し、符号化
方式を一意に選択する必要があった。
Since the bit rate used for encoding an audio signal is as wide as 2 kbps to 64 kbps, an appropriate encoding method is used in accordance with the bit rate. However, music requires frequency resolution while time resolution is required, so selecting a coding method depending not only on the bit rate but also on the type of audio signal gives a higher quality result when decoding. Is obtained. In this case, it is necessary for a person to determine whether the target acoustic signal is mainly of voice or music, and to select an encoding method uniquely.

【0005】[0005]

【発明が解決しようとする課題】従来の符号化方式で
は、符号化の対象となる音響信号が音声か、音楽かを人
が判断し、この情報とビットレートに応じて符号化方法
を一意に選択していたが、実際には音声と音楽が時間分
割的に混在する対象も多く存在するため、そのような場
合は充分な音質が得られない場合がある。
In the conventional coding method, a person judges whether the audio signal to be coded is voice or music, and the coding method is uniquely determined according to this information and the bit rate. However, in practice, there are many objects in which voice and music are mixed in a time-division manner, and in such a case, sufficient sound quality may not be obtained.

【0006】この発明の目的は、一連の音響信号内にお
ける音の種類を自動的に判別し、音の種類によって符号
化方法を切り換えることによって、高品質かつ効率的な
符号化方法とその復号装置を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to automatically determine the type of sound in a series of audio signals and switch the encoding method according to the type of sound, thereby providing a high-quality and efficient encoding method and its decoding apparatus. Is to provide.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するた
め、この発明においては、音響信号を入力してフレーム
分割し、フレームごとに周波数解析し、各フレームを音
楽あるいは音声あるいはそれ以外の音響の少なくとも2
種類以上の音に分類し、フレームごとあるいは同じ種類
の連続したフレームごとに音の種類に応じた符号化方法
を選択し、どの符号化方法が選択されたかを示す分類情
報を生成し、選択された符号化方法により音響信号を符
号化し、分類情報と符号化された音響信号から符号化デ
ータを生成する。
In order to achieve the above object, according to the present invention, an audio signal is input, divided into frames, frequency-analyzed for each frame, and each frame is composed of music or voice or other audio. At least 2
Classify into sounds of more than one type, select an encoding method according to the type of sound for each frame or for each successive frame of the same type, generate classification information indicating which encoding method was selected, and select The audio signal is encoded by the encoding method described above, and encoded data is generated from the classification information and the encoded audio signal.

【0008】また、音響信号を音楽に分類する際に、周
波数方向に安定しながら一定時間以上持続する音楽の周
波数スペクトルの時間方向のエッジの強さを用いる。ま
た、音響信号を音声に分類する際に、音声の高調波成分
を検出するくし形フィルタの出力を用いる。さらに、音
楽、音声、それ以外の音響の順に割り当てるビットレー
トを低くする。
[0008] When classifying an acoustic signal into music, the strength in the time direction of the frequency spectrum of the music, which is stable in the frequency direction and lasts for a certain time or more, is used. When classifying an acoustic signal into a sound, the output of a comb filter for detecting a harmonic component of the sound is used. Furthermore, the bit rate to be assigned in the order of music, voice, and other sounds is reduced.

【0009】[0009]

【発明の実施の形態】次に、この発明の実施例について
図面を参照して説明する。図1は、この発明の一実施例
の音響信号符号化装置の概略構成を示すブロック図であ
る。音声や音楽などの音響信号は、音響入力部101か
ら入力され、音響分類部102において音声、音楽、そ
の他の音響に分類される。この分類の方法については後
で述べる。次に符号化方法選択部103において、分類
された音響信号の種類に応じて適切な符号化方法を選択
する。符号化方法の例としては、音楽にはTwinVQ、M
PEG1,2、AC−3等が、音声にはPSI−CEL
P、CS−ACELP等が、その他の音響には音声に対
するものと同様のもの例えばCELPなどがそれぞれ利
用可能である。音響データは、選択された符号化方法に
応じて符号化部1041 〜1043 の何れかで符号化お
よび誤り訂正符号化される。符号化ファイル構成部10
5では、選択された符号化方法の種類を示す分類情報と
実際に符号化された音響データとをフレームごと、ある
いは、分類情報を適当な単位でまとめてファイル化し、
符号化データとして出力する。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a schematic configuration of an audio signal encoding device according to one embodiment of the present invention. An audio signal such as voice or music is input from the audio input unit 101, and is classified into voice, music, and other sounds by the audio classification unit 102. The method of this classification will be described later. Next, the encoding method selection unit 103 selects an appropriate encoding method according to the type of the classified audio signal. As an example of the encoding method, TwinVQ, M
PEG1,2, AC-3 etc., PSI-CEL for audio
P, CS-ACELP, etc., and other sounds similar to those for voice, such as CELP, can be used. The audio data is encoded and error-correction encoded by any of the encoding units 104 1 to 104 3 according to the selected encoding method. Encoded file construction unit 10
In 5, the classification information indicating the type of the selected encoding method and the actually encoded audio data are filed for each frame or the classification information is collected in an appropriate unit and filed.
Output as encoded data.

【0010】図2は、この発明の一実施例の音響信号符
号化装置において、可変ビットレートの符号化方法を用
いた場合の概略構成を示すブロック図である。図1との
違いは、音響符号化部1041 〜1043 において、フ
レームごとの音響信号の特徴に応じてビットレートを変
化させるための音響分析部20431とモード選択部20
32が備わっている点である。音響符号化部1041
よび1042 も同様の構成にすることも可能である。音
響分析部20431では、例えば音声の場合には、音声信
号のパワー、ピッチ、相関等の特徴量を算出し、無音部
分、子音部分、母音部分等を特定する。ここでパワーは
音声信号の強度そのものであり、ピッチはいわゆる音声
帯域に特徴的な周波数情報であり、相関は音声波形を短
い周期で観測したときに現れる信号波形の相関を意味
し、特に母音の場合にこの相関が高くなるため、母音の
位置を検出できる。
FIG. 2 is a block diagram showing a schematic configuration in a case where a variable bit rate encoding method is used in the audio signal encoding apparatus according to one embodiment of the present invention. The difference from FIG. 1, the acoustic coding unit 104 1 to 104 3, acoustic analysis unit 204 31 and a mode selection unit 20 for changing the bit rate according to the characteristics of the acoustic signal for each frame
4 32 is provided. The audio encoding units 104 1 and 104 2 may have the same configuration. The acoustic analysis unit 204 31, for example in the case of voice, the voice signal power, calculates a pitch, a feature amount of correlation, etc., to identify silence, consonant part, a vowel part or the like. Here, the power is the intensity itself of the audio signal, the pitch is frequency information characteristic of a so-called audio band, and the correlation means the correlation of the signal waveform that appears when the audio waveform is observed in a short cycle, and particularly, the vowel sound. In this case, since the correlation is high, the position of the vowel can be detected.

【0011】モード選択部20432では、無音部分では
ビットレートを低くし、母音部分では高くするといった
ようにビットレートのモードを選択する。選択されたモ
ードに応じて音響信号は符号化部20433〜20435
符号化および誤り訂正符号化される。モード情報は、符
号化方法選択部103で選択された符号化方法を示す分
類情報と共にフレームごと、あるいは、適当な単位ごと
に符号化ファイル構成部105においてファイル化さ
れ、符号化部20433〜20435において符号化された
符号化情報と共に符号化データとして出力される。
[0011] In the mode selection unit 204 32, lowering the bit rate is silence, selects the mode of bit-rate as such that high vowel portions. Acoustic signal according to the selected mode is coded and error correction coding by the coding section 204 33-204 35. Mode information, each frame with classification information indicating the encoded method selected by the coding method selection unit 103, or is filed in the coding file multiplexing section 105 for each appropriate unit, the encoding unit 204 33-204 It is output as encoded data together with the encoded information encoded in 35 .

【0012】音響分類部102で分類された音響信号が
音楽の場合には、通常可変ビットレート符号化方法を使
用することがないが、この場合でも途中で音がない休止
区間にはビットレートを低くしてもよい。分類された音
響信号が音楽でもなく、音声でもないその他の音響であ
る場合には、雑音、拍手、笑声、無音区間などが想定さ
れ、可変ビットレート符号化方式を使用することにより
効率的な符号化が達成できる。この場合の音響分析部2
0431での分析は、音声と同様な手法により実現でき
る、つまりその分析すべき特徴量としては信号パワーを
用いて、無音区間と有音区間を識別して、無音区間や雑
音区間のビットレートを低くする。
When the audio signal classified by the audio classification unit 102 is music, the variable bit rate encoding method is not usually used. May be lower. If the classified audio signal is not music and other audio that is not voice, noise, applause, laughter, silence, etc. are assumed, and the use of a variable bit rate encoding method is more efficient. Encoding can be achieved. Sound analysis unit 2 in this case
The analysis at 04 31 can be realized by the same method as that of speech. That is, as a feature to be analyzed, a signal rate is used to identify a silent section and a sound section, and the bit rate of a silent section or a noise section is determined. Lower.

【0013】図3はこの発明の一実施例の音響信号符号
化装置における音響分類部での処理の流れを示すフロー
チャートである。まず、数十ミリ秒ごとのフレーム単位
で入力された音響信号は301で高速フーリエ変換(F
FT)され、302で数秒程度の長さを持つサウンドス
ペクトログラムが生成される。次に、周波数iを0に初
期化し、303において各周波数iにおけるサウンドス
ペクトログラムの時間方向のエッジ強度Iiを算出す
る。エッジ強度の算出には、周波数方向のスペクトル値
の微分等を用いることができる。304でそれまでの総
エッジ強度EDにエッジ強度Iiを加算して総エッジ強
度EDとし、305で周波数iが音響信号の帯域幅にお
ける最高周波数BWより大となったかを調べ、大でなけ
ればiを+1してステップ303に戻る。このようにし
て各周波数iにおけるサウンドスペクトログラムの時間
方向のエッジ強度Iiを算出する処理を帯域幅BW全体
に対して行い、その間エッジ強度の和EDを304で算
出する。305においてi>BWとなり全帯域について
の処理が終了したと判断されたならば、EDの値と予め
設定されたしきい値の比較を306で行う。EDの値が
しきい値以上であれば、このフレームは音楽に分類され
る。つまり、周波数方向に安定しながら一定時間以上持
続する周波数スペクトルの時間方向のエッジの強さが所
定値以上であればその音響信号は音楽であると判定す
る。
FIG. 3 is a flowchart showing the flow of processing in the audio classification unit in the audio signal encoding apparatus according to one embodiment of the present invention. First, an acoustic signal input in units of frames every several tens of milliseconds is subjected to a fast Fourier transform (F) at 301.
FT), and a sound spectrogram having a length of about several seconds is generated at 302. Next, the frequency i is initialized to 0, and at 303, the edge intensity Ii in the time direction of the sound spectrogram at each frequency i is calculated. For the calculation of the edge strength, differentiation of the spectrum value in the frequency direction or the like can be used. At 304, the edge strength Ii is added to the total edge strength ED up to that time to obtain the total edge strength ED. At 305, it is checked whether the frequency i has become larger than the highest frequency BW in the bandwidth of the audio signal. Is incremented by 1, and the process returns to step 303. In this manner, the processing for calculating the edge strength Ii in the time direction of the sound spectrogram at each frequency i is performed on the entire bandwidth BW, and the sum ED of the edge strength is calculated by 304 during that. If it is determined at 305 that i> BW and the processing for all the bands is completed, the value of ED is compared with a preset threshold at 306. If the value of ED is greater than or equal to the threshold, this frame is classified as music. That is, if the strength of the edge in the time direction of the frequency spectrum, which is stable in the frequency direction and lasts for a certain time or more, is equal to or more than the predetermined value, the sound signal is determined to be music.

【0014】306においてEDがしきい値以下であっ
た場合には、i=0、j=1、maxCR=0と初期化
した後、308で音響信号周波数スペクトルをくし形フ
ィルタ処理し、その処理結果、つまりくし形フィルタ出
力CRijを算出し、309でそのCRijがそれまで最大
値maxCRより大かを調べ、大であれば310でその
CRijをmaxCRとし、次に311でくし形フィルタ
の隣接通過域間隔jがBW/2より大かを調べ、大でな
けばjを+1してステップ308に戻り、BW/2より
大であればj=1として、312でiがBWより大かを
調べ、大でなければiを+1してステップ308に戻
る。このようにして、くし形フィルタ処理は、各ライン
スペクトルに対して繰り返し処理を行う。くし形フィル
タは、中心周波数をiずらしながら、各iに対してくし
の間隔jを変化させ、309においてmaxCRとの比
較を行い、1ラインスペクトルで最大の値maxCRを
評価値とする。
If the ED is equal to or smaller than the threshold value in step 306, i = 0, j = 1, and maxCR = 0 are initialized, and in step 308, the acoustic signal frequency spectrum is subjected to comb filter processing, and the processing is performed. The result, that is, the comb filter output CRij is calculated. At 309, it is checked whether or not the CRij is larger than the maximum value maxCR. It is checked whether or not the area interval j is larger than BW / 2. If it is not larger, j is incremented by 1 and the process returns to step 308. If it is larger than BW / 2, j is set to 1 and 312 is checked whether i is larger than BW. If not large, i is incremented by 1 and the process returns to step 308. In this way, the comb filter processing repeatedly performs processing on each line spectrum. The comb filter changes the comb interval j for each i while shifting the center frequency by i, compares it with maxCR at 309, and sets the maximum value maxCR in one line spectrum as the evaluation value.

【0015】maxCRと予め設定されたしきい値の比
較を313で行い、しきい値以上の場合は該当フレーム
を音声に分類する。しきい値以下の場合は、音楽でも音
声でもないその他の音響として分類する。その他の音響
として分類されたものは、有音/無音や特定のフィルタ
を用いてさらに分類することも可能である。このように
音響信号を音楽、音声、その他に分類し、各々の種類に
応じて適切な符号化方法を選択することにより、高品質
で効率の良い符号化が可能である。
A comparison between maxCR and a preset threshold value is made at step 313. If the value is equal to or larger than the threshold value, the corresponding frame is classified as speech. If it is less than the threshold, it is classified as other sound that is neither music nor voice. Those classified as other sounds can be further classified using sound / silence or a specific filter. As described above, by classifying the audio signal into music, voice, and the like, and selecting an appropriate encoding method according to each type, high-quality and efficient encoding can be performed.

【0016】以上のように符号化され音響信号に対する
復号は例えば図4に示すように入力された符号化データ
は分離部401で符号化音響信号と分類情報とに分離さ
れる。その分類情報に応じて選択部402が制御され、
符号化音響信号が復号部403,404,405の何れ
かに入力される。復号部403は、符号化側で楽音の音
響信号に対し符号化した符号化方法と対応する復号方法
により復号するものであり、復号部404は音声の音響
信号に対し符号化した符号化方法と対応する復号方法に
より復号するものであり、復号部405は音楽でもなく
音声でもない音の音響信号に対し符号化した符号化方法
と対応する復号方法により復号するものである。分類情
報が音楽を表わしていれば符号化音響信号を復号部40
3に入力し、音声を表わしていれば復号部404に入力
する。
In the decoding of the coded audio signal as described above, for example, the input coded data is separated into the coded audio signal and the classification information by the separation unit 401 as shown in FIG. The selection unit 402 is controlled according to the classification information,
The encoded audio signal is input to any of the decoding units 403, 404, and 405. The decoding unit 403 decodes the sound signal of the musical sound on the coding side by a decoding method corresponding to the coding method of the sound signal. The decoding unit 404 decodes the coding method of the sound signal of the voice. The decoding is performed by a corresponding decoding method, and the decoding unit 405 decodes the sound signal of a sound that is neither music nor sound by a coding method corresponding to the coding method. If the classification information indicates music, the encoded audio signal is decoded by the decoding unit 40.
3 and input to the decoding unit 404 if it represents voice.

【0017】[0017]

【発明の効果】以上のとおり、請求項1、2、6、7、
11および12記載の発明は、音響信号をフレーム分割
し、周波数解析し、各フレームを音楽あるいは音声ある
いはそれ以外の音響の少なくとも2種類以上の音に分類
し、音の種類に応じて適切な符号化方法を選択し、高品
質で効率の良い符号化が可能となる。
As described above, claims 1, 2, 6, 7,
According to the inventions described in 11 and 12, the audio signal is divided into frames, frequency analysis is performed, and each frame is classified into at least two or more types of music or voice or other types of sounds, and an appropriate code is set according to the type of sound. By selecting a coding method, high-quality and efficient coding can be performed.

【0018】請求項3、8および13記載の発明は、音
響信号から得られたサウンドスペクトログラムにおい
て、周波数方向に安定しながら一定時間以上持続する時
間方向のエッジの強さを用いることによって、音響信号
を音楽に分類することができる。請求項4、9および1
4記載の発明は、音響信号から得られたサウンドスペク
トログラムに対して、くし形フィルタの出力を用いるこ
とにより音響信号を音声に分類することができる。
According to the third, eighth and thirteenth aspects of the present invention, in the sound spectrogram obtained from the sound signal, the strength of the edge in the time direction that is stable in the frequency direction and lasts for a certain time or more is used. Can be classified as music. Claims 4, 9 and 1
According to the invention described in Item 4, the sound signal can be classified into speech by using the output of the comb filter with respect to the sound spectrogram obtained from the sound signal.

【0019】請求項5、10および15記載の発明は、
音響信号に対して、音楽、音声、それ以外の音響の順に
割り当てるビットレートを低くし、符号化することによ
って、高品質で効率の良い符号化が可能となる。請求項
16の記載の発明によれば、音楽、音声、その他の音と
対応した適切な復号がなされ高品質な効率の良い復号が
なされる。
The invention according to claims 5, 10 and 15 provides:
By encoding and lowering the bit rate assigned to music, voice, and other audio in the order of audio signals, high-quality and efficient encoding can be performed. According to the invention of claim 16, appropriate decoding corresponding to music, voice, and other sounds is performed, and high-quality efficient decoding is performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の一実施例の音響信号符号化装置の概
略機能構成を示すブロック図。
FIG. 1 is a block diagram showing a schematic functional configuration of an audio signal encoding device according to an embodiment of the present invention.

【図2】この発明の一実施例の音響信号符号化装置にお
いて、符号化部に可変ビットレートの方法を適用した場
合の概略機能構成を示すブロック図。
FIG. 2 is a block diagram showing a schematic functional configuration in a case where a variable bit rate method is applied to an encoding unit in the audio signal encoding apparatus according to one embodiment of the present invention;

【図3】この発明の一実施例の音響信号符号化装置にお
ける音響分類部の処理の流れを示すフローチャート。
FIG. 3 is a flowchart showing a flow of processing of an audio classification unit in the audio signal encoding device according to one embodiment of the present invention;

【図4】この発明の音響信号復号装置の概略機能構成を
示すブロック図。
FIG. 4 is a block diagram showing a schematic functional configuration of an audio signal decoding device according to the present invention.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 外村 佳伸 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5D045 CA01 DA11 DA20 5J064 AA01 AA02 BB10 BC02 BC25 BD03 9A001 BB04 EE04 GG03 HH16 KK31 KK43 KK54 LL02  ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Yoshinobu Tonomura 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo F-Term within Nippon Telegraph and Telephone Corporation (reference) 5D045 CA01 DA11 DA20 5J064 AA01 AA02 BB10 BC02 BC25 BD03 9A001 BB04 EE04 GG03 HH16 KK31 KK43 KK54 LL02

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 音響信号をフレーム分割し、分割された
フレームごとに符号化方法を選択して符号化する可変ビ
ットレート符号化方法であって、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
の少なくとも2種類以上の音に分類し、フレームごとあ
るいは同じ種類の連続したフレームごとに音の種類に応
じた符号化方法を選択し、 どの符号化方法が選択されたかを示す分類情報を生成
し、 選択された符号化方法により前記音響信号を符号化し、 前記分類情報と前記符号化された音響信号から符号化デ
ータを生成することを特徴とする音響信号符号化方法。
1. A variable bit rate encoding method for dividing an audio signal into frames, selecting an encoding method for each of the divided frames, and encoding the audio signal, wherein the audio signal is frequency-analyzed for each frame. The frame is classified into at least two types of sound, music or voice or other sound, and an encoding method according to the type of sound is selected for each frame or for each successive frame of the same type. Generating a classification information indicating whether the selected audio signal is selected, encoding the audio signal by a selected encoding method, and generating encoded data from the classification information and the encoded audio signal. Encoding method.
【請求項2】 音響信号をフレーム分割し、分割された
フレームごとに符号化方法を選択して符号化する可変ビ
ットレート符号化方法であって、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
の少なくとも2種類以上の音に分類し、フレームごとあ
るいは同じ種類の連続したフレームごとに音の種類に応
じた符号化方法を選択し、 前記分類された音響信号をその分類に応じた音響分析を
行い、その分析結果に応じたビットレートのモードを選
択し、 前記選択された符号化方法及び前記選択されたビットレ
ートにより前記音響信号を符号化し、 前記選択された符号化方法を示す分類情報を生成し、 前記選択されたビットレートを示すモード情報を生成
し、 前記分類情報と前記モード情報と前記符号化された音響
信号から符号化データを生成することを特徴とする音響
信号符号化方法。
2. A variable bit rate encoding method for dividing an audio signal into frames, selecting an encoding method for each of the divided frames, and encoding the audio signal, wherein the audio signal is frequency-analyzed for each frame. Classifying the frame into at least two or more types of music or voice or other types of sound, and selecting an encoding method according to the type of sound for each frame or for each successive frame of the same type; Performing an acoustic analysis according to the classification of the signal, selecting a bit rate mode according to the analysis result, encoding the acoustic signal according to the selected encoding method and the selected bit rate; Generating classification information indicating the selected encoding method; generating mode information indicating the selected bit rate; and generating the classification information and the mode information. Acoustic signal encoding method and generating encoded data from said encoded sound signal.
【請求項3】 前記音響信号を音楽に分類する際に、周
波数方向に安定しながら一定時間以上持続する音楽の周
波数スペクトルの時間方向のエッジの強さを用いること
を特徴とする請求項1又は2記載の音響信号符号化方
法。
3. The method according to claim 1, wherein when the audio signal is classified into music, the strength of a time-direction edge of a frequency spectrum of the music, which is stable in a frequency direction and lasts for a predetermined time or more, is used. 3. The audio signal encoding method according to item 2.
【請求項4】 前記音響信号を音声に分類する際に、音
声の高調波成分を検出するくし形フィルタの出力を用い
ることを特徴とする請求項1乃至3記載の音響信号符号
化方法。
4. The audio signal encoding method according to claim 1, wherein an output of a comb filter for detecting a harmonic component of the audio is used when the audio signal is classified into audio.
【請求項5】 前記音響信号に対して、音楽、音声、そ
れ以外の音響の順に割り当てるビットレートを低くし、
符号化することを特徴とする請求項1乃至4の何れかに
記載の音響信号符号化方法。
5. A low bit rate to be assigned to music, voice, and other sounds in the order of the sound signal,
The audio signal encoding method according to claim 1, wherein encoding is performed.
【請求項6】 音響信号をフレーム分割し、分割された
フレームごとに符号化方法を選択して符号化する可変ビ
ットレート符号化装置であって、 互いに符号化方法を異にする複数の符号化部と、 前記音響信号を入力する音響入力部と、 音響信号をフレームごとに周波数解析し、各フレームを
音楽あるいは音声あるいはそれ以外の音響の少なくとも
2種類以上の音に分類する音響分類部と、 フレームごとあるいは同じ種類の連続したフレームごと
に音の種類に応じた符号化方法の符号化部を選択してそ
の符号化部に前記音響信号を供給すると共にどの符号化
方法が選択されたかを示す分類情報を生成する符号化方
法選択部と、 選択された符号化部により符号化された音響信号と、前
記分類情報とから符号化データを生成する符号化ファイ
ル構成部とを具備することを特徴とする音響信号符号化
装置。
6. A variable bit rate encoding apparatus for dividing an audio signal into frames, selecting an encoding method for each of the divided frames, and encoding the divided audio signals, wherein a plurality of encoding methods different in encoding method from each other are provided. A sound input unit that inputs the sound signal, a sound classification unit that performs a frequency analysis of the sound signal for each frame, and classifies each frame into at least two types of sounds of music or voice or other sounds, For each frame or for each successive frame of the same type, select an encoding unit of an encoding method according to the type of sound, supply the audio signal to the encoding unit, and indicate which encoding method has been selected. An encoding method selecting unit for generating classification information; an audio file encoded by the selected encoding unit; and an encoded file structure for generating encoded data from the classification information. Acoustic signal encoding apparatus characterized by comprising a part.
【請求項7】 音響信号をフレーム分割し、分割された
フレームごとに符号化方法を選択して符号化する可変ビ
ットレート符号化装置であって、 符号化方法およびビットレートの少なくとも一方を互い
に異にする複数の符号化部と、 前記音響信号を入力する音響入力部と、 前記音響信号をフレームごとに周波数解析し、各フレー
ムを音楽あるいは音声あるいはそれ以外の音響の少なく
とも2種類以上の音に分類する音響分類部と、 前記分類された音響信号をその分類に応じた音響分析を
行う音響分析部と、 前記分類された音の種類に応じて選択した符号化方法を
有し、かつ前記分析の結果に応じて選択したビットレー
トを有する符号化部へ前記音響信号を供給すると共にど
の符号化方法を選択したかを示す分類情報とどのビット
レートを選択したかを示すモード情報を生成する選択部
と、 前記符号化部により符号化された音響信号と、前記分類
情報と前記モード情報から符号化データを生成する符号
化ファイル構成部とを具備することを特徴とする音響信
号符号化装置。
7. A variable bit rate encoding device for dividing an audio signal into frames, selecting an encoding method for each divided frame, and encoding, wherein at least one of the encoding method and the bit rate is different from each other. A plurality of encoding units, an audio input unit for inputting the audio signal, a frequency analysis of the audio signal for each frame, and converting each frame to at least two types of music or voice or other types of sound. A sound classification unit for classifying, a sound analysis unit for performing sound analysis on the classified sound signal according to the classification, and an encoding method selected according to a type of the classified sound, and the analysis The audio signal is supplied to an encoding unit having a bit rate selected in accordance with the result of the above, classification information indicating which encoding method is selected, and which bit rate is selected. A selection unit that generates mode information indicating whether or not the audio signal has been encoded; an audio signal encoded by the encoding unit; and an encoded file configuration unit that generates encoded data from the classification information and the mode information. A sound signal encoding device characterized by the above-mentioned.
【請求項8】 前記音響分類部は、前記音響信号を音楽
に分類する際に、周波数方向に安定しながら一定時間以
上持続する音楽の周波数スペクトルの時間方向のエッジ
の強さを用いることを特徴とする請求項6又は7記載の
音響信号符号化装置。
8. The sound classifying unit uses the strength of the edge in the time direction of the frequency spectrum of the music, which is stable in the frequency direction and lasts for a predetermined time or more, when classifying the sound signal into music. The audio signal encoding device according to claim 6 or 7, wherein
【請求項9】 前記音響分類部は、前記音響信号を音声
に分類する際に、音声の高調波成分を検出するくし形フ
ィルタの出力を用いることを特徴とする請求項6乃至8
の何れかに記載の音響信号符号化装置。
9. The sound classification unit according to claim 6, wherein when classifying the sound signal into a sound, an output of a comb filter for detecting a harmonic component of the sound is used.
The audio signal encoding device according to any one of the above.
【請求項10】 分類結果の、音楽、音声、それ以外の
音響の順にビットレートを低い符号化部が選択されるこ
とを特徴とする請求項6乃至9の何れかに記載の音響信
号符号化装置。
10. The audio signal encoding according to claim 6, wherein an encoding unit having a lower bit rate is selected in the order of music, voice, and other audio in the classification result. apparatus.
【請求項11】 音響信号をフレーム分割し、分割され
たフレームごとに符号化方法を選択して符号化する可変
ビットレート符号化プログラムを記録した記録媒体であ
って、 前記音響信号を入力する音響入力処理と、 音響信号をフレームごとに周波数解析し、各フレームを
音楽あるいは音声あるいはそれ以外の音響の少なくとも
2種類以上の音に分類する音響分類処理と、 フレームごとあるいは同じ種類の連続したフレームごと
に音の種類に応じた符号化方法を選択し、どの符号化方
法が選択されたかを示す分類情報を生成する符号化方法
選択処理と、 選択された符号化方法により音響信号を符号化する符号
化処理と、 前記分類情報と前記符号化された音響信号から符号化デ
ータを生成する符号化ファイル構成処理とをコンピュー
タに実行させるための音響信号符号化プログラムを記録
したことを特徴とする記録媒体。
11. A recording medium storing a variable bit rate encoding program for dividing an audio signal into frames, selecting an encoding method for each of the divided frames, and encoding the audio signal, wherein the audio signal is input. Input processing, frequency analysis of an audio signal for each frame, and audio classification processing for classifying each frame into at least two types of sound, such as music or voice or other sounds, and for each frame or each successive frame of the same type A coding method selection process for selecting a coding method according to the type of sound, generating classification information indicating which coding method has been selected, and a code for coding an audio signal by the selected coding method And performing, on a computer, an encoding file forming process of generating encoded data from the classification information and the encoded audio signal. Recording medium characterized by recording the acoustic signal encoding program for causing.
【請求項12】 音響信号をフレーム分割し、分割され
たフレームごとに符号化方法を選択して符号化する可変
ビットレート符号化プログラムであって、 前記音響信号を入力する音響入力処理と、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
の少なくとも2種類以上の音に分類する音響分類処理
と、 フレームごとあるいは同じ種類の連続したフレームごと
に音の種類に応じた符号化方法を選択し、どの符号化方
法が選択されたかを示す分類情報を生成する符号化方法
選択処理と、 前記分類された音響信号をその分類に応じた音響分析を
行う音響分析処理と、 前記分析結果に応じたビットレートのモードを選択し、
選択されたビットレートモードを示すモード情報を生成
するモード選択処理と、 前記選択された符号化方法及び前記選択されたビットレ
ートモードにより前記音響信号を符号化する符号化処理
と、 前記分類情報と前記モード情報と前記符号化された音響
信号から符号化データを生成する符号化ファイル構成処
理と、 をコンピュータに実行させるための音響信号符号化プロ
グラムを記録した記録媒体。
12. A variable bit rate encoding program for dividing an audio signal into frames, selecting an encoding method for each divided frame, and encoding the audio signal, wherein: an audio input process for inputting the audio signal; An audio signal is subjected to frequency analysis for each frame, and an audio classification process for classifying each frame into at least two types of sounds, such as music, voice, and other sounds, and a sound type for each frame or for each successive frame of the same type. A coding method selection process of selecting a coding method according to the above, and generating classification information indicating which coding method has been selected, and an acoustic analysis of performing an acoustic analysis on the classified audio signal according to the classification Processing and selecting a bit rate mode according to the analysis result,
A mode selection process for generating mode information indicating the selected bit rate mode; an encoding process for encoding the audio signal according to the selected encoding method and the selected bit rate mode; A recording medium storing an audio signal encoding program for causing a computer to execute an encoded file configuration process for generating encoded data from the mode information and the encoded audio signal.
【請求項13】 前記音響分類処理は、前記音響信号を
音楽に分類する際に、周波数方向に安定しながら一定時
間以上持続する音楽の周波数スペクトルの時間方向のエ
ッジの強さを用いることを特徴とする請求項11又は1
2記載の記録媒体。
13. The sound classification processing, wherein when classifying the sound signal into music, the strength of a time-direction edge of a frequency spectrum of the music, which is stable in the frequency direction and lasts for a predetermined time or more, is used. Claim 11 or 1
2. The recording medium according to 2.
【請求項14】 前記音響分類処理は、前記音響信号を
音声に分類する際に、音声の高調波成分を検出するくし
形フィルタの出力を用いることを特徴とする請求項11
乃至13の何れかに記載の記録媒体。
14. The sound classification process according to claim 11, wherein when classifying the sound signal into a sound, an output of a comb filter for detecting a harmonic component of the sound is used.
14. The recording medium according to any one of claims 13 to 13.
【請求項15】 前記符号化処理は、音楽、音声、それ
以外の音響の順に割り当てるビットレートを低くするこ
とを特徴とする請求項11乃至14の何れかに記載の記
録媒体。
15. The recording medium according to claim 11, wherein the encoding process reduces a bit rate to be assigned in the order of music, voice, and other sounds.
【請求項16】 入力符号化データを分類情報と符号化
音響信号に分離する分離部と、 互いに復号方法を異にし、入力された符号化音響信号を
音響信号に復号する複数の復号部と、 前記分離された分類情報に応じて前記復号部の1つを選
択してその復号部に前記符号化音響信号を入力する復号
選択部とを具備する音響信号復号装置。
16. A separation unit for separating input coded data into classification information and a coded audio signal, a plurality of decoding units different in decoding method from each other, for decoding an input coded audio signal into an audio signal, An audio signal decoding apparatus comprising: a decoding selection unit that selects one of the decoding units according to the separated classification information and inputs the encoded audio signal to the decoding unit.
JP11075557A 1999-03-19 1999-03-19 Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device Pending JP2000267699A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11075557A JP2000267699A (en) 1999-03-19 1999-03-19 Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11075557A JP2000267699A (en) 1999-03-19 1999-03-19 Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device

Publications (1)

Publication Number Publication Date
JP2000267699A true JP2000267699A (en) 2000-09-29

Family

ID=13579614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11075557A Pending JP2000267699A (en) 1999-03-19 1999-03-19 Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device

Country Status (1)

Country Link
JP (1) JP2000267699A (en)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006194959A (en) * 2005-01-11 2006-07-27 Sony Corp Voice detector, automatic imaging device and voice detecting method
JP2007079127A (en) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> Data format discrimination method, signal encoding method, device and program using same methods, and recording medium
JPWO2005086138A1 (en) * 2004-03-05 2008-01-24 松下電器産業株式会社 Error concealment device and error concealment method
JP2008026662A (en) * 2006-07-21 2008-02-07 Sony Corp Data recording device, method, and program
WO2008082133A1 (en) * 2006-12-28 2008-07-10 Samsung Electronics Co., Ltd. Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
JP2009522921A (en) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Managing media container files
JP2010506239A (en) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド Method and apparatus for encoding and decoding audio signals
JP2010522348A (en) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド Audio signal encoding method and apparatus, and audio signal decoding method and apparatus
JP2011504249A (en) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド Signal processing method and apparatus
WO2011039919A1 (en) * 2009-09-30 2011-04-07 パナソニック株式会社 Audio decoder, audio encoder, and system
US7933417B2 (en) 2000-12-22 2011-04-26 Sony Corporation Encoding device and decoding device
JP2011188510A (en) * 2002-08-08 2011-09-22 Qualcomm Inc Bandwidth-adaptive quantization method and apparatus
WO2012020828A1 (en) 2010-08-13 2012-02-16 株式会社エヌ・ティ・ティ・ドコモ Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
CN104040626A (en) * 2012-01-13 2014-09-10 高通股份有限公司 Multiple coding mode signal classification
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2016218345A (en) * 2015-05-25 2016-12-22 ヤマハ株式会社 Sound material processor and sound material processing program
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
JP2020126227A (en) * 2019-02-01 2020-08-20 富士通株式会社 Signal processing method and information processing device

Cited By (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933417B2 (en) 2000-12-22 2011-04-26 Sony Corporation Encoding device and decoding device
US9799341B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9799340B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10902859B2 (en) 2001-07-10 2021-01-26 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10297261B2 (en) 2001-07-10 2019-05-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9865271B2 (en) 2001-07-10 2018-01-09 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9792923B2 (en) 2001-11-29 2017-10-17 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US8019612B2 (en) 2001-11-29 2011-09-13 Coding Technologies Ab Methods for improving high frequency reconstruction
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US9779746B2 (en) 2001-11-29 2017-10-03 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9812142B2 (en) 2001-11-29 2017-11-07 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818417B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818418B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US11238876B2 (en) 2001-11-29 2022-02-01 Dolby International Ab Methods for improving high frequency reconstruction
US9761234B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US8112284B2 (en) 2001-11-29 2012-02-07 Coding Technologies Ab Methods and apparatus for improving high frequency reconstruction of audio and speech signals
US9761237B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761236B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US8447621B2 (en) 2001-11-29 2013-05-21 Dolby International Ab Methods for improving high frequency reconstruction
JP2011188510A (en) * 2002-08-08 2011-09-22 Qualcomm Inc Bandwidth-adaptive quantization method and apparatus
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US11423916B2 (en) 2002-09-18 2022-08-23 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10685661B2 (en) 2002-09-18 2020-06-16 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
JP4744438B2 (en) * 2004-03-05 2011-08-10 パナソニック株式会社 Error concealment device and error concealment method
JPWO2005086138A1 (en) * 2004-03-05 2008-01-24 松下電器産業株式会社 Error concealment device and error concealment method
JP2006194959A (en) * 2005-01-11 2006-07-27 Sony Corp Voice detector, automatic imaging device and voice detecting method
JP4520922B2 (en) * 2005-09-14 2010-08-11 日本電信電話株式会社 Data format determination method, apparatus, program, and recording medium
JP2007079127A (en) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> Data format discrimination method, signal encoding method, device and program using same methods, and recording medium
US8225164B2 (en) 2006-01-05 2012-07-17 Telefonaktiebolaget Lm Ericsson (Publ) Media container file management
JP2009522922A (en) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Managing media container files
US8185794B2 (en) 2006-01-05 2012-05-22 Telefonaktiebolaget L M Ericsson (Publ) Media container file management
JP2009522921A (en) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Managing media container files
JP2008026662A (en) * 2006-07-21 2008-02-07 Sony Corp Data recording device, method, and program
US9583117B2 (en) 2006-10-10 2017-02-28 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
JP2010506239A (en) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド Method and apparatus for encoding and decoding audio signals
WO2008082133A1 (en) * 2006-12-28 2008-07-10 Samsung Electronics Co., Ltd. Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same
JP2010522348A (en) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド Audio signal encoding method and apparatus, and audio signal decoding method and apparatus
US8504377B2 (en) 2007-11-21 2013-08-06 Lg Electronics Inc. Method and an apparatus for processing a signal using length-adjusted window
JP2011504250A (en) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド Signal processing method and apparatus
JP2011504249A (en) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド Signal processing method and apparatus
KR101221918B1 (en) 2007-11-21 2013-01-15 엘지전자 주식회사 A method and an apparatus for processing a signal
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8583445B2 (en) 2007-11-21 2013-11-12 Lg Electronics Inc. Method and apparatus for processing a signal using a time-stretched band extension base signal
CN102576534A (en) * 2009-09-30 2012-07-11 松下电器产业株式会社 Audio decoder, audio encoder, and system
WO2011039919A1 (en) * 2009-09-30 2011-04-07 パナソニック株式会社 Audio decoder, audio encoder, and system
JP2011075936A (en) * 2009-09-30 2011-04-14 Panasonic Corp Audio encoder and decoder
US8688442B2 (en) 2009-09-30 2014-04-01 Panasonic Corporation Audio decoding apparatus, audio coding apparatus, and system comprising the apparatuses
US9280974B2 (en) 2010-08-13 2016-03-08 Ntt Docomo, Inc. Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
TWI570712B (en) * 2010-08-13 2017-02-11 Ntt Docomo Inc Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
JP2012042534A (en) * 2010-08-13 2012-03-01 Ntt Docomo Inc Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method and audio encoding program
CN104835501A (en) * 2010-08-13 2015-08-12 株式会社Ntt都科摩 Audio decoding device, audio decoding method, audio encoding device, and audio encoding method
TWI476762B (en) * 2010-08-13 2015-03-11 Ntt Docomo Inc Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
WO2012020828A1 (en) 2010-08-13 2012-02-16 株式会社エヌ・ティ・ティ・ドコモ Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
CN103098125A (en) * 2010-08-13 2013-05-08 株式会社Ntt都科摩 Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
JP2015507222A (en) * 2012-01-13 2015-03-05 クゥアルコム・インコーポレイテッドQualcomm Incorporated Multiple coding mode signal classification
CN104040626A (en) * 2012-01-13 2014-09-10 高通股份有限公司 Multiple coding mode signal classification
JP2016218345A (en) * 2015-05-25 2016-12-22 ヤマハ株式会社 Sound material processor and sound material processing program
JP2020126227A (en) * 2019-02-01 2020-08-20 富士通株式会社 Signal processing method and information processing device
JP7283375B2 (en) 2019-02-01 2023-05-30 富士通株式会社 Signal processing method and information processing device

Similar Documents

Publication Publication Date Title
RU2764287C1 (en) Method and system for encoding left and right channels of stereophonic sound signal with choosing between models of two and four subframes depending on bit budget
JP2000267699A (en) Acoustic signal coding method and device therefor, program recording medium therefor, and acoustic signal decoding device
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP4390803B2 (en) Method and apparatus for gain quantization in variable bit rate wideband speech coding
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
CA2833874C (en) Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
US7191120B2 (en) Speech encoding method, apparatus and program
EP1738355B1 (en) Signal encoding
EP1982329B1 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
JP4270866B2 (en) High performance low bit rate coding method and apparatus for non-speech speech
EP1278184A2 (en) Method for coding speech and music signals
KR20080083719A (en) Selection of coding models for encoding an audio signal
KR20080093074A (en) Classification of audio signals
JP2007538282A (en) Audio encoding with various encoding frame lengths
KR20080101873A (en) Apparatus and method for encoding and decoding signal
KR20150127041A (en) Device and method for reducing quantization noise in a time-domain decoder
US11443751B2 (en) Phase reconstruction in a speech decoder
US7016832B2 (en) Voiced/unvoiced information estimation system and method therefor
US7634402B2 (en) Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
EP3899931B1 (en) Phase quantization in a speech encoder
JP3353852B2 (en) Audio encoding method
WO2002021091A1 (en) Noise signal analyzer, noise signal synthesizer, noise signal analyzing method, and noise signal synthesizing method
JP3490324B2 (en) Acoustic signal encoding device, decoding device, these methods, and program recording medium
JP2001147700A (en) Method and device for sound signal postprocessing and recording medium with program recorded