JP5814802B2 - オーディオ符号化装置 - Google Patents
オーディオ符号化装置 Download PDFInfo
- Publication number
- JP5814802B2 JP5814802B2 JP2012004214A JP2012004214A JP5814802B2 JP 5814802 B2 JP5814802 B2 JP 5814802B2 JP 2012004214 A JP2012004214 A JP 2012004214A JP 2012004214 A JP2012004214 A JP 2012004214A JP 5814802 B2 JP5814802 B2 JP 5814802B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- data
- audio data
- main
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 claims description 116
- 238000000034 method Methods 0.000 description 32
- 230000008569 process Effects 0.000 description 15
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Description
[第1の実施形態]
図1は、第1の実施形態のオーディオ符号化装置の構成を表わす図である。
ストリーム生成部5は、蓄積部7から量子化されたオーディオデータmain_dataを取り出して、ヘッダおよび付加情報を付加して、MPEGオーディオレイヤ3のストリームを生成する。MPEGオーディオレイヤ3のストリームのフレーム長は一定であって、各フレームは、ヘッダおよび付加情報を含み、メインデータ領域にmain_dataが配置される。
次に、量子化部3は、フィルタ処理されたオーディオデータを量子化する。具体的には、オーディオデータ番号iを周期Dで除算した余りが「1」の場合には、量子化部3は、量子化されたデータ量がフレーム番号iのフレーム内のメインデータ領域の容量Aを超えないように、量子化スケールを調整することによって量子化する。
次に、ストリーム生成部5は、量子化部3で作成されたmain_data(j)についてのヘッダをフレーム番号jのフレームのヘッダ領域に配置する(ステップS202)。
図4は、第1の実施形態のオーディオ符号化装置によって生成されるストリームの例を表わす図である。
フレーム1、4、7では、main_data_beginが「0」に設定されている。
図5は、第2の実施形態のオーディオ符号化装置の構成を表わす図である。
次に、LNに1を加算した値がオーディオデータ番号iに設定される(ステップS319)。
図9は、第2の実施形態のオーディオ符号化装置によって生成されるストリームの例を表わす図である。
本変形例では、量子化部13は、直前のフレーム群の最後のフレームの次のフレームである第1のフレームおよび後続の所定個数の複数のフレームのうち、フレームに含まれるヘッダと関連する量子化されたオーディオデータの容量が最小となるフレームを次のフレーム群に存在する所定のフレームとして設定する。量子化部13は、所定のフレームの直前のフレームを第2のフレームとして特定し、第1のフレームから第2のフレームまでを現在のフレーム群として設定する。
次に、LNに1を加算した値がオーディオデータ番号iに設定される(ステップS519)。
第3の実施形態が、第1の実施形態と相違する点は、量子化部3である。
次に、量子化部3は、フィルタ処理されたオーディオデータを量子化する。具体的には、オーディオデータ番号iを周期Dで除算した余りが「1」の場合には、量子化部3は、量子化されたデータ量がフレーム番号iのフレーム内のメインデータ領域の容量Aを超えるかを気にすることなく量子化する。一方、オーディオデータ番号iを周期Dで除算した余りが「1」でない場合には、量子化部3は、量子化されたデータ量がフレーム番号iのフレーム内のメインデータ領域の容量Aと、フレーム番号iのフレームに先行する1個以上の所定のフレーム内のメインデータ領域内の空き領域の和と所定の上限値のうちの小さい方Bとの合計(A+B)を超えないように、量子化スケールを調整することによって量子化する。ここで、1個以上の所定のフレームとは、フレーム番号を周期Dで除算した余りが「1」であり、かつフレーム番号(i−D)〜フレーム番号(i−1)のフレームである(ステップS604)。
次に、ストリーム生成部5は、量子化部3で作成されたmain_data(j)についてのヘッダをフレーム番号jのフレームのヘッダ領域に配置する(ステップS702)。
図14は、第3の実施形態のオーディオ符号化装置によって生成されるストリームの例を表わす図である。
フレーム1では、main_data(1)のデータ量がメインデータ領域のデフォルト容量Aを超えないため、フレーム長がデフォルトのまま変化せず、デフォルト容量Aのメインデータ領域にmain_data(1)が配置され、残りのメインデータ領域にmain_data(2)以降のデータが配置される。
Claims (5)
- オーディオデータを量子化する量子化部と、
前記量子化されたオーディオデータを蓄積する蓄積部と、
前記蓄積部内の量子化されたオーディオデータを、ストリーム内の前記オーディオデータと関連するヘッダが存在するフレームと前記ヘッダが存在するフレームに先行する1または複数のフレームのうちのいずれか一方または両方に配置するストリーム生成部とを備え、
前記ストリーム生成部は、所定のフレームについては、前記フレームに含まれるヘッダと関連する前記オーディオデータの全部を配置し、残りの領域には前記オーディオデータの後続のオーディオデータを配置し、
前記所定のフレーム以外については、前記フレームに含まれるヘッダと関連する前記オーディオデータと前記オーディオデータの後続のオーディオデータのうちのいずれか一方または両方を配置し、
前記ストリーム生成部は、ストリームのフレームをフレーム群に分割し、前記フレーム群に含まれるフレーム数は一定ではなく、1つのフレーム群の先頭のフレームを前記所定のフレームして設定し、
前記量子化部は、直前のフレーム群の最後のフレームの次のフレームである第1のフレームおよび後続の所定個数の複数のフレームのうち、前記フレームに含まれるヘッダと関連する量子化されたオーディオデータの容量が最小となるフレームを次のフレーム群に存在する所定のフレームとし、
前記量子化部は、前記所定のフレームの直前のフレームを第2のフレームとして特定し、前記第1のフレームから前記第2のフレームまでを現在のフレーム群として設定する、オーディオ符号化装置。 - オーディオデータを量子化する量子化部と、
前記量子化されたオーディオデータを蓄積する蓄積部と、
前記蓄積部内の量子化されたオーディオデータを、ストリーム内の前記オーディオデータと関連するヘッダが存在するフレームと前記ヘッダが存在するフレームに先行する1または複数のフレームのうちのいずれか一方または両方に配置するストリーム生成部とを備え、
前記ストリーム生成部は、所定のフレームについては、前記フレームに含まれるヘッダと関連する前記オーディオデータの全部を配置し、残りの領域には前記オーディオデータの後続のオーディオデータを配置し、
前記所定のフレーム以外については、前記フレームに含まれるヘッダと関連する前記オーディオデータと前記オーディオデータの後続のオーディオデータのうちのいずれか一方または両方を配置し、
前記ストリーム生成部は、ストリームのフレームをフレーム群に分割し、前記フレーム群に含まれるフレーム数は一定ではなく、1つのフレーム群の先頭のフレームを前記所定のフレームして設定し、
前記量子化部は、直前のフレーム群の最後のフレームの次のフレームである第1のフレームを起点として後続のフレームを順番に選択し、フレーム内のメインデータ領域の容量と前記選択したフレームに含まれるヘッダと関連する量子化されたオーディオデータの容量との差分を求め、
前記量子化部は、前記順次選択によって、差分の合計値が前記蓄積部の容量を超えることになるフレームを次のフレーム群に存在する所定のフレームとし、
前記量子化部は、前記所定のフレームの直前のフレームを第2のフレームとして特定し、前記第1のフレームから前記第2のフレームまでを現在のフレーム群として設定する、オーディオ符号化装置。 - 前記ストリームは、MPEGオーディオ・レイヤ3のストリームであって、
前記ストリーム生成部は、前記所定のフレーム内に「0」を示すmain_data_beginを配置する、請求項1記載のオーディオ符号化装置。 - 前記ストリームのすべてのフレーム長は一定であって、
前記ストリーム生成部は、前記フレーム内のメインデータ領域内の前記オーディオデータが配置されない空き領域をゼロパディングする、請求項1記載のオーディオ符号化装置。 - 前記ストリームのすべてのフレーム長は一定であって、
前記量子化部は、前記フレーム内のメインデータ領域に空き領域が発生しないように、前記オーディオデータの量子化スケールを調整する、請求項1記載のオーディオ符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012004214A JP5814802B2 (ja) | 2012-01-12 | 2012-01-12 | オーディオ符号化装置 |
US13/706,448 US9349377B2 (en) | 2012-01-12 | 2012-12-06 | Audio encoding apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012004214A JP5814802B2 (ja) | 2012-01-12 | 2012-01-12 | オーディオ符号化装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013142862A JP2013142862A (ja) | 2013-07-22 |
JP2013142862A5 JP2013142862A5 (ja) | 2014-09-25 |
JP5814802B2 true JP5814802B2 (ja) | 2015-11-17 |
Family
ID=48780612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012004214A Expired - Fee Related JP5814802B2 (ja) | 2012-01-12 | 2012-01-12 | オーディオ符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9349377B2 (ja) |
JP (1) | JP5814802B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08331564A (ja) * | 1995-05-30 | 1996-12-13 | Matsushita Electric Ind Co Ltd | 画像符号化方法 |
US7317867B2 (en) * | 2002-07-11 | 2008-01-08 | Mediatek Inc. | Input buffer management for the playback control for MP3 players |
EP1647010B1 (de) * | 2003-07-21 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
TW200612673A (en) * | 2004-10-06 | 2006-04-16 | Elan Microelectronics Corp | Encoding/decoding apparatus and its method of quantization of a random step number |
JP4619131B2 (ja) * | 2005-01-04 | 2011-01-26 | 富士通セミコンダクター株式会社 | オーディオ符号化方法、オーディオ復号化方法、オーディオ符号器及びオーディオ復号器 |
US20070036228A1 (en) * | 2005-08-12 | 2007-02-15 | Via Technologies Inc. | Method and apparatus for audio encoding and decoding |
-
2012
- 2012-01-12 JP JP2012004214A patent/JP5814802B2/ja not_active Expired - Fee Related
- 2012-12-06 US US13/706,448 patent/US9349377B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013142862A (ja) | 2013-07-22 |
US9349377B2 (en) | 2016-05-24 |
US20130185083A1 (en) | 2013-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102248253B1 (ko) | 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치 | |
JP4702928B2 (ja) | 動画像符号化装置及び復号装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4219551B2 (ja) | 知覚モデルに基づいて信号を符号化する方法および装置 | |
RU2636697C1 (ru) | Устройство и способ кодирования | |
JP6302071B2 (ja) | 無損失符号化方法及び無損失復号化方法 | |
EP2381438A1 (en) | Signal classification processing method, classification processing device and encoding system | |
JP2015517119A (ja) | 信号符号化および復号化の方法および装置 | |
JP2019040206A (ja) | 音声音響符号化装置及び音声音響符号化方法 | |
KR102288111B1 (ko) | 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치 | |
KR20210083225A (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
KR101668093B1 (ko) | 데이터 인코딩 및 디코딩 방법 및 장치 | |
JP2006145782A5 (ja) | ||
JP5814802B2 (ja) | オーディオ符号化装置 | |
EP2926556A1 (en) | Compressed data stream transmission using rate control | |
US8451148B2 (en) | Encoding apparatus, encoding method, decoding apparatus, decoding method, and program | |
JP5704018B2 (ja) | オーディオ信号符号化方法および装置 | |
JP4335245B2 (ja) | 量子化装置、逆量子化装置、音声音響符号化装置、音声音響復号装置、量子化方法、および逆量子化方法 | |
US8364496B2 (en) | Signal recording and reproducing apparatus and method | |
JP5088215B2 (ja) | 情報処理システム及び情報処理方法、並びにプログラム | |
JP2002162996A (ja) | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム | |
US20100023334A1 (en) | Audio coding apparatus, audio coding method and recording medium | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
JP2001134294A (ja) | オーディオ信号のビットストリームの処理方法及び処理装置 | |
KR20240118076A (ko) | 부호화 장치, 복호 장치, 부호화 방법, 및, 복호 방법 | |
JPH066779A (ja) | 帯域分割符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140811 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5814802 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |