JP2013037111A - オーディオ信号符号化方法および装置 - Google Patents
オーディオ信号符号化方法および装置 Download PDFInfo
- Publication number
- JP2013037111A JP2013037111A JP2011171821A JP2011171821A JP2013037111A JP 2013037111 A JP2013037111 A JP 2013037111A JP 2011171821 A JP2011171821 A JP 2011171821A JP 2011171821 A JP2011171821 A JP 2011171821A JP 2013037111 A JP2013037111 A JP 2013037111A
- Authority
- JP
- Japan
- Prior art keywords
- bits
- channel
- usable
- bit
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013139 quantization Methods 0.000 claims abstract description 90
- 238000012937 correction Methods 0.000 claims abstract description 65
- 238000004364 calculation method Methods 0.000 claims abstract description 22
- 238000013500 data storage Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 8
- 241000282344 Mellivora capensis Species 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】オーディオ信号符号化装置であって、知覚エントロピー算出部21と、知覚エントロピーに応じて、各チャネルの使用可能ビット数を決定するビット配分部22と、窓判定部23と、使用可能ビット数を補正する補正部24と、各チャネルのオーディオ信号を、補正された使用可能ビット数以下となるように順次量子化し、その際にフレーム内で既に量子化されたチャネルの余りビット数を順次後のチャネルに加えながら量子化する量子化部25と、を有し、補正部24は、以前のフレームの窓のタイプごとの量子化ビット使用率を算出する使用率履歴算出部31と、量子化ビット使用率で量子化が行われた場合の各チャネルの使用可能ビット数に対する使用率が等しくなるように補正する補正ビット数算出部32と、を有する。
【選択図】図5
Description
図1は、量子化処理が理想状態で行われる場合の量子化後のビット数の変化を示す図である。図1に示すように、理想状態では、量子化スケール補正回数を無限にし、量子化処理を完了させることで、使用可能な量子化ビット数(以降、使用可能ビット数ともいう)を使い切ること、言い換えれば、量子化後のビット数が使用可能ビット数に等しくなった状態で、量子化処理を終了できる。しかし通常、量子化スケール補正回数を増加させると処理量が増加し、その分処理時間が増加し、所定時間内に量子化処理を終了することができない。そのため、現実には量子化スケール補正回数が無限であるという理想状態で量子化処理を行うことはできず、量子化スケール補正回数を有限に設定する。
ステップS12では、ショート窓(SHORT WINDOW)であるかロング窓(LONG WINDOW)であるかを選択する。
ステップS14では、聴覚心理モデルとMDCT係数により、マスキングパワーをスケールファクタバンドごとに導出する。
ステップS16では、知覚エントロピーに基づいて各チャネルへ使用可能ビット数を割り当てる。
以上のようにして得られた符号化データからストリームを生成して出力する。
実施形態の符号化装置は、フレーム内の総ビット数が上限ビット数以下となるように、複数チャネルのオーディオ信号をそれぞれ符号化する。図5に示すように、実施形態の符号化装置は、知覚エントロピー算出部21と、ビット配分部22と、窓判定部23と、補正部24と、量子化部25と、履歴データ記憶部30と、を有する。補正部24は、使用率履歴算出部31と、補正ビット数算出部32と、を有する。
ステップS11からS16までは、図3で説明したフローチャートの場合と同じであり、説明は省略する。
ステップS22からS24は、補正された使用可能ビット数に対して処理を行うこと以外は、図3で説明したフローチャートのS17からS19の場合と同じであり、説明は省略する。
現在フレーム番号をn、現在フレームのビット配分処理にて各チャネルに割り当てられた使用可能ビット数をCH1(n),CH2(n)、ロング窓およびショート窓の量子化ビット使用率をそれぞれRateL(n), RateS(n)で表す。なお、各チャネルの窓情報は、CH1=LONG, CH2=SHORTとする。
ステップS32では、過去のフレーム0〜n−1までのフィードバック情報におけるロング窓の量子化ビット平均使用率RateL(n)を、式(1)により導出し、ステップS34に進む。
RateCH1(n)= RateL(n)
RateCH2(n)= RateS(n)
と、予測することができる。
ステップS35では、算出した補正ビット数AdjustBits(n)を、各チャネルのビット配分時の使用可能ビット数に加算(負の場合は減算)する。
[例1: 2つのチャネル(CH1,CH2)の量子化ビット平均使用率が等しい場合]
CH1がロング窓、CH2がショート窓とし、ロング窓とショート窓の量子化ビット使用率を0.8、両チャネル使用可能ビット数を2000ビット、知覚エントロピーによるビット配分比率をCH1:CH2=1:3とし、量子化処理は、CH1を行った後CH2を行うものとする。なお、ビット使用率は、ビット配分時の使用可能ビット数に対する量子化部で使用したビット数の割合である。
CH1:CH2=1:3のビット配分比率で配分するため、CH1=500ビット、CH2=1500ビットが配分される。CH1で量子化が行なわれ、ビット使用率は0.8であるから、400ビットが使用され、100ビットが余る。余った100ビットはCH2に加えられて、CH2には1600ビットが割り当てられる。CH2のビット使用率も0.8であるから、1600×0.8=1280ビットが使用され、320ビットが余る。CH2に最初に配分されたのは1500ビットであるから、CH2のビット使用率は、1280/1500=0.85となる。CH1とCH2で実際に使用されたビット数は、400+1280=1680ビットになる。
上記と同様に、CH1:CH2=1:3のビット配分比率で配分するため、CH1=500ビット、CH2=1500ビットが配分される。次に、前のフレームまでのビット使用率は、ロング窓およびショート窓の両方とも0.8である。したがって、式5は次のようにして解かれる。
(500*1500(0.8-0.8)+500*500*0.8*(1-0.8))/(0.8*(1500+500*0.8))=26.32
CH1がショート窓、CH2がロング窓とし、ショート窓の量子化ビット使用率を0.9、ロング窓の量子化ビット使用率を0.6、両チャネル使用可能ビット数を3000ビット、知覚エントロピーによるビット配分比率をCH1:CH2=3:1とし、量子化処理は、CH1を行った後CH2を行うものとする。
CH1:CH2=3:1のビット配分比率で配分するため、CH1=2250ビット、CH2=750ビットが配分される。CH1で量子化が行なわれ、ショート窓のビット使用率は0.9であるから、2025ビットが使用され、225ビットが余る。余った225ビットはCH2に加えられて、CH2には975ビットが割り当てられる。ロング窓のCH2のビット使用率は0.6であるから、975×0.6=585ビットが使用され、390ビットが余る。CH2に最初に配分されたのは750ビットであるから、CH2のビット使用率は、585/750=0.78となる。
上記と同様に、CH1:CH2=3:1のビット配分比率で配分するため、CH1=2250ビット、CH2=750ビットが配分される。次に、ビット使用率は、ロング窓が0.6、ショート窓が0.9である。したがって、式5は次のようにして解かれる。
(2250*750(0.6-0.9)+2250*2250*0.6*(1-0.9))/(0.9*(750+2250*0.6))=-107.14
CH1がロング窓、CH2がショート窓、CH3がロング窓とし、ショート窓の量子化ビット使用率を0.6、ロング窓の量子化ビット使用率を0.9、両チャネル使用可能ビット数を3000ビット、知覚エントロピーによるビット配分比率をCH1:CH2:CH3=1:3:2とし、量子化処理は、CH1、CH2、CH3の順番で行うものとする。
CH1:CH2:CH3=1:3:2のビット配分比率で配分するため、CH1=500ビット、CH2=1500ビット、CH3=1000ビットが配分される。CH1で量子化が行なわれ、ロング窓のCH1のビット使用率は0.9であるから、450ビットが使用され、50ビットが余る。余った50ビットはCH2に加えられて、CH2には1550ビットが割り当てられる。ショート窓のCH2のビット使用率は0.6であるから、1550×0.6=930ビットが使用され、620ビットが余る。余った620ビットはCH3に加えられて、CH3には1620ビットが割り当てられる。ロング窓のCH3のビット使用率は0.9であるから、1620×0.9=1458ビットが使用される。
CH1に最初に配分されたのは500ビット、CH2に最初に配分されたのは1500ビット、CH3に最初に配分されたのは1000ビットであるから、CH1〜CH3のビット使用率は、0.9、0.62、1.46となる。
上記と同様に、CH1:CH2:CH3=1:3:2のビット配分比率で配分するため、CH1=500ビット、CH2=1500ビット、CH3=1000ビットが配分される。次に、ビット使用率は、ロング窓が0.9、ショート窓が0.6である。3チャネルであるので、式5は使用できず、補正ビット数は、次のようにして求められる。
まず、CH1〜CH3の使用可能ビット数をそれぞれC1〜C3、量子化ビット使用率をR1〜R3とすると、各チャネルに加える補正ビット数A1〜A3は、式6〜式8で求められる。
補正を行った場合の各チャネルの使用可能ビット数とビット使用率は、表6のようになる。
22 ビット配分部
23 窓判定部
24 補正部
25 量子化部
30 履歴データ記憶部
31 使用率履歴算出部
32 補正ビット数算出部
Claims (3)
- フレーム内の総ビット数が上限ビット数以下となるように、複数チャネルのオーディオ信号をそれぞれ符号化するオーディオ信号符号化方法であって、
各チャネルのオーディオ信号の知覚エントロピーを算出し、
前記知覚エントロピーに応じて、各チャネルに使用可能ビット数を配分し、
前記使用可能ビット数を補正し、
前記各チャネルのオーディオ信号を、補正した前記使用可能ビット数以下となるように順次量子化する時に、前記フレーム内で既に量子化したチャネルで実際に量子化に使用されたビット数と前記補正した使用可能ビット数との差である余りビット数を順次後のチャネルの使用可能ビット数に加えながら量子化し、
前記使用可能ビット数の補正は、処理対象のフレームより前のフレームの符号化データに基づいて窓のタイプごとの量子化ビット使用率を算出し、算出した前記量子化ビット使用率で量子化が行われたと仮定した場合の各チャネルの使用可能ビット数に対する使用率が等しくなるように、前記使用可能ビット数を補正する
ことを特徴とするオーディオ信号符号化方法。 - フレーム内の総ビット数が上限ビット数以下となるように、複数チャネルのオーディオ信号をそれぞれ符号化するオーディオ信号符号化装置であって、
各チャネルのオーディオ信号の知覚エントロピーを算出する知覚エントロピー算出部と、
前記知覚エントロピーに応じて、各チャネルの使用可能ビット数を決定するビット配分部と、
前記各チャネルのオーディオ信号の窓のタイプを判定する窓判定部と、
前記使用可能ビット数を補正する補正部と、
前記各チャネルのオーディオ信号を、補正した前記使用可能ビット数以下となるように順次量子化する時に、前記フレーム内で既に量子化したチャネルで実際に量子化に使用されたビット数と補正した使用可能ビット数との差である余りビット数を順次後のチャネルの使用可能ビット数に加えながら量子化する量子化部と、を備え、
前記補正部は、
処理対象のフレームより前の符号化データに基づいて窓のタイプごとの量子化ビット使用率を算出する使用率履歴算出部と、
算出した前記量子化ビット使用率で量子化が行われたと仮定した場合の各チャネルの使用可能ビット数に対する使用率が等しくなるように、前記使用可能ビット数を補正する補正ビット数算出部と、を備えることを特徴とするオーディオ信号符号化装置。 - 前記量子化部が出力するタイプごとの量子化ビット使用率を含む符号化データを記憶する履歴データ記憶部を備え、
前記使用率履歴算出部は、前記履歴データ記憶部に記憶された処理対象のフレームより前の符号化データに基づいて窓のタイプごとの量子化ビット使用率を算出する請求項2記載の複数チャネルオーディオ信号符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011171821A JP5704018B2 (ja) | 2011-08-05 | 2011-08-05 | オーディオ信号符号化方法および装置 |
US13/562,960 US9224401B2 (en) | 2011-08-05 | 2012-07-31 | Audio signal encoding method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011171821A JP5704018B2 (ja) | 2011-08-05 | 2011-08-05 | オーディオ信号符号化方法および装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013037111A true JP2013037111A (ja) | 2013-02-21 |
JP2013037111A5 JP2013037111A5 (ja) | 2014-06-19 |
JP5704018B2 JP5704018B2 (ja) | 2015-04-22 |
Family
ID=47626961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011171821A Active JP5704018B2 (ja) | 2011-08-05 | 2011-08-05 | オーディオ信号符号化方法および装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9224401B2 (ja) |
JP (1) | JP5704018B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016075737A1 (ja) * | 2014-11-10 | 2016-05-19 | 株式会社ワンダーフューチャーコーポレーション | タッチパネル、タッチパネルの製造方法、及びタッチパネル一体型表示装置 |
CN109635209B (zh) * | 2018-12-12 | 2021-03-12 | 广东小天才科技有限公司 | 一种学习内容推荐方法及家教设备 |
CN112599139B (zh) * | 2020-12-24 | 2023-11-24 | 维沃移动通信有限公司 | 编码方法、装置、电子设备及存储介质 |
CN117093182B (zh) * | 2023-10-10 | 2024-04-02 | 荣耀终端有限公司 | 一种音频播放方法、电子设备和计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0758707A (ja) * | 1993-08-20 | 1995-03-03 | Fujitsu Ltd | 量子化ビット割当方式 |
JPH11219197A (ja) * | 1998-02-02 | 1999-08-10 | Fujitsu Ltd | オーディオ信号符号化方法及び装置 |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
JP2006345063A (ja) * | 2005-06-07 | 2006-12-21 | Oki Electric Ind Co Ltd | 量子化装置、符号化装置、量子化方法および符号化方法 |
EP1873753A1 (en) * | 2004-04-01 | 2008-01-02 | Beijing Media Works Co., Ltd | Enhanced audio encoding/decoding device and method |
JP2009116371A (ja) * | 2001-11-14 | 2009-05-28 | Panasonic Corp | 符号化装置および復号化装置 |
JP2010156837A (ja) * | 2008-12-26 | 2010-07-15 | Fujitsu Ltd | オーディオ符号化装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001154695A (ja) | 1999-11-24 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
JP2001154698A (ja) | 1999-11-29 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
US7668715B1 (en) * | 2004-11-30 | 2010-02-23 | Cirrus Logic, Inc. | Methods for selecting an initial quantization step size in audio encoders and systems using the same |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
GB2490879B (en) * | 2011-05-12 | 2018-12-26 | Qualcomm Technologies Int Ltd | Hybrid coded audio data streaming apparatus and method |
-
2011
- 2011-08-05 JP JP2011171821A patent/JP5704018B2/ja active Active
-
2012
- 2012-07-31 US US13/562,960 patent/US9224401B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0758707A (ja) * | 1993-08-20 | 1995-03-03 | Fujitsu Ltd | 量子化ビット割当方式 |
JPH11219197A (ja) * | 1998-02-02 | 1999-08-10 | Fujitsu Ltd | オーディオ信号符号化方法及び装置 |
JP2009116371A (ja) * | 2001-11-14 | 2009-05-28 | Panasonic Corp | 符号化装置および復号化装置 |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
EP1873753A1 (en) * | 2004-04-01 | 2008-01-02 | Beijing Media Works Co., Ltd | Enhanced audio encoding/decoding device and method |
JP2006345063A (ja) * | 2005-06-07 | 2006-12-21 | Oki Electric Ind Co Ltd | 量子化装置、符号化装置、量子化方法および符号化方法 |
JP2010156837A (ja) * | 2008-12-26 | 2010-07-15 | Fujitsu Ltd | オーディオ符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
US20130034233A1 (en) | 2013-02-07 |
JP5704018B2 (ja) | 2015-04-22 |
US9224401B2 (en) | 2015-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230245665A1 (en) | Decoding apparatus and method, and program | |
KR101353216B1 (ko) | 팩토리얼 펄스 코더를 위한 산술 인코딩 | |
EP2159790B1 (en) | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system | |
KR101353170B1 (ko) | 완전히 활용되지 않는 코드 공간을 압축하는데 산술 스테이지를 이용하는 인코더 및 디코더 | |
AU2018200552A1 (en) | Encoding method and apparatus | |
WO2006054583A1 (ja) | オーディオ信号符号化装置および方法 | |
US20090132238A1 (en) | Efficient method for reusing scale factors to improve the efficiency of an audio encoder | |
JP5704018B2 (ja) | オーディオ信号符号化方法および装置 | |
JP5201375B2 (ja) | チャネル間及び一時的冗長度抑圧を用いた音声信号符号化 | |
JP2019529979A (ja) | インデックスコーディング及びビットスケジューリングを備えた量子化器 | |
JP7257965B2 (ja) | デジタルオーディオ信号における差分データ | |
MX2012002182A (es) | Determinacion de factor de escala de banda de frecuencia en la codificacion de audio con base en la energia de señal de banda de frecuencia. | |
US8576910B2 (en) | Parameter selection method, parameter selection apparatus, program, and recording medium | |
US8593321B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
WO2015146224A1 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
US8601039B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
JPH0969781A (ja) | オーディオデータ符号化装置 | |
JP2014085542A (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム | |
WO2017109865A1 (ja) | データ圧縮装置、データ伸長装置、データ圧縮プログラム、データ伸長プログラム、データ圧縮方法及びデータ伸長方法 | |
JP3889738B2 (ja) | 逆量子化装置、オーディオ復号化装置、画像復号化装置、逆量子化方法および逆量子化プログラム | |
US20120143614A1 (en) | Encoding apparatus, encoding method, decoding apparatus, decoding method, and program | |
JP2002311997A (ja) | オーディオ信号符号化装置 | |
JP2023523074A (ja) | 線形予測符号化パラメータの符号化方法および符号化装置 | |
JP2003108192A (ja) | オーディオ信号符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140502 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140502 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5704018 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |