JPWO2011021238A1 - レート制御装置、レート制御方法及びレート制御プログラム - Google Patents
レート制御装置、レート制御方法及びレート制御プログラム Download PDFInfo
- Publication number
- JPWO2011021238A1 JPWO2011021238A1 JP2011527482A JP2011527482A JPWO2011021238A1 JP WO2011021238 A1 JPWO2011021238 A1 JP WO2011021238A1 JP 2011527482 A JP2011527482 A JP 2011527482A JP 2011527482 A JP2011527482 A JP 2011527482A JP WO2011021238 A1 JPWO2011021238 A1 JP WO2011021238A1
- Authority
- JP
- Japan
- Prior art keywords
- nmr
- scale factor
- rate
- rate control
- candidate value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 46
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000008569 process Effects 0.000 claims description 30
- 238000001228 spectrum Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000007774 longterm Effects 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
まず、各バンドごとに与えられたスケール・ファクタで符号量を計算する(S101)。次に、符号量が平均ビットレート以下か否かを判断する(S102)。符号量が平均ビットレートを上回ると判断された場合は、全てのバンドのスケール・ファクタを大きくし(S103)、処理はS101に戻る。符号量が平均ビットレート以下と判断された場合、処理を終了する。
<本発明のレート制御の原理>
図1に信号エネルギー、ノイズ・エネルギーとマスク・エネルギーの関係の一例を示す。本明細書では特に断らない限りNMRとして、そのデシベル値NMRdBを用いる。NMRdBを以下のように定義する。
図6に本発明の一実施の形態のレート制御装置を制御部に含むオーディオ符号化装置の機能ブロック図を示す。
図6に示すように、オーディオ符号化装置10は、聴覚心理分析部11と、フィルタ・バンク12と、TNS(Temporal Noise Shaping:時間領域ノイズ整形)部13と、M/S(Middle/Side(ミドル/サイド))ステレオ部14と、本実施の形態のレート制御装置15と、量子化部16と、エントロピー符号化部17と、ビット・ストリーム生成部18を備える。オーディオ符号化装置10は、入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行い、符号化ビット・ストリームをビット・ストリーム生成部18から出力する。
2 スケール・ファクタ決定部
3 記憶部
10 オーディオ符号化装置(音声符号化装置)
11 聴覚心理分析部
12 フィルタ・バンク
13 TNS部
14 M/Sステレオ部
15 レート制御装置
16 量子化部
17 エントロピー符号化部
18 ビット・ストリーム生成部
20 制御部
Claims (10)
- 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化装置において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御装置であって、
目標レートを超えないNMRを2分探索によって決定するNMR決定部と、
スケール・ファクタ・バンドごとに、前記NMR決定部によって決定したNMRに対応する最大のスケール・ファクタを2分探索によって決定するスケール・ファクタ決定部と、
を含み、
前記NMR決定部が、NMRを2分探索する際に候補となるNMR候補値を選定する都度、前記スケール・ファクタ決定部が前記NMR候補値に対するスケール・ファクタとレートを決定し、
前記NMR決定部は、前記スケール・ファクタ決定部で決定したスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分に基づいて目標レートを超えない最小のNMRを最適なNMRとして決定する、前記レート制御装置。 - 前記NMR決定部は、
NMR予測値と、該NMR予測値に対するレートに対して対応するレートが前記目標レートを挟むようにして選定したNMR候補値により確定される区間から、2分探索を開始する、請求項1記載のレート制御装置。 - 前記スケール・ファクタ決定部は、
スケール・ファクタ・バンドごとに、周波数スペクトルの量子化値の絶対値が既定された最大値を超えないスケール・ファクタのうち最小のスケール・ファクタを西のスケール・ファクタとし、周波数スペクトルの量子化値がすべてゼロになるスケール・ファクタのうち最小のスケール・ファクタを東のスケール・ファクタとして算出し、前記西のスケール・ファクタと前記東のスケール・ファクタとによって画定される区間から、前記NMR決定部が選定したNMR候補値に対応する最大のスケール・ファクタの2分探索を開始する、請求項1記載のレート制御装置。 - 前記スケール・ファクタ決定部は、前記スケール・ファクタ決定部が算出した西のスケール・ファクタと東のスケール・ファクタに基づいてNMRの最小値と最大値を算出し、
前記スケール・ファクタ決定部は、
前記NMR候補値が最小のNMRを下回る場合は前記西のスケール・ファクタを前記NMR候補値に対するスケール・ファクタとして決定し、
前記NMR候補値が最大のNMRを上回る場合は前記東のスケール・ファクタを前記NMR候補値に対するスケール・ファクタとして決定する、請求項3記載のレート制御装置。 - さらに、前記スケール・ファクタ決定部が実行する2分検索の過程を記憶する記憶部を備え、
前記スケール・ファクタ決定部は、前記記憶部に記憶された2分検索の過程に基づいて2分検索を実行する、請求項1記載のレート制御装置。 - 前記目標レートは、所定の範囲で変動可能である、請求項1記載のレート制御装置。
- 前記NMR決定部は、NMR予測値に基づいて算出したレートが前記所定の範囲の中にある場合、前記NMRを最適なNMRとして決定する、請求項6記載のレート制御装置。
- 前記NMR決定部は、前記フレームが符号化されるごとに、NMRの予測値を更新する、請求項1記載のレート制御装置。
- 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化方法において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御方法であって、
目標レートを超えないNMRを2分探索によって決定するNMR決定ステップと、
スケール・ファクタ・バンドごとに、前記NMR決定ステップで決定されたNMRに対応する最大のスケール・ファクタを2分探索によって決定するスケール・ファクタ決定ステップと、
前記スケール・ファクタ決定ステップで決定されたスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分を評価して、前記NMR候補値が目標レートを超えない最小のNMRであるか否かを判断する評価ステップと、
を含み、
前記NMR決定ステップで、NMRを2分探索する際に候補となるNMR候補値が選定される都度、前記スケール・ファクタ決定ステップで、前記NMRの候補値に対するスケール・ファクタが決定され、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRであると判断された場合は、前記NMR候補値を最適なNMRとして決定し、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRでないと判断された場合は、前記NMR決定ステップから前記評価ステップまでを反復する、前記レート制御方法。 - 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化方法において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御処理をコンピュータに実行させるレート制御プログラムであって、
前記レート制御処理は、
目標レートを超えないNMRを2分探索によって決定するNMR決定ステップと、
スケール・ファクタ・バンドごとに、前記NMR決定ステップで決定されたNMRに対応する最大のスケール・ファクタとレートを2分探索によって決定するスケール・ファクタ決定ステップと、
前記スケール・ファクタ決定ステップで決定されたスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分を評価して、前記NMR候補値が目標レートを超えない最小のNMRであるか否かを判断する評価ステップと、
を含み、
前記NMR決定ステップで、NMRを2分探索する際に候補となるNMR候補値が選定される都度、前記スケール・ファクタ決定ステップで、前記NMRの候補値に対するスケール・ファクタが決定され、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRであると判断された場合は、前記NMR候補値を最適なNMRとして決定し、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRでないと判断された場合は、前記NMR決定ステップから前記評価ステップまでを反復するようになっており、
前記NMR決定ステップと前記評価ステップとを外部ループとして、前記スケール・ファクタ決定ステップを内部ループとしてコンピュータに実行させる、レート制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/003966 WO2011021238A1 (ja) | 2009-08-20 | 2009-08-20 | レート制御装置、レート制御方法及びレート制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011021238A1 true JPWO2011021238A1 (ja) | 2013-01-17 |
JP5539992B2 JP5539992B2 (ja) | 2014-07-02 |
Family
ID=43606709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011527482A Active JP5539992B2 (ja) | 2009-08-20 | 2009-08-20 | レート制御装置、レート制御方法及びレート制御プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9159330B2 (ja) |
JP (1) | JP5539992B2 (ja) |
WO (1) | WO2011021238A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5985850B2 (ja) * | 2012-03-27 | 2016-09-06 | ラピスセミコンダクタ株式会社 | 基準電圧調整部を含む半導体集積装置及び基準電圧調整方法 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10762910B2 (en) | 2018-06-01 | 2020-09-01 | Qualcomm Incorporated | Hierarchical fine quantization for audio coding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US5764698A (en) * | 1993-12-30 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for efficient compression of high quality digital audio |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JPH10136362A (ja) * | 1996-10-29 | 1998-05-22 | Sony Corp | データ圧縮装置およびディジタルビデオ信号処理装置 |
JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
JP4148356B2 (ja) * | 2002-11-18 | 2008-09-10 | 学校法人東海大学 | 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム |
SG120118A1 (en) * | 2003-09-15 | 2006-03-28 | St Microelectronics Asia | A device and process for encoding audio data |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
-
2009
- 2009-08-20 US US13/391,264 patent/US9159330B2/en active Active
- 2009-08-20 JP JP2011527482A patent/JP5539992B2/ja active Active
- 2009-08-20 WO PCT/JP2009/003966 patent/WO2011021238A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP5539992B2 (ja) | 2014-07-02 |
US20120263312A1 (en) | 2012-10-18 |
US9159330B2 (en) | 2015-10-13 |
WO2011021238A1 (ja) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2696292C2 (ru) | Аудиокодер и декодер | |
JP5474088B2 (ja) | スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 | |
KR101190875B1 (ko) | 차원 벡터 및 가변 분해능 양자화 | |
KR101143724B1 (ko) | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 | |
JP6452759B2 (ja) | 先進量子化器 | |
CN101057275B (zh) | 矢量变换装置以及矢量变换方法 | |
KR101693280B1 (ko) | 오디오 데이터 처리 방법, 장치 및 시스템 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR20060131782A (ko) | 최적의 다중 부호화 방법 | |
JP5539992B2 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JPH1130998A (ja) | オーディオ信号符号化装置,及び復号化装置、オーディオ信号符号化・復号化方法 | |
JPWO2011045926A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP2006011170A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2005345707A (ja) | 音声処理装置及び音声符号化方法 | |
JP4273062B2 (ja) | 符号化方法、符号化装置、復号化方法及び復号化装置 | |
JP2010532489A (ja) | デジタルオーディオ信号の符号化 | |
JP2005128404A (ja) | 音声処理装置及び音声符号化方法 | |
RU2793725C2 (ru) | Аудиокодер и декодер | |
EP2526546A1 (en) | Method and device for determining a number of bits for encoding an audio signal | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP2002311993A (ja) | オーディオ符号化装置 | |
Krasner et al. | Efficient Encoding and Decoding of Speech. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5539992 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140501 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |