JP5539992B2 - レート制御装置、レート制御方法及びレート制御プログラム - Google Patents
レート制御装置、レート制御方法及びレート制御プログラム Download PDFInfo
- Publication number
- JP5539992B2 JP5539992B2 JP2011527482A JP2011527482A JP5539992B2 JP 5539992 B2 JP5539992 B2 JP 5539992B2 JP 2011527482 A JP2011527482 A JP 2011527482A JP 2011527482 A JP2011527482 A JP 2011527482A JP 5539992 B2 JP5539992 B2 JP 5539992B2
- Authority
- JP
- Japan
- Prior art keywords
- nmr
- scale factor
- rate
- rate control
- candidate value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Description
まず、各バンドごとに与えられたスケール・ファクタで符号量を計算する(S101)。次に、符号量が平均ビットレート以下か否かを判断する(S102)。符号量が平均ビットレートを上回ると判断された場合は、全てのバンドのスケール・ファクタを大きくし(S103)、処理はS101に戻る。符号量が平均ビットレート以下と判断された場合、処理を終了する。
<本発明のレート制御の原理>
図1に信号エネルギー、ノイズ・エネルギーとマスク・エネルギーの関係の一例を示す。本明細書では特に断らない限りNMRとして、そのデシベル値NMRdBを用いる。NMRdBを以下のように定義する。
図6に本発明の一実施の形態のレート制御装置を制御部に含むオーディオ符号化装置の機能ブロック図を示す。
図6に示すように、オーディオ符号化装置10は、聴覚心理分析部11と、フィルタ・バンク12と、TNS(Temporal Noise Shaping:時間領域ノイズ整形)部13と、M/S(Middle/Side(ミドル/サイド))ステレオ部14と、本実施の形態のレート制御装置15と、量子化部16と、エントロピー符号化部17と、ビット・ストリーム生成部18を備える。オーディオ符号化装置10は、入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行い、符号化ビット・ストリームをビット・ストリーム生成部18から出力する。
2 スケール・ファクタ決定部
3 記憶部
10 オーディオ符号化装置(音声符号化装置)
11 聴覚心理分析部
12 フィルタ・バンク
13 TNS部
14 M/Sステレオ部
15 レート制御装置
16 量子化部
17 エントロピー符号化部
18 ビット・ストリーム生成部
20 制御部
Claims (10)
- 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化装置において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御装置であって、
目標レートを超えないNMRを2分探索によって決定するNMR決定部と、
スケール・ファクタ・バンドごとに、前記NMR決定部によって決定したNMRに対応する最大のスケール・ファクタを2分探索によって決定するスケール・ファクタ決定部と、
を含み、
前記NMR決定部が、NMRを2分探索する際に候補となるNMR候補値を選定する都度、前記スケール・ファクタ決定部が前記NMR候補値に対するスケール・ファクタとレートを決定し、
前記NMR決定部は、前記スケール・ファクタ決定部で決定したスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分に基づいて目標レートを超えない最小のNMRを最適なNMRとして決定する、前記レート制御装置。 - 前記NMR決定部は、
NMR予測値と、該NMR予測値に対するレートに対して対応するレートが前記目標レートを挟むようにして選定したNMR候補値により確定される区間から、2分探索を開始する、請求項1記載のレート制御装置。 - 前記スケール・ファクタ決定部は、
スケール・ファクタ・バンドごとに、周波数スペクトルの量子化値の絶対値が既定された最大値を超えないスケール・ファクタのうち最小のスケール・ファクタを西のスケール・ファクタとし、周波数スペクトルの量子化値がすべてゼロになるスケール・ファクタのうち最小のスケール・ファクタを東のスケール・ファクタとして算出し、前記西のスケール・ファクタと前記東のスケール・ファクタとによって画定される区間から、前記NMR決定部が選定したNMR候補値に対応する最大のスケール・ファクタの2分探索を開始する、請求項1記載のレート制御装置。 - 前記スケール・ファクタ決定部は、前記スケール・ファクタ決定部が算出した西のスケール・ファクタと東のスケール・ファクタに基づいてNMRの最小値と最大値を算出し、
前記スケール・ファクタ決定部は、
前記NMR候補値が最小のNMRを下回る場合は前記西のスケール・ファクタを前記NMR候補値に対するスケール・ファクタとして決定し、
前記NMR候補値が最大のNMRを上回る場合は前記東のスケール・ファクタを前記NMR候補値に対するスケール・ファクタとして決定する、請求項3記載のレート制御装置。 - さらに、前記スケール・ファクタ決定部が実行する2分検索の過程を記憶する記憶部を備え、
前記スケール・ファクタ決定部は、前記記憶部に記憶された2分検索の過程に基づいて2分検索を実行する、請求項1記載のレート制御装置。 - 前記目標レートは、所定の範囲で変動可能である、請求項1記載のレート制御装置。
- 前記NMR決定部は、NMR予測値に基づいて算出したレートが前記所定の範囲の中にある場合、前記NMRを最適なNMRとして決定する、請求項6記載のレート制御装置。
- 前記NMR決定部は、前記フレームが符号化されるごとに、NMRの予測値を更新する、請求項1記載のレート制御装置。
- 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化方法において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御方法であって、
目標レートを超えないNMRを2分探索によって決定するNMR決定ステップと、
スケール・ファクタ・バンドごとに、前記NMR決定ステップで決定されたNMRに対応する最大のスケール・ファクタを2分探索によって決定するスケール・ファクタ決定ステップであって、NMRを2分探索する際に候補となるNMR候補値が前記NMR決定ステップで選定される都度、前記NMR候補値に対するスケール・ファクタを決定するスケール・ファクタ決定ステップと、
前記スケール・ファクタ決定ステップで決定されたスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分を評価して、前記NMR候補値が目標レートを超えない最小のNMRであるか否かを判断する評価ステップと、
を含み、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRであると判断された場合は、前記NMR候補値を最適なNMRとして決定し、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRでないと判断された場合は、前記NMR決定ステップから前記評価ステップまでを反復する、前記レート制御方法。 - 入力信号から生成したフレームを複数のスケール・ファクタ・バンドに分割し、前記複数のスケール・ファクタ・バンドの各々をスケール・ファクタを用いて符号化を行う音声符号化方法において、ノイズ・エネルギーと所定の聴覚心理モデルに基づくマスク・エネルギーとの比であるNMRに基づくレート制御を行うレート制御処理をコンピュータに実行させるレート制御プログラムであって、
前記レート制御処理は、
目標レートを超えないNMRを2分探索によって決定するNMR決定ステップと、
スケール・ファクタ・バンドごとに、前記NMR決定ステップで決定されたNMRに対応する最大のスケール・ファクタとレートを2分探索によって決定するスケール・ファクタ決定ステップであって、NMRを2分探索する際に候補となるNMR候補値が前記NMR決定ステップで選定される都度、前記NMR候補値に対するスケール・ファクタを決定するスケール・ファクタ決定ステップと、
前記スケール・ファクタ決定ステップで決定されたスケール・ファクタに基づいて算出した前記NMR候補値に対するレートと前記目標レートとの差分を評価して、前記NMR候補値が目標レートを超えない最小のNMRであるか否かを判断する評価ステップと、
を含み、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRであると判断された場合は、前記NMR候補値を最適なNMRとして決定し、
前記評価ステップで前記NMR候補値が目標レートを超えない最小のNMRでないと判断された場合は、前記NMR決定ステップから前記評価ステップまでを反復するようになっており、
前記NMR決定ステップと前記評価ステップとを外部ループとして、前記スケール・ファクタ決定ステップを内部ループとしてコンピュータに実行させる、レート制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/003966 WO2011021238A1 (ja) | 2009-08-20 | 2009-08-20 | レート制御装置、レート制御方法及びレート制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011021238A1 JPWO2011021238A1 (ja) | 2013-01-17 |
JP5539992B2 true JP5539992B2 (ja) | 2014-07-02 |
Family
ID=43606709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011527482A Active JP5539992B2 (ja) | 2009-08-20 | 2009-08-20 | レート制御装置、レート制御方法及びレート制御プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9159330B2 (ja) |
JP (1) | JP5539992B2 (ja) |
WO (1) | WO2011021238A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5985850B2 (ja) * | 2012-03-27 | 2016-09-06 | ラピスセミコンダクタ株式会社 | 基準電圧調整部を含む半導体集積装置及び基準電圧調整方法 |
US10553228B2 (en) * | 2015-04-07 | 2020-02-04 | Dolby International Ab | Audio coding with range extension |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10762910B2 (en) | 2018-06-01 | 2020-09-01 | Qualcomm Incorporated | Hierarchical fine quantization for audio coding |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651795A (ja) * | 1992-03-02 | 1994-02-25 | American Teleph & Telegr Co <Att> | 信号量子化装置及びその方法 |
JPH07210195A (ja) * | 1993-12-30 | 1995-08-11 | Internatl Business Mach Corp <Ibm> | 高品質ディジタル・オーディオの効率的な圧縮のための方法および装置 |
JPH10136362A (ja) * | 1996-10-29 | 1998-05-22 | Sony Corp | データ圧縮装置およびディジタルビデオ信号処理装置 |
JPH10207489A (ja) * | 1997-01-22 | 1998-08-07 | Sharp Corp | デジタルデータの符号化方法 |
JP2000501846A (ja) * | 1995-12-01 | 2000-02-15 | デジタル・シアター・システムズ・インコーポレーテッド | 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ |
JP2004172770A (ja) * | 2002-11-18 | 2004-06-17 | Tokai Univ | 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
SG120118A1 (en) * | 2003-09-15 | 2006-03-28 | St Microelectronics Asia | A device and process for encoding audio data |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
-
2009
- 2009-08-20 WO PCT/JP2009/003966 patent/WO2011021238A1/ja active Application Filing
- 2009-08-20 JP JP2011527482A patent/JP5539992B2/ja active Active
- 2009-08-20 US US13/391,264 patent/US9159330B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651795A (ja) * | 1992-03-02 | 1994-02-25 | American Teleph & Telegr Co <Att> | 信号量子化装置及びその方法 |
JPH07210195A (ja) * | 1993-12-30 | 1995-08-11 | Internatl Business Mach Corp <Ibm> | 高品質ディジタル・オーディオの効率的な圧縮のための方法および装置 |
JP2000501846A (ja) * | 1995-12-01 | 2000-02-15 | デジタル・シアター・システムズ・インコーポレーテッド | 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ |
JPH10136362A (ja) * | 1996-10-29 | 1998-05-22 | Sony Corp | データ圧縮装置およびディジタルビデオ信号処理装置 |
JPH10207489A (ja) * | 1997-01-22 | 1998-08-07 | Sharp Corp | デジタルデータの符号化方法 |
JP2004172770A (ja) * | 2002-11-18 | 2004-06-17 | Tokai Univ | 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2011021238A1 (ja) | 2011-02-24 |
JPWO2011021238A1 (ja) | 2013-01-17 |
US20120263312A1 (en) | 2012-10-18 |
US9159330B2 (en) | 2015-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2696292C2 (ru) | Аудиокодер и декодер | |
JP5474088B2 (ja) | スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 | |
KR101190875B1 (ko) | 차원 벡터 및 가변 분해능 양자화 | |
KR101175651B1 (ko) | 다중 압축 부호화 방법 및 장치 | |
JP6452759B2 (ja) | 先進量子化器 | |
CN101057275B (zh) | 矢量变换装置以及矢量变换方法 | |
KR101693280B1 (ko) | 오디오 데이터 처리 방법, 장치 및 시스템 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP5539992B2 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
WO2011045926A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
JP2005345707A (ja) | 音声処理装置及び音声符号化方法 | |
JP4273062B2 (ja) | 符号化方法、符号化装置、復号化方法及び復号化装置 | |
RU2793725C2 (ru) | Аудиокодер и декодер | |
EP2526546A1 (en) | Method and device for determining a number of bits for encoding an audio signal | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2002311993A (ja) | オーディオ符号化装置 | |
Krasner et al. | Efficient Encoding and Decoding of Speech. | |
SECTOR et al. | ITU-Tg. 711.0 | |
JPH03243996A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5539992 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140501 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |