JP2007017659A - オーディオ符号化方法及び装置 - Google Patents
オーディオ符号化方法及び装置 Download PDFInfo
- Publication number
- JP2007017659A JP2007017659A JP2005198458A JP2005198458A JP2007017659A JP 2007017659 A JP2007017659 A JP 2007017659A JP 2005198458 A JP2005198458 A JP 2005198458A JP 2005198458 A JP2005198458 A JP 2005198458A JP 2007017659 A JP2007017659 A JP 2007017659A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- initial value
- search window
- distortion amount
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】 オーディオ情報をデジタル圧縮する場合に、量子化後の量子化歪量及び符号化後の符号量の評価を行ない、適切な評価結果が得られるまでループ処理により量子化ステップを更新する装置において、該量子化ステップの探索窓の初期値を最適制御する初期値制御手段3aを具備して構成される。
【選択図】 図1
Description
ただし、Ax,Ay,Bx,Byは以下の値とする。
Ay:startの量子化誤差 By:endの量子化誤差
また、図8中の推定方法2は、startとendの量子化誤差量を用いない推定方法である。例として(2)式に示すように、startとendの中間点を量子化ステップとする方法がある。
従来のこの種のシステムとしては、入力されるオーディオ信号を直交変換して変換係数を算出する直交変換手段と、入力されたオーディオデータを分析して許容歪量を算出する聴覚モデル手段と、前記変換係数を指示されたスケーリング係数でスケーリング手段と、前記スケーリングされた変換係数を指示された量子化ステップで量子化する量子化手段と、前記量子化された変換係数を可変長符号化して出力する可変長符号化手段と、量子化後の量子化歪量及び符号化後の符号量の評価を行ない、適切な評価結果が得られるまで前記スケーリング係数及び前記量子化ステップを更新して反復処理を指示する符号量歪制御手段と、前記量子化ステップの初期値を最適制御する初期値制御手段とを備えたものであって、フィードバックによる符号化パラメータ決定までの所要を短くでき、符号量制御が高速に収束することができるオーディオ符号化装置及びオーディオ符号化方法が知られている(例えば特許文献1参照)。
また、ピッチ予測レギュラーパルス音声符号化法において、駆動音源の振幅は、各フレーム間の相関があることを利用し、前のフレームでの駆動音源振幅最大値と量子化器の擬似量子化範囲から適応的に現フレームの量子化器の擬似量子化範囲を推定して、駆動音源の振幅の小さい時には振幅量子化範囲を小さくし、逆に駆動騒音源の振幅の小さいときには振幅量子化範囲を小さくし、逆に駆動音源が大きい時には振幅量子化範囲を大きくして、量子化ビット数が同じ場合、駆動音源信号の量子化誤差を小さくすることができる技術が知られている(例えば特許文献3参照)。
(2)請求項2記載の発明は、オーディオ情報をデジタル圧縮する場合に、量子化後の量子化歪量及び符号化後の符号量の評価を行ない、適切な評価結果が得られるまでループ処理により量子化ステップを更新する装置において、該量子化ステップの探索窓の初期値を前回の目標量子化歪量と今回の目標量子化歪量をもとに最適制御する探索窓初期値制御手段を具備したことを特徴とする。
(3)請求項3記載の発明は、前記探索窓の初期値制御手段は、前回の探索時の目標量子化歪量と、今回の探索の目標量子化歪量の差の絶対値により、探索窓の初期値を決めることを特徴とする。
(4)請求項4記載の発明は、前記探索窓の初期値制御手段は、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により、探索窓の初期値を求めることを特徴とする。
(5)請求項5記載の発明は、前記探索窓の初期値制御手段は、前回の探索時の目標量子化歪量と、今回の探索の目標量子化歪量の差の絶対値と、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により、探索窓の初期値を決めることを特徴とする。
(2)請求項2記載の発明によれば、量子化ステップの探索窓の初期値を最適制御することで、ループ処理に要する時間を短縮することができる。
(3)請求項3記載の発明によれば、前回の探索時の目標量子化歪量と今回の探索の目標量子化歪量の差の絶対値により探索窓の初期値を決めることで、量子化・可変符号化の処理時間を短かくすることができる。
(4)請求項4記載の発明によれば、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により探索窓の初期値を決めることで、量子化・可変長符号化部の処理時間を短かくすることができる。
(5)請求項5記載の発明によれば、今回の探索の目標量子化歪量の差の絶対値と、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により探索窓の初期値を決めることで、処理に要する時間を短かくすることができる。
図1は本発明の一実施の形態例を示すブロック図である。図6と同一のものは、同一の符号を付して示す。入力データであるオーディオデータは、DCT等の直交変換手段を用いた直交変換部1により周波数データへの変換を行なう。また、この周波数データは聴覚モデル算出部2に入り、該聴覚モデル算出部2により聴覚モデルが算出される。算出された聴覚モデルは、目標量子化歪量・目標符号化量算出部4に入る。
次に、探索窓の開始位置をstart、探索窓の終了位置をend、X0〜Xnを探索窓の設定値としてstartとendはそれぞれ次式で表わされる(S2)。
end=量子化ステップ初期値−X0
次に、、Th1〜Thnを閾値としてDeltaと閾値との比較を行なう(S3)。
ここで、Th1は1番目の閾値である。Delta>Th1が成立しない時には、ステップS9にスキップする。Delta>Th1が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S4)。
end=量子化ステップ初期値−X1
次に、Deltaと2番目の閾値Th2との比較を行なう(S5)。
Delta>Th2が成立しない時には、ステップS9にスキップする。Delta>Th2が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S6)
start=量子化ステップ初期値−X2
end=量子化ステップ初期値−X2
以上のような処理を繰り返す。そして、Deltaとn番目の閾値Thnとの比較を行なう(S7)
Delta>Thn
Delta>Thnが成立しない時には、ステップS9にスキップする。Delta>Thnが成立する時には、以下の計算を行なう(S8)。
end=量子化ステップ初期値−Xn
次に前回の目標量子化歪量を更新する(S9)。
q_ref_old=q_ref
以上のシーケンスにより処理が終了する。
次に、探索窓の開始位置をstart、探索窓の終了位置をend、X2_0〜X2_nを探索窓の設定値としてstartとendはそれぞれ次式で表わされる(S2)。
end=量子化ステップ初期値−X2_0
次に、、Th2_1〜Th2_nを閾値としてDeltaと閾値との比較を行なう(S3)。
ここで、Th2_1は1番目の閾値である。Delta2>Th2_1が成立しない時には処理は終了する。Delta2>Th2_1が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S4)。
end=量子化ステップ初期値−X2_1
次に、Delta2と2番目の閾値Th2_2との比較を行なう(S5)。
Delta2>Th2_2が成立しない時には、処理は終了する。Delta2>Th2_2が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S6)
start=量子化ステップ初期値−X2_2
end=量子化ステップ初期値−X2_2
以上のような処理を繰り返す。そして、Delta2とn番目の閾値Th2_nとの比較を行なう(S7)
Delta2>Th2_n
Delta2>Th2_nが成立しない時には、処理を終了する。Delta2>Th2_nが成立する時には、以下の計算を行なう(S8)。
end=量子化ステップ初期値−X2_n
以上のシーケンスにより処理が終了する。
先ずDeltaの計算を行なう(S1)。ここで、Deltaは前回の目標量子化歪量をq_ref_old、今回の目標量子化歪量をq_refとして次式で表わされる。
次に、探索窓の開始位置をstart、探索窓の終了位置をend、X0〜Xnを探索窓の設定値として次式でstartとendはそれぞれ次式で表わされる(S2)。
end=量子化ステップ初期値−X0
次に、、Th1〜Thnを閾値としてDeltaと閾値との比較を行なう(S3)。
ここで、Th1は1番目の閾値である。Delta>Th1が成立しない時には、ステップS9にスキップする。Delta>Th1が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S4)。
end=量子化ステップ初期値−X1
次に、Deltaと2番目の閾値Th2との比較を行なう(S5)。
Delta>Th2が成立しない時には、ステップS9にスキップする。Delta>Th2が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S6)
start=量子化ステップ初期値−X2
end=量子化ステップ初期値−X2
以上のような処理を繰り返す。そして、Deltaとn番目の閾値Thnとの比較を行なう(S7)
Delta>Thn
Delta>Thnが成立しない時には、ステップS9にスキップする。Delta>Thnが成立する時には、以下の計算を行なう(S8)。
end=量子化ステップ初期値−Xn
次に前回の目標量子化歪量を更新(q_ref_old=q_ref)とする(S9)。
次に、探索窓の開始位置をstart、探索窓の終了位置をend、X2_0〜X2_nを探索窓の設定値、th2_1th2_nとしてstartとendはそれぞれ次式で表わされる(S12)。
end=量子化ステップ初期値−X2_0
次に、、Th2_1〜Th2_nを閾値としてDeltaと閾値との比較を行なう(S13)。
ここで、Th2_1は1番目の閾値である。Delta2>Th2_1が成立しない時には処理は終了する。Delta2>Th2_1が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S14)。
end=量子化ステップ初期値−X2_1
次に、Deltaと2番目の閾値Th2_2との比較を行なう(S15)。
Delta2>Th2_2が成立しない時には、処理は終了する。Delta2>Th2_2が成立する場合には、探索窓の設定値を変えて以下の計算を行なう(S16)
start=量子化ステップ初期値−X2_2
end=量子化ステップ初期値−X2_2
以上のような処理を繰り返す。そして、Delta2とn番目の閾値Th2_nとの比較を行なう(S17)
Delta2>Th2_n
Delta2>Th2_nが成立しない時には、処理を終了する。Delta2>Th2_nが成立する時には、以下の計算を行なう(S18)。
end=量子化ステップ初期値−X2_n
以上のシーケンスにより処理が終了する。
2 聴覚モデル算出部
3 量子化・可変長符号化部
3a 探索窓初期値制御部
4 目標量子化歪量・目標符合化量算出部
Claims (5)
- オーディオ情報をディジタル圧縮する場合に、量子化後の量子化歪量及び符号化後の符号量の評価を行ない、適切な評価結果が得られるまでループ処理により量子化ステップを更新する場合において、
該量子化ステップの探索窓の初期値を前回の目標量子化歪量と今回の目標量子化歪量をもとに最適制御するようにしたことを特徴とするオーディオ符号化方法。 - オーディオ情報をデジタル圧縮する場合に、量子化後の量子化歪量及び符号化後の符号量の評価を行ない、適切な評価結果が得られるまでループ処理により量子化ステップを更新する装置において、
該量子化ステップの探索窓の初期値を前回の目標量子化歪量と今回の目標量子化歪量を基に最適制御する探索窓初期値制御手段を具備したことを特徴とするオーディオ符号化装置。 - 前記探索窓の初期値制御手段は、前回の探索時の目標量子化歪量と、今回の探索の目標量子化歪量の差の絶対値により、探索窓の初期値を決めることを特徴とする請求項2記載のオーディオ符号化装置。
- 前記探索窓の初期値制御手段は、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により、探索窓の初期値を求めることを特徴とする請求項2記載のオーディオ符号化装置。
- 前記探索窓の初期値制御手段は、前回の探索時の目標量子化歪量と、今回の探索の目標量子化歪量の差の絶対値と、前回の量子化歪量で求めた量子化ステップと符号量の評価で求まった量子化ステップの差の絶対値により、探索窓の初期値を決めることを特徴とする請求項2記載のオーディオ符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005198458A JP2007017659A (ja) | 2005-07-07 | 2005-07-07 | オーディオ符号化方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005198458A JP2007017659A (ja) | 2005-07-07 | 2005-07-07 | オーディオ符号化方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007017659A true JP2007017659A (ja) | 2007-01-25 |
Family
ID=37754891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005198458A Withdrawn JP2007017659A (ja) | 2005-07-07 | 2005-07-07 | オーディオ符号化方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007017659A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012060210A (ja) * | 2010-09-06 | 2012-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 適応量子化方法,適応量子化装置および適応量子化プログラム |
CN111862995A (zh) * | 2020-06-22 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 一种码率确定模型训练方法、码率确定方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219197A (ja) * | 1998-02-02 | 1999-08-10 | Fujitsu Ltd | オーディオ信号符号化方法及び装置 |
JP2000347679A (ja) * | 1999-06-07 | 2000-12-15 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
JP2001306095A (ja) * | 2000-04-18 | 2001-11-02 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
JP2002311993A (ja) * | 2001-04-17 | 2002-10-25 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP2003101418A (ja) * | 2001-09-26 | 2003-04-04 | Tokai Univ | 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム |
JP2004021153A (ja) * | 2002-06-20 | 2004-01-22 | Toshiba Corp | オーディオ信号符号化装置 |
JP2004172770A (ja) * | 2002-11-18 | 2004-06-17 | Tokai Univ | 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム |
-
2005
- 2005-07-07 JP JP2005198458A patent/JP2007017659A/ja not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219197A (ja) * | 1998-02-02 | 1999-08-10 | Fujitsu Ltd | オーディオ信号符号化方法及び装置 |
JP2000347679A (ja) * | 1999-06-07 | 2000-12-15 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
JP2001306095A (ja) * | 2000-04-18 | 2001-11-02 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
JP2002311993A (ja) * | 2001-04-17 | 2002-10-25 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP2003101418A (ja) * | 2001-09-26 | 2003-04-04 | Tokai Univ | 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム |
JP2004021153A (ja) * | 2002-06-20 | 2004-01-22 | Toshiba Corp | オーディオ信号符号化装置 |
JP2004172770A (ja) * | 2002-11-18 | 2004-06-17 | Tokai Univ | 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012060210A (ja) * | 2010-09-06 | 2012-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 適応量子化方法,適応量子化装置および適応量子化プログラム |
CN111862995A (zh) * | 2020-06-22 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 一种码率确定模型训练方法、码率确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8019601B2 (en) | Audio coding device with two-stage quantization mechanism | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
WO2009043264A1 (en) | A control method and device for image code rate | |
US7974848B2 (en) | Method and apparatus for encoding audio data | |
JP6739604B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
US20090083042A1 (en) | Encoding Method and Encoding Apparatus | |
JP2008065162A (ja) | オーディオ符号化装置 | |
KR20200100053A (ko) | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 | |
KR20060051157A (ko) | 정수 데이터의 무손실 적응 인코딩 및 디코딩을 위한시스템 및 방법 | |
JP2007017659A (ja) | オーディオ符号化方法及び装置 | |
JP4264656B2 (ja) | 符号化装置及び方法、並びにプログラム及び記録媒体 | |
JP2005151391A (ja) | 動画像符号化方法、動画像符号化装置およびプログラム | |
WO2006008817A1 (ja) | オーディオ符号化装置及びオーディオ符号化方法 | |
US9426474B2 (en) | Transcoder | |
KR20030009575A (ko) | 신경망 분류기를 이용한 동영상 전송률 제어 장치 및 그방법 | |
JP4799377B2 (ja) | 画像符号化装置 | |
JP2001306095A (ja) | オーディオ符号化装置及びオーディオ符号化方法 | |
JPH03255792A (ja) | 画質制御装置 | |
US11563945B2 (en) | Adaptive offset for variance based quantization | |
JP6629256B2 (ja) | 符号化装置、方法及びプログラム | |
JP5244479B2 (ja) | 画像符号化装置及び画像符号化方法 | |
JP4775026B2 (ja) | 符号本選択方法及び符号本選択装置 | |
JP2007028531A (ja) | 画像符号化装置及び画像符号化方法 | |
JP3297471B2 (ja) | 画像符号化装置 | |
JP4510696B2 (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101029 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20101126 |