JP3863706B2 - 音声符号化方法 - Google Patents
音声符号化方法 Download PDFInfo
- Publication number
- JP3863706B2 JP3863706B2 JP2000202406A JP2000202406A JP3863706B2 JP 3863706 B2 JP3863706 B2 JP 3863706B2 JP 2000202406 A JP2000202406 A JP 2000202406A JP 2000202406 A JP2000202406 A JP 2000202406A JP 3863706 B2 JP3863706 B2 JP 3863706B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- channel
- frequency
- frequency conversion
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は、音声符号化方法に関する。
【0002】
【従来の技術】
MPEG−2 AAC(Advanced Audio Coding) やドルビーデジタルなどのマルチチャンネル信号の圧縮符号化方式には、マルチチャンネル記録信号の近似部分を共通信号として記録することによって符号化効率の向上を図るインテンシティステレオ法やカップリング法が採用されている。
【0003】
符号ビットの節約に高い可能性を示すこれらの方法では、複数の符号化チャンネル信号に対してただ1つの周波数変換されたスペクトル係数を送信することによって、高い周波数(例えば4khz以上の周波数)における人間の聴覚特性を利用し、データレートの大幅な節約を実現する。
【0004】
このような節約は、人間の聴覚系が高い周波数の位相情報に敏感でなく、エンベロープ(包絡線)が知覚的に評価されるために可能である。このため、所定の周波数以上の信号については、信号の波形全体を符号化するのではなく、全ての関連したチャンネルに対して1つの共通のエンベロープ(スペクトル係数)として送信することが可能となる。
【0005】
図1は、AAC符号化方式を採用したエンコーダの構成を示している。
【0006】
フィルタバンク2は、時間軸の入力信号をMDCT(Modified Discrete Cosine Transform)によりMDCT係数(周波数変換値)に変換する。
【0007】
聴覚モデル1は、周波数変換された各チャンネルの信号(MDCT係数)を複数のバンドに分割し、各チャンネルのバンド毎に聴感特性を考慮したマスキング値を算出する。この算出結果は、各種制御部に送信される。
【0008】
TNS(テンポラルノイズシェイピング)処理部3は、周波数軸の信号であるMDCT係数を時間軸の信号とみなし、LPCフィルタを通すことにより、時間軸上の振幅の大きいところに雑音を集中させ、男性の音声などの低いピッチ周波数を含む信号の音質を向上させる。
【0009】
インシティステレオ処理部4は、インシティステレオ処理を行なう。M/S(Middle Side)ステレオ処理部5は、M/Sステレオ処理を行なう。
【0010】
スケールファクタ処理部6は、MDCT係数をエンベロープとスケールファクタに分離して量子化器7に送る。量子化器7は、量子化を行なう。ノイズレスコーディング処理部8は、量子化器7で量子化されたデータをハフマン符号化等によって符号化する。マルチプレクサ9は、符号化データや補助情報を記憶する。
【0011】
図2は、従来のインシティステレオ処理部4の構成を示している。
【0012】
ここでは、チャンネル総数は、左チャンネルと右チャンネルとの2であるものとする。インシティステレオ処理部4は、左右チャンネル信号の共通化値と左右のチャンネルのパワー比とを算出する。
【0013】
インシティステレオ処理部4は、ゲイン調整部41と平均値算出部42とから構成されている。ゲイン調整部41は、TNS(テンポラルノイズシェイピング)処理部3からの信号に基づいて、各チャンネル毎のエンベロープ(周波数変換値)Sikと、チャンネル間のパワー比Pijとを算出する。平均値算出部42は、各チャンネル毎のエンベロープ(周波数変換値)に基づいて、左右チャンネル信号の共通化値を算出する。
【0014】
図2において、Sikは、iチャンネルのk番目(サンプル番号がk)のサンプルの周波数変換値を示している。Sk は、k番目のサンプルの共通化値を示している。また、Pijは、iチャンネル、jバンドのパワー比(Poj=1を基準値としたパワー比)を示している。
【0015】
表1は、バンド(j)と、サンプル番号kとの関係の一例を示している。表1に示されているサンプル番号は、対応するバンドに含まれるサンプルのうちの先頭のサンプルのサンプル番号を示している。
【0016】
【表1】
【0017】
k番目のサンプルの共通化値Sk は、平均算出部42によって、各チャンネルのk番目のサンプルの周波数変換値Sikを加算平均することによって求められている。
【0018】
【発明が解決しようとする課題】
ところで、各チャンネルの共通部分およびその近辺の音圧レベル、周波数特性によって、それぞれ異なるマスキング特性を有している。マスキング特性が異なれば、各チャンネル信号の重要性も異なる。このため、単純に、各チャンネルのk番目のサンプルのスペクトルデータSikを加算平均することによって、k番目のサンプルの共通化値Sk を求める方法では、聴覚心理面を考慮した場合に必ずしも最適とはいえない。
【0019】
この発明は、音質の低下を押さえることが可能となる音声符号化方法を提供することを目的とする。
【0020】
【課題を解決するための手段】
この発明による音声符号化方法は、2チャンネル以上の時間軸の信号を周波数軸の信号に変換することにより、各チャンネル毎に一定の周波数間隔ずつ離れた複数の周波数毎の周波数変換値を抽出し、各チャンネル毎に抽出した周波数変換値列の所定の周波数以上の範囲において、各チャンネルの周波数変換値列の各周波数毎に、全てのチャンネルに対して1つの共通化値を生成して符号化する音声符号化方法において、各チャンネルの周波数変換値列を複数のバンドに分割し、各バンド毎に聴感特性を考慮したマスキング値を算出しておき、共通化値を算出すべき各周波数毎に、次式2で示す誤差評価値E k が最小となる共通化値S k を求めることを特徴とする。
【0022】
【数2】
【0023】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態について説明する。
【0024】
図3は、本発明によるインシティステレオ処理部4の構成を示している。
【0025】
ここでは、チャンネル数は、左チャンネルと右チャンネルとの2であるものとする。インシティステレオ処理部4は、左右チャンネルの信号の共通化値と左右のチャンネルのパワー比とを算出する。左右チャンネルの信号からの共通化値の求め方が、従来と異なっている。
【0026】
インシティステレオ処理部4は、ゲイン調整部41と最適値算出部43とから構成されている。ゲイン調整部41は、TNS(テンポラルノイズシェイピング)処理部3からの信号に基づいて、各チャンネル毎のエンベロープ(周波数変換値)Sikと、チャンネル間のパワー比Pijを算出する。最適値算出部43は、各チャンネル毎のエンベロープ(周波数変換値)に基づいて、左右チャンネル信号の共通化値を算出する。
【0027】
図3において、Sikは、iチャンネルのk番目(サンプル番号がk)のサンプルの周波数変換値を示している。Sk は、k番目のサンプルの共通化値を示している。また、Pijは、iチャンネル、jバンドのパワー比(Poj=1を基準値としたパワー比)を示している。
【0028】
左右のチャンネルのパワー比Poj、P1jの求め方について説明する。
PojおよびP1jは、次式3により求められる。
【0029】
【数3】
【0030】
数式3において、Sijx は、チャンネルiのバンドjのx番目のサンプルの周波数変換値を示している。また、(X−1)はバンドjに含まれるサンプルの総数を示している。
【0031】
次に、k番目のサンプルの共通化値Sk の求め方について説明する。
【0032】
k番目のサンプルの共通化値Sk は、次式4で示すk番目のサンプルの誤差評価値Ek が最小となる共通化値Sk を算出することによって求められる。なお、次式4で示すk番目のサンプルの誤差評価値Ek が最小となる共通化値Sk は、次式4を偏微分することにより、容易に求めることができる。
【0033】
【数4】
【0034】
数式4において、j(k)は、k番目のサンプルの周波数を含むバンドを示している。Mij(k) は、iチャンネル、j(k)バンドのマスキング値である。なお、マスキング値Mij(k) は、図1の聴覚モデル算出部1で算出される。
【0035】
なお、チャンネル総数がNの場合には、誤差評価値Ek は、次式5で表される。
【0036】
【数5】
【0037】
【発明の効果】
この発明によれば、音質の低下を押さえることが可能となる音声符号化方法が得られる。
【図面の簡単な説明】
【図1】AAC符号化方式を採用したエンコーダの構成を示すブロック図である。
【図2】従来のインシティステレオ処理部4の構成を示すブロック図である。
【図3】本発明の実施の形態であるインシティステレオ処理部4の構成を示すブロック図である。
【符号の説明】
1 聴覚モデル
4 インシティステレオ処理部
41 ゲイン調整部
43 最適値算出部
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000202406A JP3863706B2 (ja) | 2000-07-04 | 2000-07-04 | 音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000202406A JP3863706B2 (ja) | 2000-07-04 | 2000-07-04 | 音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002023798A JP2002023798A (ja) | 2002-01-25 |
JP3863706B2 true JP3863706B2 (ja) | 2006-12-27 |
Family
ID=18699934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000202406A Expired - Fee Related JP3863706B2 (ja) | 2000-07-04 | 2000-07-04 | 音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3863706B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112151045A (zh) | 2019-06-29 | 2020-12-29 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
-
2000
- 2000-07-04 JP JP2000202406A patent/JP3863706B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002023798A (ja) | 2002-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
KR100304055B1 (ko) | 음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법 | |
KR100346066B1 (ko) | 오디오신호 코딩방법 | |
US7613603B2 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
KR100547113B1 (ko) | 오디오 데이터 인코딩 장치 및 방법 | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
JP4567238B2 (ja) | 符号化方法、復号化方法、符号化器、及び復号化器 | |
JP4168976B2 (ja) | オーディオ信号符号化装置及び方法 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
KR100941011B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
JPH0856163A (ja) | 適応的デジタルオーディオ符号化システム | |
JP2001053617A (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
JP4008244B2 (ja) | 符号化装置および復号化装置 | |
KR100813193B1 (ko) | 정보 신호의 양자화 방법 및 장치 | |
JP2001343997A (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
KR100477701B1 (ko) | Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치 | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
JP3863706B2 (ja) | 音声符号化方法 | |
JP2008058727A (ja) | 音声符号化装置 | |
JP3616307B2 (ja) | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 | |
JP2003044096A (ja) | マルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システム | |
JP2006047561A (ja) | オーディオ信号符号化装置およびオーディオ信号復号化装置 | |
KR100827458B1 (ko) | 오디오 부호화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060929 |
|
LAPS | Cancellation because of no payment of annual fees |