JPH0856163A - 適応的デジタルオーディオ符号化システム - Google Patents
適応的デジタルオーディオ符号化システムInfo
- Publication number
- JPH0856163A JPH0856163A JP6338815A JP33881594A JPH0856163A JP H0856163 A JPH0856163 A JP H0856163A JP 6338815 A JP6338815 A JP 6338815A JP 33881594 A JP33881594 A JP 33881594A JP H0856163 A JPH0856163 A JP H0856163A
- Authority
- JP
- Japan
- Prior art keywords
- digital audio
- signal
- audio signal
- deviation
- power density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 66
- 238000001228 spectrum Methods 0.000 claims abstract description 54
- 230000000873 masking effect Effects 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 7
- 230000001149 cognitive effect Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 101001080825 Homo sapiens PH and SEC7 domain-containing protein 1 Proteins 0.000 description 3
- 101001080808 Homo sapiens PH and SEC7 domain-containing protein 2 Proteins 0.000 description 3
- 102100027472 PH and SEC7 domain-containing protein 1 Human genes 0.000 description 3
- 102100027455 PH and SEC7 domain-containing protein 2 Human genes 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
(57)【要約】
【目的】 人間の聴覚にかなり一致するように入力デジ
タルオーディオ信号を適応的に符号化する新規なデジタ
ルオーディオ符号化システムを提供する。 【構成】 入力デジタルオーディオ信号を符号化する符
号化デバイス10A、10Bと、符号化されたオーディ
オ信号を復号化する復号化デバイス20A、20Bと、
入力デジタルオーディオ信号と復号化のデジタルオーデ
ィオ信号との間の偏差信号の電力密度スペクトルを算出
する第1算出器30、34と、入力デジタルオーディオ
信号の電力密度スペクトルを算出し、電力密度スペクト
ルに基づいて前記オーディオ信号の周波数マスキング臨
界値を決定する第2測定器40と、電力密度スペクトル
と周波数マスキング臨界値に基づいて認知スペクトル偏
差を算出する第3算出器50と、最小の認知スペクトル
偏差を有する符号化のデジタルオーディオ信号を選択す
る回路60、70とを含む。
タルオーディオ信号を適応的に符号化する新規なデジタ
ルオーディオ符号化システムを提供する。 【構成】 入力デジタルオーディオ信号を符号化する符
号化デバイス10A、10Bと、符号化されたオーディ
オ信号を復号化する復号化デバイス20A、20Bと、
入力デジタルオーディオ信号と復号化のデジタルオーデ
ィオ信号との間の偏差信号の電力密度スペクトルを算出
する第1算出器30、34と、入力デジタルオーディオ
信号の電力密度スペクトルを算出し、電力密度スペクト
ルに基づいて前記オーディオ信号の周波数マスキング臨
界値を決定する第2測定器40と、電力密度スペクトル
と周波数マスキング臨界値に基づいて認知スペクトル偏
差を算出する第3算出器50と、最小の認知スペクトル
偏差を有する符号化のデジタルオーディオ信号を選択す
る回路60、70とを含む。
Description
【0001】
【産業上の利用分野】本発明は、デジタルオーディオ符
号化システムに関するもので、とくに、人間の聴覚に基
づいて測定される最小の歪みを有する符号化のオーディ
オ信号を提供できる改良されたデジタルオーディオ符号
化システムに関するものである。
号化システムに関するもので、とくに、人間の聴覚に基
づいて測定される最小の歪みを有する符号化のオーディ
オ信号を提供できる改良されたデジタルオーディオ符号
化システムに関するものである。
【0002】
【従来の技術】デジタル化されたオーディオ信号の伝送
は、コンパクトディスクまたはデジタルオーディオテー
プのものと比較して高音質オーディオ信号の伝達を可能
にする。オーディオ信号がデジタル形式で表現されてい
るとき、とくに高精細度テレビシステムの場合、相当量
のデータの伝送を必要とする。しかし、かかるオーディ
オ信号に与えられた利用可能な周波数帯域は限定されて
いるので、たとえば、約128KHzの限定されたオー
ディオ帯域を通じて相当量のデジタルデータ、たとえ
ば、16ビットのPCM(パルス符号変調)オーディオ
信号と、48KHzのサンプリング周波数に対して、1
秒当たり768キロビットを伝送するためには、該オー
ディオ信号を圧縮することが必須となっている。デジタ
ル伝送の受信端で、その圧縮されたオーディオ信号は復
号化される。
は、コンパクトディスクまたはデジタルオーディオテー
プのものと比較して高音質オーディオ信号の伝達を可能
にする。オーディオ信号がデジタル形式で表現されてい
るとき、とくに高精細度テレビシステムの場合、相当量
のデータの伝送を必要とする。しかし、かかるオーディ
オ信号に与えられた利用可能な周波数帯域は限定されて
いるので、たとえば、約128KHzの限定されたオー
ディオ帯域を通じて相当量のデジタルデータ、たとえ
ば、16ビットのPCM(パルス符号変調)オーディオ
信号と、48KHzのサンプリング周波数に対して、1
秒当たり768キロビットを伝送するためには、該オー
ディオ信号を圧縮することが必須となっている。デジタ
ル伝送の受信端で、その圧縮されたオーディオ信号は復
号化される。
【0003】該復号化されたオーディオ信号の音質は、
該オーディオ信号を符号化するために採用された圧縮技
法によって大きく影響される。時々、最小の歪みを有す
るオーディオ信号を選択的に発生するために、デジタル
オーディオ符号化システムは、他の圧縮技法を採用する
複数の符号化器、符号化器に対応する複数の復号化器及
びオーディオ歪み測定デバイスを備える。その場合、こ
の符号化器などは並列に配設され、入力デジタルオーデ
ィオ信号を同時に符号化し、各々の復号器は対応する符
号化器に接続されていて、対応する符号化器からの符号
化されたデジタルオーディオ信号を復号化する。このよ
うな構成において、デジタルオーディオ符号化システム
は、符号化されたデジタルオーディオ信号のうちの最小
の歪みを起こす符号化されたデジタルオーディオ信号を
選択的に発生する。
該オーディオ信号を符号化するために採用された圧縮技
法によって大きく影響される。時々、最小の歪みを有す
るオーディオ信号を選択的に発生するために、デジタル
オーディオ符号化システムは、他の圧縮技法を採用する
複数の符号化器、符号化器に対応する複数の復号化器及
びオーディオ歪み測定デバイスを備える。その場合、こ
の符号化器などは並列に配設され、入力デジタルオーデ
ィオ信号を同時に符号化し、各々の復号器は対応する符
号化器に接続されていて、対応する符号化器からの符号
化されたデジタルオーディオ信号を復号化する。このよ
うな構成において、デジタルオーディオ符号化システム
は、符号化されたデジタルオーディオ信号のうちの最小
の歪みを起こす符号化されたデジタルオーディオ信号を
選択的に発生する。
【0004】一般に、オーディオ歪みは「総合高調波歪
み(Total HarmonicDistortio
n;THD)」と「エスエヌ比(SNR)」によって測
定され、ここでTHDは、全ての別々の高調波歪み成分
の平方根(RMS)の和と、二つ以上の信号が符号化器
を通過する場合に発生した和と差とからなる相互変調歪
みを表し、また、SNRは受信した入力デジタル信号の
振幅とノイズ信号の振幅との比を表す。
み(Total HarmonicDistortio
n;THD)」と「エスエヌ比(SNR)」によって測
定され、ここでTHDは、全ての別々の高調波歪み成分
の平方根(RMS)の和と、二つ以上の信号が符号化器
を通過する場合に発生した和と差とからなる相互変調歪
みを表し、また、SNRは受信した入力デジタル信号の
振幅とノイズ信号の振幅との比を表す。
【0005】しかし、このようなTHDまたはSNRの
測定は、人間の聴覚が直接的に反映されない物理的な値
であるので、そのようなオーディオ歪み測定装置を有す
る通常のデジタルオーディオ符号化システムは、人間の
聴覚をよく反映する符号化されたデジタルオーディオ信
号を提供する能力が限定されている。
測定は、人間の聴覚が直接的に反映されない物理的な値
であるので、そのようなオーディオ歪み測定装置を有す
る通常のデジタルオーディオ符号化システムは、人間の
聴覚をよく反映する符号化されたデジタルオーディオ信
号を提供する能力が限定されている。
【0006】
【発明が解決しようとする課題】従って、本発明の主な
目的は、人間の聴覚にかなり一致するように入力デジタ
ルオーディオ信号を適応的に符号化する新規なデジタル
オーディオ符号化システムを提供することである。
目的は、人間の聴覚にかなり一致するように入力デジタ
ルオーディオ信号を適応的に符号化する新規なデジタル
オーディオ符号化システムを提供することである。
【0007】
【課題を解決するための手段】従って、上記の目的を達
成するために、本発明の実施例によると、複数のフレー
ムを有する入力デジタルオーディオ信号を符号化する新
規なデジタルオーディオ符号化システムが提供される
が、現フレームにおける入力デジタルオーディオ信号を
各々符号化する並列に配設されたM個の符号化手段と、
前記符号化されたオーディオ信号の各々を復号化する並
列に配設されたM個の復号化手段と、前記入力デジタル
オーディオ信号と各々の復号化された前記デジタルオー
ディオ信号との間の偏差信号の電力密度スペクトルを算
出する第1測定手段と、前記現フレームにおける入力デ
ジタルオーディオ信号の電力密度スペクトルを算出し、
該入力デジタルオーディオ信号の電力密度スペクトルに
基づいて前記該信号のマスキング臨界値を決定する第2
算出手段と、前記各々の偏差信号への電力密度スペクト
ルと前記マスキング臨界値に基づいて認知スペクトル偏
差を算出する第3算出手段と、最小の認知スペクトル偏
差を有する符号化されたデジタルオーディオ信号を選択
する手段とを含む。
成するために、本発明の実施例によると、複数のフレー
ムを有する入力デジタルオーディオ信号を符号化する新
規なデジタルオーディオ符号化システムが提供される
が、現フレームにおける入力デジタルオーディオ信号を
各々符号化する並列に配設されたM個の符号化手段と、
前記符号化されたオーディオ信号の各々を復号化する並
列に配設されたM個の復号化手段と、前記入力デジタル
オーディオ信号と各々の復号化された前記デジタルオー
ディオ信号との間の偏差信号の電力密度スペクトルを算
出する第1測定手段と、前記現フレームにおける入力デ
ジタルオーディオ信号の電力密度スペクトルを算出し、
該入力デジタルオーディオ信号の電力密度スペクトルに
基づいて前記該信号のマスキング臨界値を決定する第2
算出手段と、前記各々の偏差信号への電力密度スペクト
ルと前記マスキング臨界値に基づいて認知スペクトル偏
差を算出する第3算出手段と、最小の認知スペクトル偏
差を有する符号化されたデジタルオーディオ信号を選択
する手段とを含む。
【0008】
【実施例】以下、本発明の適応的デジタルオーディオ符
号化システムを添付の図面を参照しながら詳細に説明す
る。
号化システムを添付の図面を参照しながら詳細に説明す
る。
【0009】図1を参照すると、本発明によるデジタル
オーディオ符号化システムを説明するブロック図が示さ
れている。
オーディオ符号化システムを説明するブロック図が示さ
れている。
【0010】前記符号化システム100は符号化デバイ
ス10、復号化デバイス20、第1及び第2電力密度ス
ペクトル測定ユニット30及び34、マスキング臨界値
測定ユニット40、認知スペクトル偏差測定器50、比
較器60、選択器70及びフォーマッティング回路80
を備えている。
ス10、復号化デバイス20、第1及び第2電力密度ス
ペクトル測定ユニット30及び34、マスキング臨界値
測定ユニット40、認知スペクトル偏差測定器50、比
較器60、選択器70及びフォーマッティング回路80
を備えている。
【0011】N個のサンプル、即ち、n=0,1,
2,...,N−1のサンプルを含むi番目のフレーム
または現フレームの入力デジタルオーディオ信号x
(n,i)が、符号化デバイス10へ印加される。この
符号化デバイス10は予め定められたビット伝送速度で
入力デジタルオーディオ信号の符号化動作を行うために
適しており、Nは正の整数であって、一つのフレームは
L個(たとえば、32個)のサブバンドを含む。本明細
書で用いられた「フレーム」は、オーディオサンプルの
一定数の対応するデジタルオーディオ信号の一部分を表
し、また、デジタルオーディオ信号の符号化及び復号化
のための処理単位を表す。
2,...,N−1のサンプルを含むi番目のフレーム
または現フレームの入力デジタルオーディオ信号x
(n,i)が、符号化デバイス10へ印加される。この
符号化デバイス10は予め定められたビット伝送速度で
入力デジタルオーディオ信号の符号化動作を行うために
適しており、Nは正の整数であって、一つのフレームは
L個(たとえば、32個)のサブバンドを含む。本明細
書で用いられた「フレーム」は、オーディオサンプルの
一定数の対応するデジタルオーディオ信号の一部分を表
し、また、デジタルオーディオ信号の符号化及び復号化
のための処理単位を表す。
【0012】図示されたように、符号化デバイス10は
複数の符号化器、たとえば、並列で配設された二つの符
号化器10A及び10Bを含み、現フレームの入力デジ
タルオーディオ信号を同時に受信し、多様な圧縮技法を
用いて入力デジタルオーディオ信号を符号化する。たと
えば、符号化器10Aは各々のサブバンドに対する認知
エントロピーに基づいて、一つのフレーム内に含まれた
各サブバンドに適応的にビットを割り当てるフレーム内
(intra−frame)ビット割り当て技法を用い
てi番目のフレームの入力デジタルオーディオ信号の符
号化動作を行い、符号化器10Bは各フレームに対する
認知エントロピーに基づいて、予め定められたフレーム
群内に含まれた各フレームに適応的にビットを割り当て
るフレーム間(inter−frame)ビット割り当
て技法を用いて入力デジタルオーディオ信号の符号化動
作を行ない、または、符号化器10Aと符号化器10B
は各々、非一様量子化器と一様量子化器を含んでもよ
い。
複数の符号化器、たとえば、並列で配設された二つの符
号化器10A及び10Bを含み、現フレームの入力デジ
タルオーディオ信号を同時に受信し、多様な圧縮技法を
用いて入力デジタルオーディオ信号を符号化する。たと
えば、符号化器10Aは各々のサブバンドに対する認知
エントロピーに基づいて、一つのフレーム内に含まれた
各サブバンドに適応的にビットを割り当てるフレーム内
(intra−frame)ビット割り当て技法を用い
てi番目のフレームの入力デジタルオーディオ信号の符
号化動作を行い、符号化器10Bは各フレームに対する
認知エントロピーに基づいて、予め定められたフレーム
群内に含まれた各フレームに適応的にビットを割り当て
るフレーム間(inter−frame)ビット割り当
て技法を用いて入力デジタルオーディオ信号の符号化動
作を行ない、または、符号化器10Aと符号化器10B
は各々、非一様量子化器と一様量子化器を含んでもよ
い。
【0013】i番目のフレームへの認知エンドロピーP
E(i) は、当業者に知られているように、次式によ
って表わされる。
E(i) は、当業者に知られているように、次式によ
って表わされる。
【0014】
【数1】
【0015】ここで、mはm=0,1,2,...,L
−1のサブバンド指数で、Lは一つのフレーム内におけ
るサブバンドの全数を表し、P(m)は高速フーリエ変
換(FFT) 技法から測定されたサブバンドmにおけ
る音圧レベル(SPL)を表し、そして、M(m)はサ
ブバンドmにおけるマスキング臨界値を表す。
−1のサブバンド指数で、Lは一つのフレーム内におけ
るサブバンドの全数を表し、P(m)は高速フーリエ変
換(FFT) 技法から測定されたサブバンドmにおけ
る音圧レベル(SPL)を表し、そして、M(m)はサ
ブバンドmにおけるマスキング臨界値を表す。
【0016】各々の符号化器からの符号化されたデジタ
ルオーディオ信号は、選択器7及び多数の復号化デバイ
ス20(たとえば、20A、20B)へ印加される。各
々の復号器は符号化器からの対応する符号化されたデジ
タルオーディオ信号を復号化するために用いられる。復
号化器20A、20Bからの復号化されたデジタルオー
ディオ信号y1(n,i)及びy2(n,i)は、第1
及び第2電力密度スペクトル算出ユニット30及び34
へ各々印加さ、各々の電力密度スペクトルユニットは減
算器31、35及び電力密度スペクトル算出器32、3
6を各々含む。第1電力密度スペクトル算出ユニット3
0に取り付けられた減算器31は、システムへの入力デ
ジタルオーディオ信号x(n,i)と復号器20Aから
の復号化されたデジタルオーディオ信号y1(n,i)
との間の偏差を表す偏差信号e1(n,i)を発生す
る。この偏差信号e1(n,i)は次式によって表わさ
れる。
ルオーディオ信号は、選択器7及び多数の復号化デバイ
ス20(たとえば、20A、20B)へ印加される。各
々の復号器は符号化器からの対応する符号化されたデジ
タルオーディオ信号を復号化するために用いられる。復
号化器20A、20Bからの復号化されたデジタルオー
ディオ信号y1(n,i)及びy2(n,i)は、第1
及び第2電力密度スペクトル算出ユニット30及び34
へ各々印加さ、各々の電力密度スペクトルユニットは減
算器31、35及び電力密度スペクトル算出器32、3
6を各々含む。第1電力密度スペクトル算出ユニット3
0に取り付けられた減算器31は、システムへの入力デ
ジタルオーディオ信号x(n,i)と復号器20Aから
の復号化されたデジタルオーディオ信号y1(n,i)
との間の偏差を表す偏差信号e1(n,i)を発生す
る。この偏差信号e1(n,i)は次式によって表わさ
れる。
【0017】
【数2】
【0018】ここで、x(n,i) 及びy1(n,
i) はP(たとえば、16)ビットのパルス符号変調
(PCM)オーディオ信号である。
i) はP(たとえば、16)ビットのパルス符号変調
(PCM)オーディオ信号である。
【0019】その次に、この偏差信号は電力密度スペク
トル算出器32へ提供され、高速フーリエ変換技法によ
って時間領域から周波数領域に変換される。
トル算出器32へ提供され、高速フーリエ変換技法によ
って時間領域から周波数領域に変換される。
【0020】図2を参照すると、電力密度スペクトル算
出器32はウィンドー処理回路32A及び高速フーリエ
変換(FFT)回路32Bを含む。
出器32はウィンドー処理回路32A及び高速フーリエ
変換(FFT)回路32Bを含む。
【0021】このウィンドー処理回路32Aは減算器3
1からの偏差信号e1(n,i)を受信して、偏差信号
e1(n,i)と予め定められたハーニングウィンドー
(hanning window)とを乗じ、ウィンド
ー処理を行う。この予め定められたハーニングウィンド
ーh(n)は、次式のように表される。
1からの偏差信号e1(n,i)を受信して、偏差信号
e1(n,i)と予め定められたハーニングウィンドー
(hanning window)とを乗じ、ウィンド
ー処理を行う。この予め定められたハーニングウィンド
ーh(n)は、次式のように表される。
【0022】
【数3】
【0023】ここで、Nは正の整数であり、n=0,
1,2,...N−1 である。
1,2,...N−1 である。
【0024】だから、ウィンドー処理回路32Aからの
出力w1(n,i)は次式のように書き直しうる。
出力w1(n,i)は次式のように書き直しうる。
【0025】
【数4】
【0026】ここで、iはフレーム指数で、nは上述し
た式のものと等しい。
た式のものと等しい。
【0027】その次、ウィンドー処理回路32Aからの
出力w1(n,i)はFFT回路32Bへ提供され、出
力w1(n,i)の電力密度スペクトルを算出し、ま
た、FFT回路32Bは本発明の好ましい一実施例で
は、聴覚モデルI[または、MPEG−Audio l
ayer I] に対して、512ポイントFFTを含
む。従って、i番目のフレームの偏差信号e1(n,
i)に対する電力密度スペクトルE1(k,i) は当業者に
周知のように、次式のように算出できる。
出力w1(n,i)はFFT回路32Bへ提供され、出
力w1(n,i)の電力密度スペクトルを算出し、ま
た、FFT回路32Bは本発明の好ましい一実施例で
は、聴覚モデルI[または、MPEG−Audio l
ayer I] に対して、512ポイントFFTを含
む。従って、i番目のフレームの偏差信号e1(n,
i)に対する電力密度スペクトルE1(k,i) は当業者に
周知のように、次式のように算出できる。
【0028】
【数5】
【0029】ここで、k=0,1,2,...,(N/
2)−1で, N及びnは上述した式のものと等しい。
2)−1で, N及びnは上述した式のものと等しい。
【0030】また図1を参照すると、第2電力密度スペ
クトルユニット34は、入力デジタルオーディオ信号x
(n,i)と復号化器20Bからの復号化されたデジタ
ルオーディオ信号y2(n,i)との間の偏差信号e2
(n,i)の電力密度スペクトルE2(k,i)がユニ
ット34で算出されること以外は、第1電力密度スペク
トルユニット30と実質的に等しいである。減算器35
からの偏差信号e2(n,i) は次式のように表され
る。
クトルユニット34は、入力デジタルオーディオ信号x
(n,i)と復号化器20Bからの復号化されたデジタ
ルオーディオ信号y2(n,i)との間の偏差信号e2
(n,i)の電力密度スペクトルE2(k,i)がユニ
ット34で算出されること以外は、第1電力密度スペク
トルユニット30と実質的に等しいである。減算器35
からの偏差信号e2(n,i) は次式のように表され
る。
【0031】
【数6】
【0032】ここで、n及びiは上述した式のものと等
しい。
しい。
【0033】従って、偏差信号e2(n,i)の電力密
度スペクトルE2(k,i)は、式(4)の偏差信号e
1(n,i)に対して処理したように、偏差信号e2
(n,i)とハーニングウィンドーh(n)とをウィン
ドー処理することによって得られる。
度スペクトルE2(k,i)は、式(4)の偏差信号e
1(n,i)に対して処理したように、偏差信号e2
(n,i)とハーニングウィンドーh(n)とをウィン
ドー処理することによって得られる。
【0034】i番目のフレームへの偏差信号e2(n,
i)の電力密度スペクトルE2(k,i) は、次式の
ように得られる。
i)の電力密度スペクトルE2(k,i) は、次式の
ように得られる。
【0035】
【数7】
【0036】ここで、N、n、k及びiは上述した式の
ものと等しく、w2(n,i)=e2(n,i)×h
(n)の関係を有する。
ものと等しく、w2(n,i)=e2(n,i)×h
(n)の関係を有する。
【0037】一方、マスキング臨界値算出ユニット40
は、i番目フレームの入力デジタルオーディオ信号x
(n,i)を受信して、該信号のマスキング臨界値を算
出するために用いられる。マスキング臨界値算出ユニッ
ト40は電力密度スペクトル算出器41及びマスキング
臨界値算出器42を含む。電力密度スペクトル算出器4
1はi番目のフレームへの入力デジタルオーディオ信号
x(n,i)の電力密度スペクトルX(k,i)が該算
出器41で算出されること以外は第1及び第2電力密度
スペクトルユニットに含まれた電力密度スペクトル算出
器と実質的に等しい。i番目のフレームへの入力デジタ
ルオーディオ信号x(n,i)の電力密度スペクトルX
(k,i)は、次式のように得られる。
は、i番目フレームの入力デジタルオーディオ信号x
(n,i)を受信して、該信号のマスキング臨界値を算
出するために用いられる。マスキング臨界値算出ユニッ
ト40は電力密度スペクトル算出器41及びマスキング
臨界値算出器42を含む。電力密度スペクトル算出器4
1はi番目のフレームへの入力デジタルオーディオ信号
x(n,i)の電力密度スペクトルX(k,i)が該算
出器41で算出されること以外は第1及び第2電力密度
スペクトルユニットに含まれた電力密度スペクトル算出
器と実質的に等しい。i番目のフレームへの入力デジタ
ルオーディオ信号x(n,i)の電力密度スペクトルX
(k,i)は、次式のように得られる。
【0038】
【数8】
【0039】ここで、N、n、k、及びiは上述した式
のものと等しく、w(n,i)=x(n,i)・h
(n)の関係を有する。
のものと等しく、w(n,i)=x(n,i)・h
(n)の関係を有する。
【0040】電力密度スペクトル算出器41で算出され
た入力デジタルオーディオ信号の電力密度スペクトルX
(k,i)はマスキング臨界値算出器42へ印加され、
該マスキング臨界値算出器42は入力デジタルオーディ
オ信号の電力密度スペクトルに基づいてマスキング臨界
値を算出する。
た入力デジタルオーディオ信号の電力密度スペクトルX
(k,i)はマスキング臨界値算出器42へ印加され、
該マスキング臨界値算出器42は入力デジタルオーディ
オ信号の電力密度スペクトルに基づいてマスキング臨界
値を算出する。
【0041】マスキング臨界値は人間の聴覚認知をよく
反映する可聴限界を表し、この可聴限界は、本明細書で
参照文献として引用された論文の「Coding of
Moving Pictures and Asso
ciated Audio」、ISO/IEC/JTC
1/SC29/WG11 NO501 MPEG 93
(July,1993)で開示されているように、ある
音の臨界値または固有可聴限界値と、周波数領域で同時
に発生する他の(マスキング)の音の存在によって起こ
った増分との合計を表し、この論文中で、いわゆる聴覚
モデル(I及びII)はマスキング臨界値を算出するた
めに記述されている。本発明の好ましい実施例におい
て、聴覚モデルIはマスキング臨界値算出器42で有効
に使用されている。
反映する可聴限界を表し、この可聴限界は、本明細書で
参照文献として引用された論文の「Coding of
Moving Pictures and Asso
ciated Audio」、ISO/IEC/JTC
1/SC29/WG11 NO501 MPEG 93
(July,1993)で開示されているように、ある
音の臨界値または固有可聴限界値と、周波数領域で同時
に発生する他の(マスキング)の音の存在によって起こ
った増分との合計を表し、この論文中で、いわゆる聴覚
モデル(I及びII)はマスキング臨界値を算出するた
めに記述されている。本発明の好ましい実施例におい
て、聴覚モデルIはマスキング臨界値算出器42で有効
に使用されている。
【0042】電力密度スペクトルE1(k,i)、E2
(k,i)とマスキング臨界値M(k,i)が認知スペ
クトル偏差算出器50へ同時に提供され、この認知スペ
クトル偏差算出器50は、考慮されるマスキング効果を
備えた人間の聴覚能力によって認知されるような電力密
度スペクトルE1(k,i)、E2(k,i)に対する
オーディオ歪みを表す第1及び第2認知スペクトル偏差
PSD1(i)、PSD2(i)を算出するために用い
られている。電力密度スペクトル算出器32からの電力
密度スペクトルE1(k,i)に対する第1認知スペク
トル偏差PSD1(i)は次式のように表される。
(k,i)とマスキング臨界値M(k,i)が認知スペ
クトル偏差算出器50へ同時に提供され、この認知スペ
クトル偏差算出器50は、考慮されるマスキング効果を
備えた人間の聴覚能力によって認知されるような電力密
度スペクトルE1(k,i)、E2(k,i)に対する
オーディオ歪みを表す第1及び第2認知スペクトル偏差
PSD1(i)、PSD2(i)を算出するために用い
られている。電力密度スペクトル算出器32からの電力
密度スペクトルE1(k,i)に対する第1認知スペク
トル偏差PSD1(i)は次式のように表される。
【0043】
【数9】
【0044】ここで、k及びiは上述した式のものと等
しい。
しい。
【0045】同様に、電力密度スペクトル算出器36か
らの電力密度スペクトルE2(k,i)に対する第2認
知スペクトル偏差PSD2(i)は、次式のように表さ
れる。
らの電力密度スペクトルE2(k,i)に対する第2認
知スペクトル偏差PSD2(i)は、次式のように表さ
れる。
【0046】
【数10】
【0047】ここで、k及びiは上述した式のものと等
しい。
しい。
【0048】上述した式(9)及び式(10)から分か
るように、i番目のフレームに対する認知スペクトル偏
差は、マスキング臨界値を超過する偏差信号の電力密度
スペクトルによって算出される。第1及び第2認知スペ
クトル偏差PSD1(i)及びPSD2(i)が比較器
60へ印加され、該比較器60はこれらの認知スペクト
ル偏差を比較することによって、符号化器(たとえば、
10A、10B)からの二つの符号化されたデジタルオ
ーディオ信号のうちで一番歪みの少ないデジタルオーデ
ィオ信号を特定する選択信号を発生する。その後、比較
器60からの選択信号は選択器70及びフォーマッティ
ング回路80へ出力される。
るように、i番目のフレームに対する認知スペクトル偏
差は、マスキング臨界値を超過する偏差信号の電力密度
スペクトルによって算出される。第1及び第2認知スペ
クトル偏差PSD1(i)及びPSD2(i)が比較器
60へ印加され、該比較器60はこれらの認知スペクト
ル偏差を比較することによって、符号化器(たとえば、
10A、10B)からの二つの符号化されたデジタルオ
ーディオ信号のうちで一番歪みの少ないデジタルオーデ
ィオ信号を特定する選択信号を発生する。その後、比較
器60からの選択信号は選択器70及びフォーマッティ
ング回路80へ出力される。
【0049】比較器60からの選択信号に応答して、選
択器70は、符号化器からの符号化されたデジタルオー
ディオ信号のうちで一番歪みの少ないデジタルオーディ
オ信号を選択し、選択されたオーディオ信号をフォーマ
ッティング回路80に提供する。
択器70は、符号化器からの符号化されたデジタルオー
ディオ信号のうちで一番歪みの少ないデジタルオーディ
オ信号を選択し、選択されたオーディオ信号をフォーマ
ッティング回路80に提供する。
【0050】フォーマッティグ回路80では、比較器6
0からの選択信号と選択器70からの選択されたオーデ
ィオ信号が、チャンネルへ伝送するためにフォーマット
されて、伝送器(図示せず)へ伝送される。
0からの選択信号と選択器70からの選択されたオーデ
ィオ信号が、チャンネルへ伝送するためにフォーマット
されて、伝送器(図示せず)へ伝送される。
【0051】上記において、本発明の特定の実施例につ
いて説明したが、特許請求の範囲で定義される本発明の
技術的視点を逸脱することなく種々の変形及び変更をな
し得ることは当業者には明らかであろう。
いて説明したが、特許請求の範囲で定義される本発明の
技術的視点を逸脱することなく種々の変形及び変更をな
し得ることは当業者には明らかであろう。
【0052】
【発明の効果】本発明は人間の聴覚認知によって入力デ
ジタルオーディオ信号を適応的に符号化することによっ
て、事実上人間の聴覚認知に近接した符号化のオーディ
オ信号を提供できる。
ジタルオーディオ信号を適応的に符号化することによっ
て、事実上人間の聴覚認知に近接した符号化のオーディ
オ信号を提供できる。
【図1】本発明による新規なデジタルオーディオ符号化
システムを説明するブロック図である。
システムを説明するブロック図である。
【図2】図1に示した電力密度スペクトル算出器の詳細
なブロック図である。
なブロック図である。
10 符号化デバイス 10A、10B 符号化器 20 復号化デバイス 20A、20B 復号化器 30 第1電力密度スペクトルユニット 31 減算器 34 第2電力密度スペクトルユニット 32 電力密度スペクトル算出器 32A ウインドー処理回路 32B 高速フーリエ変換回路 35 減算器 36 電力密度スペクトル算出器 40 マスキング臨界値算出ユニット 41 電力密度スペクトル算出器 42 マスキング臨界値算出ユニット 50 認知スペクトル偏差算出器 60 比較器 70 選択器 80 フォーマッティング回路 100 符号化システム
Claims (1)
- 【請求項1】 複数のフレームを有する入力デジタルオ
ーディオ信号を符号化する新規なデジタルオーディオ符
号化システムであって、 現フレームにおける入力デジタルオーディオ信号を各々
符号化する並列に配設されたM個の符号化手段と、 符号化された前記オーディオ信号の各々を復号化する並
列に配設されたM個の復号化手段と、 前記入力デジタルオーディオ信号と各々の復号化された
前記デジタルオーディオ信号との間の偏差信号の電力密
度スペクトルを算出する第1算出手段と、 前記現フレームの前記入力デジタルオーディオ信号の電
力密度スペクトルを算出し、該入力デジタルオーディオ
信号の電力密度スペクトルに基づいて前記入力デジタル
オーディオ信号のマスキング臨界値を決定する第2算出
手段と、 各々の前記偏差信号に対する前記電力密度スペクトルと
前記マスキング臨界値とに基づいて認知スペクトル偏差
を算出する第3算出手段と、 最小の認知スペクトル偏差を有する前記符号化されたデ
ジタルオーディオ信号を選択する手段とを有することを
特徴とする適応的デジタルオーディオ符号化システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940000758A KR970005131B1 (ko) | 1994-01-18 | 1994-01-18 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
KR1994P758 | 1994-01-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0856163A true JPH0856163A (ja) | 1996-02-27 |
Family
ID=19375774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6338815A Pending JPH0856163A (ja) | 1994-01-18 | 1994-12-28 | 適応的デジタルオーディオ符号化システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US5649052A (ja) |
EP (1) | EP0663741A3 (ja) |
JP (1) | JPH0856163A (ja) |
KR (1) | KR970005131B1 (ja) |
CN (1) | CN1116348A (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3082625B2 (ja) * | 1995-07-15 | 2000-08-28 | 日本電気株式会社 | 音声信号処理回路 |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
KR100251453B1 (ko) * | 1997-08-26 | 2000-04-15 | 윤종용 | 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크 |
US6161088A (en) * | 1998-06-26 | 2000-12-12 | Texas Instruments Incorporated | Method and system for encoding a digital audio signal |
US6499010B1 (en) * | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
IT1314626B1 (it) * | 2000-04-21 | 2002-12-20 | Ik Multimedia Production Srl | Procedimento per la codifica e la decodifica di flussi di dati,rappresentanti suoni in forma digitale, all'interno di un |
ATE387044T1 (de) * | 2000-07-07 | 2008-03-15 | Nokia Siemens Networks Oy | Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation |
WO2002005214A2 (en) * | 2000-07-11 | 2002-01-17 | Eg Technology | Adaptive edge detection and enhancement for image processing |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
DE10150519B4 (de) | 2001-10-12 | 2014-01-09 | Hewlett-Packard Development Co., L.P. | Verfahren und Anordnung zur Sprachverarbeitung |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
US8588291B2 (en) * | 2003-09-22 | 2013-11-19 | Broadcom Corporation | Multiple decode user interface |
US7706777B2 (en) * | 2003-09-23 | 2010-04-27 | Broadcom Corporation | Secure user interface in a shared resource environment |
US7693707B2 (en) * | 2003-12-26 | 2010-04-06 | Pansonic Corporation | Voice/musical sound encoding device and voice/musical sound encoding method |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CN101124626B (zh) * | 2004-09-17 | 2011-07-06 | 皇家飞利浦电子股份有限公司 | 用于最小化感知失真的组合音频编码 |
US7720013B1 (en) * | 2004-10-12 | 2010-05-18 | Lockheed Martin Corporation | Method and system for classifying digital traffic |
CN1321400C (zh) * | 2005-01-18 | 2007-06-13 | 中国电子科技集团公司第三十研究所 | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7692686B1 (en) * | 2006-02-21 | 2010-04-06 | Xfrm Incorporated | Method and apparatus for coding format autodetection testing |
US8711372B2 (en) * | 2006-08-31 | 2014-04-29 | Ricoh Co., Ltd. | Techniques for image segment accumulation in document rendering |
GB0915766D0 (en) * | 2009-09-09 | 2009-10-07 | Apt Licensing Ltd | Apparatus and method for multidimensional adaptive audio coding |
CN102393986B (zh) * | 2011-08-11 | 2013-05-08 | 重庆市科学技术研究院 | 基于音频判别的盗伐检测方法、装置及系统 |
KR20130093783A (ko) * | 2011-12-30 | 2013-08-23 | 한국전자통신연구원 | 오디오 객체 전송 장치 및 방법 |
US9774974B2 (en) | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
US10923135B2 (en) * | 2018-10-14 | 2021-02-16 | Tyson York Winarski | Matched filter to selectively choose the optimal audio compression for a metadata file |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2165654B (en) * | 1984-10-12 | 1988-05-25 | Yue Lin Thomas Hong | Method and apparatus for evaluating auditory distortions of an audio system |
JP2964344B2 (ja) * | 1988-06-08 | 1999-10-18 | 富士通株式会社 | 符号化/復号化装置 |
US5230003A (en) * | 1991-02-08 | 1993-07-20 | Ericsson-Ge Mobile Communications Holding, Inc. | Decoding system for distinguishing different types of convolutionally-encoded signals |
KR960009936B1 (ko) * | 1992-10-07 | 1996-07-25 | 대우전자 주식회사 | 오디오 신호의 왜곡 측정장치 및 방법 |
-
1994
- 1994-01-18 KR KR1019940000758A patent/KR970005131B1/ko not_active IP Right Cessation
- 1994-12-28 JP JP6338815A patent/JPH0856163A/ja active Pending
- 1994-12-29 US US08/366,144 patent/US5649052A/en not_active Expired - Fee Related
- 1994-12-30 EP EP94120952A patent/EP0663741A3/en not_active Ceased
-
1995
- 1995-01-18 CN CN95101253A patent/CN1116348A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP0663741A3 (en) | 1998-08-19 |
CN1116348A (zh) | 1996-02-07 |
EP0663741A2 (en) | 1995-07-19 |
KR950024443A (ko) | 1995-08-21 |
US5649052A (en) | 1997-07-15 |
KR970005131B1 (ko) | 1997-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0856163A (ja) | 適応的デジタルオーディオ符号化システム | |
KR101019678B1 (ko) | 저비트율 오디오 코딩 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
RU2197776C2 (ru) | Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты) | |
US6115689A (en) | Scalable audio coder and decoder | |
US6029126A (en) | Scalable audio coder and decoder | |
JP2756515B2 (ja) | 可聴信号の知覚符号化方法および音声信号伝送方法 | |
CA2286068C (en) | Method for coding an audio signal | |
US6253165B1 (en) | System and method for modeling probability distribution functions of transform coefficients of encoded signal | |
JP3878952B2 (ja) | オーディオ信号コーディング中にノイズ置換を信号で知らせる方法 | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
Brandenburg | OCF--A new coding algorithm for high quality sound signals | |
US4815134A (en) | Very low rate speech encoder and decoder | |
EP1080579B1 (en) | Scalable audio coder and decoder | |
IL158102A (en) | A device and method for encrypting / decrypting audible coolants | |
JP3297240B2 (ja) | 適応的符号化システム | |
KR100952065B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
KR100349329B1 (ko) | 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법 | |
JP3297238B2 (ja) | 適応的符号化システム及びビット割当方法 | |
JP3863706B2 (ja) | 音声符号化方法 | |
JPS59129900A (ja) | 帯域分割符号化方式 | |
JP3827720B2 (ja) | 差分コーディング原理を用いる送信システム | |
KR960012477B1 (ko) | 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치 | |
JP2000137497A (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
JPH0918348A (ja) | 音響信号符号化装置及び音響信号復号装置 |