JP6160072B2 - オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 - Google Patents
オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 Download PDFInfo
- Publication number
- JP6160072B2 JP6160072B2 JP2012267142A JP2012267142A JP6160072B2 JP 6160072 B2 JP6160072 B2 JP 6160072B2 JP 2012267142 A JP2012267142 A JP 2012267142A JP 2012267142 A JP2012267142 A JP 2012267142A JP 6160072 B2 JP6160072 B2 JP 6160072B2
- Authority
- JP
- Japan
- Prior art keywords
- reverberation
- sound
- characteristic
- masking
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 138
- 238000000034 method Methods 0.000 title claims description 41
- 230000005540 biological transmission Effects 0.000 title claims description 23
- 230000000873 masking effect Effects 0.000 claims description 314
- 238000013139 quantization Methods 0.000 claims description 56
- 238000012546 transfer Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 description 61
- 238000010586 diagram Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 17
- 230000004044 response Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 230000036961 partial effect Effects 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000003079 width control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
- G10K15/12—Arrangements for producing a reverberation or echo sound using electronic time-delay networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
本発明の一態様によれば、オーディオ信号符号化あるいはオーディオ信号復号において、更なる低ビットレート化を目的とする。
各実施形態について説明する前に、一般的に考えられる技術について説明する。
図1は、入力オーディオ信号の符号化において、入力オーディオ信号の音質を向上させるために一般的に考えられる符号化装置の構成例を示す図である。
いま例えば、図1の入力音が模式的に、図2のS1、S2、S3、S4として示される音源周波数信号成分を持っているとする。この場合、人間は、例えば音源S2の電力値に対して、201で示されるマスキングカーブ(周波数特性)を有する。つまり人間は、入力音中に音源S2が存在するときに、図2のマスキングカーブ201よりも電力値が小さいマスキング範囲202内の各周波数電力成分は、聞こえにくくなる。すなわち、マスキングされる。
図3において、量子化器301は、オーディオ信号の量子化を行う。より具体的には例えば、周波数分割部305がオーディオ信号を複数の周波数帯域の部分信号に分割し、量子化器301は複数の部分信号を各々量子化し、さらに多重化器306が、量子化器301によって量子化された複数の部分信号を多重化する。
送信側401において、入力音(図1のオーディオ信号に対応する)が符号化装置403にて符号化され、その結果得られた符号化データ405(図1の出力データに対応する)が、再生側402の再生装置404に伝送され、その再生装置404にて復号されて再生される。ここで、再生装置404がスピーカからユーザに対して放音を行うときの再生環境では、一般に直接音406に加えて、残響407が生じる。
図5(a)に示される残響なしの場合には、例えばオーディオ信号に2つの音源P1、P2が含まれている場合、聴覚マスキングの範囲は、それぞれの音源P1、P2に対して、501および502で示される各範囲となる。この場合、音源P1、P2とも、それぞれの電力値は、聴覚マスキングの範囲の上に出るため、図3の制御部303は、聴覚マスキングの特性に基づいて、音源P1、P2に対応するそれぞれの周波数信号成分に対して、量子化ステップ幅308として細かい値を割り当てる必要がある。
そこで、図3の制御部303は、聴覚マスキングの特性310に基づく聴覚マスキングの範囲501、502のほかに、残響マスキングの特性307に基づく残響マスキングの範囲503も考慮して各周波数信号成分の量子化ステップ幅308を制御する。具体的には、図5(b)に示される残響ありの場合で、残響マスキングの範囲503が聴覚マスキングの範囲501、502を全体的に包含するような場合を考える。すなわち、図4に示されるように、再生環境において残響407がかなり大きい場合である。そして、音源P2の周波数信号成分において、聴覚マスキングの範囲501、502の電力値よりも、残響マスキングの範囲503の電力値のほうが大きく、かつ音源P2の電力値が残響マスキングの範囲503内に入るような場合を考える。この場合には、図3の制御部303は、聴覚マスキングの特性310と残響マスキングの特性307に基づいて、音源P2に対応する周波数信号成分の量子化ステップ幅308を粗くする。
図6の第2の実施形態のオーディオ符号化装置の動作について、以下に説明する。
残響信号生成部801は、下記数1式に基づいて、図6の残響特性選択部611から出力される残響特性609である残響環境のインパルス応答804を用いて、入力信号805から残響信号806を生成する公知のFIR(Finite Impulse Response:有限インパルス応答)フィルタである。
次に、図6の残響特性記憶部612から、入力された再生環境の種類613に対応する残響特性609のインパルス応答が選択されて読み出される(ステップS1302)。
そして、聴覚マスキング閾値1102(図11)が算出される(ステップS1304)。
このステップS1306の処理は、図6のマスキング合成部603に対応する。
以上のステップS1308およびS1309の処理は、図6の多重化器606に対応する。
このシステムは、復号再生装置1402における再生環境の残響特性1408を推定し、それを符号化装置1401に通知することにより、残響マスキングを利用して入力信号の符号化効率を向上するオーディオ信号伝送システムである。例えば、マルチメディア放送機器および受信端末への利用が考えられる。
これに対して、符号化装置1401内の残響特性受信部1410は、復号再生装置1402から送られてきた再生環境の残響特性1408を受信し、残響マスキング算出部602に転送する。
残響特性推定部1407は、図14の復号部1404で復号されたデータ1501と、放音部1405内のスピーカ1502で放音された直接音1504、残響1505を収音部1406内のマイク1503で収音した音を入力して動作する適応フィルタ1506を備える。適応フィルタ1506は、マイク1503からの音に自身の適応処理により出力した誤差信号1507を加算する動作を繰り返して、再生環境のインパルス応答を推定する。そして、適応処理が終了したフィルタ特性にインパルスが入力されることにより、インパルス応答としての再生環境の残響特性1408を得る。
(付記1)
オーディオ信号の量子化を行う量子化器、
前記オーディオ信号で表されている音の再生によって再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を取得する残響マスキング特性取得部、及び
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する制御部、
を備えることを特徴とするオーディオ信号符号化装置。
(付記2)
前記制御部は、前記残響マスキングの特性に基づき、前記オーディオ信号で表されている音の大きさが前記残響によってマスクされる大きさである場合には、前記残響によってマスクされない大きさである場合よりも量子化ステップ幅を広げる制御を行うことを特徴とする付記1に記載のオーディオ信号符号化装置。
(付記3)
前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響が前記音に及ぼす周波数マスキングの特性を取得することを特徴とする付記1又は2に記載のオーディオ信号符号化装置。
(付記4)
前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響が前記音に及ぼす継時マスキングの特性を取得することを特徴とする付記1から3のうちのいずれか一項に記載のオーディオ信号符号化装置。
(付記5)
人の聴覚特性が前記オーディオ信号で表されている音に及ぼす聴覚マスキングの特性を取得する聴覚マスキング特性取得部を更に備え、
前記制御部は、前記量子化器の量子化ステップ幅を、更に、前記聴覚マスキングの特性にも基づいて制御する、
ことを特徴とする付記1から4のうちのいずれか一項に記載のオーディオ信号符号化装置。
(付記6)
前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響によってマスクされる音の大きさの周波数特性を取得し、
前記聴覚マスキング特性取得部は、前記聴覚マスキングの特性として、人の聴覚特性によってマスクされる音の大きさの周波数特性を取得し、
前記制御部は、前記残響マスキングの特性である周波数特性と前記聴覚マスキングの特性である周波数特性とにおいて周波数毎に大きい方の特性を選択して得られる合成マスキング特性に基づいて前記量子化器の量子化ステップ幅を制御することを特徴とする付記5に記載のオーディオ信号符号化装置。
(付記7)
前記オーディオ信号を複数の周波数帯域の部分信号に分割する周波数分割部を更に備え、
前記量子化器は、前記複数の部分信号を各々量子化し、
前記量子化器によって量子化された複数の部分信号を多重化する多重化器を更に備える、
ことを特徴とする付記1から6のうちのいずれか一項に記載のオーディオ信号符号化装置。
(付記8)
前記残響マスキング特性取得部は、前記オーディオ信号と、前記再生環境の残響特性と、予め用意されている人の聴覚心理モデルとを用いて前記残響マスキングの特性を算出することを特徴とする付記1から7のうちのいずれか一項に記載のオーディオ信号符号化装置。
(付記9)
前記残響マスキング特性取得部は、前記残響特性として、再生環境毎に予め用意されている残響特性から選択されたものを用いて前記残響マスキングの特性を算出することを特徴とする付記8に記載のオーディオ信号符号化装置。
(付記10)
前記残響マスキング特性取得部は、前記再生環境に対応する残響特性の選択情報を受け取ることにより、前記再生環境に対応する残響特性を選択することを特徴とする付記9に記載のオーディオ信号符号化装置。
(付記11)
前記残響マスキング特性取得部は、前記残響特性として、前記再生環境で収音した音と、該音を収音したときに前記再生環境で発せられていた音とに基づいた前記再生環境における残響特性の推定結果を用いて前記残響マスキングの特性を算出することを特徴とする付記8に記載のオーディオ信号符号化装置。
(付記12)
オーディオ信号を符号化する符号化装置、及び
前記符号化装置により符号化されたオーディオ信号を復号して該オーディオ信号で表されている音を再生環境で再生する復号再生装置、
を備え、
前記符号化装置は、
オーディオ信号の量子化を行う量子化器、
前記量子化されたオーディオ信号を前記復号再生装置へ送信するオーディオ信号送信部、
前記オーディオ信号で表されている音の再生によって前記再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記オーディオ信号と、前記再生環境の残響特性と、予め用意されている人の聴覚心理モデルとを用いて算出して取得する残響マスキング特性取得部、
前記再生環境の残響特性を、前記復号再生装置から受信する残響特性受信部、及び
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する制御部、
を備え、
前記復号再生装置は、
前記符号化装置から送られてくる、前記量子化されたオーディオ信号を復号する復号部、
前記復号されたオーディオ信号の音を含む音を前記再生環境で放音する放音部、
前記放音部により放音された音を前記再生環境で収音する収音部、
前記収音部により収音された音と前記放音部により放音された音とに基づいて前記再生環境の残響特性を推定する推定部、及び
前記推定部により推定された前記再生環境の残響特性を前記符号化装置へ送信する残響特性送信部、
を備える、
ことを特徴とするオーディオ信号伝送システム。
(付記13)
前記推定部は、前記放音部により放音された音が前記収音部に至るまでの伝達特性を求めることによって、前記再生環境の残響特性を推定することを特徴とする付記12に記載のオーディオ信号伝送システム。
(付記14)
前記放音部は、予め用意されている試験音を放音し、
前記推定部は、前記試験音を用いて前記再生環境の残響特性を推定する、
ことを特徴とする付記12又は13に記載のオーディオ信号伝送システム。
(付記15)
前記放音部は、前記復号部により復号されたオーディオ信号で表されている音を放音し、
前記推定部は、前記復号部により復号されたオーディオ信号で表されている音を用いて前記再生環境の残響特性を推定する、
ことを特徴とする付記12又は13に記載のオーディオ信号伝送システム。
(付記16)
前記推定部は、前記オーディオ信号の復号開始時に前記再生環境の残響特性の推定を行い、
前記送信部は、前記オーディオ信号の復号開始時に前記推定部が推定した前記再生環境の残響特性を前記符号化装置へ送信し、
前記残響マスキング特性取得部は、前記残響特性受信部が前記オーディオ信号の復号開始時に受信した前記再生環境の残響特性に基づいて前記残響マスキングの特性を取得する、
ことを特徴とする付記14又は15に記載のオーディオ信号伝送システム。
(付記17)
前記推定部は、所定時間毎に前記再生環境の残響特性の推定を行い、
前記送信部は、前記推定部が前記再生環境の残響特性の推定を行う度に、推定された前記再生環境の残響特性を前記符号化装置へ送信し、
前記残響マスキング特性取得部は、前記残響特性受信部が前記再生環境の残響特性を受信する度に前記残響マスキングの特性の取得を行い、
前記制御部は、前記残響マスキング特性取得部が前記残響マスキングの特性を取得する度に、前記量子化ステップ幅の制御を更新する、
ことを特徴とする付記15に記載のオーディオ信号伝送システム。
(付記18)
オーディオ信号の量子化を行い、
前記オーディオ信号で表されている音の再生によって再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を取得し、
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する、
ことを備えることを特徴とするオーディオ信号符号化方法。
(付記19)
オーディオ信号を符号化する符号化装置において、
前記符号化装置により符号化されたオーディオ信号を復号して該オーディオ信号で表されている音を再生環境で再生する復号再生装置から前記再生環境の残響特性を受信し、
前記オーディオ信号で表されている音の再生によって前記再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記オーディオ信号と、前記受信した再生環境の残響特性と、予め用意されている人の聴覚心理モデルとを用いて算出して取得し、
量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御し、
前記量子化ステップ幅が制御された量子化器を用いて前記オーディオ信号の量子化を行い、
前記量子化されたオーディオ信号を前記復号再生装置へ送信する、
ことを備え、
前記復号再生装置において、
前記符号化装置から送られてくる、前記量子化されたオーディオ信号を復号し、
前記復号されたオーディオ信号の音を含む音を前記再生環境で放音し、
前記放音された音を前記再生環境で収音し、
前記収音された音と前記放音された音とに基づいて前記再生環境の残響特性を推定し、
前記推定された前記再生環境の残響特性を前記符号化装置へ送信する、
ことを備える、
ことを特徴とするオーディオ信号伝送方法。
(付記20)
符号化装置から送られてくる、量子化されたオーディオ信号を復号する復号部、
前記復号されたオーディオ信号の音を含む音を再生環境で放音する放音部、
前記放音部により放音された音を前記再生環境で収音する収音部、
前記収音部により収音された音と前記放音部により放音された音とに基づいて前記再生環境の残響特性を推定する推定部、及び
前記推定部により推定された前記再生環境の残響特性を前記符号化装置へ送信する残響特性送信部、
を備えることを特徴とするオーディオ信号復号装置。
(付記21)
符号化装置から送られてくる、量子化されたオーディオ信号を復号し、
前記復号されたオーディオ信号の音を含む音を再生環境で放音し、
前記放音された音を前記再生環境で収音し、
前記収音された音と前記放音された音とに基づいて前記再生環境の残響特性を推定し、
前記推定された前記再生環境の残響特性を前記符号化装置へ送信する、
ことを備えることを特徴とするオーディオ信号復号方法。
102 量子化部
103 多重化部
104、604 聴覚マスキング算出部
201 マスキングカーブ
202 マスキング範囲
301、601 量子化器
302 残響マスキング特性取得部
303 制御部
304 聴覚マスキング特性取得部
305 周波数分割部
306、606 多重化器
307、607 残響マスキングの特性
308、608 量子化ステップ幅
309、609 残響特性
310、610 聴覚マスキングの特性
401 送信側
402 受信側
403、1401 符号化装置
404 再生装置
405 符号化データ
406、1504 直接音
407、1505 残響
501、502 聴覚マスキングの範囲
503 残響マスキングの範囲
602 残響マスキング算出部
603 マスキング合成部
604 聴覚マスキング算出部
611 残響特性選択部
612 残響特性記憶部
613 再生環境の種類
801 残響信号生成部
802 時間−周波数変換部
803 マスキング算出部
804 残響環境のインパルス応答
805 入力信号
806 残響信号
807 残響スペクトル
808 聴覚心理モデル
809 残響マスキング閾値
901、1002 電力ピーク
902A、902B、1003a、1003b マスキングカーブ
1001 残響信号の周波数成分
1101 最大値算出部
1102 聴覚マスキング閾値
1103 合成マスキング閾値
1402 復号再生装置
1403 符号化ビット列
1404 復号部
1405 放音部
1406 収音部
1407 残響特性推定部
1408 再生環境の残響特性
1409 残響特性送信部
1410 残響特性受信部
1501 復号されたデータ
1502 スピーカ
1503 マイク
1506 適応フィルタ
1507 誤差信号
Claims (10)
- オーディオ信号の量子化を行う量子化器、
前記オーディオ信号で表されている音の再生によって再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記再生環境で放音された音が収音部に至るまでの伝達特性を用いて推定する残響マスキング特性取得部、及び
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する制御部、
を備えることを特徴とするオーディオ信号符号化装置。 - 前記制御部は、前記残響マスキングの特性に基づき、前記オーディオ信号で表されている音の大きさが前記残響によってマスクされる大きさである場合には、前記残響によってマスクされない大きさである場合よりも量子化ステップ幅を広げる制御を行うことを特徴とする請求項1に記載のオーディオ信号符号化装置。
- 前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響が前記音に及ぼす周波数マスキングの特性を取得することを特徴とする請求項1又は2に記載のオーディオ信号符号化装置。
- 前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響が前記音に及ぼす継時マスキングの特性を取得することを特徴とする請求項1から3のうちのいずれか一項に記載のオーディオ信号符号化装置。
- 人の聴覚特性が前記オーディオ信号で表されている音に及ぼす聴覚マスキングの特性を取得する聴覚マスキング特性取得部を更に備え、
前記制御部は、前記量子化器の量子化ステップ幅を、更に、前記聴覚マスキングの特性にも基づいて制御する、
ことを特徴とする請求項1から4のうちのいずれか一項に記載のオーディオ信号符号化装置。 - 前記残響マスキング特性取得部は、前記残響マスキングの特性として、前記残響によってマスクされる音の大きさの周波数特性を取得し、
前記聴覚マスキング特性取得部は、前記聴覚マスキングの特性として、人の聴覚特性によってマスクされる音の大きさの周波数特性を取得し、
前記制御部は、前記残響マスキングの特性である周波数特性と前記聴覚マスキングの特性である周波数特性とにおいて周波数毎に大きい方の特性を選択して得られる合成マスキング特性に基づいて前記量子化器の量子化ステップ幅を制御することを特徴とする請求項5に記載のオーディオ信号符号化装置。 - オーディオ信号を符号化する符号化装置、及び
前記符号化装置により符号化されたオーディオ信号を復号して該オーディオ信号で表されている音を再生環境で再生する復号再生装置、
を備え、
前記符号化装置は、
オーディオ信号の量子化を行う量子化器、
前記量子化されたオーディオ信号を前記復号再生装置へ送信するオーディオ信号送信部、
前記オーディオ信号で表されている音の再生によって前記再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記オーディオ信号と、前記再生環境で放音された音が収音部に至るまでの伝達特性を用いて推定する残響特性と、予め用意されている人の聴覚心理モデルとを用いて算出して取得する残響マスキング特性取得部、
前記再生環境の残響特性を、前記復号再生装置から受信する残響特性受信部、及び
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する制御部、
を備え、
前記復号再生装置は、
前記符号化装置から送られてくる、前記量子化されたオーディオ信号を復号する復号部、
前記復号されたオーディオ信号の音を含む音を前記再生環境で放音する放音部、
前記放音部により放音された音を前記再生環境で収音する収音部、
前記収音部により収音された音と前記放音部により放音された音とに基づいて前記再生環境の残響特性を推定する推定部、及び
前記推定部により推定された前記再生環境の残響特性を前記符号化装置へ送信する残響特性送信部、
を備える、
ことを特徴とするオーディオ信号伝送システム。 - オーディオ信号の量子化を行い、
前記オーディオ信号で表されている音の再生によって再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記再生環境で放音された音が収音部に至るまでの伝達特性を用いて推定し、
前記量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御する、
ことを備えることを特徴とするオーディオ信号符号化方法。 - オーディオ信号を符号化する符号化装置において、
前記符号化装置により符号化されたオーディオ信号を復号して該オーディオ信号で表されている音を再生環境で再生する復号再生装置から前記再生環境の残響特性を受信し、
前記オーディオ信号で表されている音の再生によって前記再生環境で生じる前記音の残響が前記音に及ぼす残響マスキングの特性を、前記オーディオ信号と、前記再生環境で放音された音が収音部に至るまでの伝達特性を用いて推定する残響特性と、予め用意されている人の聴覚心理モデルとを用いて算出して取得し、
量子化器の量子化ステップ幅を前記残響マスキングの特性に基づいて制御し、
前記量子化ステップ幅が制御された量子化器を用いて前記オーディオ信号の量子化を行い、
前記量子化されたオーディオ信号を前記復号再生装置へ送信する、
ことを備え、
前記復号再生装置において、
前記符号化装置から送られてくる、前記量子化されたオーディオ信号を復号し、
前記復号されたオーディオ信号の音を含む音を前記再生環境で放音し、
前記放音された音を前記再生環境で収音し、
前記収音された音と前記放音された音とに基づいて前記再生環境の残響特性を推定し、
前記推定された前記再生環境の残響特性を前記符号化装置へ送信する、
ことを備える、
ことを特徴とするオーディオ信号伝送方法。 - 符号化装置から送られてくる、量子化されたオーディオ信号を復号する復号部、
前記復号されたオーディオ信号の音を含む音を再生環境で放音する放音部、
前記放音部により放音された音を前記再生環境で収音する収音部、
前記収音部により収音された音と前記放音部により放音された音とに基づいて前記再生環境の残響特性を、前記再生環境で放音された音が収音部に至るまでの伝達特性を用いて推定する推定部、及び
前記推定部により推定された前記再生環境の残響特性を前記符号化装置へ送信する残響特性送信部、
を備えることを特徴とするオーディオ信号復号装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012267142A JP6160072B2 (ja) | 2012-12-06 | 2012-12-06 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
US14/093,798 US9424830B2 (en) | 2012-12-06 | 2013-12-02 | Apparatus and method for encoding audio signal, system and method for transmitting audio signal, and apparatus for decoding audio signal |
EP13195452.1A EP2741287B1 (en) | 2012-12-06 | 2013-12-03 | Apparatus and method for encoding audio signal, system and method for transmitting audio signal |
CN201310641777.1A CN103854656B (zh) | 2012-12-06 | 2013-12-03 | 音频信号编码装置和方法、传输系统和方法以及解码装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012267142A JP6160072B2 (ja) | 2012-12-06 | 2012-12-06 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014115316A JP2014115316A (ja) | 2014-06-26 |
JP6160072B2 true JP6160072B2 (ja) | 2017-07-12 |
Family
ID=49679446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012267142A Expired - Fee Related JP6160072B2 (ja) | 2012-12-06 | 2012-12-06 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9424830B2 (ja) |
EP (1) | EP2741287B1 (ja) |
JP (1) | JP6160072B2 (ja) |
CN (1) | CN103854656B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10418042B2 (en) | 2014-05-01 | 2019-09-17 | Nippon Telegraph And Telephone Corporation | Coding device, decoding device, method, program and recording medium thereof |
CN105280188B (zh) * | 2014-06-30 | 2019-06-28 | 美的集团股份有限公司 | 基于终端运行环境的音频信号编码方法和系统 |
CN108665902B (zh) | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN113207058B (zh) * | 2021-05-06 | 2023-04-28 | 恩平市奥达电子科技有限公司 | 一种音频信号的传输处理方法 |
CN114495968B (zh) * | 2022-03-30 | 2022-06-14 | 北京世纪好未来教育科技有限公司 | 语音处理方法、装置、电子设备及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2976429B2 (ja) * | 1988-10-20 | 1999-11-10 | 日本電気株式会社 | アドレス制御回路 |
JP3446216B2 (ja) | 1992-03-06 | 2003-09-16 | ソニー株式会社 | 音声信号処理方法 |
JP2820117B2 (ja) | 1996-05-29 | 1998-11-05 | 日本電気株式会社 | 音声符号化装置 |
KR100261254B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
US6154552A (en) * | 1997-05-15 | 2000-11-28 | Planning Systems Inc. | Hybrid adaptive beamformer |
JP3750705B2 (ja) * | 1997-06-09 | 2006-03-01 | 松下電器産業株式会社 | 音声符号化伝送方法及び音声符号化伝送装置 |
JP2000148191A (ja) | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化装置 |
JP3590342B2 (ja) | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
CN1898724A (zh) * | 2003-12-26 | 2007-01-17 | 松下电器产业株式会社 | 语音/乐音编码设备及语音/乐音编码方法 |
ATE539431T1 (de) | 2004-06-08 | 2012-01-15 | Koninkl Philips Electronics Nv | Kodierung von tonsignalen mit hall |
GB0419346D0 (en) * | 2004-09-01 | 2004-09-29 | Smyth Stephen M F | Method and apparatus for improved headphone virtualisation |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
JP4175376B2 (ja) * | 2006-03-30 | 2008-11-05 | ヤマハ株式会社 | オーディオ信号処理装置、オーディオ信号処理方法、及びオーディオ信号処理プログラム |
KR101435411B1 (ko) * | 2007-09-28 | 2014-08-28 | 삼성전자주식회사 | 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치 |
TWI475896B (zh) * | 2008-09-25 | 2015-03-01 | Dolby Lab Licensing Corp | 單音相容性及揚聲器相容性之立體聲濾波器 |
US9467790B2 (en) | 2010-07-20 | 2016-10-11 | Nokia Technologies Oy | Reverberation estimator |
US8761410B1 (en) * | 2010-08-12 | 2014-06-24 | Audience, Inc. | Systems and methods for multi-channel dereverberation |
CN102436819B (zh) * | 2011-10-25 | 2013-02-13 | 杭州微纳科技有限公司 | 无线音频压缩、解压缩方法及音频编码器和音频解码器 |
-
2012
- 2012-12-06 JP JP2012267142A patent/JP6160072B2/ja not_active Expired - Fee Related
-
2013
- 2013-12-02 US US14/093,798 patent/US9424830B2/en not_active Expired - Fee Related
- 2013-12-03 CN CN201310641777.1A patent/CN103854656B/zh not_active Expired - Fee Related
- 2013-12-03 EP EP13195452.1A patent/EP2741287B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
CN103854656A (zh) | 2014-06-11 |
CN103854656B (zh) | 2017-01-18 |
US9424830B2 (en) | 2016-08-23 |
JP2014115316A (ja) | 2014-06-26 |
US20140161269A1 (en) | 2014-06-12 |
EP2741287B1 (en) | 2015-08-19 |
EP2741287A1 (en) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107851440B (zh) | 经编码音频扩展的基于元数据的动态范围控制 | |
JP3870193B2 (ja) | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム | |
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
KR100981694B1 (ko) | 스테레오 신호들의 코딩 | |
JP6160072B2 (ja) | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 | |
US20060004566A1 (en) | Low-bitrate encoding/decoding method and system | |
KR20180104701A (ko) | 채널 간 시간 차를 추정하기 위한 장치 및 방법 | |
JP2012198555A (ja) | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 | |
Hwang | Multimedia networking: From theory to practice | |
JP2006139306A (ja) | アダプティブディザを減算し、埋没チャンネルビットを挿入し、フィルタリングすることによりマルチビット符号ディジタル音声を符号化する方法及び装置、及びこの方法のための符号化及び復号化装置 | |
JP2013543712A (ja) | 音を増強させるための方法及びシステム | |
EP3762923B1 (en) | Audio coding | |
JP4021124B2 (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
CN105745703A (zh) | 信号编码方法和装置以及信号解码方法和装置 | |
KR20070122414A (ko) | 디지털 신호 처리 장치, 디지털 신호 처리 방법, 디지털신호 처리 프로그램, 디지털 신호 재생 장치 및 디지털신호 재생 방법 | |
JP2004199075A (ja) | ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置 | |
WO2016016051A1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP4944317B2 (ja) | デジタルオーディオ圧縮アプリケーションにおいてオーディオ材料を事前に分類する方法および装置 | |
US9311925B2 (en) | Method, apparatus and computer program for processing multi-channel signals | |
KR102605961B1 (ko) | 고해상도 오디오 코딩 | |
JP2013073230A (ja) | オーディオ符号化装置 | |
JPWO2010150767A1 (ja) | 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体 | |
JP7262593B2 (ja) | ハイレゾリューションオーディオ符号化 | |
WO2020149227A1 (ja) | 復号装置、復号方法、及びプログラム | |
CN113302684B (zh) | 高分辨率音频编解码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6160072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |