JP2014085542A - オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム - Google Patents

オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム Download PDF

Info

Publication number
JP2014085542A
JP2014085542A JP2012234870A JP2012234870A JP2014085542A JP 2014085542 A JP2014085542 A JP 2014085542A JP 2012234870 A JP2012234870 A JP 2012234870A JP 2012234870 A JP2012234870 A JP 2012234870A JP 2014085542 A JP2014085542 A JP 2014085542A
Authority
JP
Japan
Prior art keywords
frequency spectrum
band
tone signal
scale factor
audio encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012234870A
Other languages
English (en)
Other versions
JP6179087B2 (ja
Inventor
Yohei Kishi
洋平 岸
Akira Kamano
晃 釜野
Shunsuke Takeuchi
俊輔 武内
Miyuki Shirakawa
美由紀 白川
Masanao Suzuki
政直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012234870A priority Critical patent/JP6179087B2/ja
Priority to US14/046,404 priority patent/US20140114652A1/en
Publication of JP2014085542A publication Critical patent/JP2014085542A/ja
Application granted granted Critical
Publication of JP6179087B2 publication Critical patent/JP6179087B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】トーン信号を含むオーディオ信号を適切に量子化して音質劣化を抑制することが可能となるオーディオ符号化装置を提供する。
【解決手段】オーディオ符号化装置1は、入力信号の周波数スペクトル特性を算出する算出部4を有する。更に、当該オーディオ符号化装置1は、入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、周波数スペクトル特性に基づいて複数の帯域毎に規定する規定部5を備える。更に、当該オーディオ符号化装置1は、スケールファクタに基づいて、周波数スペクトルを量子化する量子化部6を有する。
【選択図】図1

Description

開示の技術は、オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化用コンピュータプログラムに関する。
従来より、オーディオ信号(音声・音楽などの音源)を圧縮・伸張するオーディオ符号化技術に関して、様々な研究が行われている。例えば、オーディオ信号を周波数領域に変換して符号化する手法について、様々な研究が行われている。
例えば、このようなオーディオ符号化技術としては、AAC(advanced audio coding)方式や、HE−AAC(high efficiency−advanced audio coding)方式などがある。AAC方式やHE−AAC方式は、ISO/IECのMPEG−2/4 Audio規格の一つであり、日本のデジタル放送(地上波、BS、CS)などに広く用いられている。
この様なオーディオ符号化技術では、オーディオ符号化を実行する符号化装置が、MDCT(modified discrete cosine transform)変換により周波数スペクトルにオーディオ信号を変換し、この周波数スペクトルを量子化し、その後、量子化値を符号化する。
上述したオーディオ符号化技術では、聴覚のマスキング特性を利用して、周波数スペクトルを量子化する。具体的には、ある音にマスクされて、聴覚的に聞こえない音の成分を決定する閾値(聞こえるか、聞こえないかの閾値)であるマスキング閾値を用いて、ユーザの聴覚に聞こえる音だけを量子化する。
例えば、従来のオーディオ符号化装置においては、オーディオ信号(符号化する音源)について、心理聴覚分析(聴覚によって、聞こえるか、聞こえないかを分析する手法)を行い、マスキング閾値を周波数帯域ごとに算出する。その後、オーディオ符号化装置は、算出したマスキング閾値から、量子化する際に許容できる誤差の限界(許容誤差電力)を、周波数帯域(所定の周波数の幅)ごとに決定する。そして、オーディオ符号化装置は、許容誤差電力を用いて、聴覚的に聞こえる音源(周波数のスペクトル)のみを量子化する。
関連する従来技術として、マスキング閾値を調節する手法、符号化する際に使用するビットの使用量を少なくする手法、ビットの配分量を指定する手法等が開示されている。また、トーン性(トーン信号)を有するオーディオ信号を符号化する際に、音質を劣化させない為に、量子化に用いるスケールファクタを補正する手法も開示されている。
具体的には、トーン信号を有するオーディオ信号(例えば、正弦波やスイープ波など)を符号化する場合、特定の帯域に強度(電力[dB]、パワー)が集中し、他の帯域と比較して相対的に大きなピークを示す(強度が強い周波数スペクトルとなる)。トーン信号を有するオーディオ信号を符号化する際に、トーン信号近傍の周波数スペクトル帯域の周波数スペクトルを確実に量子化することが出来ない場合、トーン信号近傍の周波数スペクトルが失われることになる。トーン信号を有するオーディオ信号は、時間方向で一定の音となる。この為、トーン信号帯域の帯域電力がフレームごとに変化することにより音の震えとして聞こえる為に、符号化による主観的な音声劣化が顕著に目立つことになる。この為、従来技術においては、マスキング閾値を越えるスケールファクタに補正することで、トーン信号近傍の周波数スペクトル帯域の周波数スペクトルを量子化している。
特開2006−18023号公報 特開2001−7704号公報 特開平7−202823号公報 特開平7−295594号公報 特開2009−198612号公報
トーン信号を有するオーディオ信号の符号化の際にスケールファクタを補正する場合において、発明者らの鋭意検証により、以下の新たな課題が見出された。従来技術において、トーン信号を有するオーディオ信号に背景雑音等の雑音が重畳する場合を想定すると、トーン信号帯域のみならず、雑音帯域についてもスケールファクタが補正されることになる。この為、トーン信号帯域に加えて、雑音帯域においても量子化ビット量が大きく増加することになる。
一方、トーン信号帯域と雑音帯域を合わせた全帯域における量子化ビットの割当総量は、ビットレートで一意的に規定される為、全帯域の量子化ビットが増加することにより、量子化ビットの割当総量を超えた場合、量子化ビットの欠落が発生する。トーン信号や背景雑音は、時間単位で変化する為、量子化ビットの欠落が発生する符号化帯域も時間単位で異なることになる。この場合は、トーン信号帯域の量子化ビット欠落による音質劣化と比較して、顕著な音質劣化が発生することが明らかとなった。即ち、トーン信号に背景雑音が重畳した場合において、量子化ビット欠落による音質劣化を抑制することが可能となるオーディオ符号化技術は提唱されていない状況である。
本発明は、トーン信号を含むオーディオ信号を適切に量子化して音質劣化を抑制することが可能となるオーディオ符号化装置を提供することを目的とする。
本発明が開示するオーディオ符号化装置は、入力信号の周波数スペクトル特性を算出する算出部を有する。更に、当該オーディオ符号化装置は、入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、周波数スペクトル特性に基づいて複数の帯域毎に規定する規定部を備える。更に、当該オーディオ符号化装置は、スケールファクタに基づいて、周波数スペクトルを量子化する量子化部を有する。
なお、本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成されるものである。また、上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を制限するものではないことを理解されたい。
本明細書に開示されるオーディオ符号化装置では、トーン信号を含むオーディオ信号を適切に量子化して音質劣化を抑制することが可能となる。
一つの実施形態によるオーディオ符号化装置の機能ブロック図である。 (a)は、周波数スペクトルの電力と周波数帯域の関係図である。(b)は、トーン信号帯域判定のデータ構造の一例を示すテーブルである。 (a)は、トーン信号対雑音比とスケールファクタの規定係数の関係図である。(b)は、トーン信号対雑音比と規定係数を含むデータ構造の一例を示すテーブルである。 (a)は、オーディオ信号に雑音帯域が含まれない場合の量子化ビット数と周波数の関係図である。(b)は、オーディオ信号に雑音帯域が含まれる場合の量子化ビット数と周波数の関係図である。 (a)は、トーン信号を含むオーディオ信号の原音のスペクトル図である。(b)は、比較例の符号化を適用した復号後のオーディオ信号のスペクトル図である。(c)は、実施例1の符号化を適用した復号後のオーディオ信号のスペクトル図である。 オーディオ符号化処理の動作フローチャートである。 一つの実施形態によるオーディオ符号化復号システムの機能ブロックを示す図である。 一つの実施形態によるオーディオ符号化装置のハードウェア構成図である。
以下に、一つの実施形態によるオーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム、ならびにオーディオ符号化復号システムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
(実施例1)
図1は、一つの実施形態によるオーディオ符号化装置1の機能ブロック図である。図1に示す様に、オーディオ符号化装置1は、変換部2、予備規定部3、算出部4、規定部5、量子化部6、符号化部7を含んでいる。
オーディオ符号化装置1が有するこれらの各部は、例えば、それぞれ別個の回路としてワイヤードロジックによるハードウェア回路によって形成される。あるいはオーディオ符号化装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路としてオーディオ符号化装置1に実装されてもよい。さらに、オーディオ符号化装置1が有するこれらの各部は、オーディオ符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
変換部2は、外部から入力された入力信号となるオーディオ信号を、複数の帯域を有する周波数スペクトルに変換する。具体的には、変換部2は、入力されたオーディオ信号に、MDCT変換によって時間−周波数変換を行い、複数の帯域を有する周波数スペクトルに変換する。ここで、時間−周波数変換とは、例えば、時間をパラメータとして表されている(例えば、横軸が「時間」で表される)オーディオ信号を、周波数をパラメータとして表される情報である(例えば、横軸が「周波数」で表される)周波数スペクトルに変換することを示す。変換部2は、例えば、ISO/IEC13818−7に記載の次式に従って、オーディオ信号を周波数スペクトルに変換することが出来る。
(数1)
ここで、nは時間、kは周波数、Znは入力信号×窓、Nは窓長、n=(N/2+1)/2を示す。
なお、「周波数スペクトル」とは、オーディオ信号(音源)を周波数領域に変換(例えば、上述のMDCT変換)した場合に得られる周波数ごとの係数(例えば、MDCT係数)である。なお、周波数スペクトルを二乗した値が「周波数スペクトル電力」となる。また、周波数スペクトルの内、ある周波数に周波数スペクトル電力のピークが集中した場合の当該周波数の係数が、「トーン信号を有する周波数スペクトル」となる。例えば、全ての周波数スペクトル電力の平均より大きい電力を持つ周波数スペクトルが「トーン信号を有する周波数スペクトル」に該当する。
予備規定部3は、変換部2から複数の帯域を有する周波数スペクトルを受け取り、後述する量子化部6による量子化における量子化誤差が許容誤差電力内になる様に、スケールファクタを必要に応じて事前に規定する(なお、以降に説明においては、必要に応じて事前規定されたスケールファクタを予備規定スケールファクタと称する)。予備規定部3は、例えば、特開2009−198612号公報に開示される方法でスケールファクタを事前に規定することが出来る。なお、予備規定部3の機能は、後述する規定部5と機能を統合させることが可能である為、オーディオ符号化装置1において予備規定部3は、必ずとも必要とはしない。
ここで、「量子化」とは、例えば、有効数字のうち小数点以下の数値を切り捨てる(例えば、「1.8」や「2.1」を「1」や「2」などの整数にする)処理である。なお、「量子化値」とは、例えば、周波数スペクトルを量子化することによって得られる値を示す。また、「量子化誤差」とは、例えば、周波数スペクトルを量子化することによって周波数スペクトル各々について発生する誤差である。具体的には、量子化前の周波数スペクトルと、逆量子化後のスペクトル(これを、「逆量子化スペクトル」とする)との差分が量子化誤差に該当する。なお、例えば、「逆量子化スペクトル」とは、量子化値から得られる周波数スペクトルである。
ここで、上述の周波数スペクトルと量子化値と逆量子化スペクトルの関係を説明する。量子化部6は、周波数スペクトルのダイナミックレンジを縮小させる為に、所定のスケールファクタを用いてスケーリングする。その後、量子化部6は、量子化を行うことで量子化値を得る。なお、オーディオ復号装置は、オーディオ符号化装置1から受け取った量子化値を、所定のスケールファクタを用いてリスケーリングすることで、逆量子化スペクトルを得ることが出来る。周波数スペクトルと量子化値とスケール値との関係は、次式で表現することが出来る。
(数2)
周波数スペクトル=量子化値×2^(スケールファクタ)
ここで、「2^(スケールファクタ)」は、「2の(スケールスケールファクタ)乗を示す。また、逆量子化スペクトルは、次式によって表現される。
(数3)
量子化後スペクトル=量子化値×2^(スケールファクタ)
更に、量子化値は、次式によって表現される。
(数4)
量子化値=int(量子化前の周波数スペクトル×2^(−(スケールファクタ)))
「スケールファクタ」とは、例えば、帯域ごとに一つずつ与えられるものであり、量子化誤差電力が許容誤差電力未満になるような値が用いられる。なお、帯域とは、例えば、周波数を所定の幅で分割した領域のそれぞれを示す。なお、各帯域に含まれる周波数スペクトル電力各々の和が、周波数スペクトルの「帯域電力」となる。また、周波数スペクトルの「量子化誤差電力」とは、例えば、量子化誤差の二乗の値を示す。更に、「ある帯域についての量子化誤差電力」とは、例えば、当該帯域に含まれる周波数スペクトル各々を量子化する際に発生する量子化誤差から算出される量子化誤差電力各々の和を示す。具体的には、ある帯域の量子化誤差電力と量子化誤差との関係は、次式によって表現される。
(数5)
ある帯域の量子化誤差電力=Σ{(当該帯域に含まれる周波数スペクトル各々の量子化誤差)^2}
ここで、「^2」は、「2乗」を示す。
「許容誤差電力」とは、例えば、量子化する際に許容できる最大の量子化誤差電力であり、オーディオ信号について算出される聴覚的に聞こえるか否かを示す閾値であるマスキング閾値が変換されて、オーディオ信号の周波数を所定の幅で分割した帯域それぞれについて算出される。なお、マスキング閾値から許容誤差電力を算出する手法については、例えば、ISO/IEC13818−7に記載された手法を用いることが出来る。
換言すると、許容誤差電力は、許容できる量子化誤差電力の限界値となる。例えば、ある帯域の許容誤差電力とは、ある帯域について算出される量子化誤差電力であって、当該帯域の周波数スペクトルを量子化する際に発生する誤差として許容できる最大の値を示す。即ち、量子化部6は、ある帯域における量子化前の周波数スペクトルの電力と、逆量子化スペクトルの電力との差が、許容誤差電力未満となるように、周波数スペクトルを量子化する。
許容誤差電力は、マスキング閾値から変換されて帯域ごとに算出され、帯域ごとの周波数スペクトルの電力と比較して、どの帯域の周波数スペクトルを量子化するかを決定する際にも用いられる。なお、量子化する周波数スペクトルを決定する際に、許容誤差電力と比較するのは、比較対象となる帯域電力となる。
ここで、スケール値と、量子化誤差電力と、許容誤差電力との関係について説明する。量子化部6は、帯域電力が、許容誤差電力よりも大きい場合に、量子化する対象の帯域とする。また、量子化部6は、量子化誤差電力が許容誤差電力未満になるスケールファクタを用いて、周波数スペクトルを量子化する。量子化部6は、後述する規定部5が規定したスケールファクタを用いて周波数スペクトルを量子化する。なお、量子化部6は、例えば、ISO/IEC13818−7に開示される次式を用いて量子化(quant)することが出来る。
(数6)
quant=INT{abs(X)×2^(−1/4×scf)+MAGIC_NUMBER}
ここで、Xは周波数スペクトル、scfはスケールファクタ、MAGIC_NUMBERは任意の固定値(例えば、0.4054)を示す。また、従来技術におけるトーン信号を考慮して調整した、予備規定スケールファクタscf’は次式の通り、表現することが出来る。
(数7)
scf’= log2( max-pow-spec / MAX QUANT)
ここで、max-pow-specは、帯域中の最大スペクトル、MAX QUANTは、量子化値となる。
算出部4は、複数の帯域を有する周波数スペクトルを変換部2から受け取り、当該周波数スペクトルから周波数スペクトル特性の1つであるトーン信号対雑音比(SNR)を算出する。算出部4は、例えば、特開2009−198612号公報に開示される方法でトーン信号帯域を算出することが出来る。また、算出部4は、例えば、複数の帯域に含まれる、全ての周波数スペクトル電力の平均より大きい電力を持つ周波数スペクトルが含まれる帯域を、トーン信号帯域として算出し、それ以外の帯域を雑音帯域として算出することが出来る。なお、雑音帯域は、背景雑音帯域と称しても良い。なお、実施例1においては、周波数スペクトル特性の例としてトーン信号対雑音比を用いて説明するが、トーン信号対雑音比以外に、例えば高域と低域の電力の比で規定される分解能を周波数スペクトル特性として用いることも可能である。
図2(a)は、周波数スペクトルの電力と周波数帯域の関係図である。図2(b)は、トーン信号帯域判定のデータ構造の一例を示すテーブルである。図2(a)に示される通り、変換部3から受け取る周波数スペクトルは、複数の帯域に分割されており、トーン信号を含む帯域と雑音を含む帯域が混在している。図2(b)のテーブル20に示される通り、算出部4は、例えば、上述の通り、全ての周波数スペクトル電力の平均より大きい電力を持つ周波数スペクトルが含まれる帯域を、トーン信号帯域として算出し、帯域毎にトーン信号判定の項目に算出結果を格納する。なお、算出部4はトーン信号帯域を算出した帯域(f)については「Yes」を格納し、それ以外の帯域(f)、換言すると雑音帯域については、「No」を格納する。
図2(a)において、トーン信号帯域の電力(Ps)、雑音帯域の電力(Pn)とすると、算出部4は、トーン信号対雑音比(SNR)を、次式を用いて算出することが出来る。
(数8)
SNR=Ps/Pn
なお、図2(a)、(b)におけるトーン信号帯域の電力(Ps)、雑音帯域の電力(Pn)は、例えば次式の通り算出することが出来る。
(数9)



なお、算出部4は、トーン信号対雑音比として、上述の(数8)以外にも、例えば、トーン信号と雑音の総和を雑音で規格化した値など、様々な値をトーン信号対雑音比として算出しても良い。
図1の規定部5は、予備規定部3から必要に応じて予備規定スケールファクタを受け取り、算出部4からトーン信号対雑音比を受け取る。規定部5は、トーン信号対雑音比に基づいて予備規定スケールファクタを補正することでスケールファクタを規定する。図3(a)は、トーン信号対雑音比とスケールファクタの規定係数の関係図を示す。図3(a)において、実施例1のスケールファクタの規定係数(h)はトーン信号対雑音比(SNR)が10未満の場合は0であり、110以上の場合は1となる。また、トーン信号対雑音比(SNR)が10以上110未満の場合は、規定係数(h)は、次式で表現することが出来る。
(数10)
h=SNR/100−0.1
また、比較例における規定係数(h)は、トーン信号対雑音比(SNR)に係らず1となる。なお、図3(a)における数値や、上述の(数10)における各係数は任意の係数で定めることも可能である。なお、スケールファクタの規定係数(h)を、第1規定量と称しても良い。また、規定部5は算出部4がトーン信号帯域を検出しない場合は、必ずしも予備規定スケールファクタを補正することでスケールファクタを規定する必要はなく、予備規定スケールファクタを規定後のスケールファクタとして用いれば良い。なお、予備規定部3は、必ずしもオーディオ符号化装置1に備える必要はない。例えば、規定部5がトーン信号対雑音比を算出した後に、規定部5が当該トーン信号対雑音と上述の(数7)に基づいたスケールファクタを規定しても良い。
図3(b)は、トーン信号対雑音比と規定係数を含むデータ構造の一例を示すテーブルである。図3(b)のテーブル30に示される通り、規定係数(h)は、例えば、オーディオ信号のフレーム毎に格納される。規定部5は、規定係数(h)を用いて予備規定部3から受け取った予備規定スケールファクタを補正することでスケールファクタを規定する。具体的には、規定部5は、すべての複数の帯域のスケールファクタについて、同一の規定係数を用いて、例えば、次式の通り、予備規定スケールファクタを補正し、規定後のスケールファクタ(scf’’)を算出する。
(数11)
scf’’ = (scf’-scf)×h +scf
なお、すべての複数の帯域のスケールファクタについて、同一の規定係数を乗算することで以下の技術的効果が創出される。例えば、AAC(advanced audio coding)による符号化においては、隣接する周波数帯域間のスケールファクタの差分情報を符号化している。ここで、スケールファクタ用の符号帳は、スケールファクタの差分が小さいほど、短い符号が割り当てられている。この為、周波数帯域間のスケールファクタの差分が小さい程、後述する符号化部7による符号化ビット数を削減することが可能となる。よって、同一の規定係数を乗算する周波数帯域間のスケールファクタを一定に保つことで、符号化ビット数を削減することが可能となる。
量子化部6は、変換部2から複数の帯域を有する周波数スペクトルと、規定部5からスケールファクタを受け取り、複数の帯域を有する周波数スペクトルを量子化する。具体的には、量子化部6は、複数の帯域にそれぞれ含まれる周波数スペクトルのダイナミックレンジを、規定後のスケールファクタによって一意的に特定されるダイナミックレンジに縮小する。量子化部6は、当該縮小したダイナミックレンジにおける帯域各々を構成する周波数スペクトルそれぞれを量子化する。
量子化部6は、規定部5から受け取るスケールファクタに基づいて帯域毎にダイナミックレンジを変更するが、量子化を実行する際には、帯域単位に行うのではなく、当該帯域各々を構成する周波数スペクトル単位ごとに量子化を行っても良い。換言すると、量子化部6は、周波数スペクトル一つ一つに対して、量子化を実施することで量子化値を得ても良い。なお、量子化部6は、例えば、算出部4がトーン信号帯域を検出しない場合は、予備規定スケールファクタを用いて量子化を行えば良い。なお、オーディオ符号化装置1が予備規定部3を備えない場合は、規定部5が、予備規定スケールファクタと同等の値をスケールファクタとして規定すれば良い。
符号化部7は、量子化値と、規定後のスケールファクタを量子化部6から受け取り、例えばハフマン符号化を用いて、量子化値と、規定後のスケールファクタを符号化する。符号化部7は、符号化した符号化データを外部に出力する。
図4(a)は、オーディオ信号に雑音帯域が含まれない場合の量子化ビット数と周波数の関係図である。図4(b)は、オーディオ信号に雑音帯域が含まれる場合の量子化ビット数と周波数の関係図である。図4(a)に示される通り、オーディオ信号に雑音帯域が含まれない場合は、図3の関係図からSNR=1となる為、スケールファクタは規定前後で変化しない為、量子化ビット数も変化しない。
一方、図4(b)に示される通り、オーディオ信号に雑音帯域が含まれる場合において、比較例となる予備規定スケールファクタを用いた場合は、トーン信号帯域に加えて、雑音帯域においても量子化ビット量が大きく増加することになる。トーン信号帯域と雑音帯域を合わせた全帯域における量子化ビットの割当総量は、ビットレートで一意的に規定される為、全帯域の量子化ビットを増加して量子化ビットの割当総量を超えた場合、量子化ビットの欠落が発生する。一方、図3の関係図ならびに上述の(数8)、(数10)などから、スケールファクタをトーン信号対雑音比に基づいて規定した場合は、量子化ビット数の使用量が適切に抑制させることが可能となる為、量子化ビットの欠落を抑制することが可能となる。
図5(a)は、トーン信号を含むオーディオ信号の原音のスペクトル図である。図5(b)は、比較例の符号化を適用した復号後のオーディオ信号のスペクトル図である。なお、図5(b)の比較例においては、予備規定スケールファクタを用いている。図5(c)は、実施例1の符号化を適用した復号後のオーディオ信号のスペクトル図である。図5(a)ないし図5(c)のスペクトル図の縦軸は周波数を示し、横軸はサンプリング時間を示している。図5(b)においては、図5(a)のスペクトルと比較して音質の劣化が確認された。特に、図5(b)の高域の帯域においては、量子化ビットの欠落が、時間単位毎に不定期に発生しており、顕著な音質劣化が発生していることが確認された。図5(c)においては、図5(a)のスペクトルとほぼ同等の音質を保っていることが確認された。よって、実施例1に開示のオーディオ符号化装置においては、トーン信号に雑音が重畳した場合においても、量子化ビット欠落による音質劣化を抑制することが可能となる。
図6は、オーディオ符号化処理の動作フローチャートである。なお、図6に示されたフローチャートは、1フレーム分のオーディオ信号に対する処理を表す。オーディオ符号化装置1は、オーディオ信号を受信し続けている間、フレームごとにすべての周波数帯域について図6に示されたオーディオ符号化処理の手順を繰り返し実行する。
変換部2は、外部から入力された入力信号となるオーディオ信号を、複数の帯域を有する周波数スペクトルに変換する(ステップS601)。具体的には、変換部2は、入力されたオーディオ信号に、MDCT変換によって時間−周波数変換を行い、複数の帯域を有する周波数スペクトルに変換する。変換部2は、複数の帯域を有する周波数スペクトルを予備規定部3、算出部4、量子化部6へ出力する。
予備規定部3は、変換部2から複数の帯域を有する周波数スペクトルを受け取り、後述する量子化部6による量子化における量子化誤差が許容誤差電力内になる様に、スケールファクタを規定する(ステップS602)。予備規定部3は、規定したスケールファクタを規定部5へ出力する。なお、上述の通り、予備規定部3の機能は規定部5と統合させることが可能である為、規定部5に予備規定部3の機能を保持させる場合は、ステップS602の処理は省略出来る。
算出部4は、複数の帯域を有する周波数スペクトルを変換部2から受け取り、当該周波数スペクトルからトーン信号帯域を検出する(ステップS603)。なお、算出部4は、例えば、全ての周波数スペクトル電力の平均より大きい電力を持つ周波数スペクトルが含まれる帯域を、トーン信号帯域として検出することが出来る。
算出部4は、トーン信号帯域を検出した場合(ステップS604−Yes)、トーン信号対雑音比を算出する(ステップS605)。算出部4は、例えば、複数の帯域に含まれる、全ての周波数スペクトル電力の平均より大きい電力を持つ周波数スペクトルが含まれる帯域を、トーン信号帯域として算出し、それ以外の帯域を雑音帯域として算出した上で、上述の(数8)を用いてトーン信号対雑音比を算出することが出来る。算出部4は、算出したトーン信号対雑音比を規定部5へ出力する。また、算出部4は、トーン信号帯域を検出しなかった場合(ステップS604−No)、トーン信号帯域を検出しなかった旨を規定部5へ通知する。
規定部5は、予備規定部3から必要に応じて予備規定スケールファクタを受け取り、算出部4からトーン信号対雑音比を受け取る。規定部5は、トーン信号対雑音比と、図3の関係図、ならびに上述の(数10)等に基づいてスケールファクタを規定する(ステップS606)。規定部5は、規定したスケールファクタを量子化部6へ出力する。また、規定部5は、算出部4からトーン信号帯域を検出しなかった旨を通知されている場合は、スケールファクタを必ずしも予備規定スケールファクタから規定する必要はなく、予備規定スケールファクタを規定後のスケールファクタとして用いれば良い。規定部5は、規定したスケールファクタを量子化部6へ出力する。
量子化部6は、変換部2から複数の帯域を有する周波数スペクトルと、規定部5から規定後のスケールファクタを受け取り、複数の帯域を有する周波数スペクトルを量子化する(ステップS607)。具体的には、量子化部6は、複数の帯域にそれぞれ含まれる周波数スペクトルのダイナミックレンジを、スケールファクタによって一意的に特定されるダイナミックレンジに縮小する。量子化部6は、当該縮小したダイナミックレンジにおける帯域各々を構成する周波数スペクトルそれぞれを量子化する。量子化部6は、量子化した量子化値と、規定後のスケールファクタを符号化部7へ出力する。
符号化部7は、量子化値と、規定後のスケールファクタを量子化部6から受け取り、例えばハフマン符号化を用いて、量子化値と、規定後のスケールファクタを符号化する(ステップS608)。符号化部7が、符号化した符号化データを外部に出力することで、オーディオ符号化装置1は、図6に示す符号化処理を終了する。
(実施例2)
実施例1においては、規定部5は、すべての複数の帯域のスケールファクタについて、同一の規定係数を用いてスケールファクタを規定するが、帯域毎でスケールファクタの規定量を適切に変化させることで、量子化ビット数を削減させ量子化ビット欠落による音質劣化を、更に抑制することが可能となる。具体的には、実施例2においては、規定部5は、トーン信号帯域のみのスケールファクタを規定する。
例えば、トーン信号帯域をKs、雑音信号帯域の数をKnとした場合、スケールファクタを規定する帯域は、実施例1の場合にはKs+Knに、実施例2の場合にはKsとなる。ここで、実施例1においてスケールファクタの規定により減少する使用量子化ビット量は1−h(hは規定係数)に比例することになる。よって、実施例2の規定係数h’は、実施例1の規定係数hを用いて次式で表現することが出来る。なお、規定係数h’を、第2規定量と称しても良い。
(数12)
実施例2におけるオーディオ符号化装置においても、トーン信号に雑音が重畳した場合においても、量子化ビット欠落による音質劣化を抑制することが可能となる。
(実施例3)
図7は、一つの実施形態によるオーディオ符号化復号システム70の機能ブロックを示す図である。図7に示す様に、オーディオ符号化復号システム70は、変換部2、予備規定部3、算出部4、規定部5、量子化部6、符号化部7、復号部8、逆量子化部9、逆変換部10を含んでいる。
オーディオ符号化復号システム70が有するこれらの各部は、例えば、それぞれ別個の回路としてワイヤードロジックによるハードウェア回路によって形成される。あるいはオーディオ符号化復号システム70が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路としてオーディオ符号化復号システム70に実装されてもよい。さらに、オーディオ符号化復号システム70が有するこれらの各部は、オーディオ符号化装置70が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
復号部8は、外部(例えばオーディオ符号化装置1)から符号化データを受け取り、当該符号化データから、少なくとも量子化値と、スケールファクタを復号する。
逆量子化部9は、復号部8から受け取る量子化値を、復号部8から受けとるスケールファクタを用いてリスケーリングすることで、逆量子化スペクトル(周波数スペクトル)を得ることが出来る。
逆変換部10は、逆量子化部9から周波数スペクトルを受け取り、例えば逆MDCT変換により、周波数−時間変換を行いうことで、オーディオ信号を生成する。
図7に示す予備規定部3、算出部4、規定部5、量子化部6、ならびに符号化部7は、図1に示す各機能と同様となる為、詳細な説明は省略する。
実施例3におけるオーディオ符号化復号システムにおいても、トーン信号に雑音が重畳した場合においても、量子化ビット欠落による音質劣化を抑制することが可能となる。
図8は、一つの実施形態によるオーディオ符号化装置1のハードウェア構成図である。図8に示すように、オーディオ符号化装置1は、制御部11、主記憶部12、補助記憶部13、ドライブ装置14、ネットワークI/F部17、入力部18、表示部19を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
制御部11は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部11は、主記憶部12や補助記憶部13に記憶されたプログラムを実行する演算装置であり、入力部18や記憶装置からデータを受け取り、演算、加工した上で、表示部19や記憶装置などに出力する。
主記憶部12は、ROMやRAMなどであり、制御部11が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶または一時保存する記憶装置である。
補助記憶部13は、HDDなどであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
ドライブ装置14は、記録媒体15、例えばフレキシブルディスクからプログラムを読み出し、補助記憶部13にインストールする。
また、記録媒体15に、所定のプログラムを格納し、この記録媒体15に格納されたプログラムはドライブ装置14を介してオーディオ符号化装置1にインストールされる。インストールされた所定のプログラムは、オーディオ符号化装置1により実行可能となる。
ネットワークI/F部17は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器とオーディオ符号化装置1とのインターフェースである。
入力部18は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部19の表示画面上でキーの選択等を行うためのマウスやスライスパット等を有する。また、入力部18は、ユーザが制御部11に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
表示部19は、CRT(Cathode Ray Tube)やLCD(LiquidCrystal Display)等により構成され、制御部11から入力される表示データに応じた表示が行われる。
なお、上述したオーディオ符号化方法は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、上述したオーディオ符号化方法を実現することができる。
また、このプログラムを記録媒体15に記録し、このプログラムが記録された記録媒体15をコンピュータや携帯端末に読み取らせて、前述した画像処理を実現させることも可能である。なお、記録媒体15は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
なお、上述のオーディオ符号化装置1のハードウェア構成図は、図8に示したオオーディオ符号化復号システム70のハードウェア構成図と同等の構成を用いても良い。
上記の各実施形態におけるオーディオ符号化装置が有する各部の機能をコンピュータに実現させるコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体などの記録媒体に記憶された形で提供されてもよい。また、符号化の対象となるオーディオ信号は、2chのオーディオ信号に限らない。例えば、符号化の対象となるオーディオ信号は、3ch、3.1ch、5.1chまたは7.1chなど、複数のチャネルを持つオーディオ信号であってもよい。
また、上述の実施例において、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
ここに挙げられた全ての例及び特定の用語は、当業者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
以上説明した実施形態及びその変形例に関し、更に以下の付記を開示する。
(付記1)
入力信号の周波数スペクトル特性を算出する算出部と、
前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定する規定部と、
前記スケールファクタに基づいて、前記周波数スペクトルを量子化する量子化部と、
を備えることを特徴とするオーディオ符号化装置。
(付記2)
前記算出部は、少なくとも1つの帯域にトーン信号が含まれる複数の帯域を有する前記周波数スペクトルの前記トーン信号に基づくトーン信号対雑音比を、前記周波数スペクトル特性として算出することを特徴とする付記1記載のオーディオ符号化装置。
(付記3)
前記算出部は、前記周波数スペクトルに含まれるトーン信号帯域を検出し、前記トーン信号帯域以外の前記周波数スペクトルの帯域を雑音帯域として、前記トーン信号帯域における電力と前記雑音帯域における電力の比率を前記トーン信号対雑音比として算出することを特徴とする付記2記載のオーディオ符号化装置。
(付記4)
前記規定部は、前記周波数スペクトルの前記トーン信号帯域と前記雑音帯域の前記スケールファクタを、前記トーン信号対雑音比の大きさに基づく第1規定量を用いて規定することを特徴とする付記2または付記3記載のオーディオ符号化装置。
(付記5)
前記規定部は、前記トーン信号帯域のみの前記スケールファクタを、前記トーン信号対雑音比、前記トーン信号帯域、ならびに前記雑音帯域に基づく第2規定量を用いて規定することを特徴とする付記2または付記3記載のオーディオ符号化装置。
(付記6)
前記規定部は、前記算出部が前記トーン信号帯域を検出しない場合は、前記スケールファクタを前記第1規定量または前記第2規定量を用いて規定しないことを特徴とする付記4または付記5記載のオーディオ符号化装置。
(付記7)
入力信号の周波数スペクトル特性を算出し、
前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定し、
前記スケールファクタに基づいて、前記周波数スペクトルを量子化する
ことを含むことを特徴とするオーディオ符号化方法。
(付記8)
前記算出することは、少なくとも1つの帯域にトーン信号が含まれる複数の帯域を有する前記周波数スペクトルの前記トーン信号に基づくトーン信号対雑音比を、前記周波数スペクトル特性として算出することを特徴とする付記7記載のオーディオ符号化方法。
(付記9)
前記算出することは、前記周波数スペクトルに含まれるトーン信号帯域を検出し、前記トーン信号帯域以外の前記周波数スペクトルの帯域を雑音帯域として、前記トーン信号帯域における電力と前記雑音帯域における電力の比率を前記トーン信号対雑音比として算出することを特徴とする付記8記載のオーディオ符号化方法。
(付記10)
前記規定することは、前記周波数スペクトルの前記トーン信号帯域と前記雑音帯域の前記スケールファクタを、前記トーン信号対雑音比の大きさに基づく第1規定量を用いて規定することを特徴とする付記8または付記9記載のオーディオ符号化方法。
(付記11)
前記規定することは、前記トーン信号帯域のみの前記スケールファクタを、前記トーン信号対雑音比、前記トーン信号帯域、ならびに前記雑音帯域に基づく第2規定量を用いて規定することを特徴とする付記8または付記9記載のオーディオ符号化方法。
(付記12)
前記補正することは、前記算出することが前記トーン信号帯域を検出しない場合は、前記スケールファクタを前記第1規定量または前記第2規定量を用いて規定しないことを特徴とする付記10または付記11記載のオーディオ符号化方法。
(付記13)
コンピュータに、
入力信号の周波数スペクトル特性を算出し、
前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定し、
前記スケールファクタに基づいて、前記周波数スペクトルを量子化する
ことを実行させることを特徴とするオーディオ符号化用コンピュータプログラム。
(付記14)
入力信号の周波数スペクトル特性を算出する算出部と、
前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定する規定部と、
前記スケールファクタに基づいて、前記周波数スペクトルを量子化する量子化部と、
前記量子化された前記周波数スペクトルを、前記スケールファクタに基づいて逆量子化する逆量子化部と、
を備えることを特徴とするオーディオ符号化複合システム。
1 オーディオ符号化装置
2 変換部
3 予備規定部
4 算出部
5 規定部
6 量子化部
7 符号化部

Claims (7)

  1. 入力信号の周波数スペクトル特性を算出する算出部と、
    前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定する規定部と、
    前記スケールファクタに基づいて、前記周波数スペクトルを量子化する量子化部
    を備えることを特徴とするオーディオ符号化装置。
  2. 前記算出部は、少なくとも1つの帯域にトーン信号が含まれる複数の帯域を有する前記周波数スペクトルの前記トーン信号に基づくトーン信号対雑音比を、前記周波数スペクトル特性として算出することを特徴とする請求項1記載のオーディオ符号化装置。
  3. 前記算出部は、前記周波数スペクトルに含まれるトーン信号帯域を検出し、前記トーン信号帯域以外の前記周波数スペクトルの帯域を雑音帯域として、前記トーン信号帯域における電力と前記雑音帯域における電力の比率を前記トーン信号対雑音比として算出することを特徴とする請求項2記載のオーディオ符号化装置。
  4. 前記規定部は、前記周波数スペクトルの前記トーン信号帯域と前記雑音帯域の前記スケールファクタを、前記トーン信号対雑音比の大きさに基づく第1規定量を用いて規定することを特徴とする請求項2または請求項3記載のオーディオ符号化装置。
  5. 前記規定部は、前記トーン信号帯域のみの前記スケールファクタを、前記トーン信号対雑音比、前記トーン信号帯域、ならびに前記雑音帯域に基づく第2規定量を用いて規定することを特徴とする請求項2または請求項3記載のオーディオ符号化装置。
  6. 入力信号の周波数スペクトル特性を算出し、
    前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定し、
    前記スケールファクタに基づいて、前記周波数スペクトルを量子化する
    ことを含むことを特徴とするオーディオ符号化方法。
  7. コンピュータに、
    入力信号の周波数スペクトル特性を算出し、
    前記入力信号から変換される周波数スペクトルの量子化に用いるスケールファクタを、前記周波数スペクトル特性に基づいて前記複数の帯域毎に規定し、
    前記スケールファクタに基づいて、前記周波数スペクトルを量子化する
    ことを実行させることを特徴とするオーディオ符号化用コンピュータプログラム。
JP2012234870A 2012-10-24 2012-10-24 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム Expired - Fee Related JP6179087B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012234870A JP6179087B2 (ja) 2012-10-24 2012-10-24 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム
US14/046,404 US20140114652A1 (en) 2012-10-24 2013-10-04 Audio coding device, audio coding method, and audio coding and decoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012234870A JP6179087B2 (ja) 2012-10-24 2012-10-24 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2014085542A true JP2014085542A (ja) 2014-05-12
JP6179087B2 JP6179087B2 (ja) 2017-08-16

Family

ID=50486129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012234870A Expired - Fee Related JP6179087B2 (ja) 2012-10-24 2012-10-24 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム

Country Status (2)

Country Link
US (1) US20140114652A1 (ja)
JP (1) JP6179087B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
US9810427B2 (en) * 2015-03-26 2017-11-07 Ansaldo Energia Switzerland AG Fuel nozzle with hemispherical dome air inlet
CN109215670B (zh) * 2018-09-21 2021-01-29 西安蜂语信息科技有限公司 音频数据的传输方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04304031A (ja) * 1991-03-30 1992-10-27 Sony Corp ディジタル信号符号化方法
JPH10161694A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 帯域分割型雑音低減方法
JPH10207489A (ja) * 1997-01-22 1998-08-07 Sharp Corp デジタルデータの符号化方法
JP2009198612A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 符号化装置、符号化方法および符号化プログラム
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
US7283567B2 (en) * 2001-06-22 2007-10-16 Airbiquity Inc. Network delay identification method and apparatus
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
US20050129139A1 (en) * 2003-12-03 2005-06-16 Jones Aled W. Tag tracking
US6809669B1 (en) * 2004-01-13 2004-10-26 Northrop Grumman Corporation Selective noise generator
JP2006018023A (ja) * 2004-07-01 2006-01-19 Fujitsu Ltd オーディオ信号符号化装置、および符号化プログラム
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
KR20080047443A (ko) * 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
JP5061111B2 (ja) * 2006-09-15 2012-10-31 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
JP5065687B2 (ja) * 2007-01-09 2012-11-07 株式会社東芝 オーディオデータ処理装置及び端末装置
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5381982B2 (ja) * 2008-05-28 2014-01-08 日本電気株式会社 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
CN102044241B (zh) * 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04304031A (ja) * 1991-03-30 1992-10-27 Sony Corp ディジタル信号符号化方法
JPH10161694A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 帯域分割型雑音低減方法
JPH10207489A (ja) * 1997-01-22 1998-08-07 Sharp Corp デジタルデータの符号化方法
JP2009198612A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 符号化装置、符号化方法および符号化プログラム
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal

Also Published As

Publication number Publication date
US20140114652A1 (en) 2014-04-24
JP6179087B2 (ja) 2017-08-16

Similar Documents

Publication Publication Date Title
JP6726785B2 (ja) ビット割り当て装置
US10121480B2 (en) Method and apparatus for encoding audio data
TWI616869B (zh) 音訊解碼方法、裝置及電腦可讀取記錄媒體
JP6717746B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
RU2718421C1 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
EP2863388B1 (en) Bit allocation method and device for audio signal
JP2005338637A (ja) オーディオ信号符号化装置及び方法
KR102653849B1 (ko) 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
JP2002196792A (ja) 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US9646615B2 (en) Audio signal encoding employing interchannel and temporal redundancy reduction
JP5262171B2 (ja) 符号化装置、符号化方法および符号化プログラム
US8401863B1 (en) Audio encoding and decoding with conditional quantizers
JP2013502619A (ja) 周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定
RU2662693C2 (ru) Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
JP6179087B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム
JP2004163696A (ja) 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
US10896684B2 (en) Audio encoding apparatus and audio encoding method
JP2019070823A (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
WO2024196888A1 (en) Frame segmentation and grouping for audio encoding
JP2009103974A (ja) マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150706

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170703

R150 Certificate of patent or registration of utility model

Ref document number: 6179087

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees