JP2009236994A - オーディオ信号の信号圧縮回路 - Google Patents

オーディオ信号の信号圧縮回路 Download PDF

Info

Publication number
JP2009236994A
JP2009236994A JP2008079656A JP2008079656A JP2009236994A JP 2009236994 A JP2009236994 A JP 2009236994A JP 2008079656 A JP2008079656 A JP 2008079656A JP 2008079656 A JP2008079656 A JP 2008079656A JP 2009236994 A JP2009236994 A JP 2009236994A
Authority
JP
Japan
Prior art keywords
compression
audio signal
signal
unit
compression circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008079656A
Other languages
English (en)
Inventor
Kazuhiko Kondo
和彦 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
System Solutions Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Sanyo Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd, Sanyo Semiconductor Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2008079656A priority Critical patent/JP2009236994A/ja
Publication of JP2009236994A publication Critical patent/JP2009236994A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】オーディオ信号の音質を低下させることなく、信号圧縮回路を小型化・省電力化する。
【解決手段】入力されたオーディオ信号を圧縮する第1圧縮部20と、第1圧縮部20によって圧縮されたオーディオ信号を記憶及び保持するバッファメモリ22と、バッファメモリ22からオーディオ信号を読み出して伸張する伸張部24と、伸張部24で伸張されたオーディオ信号を受けて、オーディオ信号の将来の複雑さを推定する推定部26と、伸張部24で伸張されたオーディオ信号と、推定部26での推定結果と、に応じてオーディオ信号を圧縮する第2圧縮部28と、を備える。
【選択図】図1

Description

本発明は、オーディオ信号の信号圧縮回路に関する。
近年、デジタルオーディオ信号を圧縮する技術が用いられている。例えば、WMA(Windows Media Audio)(登録商標)やMP3(MPEG Audio Layer-3)等のように、過去のオーディオ信号を用いて将来のオーディオ信号の変動を予測し、その複雑性に基づいて圧縮のビット量を調整する方法も知られている。
図3に、従来のオーディオ信号の信号圧縮回路100の構成例を示す。信号圧縮回路100は、図3に示すように、バッファメモリ10、推定部12及び圧縮部14を備える。
信号圧縮回路100に入力されるデジタルオーディオ信号は一般的にPCM等の圧縮されていない信号である。バッファメモリ10は、外部から入力されるデジタルオーディオ信号を一時的に保持する。推定部12は、バッファメモリ10に保持されているオーディオ信号を読み出し、複数のフレーム分のオーディオ信号に基づいてオーディオ信号の将来の複雑性を予測する。圧縮部14は、バッファメモリ10に保持されているオーディオ信号及び推定部12おいて得られた複雑性の推定結果を受けて、複雑性の推定結果に応じたビット量でオーディオ信号を圧縮する。例えば、オーディオ信号が将来的により複雑になると推定された場合には現在のフレームのビット量を抑え、オーディオ信号が将来的により単純になると推定された場合には現在のフレームのビット量を増加させる(特許文献1等)。
従って、バッファメモリ10は推定部12における推定処理に必要なフレーム分のオーディオ信号を保持できる記憶容量を備える必要がある。例えば、WMAの場合、バッファメモリ10の記憶容量が32フレーム分とすると、一般的な16ビットで2048サンプル/チャネルのオーディオ信号においては128kバイト/チャネルの記憶容量が必要となる。
米国特許第7,277,848号明細書
ところで、オーディオ機器の小型化・省電力化等に伴って、信号圧縮回路のバッファメモリとして必要な記憶容量を少なくすることが望まれている。一方で、再生時の音質を高品質に保つために、推定部で参照されるフレーム数を減少させたくないという要求もある。
圧縮されたオーディオ信号を生成する方法として、主に次の2種類の方法がある。1つはパーソナルコンピュータと信号圧縮のソフトウェアを用いる方法で、もう1つは携帯用のオーディオ機器を用いる方法である。1つ目の方法を用いる場合、パーソナルコンピュータには大容量のメモリが備えられているため、複雑性の推定に必要なフレーム数のオーディオデータを格納する記憶容量は問題にならない。しかし、2つ目の方法を用いる場合、複雑性の推定のために携帯用のオーディオ機器に大容量のメモリを備えることは好ましくない。これは、携帯用のオーディオ機器に大容量のメモリを備えることが機器の小型化、低コスト化の妨げとなるからである。
本発明は、このような要求を満たすオーディオ信号の信号圧縮回路を提供することを目的とする。
本発明の1つの態様は、オーディオ信号を圧縮出力する信号圧縮回路であって、入力されたオーディオ信号を圧縮する第1圧縮部と、前記第1圧縮部によって圧縮されたオーディオ信号を記憶及び保持するバッファメモリと、前記バッファメモリから前記オーディオ信号を読み出して伸張する伸張部と、前記伸張部で伸張されたオーディオ信号を受けて、オーディオ信号の将来の複雑さを推定する推定部と、前記伸張部で伸張されたオーディオ信号と、前記推定部での推定結果と、に応じてオーディオ信号を圧縮する第2圧縮部と、を備えることを特徴とする。
このように構成することによって、オーディオ信号を一旦保持するバッファメモリの記憶容量を小さくすることができ、例えば、オーディオ信号の音質を低下させることなく、信号圧縮回路を小型化・省電力化することができる。
ここで、前記第1圧縮部は、オーディオ信号を可逆的に圧縮することが好適である。また、前記第2圧縮部は、オーディオ信号を不可逆的に圧縮して高い圧縮率を得ることが好適である。これにより、オーディオ信号の劣化を伴うことなく、バッファメモリの記憶容量を小さくすることができる。
また、前記第1圧縮部及び前記第2圧縮部は、オーディオ信号を圧縮する方式を複数の圧縮方式から選択可能であり、前記第1圧縮部は、前記第2圧縮部において選択された圧縮方式に応じて圧縮方式を選択するものとしてもよい。これにより、第2圧縮部における圧縮形式に応じて、第1圧縮部において適切な圧縮方式を適用することができる。
また、より具体的な例としては、前記第1圧縮部は、MSステレオ方式によってオーディオ信号を圧縮することが好適である。MSステレオ方式は、簡素な圧縮方式であり、バッファメモリの前後における圧縮処理及び伸張処理を迅速に行うことができ、さらに回路を簡素に構成できる点で優れている。
本発明によれば、オーディオ信号の音質を低下させることなく、信号圧縮回路を小型化・省電力化することができる。
本発明の実施の形態におけるオーディオ信号の信号圧縮回路200は、図1に示すように、第1圧縮部20、バッファメモリ22、伸張部24、推定部26及び第2圧縮部28を含んで構成される。
第1圧縮部20は、信号圧縮回路200の外部から入力されるデジタルオーディオ信号を受けて、オーディオ信号を圧縮する処理を行う。また、最終的なオーディオ信号から再生される音質を高く維持するために、第1圧縮部20では可逆的圧縮方式(Lossless圧縮)又は準可逆的圧縮方式(Near Lossless圧縮)を適用することが好適である。
入力されるオーディオ信号は、例えば、PCM信号とされる。PCM(Pulse Code Modulation)は、音声などのアナログ信号をデジタル信号に変換する方式の一つである。アナログ信号を一定のサンプリング時間ごとに標本化(サンプリング)し、定められたビット数の整数値に量子化する。デジタル信号の品質は、1秒間に何回数値化するか(サンプリング周波数)と、データを何ビットの数値で表現するか(量子化ビット数)で決まる。PCMは、例えば、音楽CDにおける量子化に採用されており、サンプリング周波数44.1kHz、量子化16ビットを標準としている。
可逆的圧縮処理としては、例えば、入力信号がステレオのオーディオ信号である場合、左(L)信号と右(R)信号との差分を算出することによって圧縮を行うMSステレオ方式を採用することが好適である。MSステレオ方式では左(L)信号と右(R)信号とが完全に一致する場合にはオーディオ信号を最大1/2に圧縮することができる。
また、本実施の形態における可逆的圧縮処理に適している圧縮方式としては、例えば、MPEG4 ALSやWMA Lossless等も挙げられる。また、本実施の形態における準可逆的圧縮処理に適している圧縮方式としては、例えば、ADPCM等も挙げられる。
バッファメモリ22は、第1圧縮部20で圧縮されたオーディオ信号を格納及び保持する記憶手段である。バッファメモリ22はFIFO型であり、例えば、リングバッファとすることができる。
バッファメモリ22は、推定部26においてオーディオ信号の複雑性を推定する際に必要なフレーム数のオーディオ信号を保持できる記憶容量を少なくとも有する。このとき、第1圧縮部20においてオーディオ信号を圧縮しているので、従来の信号圧縮回路と同じフレーム数のオーディオ信号を格納するために必要な記憶容量は従来よりも小さくできる。
例えば、WMAの場合、従来のバッファメモリ10の記憶容量が32フレーム分とすると、一般的な16ビットで2048サンプル/チャネルのオーディオ信号において従来は128kバイト/チャネルの記憶容量が必要であった。したがって、2チャンネルのステレオ放送では、その左(L)信号と右(R)信号に関わらず256kバイトの記憶容量が必要であった。これに対して、本実施の形態では、バッファメモリ22に入力される前にオーディオ信号が圧縮されているので、バッファメモリ22の記憶容量は256kバイトよりも小さくすることができる。
伸張部24は、バッファメモリ22に保持されているオーディオ信号を格納された順に読み出し、第1圧縮部20での圧縮形式に対応した伸張方式でオーディオ信号を伸張する。伸張されたオーディオ信号は推定部26及び第2圧縮部28へ出力される。
推定部26は、伸張部24で伸張されたオーディオ信号を受けて、オーディオ信号の将来の複雑性を評価する。複雑性の評価には、特許文献1に記載された技術等を用いることができる。複雑性の評価値は第2圧縮部28へ出力される。
すなわち、推定部26は、伸張部24を介してバッファメモリ22に格納されている複数フレームのオーディオ信号を読み出し、伸張された複数フレームのオーディオ信号における信号の時間的な変化の推移から、将来のオーディオ信号の複雑性を予測する。
例えば、第2圧縮部2における圧縮方式がWMA方式である場合、推定部26に入力されるオーディオ信号として推奨されるフレーム数は32フレームであり、バッファメモリ22から32フレーム分のオーディオ信号を読み出し、それらのオーディオ信号の相関に基づいて信号の複雑性を予測する。
第2圧縮部28は、伸張部24で伸張されたオーディオ信号、及び、推定部26における複雑性の評価値を受けて、オーディオ信号を圧縮して出力する。このとき、複雑性の評価値に応じたビット量(量子化ビット数)でオーディオ信号を圧縮処理する。
このような可変ビットレートの圧縮方式としては、例えば、WMA VBR(Variable Bit Rate)が挙げられる。これは、オーディオ信号の複雑性に応じて、圧縮後のデータ量を40kbps以上355kbps以下の範囲で調整するものである。すなわち、オーディオ信号においてデータの変化が激しい箇所では高ビットレートで量子化することによって音質を維持したまま圧縮を行い、オーディオ信号においてデータの変化が単調で動きの少ない箇所では低ビットレートで量子化することによってデータ量を低減させる。これにより、圧縮されたオーディオ信号のファイル容量を無駄に大きくすることなく、オーディオ信号の再生時には高い音質を得ることが可能となる。
同様に、MP3やAACにおいてもVBRを適用することができる。MP3とは、人間の感じ取りにくい部分のデータを間引くことによって高い圧縮率を得る非可逆圧縮方式である。MP3を用いることによって、音楽CDと同程度の音質を保ったまま、データ量を約1/11(128kbps)に圧縮することができる。また、AACとは、映像圧縮規格MPEG−2又はMPEG−4で使われる音声圧縮方式である。
以上のように、本実施の形態における信号圧縮回路200では、バッファメモリ22にオーディオ信号を入力する前にオーディオ信号を圧縮し、バッファメモリ22から出力された信号を伸張することによってバッファメモリ22として確保しておかなければならないメモリの記憶容量を低減することができる。このような処理は、オーディオ信号の時間的な変化に応じて最終的な圧縮のビット量を調整するVBR方式の信号圧縮回路においても有効である。
<変形例1>
上記実施の形態では、第1圧縮部20において1種類の圧縮方式を適用したが、第1圧縮部20において複数種の圧縮方式から1種類の圧縮方式を選択して適用するものとしてもよい。
具体的には、図2に示すように、第1圧縮部20にレジスタ30を併設し、レジスタ30に設定された値に応じて第1圧縮部20において適用する圧縮方式を選択する構成としてもよい。この場合、伸張部24は、第1圧縮部20において選択された圧縮方式に応じた伸張方式を採用する。
例えば、レジスタ30に“0”が設定された場合にはMSステレオ方式、“1”が設定された場合にはMPEG4 ALS方式、“2”が設定された場合にはWMA Lossless方式、“3”が設定された場合にはADPCM方式を採用するようにすればよい。伸張部24では、第1圧縮部20において採用された圧縮方式に対応する伸張方式でオーディオ信号を伸張する。
なお、レジスタ30には、信号圧縮回路200の外部から値を設定できるようにすることが好適である。
このように、第1圧縮部20における圧縮方式を複数種の圧縮方式から選択できるようにすることによって、オーディオ信号のタイプやデータ量等に応じて、バッファメモリ22の記憶容量を効果的に利用できる圧縮方式を採用することが可能となる。
本発明の実施の形態における信号圧縮回路の構成を示す図である。 本発明の変形例1における信号圧縮回路の構成を示す図である。 従来の信号圧縮回路の構成を示す図である。
符号の説明
10 バッファメモリ、12 推定部、14 圧縮部、20 第1圧縮部、22 バッファメモリ、24 伸張部、26 推定部、28 第2圧縮部、30,32 レジスタ、100,200 信号圧縮回路。

Claims (5)

  1. オーディオ信号を圧縮出力する信号圧縮回路であって、
    入力されたオーディオ信号を圧縮する第1圧縮部と、
    前記第1圧縮部によって圧縮されたオーディオ信号を記憶及び保持するバッファメモリと、
    前記バッファメモリから前記オーディオ信号を読み出して伸張する伸張部と、
    前記伸張部で伸張されたオーディオ信号を受けて、オーディオ信号の将来の複雑さを推定する推定部と、
    前記伸張部で伸張されたオーディオ信号と、前記推定部での推定結果と、に応じてオーディオ信号を圧縮する第2圧縮部と、
    を備えることを特徴とする信号圧縮回路。
  2. 請求項1に記載の信号圧縮回路であって、
    前記第1圧縮部は、オーディオ信号を可逆的に圧縮することを特徴とする信号圧縮回路。
  3. 請求項1又は2に記載の信号圧縮回路であって、
    前記第2圧縮部は、オーディオ信号を不可逆的に圧縮することを特徴とする信号圧縮回路。
  4. 請求項1から3のいずれか1つに記載の信号圧縮回路であって、
    前記第1圧縮部及び前記第2圧縮部は、オーディオ信号を圧縮する方式を複数の圧縮方式から選択可能であり、
    前記第1圧縮部は、前記第2圧縮部において選択された圧縮方式に応じて圧縮方式を選択することを特徴とする信号圧縮回路。
  5. 請求項1から3のいずれか1つに記載の信号圧縮回路であって、
    前記第1圧縮部は、MSステレオ方式によってオーディオ信号を圧縮することを特徴とする信号圧縮回路。
JP2008079656A 2008-03-26 2008-03-26 オーディオ信号の信号圧縮回路 Pending JP2009236994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008079656A JP2009236994A (ja) 2008-03-26 2008-03-26 オーディオ信号の信号圧縮回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008079656A JP2009236994A (ja) 2008-03-26 2008-03-26 オーディオ信号の信号圧縮回路

Publications (1)

Publication Number Publication Date
JP2009236994A true JP2009236994A (ja) 2009-10-15

Family

ID=41251062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008079656A Pending JP2009236994A (ja) 2008-03-26 2008-03-26 オーディオ信号の信号圧縮回路

Country Status (1)

Country Link
JP (1) JP2009236994A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050177367A1 (en) * 2001-12-14 2005-08-11 Microsoft Corporation Quality and rate control strategy for digital audio
JP2006078882A (ja) * 2004-09-10 2006-03-23 Renesas Technology Corp 音声録音再生装置
JP2008028574A (ja) * 2006-07-19 2008-02-07 Matsushita Electric Ind Co Ltd オーディオ処理装置、オーディオ処理方法、プログラム、および集積回路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050177367A1 (en) * 2001-12-14 2005-08-11 Microsoft Corporation Quality and rate control strategy for digital audio
JP2006078882A (ja) * 2004-09-10 2006-03-23 Renesas Technology Corp 音声録音再生装置
JP2008028574A (ja) * 2006-07-19 2008-02-07 Matsushita Electric Ind Co Ltd オーディオ処理装置、オーディオ処理方法、プログラム、および集積回路

Similar Documents

Publication Publication Date Title
TWI474316B (zh) 使用具隨機存取點及多重預測參數集合能力的適應性分段技術之無損多聲道音訊編解碼器
JP5032314B2 (ja) オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
JP2008511852A (ja) トランスコードのための方法および装置
JPWO2005081229A1 (ja) オーディオエンコーダ及びオーディオデコーダ
BRPI0206395B1 (pt) Decoding device, coding device, communication system constituting a coding device and a coding device, decoding method, coding method, communication method for a system established by a coding device and a decoding device , and recording media
RU2607230C2 (ru) Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования
EP2580752B1 (en) Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
EP1386310A1 (en) Device to encode, decode and broadcast audio signal with reduced size spectral information
JP2006074635A (ja) 符号化映像信号変換方法及び装置
JP4639966B2 (ja) オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
JP2009236994A (ja) オーディオ信号の信号圧縮回路
JP3913664B2 (ja) 符号化装置、復号化装置およびこれらを用いたシステム
KR20000056661A (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
EP1615219A1 (en) Creating a DVD compliant stream directly from encoder hardware
JPH0962298A (ja) 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置
CN101740075B (zh) 音频信号播放装置、音频信号播放方法和程序
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
US20090157396A1 (en) Voice data signal recording and retrieving
CN108292506B (zh) 使用视频信息的音频编码
CN1764073B (zh) 音频解码中再量化方法
Auristin et al. New Ieee Standard For Advanced Audio Coding In Lossless Audio Compression: A Literature Review
KR100776432B1 (ko) 오디오 기록 재생 장치 및 그 장치에서 실행 가능한 압축률개선을 위한 오디오 코딩 방법
JP2006235322A (ja) 再生装置および再生方法
JP2005244303A (ja) データ遅延装置及び同期再生装置並びにデータ遅延方法
JP2011013620A (ja) 音声編集方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110317

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110607

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130305