JP4959935B2 - 復号装置 - Google Patents

復号装置 Download PDF

Info

Publication number
JP4959935B2
JP4959935B2 JP2004325536A JP2004325536A JP4959935B2 JP 4959935 B2 JP4959935 B2 JP 4959935B2 JP 2004325536 A JP2004325536 A JP 2004325536A JP 2004325536 A JP2004325536 A JP 2004325536A JP 4959935 B2 JP4959935 B2 JP 4959935B2
Authority
JP
Japan
Prior art keywords
decoding
data
amount
input
output buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004325536A
Other languages
English (en)
Other versions
JP2006133698A (ja
Inventor
広和 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004325536A priority Critical patent/JP4959935B2/ja
Publication of JP2006133698A publication Critical patent/JP2006133698A/ja
Application granted granted Critical
Publication of JP4959935B2 publication Critical patent/JP4959935B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、例えばAAC(Advanced Audio Coding)方式やMP3(MPEG Audio Layer-3)方式などのオーディオデータの復号に用いられる復号装置に関する。
周知のように、AACやMP3などのコアデコーダと組み合わせ可能な帯域拡張符号化方式の1つとしてSBR(Spectral Band Replication)がある(例えば、特許文献1参照)。このSBRは、復号処理負荷が比較的大きいことが知られている。
SBRのような帯域拡張符号化方式を採用した場合に、復号装置のプロセッサによっては処理能力を超えるフレームデータが入力されると、復号時に音途切れ等の現象が発生する可能性がある。
これに対して従来は、プロセッサに対する突発的な処理負荷による影響を緩和するために、復号データの出力段でバッファリング処理を行うことで音途切れを回避している。しかしながら、このような従来の手法では、処理負荷による影響をある程度緩和することは可能であるが、バッファリング処理した復号データのアンダーフローが発生し、音途切れが発生する可能性があるという問題があった。この問題は、バースト的に処理負荷の高いフレームを受信する際に、顕著な問題となっていた。
特開2004−053940公報
従来の復号装置では、SBRのような帯域拡張符号化方式を採用する場合に、バッファリング処理した復号データのアンダーフローが発生し、音途切れが発生して聴感上の違和感が生じるという問題があった。
この発明は上記の問題を解決すべくなされたもので、SBRのような帯域拡張符号化方式を採用する場合でも、音途切れによる聴感上の違和感を軽減することが可能な復号装置を提供することを目的とする。
上記の目的を達成するために、この発明は、符号化された音声データが入力される入力手段と、この入力手段を通じて入力された音声データを復号する復号手段と、この復号手段によって復号されたデータを一時的に記憶する出力バッファ手段と、この出力バッファ手段が記憶しているデータの量を検出する検出手段と、この検出手段が検出したデータ量が予め設定した第1の閾値未満の場合には、出力バッファ手段が記憶しているデータの量が第1の閾値以上の場合よりも負荷レベルが低い復号処理を復号手段に行わせる制御手段とを具備して構成するようにした。
以上述べたように、この発明では、復号手段によって復号されたデータを一時的に記憶する出力バッファ手段が記憶しているデータ量に応じて、復号手段による復号処理の負荷レベルを制御するようにしている。
したがって、この発明によれば、復号手段による復号処理の負荷レベルを制御して、出力バッファ手段が記憶する復号後のデータが枯渇しないように復号処理することができるので、音途切れを防止して聴感上の違和感を軽減することが可能な復号装置を提供できる。
以下、図面を参照して、この発明の一実施形態について説明する。
図1は、この発明の一実施形態に係わる復号装置の構成を示すものである。この復号装置は、入力バッファ10、デコーダ20、出力バッファ30、ディジタルアンプ40、スピーカ50および制御部100を備えている。
入力バッファ10は、AAC方式やMP3方式などのコアデータを含むオーディオデータが前段の受信部(図示しない)から入力され、この入力されたオーディオデータを一時的に記憶し、デコーダ20に出力する。
上記オーディオデータは、図2に示すようなフレーム内に挿入されてた状態で通信相手より送信され、上記受信部で受信されるものである。このため、上記受信部から入力バッファ10へは、バースト的に入力されることになる。
なお、上記受信部に代わって、例えば外部機器から上記オーディオデータが入力されるインターフェースや、DVDやCDなどの光学メディアや、ハードウェアディスクや半導体メモリなどのストレージデバイスから上記オーディオデータを読み出すインターフェースであってもよい。
デコーダ20は、入力バッファ10に蓄積されたオーディオデータを読み出してこれに復号処理を施すものであって、後述する制御部100からの指示に応じて、上記復号処理を間欠的もしくは連続的に実行する。この復号処理では、上記オーディオデータに復号処理を施したのち、この処理結果にSBRによる帯域拡張符号化処理を施して、PCMデータを得る。
出力バッファ30は、デコーダ20から出力されるPCMデータを一時的に蓄積し、蓄積したPCMデータを所定の平均転送速度でディジタルアンプ40に出力する。ディジタルアンプ40は、出力バッファ30から与えられるPCMデータに基づいてアナログ信号を生成し、これを増幅する。この増幅されたアナログ信号は、スピーカ50より拡声出力される。
制御部100は、当該復号装置の各部を統括して制御するものであって、出力バッファ30に蓄積されるPCMデータの残量を検出し、この検出結果に応じて、デコーダ20におけるデコード処理を制御する。
次に、上記構成の復号装置の動作について、制御部100の制御動作を通じて説明する。図3は、制御部100の制御動作を説明するフローチャートである。このフローチャートの基になる制御プログラムは制御部100内に記憶され、制御部100は上記制御プログラムに従って動作する。
また図4に、出力バッファ30に蓄積されるPCMデータの残量の一例を示す。なお、この実施例では、説明を簡明にするために、出力バッファ30での初期遅延を1フレームとした場合について述べることにするが、この遅延フレーム数は、システムが許容する出力遅延に応じて1フレーム以上を設定してもよい。
なお、以下の説明では、制御部100は、安定したデコード処理がなされる状況において、基準閾値2+αフレーム分以上のPCMデータが出力バッファ30に蓄積されるように各部を制御するものとする。
上記基準閾値は、デコーダ20のデコード処理負荷がプロセッサ処理能力を超えているかどうか判断する際のマージン値である。α=0の場合にはマージンはなく、PCMデータが基準閾値以下であればデコード処理負荷がプロセッサ処理能力を超えていることを意味する。またα>0の場合に、PCMデータが2以上基準値以下であればデコード処理負荷がプロセッサ処理能力以内であるが、次フレーム以降でプロセッサ処理能力を超える可能性が高いことを意味する。
まず、ステップ3aにおいて制御部100は、デコーダ20を制御して、無音データを出力させるとともに、次フレームのデコード方法を制御するデコードフラグの初期設定として「通常デコード」を示す値にセットし、ステップ3bに移行する。
無音データの出力により出力バッファ30には、無音データが蓄積される。これは、処理負荷時のバッファアンダーフローによる音途切れを回避するのものである。また、デコードフラグとして「通常デコード」が設定されることで、デコーダ20はオーディオデータに対応する復号処理と、SBR処理を実行する。
ステップ3bにおいて制御部100は、デコーダ20にデコード処理を開始させ、ステップ3cに移行する。これによりデコーダ20では、プロセッサが、入力バッファ10からオーディオデータを1フレーム分読み出し、これに現在設定されるデコードフラグに従ったデコード処理を施し、これによって得たPCMデータを出力バッファ30に出力する。
ステップ3cにおいて制御部100は、出力バッファ30に蓄積されるPCMデータの残量を検出し、この残量が2+αフレーム分以上か否かを判定する。ここで、上記残量が2+αフレーム分以上の場合には、ステップ3dに移行し、2+αフレーム分未満の場合には、ステップ3eに移行する。
ここで、上記残量が2+αフレーム分以上と判断された場合は、図4(a)に示すような状態であり、この時点でのデコーダ20に対する処理負荷が、プロセッサの処理能力以下の状況にあると考えられる。
ステップ3dにおいて制御部100は、上述したように、処理負荷がプロセッサの処理能力以下の状況と考えられるため、デコーダ20にデコードフラグとして「通常デコード」を設定し、そしてデコーダ20を次のフレーム周期までスリープ(sleep)させるために待機し、次のフレーム周期の到来に合わせて、ステップ3bに移行する。
このスリープ後のステップ3b移行時にあっては、出力バッファ30に蓄積されるPCMデータの残量は、上記スリープ中にPCMデータを消費(出力)しているため、図4(b)に示すような状態となっている。
ステップ3eにおいて制御部100は、出力バッファ30に蓄積されるPCMデータの残量を検出し、この残量が2−βフレーム分以上か否かを判定する。ここで、上記残量が2−βフレーム分以上の場合には、ステップ3fに移行し、2−βフレーム分未満の場合には、ステップ3gに移行する。
ここで、上記残量が2−βフレーム分以上と判断された場合は、図4(c)に示すような状態であり、この時点でのデコーダ20の処理能力とデコード処理負荷が同程度であり、次フレーム以降で処理負荷がプロセッサ処理能力を超える可能性が高い状況にあると考えられる。
ステップ3fにおいて制御部100は、上述したように、デコーダ20の処理能力とデコード処理負荷が同程度であると考えられるため、デコーダ20にデコードフラグとして「通常デコード」を設定し、デコーダ20をスリープさせることなく、ステップ3bに移行して次フレームのデコード処理を実行させる。
ステップ3gにおいて制御部100は、出力バッファ30に蓄積されるPCMデータの残量を検出し、この残量が2−γフレーム分以上か否かを判定する(β<γ)。ここで、上記残量が2−γフレーム分以上の場合には、ステップ3hに移行し、2−γフレーム分未満の場合には、ステップ3jに移行する。
ここで、上記残量が2−γフレーム分以上と判断された場合は、図4(d)に示すような状態であり、この時点でのデコーダ20に対する処理負荷が、プロセッサの処理能力に比して比較的高い状況にあり、処理が遅れだしていると考えられる。
ステップ3hにおいて制御部100は、上述したように、処理負荷が遅れだしていると考えられるため、デコーダ20にデコードフラグとして「SBR処理簡略」を設定し、デコーダ20をスリープさせることなく、ステップ3bに移行して、次フレームに対してSBR処理が簡略化されたデコード処理を実行させる。
なお、デコードフラグとして「SBR処理簡略」が設定される場合には、デコーダ20は、前フレームのデコード処理時に用いたエンベロープ補正のパワー情報などを流用してデコード処理を実行し、SBRデコード処理を簡略化して、処理の遅れを取り戻す。
なお、SBR処理簡略化は、上述したような情報流用によるもののほかに、拡張帯域を制限することで処理負荷を軽減するようにしたり、あるいはこの拡張帯域制限と上記情報流用と併せて行うようにしてもよい。
一方、ステップ3gにて、上記残量が2−γフレーム分未満と判断された場合は、図4(e)に示すような状態であり、この時点でのデコーダ20に対する処理負荷が、プロセッサの処理能力に比してかなり高い状況にあり、過度に処理が遅れていると考えられる。 このため、ステップ3jにおいて制御部100は、上述したように、過度に処理負荷が遅れていると考えられるため、デコーダ20にデコードフラグとして「SBR処理省略」を設定し、デコーダ20をスリープさせることなく、ステップ3bに移行する。
これにより、ステップ3bにおける次フレームのデコード処理では、デコードフラグとして「SBR処理省略」が設定されるため、SBR処理を省略して、コアデコードの処理とアップサンプリング処理のみを実行させる。
以上のように、上記構成の復号装置では、出力バッファ30に蓄積されるPCMデータの残量が基準閾値(2+αフレーム分)以上の場合には、デコーダ20に対する処理負荷が、プロセッサの処理能力以下の状況にあるものと判断して、デコーダ20を次のフレーム周期までスリープさせた後、次のフレーム周期に通常のデコード処理として、オーディオデータに対応する復号処理と、SBR処理を実行させる。
そして、出力バッファ30に蓄積されるPCMデータの残量が基準閾値未満2−βフレーム分以上の場合には、デコーダ20の処理能力とデコード処理負荷が同程度であると判断して、次フレーム以降のデコード時のプロセッサ処理能力マージンを増やすため、デコーダ20をスリープさせることなく、通常のデコード処理を実行させる。
そしてまた、出力バッファ30に蓄積されるPCMデータの残量が2−βフレーム分未満2−γフレーム分以上の場合には、デコーダ20に対する処理負荷が、プロセッサの処理能力に比して比較的高い状況にあるものと判断して、デコーダ20をスリープさせることなく、SBR処理が簡略化されたデコード処理を実行させる。
さらに、出力バッファ30に蓄積されるPCMデータの残量が2−γフレーム分未満の場合には、デコーダ20に対する処理負荷が、プロセッサの処理能力に比して過度に高い状況にあるものと判断して、デコーダ20をスリープさせることなく、SBR処理を省略したデコード処理を実行させる。
すなわち、上記構成の復号装置では、出力バッファ30に蓄積されるPCMデータの残量に応じて、スリープ時間を制御したり、あるいはデコード処理の負荷レベルを制御するようにしている。
したがって、上記構成の復号装置によれば、出力バッファ30に蓄積されるPCMデータが枯渇してしまう状況を回避でき、音途切れを防止して聴感上の違和感を軽減することができる。
特に、オーディオデータがバースト受信される場合にあっては、デコーダ20に対する処理負荷が大きくなると、出力バッファ30に蓄積されるPCMデータが枯渇してしまう虞が高いため、バースト受信を行う機器や、バースト受信のように、オーディオデータが断続的に入力される機器に大きな効果をもたらす。
なお、この発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
その一例として例えば、上記実施の形態では、出力バッファ30に蓄積されるPCMデータの残量に応じて、スリープ時間を制御したり、あるいはデコード処理の負荷レベルを制御するように構成したが、これに代わって、あるいはこれに加えて例えば、出力バッファ30に蓄積されるPCMデータの残量に応じて、SBR処理による帯域拡張の周波数範囲を増減するようにしてもよい。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
この発明に係わる復号装置の一実施形態の構成を示す回路ブロック図。 図1に示した復号装置の入力バッファに入力されるオーディオデータを説明するための図。 図1に示した復号装置の動作を説明するためのフローチャート。 図1に示した復号装置の出力バッファに記憶されているデータ量を示す図。
符号の説明
10…入力バッファ、20…デコーダ、30…出力バッファ、40…ディジタルアンプ、100…制御部。

Claims (5)

  1. 符号化された音声データが入力される入力手段と、
    この入力手段を通じて入力された音声データを復号する復号手段と、
    この復号手段によって復号されたデータを一時的に記憶する出力バッファ手段と、
    この出力バッファ手段が記憶しているデータの量を検出する検出手段と、
    この検出手段が検出したデータ量が予め設定した第1の閾値未満の場合には、前記検出手段が検出したデータの量が前記第1の閾値以上の場合よりも負荷レベルが低い復号処理を前記復号手段に行わせる制御手段とを具備したことを特徴とする復号装置。
  2. 前記制御手段は、前記検出手段が検出したデータ量が前記第1の閾値以上の場合には、前記復号手段に帯域拡張処理を含む復号処理を実行させ、一方、前記検出手段が検出したデータ量が前記第1の閾値未満の場合には、前記復号手段に帯域拡張処理を除く復号処理を実行させることを特徴とする請求項1に記載の復号装置。
  3. 前記制御手段は、前記検出手段が検出したデータ量が第1の閾値未満の場合には、過去に音声データを復号した際に用いた情報を用いた復号を前記復号手段に行わせることを特徴とする請求項1に記載の復号装置。
  4. 前記復号手段は、音声データにコアデータの復号処理と帯域拡張処理を施すものであって、
    前記制御手段は、前記検出手段が検出したデータ量に応じて、前記復号手段で行われる帯域拡張処理の拡張帯域幅を可変することを特徴とする請求項1に記載の復号装置。
  5. さらに、前記入力手段を通じて入力された音声データを一時的に記憶する入力バッファ手段を備え、
    前記復号手段は、前記入力バッファ手段に記憶される音声データを読み出して復号するもので、
    前記制御手段は、前記検出手段が検出したデータ量が前記第1の閾値よりも大きい第2の閾値以上の場合には待ち時間が経過した後に前記復号手段に復号動作させることを特徴とする請求項1に記載の復号装置。
JP2004325536A 2004-11-09 2004-11-09 復号装置 Expired - Fee Related JP4959935B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004325536A JP4959935B2 (ja) 2004-11-09 2004-11-09 復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004325536A JP4959935B2 (ja) 2004-11-09 2004-11-09 復号装置

Publications (2)

Publication Number Publication Date
JP2006133698A JP2006133698A (ja) 2006-05-25
JP4959935B2 true JP4959935B2 (ja) 2012-06-27

Family

ID=36727280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004325536A Expired - Fee Related JP4959935B2 (ja) 2004-11-09 2004-11-09 復号装置

Country Status (1)

Country Link
JP (1) JP4959935B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100489739C (zh) 2005-12-13 2009-05-20 松下电器产业株式会社 数据处理装置
EP2015302A4 (en) 2006-04-28 2012-05-30 Panasonic Corp DEVICE FOR REPRODUCING CONTENT
JP4757836B2 (ja) 2007-05-11 2011-08-24 パナソニック株式会社 データ処理装置
JP5084347B2 (ja) 2007-05-21 2012-11-28 パナソニック株式会社 データ処理装置
CN102598123B (zh) * 2009-10-23 2015-07-22 松下电器(美国)知识产权公司 编码装置、解码装置及其方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08328586A (ja) * 1995-05-29 1996-12-13 Matsushita Electric Ind Co Ltd 音声時間軸変換装置
JP3225502B2 (ja) * 1996-04-25 2001-11-05 日本ビクター株式会社 音声情報の圧縮データ再生装置
JP3282661B2 (ja) * 1997-05-16 2002-05-20 ソニー株式会社 信号処理装置および方法
JP3484341B2 (ja) * 1998-03-30 2004-01-06 三菱電機株式会社 音声信号伝送装置
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3796240B2 (ja) * 2002-09-30 2006-07-12 三洋電機株式会社 ネットワーク電話機および音声復号化装置
JPWO2005043540A1 (ja) * 2003-10-31 2007-05-10 松下電器産業株式会社 音響装置

Also Published As

Publication number Publication date
JP2006133698A (ja) 2006-05-25

Similar Documents

Publication Publication Date Title
JP4630876B2 (ja) 話速変換方法及び話速変換装置
JP2008261978A (ja) 再生音量自動調整方法
JPWO2005117366A1 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
TW200908602A (en) Method and apparatus for modifying playback timing of talkspurts within a sentence without affecting intelligibility
TWI480861B (zh) 用於控制聲頻信號之時間縮放的方法、裝置及系統
US7240013B2 (en) Method and apparatus for controlling buffering of audio stream
JP4959935B2 (ja) 復号装置
US20060098741A1 (en) Reproducing apparatus
TWI701922B (zh) 訊號處理裝置、及訊號處理方法、以及記錄程式之非暫時性電腦可讀取之記錄媒體
JP4507672B2 (ja) オーディオ再生装置およびクロック周波数制御方法
JP2006113375A (ja) 音声の再生及び停止を制御する音声再生装置及びプログラム
JP5977528B2 (ja) 話速変換装置、話速変換方法及びプログラム
JP5691721B2 (ja) 音声データ処理装置
WO2010100895A1 (ja) 音声再生装置及び映像音声再生装置
JP2003223192A (ja) オーディオ符号化装置およびオーディオ符号化方法
JP6005910B2 (ja) 音響装置
JP2008076847A (ja) 復号器及び信号処理システム
JP2003162299A (ja) 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JP3607586B2 (ja) 音声遅延制御装置
JP5299631B2 (ja) 音声復号装置およびその音声処理方法
KR20010085664A (ko) 화속 변환 장치
JP2008084382A (ja) 圧縮データ再生方法
JP2005284034A (ja) 音声復号装置
JP2007184861A (ja) オーディオ再生装置
JP2007221597A (ja) ストリーム受信装置及びストリーム受信方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110614

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111205

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120322

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees