JP2005292702A - オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム - Google Patents

オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム Download PDF

Info

Publication number
JP2005292702A
JP2005292702A JP2004111028A JP2004111028A JP2005292702A JP 2005292702 A JP2005292702 A JP 2005292702A JP 2004111028 A JP2004111028 A JP 2004111028A JP 2004111028 A JP2004111028 A JP 2004111028A JP 2005292702 A JP2005292702 A JP 2005292702A
Authority
JP
Japan
Prior art keywords
fade
gain parameter
gain
bit stream
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004111028A
Other languages
English (en)
Inventor
Koichi Takagi
幸一 高木
Shigeyuki Sakasawa
茂之 酒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004111028A priority Critical patent/JP2005292702A/ja
Priority to US11/073,639 priority patent/US7472069B2/en
Publication of JP2005292702A publication Critical patent/JP2005292702A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 携帯電話機のような低演算速度及び低メモリ量の装置であっても、オーディオデータを完全に復号化することなく、音量に時間的変化を加えることができるフェードイン/フェードアウト処理装置及びプログラムを提供する。
【解決手段】 MPEGオーディオ規格に基づくオーディオフレームのビットストリームをヘッダ部及び実データ部に分解して、global_gainを出力するビットストリーム分解部10と、global_gainを所定時間範囲で増加又は減少させる利得パラメータ変更部12と、変更されたglobal_gainを含めて、分解されたヘッダ部及び実データ部を合成するビットストリーム合成部14とを有する。また、SBRデータを含むオーディオデータについては、サブバンド毎のbs_data_envを増加又は減少する。
【選択図】 図2

Description

本発明は、オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラムに関する。
インターネットを介した音楽配信においては、通常、原音から得られたPCM符号データに圧縮をかけた形で配信される。代表的なオーディオ圧縮方式としては、MPEG1オーディオレイヤIII規格に基づくMP3(ISO/IEC11172−3、JIS X4323)がある。また、MPEG1オーディオレイヤIIIから互換性を保ちつつ多くの拡張がなされたMPEG2オーディオレイヤIII規格は、互換性はないまでもMPEG1オーディオレイヤIIIと比較して最大20%〜50%の符号化効率を達成するAAC(Advanced Audio Coding)が規格されている。このように非常に少ない符号量で高音質を実現するAACは、携帯電話機に対する音楽配信のための符号化として注目されてきている。
近年、オーディオデータは、利用者の嗜好に応じて様々な場面で再生させることができる。利用者は、単に趣味的に音楽を聴くだけでなく、例えば携帯電話機において、着信音としてその音楽を鳴動させたり、アラーム代わりに鳴動させることができる。このとき、利用者にとっては、音量をフェードイン(単調増加)又はフェードアウト(単調減少)させ、心地よい音楽にしたいという要求がある。しかしながら、その音量を変化させるには、通常、スピーカのボリュームを利用者自身が手動で変化させるしかなかった。また、一度、その音楽を再生しつつ、自らボリュームを変化させた音を再度録音し、その機器のメモリに記憶させておかなければならなかった。
これに対し、オーディオデータの前部分のサンプルのみを復号化して、そのゲインを除々に上げて、更に符号化してオーディオデータを再生成することにより、フェードインを実現する方法がある(例えば特許文献1参照)。この方法によれば、また、オーディオデータの後部分のサンプルのみを復号化して、そのゲインを除々に下げて、更に符号化してオーディオデータを再生成することにより、フェードアウトを実現している。
特開平7−220394号公報
しかしながら、従来技術による方法によれば、音量に時間変化を加えるだけのために、復号化したオーディオデータに対するゲインを制御し、更に符号化してオーディオデータを再生成しなければならないので、比較的高い演算速度及びメモリ量を必要とする。これに対し、低演算速度で且つ低メモリ量である携帯電話機では、その実現が難しいという問題があった。
そこで、本発明は、携帯電話機のような低演算速度及び低メモリ量の装置であっても、オーディオデータを完全に復号化することなく、音量に時間的変化を加えることができるフェードイン/フェードアウト処理装置及びプログラムを提供することを目的とする。
本発明のフェードイン/フェードアウト処理装置によれば、
オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解して、利得パラメータ値を出力するビットストリーム分解手段と、
利得パラメータ値を所定時間範囲で増加又は減少させる利得パラメータ変更手段と、
変更された利得パラメータ値を含めて、ヘッダ要素及び実データ部を合成するビットストリーム合成手段とを有することを特徴とする。
本発明のフェードイン/フェードアウト処理装置における他の実施形態によれば、オーディオフレームは、MPEGオーディオ規格に基づくAACデータを含むものであって、利得パラメータ値はglobal_gainであることも好ましい。
また、本発明のフェードイン/フェードアウト処理装置における他の実施形態によれば、ビットストリーム分解手段はスケールファクタを出力するように構成されており、量子化刻み幅が負とならないように、global_gainと差分値のスケールファクタとから計算される量子化刻み幅の中で最小値を利得パラメータ変更手段へ通知する操作可能域監視手段を更に有し、利得パラメータ変更手段は、global_gainから量子化刻み幅の最小値を差し引いた値よりも、global_gainが減少しないように構成されていることも好ましい。
本発明のフェードイン/フェードアウト処理装置によれば、オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解するビットストリーム分解手段と、実データ部に含まれる包絡線の利得パラメータの符号列を利得パラメータ値に復元するハフマン復号化手段と、利得パラメータ値を所定時間範囲で増加又は減少させて、変更された利得パラメータ値をハフマン符号化して当該実データ部に含める利得パラメータ変更手段と、ヘッダ要素及び実データ部を合成するビットストリーム合成手段とを有することを特徴とする。
本発明のフェードイン/フェードアウト処理装置における他の実施形態によれば、オーディオフレームは、MPEGオーディオ規格に基づくSBRデータを含むものであって、利得パラメータ値はbs_data_envであることも好ましい。
また、本発明のフェードイン/フェードアウト処理装置における他の実施形態によれば、利得パラメータ変更手段は、利得パラメータ値を、時間進行に対して、単調的に、指数曲線的に又は予め指定された特徴ある曲線的に、増加又は減少させることも好ましい。
本発明のフェードイン/フェードアウト処理プログラムによれば、
オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解して、利得パラメータ値を出力するビットストリーム分解手段と、
利得パラメータ値を所定時間範囲で増加又は減少させる利得パラメータ変更手段と、
変更された利得パラメータ値を含めて、ヘッダ要素及び実データ部を合成するビットストリーム合成手段として機能させることを特徴とする。
また、本発明のフェードイン/フェードアウト処理プログラムにおける他の実施形態によれば、オーディオフレームは、MPEGオーディオ規格に基づくAACデータを含むものであって、利得パラメータ値はglobal_gainであるように機能させることも好ましい。
また、本発明のフェードイン/フェードアウト処理プログラムにおける他の実施形態によれば、ビットストリーム分解手段はスケールファクタを出力するように構成されており、量子化刻み幅が負とならないように、global_gainと差分値のスケールファクタとから計算される量子化刻み幅の中で最小値を利得パラメータ変更手段へ通知する操作可能域監視手段を更に有し、利得パラメータ変更手段は、global_gainから量子化刻み幅の最小値を差し引いた値よりも、global_gainが減少しないように機能させることも好ましい。
本発明のフェードイン/フェードアウト処理プログラムによれば、
オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解するビットストリーム分解手段と、
実データ部に含まれる包絡線の利得パラメータの符号列を利得パラメータ値に復元するハフマン復号化手段と、
利得パラメータ値を所定時間範囲で増加又は減少させて、変更された利得パラメータ値をハフマン符号化して当該実データ部に含める利得パラメータ変更手段と、
ヘッダ要素及び実データ部を合成するビットストリーム合成手段として機能させることを特徴とする。
また、本発明のフェードイン/フェードアウト処理プログラムにおける他の実施形態によれば、オーディオフレームは、MPEGオーディオ規格に基づくSBRデータを含むものであって、利得パラメータ値はbs_data_envであるように機能させることも好ましい。
更に、本発明のフェードイン/フェードアウト処理プログラムにおける他の実施形態によれば、利得パラメータ変更手段は、利得パラメータ値を、時間進行に対して、単調的に、指数曲線的に又は予め指定された特徴ある曲線的に、増加又は減少させるように機能させることも好ましい。
本発明のフェードイン/フェードアウト処理装置及びプログラムによれば、オーディオフレームの利得パラメータ(global_gain)のみを変化させることにより、携帯電話機のような低演算速度及び低メモリ量の装置であっても、オーディオデータを完全に復号化することなく、音量に時間的変化を加えて再生することが可能なオーディオデータに変更できる。
また、本発明によれば、MPEGオーディオ規格に基づいて、低周波数領域のAACデータだけでなく、高周波数領域のSBRデータについてもフェードイン/フェードアウト処理を加えることができる。
更に、本発明によれば、利用者の希望に応じて、フェードイン/フェードアウトさせる音量変更の種々パターンを指定することができる。
以下では、図面を用いて、本発明における最良の実施形態について詳細に説明する。
図1は、1オーディオフレームの構成図である。
MPEGオーディオ規格に基づくフレームによれば、チャネルCh1及びCh2(例えば右チャネルと左チャネル)からなり低周波数領域をカバーするAAC部と、高周波数領域をカバーするSBR(Spectral Band Replication:スペクトル帯域複製)部とがタグで区切られている。
AAC部には、チャネル毎にglobal_gainが含まれている。global_gainは、実際にデコードに用いられる値が格納されている。また、AAC部には、チャネル毎に、サブバンド分解された、オーディオデータに対応したスケールファクタ(差分値)と符号化データとを含む。スケールファクタは、予測差分値の形式で、サブバンド毎に異なる値が配列形式で一カ所に固めて格納されている。尚、スケールファクタは、ハフマン符号化されて格納されているので、ハフマン復号化する必要がある。
SBR(Spectral Band Replication:スペクトル帯域複製)とは、復号側で低周波数領域を用いて高周波数領域を複製することによって音質を向上させる技術である。SBRは、低周波数領域とわずかなサイド情報だけを伝送すればよいために、低ビットレートの情報で、高ビットレートのAACと同等の音質を実現することができる。SBR部は、ヘッダ部と実データ部とからなり、実データ部には、サブバンド毎に異なるbs_data_env(包絡線の利得パラメータ)が配列形式で一カ所に固めてた部分と、合成用ノイズデータとが含まれている。尚、bs_data_envは、ハフマン符号化されて格納されているので、ハフマン復号化する必要がある。
図2は、本発明におけるAACのフェードイン/フェードアウト処理装置1の機能構成図である。これら機能は、プログラムによって実現されることが好ましい。
AACのフェードイン/フェードアウト処理装置1には、AACのオーディオフレームが入力され、フェードイン/フェードアウト処理が加えられたオーディオフレームを出力する。ビットストリーム分解部10は、ビットストリームをヘッダ要素及び実データ部に分解する。そして、ヘッダ要素に含まれるglobal_gainを利得パラメータ変更部12へ通知し、サブバンド毎のスケールファクタの符号列をハフマン復号化部11へ通知する。ハフマン復号化部11は、スケールファクタの符号列を復号化し、抽出されたスケールファクタは、操作可能域監視部13へ通知される。
利得パラメータ変更部12は、フェードイン又はフェードアウトのいずれを行うか、どの程度の時間範囲で行うか等の制御情報が、利用者によって予め指定されている。その上で、利得パラメータ変更部12は、所定時間範囲で、段階的にglobal_gainを増加又は減少させる。global_gainは初期値となるものであり、その値とスケールファクタとから計算されて、量子化刻み幅が決定される。尚、global_gainを変更することによって符号列が短くなった場合、ビットストリーム合成部14において、オーディオフレーム長が所定の固定長となるようにスタッフィングデータを挿入することで当該符号長に変更が生じないようにすることができる。
ハフマン復号化部11は、分解されたサブバンド毎のスケールファクタの符号列を復号化する。復号化されたスケールファクタの配列が、操作可能域監視部13へ通知される。
操作可能監視部13は、ビットストリーム分解部10からglobal_gainが入力され、ハフマン復号化部11からscale_factor[]配列が入力される。その上で、操作可能監視部13は、scale_factor[]から計算される量子化刻み幅が負とならないように、該量子化刻み幅の中で最小値を利得パラメータ変更部12へ通知する。利得パラメータ変更部12は、global_gainから量子化刻み幅の最小値を差し引いた値よりも、global_gainが減少しないようにように動作する。これにより、scale_factor[]から計算される量子化刻み幅の最小値が負になることを防ぐことができる。
global_gain、scale_factor[]及び量子化刻み幅は、例えば以下のような関係の値をとる。
global_gain =15
scale_factor[]=0, -2, -1, -2, +4, ・・・
量子化刻み幅 =15, 13, 12, 10, 14, ・・・
このとき、global_gain=15->3に変更されたとする。そうすると、以下のような関係の値となる。
global_gain = 3
scale_factor[]=0, -2, -1, -2, +4, ・・・
量子化刻み幅 =3, 1, 0, -2, 2, ・・・
この場合、量子化刻み幅が"-2"となる負の値となる部分が生じてしまう。このように量子化刻み幅が負とならないようにするためには、global_gain=15の場合における量子化刻み幅の最小値"10"よりも、global_gainを減少させないようにしなければならない。従って、以下のような関係がglobal_gainの最小値となる。
global_gain =15->5
scale_factor[]=0, -2, -1, -2, +4, ・・・
量子化刻み幅 =5, 3, 2, 0, 4, ・・・
前述の例の場合、操作可能監視部13は、global_gain=15の場合の量子化刻み幅の最小値"10"を、利得パラメータ変更部12へ通知する。利得パラメータ変更部12は、量子化刻み幅の最小値"10"よりもglobal_gainを減少させないように動作する。
ビットストリーム合成部14は、利得パラメータ変更部12から出力された利得パラメータを含めて、分解されたヘッダ要素及び実データ部をビットストリームに合成する。これにより、フェードイン/フェードアウト処理装置1から、フェードイン/フェードアウト処理が加えられたAACデータが出力される。
図3は、標準の量子化特性を表すグラフである。また、図4は、音量を1段小さくした量子化特性を表すグラフである。更に、図5は、音量を2段小さくした量子化特性を表すグラフである。
それぞれのグラフは、横軸を入力とし、縦軸を出力として表されており、入力信号を量子化刻み幅Δで割算した結果を切り捨てたものである。図3->図4->図5への刻み幅の変更はフェードアウトを意味し、図5->図4->図3への刻み幅の変更はフェードインを意味する。このように、global_gainの増加又は減少により、量子化刻み幅が変更され、擬似的に音量を制御することが可能となる。
図6は、フェードアウトの変更パターンのグラフである。
このグラフは、縦軸はglobal_gainの割合を表し、横軸は時間経過を表している。パターン1は、global_gainの100%から単調減少で変化している。パターン2は、指数曲線的に減少して変化している。パターン3は、減少した後、増加して、再び減少して変化している。このようなパターンは、利得パラメータ変更部12のglobal_gainの変更によってどのようにもすることができる。どのように変化させるかは設計事項である。
図7は、SBR及びbs_data_envパラメータの説明図である。
図7によれば、低周波数領域はAACによって符号化されており、その部分を用いて高周波数領域として複製している。その高周波数領域の包絡線は、bs_data_envパラメータとして表されている。bs_data_envパラメータを、AACのglobal_gain及びスケールファクタと同様に増加又は減少させることによって、高周波数領域についてもフェードイン/フェードアウトを実現することができる。
図8は、SBRのフェードイン/フェードアウト処理装置2の機能構成図である。これら機能は、プログラムによって実現されることが好ましい。
SBRのフェードイン/フェードアウト処理装置2は、ビットストリーム分解部20と、ハフマン復号化部21と、利得パラメータ変更部22と、ビットストリーム合成部23とを有する。
ビットストリーム分解部20は、ビットストリームをヘッダ部及び実データ部に分解し、実データ部に含まれる包絡線利得パラメータのハフマン符号をハフマン復号化部21へ通知する。ハフマン復号化部21は、サブバンド毎のbs_data_env(包絡線利得パラメータ)の符号列を復号化して抽出する。利得パラメータ変更部22は、サブバンド毎のbs_data_envを増加又は減少させる。そして、利得パラメータ変更部22は、変更後のbs_data_envに対応したハフマン符号語に置き換えてビットストリーム合成部23へ通知する。このとき、bs_data_envを変更することによって符号列が短くなった場合、スタッフィングデータを挿入することで当該符号長に変更が生じないようにすることができる。ビットストリーム合成部23は、ヘッダ部及び実データ部を合成し、そのビットストリームを出力する。このとき、ハフマン符号語を置き換える際に、一段階音を小さくするのに対応するハフマン符号語だと符号語長が長くなってしまう際に、符号語長が同じ又は短くなるハフマン符号語で、より小さな音となるように置き換えることもできる。これにより、SBR全体のデータ長の増加を防止することができる。
尚、図2は、AACに対するフェードイン/フェードアウト処理装置であるのに対し、図8は、SBRに対するものである。従って、AACの低周波数領域とSBRの高周波数領域とを同時にフェードイン/フェードアウトさせるためには、図2及び図6の機能構成を併合することによって実現できる。
前述した本発明における種々の実施形態によれば、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略を、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1オーディオフレームの構成図である。 本発明におけるAACのフェードイン/フェードアウト処理装置の機能構成図である。 標準の量子化特性を表すグラフの例である。 音量を1段小さくした量子化特性を表すグラフの例である。 音量を2段小さくした量子化特性を表すグラフの例である。 フェードアウトの変更パターンのグラフである。 SBR及びbs_data_envパラメータの説明図である。 本発明におけるSBRのフェードイン/フェードアウト処理装置の機能構成図である。
符号の説明
1 AACのフェードイン/フェードアウト処理装置
10 ビットストリーム分解部
11 ハフマン復号化部
12 利得パラメータ変更部
13 操作可能域監視部
14 ビットストリーム合成部
2 SBRのフェードイン/フェードアウト処理装置
20 ビットストリーム分解部
21 ハフマン復号化部
22 利得パラメータ変更部
23 ビットストリーム合成部
4 オーディオデータ記憶部

Claims (12)

  1. オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解して、利得パラメータ値を出力するビットストリーム分解手段と、
    前記利得パラメータ値を所定時間範囲で増加又は減少させる利得パラメータ変更手段と、
    変更された前記利得パラメータ値を含めて、前記ヘッダ要素及び実データ部を合成するビットストリーム合成手段と
    を有することを特徴とするフェードイン/フェードアウト処理装置。
  2. 前記オーディオフレームは、MPEGオーディオ規格に基づくAACデータを含むものであって、前記利得パラメータ値はglobal_gainであることを特徴とする請求項1に記載のフェードイン/フェードアウト処理装置。
  3. 前記ビットストリーム分解手段はスケールファクタを出力するように構成されており、
    量子化刻み幅が負とならないように、前記global_gainと差分値の前記スケールファクタとから計算される量子化刻み幅の中で最小値を前記利得パラメータ変更手段へ通知する操作可能域監視手段を更に有し、
    前記利得パラメータ変更手段は、前記global_gainから前記量子化刻み幅の最小値を差し引いた値よりも、前記global_gainが減少しないように構成されていることを特徴とする請求項2に記載のフェードインフェードアウト処理装置。
  4. オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解するビットストリーム分解手段と、
    前記実データ部に含まれる包絡線の利得パラメータの符号列を利得パラメータ値に復元するハフマン復号化手段と、
    前記利得パラメータ値を所定時間範囲で増加又は減少させて、変更された前記利得パラメータ値をハフマン符号化して当該実データ部に含める利得パラメータ変更手段と、
    前記ヘッダ要素及び実データ部を合成するビットストリーム合成手段と
    を有することを特徴とするフェードイン/フェードアウト処理装置。
  5. 前記オーディオフレームは、MPEGオーディオ規格に基づくSBRデータを含むものであって、前記利得パラメータ値はbs_data_envであることを特徴とする請求項4に記載のフェードイン/フェードアウト処理装置。
  6. 前記利得パラメータ変更手段は、前記利得パラメータ値を、時間進行に対して、単調的に、指数曲線的に又は予め指定された特徴ある曲線的に、増加又は減少させることを特徴とする請求項1から5のいずれか1項に記載のフェードイン/フェードアウト処理装置。
  7. オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解して、利得パラメータ値を出力するビットストリーム分解手段と、
    前記利得パラメータ値を所定時間範囲で増加又は減少させる利得パラメータ変更手段と、
    変更された前記利得パラメータ値を含めて、前記ヘッダ要素及び実データ部を合成するビットストリーム合成手段と
    して機能させることを特徴とするフェードイン/フェードアウト処理プログラム。
  8. 前記オーディオフレームは、MPEGオーディオ規格に基づくAACデータを含むものであって、前記利得パラメータ値はglobal_gainであるように機能させることを特徴とする請求項7に記載のフェードイン/フェードアウト処理プログラム。
  9. 前記ビットストリーム分解手段はスケールファクタを出力するように構成されており、
    量子化刻み幅が負とならないように、前記global_gainと差分値の前記スケールファクタとから計算される量子化刻み幅の中で最小値を前記利得パラメータ変更手段へ通知する操作可能域監視手段を更に有し、
    前記利得パラメータ変更手段は、前記global_gainから前記量子化刻み幅の最小値を差し引いた値よりも、前記global_gainが減少しないように機能させることを特徴とする請求項8に記載のフェードインフェードアウト処理プログラム。
  10. オーディオフレームのビットストリームをヘッダ要素及び実データ部に分解するビットストリーム分解手段と、
    前記実データ部に含まれる包絡線の利得パラメータの符号列を利得パラメータ値に復元するハフマン復号化手段と、
    前記利得パラメータ値を所定時間範囲で増加又は減少させて、変更された前記利得パラメータ値をハフマン符号化して当該実データ部に含める利得パラメータ変更手段と、
    前記ヘッダ要素及び実データ部を合成するビットストリーム合成手段と
    して機能させることを特徴とするフェードイン/フェードアウト処理プログラム。
  11. 前記オーディオフレームは、MPEGオーディオ規格に基づくSBRデータを含むものであって、前記利得パラメータ値はbs_data_envであるように機能させることを特徴とする請求項10に記載のフェードイン/フェードアウト処理プログラム。
  12. 前記利得パラメータ変更手段は、前記利得パラメータ値を、時間進行に対して、単調的に、指数曲線的に又は予め指定された特徴ある曲線的に、増加又は減少させるように機能させることを特徴とする請求項7から11のいずれか1項に記載のフェードイン/フェードアウト処理プログラム。
JP2004111028A 2004-04-05 2004-04-05 オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム Pending JP2005292702A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004111028A JP2005292702A (ja) 2004-04-05 2004-04-05 オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム
US11/073,639 US7472069B2 (en) 2004-04-05 2005-03-08 Apparatus for processing framed audio data for fade-in/fade-out effects

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004111028A JP2005292702A (ja) 2004-04-05 2004-04-05 オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2005292702A true JP2005292702A (ja) 2005-10-20

Family

ID=35097395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004111028A Pending JP2005292702A (ja) 2004-04-05 2004-04-05 オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム

Country Status (2)

Country Link
US (1) US7472069B2 (ja)
JP (1) JP2005292702A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171821A (ja) * 2005-12-26 2007-07-05 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2007187905A (ja) * 2006-01-13 2007-07-26 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2012118462A (ja) * 2010-12-03 2012-06-21 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7970618B2 (en) * 2004-04-02 2011-06-28 Kddi Corporation Content distribution server for distributing content frame for reproducing music and terminal
US20060217971A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US20060217988A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for adaptive level control
US20060217969A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for echo suppression
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US20060217970A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for noise reduction
US20060217983A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for injecting comfort noise in a communications system
US7826174B2 (en) * 2006-03-31 2010-11-02 Ricoh Company, Ltd. Information recording method and apparatus using plasmonic transmission along line of ferromagnetic nano-particles with reproducing method using fade-in memory
WO2008002098A1 (en) * 2006-06-29 2008-01-03 Lg Electronics, Inc. Method and apparatus for an audio signal processing
JP2008047223A (ja) * 2006-08-17 2008-02-28 Oki Electric Ind Co Ltd オーディオ再生回路
CN101512909B (zh) * 2006-11-30 2012-12-19 松下电器产业株式会社 信号处理装置
US20100063825A1 (en) * 2008-09-05 2010-03-11 Apple Inc. Systems and Methods for Memory Management and Crossfading in an Electronic Device
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
CN112118481B (zh) * 2020-09-18 2021-11-23 珠海格力电器股份有限公司 一种音频片段生成方法、装置、播放器及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220394A (ja) 1994-01-25 1995-08-18 Sony Corp オーディオ編集方法
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171821A (ja) * 2005-12-26 2007-07-05 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8364474B2 (en) 2005-12-26 2013-01-29 Sony Corporation Signal encoding device and signal encoding method, signal decoding device and signal decoding method, program, and recording medium
JP2007187905A (ja) * 2006-01-13 2007-07-26 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2012118462A (ja) * 2010-12-03 2012-06-21 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Also Published As

Publication number Publication date
US20050234714A1 (en) 2005-10-20
US7472069B2 (en) 2008-12-30

Similar Documents

Publication Publication Date Title
JP2005292702A (ja) オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP3926726B2 (ja) 符号化装置および復号化装置
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
EP1455345B1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
US10366694B2 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
JP4308229B2 (ja) 符号化装置および復号化装置
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
JP4618634B2 (ja) 圧縮オーディオデータ処理方法
JP4558734B2 (ja) 信号復号化装置
KR102689827B1 (ko) 음장적용기능 및 적응적 소음통제기능이 구비되는 블루투스 이어폰
JP2005122034A (ja) オーディオデータ圧縮方法
CN1993891B (zh) 信号解码装置
JP2005114813A (ja) オーディオ信号再生装置及び再生方法
JP4465075B2 (ja) データストリーム処理方法およびデコーダとその使用方法
JP2008033211A (ja) 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム
US20220328051A1 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
JP2006522949A (ja) 埋め込みデータ・チャンネルの更新
CN120226074A (zh) 基于对象的音频编解码器中不连续传输的方法和设备
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2003005798A (ja) 記録装置および再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091215