JP5134019B2 - 正弦波オーディオコーディング方法及び装置 - Google Patents

正弦波オーディオコーディング方法及び装置 Download PDF

Info

Publication number
JP5134019B2
JP5134019B2 JP2009554436A JP2009554436A JP5134019B2 JP 5134019 B2 JP5134019 B2 JP 5134019B2 JP 2009554436 A JP2009554436 A JP 2009554436A JP 2009554436 A JP2009554436 A JP 2009554436A JP 5134019 B2 JP5134019 B2 JP 5134019B2
Authority
JP
Japan
Prior art keywords
sine wave
mode
component
track
previous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009554436A
Other languages
English (en)
Other versions
JP2010521712A (ja
Inventor
リー,ナム−スク
リー,ゴン−ヒョン
オー,ジェ−ウォン
リー,チョル−ウー
ジョン,ジョン−フン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010521712A publication Critical patent/JP2010521712A/ja
Application granted granted Critical
Publication of JP5134019B2 publication Critical patent/JP5134019B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号のコーディングに係り、特に、パラメトリック・コーディングでの正弦波成分(sinusoids)のトラッキングに関する。
パラメトリック・コーディング(parametric coding)は、モノラル(monaural)信号に対して適用されるオーディオ信号のコーディング方式である。パラメトリック・コーディングは、MPEG−4(moving picture experts group 4)標準で利用されている。
図1は、パラメトリック・コーディング方式について説明するための図である。パラメトリック・コーディング方式では、入力信号を分析してパラメータ化する。まず、入力されたオーディオ信号に対し、適切なフィルタリングを行う(audio reading and filtering)。入力されたオーディオ信号に対し、トランジェント(transient)分析、正弦波(sinusoidal)分析及びノイズ(noise)分析の三種の分析を行い、それぞれの領域でのオーディオ成分に対するパラメータを抽出する。トランジェント分析は、非常に躍動的な(dynamic)オーディオの変化に対応する。正弦波分析は、決定的な(deterministic)オーディオの変化に対応する。ノイズ分析は、ストカスティック(stochastic)、または非決定的な(non-deterministic)オーディオの変化に対応する。
抽出されたパラメータは、ビットストリームにフォーマッティングされる(bit-stream formatting)。
本発明は、特に、前記正弦波分析に関連したものである。正弦波分析を行った後、生成された正弦波成分をパーシャル(partial)と呼ぶ。
パラメトリックオーディオ・コーディングでは、正弦波分析を行った後、正弦波成分に対し、ADPCM(adaptive differential pulse code modulation)やDPCM(differential pulse code modulation)を行う。このためには、パーシャル(正弦波成分)に対するトラッキングが行われねばならない。
従来の方式では、トラッキングの方式で二種モードだけを採択している。これは、新生モード(birth mode)と連続モード(continuation mode)との二種である。
1つのパーシャルが以前フレームのパーシャルと関連性を有する場合(これを、連続するという)には、連続モードが指定される。連続モードが指定されれば、以前フレームのパーシャルに係わる情報を利用してコーディングできるので、コーディングに必要なビット数が減る。
一方、連続モードが指定されていないあらゆるパーシャルには、新生モードが指定される。新生モードが指定された場合、当該パーシャルをコーディングするためには、多くのビット数が必要になり、コーディング効率が落ちてしまう。
ところで、従来の方式では、1つのパーシャルは、他の1つのパーシャルによってのみトラッキングされうる。従って、以前フレームの1つのパーシャルに対して類似のパーシャルが多数連続しうる場合にも、連続モードが指定されていない残りのパーシャルに対して新生モードを指定せねばならないので、さらに多くのビット数が必要になるという問題点がある。
本発明がなそうとする技術的課題は、パラメトリック・コーディングでの正弦波分析において、抽出された正弦波成分に対し、さらに効率的にコーディングを可能にするトラッキング方式を含む正弦波オーディオコーディング方法及び装置を提供することである。
本発明がなそうとする技術的課題はまた、前記正弦波オーディオコーディング方法を、コンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
前記技術的課題をなすための正弦波オーディオコーディング方法は、入力オーディオ信号に対して正弦波分析を行って現在フレームの正弦波成分を抽出する段階と、抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード(birth mode)、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード(continuation mode)、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモード(other track mode)のうち、1つのモードを指定する段階と、指定されたモードによって、前記抽出された正弦波成分をコーディングする段階とを含むことが望ましい。
前記モードを指定する段階は、前記以前フレームの正弦波成分のうちから、前記モードを指定しようとする正弦波成分と最も近い正弦波成分である第1以前トラック成分を決定する段階と、前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断する段階と、前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対して新生モードを指定する段階と、前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、前記以前フレームの正弦波成分のうち一つを以前トラック成分として連続モード、またはその他トラックモードを指定する段階とを含むことが望ましい。
前記第1以前トラック成分を決定する段階は、前記以前フレームの正弦波成分のうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを前記第1以前トラック成分として選択する段階を含むことが望ましい。
前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が一つだけ存在する場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として連続モードを指定する段階を含むことが望ましい。
前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が複数個存在する場合、前記第1以前トラック成分から続く正弦波成分のうち、前記モードを指定しようとする正弦波成分が前記第1以前トラック成分に最も近いか否かを判断する段階と、前記モードを指定しようとする正弦波成分が前記第1以前トラック成分に最も近いものである場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として連続モードを指定する段階とをさらに含むことが望ましい。
前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、前記モードを指定しようとする正弦波成分が前記第1正弦波成分に最も近いものではない場合、前記以前フレームの正弦波成分のうち、前記現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分に最も近い第2以前トラック成分を決定する段階と、前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断する段階と、前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定する段階と、前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、連続モードに指定した場合と、その他トラックモードに指定した場合とのコーディング後のデータサイズを比較してモードを指定する段階とをさらに含むことが望ましい。
前記モードを指定しようとする正弦波成分に対してコーディング後のデータサイズを比較してモードを指定する段階は、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラックとして、その他トラックモードに指定した場合のコーディング後のデータサイズの第1サイズを求める段階と、前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラックとして、連続モードに指定した場合のコーディング後のデータサイズの第2サイズを求める段階と、前記第1サイズが前記第2サイズより小さい場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定する段階と、前記第1サイズが前記第2サイズより大きくても同じ場合、前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラック成分として連続モードを指定する段階を含むことが望ましい。
前記第2以前トラック成分を決定する段階は、前記以前フレームの正弦波成分のうち、現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを前記第2以前トラック成分として選択する段階を含むことが望ましい。
前記方法において、前記正弦波成分が互いに連続しているか否かは、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否かによって判断したり、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否か、及び前記正弦波成分の振幅の比が所定値以下であるか否かによって判断することが望ましい。
前記抽出された正弦波成分をコーディングする段階は、前記抽出された正弦波成分に対して指定されたモードがその他トラックモードである場合、以後のフレームの正弦波成分のうち、前記抽出された正弦波成分に連続する正弦波成分の個数を示す値、前記抽出された正弦波成分の以前トラック成分、前記抽出された正弦波成分の周波数及び位相値と、前記以前トラック成分の周波数及び位相値との差を示す値、及び前記抽出された正弦波成分の振幅値と、前記以前トラック成分の振幅値との差を示す値を含むデータを生成する段階を含むことが望ましい。
前記技術的課題をなすための正弦波オーディオコーディング装置は、入力オーディオ信号に対して正弦波分析を行って現在フレームの正弦波成分を抽出する正弦波分析部と、抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモードのうち、1つのモードを指定するモード指定部と、指定されたモードによって、前記抽出された正弦波成分をコーディングする正弦波成分コーディング部とを含むことが望ましい。
本発明による正弦波オーディオコーディング方法及び装置によれば、1つの以前トラック成分から連続しうる複数の正弦波成分に対し、連続モード、またはその他トラックモードを指定し、現在正弦波成分と以前トラック成分との周波数、位相、振幅の差値だけをコーディングすることによって、コーディング後のデータのビット数が新生モードを指定する場合に比べて顕著に減少する。
パラメトリック・コーディングの一例を示した図である。 本発明の一実施形態による正弦波オーディオコーディング装置の構成を示したブロック図である。 本発明の一実施形態によるモード指定部の構成を示したブロック図である。 本発明の一実施形態による正弦波成分コーディング部の構成を示したブロック図である。 本発明で提示するその他トラックモードが適用される場合と適用されていない場合とを比較するためのグラフである。 本発明で提示するその他トラックモードが適用される場合と適用されていない場合とを比較するためのグラフである。 本発明の一実施形態による正弦波オーディオコーディング方法の各段階を示したフローチャートである。 本発明の一実施形態によるその他トラックモードでのコーディングされたデータのフォーマットを示した図である。 s_contの概念を説明するための図である。
以下、添付された図面を参照しつつ、本発明による正弦波オーディオコーディング方法及び装置について詳細に説明する。
上記の従来技術について述べた通り、1つのパーシャルに対して1つのパーシャルでのみトラッキングが可能である場合、コーディング効率が落ちるという問題点があった。このために、本発明によるオーディオコーディング方法及び装置では、以前フレームの1つのパーシャルに対して一つ以上のパーシャルでトラッキングを可能にする。
このために本発明では、正弦波成分に対して三種モードを指定する。これは、新生モード(birth mode)、連続モード(continuation mode)、その他トラックモード(other track mode)である。
新生モードは、現在の正弦波成分(パーシャル)が以前フレームの正弦波成分とは関係なく新たに生成されたことを示す。
連続モードは、現在の正弦波成分が以前フレームの正弦波成分のうち一つから、唯一連続したことを示す。
その他トラックモードは、現在の正弦波成分が以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示す。
図2は、本発明の一実施形態による正弦波オーディオコーディング装置の構成を示したブロック図である。
図2を参照すれば、本発明による正弦波オーディオコーディング装置100は、正弦波分析部110、モード指定部120及び正弦波成分コーディング部130を含むことが望ましい。
正弦波分析部110は、入力オーディオ信号に対して正弦波分析を行い、現在フレームの正弦波成分を抽出する。本発明による正弦波分析部110は、従来技術での正弦波分析方式を利用して動作するので、説明を省略する。
モード指定部120は、抽出された正弦波成分それぞれに対し、新生モード、連続モード、その他トラックモードのうち、1つのモードを指定する。
言及した通り、新生モードは、現在の正弦波成分(パーシャル)が以前フレームの正弦波成分とは関係なく新たに生成されたことを示し、連続モードは、現在の正弦波成分が以前フレームの正弦波成分のうち一つから、唯一連続したことを示し、その他トラックモードは、現在の正弦波成分が以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示す。
正弦波成分コーディング部130は、指定されたモードによって抽出された正弦波成分をコーディングする。
図3は、本発明の一実施形態によるモード指定部の構成を示したブロック図である。
図3を参照すれば、本発明によるモード指定部120は、以前トラック成分決定部122、連続判断部124、新生モード指定部126及び連続モード/その他トラックモード指定部128を含むことが望ましい。
以前トラック成分決定部122は、以前フレームの正弦波成分のうちから現在モードを指定しようとする正弦波成分と最も近い正弦波成分を決定する。これを、第1以前トラック成分という。
正弦波成分が互いに近いか否かは、周波数の差で判断することが望ましい。本発明の一実施形態において、以前トラック成分決定部122は、以前フレームの正弦波成分のうち、モードを指定しようとする現在の正弦波成分と周波数の差が最も小さいものを、第1以前トラック成分として選択する。
連続判断部124は、第1以前トラック成分から現在のモードを指定しようとする正弦波成分が、連続しているか否かを判断する。
正弦波成分が連続しうるということは、相互間に関連性(correlation)を有するという意味である。この場合、関連性を有する情報を共有するので、1つの正弦波成分に係わる情報を利用し、他の正弦波成分を予測することが可能である。従って、データの効率的なコーディングが可能である。
正弦波成分が連続しているか否かは、連続しているか否かを判断しようとする正弦波成分間の周波数の差を利用したり、連続しているか否かを判断しようとする正弦波成分間の周波数の差及び振幅の比を利用でき、その他にも、従来技術での正弦波成分のトラッキング方式で使われる多くの基準が使われうる。
周波数の差を利用する場合、連続いかんを判断しようとする2正弦波成分の周波数の差が所定値以下であるか否かを判断し、所定値以下である場合、互いに関連性を有すると判断できる。例えば、周波数の差が0.4
ERB(equivalent rectangular bandwidth rate)以下である場合、連続しうると判断できるのである。
周波数の差及び振幅の比を利用する場合、連続いかんを判断しようとする2正弦波成分の周波数の差が所定値が以下であり、2正弦波成分の振幅の比が所定値以下である場合、互いに連続しうると判断できる。例えば、周波数の差が0.4 ERB以下であり、現在の正弦波成分の振幅値が以前の正弦波成分の振幅値の1/3倍以上並びに3倍以下であるならば、互いに連続しうると判断できるのである。
連続判断部124で、第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続しているか否かを判断した後、それによって、新生モード指定部126または連続モード/その他トラックモード指定部128で前記モードを指定しようとする正弦波成分に対してモードを指定する。
新生モード指定部126は、第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続していない場合、現在モードを指定しようとする正弦波成分に対して新生モードを指定する。
連続モード/その他トラックモード指定部128は、第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続しうる場合、現在モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する。
現在の正弦波モードに対し、連続モード、またはその他トラックモードを指定する時には、以前フレームの正弦波成分のうち、どれから連続するかを示す必要がある。このように、以前フレームの正弦波成分のうち、現在フレームの正弦波成分と関連している成分を、現在モードを指定しようとする正弦波成分に対する「以前トラック成分」という。
連続モード/その他トラックモード指定部128の動作については、図7を参照しつつ、さらに詳細に説明する。
図4は、本発明の一実施形態による正弦波成分コーディング部の構成を示したブロック図である。図4を参照するに、本発明による正弦波成分コーディング部130は、新生モードコーディング部132、連続モードコーディング部134及びその他トラックモードコーディング部136を含むことが望ましい。
新生モードコーディング部132は、新生モードに指定された正弦波成分をコーディングする。新生モードコーディング部132では、正弦波成分の周波数、位相、振幅の値をいずれもコーディングする。本発明による新生モードコーディング部132でのコーディング方式は、従来技術によって新生モードに指定された正弦波成分をコーディングする方式と同一なので、説明を省略する。
連続モードコーディング部134は、連続モードに指定された正弦波成分をコーディングする。連続モードコーディング部134では、現在の正弦波成分に対する以前トラック成分の周波数、位相、振幅の値を参照し、その差値だけをコーディングするので、コーディング後のビットの数が顕著に減ることになる。本発明による連続モードコーディング部134でのコーディング方式は、従来技術によって連続モードに指定された正弦波成分をコーディングする方式と同一なので、説明を省略する。
その他トラックモードコーディング部136は、その他トラックモードに指定された正弦波成分をコーディングする。その他トラックモードコーディング部136の動作については、図8を参照しつつ、さらに詳細に説明する。
図5及び図6は、本発明で提示するその他トラックモードが適用される場合と適用されていない場合とを比較するための図である。
図5は、従来技術による正弦波成分のトラッキングを示す。図5で、各点(●,○)は、正弦波成分を示す。横軸は時間を示し、点線で示したのは、それぞれのフレームに対応する。
最初のフレームで、正弦波成分10が以前フレームの正弦波成分とは関係なく新たに生成された。従って、正弦波成分10には、新生モードが指定される。これを●で示した。
2番目のフレームでは、正弦波成分11と正弦波成分12とが含まれている。正弦波成分11と12は、いずれも以前フレームの正弦波成分10から連続しうる範囲内に含まれていると仮定する。
1つの正弦波成分から連続モードに指定されうる正弦波成分は、一つのみである。従って、正弦波成分11と12とのうち、正弦波成分10にさらに近い正弦波成分である正弦波成分11に対し、連続モードが指定される。これを○で示した。
正弦波成分12は、連続モードに指定できないので、新生モード(●)が指定される。
3番目のフレームには、3つの正弦波成分13,14,15が含まれている。
正弦波成分13は、正弦波成分11を以前トラック成分として連続モード(○)が指定される。正弦波成分14は、正弦波成分12を以前トラック成分として連続モード(○)が指定される。
正弦波成分15は、以前フレームの正弦波成分のうち、連続可能であるものが存在しないので、新生モード(●)が指定される。
4番目のフレームには、4つの正弦波成分16ないし19が含まれている。
正弦波成分16には、新生モード(●)が指定される。正弦波成分17は、正弦波成分13を以前トラック成分として連続モード(○)が指定される。正弦波成分18は、正弦波成分14を以前トラック成分として連続モード(○)が指定される。正弦波成分19は、正弦波成分15を以前トラック成分として連続モード(○)が指定される。
5番目のフレームには、4つの正弦波成分20ないし23が含まれている。
正弦波成分20は、正弦波成分16を以前トラック成分として連続モード(○)が指定される。正弦波成分21は、正弦波成分17を以前トラック成分として連続モード(○)が指定される。正弦波成分22は、正弦波成分18を以前トラック成分として連続モード(○)が指定される。正弦波成分23は、正弦波成分19を以前トラック成分として連続モード(○)が指定される。
図5で、正弦波成分12と16とについて述べれば、それぞれ正弦波成分10と13とに連続しうる範囲にあるにもかかわらず、新生モードを指定することによって、コーディング後のデータのビット数が連続モードに指定する場合に比べて多い。従って、本発明では、このような正弦波成分に対し、その他トラックモードを指定することによって、新生モードに指定する場合より、コーディング後のビット数を減らせる。
図6は、本発明による場合の正弦波成分のトラッキングを示す。図6を参照するに、2番目のフレームは、正弦波成分11と12とを含む。正弦波成分11と12は、いずれも正弦波成分10から連続しうる。2つの周波数成分のうち、正弦波成分10にいずれが近いかを判断して連続モードを指定し、残りに対しては、その他トラックモードを指定する。
従って、周波数成分11に対しては、周波数成分10を以前トラックモードとして連続モードを指定する。
そして、周波数成分12に対しては、周波数成分11を以前トラックモードとし、その他トラックモードを指定する。これを、図6に◎で示した。
4番目のフレームには、正弦波成分16ないし19が含まれている。
図5の場合、以前フレームの周波数成分13に最も近い周波数成分17に連続モードが指定され、他の周波数成分16には、新生モードが指定された。
図6に図示されている本発明の場合には、周波数成分16に対し、以前フレームの周波数成分13を以前トラック成分として、その他トラックモード(◎)が指定される。
新生モードに指定される場合、当該周波数成分に対し、振幅(amplitude)、周波数(frequency)及び位相(phase)の成分をいずれもコーディングする。
一方、連続モードに指定された場合、当該周波数成分と以前トラック成分との差を利用し、DPCM(differential pulse code modulation)またはADPCM(adaptive differential pulse code modulation)を適用してコーディングする。
その他トラックモードに指定される場合、前記連続モードに指定された場合のように、DPCMまたはADPCMなどが適用可能である。
従って、連続モード、またはその他トラックモードに指定された場合、コーディング後のビット数は、減少することになる。
例えば、新生モードに指定される場合、それぞれの周波数成分に対し、15ないし47ビットが必要であるのに対し、連続モード、またはその他トラックモードに指定される場合、3ないし17ビットが必要になる。
図7は、本発明の一実施形態による正弦波オーディオコーディング方法の各段階を示したフローチャートである。
まず、正弦波分析部110で、入力オーディオ信号に対して正弦波分析を行い、正弦波成分を抽出する(S100)。
以前トラック成分決定部122は、以前フレームで、現在モードを指定しようとする正弦波成分と最も近い成分である第1以前トラック成分を決定する(S110)。
連続判断部124は、第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続しているか否かを判断する(S120)。
もし第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続するものではなければ、現在モードを指定しようとする正弦波成分に対し、新生モードを指定する(S130)。
図6で、正弦波成分15の例を考える。まず、3番目のフレーム(現在フレーム)から、正弦波成分13,14、15が抽出される(S100)。
正弦波成分13と14とに対してモードが指定されれば、正弦波成分15がモードを指定しようとする正弦波成分になる。
正弦波成分15に対し、以前フレーム(2番目のフレーム)から最も近い正弦波成分は、正弦波成分12である(S110)。
ところで、正弦波成分15は、正弦波成分12から連続しうる範囲にない(S120)。従って、正弦波成分15に対しては、新生モードが指定される(S130)。
第1以前トラック成分から現在モードを指定しようとする正弦波成分が連続しうる場合、連続モード、またはその他トラックモードが指定される。
連続モード/その他トラックモード指定部128は、現在フレームの正弦波成分のうち、第1以前トラック成分から続く正弦波成分がいくつあるかを決定し、続く成分が一つだけ存在するか否かを判断する(S140)。続く成分が一つだけ存在する場合、これは、従来技術での連続モードに該当するものである。従って、本発明においても、前記モードを指定しようとする正弦波成分に対し、第1以前トラック成分を以前トラック成分として連続モードを指定する(S150)。
もし続く成分が複数個存在する場合、現在モードを指定しようとする周波数成分と異なる周波数成分を比較し、第1以前トラック成分から最も近い正弦波成分に対してのみ第1以前トラック成分を以前トラックとして連続モードを指定する。
連続モード/その他トラックモード指定部128は、前記モードを指定しようとする正弦波成分が前記第1以前トラック成分から続く正弦波成分のうち、前記第1以前トラック成分に最も近いか否かを判断する(S160)。もし最も近いものであるならば、前記モードを指定しようとする正弦波成分に対し、第1以前トラック成分を以前トラックとして、連続モードを指定する(S150)。
もし最も近いものではないならば、以前フレームの正弦波成分のうち、現在フレームの正弦波成分に対する以前トラックとして指定されていないものを抽出し、それらのうち現在モードを指定しようとする正弦波成分に最も近いものを探す(S170)。これを、第2以前トラック成分とする。
連続モード/その他トラックモード指定部128は、現在モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分から連続しているか否かを判断する(S180)。連続していない場合ならば、現在モードを指定しようとする正弦波成分に対し、連続しうるのは、第1以前トラック成分一つのみであるから、第1以前トラック成分を以前トラック成分として、その他トラックモードを指定する(S190)。
第2以前トラック成分から連続しうる場合ならば、現在モードを指定しようとする正弦波成分に対しては、第1以前トラック成分及び第2以前トラック成分いずれも連続しうる。この場合、いずれを以前トラック成分とするのがさらに効率的にコーディングできるかを判断せねばならない。従って、第1以前トラック成分を以前トラックとして、その他トラックモードに指定した場合(Aの場合)と、第2以前トラック成分を以前トラックとして連続モードに指定した場合(Bの場合)とを比較せねばならない。
連続モード/その他トラックモード指定部128は、それぞれの場合に対するコーディング後のデータサイズを求める(S200)。まず、Aの場合について、コーディング後のデータサイズ値を求め、これを第1サイズとする。そして、Bの場合について、コーディング後のデータサイズ値を求め、これを第2サイズとする。
そして、第1サイズと第2サイズとを比較する(S210)。第1サイズが第2サイズより大きいか、あるいは同じである場合、Bの場合がさらに効率的なコーディングが可能であるので、第2以前トラック成分を以前トラックとして連続モードを指定する(S150)。
第1サイズが第2サイズより小さい場合、Aの場合がさらに効率的であるので、第1以前トラック成分を以前トラックとして、その他トラックモードに指定する(S190)。
図8は、本発明の一実施形態によるその他トラックモードでのコーディングされたデータのフォーマットを示した図である。図8を参照し、その他トラックモードコーディング部136の動作について述べる。
その他トラックモードコーディング部136では、正弦波成分に対して指定されたモードがその他トラックモードである場合、図8のようなデータを生成する。
s_cont 200は、以後のフレームの正弦波成分のうち、現在正弦波成分に連続する正弦波成分の個数を示す。s_contについては、図9を参照しつつ、さらに詳細に説明する。
s_prev_track_idx 210は、現在正弦波成分に対する以前トラック成分を示す。
s_delta_cont_freq_pha 220は、現在正弦波成分の周波数及び位相値と、以前トラック成分の周波数及び位相値との差を示す。
s_delta_cont_amp 230は、現在正弦波成分の振幅値と、以前トラック成分の振幅値との差を示す。
図9は、s_contの概念を説明するための図である。
フレーム1に含まれた周波数成分50について述べれば、以後のフレーム(フレーム2,3,4)の正弦波成分のうち、現在正弦波成分50に連続する正弦波成分として正弦波成分51,52,53がある。従って、正弦波成分50に対し、s_contの値は、3になる。
また、フレーム2に含まれた周波数成分51について述べれば、以後のフレーム(フレーム3,4)の正弦波成分のうち、現在正弦波成分51に連続する正弦波成分として正弦波成分52と53とがある。従って、正弦波成分51に対し、s_contの値は2となる。
本発明は、コンピュータで読み取り可能な記録媒体にコンピュータ(情報処理機能を有する装置をいずれも含む)で読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータによって読み取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(read-only memory)、RAM(random-access memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
本発明の実施形態を行うためのコンピュータは、プロセッサ及びプロセッサによって制御され、コンピュータが本発明の実施形態を行うことができるようにするコンピュータプログラムを含むメモリを含む。
たとえ前記説明が多様な実施形態に適用される本発明の新規の特徴に焦点を合わせて説明したにしても、本技術分野に熟達した当業者は、本発明の範囲を外れずにも、前記説明された装置及び方法の形態及び細部事項で、多様な削除、代替、及び変更が可能であるということを理解するであろう。従って、本発明の範囲は、前記説明によってよりも、特許請求の範囲によって定義される。特許請求の範囲の均等範囲のうちのあらゆる変形は、本発明の範囲に含まれる。

Claims (24)

  1. 入力オーディオ信号に対して正弦波分析を行い、現在フレームの正弦波成分を抽出する段階と、
    抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモードのうち、1つのモードを指定する段階と、
    指定されたモードによって、前記抽出された正弦波成分をコーディングする段階とを含むことを特徴とする正弦波オーディオコーディング方法。
  2. 前記モードを指定する段階は、
    前記以前フレームの正弦波成分のうち、前記モードを指定しようとする正弦波成分と最も近い正弦波成分である第1以前トラック成分を決定する段階と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断する段階と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対して新生モードを指定する段階と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、前記以前フレームの正弦波成分のうち一つを以前トラック成分として連続モード、またはその他トラックモードを指定する段階とを含むことを特徴とする請求項1に記載の正弦波オーディオコーディング方法。
  3. 前記第1以前トラック成分を決定する段階は、
    前記以前フレームの正弦波成分のうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを、前記第1以前トラック成分として選択する段階を含むことを特徴とする請求項2に記載の正弦波オーディオコーディング方法。
  4. 前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、
    前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が一つだけ存在する場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として連続モードを指定する段階を含むことを特徴とする請求項2に記載の正弦波オーディオコーディング方法。
  5. 前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、
    前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が複数個存在する場合、前記第1以前トラック成分から続く正弦波成分のうち、前記モードを指定しようとする正弦波成分が前記第1以前トラック成分に最も近いか否かを判断する段階と、
    前記モードを指定しようとする正弦波成分が、前記第1以前トラック成分に最も近いものである場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、連続モードを指定する段階とをさらに含むことを特徴とする請求項4に記載の正弦波オーディオコーディング方法。
  6. 前記モードを指定しようとする正弦波成分に対し、連続モード、またはその他トラックモードを指定する段階は、
    前記モードを指定しようとする正弦波成分が、前記第1正弦波成分に最も近いものではない場合、前記以前フレームの正弦波成分のうち、前記現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分に最も近い第2以前トラック成分を決定する段階と、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断する段階と、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定する段階と、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、連続モードに指定した場合と、その他トラックモードに指定した場合とのコーディング後のデータサイズを比較してモードを指定する段階とをさらに含むことを特徴とする請求項5に記載の正弦波オーディオコーディング方法。
  7. 前記モードを指定しようとする正弦波成分に対し、コーディング後のデータサイズを比較してモードを指定する段階は、
    前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラックとして、その他トラックモードに指定した場合のコーディング後のデータサイズの第1サイズを求める段階と、
    前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラックとして、連続モードに指定した場合のコーディング後のデータサイズの第2サイズを求める段階と、
    前記第1サイズが前記第2サイズより小さい場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定する段階と、
    前記第1サイズが前記第2サイズより大きいか、あるいは同じである場合、前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラック成分として連続モードを指定する段階とを含むことを特徴とする請求項6に記載の正弦波オーディオコーディング方法。
  8. 前記第2以前トラック成分を決定する段階は、
    前記以前フレームの正弦波成分のうち、現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを、前記第2以前トラック成分として選択する段階を含むことを特徴とする請求項6に記載の正弦波オーディオコーディング方法。
  9. 前記正弦波成分が互いに連続しているか否かは、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否かによって判断することを特徴とする請求項2に記載の正弦波オーディオコーディング方法。
  10. 前記正弦波成分が互いに連続しているか否かは、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否か、及び前記正弦波成分の振幅の比が所定値以下であるか否かによって判断することを特徴とする請求項2に記載の正弦波オーディオコーディング方法。
  11. 前記抽出された正弦波成分をコーディングする段階は、
    前記抽出された正弦波成分に対して指定されたモードがその他トラックモードである場合、
    以後のフレームの正弦波成分のうち、前記抽出された正弦波成分に連続する正弦波成分の個数を示す値と、
    前記抽出された正弦波成分の以前トラック成分と、
    前記抽出された正弦波成分の周波数及び位相値と、前記以前トラック成分の周波数及び位相値との差を示す値と、
    前記抽出された正弦波成分の振幅値と、前記以前トラック成分の振幅値との差を示す値をと含むデータを生成する段階を含むことを特徴とする請求項1に記載の正弦波オーディオコーディング方法。
  12. 入力オーディオ信号に対して正弦波分析を行い、現在フレームの正弦波成分を抽出する正弦波分析部と、
    抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモードのうち、1つのモードを指定するモード指定部と、
    指定されたモードによって、前記抽出された正弦波成分をコーディングする正弦波成分コーディング部とを含むことを特徴とする正弦波オーディオコーディング装置。
  13. 前記モード指定部は、
    前記以前フレームの正弦波成分のうち、前記モードを指定しようとする正弦波成分と最も近い正弦波成分である第1以前トラック成分を決定する以前トラック成分決定部と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断する連続判断部と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対して新生モードを指定する新生モード指定部と、
    前記第1以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、前記以前フレームの正弦波成分のうち一つを以前トラック成分として連続モード、またはその他トラックモードを指定する連続モード/その他トラックモード指定部とを含むことを特徴とする請求項12に記載の正弦波オーディオコーディング装置。
  14. 前記以前トラック成分決定部は、
    前記以前フレームの正弦波成分のうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを、前記第1以前トラック成分として選択することを特徴とする請求項13に記載の正弦波オーディオコーディング装置。
  15. 前記連続モード/その他トラックモード指定部は、
    前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が一つだけ存在する場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として連続モードを指定することを特徴とする請求項13に記載の正弦波オーディオコーディング装置。
  16. 前記連続モード/その他トラックモード指定部は、
    前記抽出された正弦波成分のうち、前記第1以前トラック成分から続く正弦波成分が複数個存在する場合、前記第1以前トラック成分から続く正弦波成分のうち、前記モードを指定しようとする正弦波成分が前記第1以前トラック成分に最も近いか否かを判断し、
    前記モードを指定しようとする正弦波成分が前記第1以前トラック成分に最も近いものである場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、連続モードを指定することを特徴とする請求項15に記載の正弦波オーディオコーディング装置。
  17. 前記連続モード/その他トラックモード指定部は、
    前記モードを指定しようとする正弦波成分が前記第1正弦波成分に最も近いものではない場合、
    前記以前フレームの正弦波成分のうち、前記現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分に最も近い第2以前トラック成分を探し、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しているか否かを判断し、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続していない場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定し、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、前記モードを指定しようとする正弦波成分に対し、連続モードに指定した場合と、その他トラックモードに指定した場合とのコーディング後のデータサイズを比較し、モードを指定することを特徴とする請求項16に記載の正弦波オーディオコーディング装置。
  18. 前記連続モード/その他トラックモード指定部は、
    前記第2以前トラック成分から前記モードを指定しようとする正弦波成分が連続しうる場合、
    前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラックとして、その他トラックモードに指定した場合のコーディング後のデータサイズの第1サイズを求め、
    前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラックとして、連続モードに指定した場合のコーディング後のデータサイズの第2サイズを求め、
    前記第1サイズが前記第2サイズより小さい場合、前記モードを指定しようとする正弦波成分に対し、前記第1以前トラック成分を以前トラック成分として、その他トラックモードを指定し、
    前記第1サイズが前記第2サイズより大きいか、あるいは同じである場合、前記モードを指定しようとする正弦波成分に対し、前記第2以前トラック成分を以前トラック成分として連続モードを指定することを特徴とする請求項17に記載の正弦波オーディオコーディング装置。
  19. 前記連続モード/その他トラックモード指定部は、
    前記以前フレームの正弦波成分のうち、現在フレームの正弦波成分に対する以前トラックとして指定されていないもののうち、前記モードを指定しようとする正弦波成分と周波数の差が最も小さいものを、前記第2以前トラック成分として選択することを特徴とする請求項17に記載の正弦波オーディオコーディング装置。
  20. 前記正弦波成分が互いに連続しているか否かは、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否かによって判断することを特徴とする請求項13に記載の正弦波オーディオコーディング装置。
  21. 前記正弦波成分が互いに連続しているか否かは、前記連続しているか否かを判断しようとする正弦波成分間の周波数の差が所定値以下であるか否か、及び前記正弦波成分の振幅の比が所定値以下であるか否かによって判断することを特徴とする請求項13に記載の正弦波オーディオコーディング装置。
  22. 前記正弦波成分コーディング部は、
    前記抽出された正弦波成分に対して指定されたモードがその他トラックモードである場合、
    以後のフレームの正弦波成分のうち、前記抽出された正弦波成分に連続する正弦波成分の個数を示す値と、
    前記抽出された正弦波成分の以前トラック成分と、
    前記抽出された正弦波成分の周波数及び位相値と、前記以前トラック成分の周波数及び位相値との差を示す値と、
    前記抽出された正弦波成分の振幅値と、前記以前トラック成分の振幅値との差を示す値とを含むデータを生成するその他トラックモードコーディング部を含むことを特徴とする請求項12に記載の正弦波オーディオコーディング装置。
  23. 入力オーディオ信号に対して正弦波分析を行い、現在フレームの正弦波成分を抽出する段階と、
    抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモードのうち、1つのモードを指定する段階と、
    指定されたモードによって、前記抽出された正弦波成分をコーディングする段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
  24. 正弦波オーディオコーディング方法を行うコンピュータにおいて、
    前記コンピュータは、プロセッサと、
    前記プロセッサーによって制御され、前記コンピュータのオペレーションを可能にするコンピュータプログラムを含むメモリと含み、
    前記オペレーションは、入力オーディオ信号に対して正弦波分析を行い、現在フレームの正弦波成分を抽出する段階と、
    抽出された正弦波成分それぞれに対し、以前フレームの正弦波成分とは関係なく新たに生成されたことを示す新生モード、前記以前フレームの正弦波成分のうち一つから、唯一連続したことを示す連続モード、前記以前フレームの正弦波成分のうち一つから連続した複数の正弦波成分のうち、一つであることを示すその他トラックモードのうち、1つのモードを指定する段階と、
    指定されたモードによって、前記抽出された正弦波成分をコーディングする段階とを含むことを特徴とするコンピュータ。
JP2009554436A 2007-03-16 2008-02-12 正弦波オーディオコーディング方法及び装置 Expired - Fee Related JP5134019B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020070026268A KR101080421B1 (ko) 2007-03-16 2007-03-16 정현파 오디오 코딩 방법 및 장치
KR10-2007-0026268 2007-03-16
PCT/KR2008/000800 WO2008114932A1 (en) 2007-03-16 2008-02-12 Method and apapratus for sinusoidal audio coding

Publications (2)

Publication Number Publication Date
JP2010521712A JP2010521712A (ja) 2010-06-24
JP5134019B2 true JP5134019B2 (ja) 2013-01-30

Family

ID=39766022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009554436A Expired - Fee Related JP5134019B2 (ja) 2007-03-16 2008-02-12 正弦波オーディオコーディング方法及び装置

Country Status (7)

Country Link
US (1) US8290770B2 (ja)
EP (1) EP2122620B1 (ja)
JP (1) JP5134019B2 (ja)
KR (1) KR101080421B1 (ja)
CN (1) CN101675476B (ja)
AT (1) ATE553473T1 (ja)
WO (1) WO2008114932A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101410229B1 (ko) * 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
EP2763137B1 (en) 2011-09-28 2016-09-14 LG Electronics Inc. Voice signal encoding method and voice signal decoding method

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU597573B2 (en) * 1985-03-18 1990-06-07 Massachusetts Institute Of Technology Acoustic waveform processing
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
WO2001099097A1 (en) 2000-06-20 2001-12-27 Koninklijke Philips Electronics N.V. Sinusoidal coding
CN1237507C (zh) * 2001-06-08 2006-01-18 皇家菲利浦电子有限公司 音频信号的编辑
JP2005506582A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーダにおける正弦波パラメータのトラッキング
US20050259822A1 (en) * 2002-07-08 2005-11-24 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
DE60304479T2 (de) * 2002-08-01 2006-12-14 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodekodierungsvorrichtung und audiodekodierungsverfahren auf der basis der spektralband duplikation
CN1689071A (zh) * 2002-10-17 2005-10-26 皇家飞利浦电子股份有限公司 使用相位更新进行正弦音频编码
AU2003274524A1 (en) 2002-11-27 2004-06-18 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
ES2298568T3 (es) * 2002-11-29 2008-05-16 Koninklijke Philips Electronics N.V. Descodificacion de audio.
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
CN1846253B (zh) * 2003-09-05 2010-06-16 皇家飞利浦电子股份有限公司 低比特率音频编码
CN1867969B (zh) * 2003-10-13 2010-06-16 皇家飞利浦电子股份有限公司 用于对音频信号进行编码或解码的方法和设备
GB0419346D0 (en) * 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation

Also Published As

Publication number Publication date
EP2122620A1 (en) 2009-11-25
EP2122620A4 (en) 2011-11-09
US20080294445A1 (en) 2008-11-27
EP2122620B1 (en) 2012-04-11
KR101080421B1 (ko) 2011-11-04
KR20080084469A (ko) 2008-09-19
ATE553473T1 (de) 2012-04-15
WO2008114932A1 (en) 2008-09-25
US8290770B2 (en) 2012-10-16
JP2010521712A (ja) 2010-06-24
CN101675476A (zh) 2010-03-17
CN101675476B (zh) 2012-05-09

Similar Documents

Publication Publication Date Title
JP2004513557A (ja) オーディオ信号のパラメトリック符号化方法及び装置
JP2005227782A (ja) 有声音および無声音の検出装置、並びにその方法
JP4359499B2 (ja) オーディオ信号の編集
JP5134019B2 (ja) 正弦波オーディオコーディング方法及び装置
US8024180B2 (en) Method and apparatus for encoding envelopes of harmonic signals and method and apparatus for decoding envelopes of harmonic signals
US8224659B2 (en) Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid
CN113454575A (zh) 利用音频信号模式的触觉信号产生方法及装置
US20080189120A1 (en) Method and apparatus for parametric encoding and parametric decoding
US20090024396A1 (en) Audio signal encoding method and apparatus
KR101261528B1 (ko) 복호화된 오디오 신호의 오류 은폐 방법 및 장치
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
US20130204413A1 (en) Audio Hyperlinking
Czyzewski et al. DSP techniques for determining “Wow” distortion
US9076444B2 (en) Method and apparatus for sinusoidal audio coding and method and apparatus for sinusoidal audio decoding
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
KR101536855B1 (ko) 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
KR101346771B1 (ko) 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치
JP2006508386A (ja) サウンドフレームを正弦波成分と残留ノイズとに分離する方法
KR101567665B1 (ko) 퍼스널 오디오 스튜디오 시스템
JP2011209412A (ja) 圧縮装置、圧縮方法、再生装置および再生方法
JPH10161700A (ja) 音声記録再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees