JP3609323B2 - 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 - Google Patents

楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3609323B2
JP3609323B2 JP2000134625A JP2000134625A JP3609323B2 JP 3609323 B2 JP3609323 B2 JP 3609323B2 JP 2000134625 A JP2000134625 A JP 2000134625A JP 2000134625 A JP2000134625 A JP 2000134625A JP 3609323 B2 JP3609323 B2 JP 3609323B2
Authority
JP
Japan
Prior art keywords
frequency
frequency band
group
signal sequence
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000134625A
Other languages
English (en)
Other versions
JP2001318684A (ja
Inventor
和明 千喜良
直樹 岩上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000134625A priority Critical patent/JP3609323B2/ja
Publication of JP2001318684A publication Critical patent/JP2001318684A/ja
Application granted granted Critical
Publication of JP3609323B2 publication Critical patent/JP3609323B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
音響信号をディジタル信号として、編集加工、早送り再生、任意グループ再生等符号化出力を復号化するに際し、各種データ処理を容易にし、かつ利用し易い形式として表現する符号化および復号化方法に係る。
【0002】
【従来の技術】
ディジタル化された音響信号を、聴感上のひずみを抑えつつ、その信号を表現するビット数を削減するのが従来の主な符号化技術であった。その代表的な例としてTwinVQ、AAC、ATRAC等が挙げられる。一方、このような周波数帯域の圧縮を目的とした符号化方式とは異なり、符号としての構造に価値を持たせるこを目的とした方式も普及している。これは音楽を構成する楽器音それぞれについて、ノートオン、ノートオフの時刻や音の高さ、強弱を符号として保持する方式であり、そのパラメータを変更することで容易に音楽の編集加工をすることができることが最大の利点である。具体的にはMIDI(Musical Instrument Digital Interface)やStructured Audioなどの方式が挙げられるが、これらの方式の欠点はディジタルおよびアナログ録音された音響信号から符号系列への変換が自動的にできないことであり、人が音を聴きとってパラメータヘと変換しているのが現状である。そこで一般の音響信号からMIDI形式の符号へと自動変換する技術も研究されているが、この技術では音響信号が復号されたときに原音に近い音を再生することが困難である。
【0003】
編集加工の一例として早送りが挙げられるが、音響信号を、上述のような構造化された符号に変換せず、直接編集し早送りを実現する技術が存在する。ここで早送りとは、基本的にピッチを変えることなくテンポ(速さ)のみを早くすることを意味するものである。この技術は質の高い早送りを行うことができるが、従来の符号化技術と組み合せて利用するためには一旦すべての音響信号を復号する必要があり、伝送経路を考慮に入れた場合、N倍の早送りをするためにはN倍の伝送容量が必要となる。また、この操作を実行する装置にかかる負荷は大きいことが問題となる。例えばTwinVQやCDによる方式ではフレームを飛ばして符号を伝送することによってこの問題を回避している。しかしながら早送りの質に問題があり、質と伝送効率を同時に満たす技術が求められている。
【0004】
【発明が解決しようとする課題】
従来技術のように音響信号を圧縮する場合、復号された音響信号をそのまま再生するだけでなく、再び編集加工を施したり、楽音検索の対象として利用する場合等が考えられる。従来の方式では、そういった操作をする前に音響信号を伝送し復号しなければならず、伝送効率や計算量の面で無駄が生じる。本発明は、符号の形式のまま編集加工が可能であり、符号化系列そのものが直接編集が可能なように構造化されており、意味をもつような符号化方法を提供することを課題としている。また上記のような構造化された符号系列を、入力音に近い音を再生できることを保証した上で、入力された音響信号から目的とする信号を自動的に生成する符号化および復号化方法およびこれら方法を実現する装置を提供することを課題とする。
【0005】
【課題を解決するための手段】
上記課題を達成するために、本発明においては入力音を伝送再生するためのデジタル信号系列を保持すると同時に、それに加えて編集加工その他各種処理を行うための情報を符号系列に付加する。この情報は入力音をオブジェクトという塊に分離するための情報であり、この塊を単位として編集加工を可能とする。またこの情報は、後の編集加工の度に同様な操作を繰り返さないで済むように、符号化を行う段階で生成しておき、状況に応じて、必要な情報と信号系列とを符号系列から抽出し伝送する構成としている。すなわち、本発明請求項1においては、入力された音響信号を予め定められた複数の周波数帯域に分割し、該分割された各周波数帯域毎に予め定められた複数の直交変換における窓長のうちの1つの窓長を選択して、該窓長による直交変換処理を実施し、該直交変換処理をする際に選択された窓長を前記各周波数帯域毎の変換情報とし、該直交変換処理により得られた信号系列を前記各周波数帯域毎の周波数領域における信号系列とする第1段階と、該第1段階で得られた前記各周波数帯域毎の周波数領域における信号系列の係数群を、予め定められた閾値との大小によって少なくとも2つのグループに分類して、次いで、該分類された各信号系列の各係数がどちらのグループに属するかを示す情報を前記各周波数帯域毎の各係数毎の周波数分離情報として得る第2の段階と、前記各周波数帯域毎の各グループの係数群を時間領域に変換し、前記複数の周波数帯域に分割された信号を再び単一の広帯域信号に復元する処理を行って、各グループ毎の時間領域信号系列を得て、次いで、前記得られた各グループ毎の時間領域信号系列を時間軸方向で信号を切り分けるための予め定められた規則による時刻毎に区切って、該区切りの時刻の情報を前記各グループ毎の時間分離情報とする第3の段階と、前記各周波数帯域の周波数領域における信号系列と、前記各周波数帯域毎の変換情報と、前記各周波数帯域毎の周波数分離情報と、前記各グループ毎の時間分離情報とを符号系列として出力する第4の段階とを有する楽音符号化方法について開示している。
【0006】
請求項2においては、請求項1に記載の楽音符号化方法において、前記第3の段階で用いる規則による時刻は、前記各グループ毎の時間領域の信号系列のエネルギーに急激な変化がある時刻、あるいは或る周波数成分が発生または消滅の何れかとなる時刻である楽音符号化方法について規定している。
【0007】
請求項3においては、請求項1に記載の楽音符号化方法により得られた符号系列が入力され、前記各周波数帯域毎の周波数分離情報を用いて、前記各周波数帯域毎の周波数領域における信号系列からそれぞれのグループに属する各周波数帯域毎の周波数領域における信号を抽出することにより前記各グループの各周波数帯域毎の周波数領域における信号系列を得て、前記各グループの各周波数帯域毎の周波数領域における信号系列に、前記各周波数帯域毎の変換情報により決まる直交変換における窓長による直交変換処理を実施して前記各グループの各周波数帯域毎の時間領域における信号系列を得て、前記各グループの各周波数帯域毎の時間領域における信号系列をそれぞれのグループ毎に合成して前記各グループの時間領域における信号系列を得て、前記各グループの時間領域における信号系列に対して、時間分離情報を用いて信号の一部削除を行い、残りの信号を順次時刻順につなぎ合わせて合成して復号音響信号を得る楽音復号化方法について規定している。
【0008】
請求項4においては、請求項1に記載の楽音符号化方法により得られた符号系列が入力され、前記各周波数帯域毎の周波数領域における信号系列を、前記各周波数帯域毎の変換情報により決まる直交変換における窓長による直交変換処理を実施して前記各周波数帯域毎の時間領域における信号系列を得て、前記各周波数帯域毎の時間領域における信号系列を合成して復号音響信号を得る楽音復号方法において、前記少なくとも2つのグループのうちの1つのグループのみを再生するように指定された場合に、前記1つの指定されたグループに属する周波数領域における係数群のみを前記各周波数帯域毎の周波数領域における信号系列として復号化を行う楽音復号化方法について規定している。
【0009】
請求項5においては、請求項1に記載の楽音符号化方法により得られた符号系列が入力され、前記各周波数帯域毎の周波数領域における信号系列と前記各周波数帯域毎の各係数毎の周波数分離情報とから、前記各周波数帯域について1つのグループに属する係数のみを抜き出して前記各周波数帯域毎の周波数領域における信号系列とし、前記抜き出した各周波数帯域毎の周波数領域における信号系列と、前記各周波数帯域毎の変換情報と、前記各周波数帯域毎の各係数毎の周波数分離情報と、前記各周波数帯域毎の各グループ毎の時間分離情報とを符号系列として出力する符号生成方法について規定している。
【0010】
請求項6においては、請求項1または請求項2に記載の楽音符号化方法を実行するプログラムを記録した記録媒体について規定している。
【0011】
請求項7においては、請求項3または請求項4に記載の楽音復号化方法を実行するプログラムを記録した記録媒体について規定している。
【0012】
請求項8においては、請求項5に記載の符号生成方法を実行するプログラムを記録した記録媒体について規定している。
【0015】
【発明の実施の形態】
以下に、この発明の実施の形態を図により説明する。
図1は、本発明における符号化方法の構成例を示したものである。また、図2は本発明における復号化方法の構成例を示したものである。まず図1の符号化方法について説明する。
エンコーダAは変換部分1、グルーピング(分離)部分2、符号化部分1gの3つのモジュールから構成される。変換部分1のモジュールでは入力信号のanalysis(分解)用としてQMF(Quadrature Mirror Filter)1kが用いられている。このQMFは入力信号の帯域を2等分してサブバンドに分解するもので、本実施の形態においては、これを2段組み合わせることによって、入力された音響信号1pをフレームごとに、先ず第1段階で高域/低域に分解し、更に第2段階で低高域/低低域に分解し、これにより高域1l、低高域1m、低低域1nの3帯域に分割し、それぞれの信号が後続のMDCT(Modified Descrete Cosine Transform;離散コサイン変換)により処理される。ここで、入力信号の処理単位をフレームと定義し、1フレーム=2048サンプルとする。なお、MDCTは時間領域の信号を或るサンプル数単位で周波数領域に変換する手法で、このサンプル数単位をこの変換における窓長と称している。
【0016】
高域では時間変化の大きい信号が主であるため、短い窓長で信号を切り出すMDCTが適切である場合が多いが、一般に低域では時間変化が比較的少ないためその逆となる。本方式では、MDCTを行う前にQMF 1kで帯域分割することにより、このような窓長の問題を解決し、よりフレキシブルな変換を行なう。これにより得られた上記の各帯域に対応する3つの信号系列1l、1m、1nそれぞれに対して、MDCT 1jの処理を行う。ここで、MDCT 1jの窓長は可変であり、時間的変化の大きい信号に対しては短い窓長を使用し、比較的定常で時間的変化の少ない信号に対しては長い窓長を使用する。これによってMDCT処理後の信号のエネルギー分布を少ない係数の範囲に集中させ、その結果効率的に信号を符号化することが可能となる。ここで係数とは、例えば時間周波数領域において時間軸方向と周波数軸方向とで囲まれたデータ系列の単位領域を示すもので、この単位領域の集合を窓関数と呼んでいる。具体的には、予め用意された複数個の窓関数(例えば本実施の形態における実験では32個、128個、512個の3種類用意した。)を利用して後に記述するグルーピングの操作までを行い、グループ間での音の偏りの度合いが高い窓長を選択する。この窓長選択基準となる音の偏りの度合いとは、あるグループに属する係数(上記単位領域)の数に対するそのグループに含まれる音響信号のエネルギの比で求められる。すなわち、
(グループ0のエネルギ)/(グループ0に属する係数の数)
が最大となる窓関数を選択する。ここで、グループ0は、絶対値の大きい係数群からなるグループである。このことは係数群の絶対値の大小によって複数のグループに分配し得ることを示している。窓長は、それぞれの周波数帯域で独立に決定する。図1に示すように、このようにして得られた各周波数領域ごとの信号系列1iは符号化部分となるモジュール1gに入力される。また、使用する窓長の情報を、変換情報1hとしてこの符号化部分のモジュール1gへと入力する。
【0017】
グルーピング部分のモジュール2においては、変換部分のモジュール1から入力された各周波数ごとの信号系列1iを、周波数領域と時間領域とにグルーピングし、幾つかの信号の塊とするためのグルーピング情報としてF-分類情報1aおよびT−分類情報1fを生成する。これら2つの情報1aおよび1fを符号化部分のモジュール1gヘと入力する。上記のグルーピングは、まず周波数領域で行い、つぎに時間領域で行う。周波数領域でのグルーピングは、図1においてF−Grouping 1dで示される部分で実行され、変換部分のモジュール1の出力した信号系列1iの係数をそれぞれの属するグループヘ振り分ける操作である。振り分けは、ある閾値を設定し、信号系列1の係数がその閾値よりも大きければ、foreground 1bのグループ、小さければbackground 1cのグループヘ、という方法で行う。具体的には、信号系列1i{、f、f、… fN−1(Nは1フレームあたりのサンプル数)から、グルーピング情報{g、g、g、… gN− }を得ることである。ただし、
【数1】
Figure 0003609323
とし、Cは閾値である。ここで、0と1はグループ個有の値であり、この構成例は、2つのグループを持つ時の例であり、foregroundを1、backgroundのグループを0としている。
【0018】
つぎに、得られた複数のグループの信号系列それぞれのグループ(1b、1c)に対して、図2で示されているのと同じIMDCT(Inverse MDCT)2cとsynthesis(合成)QMF 2dを適用し、周波数領域信号1bおよび1cを単一の時間信号に逆変換する。ここで、IMDCT 2cは前記DCTの逆変換を行うもので、周波数領域に変換されていたデータを時間領域のデータに復元するものであり、synthesisQMF 2dはサブバンドに分解されていた信号を再び単一の広帯域信号に復元する処理を行うものである。この逆変換処理を行うために時間領域でのグルーピングをT-grouping
1eにおいて行う。たとえば、周波数領域のforeground成分1bにおいて伝送される時間信号系列{b}は、周波数領域での系列
【数2】
Figure 0003609323
を時間領域に変換したものである。
【0019】
T−grouping 1eにおける時間領域でのグルーピングは、時間軸方向で信号を切り分ける操作であり、具体的には、時間信号のエネルギに急峻な変化のある時刻、あるいは「或る周波数成分」が発生および消滅した時刻を抽出することである。ここでのグルーピングは、人間が音を聴いたとき、音の区切りと判断する単位で音を塊とすることを目的としているので、上述の2種類の時刻をその判断基準として利用することによって、この目的に適した時刻を抽出する。この手順の一例を以下に示す。
【0020】
(操作1)
T−groupingの入力信号に対してFFT(Fast Fourier Transform)を行ない周波数領域でのピークを抽出する。このピークは聴感上で周波数弁別が可能となる最小の帯域幅に対応したバークスケールバンドごとに検索し、その条件は
1.(該当バークスケールバンド全体のエネルギー)/5以上のエネルギーを 有していること、
2.ひとつ隣りのバークスケールバンドの周波数成分よりも大きいエネルギー を有していること、
3.(ふたつ隣りの周波数成分)×1.4よりも大きいエネルギーを有してい ること、
の3条件であり、これらの条件を満すピークの周波数と周波数成分をすべて保持するものである。また、この操作1の入力信号として、各フレームごとの時間信号2048サンプルを、128サンプルずつ時間軸上を左にシフトさせ、シフト後の右側の空き領域には後続のサンプルを移動して埋め、これにより現在のフレームからFFTにより抽出されたピークそれぞれについて、ひとつ前の(操作1)で抽出されたピークと一致する周波数がないかどうか調べる。もし一致するピークがあるならば、周波数成分の増加分を変数diffに加える。こうして得られた変数diffが閾値であるOnsetレベルよりも大きければ、新たな音が出現したとして、この時刻を記録する。また、変数diffの値が閾値であるOffsetレベルよりも小さくなった場合は、音が消えたとしてこの時刻を記録する。時刻はフレームと、そのフレーム内での時間軸上での上記シフト量で表現するが、以下ではそれらを単純に{T}と表わしている。
【0021】
符号化部分のモジュール1gでは、上述の3つの情報、すなわち変換情報1h、周波数分離情報1aおよび時間分離情報1fに加えて、変換部分が出力する信号の周波数領域での系列1iを、ビットストリーム1oに変換し符号化された信号とする。この例では一切のデータ圧縮を行っていないが、ヘッダにフレーム総数Nやフレーム長、またデータの圧縮方式などを記録することによって、さらなる可逆圧縮を施すことも可能である。以上述べた処理のアルゴリズムにしたがったプログラムを予め記録媒体に記録しておき、この記録媒体を用いて上記一連の処理の制御を実行させることにより、以上の符号化処理を容易に行うことが出来る。
【0022】
ここで、図2に示す復号系における復号化方法について説明する。本発明による符号化法では、符号化の時点で付加情報を抽出しているので、それらを利用して幾つかの機能を実現することが可能である。この実施の形態では、従来通りの信号復元、早送り再生および任意のグループのみを再生の3例について説明する。従来通りのデコーダとしての機能は、信号の周波数領域での信号系列2eと変換情報2fとだけを利用し、逆変換をすることによって実現する。これは、図1における符号化方法との逆の手順である。グループ選択、編集加工部2bにおいて、2つの分離情報すなわちT−分類情報2gとF−分類情報2hを使用せず、周波数領域での信号系列2eを該当する3つの帯域成分2i、2j、2kにわけて3つのIMDCT2cにそれぞれ入力する。このIMDCT 2cではMDCTの逆の処理を行い、それらの結果をQMF(synthesis)2dで合成する。これによって、ほぼ原信号通りの信号を再生をすることが可能となる。
【0023】
また、周波数分離情報(F−分類情報)2hと時間分離情報(T−分類情報)2gとを利用して、音響信号の早送り再生を簡単に行うことができる。たとえば、1サンプル係数ごとに時間信号を破棄するといった方法で2倍の早送りをしようとすると、音の周波数成分に変化が生じ、自然な早送りとはならない。そこで、従来の早送りの技術では音の構成単位となっている楽器音の発生から消滅までを一つの塊として、その後半を削除して再生していた。この場合、主旋律となっている楽器音の発生と消滅に合わせて時間信号の削除を行っているため、背景に主旋律と異なるリズムの旋律がある場合に、それらが不自然な早送りになってしまう。しかし、本発明では主旋律と背景音を分離してから時間軸上の音響信号の一部削除を行い、残りの音響信号を順次つなぎ合わせることにより自然な早送りとなる。具体的な手法は以下のとおりである。
【0024】
まずグループ選択、編集加工部2bにおいて周波数分離情報(F−分類情報)2hをもとに、信号を複数の音響信号に分離する。それぞれの音響信号に対して、時間分離情報(T−分類情報)2gを用いて音響信号の一部削除を行い、残りの音響信号を順次つなぎ合わせる。たとえば、上述の音響信号の系列{b}に対して時刻の系列{T}が得られたとき、N倍速で再生するためには
【数3】
Figure 0003609323
の範囲を満足する時間の範囲kの中の音響信号を削除する。この削除した部分を詰め、残りの部分を順次つなぎ合わせることにより時間軸上の圧縮を行い、実質的に再生速度の向上、すなわち早送り、を行う。伝送系を含めて考えた場合、破棄の操作は伝送前に実行しておくことが効率的である。
【0025】
ここで、実際に伝送される係数は時間領域信号系列{b}ではなく、周波数領域系列{a}なので周波数領域系列{a}において上述の(数3)式におけるkに相当する範囲(今後これをmとする)を削除して伝送する。換言すれば、上記(数3)式における時間領域(周波数分解能は有していない。)での範囲kはQMFを用いたMDCTで関係付けられている。時間周波数領域における、このkに等価な範囲をmとして、このmに相当する範囲を破棄して伝送することである。この{a}は周波数領域での信号系列を示すものであるが、MDCTの窓長と同じ時間分解能を持つので、時刻の系列{T}を求めるとき、その値を該当フレームにおける時間分解能の単位で決定すれば周波数領域における時間長mが求められる。伝送後は従来通りのデコードを行うが、上記削除の処理により無音状態となった時間を詰めて再生する。
【0026】
次に、任意のグループのみ再生する方法について説明する。たとえばforgroundのグループを再生する場合、必要となる情報はグルーピング情報{g}とg=1となるときの信号fだけである。伝送系を含めて本発明を実施する場合には無駄な伝送を避けるために、この情報だけを伝送する。上記の2つの情報から上述の周波数領域での信号系列{a}を生成し通常の復号手順を適用することで、foregroundのグループ(例えば主旋律)を再生する。以上述べた再生過程においても、上記復号の処理アルゴリズムにしたがったプログラムを予め記録媒体に記録しておき、この記録媒体を使用して上記の復号化処理を行うことにより、上記の復号・再生処理を容易に実行することが出来る。
【0027】
【発明の効果】
本発明によれば、入力された音響信号から編集加工等が容易な符号系列を生成することができ、符号系列から原音に近い音を再現することができる。
【0028】
また、構造化された符号形態を利用することによって、音響信号の早送り再生や、データ削減された音響信号の一部を再生することが容易にできるだけでなく、伝送経路を含めての利用を考慮した場合、効率的な伝送を行うことができる。
【図面の簡単な説明】
【図1】本発明における符号化処理系の構成図。
【図2】本発明における復号化処理系の構成図。
【符号の説明】
1 : 変換部分 2 : グルーピング部
1a : F−分類情報 1b : foreground
1c : background 1d : F−Grouping
1e : T−Grouping 1g : 符号化モジュール
1h : 変換情報 1i : 周波数領域での信号系列
1j : MDCT 1k : QMF(analysis)
1p : 入力音響信号 1o : 符号化出力ビットストリーム
2a : ビットストリーム分解 2b : グループ選択、編集加工
2c : IMDCT 2d : QMF(synthesis)
2e : 周波数領域での信号系列 2f : MDCT変換情報
2g : T−分類情報 2h : F−分類情報
2o : 複合化出力信号 diff : 変数

Claims (8)

  1. 入力された音響信号を予め定められた複数の周波数帯域に分割し、
    該分割された各周波数帯域毎に予め定められた複数の直交変換における窓長のうちの1つの窓長を選択して、
    該窓長による直交変換処理を実施し、
    該直交変換処理をする際に選択された窓長を前記各周波数帯域毎の変換情報とし、
    該直交変換処理により得られた信号系列を前記各周波数帯域毎の周波数領域における信号系列とする第1段階と、
    該第1段階で得られた前記各周波数帯域毎の周波数領域における信号系列の係数群を、予め定められた閾値との大小によって少なくとも2つのグループに分類して、
    次いで、該分類された各信号系列の各係数がどちらのグループに属するかを示す情報を前記各周波数帯域毎の各係数毎の周波数分離情報として得る第2の段階と、
    前記各周波数帯域毎の各グループの係数群を時間領域に変換し、前記複数の周波数帯域に分割された信号を再び単一の広帯域信号に復元する処理を行って、各グループ毎の時間領域信号系列を得て、
    次いで、前記得られた各グループ毎の時間領域信号系列を時間軸方向で信号を切り分けるための予め定められた規則による時刻毎に区切って、該区切りの時刻の情報を前記各グループ毎の時間分離情報とする第3の段階と、
    前記各周波数帯域の周波数領域における信号系列と、前記各周波数帯域毎の変換情報と、前記各周波数帯域毎の周波数分離情報と、前記各グループ毎の時間分離情報とを符号系列として出力する第4の段階とを有する
    ことを特徴とする楽音符号化方法。
  2. 請求項1に記載の楽音符号化方法において、
    前記第3の段階で用いる規則による時刻は、前記各グループ毎の時間領域の信号系列のエネルギーに急激な変化がある時刻、あるいは或る周波数成分が発生または消滅の何れかとなる時刻である
    ことを特徴とする楽音符号化方法。
  3. 請求項1に記載の楽音符号化方法により得られた符号系列が入力され、
    前記各周波数帯域毎の周波数分離情報を用いて、前記各周波数帯域毎の周波数領域における信号系列からそれぞれのグループに属する各周波数帯域毎の周波数領域における信号を抽出することにより前記各グループの各周波数帯域毎の周波数領域における信号系列を得て、
    前記各グループの各周波数帯域毎の周波数領域における信号系列に、前記各周波数帯域毎の変換情報により決まる直交変換における窓長による直交変換処理を実施して前記各グループの各周波数帯域毎の時間領域における信号系列を得て、
    前記各グループの各周波数帯域毎の時間領域における信号系列をそれぞれのグループ毎に合成して前記各グループの時間領域における信号系列を得て、
    前記各グループの時間領域における信号系列に対して、時間分離情報を用いて信号の一部削除を行い、残りの信号を順次時刻順につなぎ合わせて合成して復号音響信号を得ること
    を特徴とする楽音復号化方法。
  4. 請求項1に記載の楽音符号化方法により得られた符号系列が入力され、
    前記各周波数帯域毎の周波数領域における信号系列を、前記各周波数帯域毎の変換情報により決まる直交変換における窓長による直交変換処理を実施して前記各周波数帯域毎の時間領域における信号系列を得て、
    前記各周波数帯域毎の時間領域における信号系列を合成して復号音響信号を得る楽音復 号方法において、
    前記少なくとも2つのグループのうちの1つのグループのみを再生するように指定された場合に、
    前記1つの指定されたグループに属する周波数領域における係数群のみを前記各周波数帯域毎の周波数領域における信号系列として復号化を行う
    ことを特徴とする楽音復号化方法。
  5. 請求項1に記載の楽音符号化方法により得られた符号系列が入力され、
    前記各周波数帯域毎の周波数領域における信号系列と前記各周波数帯域毎の各係数毎の周波数分離情報とから、前記各周波数帯域について1つのグループに属する係数のみを抜き出して前記各周波数帯域毎の周波数領域における信号系列とし、
    前記抜き出した各周波数帯域毎の周波数領域における信号系列と、前記各周波数帯域毎の変換情報と、前記各周波数帯域毎の各係数毎の周波数分離情報と、前記各周波数帯域毎の各グループ毎の時間分離情報とを符号系列として出力する
    ことを特徴とする符号生成方法。
  6. 請求項1または請求項2に記載の楽音符号化方法を実行するプログラムを記録したことを特徴とする記録媒体。
  7. 請求項3または請求項4に記載の楽音復号化方法を実行するプログラムを記録したことを特徴とする記録媒体。
  8. 請求項5に記載の符号生成方法を実行するプログラムを記録したことを特徴とする記録媒体。
JP2000134625A 2000-05-08 2000-05-08 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 Expired - Fee Related JP3609323B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000134625A JP3609323B2 (ja) 2000-05-08 2000-05-08 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000134625A JP3609323B2 (ja) 2000-05-08 2000-05-08 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001318684A JP2001318684A (ja) 2001-11-16
JP3609323B2 true JP3609323B2 (ja) 2005-01-12

Family

ID=18642872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000134625A Expired - Fee Related JP3609323B2 (ja) 2000-05-08 2000-05-08 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3609323B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908117B1 (ko) 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8818818B2 (en) 2006-07-07 2014-08-26 Nec Corporation Audio encoding device, method, and program which controls the number of time groups in a frame using three successive time group energies
KR100868475B1 (ko) * 2007-02-16 2008-11-12 한국전자통신연구원 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성방법

Also Published As

Publication number Publication date
JP2001318684A (ja) 2001-11-16

Similar Documents

Publication Publication Date Title
AU2009226654B2 (en) Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CN1197254C (zh) 编码无损压缩方法及其装置和译码无损压缩方法及其装置
JP2976860B2 (ja) 再生装置
JP2007017908A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
AU2006332046A1 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7781665B2 (en) Sound synthesis
JP5232791B2 (ja) ミックス信号処理装置及びその方法
JP3609323B2 (ja) 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
JP2002341896A (ja) ディジタルオーディオ圧縮回路および伸長回路
JP3923783B2 (ja) 符号化装置及び復号化装置
JPH0993135A (ja) 発声音データの符号化装置及び復号化装置
KR20010111630A (ko) 시간/피치 변환 장치 및 시간/피치 변환 방법
JP4317355B2 (ja) 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
JP4508599B2 (ja) データ圧縮方法
JP2009284212A (ja) デジタル音声信号解析方法、その装置、及び映像音声記録装置
JP2002236499A (ja) 音楽信号圧縮装置、音楽信号圧縮伸張装置及び前処理制御装置
JP2005114813A (ja) オーディオ信号再生装置及び再生方法
JP4403721B2 (ja) ディジタルオーディオデコーダ
Motta et al. An Audio Compression Method Based on Wavelet Packet Decomposition, Ordering, and Polynomial Approximation of Expressive Coefficients
JP4159927B2 (ja) ディジタルオーディオデコーダ
KR100264389B1 (ko) 키변환 기능을 갖는 컴퓨터 음악반주기
JP3510493B2 (ja) 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
WO2002005433A1 (en) A method, a device and a system for compressing a musical and voice signal

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041013

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees