JP5609280B2 - 音響信号の符号化方法および装置 - Google Patents
音響信号の符号化方法および装置 Download PDFInfo
- Publication number
- JP5609280B2 JP5609280B2 JP2010130629A JP2010130629A JP5609280B2 JP 5609280 B2 JP5609280 B2 JP 5609280B2 JP 2010130629 A JP2010130629 A JP 2010130629A JP 2010130629 A JP2010130629 A JP 2010130629A JP 5609280 B2 JP5609280 B2 JP 5609280B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequencies
- frequency
- unit interval
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
まず、最初に、本発明の基本概念を、特許文献5に代表される従来技術と比較して説明する。図1は、従来技術と比較した本発明の基本概念を示す図である。従来の場合も本発明も、後述するように、サンプリングにより得られた所定数のサンプルを単位区間として設定し、単位区間ごとに周波数解析を行う点は同一である。図1(a)に示すように、特許文献5に開示されている従来技術では、ゼロ交差点を特定し、そのゼロ交差点を利用して単位区間の設定位置を可変とする。図1(a)では例として3つの単位区間が設定されているが、これらの開始位置(左端)の間隔は均一ではない。そして、設定された各単位区間に対して、離散フーリエ変換及び一般化調和解析の両方を実行して解析結果を得る。
x´(j・Q+k)=(1−w)・x(j)+w・x(j+1)
A(p,n,m)=(1/T(n))・Σi=0,T(n)-1x(p,i) sin(2πf(n,m)(i+pW)/fs)
B(p,n,m)=(1/T(n))・Σi=0,T(n)-1x(p,i) cos (2πf(n,m)(i+pW)/fs)
E1(p,n,m)={A(p,n,m)}2+{B(p,n,m)}2
A(p,n,m)=A(p−1,n,m) −(1/T(n))・Σi=0,W-1x(p−1,i) sin(2πf(n,m)(i+(p−1)W)/fs)+(1/T(n))・Σi=T(n)-W,T(n)-1x(p,i) sin(2πf(n,m)(i+pW)/fs)
B(p,n,m)=B(p−1,n,m) −(1/T(n))・Σi=0,W-1x(p−1,i) cos (2πf(n,m)(i+(p−1)W)/fs)+(1/T(n))・Σi=T(n)-W,T(n)-1x(p,i) cos (2πf(n,m)(i+pW)/fs)
E1(p,n,m)={A(p,n,m)}2+{B(p,n,m)}2
dE(p−1,p)=(100/N)・Σn=0,N-1{|E1(p,n)−E1(p−1,n)|/(E1(p,n)+E1(p−1,n))}
A(p,nmax,mmax)=(1/T(nmax))・Σi=0,T(nmax)-1x(p,i)・ sin(2πf(nmax,mmax)i/fs)
B(p,nmax,mmax)=(1/T(nmax))・Σi=0,T(nmax)-1x(p,i) cos (2πf(nmax,mmax)i/fs)
E2(q,nmax)={A(p,nmax,mmax)}2+{B(p,nmax,mmax)}2
x(p,i)←x(p,i)−A(p,nmax,mmax) ・sin(2πf(nmax,mmax)i/fs)−B(p,nmax,mmax) ・cos (2πf(nmax,mmax)i/fs)
尚、単位区間長Tが、調和信号の1/4周期未満に相当する場合(単位区間の最終サンプルが分割区間K1に属する場合)も起こり得るが、これをもとに時間軸延長を行って相関計算を行っても、ソースとなる情報量が少なすぎて、有意な相関値が得られないため、単位区間長Tが、調和信号の1/4周期未満に相当する周波数に対しては解析対象としないものとする。
E1(P(q+1),n)−E1(P(q+1)−1,n)<Ldif
E1(P(q+1)−1,n)>LminかつE1(P(q+1),n)>Lmin
|S(P(q+1)−1,n)−S(P(q+1),n)|<Ndif
E1(P(q+1),n−1)−E1(P(q+1)−1,n)<Ldif
E1(P(q+1)−1,n)>LminかつE1(P(q+1),n−1)>Lmin
|S(P(q+1)−1,n)−S(P(q+1),n−1)−M|<Ndif
E1(P(q+1),n+1)−E1(P(q+1)−1,n)<Ldif
E1(P(q+1)−1,n)>LminかつE1(P(q+1),n+1)>Lmin
|S(P(q+1)−1,n)−S(P(q+1),n+1)+M|<Ndif
Claims (16)
- 所定のサンプリング周波数でデジタル化されたJ個の時系列のサンプル列として与えられる音響信号を符号化するための符号化方法であって、
前記サンプル列に対して、所定数T(T<J)個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に所定数W(W<T)個のサンプルを重複させながら設定する区間設定段階と、
個々の単位区間ごとに、解析対象とする少なくともN種類の各周波数f(n)について、周波数変換を行うことにより、単位区間pに対して、前記N種類の周波数に対応した第1のスペクトル強度E1(p,n)を算出する第1のスペクトル算出段階と、
前記単位区間pに対して直前に位置する単位区間p−1における第1のスペクトル強度E1(p−1,n)との対応する周波数ごとの変化に基づく評価値が、所定のしきい値より大きい場合に限り、当該単位区間pをq(q≦p)番目の選出単位区間qとして選出し、解析対象とする少なくともN種類の各周波数f(n)について、前記第1のスペクトル算出段階における周波数変換に比較して高精度な周波数変換を行うことにより、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出する第2のスペクトル算出段階と、
前記選出単位区間qの先頭時刻と直後の選出単位区間q+1の先頭時刻との時間差と、前記選出単位区間qの第2のスペクトル強度E2(q,n)に基づいて、所定の形式の符号コードを生成する符号化段階と、
を有することを特徴とする音響信号の符号化方法。 - 請求項1において、
前記第1のスペクトル算出段階および第2のスペクトル算出段階はN種類の各周波数f(n)に対して隣接する周波数を超えない範囲で所定のM種類の微細周波数f(n,m)を設定し、前記第1のスペクトル強度E1(p,n)および第2のスペクトル強度E2(q,n)として、前記M種類の微細周波数の中で最も大きい強度を示す微細周波数に対応する強度値を算出することを特徴とする音響信号の符号化方法。 - 請求項1において、
前記符号化段階は、隣接する2つの選出単位区間qと選出単位区間q+1に対して、前記選出単位区間qがp番目の単位区間pであった場合に、P(q)=pと定義し、前記選出単位区間q+1における周波数f(n)、f(n−1)、f(n+1)に対応する前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれかと、当該選出単位区間q+1の直前に位置する単位区間P(q+1)−1における周波数f(n)に対応する前記第1のスペクトル強度E1(P(q+1)−1,n)との差が所定のしきい値Ldif未満で、かつ前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれかおよび前記第1のスペクトル強度E1(P(q+1)−1,n)が所定のしきい値Lminより大きい場合、前記選出単位区間qと選出単位区間q+1を連結し、前記符号コードの基礎となる時間差として、前記選出単位区間qに定義された選出単位区間qの先頭時刻と、選出単位区間q+1の直後の選出単位区間q+2の先頭時刻との時間差を用いることを特徴とする音響信号の符号化方法。 - 請求項3において、
前記第1のスペクトル算出段階および第2のスペクトル算出段階はN種類の各周波数f(n)に対して隣接する周波数を超えない範囲で所定のM種類の微細周波数f(n,m)を設定し、前記第1のスペクトル強度E1(p,n)および第2のスペクトル強度E2(q,n)として、前記M種類の微細周波数の中で最も大きい強度を示す微細周波数に対応する強度値を算出するものであり、
前記符号化段階は、前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれか決定する微細周波数と、前記第1のスペクトル強度E1(P(q+1)−1,n)を決定する微細周波数との差が所定のしきい値Ndif未満という条件をさらに満たした場合に限り、前記選出単位区間qと選出単位区間q+1を連結することを特徴とする音響信号の符号化方法。 - 請求項1において、
前記第1のスペクトル算出段階は、前記単位区間の区間信号の構成要素となるべきN種類の要素信号を、各々当該周波数f(n)の周期の整数倍に対応し、前記Tに最も近いT(n)個のサンプルとして準備する要素信号準備段階と、
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記単位区間pのT(n)個のサンプルで構成される区間信号との相関演算を行うことにより、第1のスペクトル強度E1(p,n)を算出する相関演算段階により構成され、
前記第2のスペクトル算出段階は、
前記要素信号準備段階と、
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記選出単位区間qのT(n)個のサンプルで構成される区間信号との相関演算を行い、相関値が最も高い周波数f(nmax)に対応する要素信号を調和信号として選出する調和信号選出段階と、
前記選出された調和信号と当該調和信号について得られた相関値との積で与えられるT(nmax)個のサンプルを含有信号とし、当該含有信号を前記区間信号から減じることにより、T(nmax)個のサンプルで構成される差分信号を求める差分信号演算段階と、を有し、
前記T(nmax)個のサンプルを反映させ更新されたT(n)個のサンプルを新たな区間信号として、前記調和信号選出段階および差分信号演算段階を実行して新たな含有信号および差分信号を得る処理を繰り返し行うことによりN個の含有信号を求め、求められた含有信号の相関値に基づいて、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出することを特徴とする音響信号の符号化方法。 - 請求項5において、
前記相関演算段階は、
直前に位置する単位区間p−1における各周波数f(n)に対応する直前相関演算結果に対し、前記単位区間p−1における先頭Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果より減算するとともに、前記単位区間pにおけるT(n)サンプル中の最後尾Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果に加算することにより、前記単位区間pにおける各周波数f(n)に対応する相関演算結果を取得し、当該相関演算結果に基づいて前記第1のスペクトル強度E1(p,n)を算出することを特徴とする音響信号の符号化方法。 - 請求項1から請求項6のいずれかにおいて、
前記符号化段階は、前記符号コードとしてMIDI形式を用いて符号化を行い、前記符号コードの前記周波数の情報としてノートナンバーを用い、前記第2のスペクトル強度としてベロシティを用い、前記選出単位区間qの先頭時刻と直後の選出単位区間q+1の先頭時刻との時間差を各々直前のMIDIイベントからの相対時刻であるデルタタイム1とデルタタイム2で定義し、これらの定義されたノートナンバー、ベロシティ、デルタタイム1を基にMIDIのノートオンイベントを作成するとともに、ノートナンバー、デルタタイム2を基にMIDIのノートオフイベントを作成するようにしていることを特徴とする音響信号の符号化方法。 - 所定のサンプリング周波数でデジタル化されたJ個の時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T(T<J)個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に所定数W(W<T)個のサンプルを重複させながら設定する区間設定手段と、
個々の単位区間ごとに、解析対象とする少なくともN種類の各周波数f(n)について、周波数変換を行うことにより、単位区間pに対して、前記N種類の周波数に対応した第1のスペクトル強度E1(p,n)を算出する第1のスペクトル算出手段と、
前記単位区間pに対して直前に位置する単位区間p−1における第1のスペクトル強度E1(p−1,n)との対応する周波数ごとの変化に基づく評価値が、所定のしきい値より大きい場合に限り、当該単位区間pをq(q≦p)番目の選出単位区間qとして選出し、解析対象とする少なくともN種類の各周波数f(n)について、前記第1のスペクトル算出段階における周波数変換に比較して高精度な周波数変換を行うことにより、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出する第2のスペクトル算出手段と、
前記選出単位区間qの先頭時刻と直後の選出単位区間q+1の先頭時刻との時間差と、前記選出単位区間qの第2のスペクトル強度E2(q,n)に基づいて、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置。 - 請求項8において、
前記第1のスペクトル算出手段および第2のスペクトル算出手段はN種類の各周波数f(n)に対して隣接する周波数を超えない範囲で所定のM種類の微細周波数f(n,m)を設定し、前記第1のスペクトル強度E1(p,n)および第2のスペクトル強度E2(q,n)として、前記M種類の微細周波数の中で最も大きい強度を示す微細周波数に対応する強度値を算出することを特徴とする音響信号の符号化装置。 - 請求項8において、
前記符号化手段は、隣接する2つの選出単位区間qと選出単位区間q+1に対して、前記選出単位区間qがp番目の単位区間pであった場合に、P(q)=pと定義し、前記選出単位区間q+1における周波数f(n)、f(n−1)、f(n+1)に対応する前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれかと、当該選出単位区間q+1の直前に位置する単位区間P(q+1)−1における周波数f(n)に対応する前記第1のスペクトル強度E1(P(q+1)−1,n)との差が所定のしきい値Ldif未満で、かつ前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれかおよび前記第1のスペクトル強度E1(P(q+1)−1,n)が所定のしきい値Lminより大きい場合、前記選出単位区間qと選出単位区間q+1を連結し、前記符号コードの基礎となる時間差として、前記選出単位区間qに定義された選出単位区間qの先頭時刻と、選出単位区間q+1の直後の選出単位区間q+2の先頭時刻との時間差を用いることを特徴とする音響信号の符号化装置。 - 請求項10において、
前記第1のスペクトル算出手段および第2のスペクトル算出手段はN種類の各周波数f(n)に対して隣接する周波数を超えない範囲で所定のM種類の微細周波数f(n,m)を設定し、前記第1のスペクトル強度E1(p,n)および第2のスペクトル強度E2(q,n)として、前記M種類の微細周波数の中で最も大きい強度を示す微細周波数に対応する強度値を算出するものであり、
前記符号化手段は、前記第1のスペクトル強度E1(P(q+1),n)、E1(P(q+1),n−1)、E1(P(q+1),n+1)のいずれか決定する微細周波数と、前記第1のスペクトル強度E1(P(q+1)−1,n)を決定する微細周波数との差が所定のしきい値Ndif未満という条件をさらに満たした場合に限り、前記選出単位区間qと選出単位区間q+1を連結することを特徴とする音響信号の符号化装置。 - 請求項8において、
前記第1のスペクトル算出手段は、前記単位区間の区間信号の構成要素となるべきN種類の要素信号を、各々当該周波数f(n)の周期の整数倍に対応し、前記Tに最も近いT(n)個のサンプルとして準備する要素信号準備手段と、
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記単位区間pのT(n)個のサンプルで構成される区間信号との相関演算を行うことにより、第1のスペクトル強度E1(p,n)を算出する相関演算手段により構成され、
前記第2のスペクトル算出手段は、
前記要素信号準備手段と、
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記選出単位区間qのT(n)個のサンプルで構成される区間信号との相関演算を行い、相関値が最も高い周波数f(nmax)に対応する要素信号を調和信号として選出する調和信号選出手段と、
前記選出された調和信号と当該調和信号について得られた相関値との積で与えられるT(nmax)個のサンプルを含有信号とし、当該含有信号を前記区間信号から減じることにより、T(nmax)個のサンプルで構成される差分信号を求める差分信号演算手段と、を有し、
前記T(nmax)個のサンプルを反映させ更新されたT(n)個のサンプルを新たな区間信号として、前記調和信号選出手段および差分信号演算手段による処理を実行して新たな含有信号および差分信号を得る処理を繰り返し行うことによりN個の含有信号を求め、求められた含有信号の相関値に基づいて、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出することを特徴とする音響信号の符号化装置。 - 請求項12において、
前記相関演算手段は、
直前に位置する単位区間p−1における各周波数f(n)に対応する直前相関演算結果に対し、前記単位区間p−1における先頭Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果より減算するとともに、前記単位区間pにおけるT(n)サンプル中の最後尾Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果に加算することにより、前記単位区間pにおける各周波数f(n)に対応する相関演算結果を取得し、当該相関演算結果に基づいて前記第1のスペクトル強度E1(p,n)を算出することを特徴とする音響信号の符号化装置。 - 請求項8から請求項13のいずれかにおいて、
前記符号化手段は、前記符号コードとしてMIDI形式を用いて符号化を行い、前記符号コードの前記周波数の情報としてノートナンバーを用い、前記第2のスペクトル強度としてベロシティを用い、前記選出単位区間qの先頭時刻と直後の選出単位区間q+1の先頭時刻との時間差を各々直前のMIDIイベントからの相対時刻であるデルタタイム1とデルタタイム2で定義し、これらの定義されたノートナンバー、ベロシティ、デルタタイム1を基にMIDIのノートオンイベントを作成するとともに、ノートナンバー、デルタタイム2を基にMIDIのノートオフイベントを作成するようにしていることを特徴とする音響信号の符号化装置。 - 請求項1から請求項7のいずれかに記載の音響信号の符号化方法をコンピュータに実行させるためのプログラム。
- 請求項8から請求項14のいずれかに記載の音響信号の符号化装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010130629A JP5609280B2 (ja) | 2010-06-08 | 2010-06-08 | 音響信号の符号化方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010130629A JP5609280B2 (ja) | 2010-06-08 | 2010-06-08 | 音響信号の符号化方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011257510A JP2011257510A (ja) | 2011-12-22 |
JP5609280B2 true JP5609280B2 (ja) | 2014-10-22 |
Family
ID=45473765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010130629A Expired - Fee Related JP5609280B2 (ja) | 2010-06-08 | 2010-06-08 | 音響信号の符号化方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5609280B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02176796A (ja) * | 1988-12-28 | 1990-07-09 | Nec Corp | 音声認識装置 |
JP2003122379A (ja) * | 2001-10-19 | 2003-04-25 | Dainippon Printing Co Ltd | 周波数解析方法および音響信号の符号化方法 |
JP4061070B2 (ja) * | 2002-01-21 | 2008-03-12 | 大日本印刷株式会社 | 周波数解析方法および音響信号の符号化方法 |
-
2010
- 2010-06-08 JP JP2010130629A patent/JP5609280B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011257510A (ja) | 2011-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022095656A1 (zh) | 一种音频处理方法、装置、设备及介质 | |
US20070289432A1 (en) | Creating music via concatenative synthesis | |
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
EP1840871B1 (en) | Audio waveform processing device, method, and program | |
WO2020171033A1 (ja) | 音信号合成方法、生成モデルの訓練方法、音信号合成システムおよびプログラム | |
JP2008250008A (ja) | 楽音処理装置およびプログラム | |
JP6123574B2 (ja) | コード抽出装置、方法、およびプログラム | |
JP5552794B2 (ja) | 音響信号の符号化方法および装置 | |
JP5609280B2 (ja) | 音響信号の符号化方法および装置 | |
JP2007298607A (ja) | 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム | |
Caetano | Morphing musical instrument sounds with the sinusoidal model in the sound morphing toolbox | |
JP6047863B2 (ja) | 音響信号の符号化方法および装置 | |
JP4483561B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
JP5533021B2 (ja) | 音響信号の符号化方法および装置 | |
JP5732910B2 (ja) | 音響信号の符号化方法および装置 | |
JP6589404B2 (ja) | 音響信号の符号化装置 | |
JP5879813B2 (ja) | 複数音源の識別装置および複数音源に連動する情報処理装置 | |
JPWO2008001779A1 (ja) | 基本周波数推定法および音響信号推定システム | |
JP4695781B2 (ja) | 音響信号の符号化方法 | |
JP3633090B2 (ja) | 音源装置および楽音のスペクトル成分分析方法 | |
JP4156269B2 (ja) | 時系列信号の周波数解析方法および音響信号の符号化方法 | |
JP4930608B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
JP3304709B2 (ja) | 楽音信号分析方法 | |
Kreutzer et al. | A parametric model for spectral sound synthesis of musical sounds | |
Molina et al. | Dissonance reduction in polyphonic audio using harmonic reorganization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130419 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20130823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140805 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140818 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5609280 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |