JP6589404B2 - 音響信号の符号化装置 - Google Patents
音響信号の符号化装置 Download PDFInfo
- Publication number
- JP6589404B2 JP6589404B2 JP2015121870A JP2015121870A JP6589404B2 JP 6589404 B2 JP6589404 B2 JP 6589404B2 JP 2015121870 A JP2015121870 A JP 2015121870A JP 2015121870 A JP2015121870 A JP 2015121870A JP 6589404 B2 JP6589404 B2 JP 6589404B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- intensity
- unit section
- frequency
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Auxiliary Devices For Music (AREA)
Description
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数f(n)について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間(q−1)に対して算出されたスペクトル強度(E2(q−1,n))と、当該選出単位区間(q−1)と一部が重複する所定区間に対して算出されたスペクトル強度(E2(q´,n))との相乗平均値(E2´(q−1,n))を算出し、前記対象とする選出単位区間に対して算出されたスペクトル強度(E2(q−1,n))に対して、前記相乗平均値(E2´(q−1,n))に基づいて補正を行い、重複する選出単位区間の影響を減少させた補正スペクトル強度(E2´´(q−1,n))を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置を提供する。
所定のサンプリング周波数でデジタル化された時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間に対して算出されたスペクトル強度と、前記対象とする選出単位区間(q−1)の直後の選出単位区間(q)と重複させずに連続するように前記直後の選出単位区間よりTサンプルだけ前方にずらしたT個のサンプルで構成される隣接単位区間(q´)に対して算出されたスペクトル強度との相乗平均値(E2´(q−1,n))を算出し、単位区間の解析サンプル数(T(n))を、前記対象とする選出単位区間(q−1)と後続の選出単位区間(q)との時間差に対応するサンプル数((P(q)−P(q−1))・W)で除した値を、前記相乗平均値に乗じることにより、前記対象とする選出単位区間(q−1)に対して算出されたスペクトル強度を補正し、重複する選出単位区間の影響を減少させた補正スペクトル強度を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置を提供する。
所定のサンプリング周波数でデジタル化された時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間に対して算出されたスペクトル強度と、前記対象とする選出単位区間(q−1)の直後の選出単位区間(q)に対して算出されたスペクトル強度との相乗平均値(E2´(q−1,n))を算出し、単位区間の解析サンプル数(T(n))から、対象とする選出単位区間(q−1)と後続の選出単位区間(q)との時間差に対応するサンプル数((P(q)−P(q−1))・W)を減算したものを、前記相乗平均値に乗じた後、元のスペクトル強度(E2(q−1,n))と単位区間の解析サンプル数(T(n))を乗じたものから減算する演算を行い、当該演算の結果を、選出単位区間(q−1)と後続の選出単位区間(q)との時間差に対応するサンプル数((P(q)−P(q−1))・W)で除した値に基づいて前記対象とする選出単位区間に対して算出されたスペクトル強度を補正し、重複する選出単位区間の影響を減少させた補正スペクトル強度を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置を提供する。
個々の単位区間ごとに、解析対象とする少なくともN種類の各周波数f(n)について、周波数解析を行うことにより、p番目の単位区間pに対して、前記N種類の周波数f(n)に対応した第1のスペクトル強度E1(p,n)を算出する第1のスペクトル算出手段と、
対象とする単位区間pの直前に位置する単位区間p−1における第1のスペクトル強度E1(p−1,n)との対応する周波数ごとの変化に基づく評価値が、所定のしきい値より大きいことを前記選出条件とし、前記対象とする単位区間pを選出単位区間q(q≦p)として選出し、少なくとも前記N種類の各周波数f(n)について、前記第1のスペクトル算出手段における周波数解析に比較して高精度な周波数解析を行うことにより、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を、前記選出単位区間に対するスペクトル強度として算出する第2のスペクトル算出手段と、
を有することを特徴とする。
前記符号化手段は、隣接する2つの選出単位区間q−1と選出単位区間qに対して、後続の選出単位区間qにおける対象周波数f(n)に対応する前記第2のスペクトル強度E2(q,n)から、直前の選出単位区間q−1における前記N種類の周波数のうち前記対象周波数と同周波数f(n)、1つ低い周波数f(n−1)、1つ高い周波数f(n+1)にそれぞれ対応する前記第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれかを減じた減算値を、前記後続の選出単位区間qの第2のスペクトル強度E2(q,n)と前記直前の選出単位区間q−1の第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれかとの和である加算値で除した値が所定のしきい値(Ldif)未満で、かつ前記直前の選出単位区間q−1の第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれか、および前記後続の選出単位区間qの第2のスペクトル強度E2(q,n)が所定のしきい値(Lmin)より大きい場合、前記選出単位区間qを選出単位区間q−1に連結することを特徴とする。
前記符号化手段は、前記第2のスペクトル強度E2(q,n)を決定する副周波数と、前記第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)を決定する副周波数のいずれかとの差が所定のしきい値(Ndif)未満という条件をさらに満たした場合に、前記後続の選出単位区間qを直前の選出単位区間q−1を連結することを特徴とする。
前記直前の選出単位区間q−1が、既に他の選出単位区間と連結されている場合、前記直前の選出単位区間q−1が連結されている先頭の選出単位区間をqoとし、
前記符号化手段は、前記第2のスペクトル強度E2(q,n)を決定する副周波数と前記第2のスペクトル強度E2(qo,n)、E2(qo,n−1)、E2(qo,n+1)を決定する副周波数のいずれか1つとの差が所定のしきい値(Nadif)未満という条件をさらに満たした場合に限り、前記後続の選出単位区間qを直前の選出単位区間q−1に連結することを特徴とする。
前記符号化手段は、前記選出単位区間の連結に基づいて補正された符号コードを含む生成される符号コードの先頭時刻から先頭時刻に時間差を加えた終了時刻までを時間区間とすると、ある時刻tにおいて、所定の個数以上の符号コードの時間区間が重複する場合、前記重複する全ての符号コードに対して、先頭時刻から前記時刻tまでの経過時間に基づいて当該符号コードの強度値を補正した変動強度値(Vc(h,t))を算出し、変動強度値が最も小さい符号コードの時間差を当該符号コードの先頭時刻から前記時刻tまでの経過時間になるよう補正するようにしていることを特徴とする。
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記単位区間pのT(n)個のサンプルで構成される区間信号との相関演算を行うことにより、第1のスペクトル強度E1(p,n)を算出するものであり、
前記第2のスペクトル算出手段は、
前記N個の各周波数f(n)に対応する要素信号と、それぞれ対応する前記選出単位区間qのT(n)個のサンプルで構成される区間信号との相関演算を行い、相関値が最も高い周波数f(nmax)に対応する要素信号を調和信号として選出し、
前記選出された調和信号と当該調和信号について得られた相関値との積で与えられるT(nmax)個のサンプルを含有信号とし、当該含有信号を前記区間信号から減じることにより、T(nmax)個のサンプルで構成される差分信号を算出し、
前記T(nmax)個のサンプルを反映させ更新されたT(n)個のサンプルを新たな区間信号として、前記調和信号の選出および差分信号の算出を実行して新たな含有信号および差分信号を得る処理を繰り返し行うことによりN個の含有信号を求め、求められた含有信号の相関値に基づいて、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出することを特徴とする。
直前の単位区間p−1における各周波数f(n)に対応する直前相関演算結果に対し、前記直前の単位区間p−1における先頭Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果より減算するとともに、前記単位区間pにおける最後尾Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果に加算することにより、前記単位区間pにおける各周波数f(n)に対応する相関演算結果を取得し、当該相関演算結果に基づいて前記第1のスペクトル強度E1(p,n)を算出することを特徴とする。
前記N種類の各周波数f(n)に対して、整数kを用いてf(n)/kなる所定数の低域周波数を定義し、前記低域周波数f(n)/kに対応するスペクトル強度が存在する場合、前記低域周波数f(n)/kに対応するスペクトル強度に基づいて前記N種類の各周波数f(n)に対応するスペクトル強度を所定の割合だけ減衰させるように補正を行い、倍音補正されたスペクトル強度を作成することを特徴とする。
<1.装置構成>
図1は、本発明の一実施形態における音響信号の符号化装置のハードウェア構成図である。本実施形態に係る音響信号の符号化装置は、汎用のコンピュータで実現することができ、図1に示すように、CPU(Central Processing Unit)1と、コンピュータのメインメモリであるRAM(Random Access Memory)2と、CPU1が実行するプログラムやデータを記憶するためのハードディスク、フラッシュメモリ等の大容量の記憶装置3と、キーボード、マウス等のキー入力I/F(インターフェース)4と、外部デバイス(データ記憶媒体)とデータ通信するためのデータ入出力I/F5と、液晶ディスプレイ等の表示デバイスである表示部6と、を備え、互いにバスを介して接続されている。
図3は、本実施形態に係る音響信号の符号化装置の処理動作を示すフローチャートである。まず、区間設定手段10が、処理対象であるデジタル音響信号を、音響信号記憶部51から読み込む(ステップS1)。デジタル音響信号は、アナログ音響信号を所定のサンプリング周波数、量子化ビット数でサンプリングしたものであり、本実施形態では、サンプリング周波数44.1kHz、量子化ビット数16ビットでサンプリングした場合を例にとって以下説明していく。サンプリング周波数44.1kHzでサンプリングした場合、デジタル音響信号は、1秒間に44100個のサンプル(信号強度値)を有するサンプル列(サンプルの配列:強度配列)として構成されることになる。
A(p,n,m)=(1/T(n))・Σi=0,T(n)-1x(p,i)・ sin(2πf(n,m)(i+pW)/fs)
B(p,n,m)=(1/T(n))・Σi=0,T(n)-1x(p,i) ・cos(2πf(n,m)(i+pW)/fs)
E1(p,n,m)={A(p,n,m)}2+{B(p,n,m)}2
A(p,n,m)=A(p−1,n,m) −(1/W)・Σi=0,W-1x(p−1,i) ・sin(2πf(n,m)(i+(p−1)W)/fs)+(1/W)・Σi=T(n)-W,T(n)-1x(p,i)・ sin(2πf(n,m)(i+pW)/fs)
B(p,n,m)=B(p−1,n,m) −(1/W)・Σi=0,W-1x(p−1,i) ・cos(2πf(n,m)(i+(p−1)W)/fs)+(1/W)・Σi=T(n)-W,T(n)-1x(p,i)・ cos(2πf(n,m)(i+pW)/fs)
E1(p,n,m)={A(p,n,m)}2+{B(p,n,m)}2
dE(p−1,p)=(100/N)・Σn=0,N-1{(E1(p,n)−E1(p−1,n))/(E1(p,n)+E1(p−1,n))}
A(p,nmax,mmax)=(1/T(nmax))・Σi=0,T(nmax)-1x(p,i)・ sin(2πf(nmax,mmax)i/fs)
B(p,nmax,mmax)=(1/T(nmax))・Σi=0,T(nmax)-1x(p,i) ・cos(2πf(nmax,mmax)i/fs)
E2(q,nmax)={A(p,nmax,mmax)}2+{B(p,nmax,mmax)}2
x(p,i)←x(p,i)−A(p,nmax,mmax) ・sin(2πf(nmax,mmax)i/fs)−B(p,nmax,mmax) ・cos(2πf(nmax,mmax)i/fs)
E2(q,n)←E2(q,n)−Σk=2,10{E2(q,n)・E2(q,n−No(k))}1/2・γ
|S(P(q),n)−S(P(q−1),n)|<Ndif、かつ、
E2(q−1,n)>Lmin、かつ、E2(q,n)>Lmin、かつ、
{E2(q,n)−E2(q−1,n)}/{E2(q,n)+E2(q−1,n)}<Ldif
|S(P(q),n)−S(P(q−1),n−1)−M|<Ndif、かつ、
E2(q−1,n−1)>Lmin、かつ、E2(q,n)>Lmin、かつ、
{E2(q,n)−E2(q−1,n−1)}/{E2(q,n)+E2(q−1,n−1)}<Ldif、かつ、
C(q,n)=0
|E2(q,n)−E2(q−1,n−1)|/{E2(q,n)+E2(q−1,n−1)}<|E2(q,n)−E2(q−1,n)|/{E2(q,n)+E2(q−1,n)}、かつ、
C(q,n)=1
|S(P(q),n)−S(P(q−1),n+1)+M|<Ndif、かつ、
E2(q−1,n+1)>Lmin、かつ、E2(q,n)>Lmin、かつ、
{E2(q,n)−E2(q−1,n+1)}/{E2(q,n)+E2(q−1,n+1)}<Ldif、かつ、
C(q,n)=0
|E2(q,n)−E2(q−1,n+1)|/{E2(q,n)+E2(q−1,n+1)}<|E2(q,n)−E2(q−1,n)|/{E2(q,n)+E2(q−1,n)}、かつ、
C(q,n)=1
|E2(q,n)−E2(q−1,n+1)|/{E2(q,n)+E2(q−1,n+1)}<|E2(q,n)−E2(q−1,n−1)|/{E2(q,n)+E2(q−1,n−1)}、かつ、
C(q,n)=2
E2´(q−1,n)=[E2(q−1,n)・E2(q´,n) ]1/2
E2´´(q−1,n)=E2´(q−1,n)・[T(n)/{(P(q)−P(q−1))・W}]1/2
E2´(q−1,n)=[E2(q−1,n)4・E2(q,n) 4]1/2
E2´´(q−1,n)=[E2(q−1,n)・T(n)−E2´(q−1,n)・{T(n)−(P(q)−P(q−1))・W}]/{(P(q)−P(q−1))・W}1/4
C(q,n)=1、かつ、
|P(q)・W−P(r+1)・W|<Tmax、かつ、
|S(P(q),n)−S(P(qo),n)|<Nadif
C(q,n)=2、かつ、
|P(q)・W−P(r+1)・W|<Tmax、かつ、
|S(P(q),n)−S(P(qo),n−1)−M|<Nadif
C(q,n)=3、かつ、
|P(q)・W−P(r+1)・W|<Tmax、かつ、
|S(P(q),n)−S(P(qo),n+1)+M|<Nadif
Vc(h,t)=Ev(h).velocity・exp{(t−Ev(h).time)・τ}
本発明に係る音響信号の符号化装置により得られたMIDI形式の符号データについて、図12〜図17を用いて説明する。図12は、男声のアナウンス音声をサンプリング周波数44.1kHz、量子化ビット数16ビットでサンプリングしたデジタルの音響信号の波形を示す図である。図12において、横軸が時間軸であり、縦軸が振幅値である。図12に示した音響信号を、特許文献4に示した従来方式を基本としてMIDI形式で符号化した符号データの例、本発明に係る音響信号の符号化装置によりMIDI形式で符号化した符号データの例を、それぞれ図13、図14に示す。図14は前述の重複成分の補正の第2の手法を適用した結果であるが、第1の手法を適用した結果も図14と見かけ上の差異は殆ど無い。図13においては、サンプルの時間軸方向への拡大を4倍としている。図14においては、図13との比較のため、単位区間のサンプル数を上記実施形態のように、単位区間T=1024サンプルとして、基本となる4096サンプルにした場合に比べて4倍拡大相当としている。図13、図14においては、いずれも横軸が時間軸であり、配置されている矩形の位置は縦軸がノートナンバー(周波数)、矩形の横方向の幅が音長、矩形の縦方向の幅がベロシティ(強度値)である。
2・・・RAM
3・・・記憶装置
4・・・キー入力I/F
5・・・データ入出力I/F
6・・・表示部
10・・・区間設定手段
20・・・スペクトル算出手段
30・・・スペクトル補正手段
40・・・符号化手段
50・・・記憶手段
51・・・音響信号記憶部
52・・・符号コード記憶部
Claims (14)
- 所定のサンプリング周波数でデジタル化された時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間に対して算出されたスペクトル強度と、当該選出単位区間と一部が重複する所定区間に対して算出されたスペクトル強度との相乗平均値を算出し、前記対象とする選出単位区間に対して算出されたスペクトル強度に対して、前記相乗平均値に基づいて補正を行い、重複する選出単位区間の影響を減少させた補正スペクトル強度を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置。 - 前記スペクトル補正手段は、前記対象とする選出単位区間の直後の選出単位区間と重複させずに連続するように、前記直後の選出単位区間よりTサンプルだけ前方にずらしたT個のサンプルで構成される隣接単位区間を前記一部が重複する所定区間として前記相乗平均値を算出し、単位区間の解析サンプル数を、前記対象とする選出単位区間と後続の選出単位区間との時間差に対応するサンプル数で除した値を、前記相乗平均値に乗じることにより、前記対象とする選出単位区間に対して算出されたスペクトル強度を補正するようにしていることを特徴とする請求項1に記載の音響信号の符号化装置。
- 前記スペクトル補正手段は、前記一部が重複する所定区間として前記対象とする選出単位区間の直後の選出単位区間を用い、単位区間の解析サンプル数から、対象とする選出単位区間と後続の選出単位区間との時間差に対応するサンプル数を減算したものを、前記相乗平均値に乗じた後、元のスペクトル強度と単位区間の解析サンプル数を乗じたものから減算する演算を行い、当該演算の結果を、選出単位区間と後続の選出単位区間との時間差に対応するサンプル数で除した値に基づいて前記対象とする選出単位区間に対して算出されたスペクトル強度を補正するようにしていることを特徴とする請求項1に記載の音響信号の符号化装置。
- 所定のサンプリング周波数でデジタル化された時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間に対して算出されたスペクトル強度と、前記対象とする選出単位区間の直後の選出単位区間と重複させずに連続するように前記直後の選出単位区間よりTサンプルだけ前方にずらしたT個のサンプルで構成される隣接単位区間に対して算出されたスペクトル強度との相乗平均値を算出し、単位区間の解析サンプル数を、前記対象とする選出単位区間と後続の選出単位区間との時間差に対応するサンプル数で除した値を、前記相乗平均値に乗じることにより、前記対象とする選出単位区間に対して算出されたスペクトル強度を補正し、重複する選出単位区間の影響を減少させた補正スペクトル強度を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置。 - 所定のサンプリング周波数でデジタル化された時系列のサンプル列として与えられる音響信号を符号化するための符号化装置であって、
前記サンプル列に対して、所定数T個のサンプルで構成される単位区間を、隣接する単位区間と時間軸方向に前記T個より少ない所定数のサンプルを重複させながら設定する区間設定手段と、
前記単位区間に対して、解析対象とする少なくともN種類の各周波数について周波数解析を行い、所定の選出条件を満たす単位区間である選出単位区間に対するスペクトル強度を算出するスペクトル算出手段と、
前記N種類の周波数ごとに、対象とする選出単位区間に対して算出されたスペクトル強度と、前記対象とする選出単位区間の直後の選出単位区間に対して算出されたスペクトル強度との相乗平均値を算出し、単位区間の解析サンプル数から、対象とする選出単位区間と後続の選出単位区間との時間差に対応するサンプル数を減算したものを、前記相乗平均値に乗じた後、元のスペクトル強度と単位区間の解析サンプル数を乗じたものから減算する演算を行い、当該演算の結果を、選出単位区間と後続の選出単位区間との時間差に対応するサンプル数で除した値に基づいて前記対象とする選出単位区間に対して算出されたスペクトル強度を補正し、重複する選出単位区間の影響を減少させた補正スペクトル強度を算出するスペクトル補正手段と、
前記選出単位区間の補正スペクトル強度に基づいて強度値を定義した、所定の形式の符号コードを生成する符号化手段と、
を有することを特徴とする音響信号の符号化装置。 - 前記スペクトル算出手段は、
個々の単位区間ごとに、解析対象とする少なくともN種類の各周波数f(n)について周波数解析を行うことにより、p番目の単位区間pに対して、前記N種類の周波数f(n)に対応した第1のスペクトル強度E1(p,n)を算出する第1のスペクトル算出手段と、
前記単位区間pに対して直前に位置する単位区間p−1における第1のスペクトル強度E1(p−1,n)との対応する周波数ごとの変化に基づく評価値が、所定のしきい値より大きいことを前記選出条件とし、当該単位区間pをq(q≦p)番目の選出単位区間qとして選出し、少なくとも前記N種類の各周波数f(n)について、前記第1のスペクトル算出手段における周波数解析に比較して高精度な周波数解析を行うことにより、前記N種類の周波数f(n)に対応した第2のスペクトル強度E2(q,n)を、前記選出単位区間に対するスペクトル強度として算出する第2のスペクトル算出手段と、
を有することを特徴とする請求項1から請求項5のいずれか一項に記載の音響信号の符号化装置。 - 前記符号化手段は、隣接する2つの選出単位区間q−1と選出単位区間qに対して、後続の選出単位区間qにおける対象周波数f(n)に対応する前記第2のスペクトル強度E2(q,n)から、直前の選出単位区間q−1における前記N種類の周波数のうち前記対象周波数と同周波数f(n)、1つ低い周波数f(n−1)、1つ高い周波数f(n+1)にそれぞれ対応する前記第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれかを減じた減算値を、前記後続の選出単位区間qの第2のスペクトル強度E2(q,n)と前記直前の選出単位区間q−1の第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれかとの和である加算値で除した値が所定のしきい値未満で、かつ前記直前の選出単位区間q−1の第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)のいずれか、および前記後続の選出単位区間qの第2のスペクトル強度E2(q,n)が所定のしきい値より大きい場合、前記選出単位区間qを選出単位区間q−1に連結することを特徴とする請求項6に記載の音響信号の符号化装置。
- 前記第1のスペクトル算出手段および第2のスペクトル算出手段はN種類の各周波数f(n)を主周波数とし、隣接する主周波数を超えない範囲でM種類の副周波数f(n,m)を設定し、前記第1のスペクトル強度E1(p,n)および第2のスペクトル強度E2(q,n)として、前記M種類の副周波数の中で最も大きい強度を示す副周波数に対応する強度値を算出し、
前記符号化手段は、前記第2のスペクトル強度E2(q,n)を決定する副周波数と、
前記第2のスペクトル強度E2(q−1,n)、E2(q−1,n−1)、E2(q−1,n+1)を決定する副周波数のいずれか1つとの差が所定のしきい値未満という条件をさらに満たした場合に、前記後続の選出単位区間qを直前の選出単位区間q−1に連結することを特徴とする請求項7に記載の音響信号の符号化装置。 - 前記直前の選出単位区間q−1が、既に他の選出単位区間と連結されている場合、前記直前の選出単位区間q−1が連結されている先頭の選出単位区間をqoとし、
前記符号化手段は、前記第2のスペクトル強度E2(q,n)を決定する副周波数と前記第2のスペクトル強度E2(qo,n)、E2(qo,n−1)、E2(qo,n+1)を決定する副周波数のいずれか1つとの差が所定のしきい値未満という条件をさらに満たした場合に、前記後続の選出単位区間qを直前の選出単位区間q−1に連結することを特徴とする請求項8に記載の音響信号の符号化装置。 - 前記符号化手段は、前記選出単位区間の連結に基づいて補正された符号コードを含む生成される符号コードの先頭時刻から先頭時刻に時間差を加えた終了時刻までを時間区間とすると、ある時刻tにおいて、所定の個数以上の符号コードの時間区間が重複する場合、前記重複する全ての符号コードに対して、先頭時刻から前記時刻tまでの経過時間に基づいて当該符号コードの強度値を補正した変動強度値を算出し、変動強度値が最も小さい符号コードの時間差を当該符号コードの先頭時刻から前記時刻tまでの経過時間になるよう補正するようにしていることを特徴とする請求項7から請求項9のいずれか一項に記載の音響信号の符号化装置。
- 前記第1のスペクトル算出手段は、前記単位区間の区間信号の構成要素となるべきN種類の要素信号を、各々当該周波数f(n)の周期の整数倍に対応し、前記単位区間のサンプル数Tに最も近いT(n)個のサンプルとして準備し、
前記N種類の各周波数f(n)に対応する要素信号と、それぞれ対応する前記単位区間pのT(n)個のサンプルで構成される区間信号との相関演算を行うことにより、第1のスペクトル強度E1(p,n)を算出するものであり、
前記第2のスペクトル算出手段は、
前記N種類の各周波数f(n)に対応する要素信号と、それぞれ対応する前記選出単位区間qのT(n)個のサンプルで構成される区間信号との相関演算を行い、相関値が最も高い周波数f(nmax)に対応する要素信号を調和信号として選出し、
前記選出された調和信号と当該調和信号について得られた相関値との積で与えられるT(nmax)個のサンプルを含有信号とし、当該含有信号を前記区間信号から減じることにより、T(nmax)個のサンプルで構成される差分信号を算出し、
前記T(nmax)個のサンプルを反映させ更新されたT(n)個のサンプルを新たな区間信号として、前記調和信号の選出および差分信号の算出を実行して新たな含有信号および差分信号を得る処理を繰り返し行うことによりN種類の含有信号を求め、求められた含有信号の相関値に基づいて、前記N種類の周波数に対応した第2のスペクトル強度E2(q,n)を算出することを特徴とする請求項6から請求項10のいずれか一項に記載の音響信号の符号化装置。 - 前記第1のスペクトル算出手段は、
直前の単位区間p−1における各周波数f(n)に対応する直前相関演算結果に対し、
前記直前の単位区間p−1における先頭Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果より減算するとともに、前記単位区間pにおける最後尾Wサンプルに対応する相関演算を行い、各周波数ごとの相関値を前記直前相関演算結果に加算することにより、前記単位区間pにおける各周波数f(n)に対応する相関演算結果を取得し、当該相関演算結果に基づいて前記第1のスペクトル強度E1(p,n)を算出することを特徴とする請求項6から請求項11のいずれか一項に記載の音響信号の符号化装置。 - 前記スペクトル算出手段は、
前記N種類の各周波数f(n)に対して、整数kを用いてf(n)/kなる所定数の低域周波数を定義し、当該低域周波数f(n)/kに対応するスペクトル強度が存在する場合、前記低域周波数f(n)/kに対応するスペクトル強度に基づいて周波数f(n)に対応するスペクトル強度を所定の割合だけ減衰させるように補正を行い、倍音補正されたスペクトル強度を作成することを特徴とする請求項1から請求項12のいずれか一項に記載の音響信号の符号化装置。 - 請求項1から請求項13のいずれか一項に記載の音響信号の符号化装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015121870A JP6589404B2 (ja) | 2014-07-10 | 2015-06-17 | 音響信号の符号化装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014141954 | 2014-07-10 | ||
JP2014141954 | 2014-07-10 | ||
JP2015121870A JP6589404B2 (ja) | 2014-07-10 | 2015-06-17 | 音響信号の符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016028269A JP2016028269A (ja) | 2016-02-25 |
JP6589404B2 true JP6589404B2 (ja) | 2019-10-16 |
Family
ID=55360724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015121870A Expired - Fee Related JP6589404B2 (ja) | 2014-07-10 | 2015-06-17 | 音響信号の符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6589404B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6950180B2 (ja) * | 2016-12-26 | 2021-10-13 | カシオ計算機株式会社 | 楽音データ処理方法及び楽音データ処理装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6047863B2 (ja) * | 2011-07-13 | 2016-12-21 | 大日本印刷株式会社 | 音響信号の符号化方法および装置 |
-
2015
- 2015-06-17 JP JP2015121870A patent/JP6589404B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016028269A (ja) | 2016-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2906970B2 (ja) | サウンドの分析及び合成方法並びに装置 | |
JP5846043B2 (ja) | 音声処理装置 | |
JP6589404B2 (ja) | 音響信号の符号化装置 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JPH0777979A (ja) | 音声制御音響変調装置 | |
JPWO2008010413A1 (ja) | 音声合成装置、方法、およびプログラム | |
JP6047863B2 (ja) | 音響信号の符号化方法および装置 | |
JP5552794B2 (ja) | 音響信号の符号化方法および装置 | |
JP5163606B2 (ja) | 音声分析合成装置、及びプログラム | |
Penttinen et al. | Acoustic guitar plucking point estimation in real time | |
JP5732910B2 (ja) | 音響信号の符号化方法および装置 | |
JP5609280B2 (ja) | 音響信号の符号化方法および装置 | |
JP4513556B2 (ja) | 音声分析合成装置、及びプログラム | |
JP2002049399A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP2001282246A (ja) | 波形データ時間伸張圧縮装置 | |
JP5533021B2 (ja) | 音響信号の符号化方法および装置 | |
CN113178183B (zh) | 音效处理方法、装置、存储介质和计算设备 | |
JP3779058B2 (ja) | 音源システム | |
JP5211437B2 (ja) | 音声処理装置およびプログラム | |
JP3304709B2 (ja) | 楽音信号分析方法 | |
JP2766648B2 (ja) | 高調波係数抽出装置、高調波係数合成装置、高調波係数抽出方法及び高調波係数合成方法 | |
JP2003241777A (ja) | 楽音のフォルマント抽出方法、記録媒体及び楽音のフォルマント抽出装置 | |
JP2689709B2 (ja) | 電子楽器 | |
JP4156268B2 (ja) | 時系列信号の周波数解析方法および音響信号の符号化方法 | |
JP3226255B2 (ja) | 楽音合成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6589404 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |