JP2015210419A - 変換装置、方法、およびプログラム - Google Patents

変換装置、方法、およびプログラム Download PDF

Info

Publication number
JP2015210419A
JP2015210419A JP2014092616A JP2014092616A JP2015210419A JP 2015210419 A JP2015210419 A JP 2015210419A JP 2014092616 A JP2014092616 A JP 2014092616A JP 2014092616 A JP2014092616 A JP 2014092616A JP 2015210419 A JP2015210419 A JP 2015210419A
Authority
JP
Japan
Prior art keywords
signal
interpolation
waveform
unit
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014092616A
Other languages
English (en)
Inventor
崇史 山谷
Takashi Yamatani
崇史 山谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2014092616A priority Critical patent/JP2015210419A/ja
Publication of JP2015210419A publication Critical patent/JP2015210419A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】楽曲のタイムストレッチ(速度変換)及びピッチシフト(ピッチ変換)の技術に関し、減衰系楽器の波形信号に対しても音質の低下の少ない音声変換装置を提供する。【解決手段】フィルタバンク部からの周波数帯域毎の複素信号出力を極座標変換して振幅信号と位相信号を得て、振幅信号に対して振幅補間部204で補間演算処理を実行し、補間された振幅信号と、位相信号に対して信号処理を行って得た位相信号とから、周波数帯域毎の波形信号を再構成し、その出力を合成して、タイムストレッチまたはピッチシフトが施された波形信号を出力する音声変換装置において、振幅補間部204は、周波数帯域毎に、線形補間部405と対数補間部406のうちユーザに選択されたほうで、振幅信号の補間演算処理を実行する。【選択図】図12

Description

本発明は、楽曲のタイムストレッチ(速度変換)及びピッチシフト(ピッチ変換)の技術に関する。
波形入力に対してタイムストレッチまたはピッチシフトを実現する従来技術として、次のようなものが知られている(例えば特許文献1,2に記載の技術)。複素信号を出力するフィルタバンクにて複数の周波数帯に波形信号を分割する。そして、周波数帯域毎に分割された波形信号に対して、極座標変換にて振幅と位相を計算する。さらに位相の時間差分から瞬時周波数を求める。振幅と瞬時周波数の線形補間処理によりタイムストレッチを行う。さらに、補間後の瞬時周波数に所定の乗数を乗じてピッチシフトを行う。ピッチ変換後の瞬時周波数を積算することで位相の再構成を行い、補間後の振幅と再構成した位相から周波数帯域毎の波形の再構成を行う。そして、各周波数帯毎に再構成された波形を加算して合成し、タイムストレッチ及びピッチシフトが施された波形信号を得る。
特開2014−41240号公報 特開2014−41241号公報
しかし、入力される波形信号がピアノやギターなどの、ある時定数で振幅が減衰する楽器(以下減衰系楽器)の楽音信号である場合、減衰信号は直線的には減衰しない。このため、振幅と瞬時周波数に対して線形補間処理を実行した場合、補間する位置によりまちまちの誤差が乗るので、音質の低下が引き起こされるという課題があった。
そこで、本発明は、減衰系楽器の波形信号に対しても音質の低下の少ない変換装置を提供することを目的とする。
態様の一例では、入力波形信号を複数の周波数帯に分割してその周波数帯域毎に複素信号を出力するフィルタバンク部と、周波数帯域毎に複素信号を極座標変換して振幅信号と位相信号を出力する極座標変換部と、周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、振幅信号に対して補間演算処理を実行する振幅補間部と、周波数帯域毎に、その振幅補間部から出力される補間された振幅信号と、位相信号に対して信号処理を行って得た位相信号とから、周波数帯域毎の波形信号を再構成する波形再構成部と、波形再構成部が出力する周波数帯域毎の波形信号を合成した波形信号を出力する波形合成部と、を備える。
本発明によれば、減衰系楽器の波形信号に対しても音質の低下の少ない音声変換装置を提供することが可能となる。
本実施形態のタイムストレッチ及びピッチシフト装置の全体構成の一例を示す図である。 タイムストレッチ及びピッチシフト部102の機能ブロック図の一例を示す図である。 オーバーラップセーブ法の説明図(その1)である。 オーバーラップセーブ法の説明図(その2)である。 フィルタバンク部201の構成例を示す機能ブロック図である。 品質を保証する最低音高のユーザ設定画面例を示す図である。 フィルタバンク部201の1つのチャンネルからの出力信号の波形例を示す図である。 極座標変換部202から出力される信号の波形例を示す図である。 瞬時周波数計算部203から出力される周波数相当の信号の波形例を示す図である。 振幅信号の減衰信号部分をグラフ化した例を示す図である。 線形補間と対数補間のどちらを実行させるかをユーザに選ばせるための設定画面例を示す図である。 振幅補間部204の構成例を示す機能ブロック図である。 振幅補間部204が出力する信号の波形例を示す図である。 瞬時周波数補間部205が出力する信号の波形例を示す図である。 瞬時周波数乗算部206でピッチを1オクターブを上げた場合の出力信号の波形例を示す図である。 位相再構成部207の出力信号の波形例を示す図である。 波形再構成部208が出力する信号の波形例を示す図(その1)である。 波形再構成部208が出力する信号の波形例を示す図(その2)である。
以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。本実施形態のタイムストレッチ及びピッチシフト装置の全体構成の一例を図1に示す。図1において、101は音響データ取得部、102はタイムストレッチ及びピッチシフト部、103は音響データ再生部、104は表示部、105は操作部、106は制御部である。
音響データ取得部101は、処理すべき楽曲の音響データを逐次またはブロック読み出しして、タイムストレッチ及びピッチシフト部102に供給する。
タイムストレッチ及びピッチシフト部102は、音響データ取得部101から供給された音響データに対し、再生速度設定とピッチシフト設定に基づいてタイムストレッチ及びピッチシフトを行い、処理済みの音響データを音響データ再生部103に出力する。
音響データ再生部103は、タイムストレッチ及びピッチシフト部102が出力した処理済み音響データを再生する。
表示部104は、処理すべき楽曲の選択画面をユーザに提示したり、再生速度設定やピッチシフト設定、楽曲の再生、一時停止、停止などの操作画面、その他設定画面の表示を行う。
操作部105は、表示部104の表示内容に対するユーザ操作を提供し、ユーザの操作を取得する。
制御部106は、操作部105が取得したユーザ操作に基づき、音響データ取得部101、タイムストレッチ及びピッチシフト部102、音響データ再生部103、表示部104の制御を行う。
タイムストレッチ及びピッチシフト部102の機能ブロック図の一例を図2に示す。図2において、201はフィルタバンク部、202は極座標変換部、203は瞬時周波数計算部、204は振幅補間部、205は瞬時周波数補間部、206は瞬時周波数乗算部、207は位相再構成部、208は波形再構成部、209は波形合成部である。なお、202〜208は周波数帯1つ分のみ表示しているが、実際にはフィルタバンクのチャンネル数分、同一の構成が存在しているものとする。
図2において、フィルタバンク部201は、実数信号列から周波数帯毎に分解された複素信号列を生成し極座標変換部202に出力する。時刻t(サンプル)における音響データx(t)が下記数1式で表されている場合に、下記数2式の近似が成り立つように信号に分解する。 なお、bは各周波数帯のインデックス、総数はBで、Ab(t)は周波数帯bの振幅を、φb(t)は周波数帯bの位相を表す。
フィルタバンク部201の特性は、音高や時間周波数分解能などを考慮した音響用フィルタバンクなどが望ましい。
フィルタバンク部201の計算方法で最も単純なものは、時間領域で畳み込みを行うことであるが、計算量が膨大になるので、高速畳み込み技法であるオーバーラップセーブ法(以下「OLS」と称する)で計算する。
時間領域での畳み込みは、周波数領域での乗算に相当する。このような計算(循環畳み込み)はデータが周期性を持っていれば問題ないが、音響データは一般的に周期性を持たないので音響データの先頭部分と末尾部分が干渉する。オーバーラップセーブ法ではブロック単位で前記計算を行い、この干渉部分を破棄する。
フィルタ係数が、例えば、時刻ゼロを中心として、プラス、マイナス方向に長さLで全部で長さL*2+1と長さNの信号を畳み込みを行った場合、その結果で有効な信号の長さはN−L*2になる。このときの信号と結果の関係は図3に示すようになる。図3(a)に示される細線の矩形部分が信号、図3(b)に示される斜線の矩形部分が無効な結果、太線の矩形部分が有効な結果である。
よって、より長い信号に対しても、無効部分を破棄し、畳み込みの有効な計算結果を適切に連結するようにすれば、畳み込みを分割して計算できる。この様子を図4に示す。図4において、(a)は元の信号、(b)は信号の切り出し、(c)は畳み込みの結果、(d)は有効部分を連結した畳み込みの最終結果である。なお、切り出しの際に元の信号の範囲外をゼロとする。これは音楽などでは妥当な仮定である。
また、時間領域での畳み込みは、周波数領域での各周波数成分毎の乗算であることはよく知られている。そこで信号を切り出す長さNが高速フーリエ変換が可能なように決めれば効果的に計算できる。Nは小さな素数の積で構成されればよいが、もっとも効果的なのは2のべき乗のときである。なお、フーリエ変換では無限に続く周期信号を仮定しているので、破棄すべき無効部分では切り出した信号の先頭部分と末尾部分が干渉している。
以上は、フィルタ1つ分の説明であるが、フィルタバンクでも同様に考えることができる。ただ、フーリエ変換は高速フーリエ変換とはいえ計算量がおおいので、すべてのフィルタで信号の切り出し位置を共通化することで、フーリエ変換を共有することができ計算量を削減できる場合が多い。このときの破棄量は、本実施形態では、一番フィルタ長の長いものに合わせる。音響用フィルタバンクでは最も低音のフィルタ長がそれに当たる。以下に説明する図5において、高速フーリエ変換部304が共通化されているのは上述の理由による。なお、条件によっては上述の共通化を1つでなく複数にしたほうが計算量が減る場合もあるがここでは割愛する。
この破棄する長さは、フィルタバンク部201の最低音高のフィルタ長をL*2+1とするとL*2になる。
また、ブロック長は2のべき乗でかつ、破棄する長さに比べ十分大きいことが望ましい。しかし、メモリ容量の制約などからブロック長はあまり大きくできない。このため計算効率が低下する。
ところで、人間の聴覚上、ある程度以下の周波数は分解能や歪みに対して鈍感になる。そこで、本実施形態では、品質を保持する最低音高に基づいて破棄長を決定する。これにより破棄長を減らして計算効率を改善することができる。
以上を考慮したフィルタバンク部201の構成例を示す機能ブロック図を図5に示す。図5において、301は品質を保証する最低音高取得部、302は破棄長決定部、303はブロック読み出し部、304は高速フーリエ変換部、305はフィルタ係数乗算、306は逆高速フーリエ変換部、307は干渉部分破棄部である。なお、305〜307は周波数帯1つ分のみ表示しているが、実際にはフィルタバンク部201のチャンネル数分、同一の構成が存在しているものとする。
品質を保証する最低音高取得部301は、予め実験的に決定した所定の音高を取得してもいいし、ユーザが設定した音高を取得してもよい。ユーザが図1の操作部105から設定する場合の図1の表示部104の設定画面例を図6に示す。図6(a)は音高名を、図6(b)は変換品質を、選択させるようになっている。変換品質と音高名の対応は例えば、高がA0、中がA1、低がA2という風にする。なお、フィルタバンク部201の最低音高はA0を仮定している。よってA0が選択された場合は計算効率は従来のオーバーラップセーブ法と変わらない。
破棄長決定部302は、品質を保証する最低音高取得部301が取得した音高に基づいて破棄長を決定する。ここで決定した破棄長はブロック読み出し部303と干渉部分破棄部307で利用される。上述の取得した音高のフィルタ長をLd*2+1とすると、破棄長は、Ld*2になる。音響用フィルタバンクなど定Q性があるフィルタバンク部201は音高の周波数とフィルタ長の積が一定になる性質があるので、周波数比とLとからLdを簡易的に計算してもよい。
ブロック読み出し部303は、本来の読み出し位置のLd分手前からブロック長分音響データを読み出して、高速フーリエ変換部304に供給する。Ld分手前から読み出すのは後で破棄することを考慮したものである。なお、読み出しデータ位置が音響データの範囲外の場合はゼロを読み出すものとする。
高速フーリエ変換部304は、ブロック読み出し部303から供給されたデータに対し、高速フーリエ変換の演算を実行して周波数領域のデータに変換し、フィルタ係数乗算部305に供給する。
フィルタ係数乗算部305は、高速フーリエ変換部304が供給した周波数領域のデータと、周波数領域のフィルタ係数の乗算を行い、乗算結果を逆高速フーリエ変換部306に供給する。周波数領域のフィルタ係数は予めフーリエ変換したものを用意しておけばよいので毎回計算する必要はないし、音響用フィルタバンクでは元々周波数領域でフィルタ係数を計算するので、予めフーリエ変換自体必要ない。
逆高速フーリエ変換部306は、フィルタ係数乗算部305から供給された乗算結果に対し、逆高速フーリエ変換の演算を実行して時間領域のデータに変換し、干渉部分破棄部307に供給する。ここまでで循環畳み込みが完了している。
干渉部分破棄部307は、逆高速フーリエ変換部306から供給された時間領域のデータの干渉部分の破棄を行う。干渉部分は先頭と末尾のそれぞれの長さLdの部分の計Ld*2が該当箇所である。
以上により、オーバーラップセーブ法によるフィルタバンク処理が完了している。
いま、上述の動作を実行するフィルタバンク部201のあるチャンネル出力が、単一の周波数かつ振幅がある時定数で減衰する信号を仮定すると、フィルタバンク部201の1つのチャンネルからは、例えば図7に示される波形例を有する信号が出力される。図7において、(a)は実部信号、(b)は虚部信号である。元の入力信号は実部しかないがフィルタバンク部201により虚部も復元される。
図2の説明に戻って、極座標変換部202は、フィルタバンク部201から出力された複素信号を極座標変換して、振幅と位相を出力する。図8は、極座標変換部202から出力される信号の波形例を示しており、(a)は振幅信号、(b)は位相信号である。この例では、図8(a)に例示される振幅信号は、下に凸の曲線を描いて減衰してゆく様子が示されている。
次に、図2の瞬時周波数計算部203は、極座標変換部202が出力する位相信号列を微分して、瞬時周波数を計算する。いま、人が音を聞く場合、その音の高さは位相ではなく、瞬時周波数においてである。ある周波数帯bの位相φb(t)と瞬時周波数fb(t)の関係は、下記数3式のようになる。
瞬時周波数計算部203では、数3式のfb(t)に相当する信号を計算する。数3式から明らかなように位相φb(t)を微分すればfb(t)は求まるが、数値計算の関係と、後述する位相再構成を考慮して、微分を差分演算にて計算する。差分演算により求めた周波数相当は、下記数4式に示す信号になる。
ただ、差分を求めるといっても、図8(b)にあるように位相が±πの範囲に折りたたまれている。そこで、周波数相当の取りうる範囲は±πになるように必要に応じて2πを加減算して範囲を適正な値にする。このようにして求めた周波数相当の信号を図9(a)に示す。なお、折りたたみを解消した理想的な位相は図9(b)のようになる。これは図9(a)の信号を積算したものに等しい。
図2に示される振幅補間部204と瞬時周波数補間部205で、タイムストレッチが実行される。
具体的には、再生速度sに対応した読み出し位置t’のデータ(振幅と瞬時周波数)が補間によって算出されることで、再サンプリングが実行される。なお、読み出し位置t’は、再生速度sずつ増加する。
振幅補間部204は、極座標変換部202が出力した振幅信号を補間することで再サンプリングを実行する。
従来は線形補間での補間のみであったが、ピアノやギターなどある時定数で振幅が減衰する楽器(以下減衰系楽器)の場合、線形補間すると誤差が発生するので音質が低下する。そこで、本実施形態では、このことを考慮して対数補間ができるようにしてある。図10(a)は、振幅信号の減衰信号部分をグラフ化した例であり、図10(b)は、減衰信号部分を対数化してグラフ化つまり片対数でグラフ化したものである。図10(a)では減衰信号は下に凸で、仮に線形補間した場合、補間する位置によりまちまちの誤差が乗るので、音質の低下が引き起こされる。一方、図10(b)では減衰信号は直線になっているので、同グラフ上で線形補間つまり対数補間しても誤差は発生しない。なお、線形補間は下記数5式で、対数補間は下記数6式で、それぞれ計算されるものとする。ここでtiはt’の整数部、trはt’の小数部、時刻tのデータをd(t)とする。
線形補間と対数補間のどちらを実行させるかをユーザに選ばせて、実行させる場合、例えば図2の表示部104に図11のような設定画面を表示して、操作部105で楽曲内の主要な楽器音を選択させる。この例ではピアノ、ギター、ドラムなどが減衰系楽器に対応し、トランペット、バイオリン、ボーカルなどが非減衰系楽器に対応する。一般的に叩いたり、打鍵したり、爪弾く楽器は減衰系であり、息を吹き込んだり、弓でこすったりする楽器は非減衰系の場合が多い。そして、減衰系楽器を選択した場合には対数補間が、そうでない場合は線形補間が実行される。なお、この選択は、楽曲全体かつすべての周波数帯で同一の補間方法が実行される。
線形補間と対数補間のどちらを実行させるかをユーザに選択させず、周波数帯毎にかつ補間毎に、現在の振幅が減衰信号か否かを自動推定して、この推定結果で補間方法を適宜切り替えるようにすることもできる。図10(b)から明らかなように振幅を対数化したものが直線に乗るならば、その信号は減衰信号であると看做すことができる。
以上のことから、減衰信号を自動推定して補間方法を切り替える場合の振幅補間部204の構成例を示す機能ブロック図を図12に示す。図12において、401は減衰信号推定部、402は対数演算部、403は直線判定部、404は補間方法選択部、405は線形補間部、406は対数補間部である。
減衰信号推定部401は対数演算部402と直線判定部403から構成される。減衰信号推定結果は補間方法選択部404に供給される。
対数演算部402は、入力された振幅の対数を計算し、直線判定部403に供給する。
直線判定部403は、対数演算部402から供給される対数化した振幅を3以上の所定の数を用いて、これらのデータが直線上に乗るかの判定を行い、その判定結果を減衰信号制定部401の推定結果とする。この判定方法としては例えば、最小2乗法による直線近似の誤差を求め、この誤差が所定の閾値を下回るならば直線に乗るものと判定する方法を採用できる。
いま、ある時刻のサンプルを基準にサンプル位置をxi=−k,−k+1,…,−1,0,1,…,k−1,kとし、それに対する振幅を対数化したものyiに対し、直線判定部403は、下記数7式で示す直線の係数a、bを、下記数8式で示す二乗誤差Eが最小になるように最小二乗法により求める。
直線判定部403は、このときの最小二乗誤差Eを所定の閾値と比較する。直線判定部403は、Eが所定の閾値未満ならば対数化したものが直線に乗ると判定し、そうでなければ対数化したものが直線に乗らないと判定する。
図4の補間方法選択部404は、減衰信号推定部401の推定結果に基づき線形補間部405または対数補間部406を排他的に実行するための選択を行う。上述の推定結果が減衰信号ならば対数補間部406を、そうでなければ線形補間部405を選択する。
線形補間部405は、それが補間方法選択部404により選択されている場合、線形補間を実行する。
対数補間部406は、それが補間方法選択部404により選択されている場合、対数補間を実行する。
振幅補間部204が出力する信号の波形例を、図13に示す。この例は、図10(a)の振幅信号の入力において再生速度を0.7倍した場合の例である。図10(a)の元の信号との比較のためグラフの範囲は0〜3秒に制約しているが、表示範囲外にも補間した振幅は存在する。
図2に戻り、瞬時周波数補間部205は、瞬時周波数計算部203の出力を線形補間することで再サンプリングを行う。
瞬時周波数補間部205が出力する信号の波形例を、図14に示す。今回は単一の周波数を仮定しているので、補間した結果は、瞬時周波数計算部203が計算した周波数相当の信号例を示す図9(a)と等しくなる。
瞬時周波数乗算部206は、瞬時周波数補間部205の出力の瞬時周波数に、ピッチシフト分の乗数pをかけてピッチシフトを行う。例えばキーをk変更する場合、乗数pは下記数9式のようになる。
なお、kが正の数の場合はピッチが上がり、負の数の場合はピッチが下がる。またkの値が1変化すれば半音分音の高さが変わる。
瞬時周波数乗算部206でピッチを1オクターブを上げた場合の出力信号の波形例を、図15に示す。これは、図14に例示される瞬時周波数相当の信号を、2倍したものに相当する。
位相再構成部207は、瞬時周波数乗算部206の出力する瞬時周波数を積分(実際には積算)して、位相を再構成する。この処理は瞬時周波数計算部203の処理の逆変換に相当する。なお、計算精度を保持するため、積算結果が所定の範囲内、例えば±πの範囲になるようにするのが望ましい。
図16(a)は単純に積算されて再構成された位相である。ところで、音響処理に単精度浮動小数などを使う場合は、有効桁数の関係から計算精度が低下して品質が低下する場合がある。また後述する波形構成部208で三角関数を使う際に内部で剰余を計算するが、剰余は計算時間がかかる場合が多い。以上を考えて、積算中に位相の範囲が±πを超えないように範囲調整を行うような工夫をしたほうが望ましい場合が多い。その場合の出力例は、図16(b)のようになる。
波形再構成部208は、振幅補間部204が出力した振幅と、位相再構成部207が出力する位相から下記数10式を計算することで、波形の再構成を行う。なお、tは波形再構成時の時刻(サンプル)、A’は前記振幅、φ’は前記位相である。
波形再構成部208が出力する信号の波形例を、図17に示す。振幅の変化は遅く、周波数は高くなっているのが見て取れる。本実施形態では、速度とピッチは独立して調整可能である。参考として、速度のみを変化させた波形を図18(a)に、ピッチのみ変化させた波形を図18(b)に示す。
波形合成部209は、波形再構成部208の出力を周波数帯分加算することで、波形の合成を行う。なお、ピッチシフトによりナイキスト周波数を超える周波数帯は加算から除外するのが望ましい。
以上のようにして、減衰系楽器の楽音信号に対しても音質の低下の少ない音声変換装置を提供することが可能となる。
ここで、図1の制御部106は、タイムストレッチ及びピッチシフト部の処理のための制御プログラムを記憶するメモリと、当該制御プログラムを実行するプロセッサとを含むコンピュータで実現されてよい。この場合、制御部106は、可搬記録媒体に記録された制御プログラムまたはネットワークから取得した制御プログラムを上記メモリ内に読み込んで実行するように構成されてよい。
以上の実施形態に関して、更に以下の付記を開示する。
(付記1)
入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力するフィルタバンク部と、
前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力する極座標変換部と、
前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行する振幅補間部と、
前記周波数帯域毎に、当該振幅補間部から出力される補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成する波形再構成部と、
前記波形再構成部が出力する前記周波数帯域毎の波形信号を合成した波形信号を出力する波形合成部と、
を備えることを特徴とする変換装置。
(付記2)
前記入力波形信号は楽音信号であり、ユーザに、楽器の種類を選択させ、当該選択された楽器の種類に応じて前記線形補間による補間演算処理と前記対数補間による補間演算処理のうちいずれを選択する補間方法選択部をさらに備える、
ことを特徴とする付記1に記載の変換装置。
(付記3)
前記位相信号に対する信号処理は、前記周波数帯域毎に、前記極座標変換部が出力する位相信号を微分して瞬時周波数信号を計算し、当該瞬時周波数信号を補間し、当該補間後の瞬時周波数信号に所定の乗数を乗算し、当該乗算後の瞬時周波数信号から前記位相信号を再構成して出力する処理である、
ことを特徴とする付記1または2のいずれかに記載の変換装置。
(付記4)
変換装置が、
入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力し、
前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力し、
前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行し、
前記周波数帯域毎に、前記補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成し、
前記出力される前記周波数帯域毎の波形信号を合成した波形信号を出力する、変換方法。
(付記5)
入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力するフィルタバンク実行処理と、
前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力する極座標変換処理と、
前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行する振幅信号補間処理と、
前記周波数帯域毎に、当該振幅補間処理で出力される補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成する波形再構成処理と、
前記波形再構成処理で出力される前記周波数帯域毎の波形信号を合成した波形信号を出力する波形合成処理と、
をコンピュータに実行させるためのプログラム。
101 音響データ取得部
102 タイムストレッチ及びピッチシフト部
103 音響データ再生部
104 表示部
105 操作部
106 制御部
201 フィルタバンク部
202 極座標変換部
203 瞬時周波数計算部
204 振幅補間部
205 瞬時周波数補間部
206 瞬時周波数乗算部
207 位相再構成部
208 波形再構成部
209 波形合成部
301 品質を保証する最低音高取得部
302 破棄長決定部
303 ブロック読み出し部
304 高速フーリエ変換部
305 フィルタ係数乗算
306 逆高速フーリエ変換部
307 干渉部分破棄部
401 減衰信号推定部
402 対数演算部
403 直線判定部
404 補間方法選択部
405 線形補間部
406 対数補間部

Claims (5)

  1. 入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力するフィルタバンク部と、
    前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力する極座標変換部と、
    前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行する振幅補間部と、
    前記周波数帯域毎に、当該振幅補間部から出力される補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成する波形再構成部と、
    前記波形再構成部が出力する前記周波数帯域毎の波形信号を合成した波形信号を出力する波形合成部と、
    を備えることを特徴とする変換装置。
  2. 前記入力波形信号は楽音信号であり、ユーザに、楽器の種類を選択させ、当該選択された楽器の種類に応じて前記線形補間による補間演算処理と前記対数補間による補間演算処理のうちいずれを選択する補間方法選択部をさらに備える、
    ことを特徴とする請求項1に記載の変換装置。
  3. 前記位相信号に対する信号処理は、前記周波数帯域毎に、前記極座標変換部が出力する位相信号を微分して瞬時周波数信号を計算し、当該瞬時周波数信号を補間し、当該補間後の瞬時周波数信号に所定の乗数を乗算し、当該乗算後の瞬時周波数信号から前記位相信号を再構成して出力する処理である、
    ことを特徴とする請求項1または2のいずれかに記載の変換装置。
  4. 変換装置が、
    入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力し、
    前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力し、
    前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行し、
    前記周波数帯域毎に、前記補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成し、
    前記出力される前記周波数帯域毎の波形信号を合成した波形信号を出力する、変換方法。
  5. 入力波形信号を複数の周波数帯に分割して当該周波数帯域毎に複素信号を出力するフィルタバンク実行処理と、
    前記周波数帯域毎に前記複素信号を極座標変換して振幅信号と位相信号を出力する極座標変換処理と、
    前記周波数帯域毎に、線形補間による補間演算処理と対数補間による補間演算処理のうち選択されたいずれか一方で、前記振幅信号に対して前記補間演算処理を実行する振幅信号補間処理と、
    前記周波数帯域毎に、当該振幅補間処理で出力される補間された振幅信号と、前記位相信号に対して信号処理を行って得た位相信号とから、前記周波数帯域毎の波形信号を再構成する波形再構成処理と、
    前記波形再構成処理で出力される前記周波数帯域毎の波形信号を合成した波形信号を出力する波形合成処理と、
    をコンピュータに実行させるためのプログラム。
JP2014092616A 2014-04-28 2014-04-28 変換装置、方法、およびプログラム Pending JP2015210419A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014092616A JP2015210419A (ja) 2014-04-28 2014-04-28 変換装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014092616A JP2015210419A (ja) 2014-04-28 2014-04-28 変換装置、方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2015210419A true JP2015210419A (ja) 2015-11-24

Family

ID=54612629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014092616A Pending JP2015210419A (ja) 2014-04-28 2014-04-28 変換装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2015210419A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091831A (zh) * 2020-01-08 2020-05-01 上海交通大学 无声唇语识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091831A (zh) * 2020-01-08 2020-05-01 上海交通大学 无声唇语识别方法及系统
CN111091831B (zh) * 2020-01-08 2023-04-07 上海交通大学 无声唇语识别方法及系统

Similar Documents

Publication Publication Date Title
JP7475410B2 (ja) サブバンドブロックに基づく高調波移調の改善
KR101341115B1 (ko) 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
US20100260353A1 (en) Noise reducing device and noise determining method
EP1840871B1 (en) Audio waveform processing device, method, and program
JP4127094B2 (ja) 残響音生成装置およびプログラム
CN108806721A (zh) 信号处理器
JP6241131B2 (ja) 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム
JP2015210419A (ja) 変換装置、方法、およびプログラム
JP2015210420A (ja) 変換装置、方法、およびプログラム
JP2015210421A (ja) フィルタバンク演算装置、変換装置、方法、およびプログラム
RU2801960C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2800676C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2789688C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2810281C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2772356C2 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
CN113140204B (zh) 一种用于脉冲星信号控制的数字音乐合成方法及设备
AU2023202547B2 (en) Improved Subband Block Based Harmonic Transposition
RU2813317C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2796943C2 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
AU2019240701B2 (en) Improved Subband Block Based Harmonic Transposition
Kreutzer et al. A parametric model for spectral sound synthesis of musical sounds
Triki Harmonize-Decompose Audio Signals with Global Amplitude and Frequency Modulations
Kreutzer et al. Time domain attack and release modeling-applied to spectral domain sound synthesis
JP2004518164A (ja) オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法
LUPU MIDI VIOLIN IMPLEMENTED ON TMS320C31 DSP STARTER KIT