JP2014026055A - 音響信号分析方法、装置、及びプログラム - Google Patents
音響信号分析方法、装置、及びプログラム Download PDFInfo
- Publication number
- JP2014026055A JP2014026055A JP2012165161A JP2012165161A JP2014026055A JP 2014026055 A JP2014026055 A JP 2014026055A JP 2012165161 A JP2012165161 A JP 2012165161A JP 2012165161 A JP2012165161 A JP 2012165161A JP 2014026055 A JP2014026055 A JP 2014026055A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- note
- model
- expression
- command input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
【解決手段】基本周波数抽出部18は、音響信号の基本周波数軌跡を抽出する。初期状態系列推定部22は、ノート指令入力信号及び表現指令入力信号の初期状態系列を推定する。信号分離部24は、ノート成分、表現成分、及び微細変動成分の組からなる完全データの条件付き期待値及び完全データの自己相関の条件付き期待値を計算する。モデルパラメータ更新部26は、目的関数をモデルパラメータに関して最大化するようにモデルパラメータを更新する。パラメータ収束判定部36は、予め定められた終了条件を満たすまで、信号分離部24及びモデルパラメータ更新部26による処理を繰り返し、終了条件を満たすと判定された場合に、出力部16が、モデルパラメータを出力する。
【選択図】図3
Description
本発明では、歌唱する楽譜の音符列を表すノート指令入力信号と表現指令入力信号によって駆動される歌声F0軌跡の生成過程モデルを提案し、歌声の基本周波数(F0)軌跡から、オーバーシュートやポルタメントを表現するノート制御機構(フィルタ)のパラメータ(ノート制御パラメータと呼ぶ)およびノート指令入力信号を構成するパラメータ(ノート指令入力信号パラメータと呼ぶ)、ビブラートなどの表現意図を表す表現制御機構(フィルタ)のパラメータ(表現制御パラメータと呼ぶ)および表現指令入力信号を構成するパラメータ(表現指令入力信号パラメータと呼ぶ)、そして微細変動成分を表現するパラメータ(微細変動成分パラメータと呼ぶ)を抽出する。ここで、ノート指令入力信号は、図1に示す通り、楽譜に記載される音符の並び(階段状に音階が変化する)を表現する。一方で、表現指令入力信号は歌唱者の音楽的な表現意図(ノート指令入力信号に比べて細かいステップ状の指令)を表現する。このモデルは、対数スケールのF0軌跡y(t)(ここで、tは時間を表す)が3つの成分の重ね合わせで表現されることを想定する。図1に示されるノート成分と表現成分は先に述べた指令信号によって駆動されるノート制御機構、表現制御機構の出力である。ノート制御機構と表現制御機構はある種のフィルタに相当し、線形2次系によって表現される。ノート制御機構は、オーバーシュート、ポルタメントのようなノート(音符)の立ち上がり方を線形2次系によって制御する。表現制御機構は、ビブラートなどの音楽的な意図表現を線形2次系によって制御する。ただし、表現制御機構は、線形2次系に含まれる1つの系、「臨界制動2次系(上記(1)式のζ=1の場合)」で構成する(非特許文献3)。最後に、図1に示される微細変動成分は、10Hz以上の不規則な振動成分を想定する(非特許文献3)。本発明では、このようなF0軌跡の生成過程を離散時間領域で表現し、統計的手法に基づいてF0軌跡生成系のモデルパラメータを推定するためにフレームワークを提供する。
<原理>
次に、F0軌跡生成系のモデルパラメータを推定する原理について説明する。
<提案モデルの離散時間表現>
まず、本実施形態の提案モデルの離散時間表現について説明する。
と書くことができる。ただし、
および、φ、ψは、φ=1/(Ωt0)、ψ=ζと表現される。ここで、kを離散時刻インデックスとし、ノート指令入力信号およびノート成分の離散時間表現をそれぞれun[k]、yn[k]とすると、yn[k]は、ノート制御パラメータφ、ψによって特性が決まる拘束つき全極モデルからの出力
とみなすことができる。同様に、表現指令入力信号ue[k]と表現成分ye[k]の関係も
と書くことができる。ただし、b2=ξ2,b1=−2ξ(1+ξ),b0=1+2ξ+ξ2であり、表現制御パラメータξはξ=1/(Ωt0)と表現される。微細変動成分yf(t)の離散時間表現をyf[k]とすると、提案モデルによる歌声F0軌跡の離散時間表現は、これら3つの成分の和
で与えられる。
次に、歌声のF0生成モデルの統計モデル化について説明する。
のように正規分布する確率変数と見なし、平均ν[k]が、図2のようなノート指令入力信号と表現指令入力信号の組み合わせの状態に関する状態遷移に伴って変化するモデルを考える。これはHMMに他ならず、このようにo[k]をHMMでモデル化したことにより、状態遷移の経路制限(状態遷移確率の設定)を通して、ν[k]に制約を与えることが可能となる。
と記述する。なお、音高シフトパラメータ{di}i=1 I、分散パラメータσn 2が、ノート指令入力信号パラメータであり、表現指令の大きさパラメータ{Be (i,j)}i=1,j=1 I,J、分散パラメータσe 2が、表現指令入力信号パラメータである。また、平均値系列{μn[k]}k=1 Kおよび{μe[k]}k=1 Kは、状態系列{sk}k=1 Kが与えられたもとで、
で与えられる。
が言える。ここで、N(μn,Σn)は、平均μn、分散Σnのガウス分布を表わす。IはK×Kの単位行列を表す。ノート成分yn:= (yn[1],...,yn[K])Tとノート指令入力信号unの関係、および表現成分ye:= (ye[1],...,ye[K])Tと表現指令入力信号ueの関係は、
と置くと、それぞれ、
と表現できる。ここでは、ノート制御パラメータφ、ψがノートごとに異なるものと想定し、{φ(i)、ψ(i)}i=1 Iをパラメータとして拡張する(非特許文献3)。したがって、ノート成分と表現成分の確率密度関数は、
が導出される。微細変動成分yf[K]はガウス性白色雑音を想定し、
と表現する。なお、分散パラメータσf 2が、微細変動成分パラメータである。
で与えられる。以上より、
が歌声F0軌跡yが与えられたときのモデルパラメータΘの尤度関数である。
とする。
次に、パラメータ推定アルゴリズムについて説明する。
で与えられる。このとき、完全データの対数尤度の期待値を表わすQ関数Q(Θ,Θ´)は、
となる。ここで、tr(・)は行列のトレースを表し、E[x|y;Θ´]とE[xxT|y;Θ´]は、完全データの条件付き期待値、完全データの自己相関の条件付き期待値であり、条件付きガウス分布の性質より、
と書ける。Eステップでは、直前のステップで更新されたパラメータをΘ´に代入し、上記に基づいてE[x|y; Θ´]とE[xxT|y; Θ´]が算出される。yn,ye,yfに対応するように、E[x|y; Θ´]及びE[xxT|y; Θ´]を
のように区分表現すると、Q関数は
と書き直せて、これを用いて各パラメータについてMステップの更新式を求めることができる。
Q関数の中でs:={sk}k=1 Kに関する項は
となる。ここで、o[k]:=([A−xn]k,[B−xe]k)Tであり、[・]kはベクトルのk番目の要素を表す。これを最大化する状態系列{sk}k=1 Kは動的計画法により効率的に解くことができる。まず、状態S1,1について
とおくと、k=2,3,...,Kについて逐次的にδk(Si,j)を
により計算できる。各ステップで選択される状態番号
を記憶しておくことで、k=Kまで到着後にsk-1=ψk(sk)(k=K,K−1,...,2)により選択された状態番号を辿っていくと最適経路s1,..., skを得る。
φ(i)とψ(i)に関する事前分布をφ(i)〜N(μφ,σ2 φ)、ψ(i)〜N(μψ,σ2 ψ)とする。Q関数の中でφ(i)とψ(i)に関係する項は、
となる。ここで|T|は集合Tの要素数を表す。また、[μ]Tは、集合Tの要素をインデックスとして、μからそのインデックスに相当する要素を取り出した部分ベクトルを表す。今、
として、上記(4)式から、A(i)は、
と表現される。ここで、[U]Tは集合Tの要素をインデックスとして、行列Uからそのインデックスに相当する行ベクトルを取り出して構成される部分行列を意味する。ニュートン・ラフソン法を利用して、I2(φ(i)、ψ(i))を最大化するφ(i)とψ(i)が数値的に導出される。
ξに関する事前分布をξ〜N(μξ,σξ 2)とする。Q関数の中でξに関係する項は、
となる。ニュートン・ラフソン法を利用して、I3(ξ)を最大化するξが数値的に導出される。
diとBe (i,j)に関して、それぞれ事前分布をdi〜N(0,σd 2)と
とする。残されたパラメータの更新式は、
と導出される。EMアルゴリズムに基づくパラメータ推定アルゴリズムをまとめると、
E-step:E[x|y;Θ´], E[xxT|y;Θ´]の更新
M-step:状態系列、ノート制御パラメータ、表現制御パラメータ、上記(34)〜(38)式の更新
収束判定:事後確率P(Θ|y)、もしくはパラメータ値が収束していなければ、E−stepへ
次に、図3を参照して、本発明の実施形態による音響信号分析装置の構成を説明する。本発明の実施の形態に係る音響信号分析装置10は、歌声を示す音響信号の基本周波数軌跡を、ノート指令入力信号と線形2次系システムによって導出されるノート制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られるノート成分と、表現指令入力信号と臨界制動2次系システムによって導出される表現制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られる表現成分と、微細変動成分との和で表したときの、ノート指令入力信号を表すモデルを構成するためのノート指令入力信号パラメータと、ノート制御フィルタ特性を表すモデルを構成するためのノート制御パラメータと、表現指令入力信号を表すモデルを構成するための表現指令入力信号パラメータと、表現制御フィルタ特性を表すモデルを構成するための表現制御パラメータと、前記微細変動成分を表すモデルを構成するための微細変動成分パラメータとを推定する。ここで、ノート指令入力信号は階段状の信号であり、各時刻の状態を示す状態系列パラメータと、各音符の音高からの推移を示す音高シフトパラメータとからなるノート指令入力信号パラメータを用いてモデル化され、表現指令入力信号は矩形状のパルス信号であり、各時刻の状態を示す状態系列パラメータと、各音符の各状態における表現指令の大きさを表す表現振幅パラメータとからなる表現指令入力信号パラメータを用いて、隠れマルコフモデルによって確率モデル化され、微細変動成分は、微細変動成分パラメータからなるガウス性白色雑音として確率モデル化される。図3に示すように、音響信号分析装置10は、入力部12と、後述するパラメータ推定処理ルーチンを実行するコンピュータ14と、コンピュータ14の処理により算出されたモデルパラメータを出力する出力部16と、を備えている。
に固定されパラメータ初期値データベース20に蓄積される。事前分布におけるパラメータはμφ=6,σφ 2=0.1,μψ=0.6, σψ 2=0.02,μξ=3, σξ 2=0.1,σd 2=2500,σB 2=100,
(1≦i≦I)に固定され、パラメータ初期値データベース20に蓄積される。音高シフトパラメータ{di}i=1 I、表現指令の大きさパラメータ{Be (i,j)}i=1,j=1 I,Jの初期値はすべて0としてパラメータ初期値データベース20に蓄積される。分散パラメータσn 2,σe 2の初期値は100としてパラメータ初期値データベース20に蓄積される。これらのパラメータの初期値は実験的に決定した値である。ノート制御パラメータ{φ(i),ψ(i)}i=1 Iの初期値は、上記の非特許文献3で得られた知見に基づいて、φ= 6.5rad/ms,ψ= 0.5としてパラメータ初期値データベース20に蓄積される。表現制御パラメータξの初期値も上記の非特許文献3で得られた知見に基づいて、ξ= 0.3としてパラメータ初期値データベース20に蓄積される。
次に、本実施の形態に係る音響信号分析装置10の作用について説明する。まず、歌唱曲の楽譜から得られる各音符の音高及び音符数が、入力部12により音響信号分析装置10に入力されると、パラメータ初期値データベース20に格納される。そして、分析対象の音響信号として、観測された当該歌唱者の歌声音響信号の時系列データが、音響信号分析装置10に入力されると、図4に示すパラメータ推定処理ルーチンが実行される。
次に、本発明の効果および作用を示すため、本発明の実施形態による音響信号分析装置を用いた実験結果を以下に説明する。ここでは、上記の実施形態を実装して、基本周波数軌跡のノート成分、表現成分、微細変動成分への分解性能を評価する。
図5にパラメータの推定結果例を示す。左側がテストデータであり、右側が推定結果である。左右を比較すると正解に近いパラメータが推定されることを定性的に判断できる。それぞれの二乗平均平方根誤差(Root Mean Square Error,RMSE)を計算したところ、ノート成分はRMSE=7.47cent、表現成分はRMSE=9.51cent であった。対数周波数上の100centは半音に相当し、RMSEがその10%以下に収まっているため、パラメータ学習アルゴリズムの動作確認および局所最適化問題を解決できていることを確認できた。
12 入力部
14 コンピュータ
16 出力部
18 基本周波数抽出部
20 パラメータ初期値データベース
22 初期状態系列推定部
24 信号分離部
26 モデルパラメータ更新部
28 ノート制御パラメータ更新部
30 表現制御パラメータ更新部
32 指令入力信号パラメータ更新部
34 微細変動成分パラメータ更新部
36 パラメータ収束判定部
Claims (8)
- 歌声を示す音響信号の基本周波数軌跡を、ノート指令入力信号とノート制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られるノート成分と、表現指令入力信号と表現制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られる表現成分と、微細変動成分との和で表したときの、前記ノート指令入力信号を表すモデルを構成するためのノート指令入力信号パラメータと、前記ノート制御フィルタ特性を表すモデルを構成するためのノート制御パラメータと、前記表現指令入力信号を表すモデルを構成するための表現指令入力信号パラメータと、前記表現制御フィルタ特性を表すモデルを構成するための表現制御パラメータと、前記微細変動成分を表すモデルを構成するための微細変動成分パラメータとを推定する音響信号分析方法であって、入力された歌唱旋律の各音符の音高を示す音高目標値時系列、及び前記ノート指令入力信号パラメータと前記ノート制御パラメータと前記表現指令入力信号パラメータと前記表現制御パラメータと前記微細変動成分パラメータとからなるモデルパラメータの初期値を記憶したパラメータ初期値データベースと、基本周波数抽出手段と、初期状態系列推定手段と、信号分離手段と、モデルパラメータ更新手段と、収束判定手段と、パラメータ出力手段とを含む音響信号分析装置における音響信号分析方法であって、
前記基本周波数抽出手段によって、歌唱者の歌声を示す音響信号を入力として、前記音響信号の基本周波数軌跡を抽出し、
前記初期状態系列推定手段によって、前記音高目標値時系列と前記基本周波数軌跡とに基づいて、前記ノート指令入力信号及び前記表現指令入力信号の各時刻の状態を示す初期状態系列を推定し、
前記信号分離手段によって、前記音高目標値時系列、前記基本周波数軌跡、及び前記モデルパラメータの初期値または前回更新された前記モデルパラメータに基づいて、前記基本周波数軌跡と、前記モデルパラメータとが与えられたときの、前記ノート成分、前記表現成分、及び前記微細変動成分の組からなる完全データの条件付き期待値及び前記完全データの自己相関の条件付き期待値を計算し、
前記モデルパラメータ更新手段によって、前記信号分離手段によって計算された前記完全データの条件付き期待値及び前記完全データの自己相関の条件付き期待値、並びに前記モデルパラメータの事前確率を用いて表わされる、前記完全データの対数尤度関数の期待値を表わす関数を、目的関数とし、前記音高目標値時系列、前記基本周波数軌跡、及び前記モデルパラメータの初期値または前回更新された前記モデルパラメータに基づいて、前記目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新し、
前記収束判定手段によって、予め定められた終了条件を満たすまで、前記信号分離手段による計算及び前記更新手段による更新を繰り返し、
前記パラメータ出力手段によって、前記パラメータ収束判定手段により前記終了条件を満たすと判定された場合に、前記モデルパラメータを出力する
音響信号分析方法。 - 前記ノート指令入力信号は階段状の信号であり、各時刻の状態を示す状態系列パラメータと、各音符の音高からの推移を示す音高シフトパラメータとからなる前記ノート指令入力信号パラメータを用いてモデル化される請求項1記載の音響信号分析方法。
- 前記表現指令入力信号は矩形状のパルス信号であり、各時刻の状態を示す状態系列パラメータと、各音符の各状態における表現指令の大きさを表わす表現振幅パラメータとからなる前記表現指令入力信号パラメータを用いて、隠れマルコフモデルによって確率モデル化される請求項1又は2記載の音響信号分析方法。
- 前記微細変動成分は、前記微細変動成分パラメータからなるガウス性白色雑音として確率モデル化される請求項1〜請求項3の何れか1項記載の音響信号分析方法。
- 前記信号生成系のノート制御フィルタ特性は、線形2次系システムによって導出されるフィルタで表され、前記ノート制御パラメータは、線形2次系システムの固有周波数に反比例するパラメータと、線形2次系システムの減衰率パラメータである請求項1〜請求項4の何れか1項記載の音響信号分析方法。
- 前記信号生成系の表現制御フィルタ特性は、臨界制動2次系システムによって導出されるフィルタで表され、前記表現制御パラメータは、臨界制動2次系システムの固有周波数に反比例するパラメータである請求項1〜請求項5の何れか1項記載の音響信号分析方法。
- 歌声を示す音響信号の基本周波数軌跡を、ノート指令入力信号とノート制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られるノート成分と、表現指令入力信号と表現制御フィルタ特性を表すインパルス応答信号との畳みこみによって得られる表現成分と、微細変動成分との和で表したときの、前記ノート指令入力信号を表すモデルを構成するためのノート指令入力信号パラメータと、前記ノート制御フィルタ特性を表すモデルを構成するためのノート制御パラメータと、前記表現指令入力信号を表すモデルを構成するための表現指令入力信号パラメータと、前記表現制御フィルタ特性を表すモデルを構成するための表現制御パラメータと、前記微細変動成分を表すモデルを構成するための微細変動成分パラメータとを推定する音響信号分析装置であって、
歌唱者の歌声を示す音響信号を入力として、前記音響信号の基本周波数軌跡を抽出する基本周波数抽出手段と、
入力された歌唱旋律の各音符の音高を示す音高目標値時系列、及び前記ノート指令入力信号パラメータと前記ノート制御パラメータと前記表現指令入力信号パラメータと前記表現制御パラメータと前記微細変動成分パラメータとからなるモデルパラメータの初期値を記憶したパラメータ初期値データベースと、
前記音高目標値時系列と前記基本周波数軌跡とに基づいて、前記ノート指令入力信号及び前記表現指令入力信号の各時刻の状態を示す初期状態系列を推定する初期状態系列推定手段と、
前記音高目標値時系列、前記基本周波数軌跡、及び前記モデルパラメータの初期値または前回更新された前記モデルパラメータに基づいて、前記基本周波数軌跡と、前記モデルパラメータとが与えられたときの、前記ノート成分、前記表現成分、及び前記微細変動成分の組からなる完全データの条件付き期待値及び前記完全データの自己相関の条件付き期待値を計算する信号分離手段と、
前記信号分離手段によって計算された前記完全データの条件付き期待値及び前記完全データの自己相関の条件付き期待値、並びに前記モデルパラメータの事前確率を用いて表わされる、前記完全データの対数尤度関数の期待値を表わす関数を、目的関数とし、前記音高目標値時系列、前記基本周波数軌跡、及び前記モデルパラメータの初期値または前回更新された前記モデルパラメータに基づいて、前記目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新手段と、
予め定められた終了条件を満たすまで、前記信号分離手段による計算及び前記更新手段による更新を繰り返し行う収束判定手段と、
前記パラメータ収束判定部により前記終了条件を満たすと判定された場合に、前記モデルパラメータを出力するパラメータ出力手段と、
を含む音響信号分析装置。 - コンピュータに、請求項1〜請求項6の何れか1項記載の音響信号分析方法の各ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012165161A JP5771575B2 (ja) | 2012-07-25 | 2012-07-25 | 音響信号分析方法、装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012165161A JP5771575B2 (ja) | 2012-07-25 | 2012-07-25 | 音響信号分析方法、装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014026055A true JP2014026055A (ja) | 2014-02-06 |
JP5771575B2 JP5771575B2 (ja) | 2015-09-02 |
Family
ID=50199759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012165161A Active JP5771575B2 (ja) | 2012-07-25 | 2012-07-25 | 音響信号分析方法、装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5771575B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015181001A (ja) * | 2014-03-18 | 2015-10-15 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデル決定用の方法と装置 |
JP2015191668A (ja) * | 2014-03-28 | 2015-11-02 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデルを決定する方法と装置 |
JP2015201176A (ja) * | 2014-03-18 | 2015-11-12 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデルを決定する方法および装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011090199A (ja) * | 2009-10-23 | 2011-05-06 | Nagoya Univ | 音声処理装置およびプログラム |
-
2012
- 2012-07-25 JP JP2012165161A patent/JP5771575B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011090199A (ja) * | 2009-10-23 | 2011-05-06 | Nagoya Univ | 音声処理装置およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015181001A (ja) * | 2014-03-18 | 2015-10-15 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデル決定用の方法と装置 |
JP2015201176A (ja) * | 2014-03-18 | 2015-11-12 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデルを決定する方法および装置 |
JP2015191668A (ja) * | 2014-03-28 | 2015-11-02 | エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd. | リレーショナルモデルを決定する方法と装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5771575B2 (ja) | 2015-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107924678B (zh) | 语音合成装置、语音合成方法及存储介质 | |
Yi et al. | Singing voice synthesis using deep autoregressive neural networks for acoustic modeling | |
Ohishi et al. | A Stochastic Model of Singing Voice F0 Contours for Characterizing Expressive Dynamic Components. | |
JP5771575B2 (ja) | 音響信号分析方法、装置、及びプログラム | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP6505346B1 (ja) | Dnn音声合成の教師無し話者適応を実現するコンピュータシステム、そのコンピュータシステムにおいて実行される方法およびプログラム | |
JP6044119B2 (ja) | 音響解析装置およびプログラム | |
JP4392621B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Gabrielli et al. | A multi-stage algorithm for acoustic physical model parameters estimation | |
JP3541224B2 (ja) | 音源の分離方法および分離装置 | |
JP2018013722A (ja) | 音響モデル最適化装置及びそのためのコンピュータプログラム | |
JP2012058343A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2012027196A (ja) | 信号分析装置、方法、及びプログラム | |
JP2004117503A (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
JP4392622B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5188300B2 (ja) | 基本周波数軌跡モデルパラメータ抽出装置、基本周波数軌跡モデルパラメータ抽出方法、プログラム及び記録媒体 | |
US11798579B2 (en) | Device, method, and program for analyzing speech signal | |
JP5318042B2 (ja) | 信号解析装置、信号解析方法及び信号解析プログラム | |
JP6142401B2 (ja) | 音声合成モデル学習装置、方法、及びプログラム | |
JP6101599B2 (ja) | 音響信号分析装置、音量軌跡予測装置、方法、及びプログラム | |
JP6564744B2 (ja) | 信号解析装置、方法、及びプログラム | |
JP6137708B2 (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
Sung et al. | Factored MLLR adaptation for singing voice generation | |
JP2015049433A (ja) | 音声信号解析装置、方法、及びプログラム | |
Hashimoto et al. | Overview of NIT HMMbased speech synthesis system for Blizzard Challenge 2011 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5771575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |