JP2016133522A - 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム - Google Patents
声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム Download PDFInfo
- Publication number
- JP2016133522A JP2016133522A JP2015006044A JP2015006044A JP2016133522A JP 2016133522 A JP2016133522 A JP 2016133522A JP 2015006044 A JP2015006044 A JP 2015006044A JP 2015006044 A JP2015006044 A JP 2015006044A JP 2016133522 A JP2016133522 A JP 2016133522A
- Authority
- JP
- Japan
- Prior art keywords
- egg
- time
- signal
- glottal
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
Description
本実施形態では、実時間で、EGG信号が与えられた場合に、EGG声門閉鎖時刻を推定する方法を提案し、さらに、音声信号とEGG信号が与えられた場合、EGG声門閉鎖時刻と音声信号のLPC残差信号との相互相関を計算することで、EGG声門閉鎖時刻に対するLPC残差信号の遅延を推定し、推定した遅延とEGG声門閉鎖時刻とLPC残差信号とを用いてピッチマーク時刻を推定する方法を提案する。
図1は第一実施形態に係るピッチマーク時刻推定装置100の機能ブロック図を、図2はその処理フローを示す。
EGG声門閉鎖時刻推定部110は、EGG信号sE(t)を受け取り、EGG信号sE(t)を用いて、EGG声門閉鎖時刻{ti E}を推定し(S110)、出力する。
EGG差分算出部111は、EGG信号sE(t)を受け取り、EGG信号sE(t)を用いて、EGG差分信号ΔsE(t)=sE(t)-sE(t-1)(図11参照)を算出し(S111)、出力する。
基本周期推定部112は、EGG信号sE(t)を受け取り、EGG信号sE(t)を用いて、EGG信号sE(t)の基本周期F0を推定し(S112)、出力する。例えば、次式により、EGG信号sE(t)の自己相関が最大になる時刻を基本周期F0として求める。
時刻検出部113は、少なくともEGG差分信号ΔsE(t)と基本周期F0とを受け取り、これらの値を用いて、EGG声門閉鎖時刻{ti E}を推定し(S113)、出力する(図11参照)。本実施形態では2つの推定方法を提案する。
基本周期F0毎にEGG差分信号ΔsE(t)が極大値をとる時点を検出し、EGG声門閉鎖時刻{ti E}とする。例えば、基本周期F0よりも大きな周期r×F0の矩形窓を用いて、EGG差分信号ΔsE(t)から信号を切り出し、切り出された信号の最大値を検出する。例えば、r×F0個のEGG差分信号ΔsE(t-r×F0+1),ΔsE(t-r×F0+2),…,ΔsE(t)の最大値を検出し、最大値に対応する時刻をEGG声門閉鎖時刻ti Eとする。この処理を、窓位置を時間的に変化させて行うことで、EGG声門閉鎖時刻{ti E}を検出することができる。係数rは1よりも若干大きな値(例えば1.2など)に設定するとよい。
図5は本推定方法を実施する場合の時刻検出部113の機能ブロック図を、図6はその処理フローを示す。
零交差時刻算出部113Aは、EGG信号sE(t)を受け取り、EGG信号sE(t)の零交差時刻{ti X}を算出し(S113A)、出力する。例えば、次式によって定義される、平均値を減算したEGG信号の零交差時刻{ti X}を計算する。
候補探索部113Bは、零交差時刻{ti X}とEGG差分信号ΔsE(t)と基本周期F0とを受け取り、零交差時刻{ti X}を含み、基本周期F0に対応する探索幅|(wR+wL)×F0|を持つ探索範囲(ti X-wL×F0)〜(ti X+wR×F0)から、EGG差分信号ΔsE(t)が最大となる時刻をEGG声門閉鎖時刻の候補{t^i E}として探索し(S113B)、出力する。例えば、次式により、候補{t^i E}を求める。
想定される基本周期の最小値をF'0とすると、検出される声門閉鎖時刻の最大値(最大個数)はN/(F'0)となる。
ピッチマーク時刻推定部120は、EGG信号sE(t)に対応する音声信号sS(t)とEGG声門閉鎖時刻{ti E}を受け取り、これらの値を用いて、ピッチマーク時刻{ti S}を推定し(S120)、出力する。
遅延推定部121は、音声信号sS(t)とEGG声門閉鎖時刻{ti E}を受け取り、音声信号sS(t)から得られるLPC残差信号e(t)(詳細は後述する)と、EGG声門閉鎖時刻{ti E}から得られるインパルス列δ(t,{ti E})(詳細は後述する)との相互相関に基づき、EGG信号sE(t)に対するLPC残差信号e(t)の遅延τを推定し(S121)、出力する。
高域強調部121Aは、音声信号sS(t)を受け取り、音源スペクトルの傾斜特性を取り除くために高域強調した音声信号ΔsS(t)を次式により求め(S121A)、出力する。
LPC残差取得部121Cは、音声信号ΔsS(t)を受け取り、LPC分析によりLPC係数{ak}を求める。ただし、kはLPC分析の次数を表すインデックスである。さらに、LPC残差取得部121Cは、音声信号ΔsS(t)とLPC係数{ak}とを用いて、次式によりLPC残差信号e(t)(図11参照)を求め(S121C)、出力する。
インパルス列算出部121Eは、EGG声門閉鎖時刻{ti E}を受け取り、この値を用いて、次式で表されるインパルス列δ(t,{ti E})を算出し(S121E)、出力する。
相互相関推定部121Dは、LPC残差信号e(t)とインパルス列δ(t,{ti E})とを受け取り、次式により、LPC残差信号e(t)とインパルス列δ(t,{ti E})との相互相関を推定することで(S121D)、EGG信号sE(t)に対するLPC残差信号e(t)の遅延τを推定し、出力する。
時刻推定部122は、遅延τとEGG声門閉鎖時刻{ti E}とLPC残差信号e(t)とを受け取り、EGG声門閉鎖時刻ti Eに遅延τを加えた値ti E+τを中心として、±Δ1の範囲(ti E+τ±Δ1)に含まれる時刻のうち、対応するLPC残差信号e(t)が最大または最小となるものを、ピッチマーク時刻ti Sとして推定し(S122)、出力する。なお、Δ1を基本周期F0より小さい値とする。遅延τの分散は非常に小さいため、Δ1は1か2の微小値に設定すればよい。本実施形態では2つの推定方法を提案する。
次式により、範囲(ti E+τ±Δ1)に含まれる時刻のうち、対応するLPC残差信号e(t)の振幅が最大となる時刻tを、ピッチマーク時刻ti Sとして推定する。
図9は本推定方法を実施する場合の時刻推定部122の機能ブロック図を、図10はその処理フローを示す。
最小値最大値時刻取得部122Aは、遅延τとEGG声門閉鎖時刻{ti E}とLPC残差信号e(t)とを受け取り、次式により、範囲(ti E+τ±Δ1)において、LPC残差信号e(t)が最小値または最大値となる時刻{t^0i -},{t^0i +}を取得し(S122A)、出力する。
最大値時刻取得部122Bは、時刻{t^0i -},{t^0i +}を受け取り、次式により、それぞれの要素の内、範囲(t^0i -±Δ2)、(t^0i +±Δ2)におけるLPC残差信号e(t^0i --i)(ただし、i∈{-Δ2,-Δ2+1,…,+Δ2,})と、LPC残差信号e(t^0i -)との差分の総和が最も大きい時刻t^0 -及びt^0 +を求め(S122B)、出力する。
選択部122Cは、時刻t^0 -,t^0 +を受け取り、t^0 -,t^0 +のうち、直前の分析フレーム(n-1)の時刻t^0 (n-1)近傍との相関の高い方を現在の分析フレームnの時刻t^0 (n)として選択し(S122C)、出力する。
位相等化残差検出部122Dは、時刻t^0とLPC残差信号e(t)とを受け取り、次式により、位相等化残差信号eP(t)(図11参照)を求め(S122D)、出力する。
ピーク取得部122Eは、位相等化残差信号eP(t)を受け取り、所定の閾値と比較し、閾値を超える時刻tをピッチマーク時刻{ti S}とし(s122E)、出力する。位相等化残差検出部122Dの処理によって、ピッチマーク時刻の候補の1つt^0の近傍と相関の高い時刻の振幅が強調されるため(図11参照)、ピーク取得部122Eでピークを取得することでピッチマーク時刻を取得することができる(非特許文献1参照)。
以上の構成により、従来よりも高精度でピッチマーク時刻を推定することができる。EGG信号を用いることで、雑音が混入した音声信号や基本周波数が高い音声信号を対象にした場合であっても、ピッチマーク時刻を正確に推定することができる。このように求めたピッチマーク時刻を用いることで、より頑健に、音声合成、音声変換及び音声分析等を行うことができる。
本実施形態では、EGG声門閉鎖時刻{ti E}を用いたが、ピッチマーク時刻{ti S}と位相同期している時刻であれば、EGG声門閉鎖時刻{ti E}は、他の時刻、例えばEGG信号が振幅極大値をとる時刻で代用することが出来る。ピッチマーク時刻{ti S}と位相同期している時刻は、EGG声門閉鎖時刻{ti E}に対応する時刻とも言える。
また、音声合成への応用の観点から、隣接した2つのピッチ波形を接続した信号の、スペクトル歪を小さくしたいことがある。そのためには、音声信号に基づいてピッチ波形の接続点を検出することが考えられるが、この場合においても、EGG信号を併用することが有効である。例えば、EGG信号の極大値及び極小値の時刻に、EGG信号と音声信号(もしくはEGG差分信号と音声信号)の相互相関が最大になる遅延を加算することで、ピッチ波形の接続点を決定することができる。
ピッチ波形接続点推定装置200は、音声合成に用いるピッチ波形の接続点を推定する。
EGG声門閉鎖時刻推定部210は、EGG信号sE(t)を受け取り、EGG信号sE(t)を用いて、EGG声門閉鎖時刻{ti E}に対応する値であるEGG信号sE(t)の極大値及び極小値(図11参照)の時刻{ti max}及び{ti min}を推定し(S210)、出力する。
ピッチ波形接続点推定部220は、EGG信号に対応する音声信号sS(t)と極大値及び極小値の時刻{ti max}及び{ti min}を受け取り、これらの値を用いて、ピッチ波形の接続点を推定し(S220)、出力する。
加算部222は、極大値及び極小値の時刻{ti max}及び{ti min}と遅延τとを受け取り、極大値及び極小値の時刻{ti max}及び{ti min}に遅延τを加えた値を、接続点{ti lin}として推定し(S222)、出力する。
このような構成とすることで、高精度でピッチ波形の接続点を推定することができる。
また、その他のピッチ波形接続点を推定する方法として、LPC残差信号のピーク近傍時刻から、基本周期の10-20%遅延した時刻を中心として窓関数を適用した場合に、ピッチ波形のスペクトル歪が最小になること(参考文献1)から、ピッチマーク時刻{ti S}から基本周期F0の10-20%遅延した範囲における、音声信号sS(t)の振幅最大値をピッチ波形の接続点とすることも可能である。この場合、第一実施形態で求めたピッチマーク時刻{ti S}を用いればよい。
(参考文献1)望月亮, 新居康彦, 西村洋文, 本多高, 「駆動点同期型ピッチ波形抽出法」, 日本音響学会誌, 1997, 53, 772-778.
本実施形態では、第一実施形態のピッチマーク時刻推定装置100で推定したピッチマーク時刻{ti S}を用いた応用例について説明する。
上記の方法によって得られたピッチマーク時刻{ti S}を利用して、声道スペクトルを高精度に推定する方法について説明する(特許文献3参照)。
さらに、本実施形態では、第三実施形態の声道スペクトル推定装置によって得られたLPC係数{a^i}を用いて、音声のフォルマント周波数を変換する方法を説明する(参考文献2参照)。
(参考文献2)Villacorta, V.M., Perkell, J.S., and Guenther, F.H., "Sensorimotor adaptation to feedback perturbations of vowel acoustics and its relation to perception", J. Acoust. Soc. Am., 2007, 122, p.2306-2319.
フォルマント周波数{Fi}とその帯域幅{Bi}は、LPC係数{a^i}によって得られる予測多項式の根{zi}から次式で得られる。なおFsはサンプリング周波数である。
<声質変換装置>
第一実施形態のピッチマーク時刻推定装置100で推定したピッチマーク時刻を利用して、音声の声質を変換する方法について説明する(特許文献1参照)。EGG信号から抽出したピッチマーク時刻{ti S}に基づき、ピッチマーク時刻間隔でピッチ波形を作成する。即ち、i番目のピッチ波形si seg(t)は次式で定義される。
<話速変換装置>
ピッチ波形を、増やすもしくは間引くことで、音声の発話速度を変更することができる。
<二話者音声合成装置>
第一実施形態のピッチマーク時刻推定装置100で推定したピッチマーク時刻を利用して、2人の話者が生成した2つの音声を接続する方法について説明する(特許文献2参照)。以下、話者1の音声から話者2の音声に接続する場合を示す。
(参考文献3)Moulines, M., and Charpentier, F., "Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones", Speech Commun., 1990, 9, 453-467.
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (8)
- EGG信号を用いて、EGG差分信号を算出するEGG差分算出部と、
前記EGG信号の基本周期を推定する基本周期推定部と、
前記EGG信号の零交差時刻を算出する零交差時刻算出部と、
前記零交差時刻を含み、前記基本周期に対応する探索幅を持つ探索範囲から、前記EGG差分信号が最大となる時刻をEGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻の候補として探索する候補探索部と、
想定される基本周期の最小値をF'0とし、分析フレーム長をNとし、Δを最小値F'0よりも小さい正の整数とし、(1)前記候補の個数がN/F'0以下の場合、前記候補全てをEGG声門閉鎖時刻として選択し、(2)前記候補の個数がN/F'0より大きい場合、基準となるEGG声門閉鎖時刻に前記基本周期を加えた値を中心として、±Δの範囲に含まれる候補のうち、対応するEGG差分信号が最大となるものをEGG声門閉鎖時刻として選択する声門閉鎖時刻選択部とを含む、
声門閉鎖時刻推定装置。 - 音声信号を用いて、音声信号における声門閉鎖時刻であるピッチマーク時刻を推定するピッチマーク時刻推定装置であって、
EGG信号を用いて、EGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻に対応する値を推定するEGG声門閉鎖時刻推定部と、
前記EGG信号に対応する音声信号と前記EGG声門閉鎖時刻に対応する値を用いて、ピッチマーク時刻を推定するピッチマーク時刻推定部とを含み、
前記ピッチマーク時刻推定部は、
前記音声信号からLPC残差信号を求めるLPC残差取得部と、
前記音声信号に対応する値と、前記EGG信号に対応する値との相互相関に基づき、前記EGG信号に対応する値に対する前記音声信号に対応する値の遅延を推定する遅延推定部と、
Δ1を音声信号の基本周期より小さい値とし、前記EGG声門閉鎖時刻に対応する値に前記遅延を加えた値を中心として、±Δ1の範囲に含まれる時刻のうち、対応するLPC残差信号が最大または最小となるものを、ピッチマーク時刻として推定する時刻推定部とを含む、
ピッチマーク時刻推定装置。 - 音声合成に用いるピッチ波形の接続点を推定するピッチ波形接続点推定装置であって、
EGG信号を用いて、EGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻に対応する値を推定するEGG声門閉鎖時刻推定部と、
前記EGG信号に対応する音声信号と前記EGG声門閉鎖時刻に対応する値を用いて、ピッチ波形の接続点を推定するピッチ波形接続点推定部とを含み、
前記ピッチ波形接続点推定部は、
前記音声信号に対応する値と、前記EGG信号に対応する値との相互相関に基づき、前記EGG信号に対応する値に対する前記音声信号に対応する値の遅延を推定する遅延推定部と、
前記EGG声門閉鎖時刻に対応する値に前記遅延を加えた値を、前記接続点として推定する加算部とを含む、
ピッチ波形接続点推定装置。 - EGG信号を用いて、EGG差分信号を算出するEGG差分算出ステップと、
前記EGG信号の基本周期を推定する基本周期推定ステップと、
前記EGG信号の零交差時刻を算出する零交差時刻算出ステップと、
前記零交差時刻を含み、前記基本周期に対応する探索幅を持つ探索範囲から、前記EGG差分信号が最大となる時刻をEGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻の候補として探索する候補探索ステップと、
想定される基本周期の最小値をF'0とし、分析フレーム長をNとし、Δを最小値F'0よりも小さい正の整数とし、(1)前記候補の個数がN/F'0以下の場合、前記候補全てをEGG声門閉鎖時刻として選択し、(2)前記候補の個数がN/F'0より大きい場合、基準となるEGG声門閉鎖時刻に前記基本周期を加えた値を中心として、±Δの範囲に含まれる候補のうち、対応するEGG差分信号が最大となるものをEGG声門閉鎖時刻として選択する声門閉鎖時刻選択ステップとを含む、
声門閉鎖時刻推定方法。 - 音声信号を用いて、音声信号における声門閉鎖時刻であるピッチマーク時刻を推定するピッチマーク時刻推定方法であって、
EGG信号を用いて、EGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻に対応する値を推定するEGG声門閉鎖時刻推定ステップと、
前記EGG信号に対応する音声信号と前記EGG声門閉鎖時刻に対応する値を用いて、ピッチマーク時刻を推定するピッチマーク時刻推定ステップとを含み、
前記ピッチマーク時刻推定ステップは、
前記音声信号からLPC残差信号を求めるLPC残差取得ステップと、
前記音声信号に対応する値と、前記EGG信号に対応する値との相互相関に基づき、前記EGG信号に対応する値に対する前記音声信号に対応する値の遅延を推定する遅延推定ステップと、
Δ1を音声信号の基本周期より小さい値とし、前記EGG声門閉鎖時刻に対応する値に前記遅延を加えた値を中心として、±Δ1の範囲に含まれる時刻のうち、対応するLPC残差信号が最大または最小となるものを、ピッチマーク時刻として推定する時刻推定ステップとを含む、
ピッチマーク時刻推定方法。 - 請求項5のピッチマーク時刻推定方法であって、
前記時刻推定ステップは、
LPC残差信号が最大となる時刻である最大値時刻t^0i +と最小となる時刻である最小値時刻t^0i -とを取得する最小最大値時刻取得ステップと、
前記最大値時刻t^0i +及び最小値時刻t^0i -におけるLPC残差信号と、範囲(t^0i -±Δ2)、(t^0i +±Δ2)におけるLPC残差信号との差分の総和が最も大きい時刻t^0 -及びt^0 +を求める最大値時刻取得ステップと、
前記時刻t^0 -またはt^0 +と前記LPC残差信号とを用いて、位相等化残差信号を求める位相等化残差検出部と、
前記位相等化残差信号と所定の閾値と比較し、閾値を超える時刻をピッチマーク時刻として推定するピーク取得部とを含む、
ピッチマーク時刻推定方法。 - 音声合成に用いるピッチ波形の接続点を推定するピッチ波形接続点推定方法であって、
EGG信号を用いて、EGG信号における声門閉鎖時刻であるEGG声門閉鎖時刻に対応する値を推定するEGG声門閉鎖時刻推定ステップと、
前記EGG信号に対応する音声信号と前記EGG声門閉鎖時刻に対応する値を用いて、ピッチ波形の接続点を推定するピッチ波形接続点推定ステップとを含み、
前記ピッチ波形接続点推定ステップは、
前記音声信号に対応する値と、前記EGG信号に対応する値との相互相関に基づき、前記EGG信号に対応する値に対する前記音声信号に対応する値の遅延を推定する遅延推定ステップと、
前記EGG声門閉鎖時刻に対応する値に前記遅延を加えた値を、前記接続点として推定する加算ステップとを含む、
ピッチ波形接続点推定方法。 - 請求項4の声門閉鎖時刻推定方法、または、請求項5もしくは請求項6のピッチマーク時刻推定方法、または、請求項6のピッチ波形接続点推定方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015006044A JP6502099B2 (ja) | 2015-01-15 | 2015-01-15 | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015006044A JP6502099B2 (ja) | 2015-01-15 | 2015-01-15 | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016133522A true JP2016133522A (ja) | 2016-07-25 |
JP6502099B2 JP6502099B2 (ja) | 2019-04-17 |
Family
ID=56437968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015006044A Active JP6502099B2 (ja) | 2015-01-15 | 2015-01-15 | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6502099B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019191378A (ja) * | 2018-04-25 | 2019-10-31 | 日本電信電話株式会社 | 発音変換装置、ピッチマーク時刻抽出装置、それらの方法、およびプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11184497A (ja) * | 1997-04-09 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 音声分析方法、音声合成方法および媒体 |
JP2007068847A (ja) * | 2005-09-08 | 2007-03-22 | Advanced Telecommunication Research Institute International | 声門閉鎖区間検出装置および声門閉鎖区間検出方法 |
US20080288258A1 (en) * | 2007-04-04 | 2008-11-20 | International Business Machines Corporation | Method and apparatus for speech analysis and synthesis |
JP2011013244A (ja) * | 2009-06-30 | 2011-01-20 | Sanyo Electric Co Ltd | コンデンサ内蔵電子機器 |
-
2015
- 2015-01-15 JP JP2015006044A patent/JP6502099B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11184497A (ja) * | 1997-04-09 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 音声分析方法、音声合成方法および媒体 |
JP2007068847A (ja) * | 2005-09-08 | 2007-03-22 | Advanced Telecommunication Research Institute International | 声門閉鎖区間検出装置および声門閉鎖区間検出方法 |
US20080288258A1 (en) * | 2007-04-04 | 2008-11-20 | International Business Machines Corporation | Method and apparatus for speech analysis and synthesis |
JP2011013244A (ja) * | 2009-06-30 | 2011-01-20 | Sanyo Electric Co Ltd | コンデンサ内蔵電子機器 |
Non-Patent Citations (3)
Title |
---|
加藤順一 JUNICHI KATO: "音声信号とEGG信号の相関を利用した話者照合 Speaker verification using a correlation between speec", 日本音響学会研究発表会議講演論文集 春I, JPN6018001356, 18 March 2002 (2002-03-18), JP, pages 1 - 9 * |
岸 裕次郎 Y. KISHI: "電気的喉頭波形を用いた連続音声の有声/無声/混合分類 Voiced/Unvoiced/Mixed Excitation Classificati", 電子情報通信学会技術研究報告 VOL.96 NO.240 IEICE TECHNICAL REPORT (1996-09-12), vol. Vol.96, No.240, JPN6018001355, 12 September 1996 (1996-09-12), JP, pages 31 - 37 * |
岸 裕次郎 Y. KISHI: "電気的喉頭波形を用いた連続音声の有声/無声/混合分類 Voiced/Unvoiced/Mixed Excitation Classificatio", 電子情報通信学会技術研究報告 VOL.96 NO.240 IEICE TECHNICAL REPORT, vol. 第96巻、第240号, JPN6018032510, 12 September 1996 (1996-09-12), JP, pages 31 - 37 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019191378A (ja) * | 2018-04-25 | 2019-10-31 | 日本電信電話株式会社 | 発音変換装置、ピッチマーク時刻抽出装置、それらの方法、およびプログラム |
WO2019208193A1 (ja) * | 2018-04-25 | 2019-10-31 | 日本電信電話株式会社 | 発音変換装置、ピッチマーク時刻抽出装置、それらの方法、およびプログラム |
JP7040258B2 (ja) | 2018-04-25 | 2022-03-23 | 日本電信電話株式会社 | 発音変換装置、その方法、およびプログラム |
US11557287B2 (en) | 2018-04-25 | 2023-01-17 | Nippon Telegraph And Telephone Corporation | Pronunciation conversion apparatus, pitch mark timing extraction apparatus, methods and programs for the same |
Also Published As
Publication number | Publication date |
---|---|
JP6502099B2 (ja) | 2019-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102158743B1 (ko) | 자연어 음성인식의 성능향상을 위한 데이터 증강장치 및 방법 | |
US8889976B2 (en) | Musical score position estimating device, musical score position estimating method, and musical score position estimating robot | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
JP2013037174A (ja) | 雑音/残響除去装置とその方法とプログラム | |
Prasanna et al. | Fast prosody modification using instants of significant excitation | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
Narendra et al. | Robust voicing detection and F 0 estimation for HMM-based speech synthesis | |
JP6993376B2 (ja) | 音声合成装置、方法及びプログラム | |
KR20190032868A (ko) | 음성인식 방법 및 그 장치 | |
JP3576800B2 (ja) | 音声分析方法、及びプログラム記録媒体 | |
US11557287B2 (en) | Pronunciation conversion apparatus, pitch mark timing extraction apparatus, methods and programs for the same | |
JP6502099B2 (ja) | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム | |
JP4469986B2 (ja) | 音響信号分析方法および音響信号合成方法 | |
JP2009244723A (ja) | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 | |
JP5588932B2 (ja) | はなし言葉分析装置とその方法とプログラム | |
JP2017021267A (ja) | ウィナーフィルタ設計装置、音強調装置、音響特徴量選択装置、これらの方法及びプログラム | |
JP6285823B2 (ja) | Lpc分析装置、音声分析変換合成装置、それらの方法及びプログラム | |
JP6599408B2 (ja) | 音響信号処理装置、方法及びプログラム | |
Lipeika | Optimization of formant feature based speech recognition | |
JP5245962B2 (ja) | 音声合成装置、音声合成方法、プログラム及び記録媒体 | |
Stanek et al. | Comparison of fundamental frequency detection methods and introducing simple self-repairing algorithm for musical applications | |
Duong et al. | Visual-guided audio source separation: an empirical study | |
JP2019028301A (ja) | 音響信号処理装置、方法及びプログラム | |
JP2019029861A (ja) | 音響信号処理装置、方法及びプログラム | |
JP4242320B2 (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6502099 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |