JP2010009034A - 歌声合成パラメータデータ推定システム - Google Patents
歌声合成パラメータデータ推定システム Download PDFInfo
- Publication number
- JP2010009034A JP2010009034A JP2009129446A JP2009129446A JP2010009034A JP 2010009034 A JP2010009034 A JP 2010009034A JP 2009129446 A JP2009129446 A JP 2009129446A JP 2009129446 A JP2009129446 A JP 2009129446A JP 2010009034 A JP2010009034 A JP 2010009034A
- Authority
- JP
- Japan
- Prior art keywords
- singing voice
- pitch
- parameter
- volume
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/366—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/455—Gensound singing voices, i.e. generation of human voices for musical applications, vocal singing sounds or intelligible words at a desired pitch or with desired vocal effects, e.g. by phoneme synthesis
Abstract
【解決手段】 音高パラメータ推定部9が、入力歌声の音響信号の少なくとも音高の特徴量と音節境界が指定された歌詞データとに基づいて、入力歌声の音響信号の音高の特徴量に合成された歌声の音響信号の音高の特徴量を近づけることができる音高パラメータを推定する。音量パラメータ推定部11が、入力歌声の音響信号の音量の特徴量を合成された歌声の音響信号の音量の特徴量に対して相対値化し、入力歌声の音響信号の相対値化した音量についての特徴量に合成された歌声の音響信号の音量の特徴量を近づけることができる音量パラメータを推定する。
【選択図】 図1
Description
・ 調子はずれ(off Pitch) の補正:音高がずれた音を修正する。
・ ビブラート深さ(vibrato extent) の調整:ビブラートを強く・弱くという直感的操作で、自分好みの表現へ変更できる。
以下上記に説明した本発明の歌声合成パラメータデータ推定システムを具体的に実現する場合に使用した技術について項を分けて説明し、最後に本実施の形態の運用及び評価実験について説明する。
次の3つのステップによって歌声合成パラメータを推定する。
・ 音高パラメータと音量パラメータの推定
・ 音高パラメータと音量パラメータの更新(反復しながら更新)
まず入力歌声の音響信号から歌声の合成に必要な情報を分析・抽出する。ここで、分析は入力歌声の音響信号に対してだけでなく、推定の途中で作成される歌声合成パラメータ及び歌詞データに基づいて合成された仮の合成された歌声の音響信号に対しても行う。仮の合成された歌声の音響信号の分析が必要なのは、歌声合成パラメータが同一であっても、歌声合成の条件の違い(歌声合成システムの相違や音源データの相違)によって、合成される歌声の音響信号が異なるからである。以下、歌声合成パラメータを構成する音高パラメータ及び音量パラメータとの区別を明確にするため、分析によって得られた入力歌声の音響信号の音高の特徴量及び音量の特徴量を、必要に応じて観測値と呼ぶこともある。
以下「歌声分析」及び「歌声合成」に関する、要素技術について説明する。以下の説明では、入力歌声の音響信号のサンプリング周波数は44.1kHz のモノラル音声信号を扱うものとし、処理の時間単位は10 msec とする。
発音開始時刻及び音長は、音声認識で使われるViterbiアラインメントによって自動的に推定したものを利用する。ここで、漢字かな混じり文の歌詞は、前述の歌詞アラインメント部3の一部を構成する形態素解析器(工藤拓, MeCab: Yet Another Part-of-Speech and Morphological Analyzer;hhtp://mecab.sourceforge.net/MeCab 等)によってかな文字列に変換した後、音素列に変換する。変換結果に誤りがあった場合は、前述の歌詞アラインメント部3は、ユーザが手作業で訂正することを許容する。Viterbiアラインメントでは、図11(B)に示すように、音節境界に短い無音(short pause) が入ることを許容したアラインメント文法を用いる。音響モデルには、朗読音声用のHMM [河原達也他: 連続音声認識コンソーシアム2002 年度版ソフトウェアの概要, 情処研報2003-SLP-48-1, pp.1−6, 2003.15] を、MLLR-MAP法[V.V. Digalakis et al.: “Speaker adaptation using combined transformation and Bayesian methods,” IEEE Transactionson Speech and Audio Processing, Vol.4, No.4,pp.294−300, 1996.16] によって入力歌声の音響信号に適応させて使用した。
歌声合成部101としては、ヤマハ株式会社の開発した「Vocaloid2」 [商標] の応用商品である、クリプトン・フューチャー・メディア株式会社の「初音ミク(以下、CV01)」及び「鏡音リン(以下、CV02)」を用いた。これらは、歌詞と楽譜情報を入力でき、表情(音高, 音量など) に関するパラメータを各時刻毎に指定できるという条件を満たし、市販されていて入手しやすく、異なる音源データも利用できる。またVSTi プラグイン(Vocaloid Playback VST Instrument) によって後述する反復推定(イテレーション) の実装が容易である。
調子はずれ量推定部17、音高補正部19、音高トランスポーズ部21、ビブラート調整部23とスムージング処理部25を用いて実現する変更機能の具体例を説明する。
調子はずれ量推定部17及び音高補正部19を用いて、入力歌声の音響信号の音高を変更する「調子はずれの補正」及び「音高トランスポーズ」機能は次のようにして実現する。まず調子はずれの補正として、音高の遷移(相対音高) が歌唱力の評価において重要であるため、音高の遷移を補正する。具体的には、音高遷移が半音単位となるように音高をずらす。このような補正方法を採ることで、ユーザ歌唱の歌唱スタイルを保持したまま調子はずれを補正できる。有声音と判断された有声区間毎に、次式で定義する半音間隔に大きな重みを与える関数i(半音グリッド:0〜127) をずらしながら、その区間のF0 軌跡が最も適合する(最も大きくなる)オフセットFdを決定する。
ビブラート調整部23及びスムージング処理部25では、入力歌声の音響信号の歌唱スタイルを「ビブラート深さの調節」及び「音高・音量のスムージング」を以下のようにして具体的に実現する。
歌声分析によって得られた入力歌声の音響信号の分析値と合成された歌声の音響信号の分析値に基づいて、歌声合成パラメータを推定する。具体的には、以下のようにして歌声合成パラメータを推定する。
まず、歌詞アラインメント、音高及び音量に関する初期値をシステムに与える。歌詞アラインメント部3には、Viterbi アラインメントによって得られた母音の開始時刻と終了時刻を初期値として与えた。音高パラメータとしては、歌声合成システムとして前述のVocaloid2 (商標)を用いる場合には、「音符の音高(ノートナンバ)」「ピッチベンド(PIT)」「ピッチベンドセンシティビティ(PBS)」を用いる。ここで、ピッチベンド(PIT) は−8192〜8191、ピッチベンドセンシティビティ(PBS)は0から24の値を取り、デフォルト値はそれぞれ0, 1 である。PBS が1 なら、ノートナンバから±1半音の範囲を、16384 の分解能で表現できる。また、ノートナンバは0〜127 の値を取り、1が半音、12が1オクターブに相当する。一方、音量パラメータとしては、ダイナミクス(DYN) を用いる。ダイナミクスは、0〜127 の値を取る(デフォルト値は64)。歌声合成パラメータとしてのPIT, PBS, DYN 初期値は、全時刻でデフォルト値とした。
音響モデルによって歌詞(音素列) と入力歌声の音響信号とを対応付ける歌詞アラインメントを実施すると、Viterbi アラインメントの誤りに加えて、歌声合成システムに対して指定した発音開始時刻や音長とずれて合成が実施される問題が生じる。したがって、Viterbiアラインメント結果をそのまま用いた歌詞アラインメントでは、入力歌声の音響信号と合成された歌声の音響信号の有声区間(信号処理によって有声と判断された区間) にずれが生じてしまう。そこでまず、有声区間のずれを以下の二つの処理によって補正する。
観測されたF0 からノートナンバを決定する。合成された歌声の音響信号は、PIT とPBS の組み合わせによっては、ノートナンバ± 2 オクターブまで表現可能である。しかし大きなPBS では量子化誤差が大きくなってしまう。そこで、その音符の区間に存在する音高の出現頻度から、PBS の値が小さくなるように、以下の式でノートナンバ(Note#) を選択する(図4)。
ノートナンバは固定したまま、合成された歌声の音響信号の音高F0 (n) syn(t)が入力歌声の音響信号の音高F0org(t)に近づくように、イテレーション(反復計算) によって音高パラメータ(PIT, PBS) を更新して推定する。時刻t,n 回目のイテレーションにおけるPIT とPBS をノートナンバに対応する値へ変換したものをPb(n)(t) とすると、更新式は以下のようになる。
入力歌声の音響信号の音量の特徴量は、収録条件の違い等が原因でその絶対的な値が変化するため、相対値化を行う。すなわち、音量の相対的な変化を表現するパラメータを推定するために、入力歌声の音響信号の音量をα倍する。ここで、入力歌声の音響信号の相対変化を完全に表現するためには、全時刻で入力歌声の音響信号の音量を、DYN=127で合成した歌唱の音量以下に調整する必要がある。しかし、そのような条件を例えば図8の「A」の箇所などでも満たそうとすると、目標音量が小さくなりすぎて、量子化誤差が大きくなってしまう。そこで、図8の「A」のような一部の再現を断念する代わりに、全体としての再限度が高くなるよう相対値化を行う。入力歌声の音響信号の音量観測値をPoworg(t)、ダイナミクスDYN が64の時の合成歌唱の音量観測値をPowDYN=64 syn(t) として、次式を最小化する相対値化係数αを決定する。
以下本発明の具体的な実施例の実際の運用結果を説明し、本発明の実施例を「歌詞アラインメントの誤り訂正機能の有効性」、「イテレーションの必要性」及び「音源データの違いに対する頑健性」の観点から評価した結果について説明する。
歌声分析及び歌声合成の要素技術 には前述の技術を利用し、歌声合成システム(Vocaloid2) では、「ビブラートをつけない」、「ベンドの深さを0 %」と設定した以外は全てデフォルト値を用いた。音源データとしては前述のCV01 及びCV02 を用いた。実験では便宜上、入力歌声の音響信号として、ユーザ歌唱の代わりにRWC研究用音楽データベース(ポピュラー音楽) RWC−MDB−P−2001 [後藤真孝他: “RWC 研究用音楽データベース:研究目的で利用可能な著作権処理済み楽曲・楽器音データベース,” 情処学論,Vol.45, No.3, pp.728−738, 2004.]の伴奏なし歌唱データを用いた。
Viterbi アラインメント結果は、表1のNo.07 ではフレーズをまたぐ等の大きな誤りは起きず、表1のNo.16 では大きな誤りが2箇所起きた。それらを手作業で直した後、実験A を行った結果を表2に示す。
実験Bで対象としたどの曲に対しても、イテレーションによってエラーは減少した。4 回のイテレーションにおける初期値からの相対エラー量は、音高に関しては1.7〜2.8 %、音量に関しては13.8〜17.5%であった。これをNo.07 について詳しく見ると表3 のようになり、その結果を図16に示す。図16は、インテレーションによる音高・音量の推移(実験B)を示す図であり、音高と音量につてそれぞれ0.84secの箇所を示している。但し図16では、音量の目標値は、CV01とCV02で相対値化係数αが異なっている。
3 歌詞アラインメント部
5 入力歌声音響信号分析部
7 分析データ記憶部
9 音高パラメータ推定部
11 音量パラメータ推定部
13 歌声合成パラメータデータ作成部
15 歌詞データ記憶部
17 調子はずれ量推定部
19 音高補正部
21 音高トランスポーズ部
23 ビブラート調整部
25 スムージング処理部
101 歌声合成部
103 歌声音源データベース
105 歌声合成パラメータデータ記憶部
107 再生装置
Claims (20)
- 1種以上の歌声音源データが蓄積された歌声音源データベースと、
歌声の音響信号を少なくとも音高パラメータ及び音量パラメータを含む複数種類のパラメータで表現した歌声合成パラメータデータを記憶する歌声合成パラメータデータ記憶部と、
入力歌声の音響信号に対応した音節境界が指定された歌詞データを記憶する歌詞データ記憶部と、
前記歌声音源データベースから選択した1種類の前記歌声音源データと前記歌声合成パラメータデータと前記歌詞データとに基づいて、合成された歌声の音響信号を合成して出力する歌声合成部とを備えた歌声合成システムにおいて使用する、前記選択した1種類の歌声音源データに適した前記歌声合成パラメータデータを作成する歌声合成パラメータデータ推定システムであって、
前記入力歌声の音響信号の少なくとも音高及び音量を含む複数種類の特徴量を分析する入力歌声音響信号分析部と、
前記入力歌声の音響信号の少なくとも前記音高の特徴量と前記歌詞データとに基づいて、前記音量パラメータを一定のものとして、前記入力歌声の音響信号の前記音高の特徴量に前記合成された歌声の音響信号の音高の特徴量を近づけることができる前記音高パラメータを推定する音高パラメータ推定部と、
前記音高パラメータ推定部が前記音高パラメータの推定を完了した後に、前記入力歌声の音響信号の前記音量の特徴量を前記合成された歌声の音響信号の音量の特徴量に対して相対値化し、前記入力歌声の音響信号の相対値化した音量の特徴量に前記合成された歌声の音響信号の音量の特徴量を近づけることができる前記音量パラメータを推定する音量パラメータ推定部と、
推定された前記音高パラメータ及び推定された前記音量パラメータに基づいて前記歌声合成パラメータデータを作成し前記合成パラメータデータ記憶部に記憶させる歌声合成パラメータデータ作成部と、
音節境界が指定されていない歌詞データと前記入力歌声の音響信号とに基づいて、前記音節境界が指定された歌詞データを作成する歌詞アラインメント部とを備え、
前記音高パラメータ推定部は、推定した前記音高パラメータに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に近づくまで所定の回数前記音高パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に収束するまで前記音高パラメータの推定を繰り返し、
前記音量パラメータ推定部は、推定が完了した前記音高パラメータと推定した前記音量パラメータとに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に近づくまで所定の回数前記音量パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に収束するまで前記音量パラメータの推定を繰り返し、
前記入力歌声音響信号分析部は、所定の周期で、前記入力歌声の音響信号から基本周波数F0を推定し、前記基本周波数から前記入力歌声の音響信号の前記音高を観測して音高の特徴量データとして分析データ記憶部に記憶する機能と、前記入力歌声の音響信号から有声音らしさを推定し、予め定めた閾値を基準にして該閾値よりも前記有声音らしさが高い区間を前記入力歌声の音響信号の有声区間として観測して前記分析データ記憶部に記憶する機能と、前記入力歌声の音響信号の前記音量の特徴量を観測して、音量の特徴量データとして前記分析データ記憶部に記憶する機能と、前記音高の特徴量データからビブラートが存在している区間を観測してビブラート区間として前記分析データ記憶部に記憶する機能とを有し、
前記分析データ記憶部に記憶された前記入力歌声の音響信号の有声区間における前記音高の特徴量データから調子はずれ量を推定する調子はずれ量推定部と、
前記調子はずれ量推定部が推定した調子はずれ量を前記音高の特徴量データから除くように前記音高の特徴量データを補正する音高補正部と、
前記音高の特徴量データに任意の値を加算して音高トランスポーズをする音高トランスポーズ部と、
前記ビブラート区間におけるビブラートの深さを任意に調整するビブラート調整部と、
前記ビブラート区間以外における前記音高の特徴量データ及び前記音量の特徴量データを任意にスムージング処理するスムージング処理部とを更に備えていることを特徴とする歌声合成パラメータデータ推定システム。 - 1種以上の歌声音源データが蓄積された歌声音源データベースと、
歌声の音響信号を少なくとも音高パラメータ及び音量パラメータを含む複数種類のパラメータで表現した歌声合成パラメータデータを記憶する歌声合成パラメータデータ記憶部と、
入力歌声の音響信号に対応した音節境界が指定された歌詞データを記憶する歌詞データ記憶部と、
前記歌声音源データベースから選択した1種類の前記歌声音源データと前記歌声合成パラメータデータと前記歌詞データとに基づいて、合成された歌声の音響信号を合成して出力する歌声合成部とを備えた歌声合成システムにおいて使用する、前記選択した1種類の歌声音源データに適した前記歌声合成パラメータデータを作成する歌声合成パラメータデータ推定システムであって、
前記入力歌声の音響信号の少なくとも音高及び音量を含む複数種類の特徴量を分析する入力歌声音響信号分析部と、
前記入力歌声の音響信号の少なくとも前記音高の特徴量と前記歌詞データとに基づいて、前記音量パラメータを一定のものとして、前記入力歌声の音響信号の前記音高の特徴量に前記合成された歌声の音響信号の音高の特徴量を近づけることができる前記音高パラメータを推定する音高パラメータ推定部と、
前記音高パラメータ推定部が前記音高パラメータの推定を完了した後に、前記入力歌声の音響信号の前記音量の特徴量を前記合成された歌声の音響信号の音量の特徴量に対して相対値化し、前記入力歌声の音響信号の相対値化した音量の特徴量に前記合成された歌声の音響信号の音量の特徴量を近づけることができる前記音量パラメータを推定する音量パラメータ推定部と、
推定された前記音高パラメータ及び推定された前記音量パラメータに基づいて前記歌声合成パラメータデータを作成し前記歌声合成パラメータデータ記憶部に記憶させる歌声合成パラメータデータ作成部とを備え、
前記音高パラメータ推定部は、推定した前記音高パラメータに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に近づくまで所定の回数前記音高パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に収束するまで前記音高パラメータの推定を繰り返し、
前記音量パラメータ推定部は、推定が完了した前記音高パラメータと推定した前記音量パラメータとに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に近づくまで所定の回数前記音量パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に収束するまで前記音量パラメータの推定を繰り返すことを特徴とする歌声合成パラメータデータ推定システム。 - 前記音高パラメータが、前記歌詞データの複数の音節のそれぞれに対応する前記入力歌声の音響信号の複数の部分区間の信号の基準音高レベルを示すパラメータ要素と、前記部分区間の信号の前記基準音高レベルに対する音高の時間的相対変化分を示すパラメータ要素と、前記部分区間の信号の音高方向への変化幅を示すパラメータ要素とからなり、
前記音高パラメータ推定部は、前記基準音高レベルを示すパラメータ要素を決定した後、前記音高の時間的相対変化分を示すパラメータ要素と前記音高方向への変化幅を示すパラメータ要素について予め定めた初期値を設定し、前記初期値に基づいて前記仮の歌声合成パラメータデータを作成し、該仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の音高の特徴量を、前記入力歌声の音響信号の前記音高の特徴量に近づけるように前記音高の時間的相対変化分を示すパラメータ要素と前記音高方向への変化幅を示すパラメータ要素を推定し、以後推定した前記パラメータ要素に基づいて次の仮の歌声合成パラメータデータを作成し、該次の仮の歌声合成パラメータデータを前記歌声合成部で合成して得た次の仮の合成された歌声の音響信号の音高の特徴量を、前記入力歌声の音響信号の前記音高の特徴量に近づけるように前記音高の時間的相対変化分を示すパラメータ要素と前記音高方向への変化幅を示すパラメータ要素を再推定することを繰り返すことを特徴とする請求項1または2に記載の歌声合成パラメータデータ推定システム。 - 前記基準音高レベルを示すパラメータ要素は、MIDI規格あるいは市販の歌声合成システムのノートナンバであり、
前記基準音高レベルに対する音高の時間的相対変化分を示すパラメータ要素は、MIDI規格あるいは市販の歌声合成システムのピッチベンド(PIT)であり、
前記音高方向への変化幅を示すパラメータ要素は、MIDI規格あるいは市販の歌声合成システムのピッチベンドセンシティビィティ(PBS)である請求項3に記載の歌声合成パラメータデータ推定システム。 - 前記音量パラメータ推定部は、
推定が完了した前記音高パラメータと設定可能な音量パラメータの範囲の中心の音量パラメータとに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の音量の特徴量と、前記入力歌声の音響信号の前記音量の特徴量との距離が最も小さくなるように相対値化係数αを定める機能と、
前記相対値化係数αを前記入力歌声の音響信号の前記音量の特徴量に乗算して前記相対値化した音量の特徴量を作る機能とを備えていることを特徴とする請求項1または2に記載の歌声合成パラメータデータ推定システム。 - 前記音量パラメータがMIDI規格のエクスプレッションあるいは市販の歌声合成システムのダイナミクス(DYN)である請求項5に記載の歌声合成パラメータデータ推定システム。
- 音節境界が指定されていない歌詞データと前記入力歌声の音響信号とに基づいて、前記音節境界が指定された歌詞データを作成する歌詞アラインメント部を更に備えている請求項2に記載の歌声合成パラメータデータ推定システム。
- 前記歌詞アラインメント部は、
前記歌詞データに含まれる歌詞を複数の音素から構成される音素列に変換する音素列変換部と、
前記音素列変換部の変換結果をマニュアルで修正することを可能にする音素マニュアル修正部と、
アラインメント用文法を生成した後に、前記入力歌声の音響信号における、前記音素列に含まれる前記複数の音素のそれぞれの開始時期と終了時期とを推定するアラインメント推定部と、
前記アラインメント推定部が推定した前記音素列に含まれる前記複数の音素のそれぞれの前記開始時期と前記終了時期とをマニュアルで修正することを可能にするアラインメント・マニュアル修正部と、
前記音素列を、音節列に変換する音素−音節列変換部と、
前記音素−音節列変換部から出力された前記音節列における有声区間のずれを補正する有声区間補正部と、
前記有声区間が補正された前記音節列の音節境界の誤りをマニュアルによる指摘に基づいて訂正することを可能にする音節境界訂正部と、
前記音節列を前記音節境界が指定された歌詞データとして記憶する歌詞データ記憶部とからなる請求項1または7に記載の歌声合成パラメータデータ推定システム。 - 前記有声区間補正部は、
前記入力歌声音響信号分析部による分析により得た1つの前記有声区間中に含まれる二つ以上の前記音節を接続して部分的に接続された部分接続音節列を作成する部分音節列作成部と、
前記入力歌声音響信号分析部による分析により得た前記有声区間に、前記歌声合成部で合成して得た仮の合成された歌声の音響信号を分析して得た有声区間を一致させるように前記部分接続音節列に含まれる複数の前記音節の開始時期と終了時期とを変更して前記音節を伸縮させる伸縮補正部とを備えている請求項8に記載の歌声合成パラメータデータ推定システム。 - 前記音節境界訂正部は、
前記入力歌声の音響信号のスペクトルの時間変化を演算する演算部と、
前記音節境界の誤り箇所の前後N1個(N1は1以上の正の整数)の音節を候補算出対象区間とし、前記音節境界の誤り箇所の前後N2個(N2は1以上の正の整数)の音節を距離計算区間とし、前記候補算出対象区間の前記スペクトルの時間変化により前記スペクトルの時間変化の大きいN3(N3は1以上の正の整数)箇所を境界候補点として検出し、各前記境界候補点に音節境界をずらした仮説の距離を取得し、前記仮説の距離が最小となる仮説をユーザに提示し、提示した前記仮説が前記ユーザにより正しいと判断されるまで、境界候補点を繰り下げて他の仮説を提示し、提示した前記他の仮説が前記ユーザにより正しいと判断されたときに、該他の仮説のための境界候補点へ音節境界をずらす訂正を行う訂正実行部とからなる請求項8に記載の歌声合成パラメータデータ推定システム。 - 前記訂正実行部は、前記境界候補点に音節境界をずらしたときの仮説の距離を取得するために、前記距離計算区間に対して前記音高パラメータを推定し、推定した前記音高パラメータを用いて前記歌声合成パラメータデータを合成して得た合成された歌声の音響信号を取得し、前記距離計算区間における前記入力歌声の音響信号と前記合成された歌声の音響信号のスペクトルの距離を前記仮説の距離として計算する請求項10に記載の歌声合成パラメータデータ推定システム。
- 前記スペクトルの時間変化が、デルタ・メル周波数ケプストラム係数(ΔMFCC)である請求項10または11に記載の歌声合成パラメータデータ推定システム。
- 前記入力歌声音響信号分析部は、
所定の周期で、前記入力歌声の音響信号から基本周波数F0を推定し、前記基本周波数から前記入力歌声の音響信号の前記音高を観測して音高の特徴量データとして分析データ記憶部に記憶する機能と、
前記入力歌声の音響信号から有声音らしさを推定し、予め定めた閾値を基準にして該閾値よりも前記有声音らしさが高い区間を前記入力歌声の音響信号の有声区間として観測して前記分析データ記憶部に記憶する機能と、
前記入力歌声の音響信号の前記音量の特徴量を観測して、音量の特徴量データとして前記分析データ記憶部に記憶する機能とを有している請求項2に記載の歌声合成パラメータデータ推定システム。 - 前記分析データ記憶部に記憶された前記入力歌声の音響信号の有声区間における前記音高の特徴量データから調子はずれ量を推定する調子はずれ量推定部と、
前記調子はずれ量推定部が推定した調子はずれ量を前記音高の特徴量データから除くように前記音高の特徴量データを補正する音高補正部を更に備えている請求項13に記載の歌声合成パラメータデータ推定システム。 - 前記音高の特徴量データに任意の値を加算して音高トランスポーズをする音高トランスポーズ部を更に備えている請求項13または14に記載の歌声合成パラメータデータ推定システム。
- 前記入力歌声音響信号分析部は、前記音高の特徴量データからビブラートが存在している区間を観測してビブラート区間として前記分析データ記憶部に記憶する機能を更に備えており、
前記ビブラート区間におけるビブラートの深さを任意に調整するビブラート調整部を更に備えている請求項13,14または15に記載の歌声合成パラメータデータ推定システム。 - 前記入力歌声音響信号分析部は、前記音高の特徴量データからビブラートが存在している区間を観測してビブラート区間として前記分析データ記憶部に記憶する機能を更に備えており、
前記ビブラート区間以外における前記音高の特徴量データ及び前記音量の特徴量データを任意にスムージング処理するスムージング処理部を更に備えている請求項13,14,15または16に記載の歌声合成パラメータデータ推定システム。 - 1種以上の歌声音源データが蓄積された歌声音源データベースと、
歌声の音響信号を少なくとも音高パラメータ及び音量パラメータを含む複数種類のパラメータで表現した歌声合成パラメータデータを記憶する歌声合成パラメータデータ記憶部と、
入力歌声の音響信号に対応した音節境界が指定された歌詞データを記憶する歌詞データ記憶部と、
前記歌声音源データベースから選択した1種類の前記歌声音源データと前記歌声合成パラメータデータと前記歌詞データとに基づいて、合成された歌声の音響信号を合成して出力する歌声合成部を備えた歌声合成システムにおいて使用する、前記選択した1種類の歌声音源データに適した前記歌声合成パラメータデータをコンピュータが作成する歌声合成パラメータデータ作成方法であって、
前記コンピュータは、
前記入力歌声の音響信号の少なくとも音高及び音量を含む複数種類の特徴量を分析し、
前記入力歌声の音響信号の少なくとも前記音高の特徴量と前記歌詞データとに基づいて、前記音量パラメータを一定のものとして、前記入力歌声の音響信号の前記音高の特徴量に前記合成された歌声の音響信号の音高の特徴量を近づけることができる前記音高パラメータを推定し、
前記音高パラメータの推定を完了した後に、前記入力歌声の音響信号の前記音量の特徴量を前記合成された歌声の音響信号の音量の特徴量に対して相対値化し、
前記入力歌声の音響信号の相対値化した音量についての特徴量に前記合成された歌声の音響信号の音量の特徴量を近づけることができる前記音量パラメータを推定し、
推定が完了した前記音高パラメータ及び推定が完了した前記音量パラメータに基づいて前記歌声合成パラメータデータを作成するように構成され、
前記コンピュータが更に、
推定した前記音高パラメータに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に近づくまで所定の回数前記音高パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に収束するまで前記音高パラメータの推定を繰り返し、
推定された前記音高パラメータと推定された前記音量パラメータとに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に近づくまで所定の回数前記音量パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に収束するまで前記音量パラメータの推定を繰り返すことを特徴とする歌声合成パラメータデータ作成方法。 - 1種以上の歌声音源データが蓄積された歌声音源データベースと、
歌声の音響信号を少なくとも音高パラメータ及び音量パラメータを含む複数種類のパラメータで表現した歌声合成パラメータデータを記憶する歌声合成パラメータデータ記憶部と、
入力歌声の音響信号に対応した音節境界が指定された歌詞データを記憶する歌詞データ記憶部と、
前記歌声音源データベースから選択した1種類の前記歌声音源データと前記歌声合成パラメータデータと前記歌詞データとに基づいて、合成された歌声の音響信号を合成して出力する歌声合成部とを備えた歌声合成システムにおいて使用する、前記選択した1種類の歌声音源データに適した前記歌声合成パラメータデータをコンピュータで作成する際に前記コンピュータで使用される歌声合成パラメータデータ作成用プログラムであって、
前記入力歌声の音響信号の少なくとも音高及び音量を含む複数種類の特徴量を分析する入力歌声音響信号分析部と、
前記入力歌声の音響信号の少なくとも前記音高の特徴量と前記歌詞データとに基づいて、前記音量パラメータを一定のものとして、前記入力歌声の音響信号の前記音高の特徴量に前記合成された歌声の音響信号の音高の特徴量を近づけることができる前記音高パラメータを推定する音高パラメータ推定部と、
前記音高パラメータ推定部が前記音高パラメータの推定を完了した後に、前記入力歌声の音響信号の前記音量の特徴量を前記合成された歌声の音響信号の音量の特徴量に対して相対値化し、前記入力歌声の音響信号の相対値化した音量についての特徴量に前記合成された歌声の音響信号の音量の特徴量を近づけることができる前記音量パラメータを推定する音量パラメータ推定部と、
推定された前記音高パラメータ及び推定された前記音量パラメータに基づいて前記歌声合成パラメータデータを作成し前記歌声合成パラメータデータ記憶部に記憶させる歌声合成パラメータデータ作成部とを前記コンピュータ内に構築し、
前記音高パラメータ推定部が、推定した前記音高パラメータに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に近づくまで所定の回数前記音高パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音高の特徴量が、前記入力歌声の音響信号の前記音高の特徴量に収束するまで前記音高パラメータの推定を繰り返し、
前記音量パラメータ推定部が、推定が完了した前記音高パラメータと推定した前記音量パラメータとに基づいて作成した仮の歌声合成パラメータデータを前記歌声合成部で合成して得た仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に近づくまで所定の回数前記音量パラメータの推定を繰り返すか、または前記仮の合成された歌声の音響信号の前記音量の特徴量が、前記入力歌声の音響信号の前記相対値化した音量の特徴量に収束するまで前記音量パラメータの推定を繰り返すように構成されていることを特徴とする歌声合成パラメータデータ作成用プログラム。 - 請求項19に記載の歌声合成パラメータデータ作成用プログラムがコンピュータ読み取り可能に記憶された記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009129446A JP5024711B2 (ja) | 2008-05-28 | 2009-05-28 | 歌声合成パラメータデータ推定システム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008139831 | 2008-05-28 | ||
JP2008139831 | 2008-05-28 | ||
JP2009129446A JP5024711B2 (ja) | 2008-05-28 | 2009-05-28 | 歌声合成パラメータデータ推定システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009034A true JP2010009034A (ja) | 2010-01-14 |
JP5024711B2 JP5024711B2 (ja) | 2012-09-12 |
Family
ID=41401090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009129446A Active JP5024711B2 (ja) | 2008-05-28 | 2009-05-28 | 歌声合成パラメータデータ推定システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8244546B2 (ja) |
JP (1) | JP5024711B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120041656A (ko) * | 2010-10-21 | 2012-05-02 | 삼성전자주식회사 | 가창 음성 생성 방법 및 그에 따른 장치 |
JP2013156544A (ja) * | 2012-01-31 | 2013-08-15 | Brother Ind Ltd | 発声区間特定装置、音声パラメータ生成装置、及びプログラム |
JP2013195928A (ja) * | 2012-03-22 | 2013-09-30 | Yamaha Corp | 音声素片切出装置 |
WO2014088036A1 (ja) * | 2012-12-04 | 2014-06-12 | 独立行政法人産業技術総合研究所 | 歌声合成システム及び歌声合成方法 |
JP2014178512A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音声合成装置 |
US9009052B2 (en) | 2010-07-20 | 2015-04-14 | National Institute Of Advanced Industrial Science And Technology | System and method for singing synthesis capable of reflecting voice timbre changes |
JP2016050994A (ja) * | 2014-08-29 | 2016-04-11 | ヤマハ株式会社 | 音響処理装置 |
JP2016118722A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
JP2016161919A (ja) * | 2015-03-05 | 2016-09-05 | ヤマハ株式会社 | 音声合成装置 |
JP2017027021A (ja) * | 2015-07-24 | 2017-02-02 | ヤマハ株式会社 | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 |
JP2017045073A (ja) * | 2016-12-05 | 2017-03-02 | ヤマハ株式会社 | 音声合成方法および音声合成装置 |
JP2017181793A (ja) * | 2016-03-30 | 2017-10-05 | ブラザー工業株式会社 | 音響処理装置、及びプログラム |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4124247B2 (ja) * | 2006-07-05 | 2008-07-23 | ヤマハ株式会社 | 楽曲練習支援装置、制御方法及びプログラム |
JP4455633B2 (ja) * | 2007-09-10 | 2010-04-21 | 株式会社東芝 | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム |
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP5482042B2 (ja) * | 2009-09-10 | 2014-04-23 | 富士通株式会社 | 合成音声テキスト入力装置及びプログラム |
US20110219940A1 (en) * | 2010-03-11 | 2011-09-15 | Hubin Jiang | System and method for generating custom songs |
US9099071B2 (en) * | 2010-10-21 | 2015-08-04 | Samsung Electronics Co., Ltd. | Method and apparatus for generating singing voice |
JP5703003B2 (ja) * | 2010-12-07 | 2015-04-15 | ローランド株式会社 | ピッチシフト装置 |
US8682938B2 (en) * | 2012-02-16 | 2014-03-25 | Giftrapped, Llc | System and method for generating personalized songs |
WO2013133768A1 (en) * | 2012-03-06 | 2013-09-12 | Agency For Science, Technology And Research | Method and system for template-based personalized singing synthesis |
JP5895740B2 (ja) * | 2012-06-27 | 2016-03-30 | ヤマハ株式会社 | 歌唱合成を行うための装置およびプログラム |
US8847056B2 (en) * | 2012-10-19 | 2014-09-30 | Sing Trix Llc | Vocal processing with accompaniment music input |
JP6171711B2 (ja) * | 2013-08-09 | 2017-08-02 | ヤマハ株式会社 | 音声解析装置および音声解析方法 |
US9123315B1 (en) * | 2014-06-30 | 2015-09-01 | William R Bachand | Systems and methods for transcoding music notation |
WO2016029217A1 (en) | 2014-08-22 | 2016-02-25 | Zya, Inc. | System and method for automatically converting textual messages to musical compositions |
JP2016080827A (ja) * | 2014-10-15 | 2016-05-16 | ヤマハ株式会社 | 音韻情報合成装置および音声合成装置 |
CN104391980B (zh) * | 2014-12-08 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 生成歌曲的方法和装置 |
JP6728754B2 (ja) * | 2015-03-20 | 2020-07-22 | ヤマハ株式会社 | 発音装置、発音方法および発音プログラム |
JP6728755B2 (ja) * | 2015-03-25 | 2020-07-22 | ヤマハ株式会社 | 歌唱音発音装置 |
US9818396B2 (en) * | 2015-07-24 | 2017-11-14 | Yamaha Corporation | Method and device for editing singing voice synthesis data, and method for analyzing singing |
EP3365883A4 (en) * | 2015-10-25 | 2019-04-10 | Commusicator Ltd. | SYSTEM AND METHOD FOR COMPUTER-AIDED TEACHING OF A MUSICAL LANGUAGE |
CN106653037B (zh) * | 2015-11-03 | 2020-02-14 | 广州酷狗计算机科技有限公司 | 音频数据处理方法和装置 |
US10008188B1 (en) * | 2017-01-31 | 2018-06-26 | Kyocera Document Solutions Inc. | Musical score generator |
WO2018175892A1 (en) * | 2017-03-23 | 2018-09-27 | D&M Holdings, Inc. | System providing expressive and emotive text-to-speech |
CN108806656B (zh) | 2017-04-26 | 2022-01-28 | 微软技术许可有限责任公司 | 歌曲的自动生成 |
JP7000782B2 (ja) * | 2017-09-29 | 2022-01-19 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
WO2019239971A1 (ja) * | 2018-06-15 | 2019-12-19 | ヤマハ株式会社 | 情報処理方法、情報処理装置およびプログラム |
CN108877753B (zh) * | 2018-06-15 | 2020-01-21 | 百度在线网络技术(北京)有限公司 | 音乐合成方法及系统、终端以及计算机可读存储介质 |
JP6610714B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6547878B1 (ja) * | 2018-06-21 | 2019-07-24 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610715B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
US10699700B2 (en) | 2018-07-31 | 2020-06-30 | Tencent Technology (Shenzhen) Company Limited | Monaural multi-talker speech recognition with attention mechanism and gated convolutional networks |
CN109817191B (zh) * | 2019-01-04 | 2023-06-06 | 平安科技(深圳)有限公司 | 颤音建模方法、装置、计算机设备及存储介质 |
JP7059972B2 (ja) | 2019-03-14 | 2022-04-26 | カシオ計算機株式会社 | 電子楽器、鍵盤楽器、方法、プログラム |
US11430431B2 (en) * | 2020-02-06 | 2022-08-30 | Tencent America LLC | Learning singing from speech |
US11257480B2 (en) | 2020-03-03 | 2022-02-22 | Tencent America LLC | Unsupervised singing voice conversion with pitch adversarial network |
KR102168529B1 (ko) * | 2020-05-29 | 2020-10-22 | 주식회사 수퍼톤 | 인공신경망을 이용한 가창음성 합성 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH037994A (ja) * | 1989-06-05 | 1991-01-16 | Matsushita Electric Works Ltd | 歌音声合成データの作成装置 |
JP2009217141A (ja) * | 2008-03-12 | 2009-09-24 | Yamaha Corp | 音声合成装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5518408A (en) * | 1993-04-06 | 1996-05-21 | Yamaha Corporation | Karaoke apparatus sounding instrumental accompaniment and back chorus |
US5654516A (en) * | 1993-11-03 | 1997-08-05 | Yamaha Corporation | Karaoke system having a playback source with pre-stored data and a music synthesizing source with rewriteable data |
JP2921428B2 (ja) * | 1995-02-27 | 1999-07-19 | ヤマハ株式会社 | カラオケ装置 |
JP3502247B2 (ja) * | 1997-10-28 | 2004-03-02 | ヤマハ株式会社 | 音声変換装置 |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
JP4483188B2 (ja) * | 2003-03-20 | 2010-06-16 | ソニー株式会社 | 歌声合成方法、歌声合成装置、プログラム及び記録媒体並びにロボット装置 |
US7271329B2 (en) * | 2004-05-28 | 2007-09-18 | Electronic Learning Products, Inc. | Computer-aided learning system employing a pitch tracking line |
JP4265501B2 (ja) * | 2004-07-15 | 2009-05-20 | ヤマハ株式会社 | 音声合成装置およびプログラム |
US7772480B2 (en) * | 2007-08-10 | 2010-08-10 | Sonicjam, Inc. | Interactive music training and entertainment system and multimedia role playing game platform |
US8706496B2 (en) * | 2007-09-13 | 2014-04-22 | Universitat Pompeu Fabra | Audio signal transforming by utilizing a computational cost function |
-
2009
- 2009-05-21 US US12/470,086 patent/US8244546B2/en active Active
- 2009-05-28 JP JP2009129446A patent/JP5024711B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH037994A (ja) * | 1989-06-05 | 1991-01-16 | Matsushita Electric Works Ltd | 歌音声合成データの作成装置 |
JP2009217141A (ja) * | 2008-03-12 | 2009-09-24 | Yamaha Corp | 音声合成装置 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9009052B2 (en) | 2010-07-20 | 2015-04-14 | National Institute Of Advanced Industrial Science And Technology | System and method for singing synthesis capable of reflecting voice timbre changes |
KR101890303B1 (ko) * | 2010-10-21 | 2018-08-22 | 삼성전자주식회사 | 가창 음성 생성 방법 및 그에 따른 장치 |
KR20120041656A (ko) * | 2010-10-21 | 2012-05-02 | 삼성전자주식회사 | 가창 음성 생성 방법 및 그에 따른 장치 |
JP2013156544A (ja) * | 2012-01-31 | 2013-08-15 | Brother Ind Ltd | 発声区間特定装置、音声パラメータ生成装置、及びプログラム |
JP2013195928A (ja) * | 2012-03-22 | 2013-09-30 | Yamaha Corp | 音声素片切出装置 |
JPWO2014088036A1 (ja) * | 2012-12-04 | 2017-01-05 | 国立研究開発法人産業技術総合研究所 | 歌声合成システム及び歌声合成方法 |
US9595256B2 (en) | 2012-12-04 | 2017-03-14 | National Institute Of Advanced Industrial Science And Technology | System and method for singing synthesis |
WO2014088036A1 (ja) * | 2012-12-04 | 2014-06-12 | 独立行政法人産業技術総合研究所 | 歌声合成システム及び歌声合成方法 |
JP2014178512A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音声合成装置 |
JP2016050994A (ja) * | 2014-08-29 | 2016-04-11 | ヤマハ株式会社 | 音響処理装置 |
JP2016118722A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
JP2016161919A (ja) * | 2015-03-05 | 2016-09-05 | ヤマハ株式会社 | 音声合成装置 |
JP2017027021A (ja) * | 2015-07-24 | 2017-02-02 | ヤマハ株式会社 | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 |
JP2017181793A (ja) * | 2016-03-30 | 2017-10-05 | ブラザー工業株式会社 | 音響処理装置、及びプログラム |
JP2017045073A (ja) * | 2016-12-05 | 2017-03-02 | ヤマハ株式会社 | 音声合成方法および音声合成装置 |
Also Published As
Publication number | Publication date |
---|---|
US20090306987A1 (en) | 2009-12-10 |
US8244546B2 (en) | 2012-08-14 |
JP5024711B2 (ja) | 2012-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5024711B2 (ja) | 歌声合成パラメータデータ推定システム | |
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
JP3823930B2 (ja) | 歌唱合成装置、歌唱合成プログラム | |
US9595256B2 (en) | System and method for singing synthesis | |
JP4469883B2 (ja) | 音声合成方法及びその装置 | |
EP1849154B1 (en) | Methods and apparatus for use in sound modification | |
Umbert et al. | Expression control in singing voice synthesis: Features, approaches, evaluation, and challenges | |
JP2017107228A (ja) | 歌声合成装置および歌声合成方法 | |
CN116895267A (zh) | 电子乐器、电子乐器的控制方法以及存储介质 | |
EP2270773A1 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
JPH10153998A (ja) | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 | |
JP5148026B1 (ja) | 音声合成装置および音声合成方法 | |
Rodet | Synthesis and processing of the singing voice | |
CN111696498B (zh) | 键盘乐器以及键盘乐器的计算机执行的方法 | |
CN103915093A (zh) | 一种实现语音歌唱化的方法和装置 | |
JP5136128B2 (ja) | 音声合成装置 | |
JP6756151B2 (ja) | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 | |
JP2009133890A (ja) | 音声合成装置及びその方法 | |
Lee et al. | A comparative study of spectral transformation techniques for singing voice synthesis | |
JP5062178B2 (ja) | 音声収録システム、音声収録方法、および収録処理プログラム | |
JP2001117598A (ja) | 音声変換装置及び方法 | |
JP6578544B1 (ja) | 音声処理装置、および音声処理方法 | |
JP4430174B2 (ja) | 音声変換装置及び音声変換方法 | |
JP6191094B2 (ja) | 音声素片切出装置 | |
JP4622356B2 (ja) | 音声合成用スクリプト生成装置及び音声合成用スクリプト生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120608 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5024711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |