JP2011028230A - 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 - Google Patents
歌唱合成用データベース生成装置、およびピッチカーブ生成装置 Download PDFInfo
- Publication number
- JP2011028230A JP2011028230A JP2010131837A JP2010131837A JP2011028230A JP 2011028230 A JP2011028230 A JP 2011028230A JP 2010131837 A JP2010131837 A JP 2010131837A JP 2010131837 A JP2010131837 A JP 2010131837A JP 2011028230 A JP2011028230 A JP 2011028230A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- melody
- singing
- component
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 39
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 104
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 93
- 230000001419 dependent effect Effects 0.000 claims abstract description 82
- 238000010801 machine learning Methods 0.000 claims description 37
- 239000000203 mixture Substances 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 abstract description 13
- 239000011295 pitch Substances 0.000 description 132
- 238000000034 method Methods 0.000 description 78
- 230000008569 process Effects 0.000 description 66
- 238000012545 processing Methods 0.000 description 29
- 230000007704 transition Effects 0.000 description 24
- 238000000605 extraction Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/066—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/086—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/155—Library update, i.e. making or modifying a musical database using musical parameters as indices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/005—Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
- G10H2250/015—Markov chains, e.g. hidden Markov models [HMM], for musical processing, e.g. musical analysis or musical composition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/455—Gensound singing voices, i.e. generation of human voices for musical applications, vocal singing sounds or intelligible words at a desired pitch or with desired vocal effects, e.g. by phoneme synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/471—General musical sound synthesis principles, i.e. sound category-independent synthesis methods
- G10H2250/481—Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Electrophonic Musical Instruments (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】音素に依存したピッチ変動を加味しつつ歌唱者毎のメロディの歌いまわしに表れる歌唱表現を的確にモデル化し、より自然に聴こえる歌唱音声の合成を可能にする技術を提供する。
【解決手段】歌唱音声の基本周波数の時間変化をメロディに依存したメロディ依存成分と音素に依存した音素依存成分とに分離し、成分毎にモデル化して歌唱合成用データベースに格納する。歌唱合成の実行段階では、歌唱合成用スコアの示す音符の配列と上記メロディ依存成分モデルとにしたがって、メロディの基本周波数の時間変化を表すピッチカーブを合成し、歌詞を構成する音素の区間毎にその音素に対応する音素依存成分モデルを利用して上記ピッチカーブを補正する。
【選択図】図7
Description
(A:第1実施形態)
(A−1:構成)
図1は、本発明の第1実施形態である歌唱合成装置1Aの構成例を示すブロック図である。この歌唱合成装置1Aは、歌唱曲の歌唱音声の音波形を表す波形データ(以下、学習用波形データ)とその歌唱曲の楽譜を表すスコアデータ(すなわち、歌唱曲のメロディを構成する音符(本実施形態では、休符も音符とみなす)と音符に合わせて歌唱する歌詞の時系列を表すデータ)とから機械学習により歌唱合成用データベースを生成し、その歌唱合成用データベースの格納内容を利用して歌唱合成を行う装置である。図1に示すように、歌唱合成装置1Aは、制御部110、インタフェース群120、操作部130、表示部140、記憶部150、およびこれら構成要素間のデータ授受を仲介するバス160を有している。
以上が歌唱合成装置1Aの構成である。
次いで、データベース生成プログラム154aおよび歌唱合成プログラム154bの各々にしたがって制御部110が実行する処理について説明する。図3は、制御部110がデータベース生成プログラム154aにしたがって実行するデータベース生成処理、および歌唱合成プログラム154bにしたがって実行する歌唱合成処理の流れを示す図である。図3に示すように、データベース生成処理は、メロディ成分抽出処理SA110と機械学習処理SA120を含んでおり、歌唱合成処理は、ピッチカーブ生成処理SB110とフィルタ処理SB120を含んでいる。
以上が本実施形態におけるデータベース生成処理の内容である。
以上が本実施形態における歌唱合成処理の内容である。
次いで、本発明の第2実施形態について説明する。
(B−1:構成)
図6は、本発明の第2の実施形態である歌唱合成装置1Bの構成例を示す図である。図6では、図1と同一の構成要素には同一の符号が付されている。図6と図1を対比すれば明らかように、歌唱合成装置1Bは、歌唱合成装置1Aと同一のハードウェア構成(制御部110、インタフェース群120、操作部130、表示部140、記憶部150およびバス160からなるハードウェア構成)を有するものの、ソフトウェア構成(すなわち、記憶部150に格納されているプログラムおよびデータ)が歌唱合成装置1Aと異なっている。より詳細に説明すると、歌唱合成装置1Bのソフトウェア構成は、データベース生成プログラム154aに代えてデータベース生成プログラム154dを、歌唱合成プログラム154bに代えて歌唱合成プログラム154eを、歌唱合成用データベース154cに代えて歌唱合成用データベース154fを不揮発性記憶部154に格納した点が歌唱合成装置1Aのソフトウェア構成と異なる。
以下、第1実施形態との相違点を中心に説明する。
次いで、データベース生成プログラム154dおよび歌唱合成プログラム154eの各々にしたがって歌唱合成装置1Bの制御部110が実行する処理について説明する。
図7に示すように、データベース生成プログラム154dにしたがって制御部110が実行するデータベース生成処理は、ピッチ抽出処理SD110、分離処理SD120、機械学習処理SA120および機械学習処理SD130を含んでいる。ピッチ抽出処理SD110および分離処理SD120は、図3のメロディ成分抽出処理SA110に相当し、前述した第2の態様でメロディ成分データを生成する処理である。より詳細に説明すると、ピッチ抽出処理SD110は、インタフェース群120を介して入力される学習用波形データに対してフレーム単位で既存のピッチ抽出アルゴリズムにしたがったピッチ抽出を施し、各フレームから抽出されるピッチを示すデータの配列をピッチデータとして生成する処理である。一方、分離処理SD120は、ピッチ抽出処理SD110にて生成したピッチデータを学習用スコアデータの表わす歌詞を構成する音素に対応する区間毎に区切り、前掲図4に示した要領で音素依存成分を除去してメロディに依存したピッチ変動を表すメロディ成分データを生成する。また、この分離処理SD120では、音素に起因したピッチ変動を表す音素依存成分データ(図4における一点鎖線と実線との差分を示すデータ)も生成される。
以上が本実施形態におけるデータベース生成処理である。
図7に示すように、歌唱合成プログラム154eにしたがって制御部110が実行する歌唱合成処理は、ピッチカーブ生成処理SB110、音素依存成分補正処理SE110およびフィルタ処理SB120を含んでいる。図7に示すように、本実施形態の歌唱合成処理は、ピッチカーブ生成処理SB110により生成したピッチカーブに対して音素依存成分補正処理SE110を施し、この補正後のピッチカーブにしたがって音信号を音源に出力させ、この音信号にフィルタ処理SB120を施す点が図3に示す歌唱合成処理と異なる。音素依存成分補正処理SE110では、歌唱合成用スコアデータの示す歌詞を構成する音素の区間毎に、以下の要領でピッチカーブを補正する処理が行われる。すなわち、歌唱音声の合成対象として指定された歌唱者についての音素依存成分補正用データベースから、歌唱合成用スコアデータの示す歌詞を構成する音素に対応する音素依存成分パラメータを読み出し、その音素依存成分パラメータにより規定される音素依存成分モデルの表すピッチ変動を付与することで上記ピッチカーブの補正が行われるのである。このようなピッチカーブの補正を行うことによって、合成対象として指定された歌唱者のメロディの歌いまわしについての歌唱表現に加え、その歌唱者の音素の発音態様に起因したピッチ変動を反映したピッチカーブが生成されるのである。
以上、本発明の第1および第2実施形態について説明したが、かかる実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した各実施形態では、本発明の特徴を顕著に示す各処理をソフトウェアで実現した。しかし、メロディ成分抽出処理SA110を実行するメロディ成分抽出手段、および機械学習処理SA120を実行する機械学習手段、ピッチカーブ生成処理SB110を実行するピッチカーブ生成手段、およびフィルタ処理SB120を実行するフィルタ処理手段の各々を電子回路で構成し、学習用波形データや各種スコアデータを入力するための入力手段と組み合わせて歌唱合成装置1Aを構成しても良い。同様に、ピッチ抽出処理SD110を実行するピッチ抽出手段、分離処理SD120を実行する分離手段、機械学習処理SA120および機械学習処理SD130を実行する機械学習手段、音素依存成分補正処理SE110を実行する音素依存成分補正手段の各々を電子回路で構成し、上記入力手段、ピッチカーブ生成手段およびフィルタ処理手段と組み合わせて歌唱合成装置1Bを構成しても勿論良い。
Claims (3)
- 歌唱曲の歌唱音声の音波形を示す学習用波形データと、前記歌唱曲の楽譜を表す学習用スコアデータとが入力される入力手段と、
前記学習用波形データを解析し、前記歌唱音声における基本周波数の時間変動を表すピッチデータを生成するピッチ抽出手段と、
前記学習用スコアデータを用いて前記歌唱曲の歌詞を構成する音素に対応する区間毎に前記ピッチデータを解析し、前記歌唱曲のメロディに依存した基本周波数の変動分を表すメロディ成分データと、歌詞を構成する音素に依存した基本周波数の変動分を表す音素依存成分データとに分離する分離手段と、
前記学習用スコアデータと前記メロディ成分データとを用いた機械学習により、前記歌唱音声における音符間の基本周波数の時間変動のうちメロディを表していると推測される変動成分を表現するメロディ成分モデルを規定するメロディ成分パラメータを音符の組み合わせ毎に生成するとともに、前記学習用スコアデータと前記音素依存成分データとを用いた機械学習により前記歌唱音声における音素に依存した基本周波数の変動成分を表現する音素依存成分モデルを規定する音素依存成分パラメータを音素毎に生成し、前記メロディ成分パラメータとそのメロディ成分パラメータにより規定されるメロディ成分モデルによりメロディを表す基本周波数の時間変動が表される1組または複数組みの音符の組み合わせを示す識別子とを対応付けて歌唱合成用データベースに書き込むとともに、前記音素依存成分パラメータとその音素依存成分パラメータにより規定される音素依存成分モデルにより音素に依存した基本周波数の変動成分が表される音素を示す識別子を対応付けて前記歌唱合成用データベースに書き込む機械学習手段と、
を有することを特徴とする歌唱合成用データベース生成装置。 - 前記学習用波形データとして複数の歌唱者の各々の歌唱音声を表す複数の学習用波形データが前記入力手段に入力された場合には、前記機械学習手段は、前記複数の学習用波形データの各々に基づいて生成されるメロディ成分パラメータを歌唱者毎に分類して前記歌唱合成用データベースに書き込むことを特徴とする請求項1に記載の歌唱合成用データベース生成装置。
- 複数の歌唱者の各々の歌唱音声における音符間の基本周波数の時間変動のうちメロディを表していると推測される変動成分を表現するメロディ成分モデルを規定するメロディ成分パラメータとそのメロディ成分モデルによりメロディを表す基本周波数の時間変動が表される1組または複数組の音符の組み合わせを示す識別子とが歌唱者毎に分類されて格納されているとともに、前記基本周波数の時間変動のうち音素に依存した変動成分を表現する音素依存成分モデルを規定する音素依存成分パラメータに対応付けてその音素依存成分モデルにより基本周波数の変動成分が表される音素を示す識別子が格納されている歌唱合成用データベースと、
歌唱曲の楽譜を表す歌唱合成用スコアデータが入力されるとともに、前記歌唱合成用データベースにメロディ成分パラメータおよび音素依存成分パラメータが格納されている歌唱者のうちの何れかを指定する情報が入力される入力手段と、
前記入力手段に入力された情報の示す歌唱者のものとして前記歌唱合成用データベースに格納されているメロディ成分パラメータにより規定されるメロディ成分モデルと前記歌唱合成用スコアデータの表す音符の時系列とから、当該歌唱合成用スコアデータの表す歌唱曲のメロディのピッチカーブを合成するピッチカーブ生成手段と、
前記ピッチカーブを、前記歌唱合成用スコアデータの示す歌詞を構成する音素の区間毎に、当該音素のものとして前記歌唱合成用データベースに格納されている音素依存成分パラメータにより規定される音素依存成分モデルにしたがって補正して出力する音素依存成分補正手段と、
を有することを特徴とするピッチカーブ生成装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010131837A JP5471858B2 (ja) | 2009-07-02 | 2010-06-09 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
EP10167620A EP2270773B1 (en) | 2009-07-02 | 2010-06-29 | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method |
US12/828,409 US8423367B2 (en) | 2009-07-02 | 2010-07-01 | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009157531 | 2009-07-02 | ||
JP2009157531 | 2009-07-02 | ||
JP2010131837A JP5471858B2 (ja) | 2009-07-02 | 2010-06-09 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011028230A true JP2011028230A (ja) | 2011-02-10 |
JP5471858B2 JP5471858B2 (ja) | 2014-04-16 |
Family
ID=42753005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010131837A Expired - Fee Related JP5471858B2 (ja) | 2009-07-02 | 2010-06-09 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8423367B2 (ja) |
EP (1) | EP2270773B1 (ja) |
JP (1) | JP5471858B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5874639B2 (ja) * | 2010-09-06 | 2016-03-02 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP5605066B2 (ja) * | 2010-08-06 | 2014-10-15 | ヤマハ株式会社 | 音合成用データ生成装置およびプログラム |
JP5974436B2 (ja) * | 2011-08-26 | 2016-08-23 | ヤマハ株式会社 | 楽曲生成装置 |
JP6171711B2 (ja) * | 2013-08-09 | 2017-08-02 | ヤマハ株式会社 | 音声解析装置および音声解析方法 |
JP5807921B2 (ja) * | 2013-08-23 | 2015-11-10 | 国立研究開発法人情報通信研究機構 | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム |
US9269339B1 (en) * | 2014-06-02 | 2016-02-23 | Illiac Software, Inc. | Automatic tonal analysis of musical scores |
JP6561499B2 (ja) * | 2015-03-05 | 2019-08-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
US10008193B1 (en) * | 2016-08-19 | 2018-06-26 | Oben, Inc. | Method and system for speech-to-singing voice conversion |
US10134374B2 (en) * | 2016-11-02 | 2018-11-20 | Yamaha Corporation | Signal processing method and signal processing apparatus |
CN108877753B (zh) * | 2018-06-15 | 2020-01-21 | 百度在线网络技术(北京)有限公司 | 音乐合成方法及系统、终端以及计算机可读存储介质 |
JP6610715B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6547878B1 (ja) * | 2018-06-21 | 2019-07-24 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610714B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
CN109241312B (zh) * | 2018-08-09 | 2021-08-31 | 广东数相智能科技有限公司 | 旋律的填词方法、装置及终端设备 |
JP6737320B2 (ja) | 2018-11-06 | 2020-08-05 | ヤマハ株式会社 | 音響処理方法、音響処理システムおよびプログラム |
JP6747489B2 (ja) | 2018-11-06 | 2020-08-26 | ヤマハ株式会社 | 情報処理方法、情報処理システムおよびプログラム |
JP7059972B2 (ja) | 2019-03-14 | 2022-04-26 | カシオ計算機株式会社 | 電子楽器、鍵盤楽器、方法、プログラム |
CN110136678B (zh) * | 2019-04-26 | 2022-06-03 | 北京奇艺世纪科技有限公司 | 一种编曲方法、装置及电子设备 |
US12059533B1 (en) | 2020-05-20 | 2024-08-13 | Pineal Labs Inc. | Digital music therapeutic system with automated dosage |
CN112542155B (zh) * | 2020-11-27 | 2021-09-21 | 北京百度网讯科技有限公司 | 歌曲合成方法及模型训练方法、装置、设备与存储介质 |
CN112992106B (zh) * | 2021-03-23 | 2024-06-25 | 平安科技(深圳)有限公司 | 基于手绘图形的音乐创作方法、装置、设备及介质 |
CN113345453B (zh) * | 2021-06-01 | 2023-06-16 | 平安科技(深圳)有限公司 | 歌声转换方法、装置、设备及存储介质 |
CN113436591B (zh) * | 2021-06-24 | 2023-11-17 | 广州酷狗计算机科技有限公司 | 音高信息生成方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282493A (ja) * | 1998-03-31 | 1999-10-15 | Matsushita Electric Ind Co Ltd | 音声合成方法とその装置 |
JP2003108179A (ja) * | 2001-10-01 | 2003-04-11 | Nippon Telegr & Teleph Corp <Ntt> | 歌唱音声合成における韻律データ収集方法、韻律データ収集プログラム、そのプログラムを記録した記録媒体 |
JP2007240564A (ja) * | 2006-03-04 | 2007-09-20 | Yamaha Corp | 歌唱合成装置および歌唱合成プログラム |
JP2007256866A (ja) * | 2006-03-24 | 2007-10-04 | Casio Comput Co Ltd | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
JP2009075611A (ja) * | 2008-12-08 | 2009-04-09 | Yamaha Corp | 合唱合成装置、合唱合成方法およびプログラム |
JP2011013454A (ja) * | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP2013164609A (ja) * | 2013-04-15 | 2013-08-22 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3102335B2 (ja) * | 1996-01-18 | 2000-10-23 | ヤマハ株式会社 | フォルマント変換装置およびカラオケ装置 |
US5963903A (en) * | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Method and system for dynamically adjusted training for speech recognition |
US5895449A (en) * | 1996-07-24 | 1999-04-20 | Yamaha Corporation | Singing sound-synthesizing apparatus and method |
JP3299890B2 (ja) * | 1996-08-06 | 2002-07-08 | ヤマハ株式会社 | カラオケ採点装置 |
US5915237A (en) * | 1996-12-13 | 1999-06-22 | Intel Corporation | Representing speech using MIDI |
US6304846B1 (en) * | 1997-10-22 | 2001-10-16 | Texas Instruments Incorporated | Singing voice synthesis |
US6236966B1 (en) * | 1998-04-14 | 2001-05-22 | Michael K. Fleming | System and method for production of audio control parameters using a learning machine |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
JP2000105595A (ja) * | 1998-09-30 | 2000-04-11 | Victor Co Of Japan Ltd | 歌唱装置及び記録媒体 |
EP1138038B1 (en) * | 1998-11-13 | 2005-06-22 | Lernout & Hauspie Speech Products N.V. | Speech synthesis using concatenation of speech waveforms |
JP2001109489A (ja) * | 1999-08-03 | 2001-04-20 | Canon Inc | 音声情報処理方法、装置および記憶媒体 |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
US6810379B1 (en) * | 2000-04-24 | 2004-10-26 | Sensory, Inc. | Client/server architecture for text-to-speech synthesis |
US6684187B1 (en) * | 2000-06-30 | 2004-01-27 | At&T Corp. | Method and system for preselection of suitable units for concatenative speech |
US6505158B1 (en) * | 2000-07-05 | 2003-01-07 | At&T Corp. | Synthesis-based pre-selection of suitable units for concatenative speech |
JP3879402B2 (ja) * | 2000-12-28 | 2007-02-14 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP4067762B2 (ja) * | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
JP2002268660A (ja) | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
US7444286B2 (en) * | 2001-09-05 | 2008-10-28 | Roth Daniel L | Speech recognition using re-utterance recognition |
JP3815347B2 (ja) * | 2002-02-27 | 2006-08-30 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP4153220B2 (ja) * | 2002-02-28 | 2008-09-24 | ヤマハ株式会社 | 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム |
JP3823930B2 (ja) * | 2003-03-03 | 2006-09-20 | ヤマハ株式会社 | 歌唱合成装置、歌唱合成プログラム |
JP3864918B2 (ja) * | 2003-03-20 | 2007-01-10 | ソニー株式会社 | 歌声合成方法及び装置 |
JP4265501B2 (ja) * | 2004-07-15 | 2009-05-20 | ヤマハ株式会社 | 音声合成装置およびプログラム |
WO2006046761A1 (ja) * | 2004-10-27 | 2006-05-04 | Yamaha Corporation | ピッチ変換装置 |
US7560636B2 (en) * | 2005-02-14 | 2009-07-14 | Wolfram Research, Inc. | Method and system for generating signaling tone sequences |
US7737354B2 (en) * | 2006-06-15 | 2010-06-15 | Microsoft Corporation | Creating music via concatenative synthesis |
US8244546B2 (en) * | 2008-05-28 | 2012-08-14 | National Institute Of Advanced Industrial Science And Technology | Singing synthesis parameter data estimation system |
US7977562B2 (en) * | 2008-06-20 | 2011-07-12 | Microsoft Corporation | Synthesized singing voice waveform generator |
US8575465B2 (en) * | 2009-06-02 | 2013-11-05 | Indian Institute Of Technology, Bombay | System and method for scoring a singing voice |
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
TWI394142B (zh) * | 2009-08-25 | 2013-04-21 | Inst Information Industry | 歌聲合成系統、方法、以及裝置 |
JP5605066B2 (ja) * | 2010-08-06 | 2014-10-15 | ヤマハ株式会社 | 音合成用データ生成装置およびプログラム |
-
2010
- 2010-06-09 JP JP2010131837A patent/JP5471858B2/ja not_active Expired - Fee Related
- 2010-06-29 EP EP10167620A patent/EP2270773B1/en not_active Not-in-force
- 2010-07-01 US US12/828,409 patent/US8423367B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282493A (ja) * | 1998-03-31 | 1999-10-15 | Matsushita Electric Ind Co Ltd | 音声合成方法とその装置 |
JP2003108179A (ja) * | 2001-10-01 | 2003-04-11 | Nippon Telegr & Teleph Corp <Ntt> | 歌唱音声合成における韻律データ収集方法、韻律データ収集プログラム、そのプログラムを記録した記録媒体 |
JP2007240564A (ja) * | 2006-03-04 | 2007-09-20 | Yamaha Corp | 歌唱合成装置および歌唱合成プログラム |
JP2007256866A (ja) * | 2006-03-24 | 2007-10-04 | Casio Comput Co Ltd | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
JP2009075611A (ja) * | 2008-12-08 | 2009-04-09 | Yamaha Corp | 合唱合成装置、合唱合成方法およびプログラム |
JP2011013454A (ja) * | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP2013164609A (ja) * | 2013-04-15 | 2013-08-22 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Non-Patent Citations (1)
Title |
---|
KEIJIRO SAINO, ET AL.: "A Singing Style Modeling System for Singing Voice Synthesizers", PROC. INTERSPEECH 2010, JPN7013004858, 26 September 2010 (2010-09-26), JP, pages 2894 - 2897, XP055284574, ISSN: 0002718468 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5874639B2 (ja) * | 2010-09-06 | 2016-03-02 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20110004476A1 (en) | 2011-01-06 |
JP5471858B2 (ja) | 2014-04-16 |
US8423367B2 (en) | 2013-04-16 |
EP2270773A1 (en) | 2011-01-05 |
EP2270773B1 (en) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
US9818396B2 (en) | Method and device for editing singing voice synthesis data, and method for analyzing singing | |
CN106971703A (zh) | 一种基于hmm的歌曲合成方法及装置 | |
US20110231193A1 (en) | Synthesized singing voice waveform generator | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP2011048335A (ja) | 歌声合成システム、歌声合成方法及び歌声合成装置 | |
CN104050961A (zh) | 语音合成装置和方法以及存储有语音合成程序的记录介质 | |
JP2016161919A (ja) | 音声合成装置 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP3728173B2 (ja) | 音声合成方法、装置および記憶媒体 | |
JP2003345400A (ja) | ピッチ変換装置、ピッチ変換方法及びプログラム | |
JP6044284B2 (ja) | 音声合成装置 | |
JP4430174B2 (ja) | 音声変換装置及び音声変換方法 | |
JP6314828B2 (ja) | 韻律モデル学習装置、韻律モデル学習方法、音声合成システム、および韻律モデル学習プログラム | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5699496B2 (ja) | 音合成用確率モデル生成装置、特徴量軌跡生成装置およびプログラム | |
JPH06318094A (ja) | 音声規則合成装置 | |
JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP6299141B2 (ja) | 楽音情報生成装置および楽音情報生成方法 | |
WO2023182291A1 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP6191094B2 (ja) | 音声素片切出装置 | |
JP4603290B2 (ja) | 音声合成装置および音声合成プログラム | |
CN116013246A (zh) | 说唱音乐自动生成方法及系统 | |
JP6036681B2 (ja) | 音声合成システム、音声合成方法、および音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130419 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5471858 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |