JP5293460B2 - 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 - Google Patents
歌唱合成用データベース生成装置、およびピッチカーブ生成装置 Download PDFInfo
- Publication number
- JP5293460B2 JP5293460B2 JP2009157527A JP2009157527A JP5293460B2 JP 5293460 B2 JP5293460 B2 JP 5293460B2 JP 2009157527 A JP2009157527 A JP 2009157527A JP 2009157527 A JP2009157527 A JP 2009157527A JP 5293460 B2 JP5293460 B2 JP 5293460B2
- Authority
- JP
- Japan
- Prior art keywords
- melody
- singing
- database
- data
- song
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 98
- 238000003786 synthesis reaction Methods 0.000 title claims description 87
- 230000002194 synthesizing effect Effects 0.000 claims description 40
- 238000010801 machine learning Methods 0.000 claims description 31
- 238000000605 extraction Methods 0.000 claims description 24
- 230000002123 temporal effect Effects 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 11
- 239000011295 pitch Substances 0.000 description 101
- 238000000034 method Methods 0.000 description 73
- 230000008569 process Effects 0.000 description 60
- 230000001419 dependent effect Effects 0.000 description 34
- 238000012545 processing Methods 0.000 description 30
- 230000007704 transition Effects 0.000 description 24
- 238000003860 storage Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/086—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/155—Library update, i.e. making or modifying a musical database using musical parameters as indices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/005—Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
- G10H2250/015—Markov chains, e.g. hidden Markov models [HMM], for musical processing, e.g. musical analysis or musical composition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/395—Gensound nature
- G10H2250/415—Weather
- G10H2250/425—Thunder
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/471—General musical sound synthesis principles, i.e. sound category-independent synthesis methods
- G10H2250/481—Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Electrophonic Musical Instruments (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(A:第1実施形態)
(A−1:構成)
図1は、本発明の第1実施形態である歌唱合成装置1Aの構成例を示すブロック図である。この歌唱合成装置1Aは、歌唱曲の歌唱音声の音波形を表す波形データ(以下、学習用波形データ)とその歌唱曲の楽譜を表すスコアデータ(すなわち、歌唱曲のメロディを構成する音符(本実施形態では、休符も音符とみなす)と音符に合わせて歌唱する歌詞の時系列を表すデータ)とから機械学習により歌唱合成用データベースを生成し、その歌唱合成用データベースの格納内容を利用して歌唱合成を行う装置である。図1に示すように、歌唱合成装置1Aは、制御部110、インタフェース群120、操作部130、表示部140、記憶部150、およびこれら構成要素間のデータ授受を仲介するバス160を有している。
以上が歌唱合成装置1Aの構成である。
次いで、データベース生成プログラム154aおよび歌唱合成プログラム154bの各々にしたがって制御部110が実行する処理について説明する。図3は、制御部110がデータベース生成プログラム154aにしたがって実行するデータベース生成処理、および歌唱合成プログラム154bにしたがって実行する歌唱合成処理の流れを示す図である。図3に示すように、データベース生成処理は、メロディ成分抽出処理SA110と機械学習処理SA120を含んでおり、歌唱合成処理は、ピッチカーブ生成処理SB110とフィルタ処理SB120を含んでいる。
以上が本実施形態におけるデータベース生成処理の内容である。
以上が本実施形態における歌唱合成処理の内容である。
次いで、本発明の第2実施形態について説明する。
(B−1:構成)
図6は、本発明の第2の実施形態である歌唱合成装置1Bの構成例を示す図である。図6では、図1と同一の構成要素には同一の符号が付されている。図6と図1を対比すれば明らかように、歌唱合成装置1Bは、歌唱合成装置1Aと同一のハードウェア構成(制御部110、インタフェース群120、操作部130、表示部140、記憶部150およびバス160からなるハードウェア構成)を有するものの、ソフトウェア構成(すなわち、記憶部150に格納されているプログラムおよびデータ)が歌唱合成装置1Aと異なっている。より詳細に説明すると、歌唱合成装置1Bのソフトウェア構成は、データベース生成プログラム154aに代えてデータベース生成プログラム154dを、歌唱合成プログラム154bに代えて歌唱合成プログラム154eを、歌唱合成用データベース154cに代えて歌唱合成用データベース154fを不揮発性記憶部154に格納した点が歌唱合成装置1Aのソフトウェア構成と異なる。
以下、第1実施形態との相違点を中心に説明する。
次いで、データベース生成プログラム154dおよび歌唱合成プログラム154eの各々にしたがって歌唱合成装置1Bの制御部110が実行する処理について説明する。
図7に示すように、データベース生成プログラム154dにしたがって制御部110が実行するデータベース生成処理は、ピッチ抽出処理SD110、分離処理SD120、機械学習処理SA120および機械学習処理SD130を含んでいる。ピッチ抽出処理SD110および分離処理SD120は、図3のメロディ成分抽出処理SA110に相当し、前述した第2の態様でメロディ成分データを生成する処理である。より詳細に説明すると、ピッチ抽出処理SD110は、インタフェース群120を介して入力される学習用波形データに対してフレーム単位で既存のピッチ抽出アルゴリズムにしたがったピッチ抽出を施し、各フレームから抽出されるピッチを示すデータの配列をピッチデータとして生成する処理である。一方、分離処理SD120は、ピッチ抽出処理SD110にて生成したピッチデータから前掲図4に示した要領で音素依存成分を除去してメロディに依存したピッチ変動を表すメロディ成分データを生成する。また、この分離処理SD120では、音素に起因したピッチ変動を表す音素依存成分データ(図4における一点鎖線と実線との差分を示すデータ)も生成される。
以上が本実施形態におけるデータベース生成処理である。
図7に示すように、歌唱合成プログラム154eにしたがって制御部110が実行する歌唱合成処理は、ピッチカーブ生成処理SB110、音素依存成分補正処理SE110およびフィルタ処理SB120を含んでいる。図7に示すように、本実施形態の歌唱合成処理は、ピッチカーブ生成処理SB110により生成したピッチカーブに対して音素依存成分補正処理SE110を施し、この補正後のピッチカーブにしたがって音信号を音源に出力させ、この音信号にフィルタ処理SB120を施す点が図3に示す歌唱合成処理と異なる。音素依存成分補正処理SE110では、歌唱合成用スコアデータの示す歌詞を構成する音素の区間毎に、以下の要領でピッチカーブを補正する処理が行われる。すなわち、歌唱音声の合成対象として指定された歌唱者についての音素依存成分補正用データベースから、歌唱合成用スコアデータの示す歌詞を構成する音素に対応する音素依存成分パラメータを読み出し、その音素依存成分パラメータにより規定される音素依存成分モデルの表すピッチ変動を付与することで上記ピッチカーブの補正が行われるのである。このようなピッチカーブの補正を行うことによって、合成対象として指定された歌唱者のメロディの歌いまわしについての歌唱表現に加え、その歌唱者の音素の発音態様に起因したピッチ変動を反映したピッチカーブが生成されるのである。
以上、本発明の第1および第2実施形態について説明したが、かかる実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した各実施形態では、本発明の特徴を顕著に示す各処理をソフトウェアで実現した。しかし、メロディ成分抽出処理SA110を実行するメロディ成分抽出手段、および機械学習処理SA120を実行する機械学習手段、ピッチカーブ生成処理SB110を実行するピッチカーブ生成手段、およびフィルタ処理SB120を実行するフィルタ処理手段の各々を電子回路で構成し、学習用波形データや各種スコアデータを入力するための入力手段と組み合わせて歌唱合成装置1Aを構成しても良い。同様に、ピッチ抽出処理SD110を実行するピッチ抽出手段、分離処理SD120を実行する分離手段、機械学習処理SA120および機械学習処理SD130を実行する機械学習手段、音素依存成分補正処理SE110を実行する音素依存成分補正手段の各々を電子回路で構成し、上記入力手段、ピッチカーブ生成手段およびフィルタ処理手段と組み合わせて歌唱合成装置1Bを構成しても勿論良い。
Claims (3)
- 歌唱曲の歌唱音声の音波形を示す学習用波形データと前記歌唱曲の楽譜を表す学習用スコアデータとが入力される入力手段と、
前記学習用波形データを解析して前記歌唱音声にてメロディを表していると推測される基本周波数の時間変動を特定し、当該基本周波数の時間変動を表すメロディ成分データを生成するメロディ成分抽出手段と、
前記学習用スコアデータと前記メロディ成分データとを用いた機械学習により、前記歌唱音声における音符間の基本周波数の時間変動のうちメロディを表していると推測される変動成分を表現するメロディ成分モデルを規定するメロディ成分パラメータを前記歌唱曲のメロディを構成する音符の組み合わせ毎に生成し、そのメロディ成分パラメータとそのメロディ成分パラメータにより規定されるメロディ成分モデルにより基本周波数の時間変動が表される1組または複数組の音符の組み合わせを示す識別子とを対応付けて歌唱合成用データベースに格納する機械学習手段と、を有し、
前記メロディ成分抽出手段は、前記学習用波形データの示す歌唱音声の基本周波数の時間変動から前記歌唱曲の歌詞を構成する音素に依存した変動成分を除去して前記メロディ成分データを生成する
ことを特徴とする歌唱合成用データベース生成装置。 - 前記学習用波形データとして複数の歌唱者の各々の歌唱音声の音波形を表す複数の学習用波形データが前記入力手段に入力された場合には、前記機械学習手段は、前記複数の学習用波形データの各々に基づいて生成されるメロディ成分パラメータを歌唱者毎に分類して前記歌唱合成用データベースに書き込むことを特徴とする請求項1に記載の歌唱合成用データベース生成装置。
- 請求項2に記載の歌唱合成用データベース生成装置により生成された歌唱合成用データベースと、
歌唱曲の楽譜を表す歌唱合成用スコアデータが入力されるとともに、前記歌唱合成用データベースにメロディ成分パラメータが格納されている歌唱者のうちの何れかを指定する情報が入力される入力手段と、
前記入力手段を介して入力された情報の示す歌唱者のものとして前記歌唱合成用データベースに格納されているメロディ成分パラメータにより規定されるメロディ生成モデルと前記歌唱合成用スコアデータの表す音符の時系列とから、当該歌唱合成用スコアデータの表す歌唱曲のメロディのピッチカーブを合成するピッチカーブ生成手段と、
を有することを特徴とするピッチカーブ生成装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009157527A JP5293460B2 (ja) | 2009-07-02 | 2009-07-02 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
EP10167617A EP2276019B1 (en) | 2009-07-02 | 2010-06-29 | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method |
US12/828,375 US8115089B2 (en) | 2009-07-02 | 2010-07-01 | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method |
US13/347,573 US8338687B2 (en) | 2009-07-02 | 2012-01-10 | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009157527A JP5293460B2 (ja) | 2009-07-02 | 2009-07-02 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013084579A Division JP2013164609A (ja) | 2013-04-15 | 2013-04-15 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011013454A JP2011013454A (ja) | 2011-01-20 |
JP5293460B2 true JP5293460B2 (ja) | 2013-09-18 |
Family
ID=42732451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009157527A Expired - Fee Related JP5293460B2 (ja) | 2009-07-02 | 2009-07-02 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US8115089B2 (ja) |
EP (1) | EP2276019B1 (ja) |
JP (1) | JP5293460B2 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP5293460B2 (ja) | 2009-07-02 | 2013-09-18 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
US10383166B2 (en) | 2010-04-14 | 2019-08-13 | Qualcomm Incorporated | Method and apparatus for supporting location services via a home node B (HNB) |
US8158870B2 (en) | 2010-06-29 | 2012-04-17 | Google Inc. | Intervalgram representation of audio for melody recognition |
US8805683B1 (en) | 2012-02-24 | 2014-08-12 | Google Inc. | Real-time audio recognition protocol |
JP5605066B2 (ja) * | 2010-08-06 | 2014-10-15 | ヤマハ株式会社 | 音合成用データ生成装置およびプログラム |
US9119167B2 (en) | 2011-08-30 | 2015-08-25 | Qualcomm Incorporated | Generic broadcast of location assistance data |
US9137778B2 (en) | 2011-12-05 | 2015-09-15 | Qualcomm Incorporated | Systems and methods for low overhead paging |
US9384734B1 (en) | 2012-02-24 | 2016-07-05 | Google Inc. | Real-time audio recognition using multiple recognizers |
US9280599B1 (en) | 2012-02-24 | 2016-03-08 | Google Inc. | Interface for real-time audio recognition |
US9208225B1 (en) | 2012-02-24 | 2015-12-08 | Google Inc. | Incentive-based check-in |
GB2505400B (en) * | 2012-07-18 | 2015-01-07 | Toshiba Res Europ Ltd | A speech processing system |
US9484045B2 (en) * | 2012-09-07 | 2016-11-01 | Nuance Communications, Inc. | System and method for automatic prediction of speech suitability for statistical modeling |
JP2014178620A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音声処理装置 |
JP2014219607A (ja) * | 2013-05-09 | 2014-11-20 | ソニー株式会社 | 音楽信号処理装置および方法、並びに、プログラム |
JP6171711B2 (ja) | 2013-08-09 | 2017-08-02 | ヤマハ株式会社 | 音声解析装置および音声解析方法 |
JP5807921B2 (ja) * | 2013-08-23 | 2015-11-10 | 国立研究開発法人情報通信研究機構 | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム |
US9384731B2 (en) * | 2013-11-06 | 2016-07-05 | Microsoft Technology Licensing, Llc | Detecting speech input phrase confusion risk |
US10157272B2 (en) * | 2014-02-04 | 2018-12-18 | Qualcomm Incorporated | Systems and methods for evaluating strength of an audio password |
JP6252420B2 (ja) * | 2014-09-30 | 2017-12-27 | ブラザー工業株式会社 | 音声合成装置、及び音声合成システム |
JP2016080827A (ja) * | 2014-10-15 | 2016-05-16 | ヤマハ株式会社 | 音韻情報合成装置および音声合成装置 |
JP6561499B2 (ja) * | 2015-03-05 | 2019-08-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
JP6498141B2 (ja) * | 2016-03-16 | 2019-04-10 | 日本電信電話株式会社 | 音響信号解析装置、方法、及びプログラム |
US20180103450A1 (en) * | 2016-10-06 | 2018-04-12 | Qualcomm Incorporated | Devices for reduced overhead paging |
JP6569712B2 (ja) * | 2017-09-27 | 2019-09-04 | カシオ計算機株式会社 | 電子楽器、電子楽器の楽音発生方法、及びプログラム |
JP6729539B2 (ja) | 2017-11-29 | 2020-07-22 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
JP6722165B2 (ja) * | 2017-12-18 | 2020-07-15 | 大黒 達也 | 音楽情報の特徴解析方法及びその装置 |
EP3739572A4 (en) * | 2018-01-11 | 2021-09-08 | Neosapience, Inc. | METHOD AND DEVICE FOR TEXT-TO-LANGUAGE SYNTHESIS USING MACHINE LEARNING AND COMPUTER-READABLE STORAGE MEDIUM |
US11356804B2 (en) | 2018-02-25 | 2022-06-07 | Qualcomm Incorporated | Systems and methods for efficiently supporting broadcast of location assistance data in a wireless network |
CN110415677B (zh) * | 2018-04-26 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 音频生成方法和装置及存储介质 |
JP6547878B1 (ja) | 2018-06-21 | 2019-07-24 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610715B1 (ja) | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610714B1 (ja) | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
US11191056B2 (en) | 2018-08-08 | 2021-11-30 | Qualcomm Incorporated | Systems and methods for validity time and change notification of broadcast location assistance data |
WO2020031544A1 (ja) * | 2018-08-10 | 2020-02-13 | ヤマハ株式会社 | 楽譜データの情報処理装置 |
JP6747489B2 (ja) * | 2018-11-06 | 2020-08-26 | ヤマハ株式会社 | 情報処理方法、情報処理システムおよびプログラム |
JP6737320B2 (ja) | 2018-11-06 | 2020-08-05 | ヤマハ株式会社 | 音響処理方法、音響処理システムおよびプログラム |
US11183169B1 (en) * | 2018-11-08 | 2021-11-23 | Oben, Inc. | Enhanced virtual singers generation by incorporating singing dynamics to personalized text-to-speech-to-singing |
JP7059972B2 (ja) | 2019-03-14 | 2022-04-26 | カシオ計算機株式会社 | 電子楽器、鍵盤楽器、方法、プログラム |
JP6835182B2 (ja) * | 2019-10-30 | 2021-02-24 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6801766B2 (ja) * | 2019-10-30 | 2020-12-16 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
CN112951198A (zh) * | 2019-11-22 | 2021-06-11 | 微软技术许可有限责任公司 | 歌声合成 |
CN111739492B (zh) * | 2020-06-18 | 2023-07-11 | 南京邮电大学 | 一种基于音高轮廓曲线的音乐旋律生成方法 |
JP7180642B2 (ja) * | 2020-07-01 | 2022-11-30 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
CN112767914B (zh) * | 2020-12-31 | 2024-04-30 | 科大讯飞股份有限公司 | 歌唱语音合成方法及合成设备、计算机存储介质 |
JP2023105472A (ja) * | 2022-01-19 | 2023-07-31 | カシオ計算機株式会社 | 情報処理装置、電子楽器、電子楽器システム、方法及びプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US5327518A (en) * | 1991-08-22 | 1994-07-05 | Georgia Tech Research Corporation | Audio analysis/synthesis system |
US5559927A (en) * | 1992-08-19 | 1996-09-24 | Clynes; Manfred | Computer system producing emotionally-expressive speech messages |
US6236966B1 (en) * | 1998-04-14 | 2001-05-22 | Michael K. Fleming | System and method for production of audio control parameters using a learning machine |
JP3533974B2 (ja) * | 1998-11-25 | 2004-06-07 | ヤマハ株式会社 | 曲データ作成装置および曲データ作成プログラムを記録したコンピュータで読み取り可能な記録媒体 |
JP4067762B2 (ja) * | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
JP2002268660A (ja) | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
JP4026446B2 (ja) * | 2002-02-28 | 2007-12-26 | ヤマハ株式会社 | 歌唱合成方法、歌唱合成装置及び歌唱合成用プログラム |
US7842874B2 (en) * | 2006-06-15 | 2010-11-30 | Massachusetts Institute Of Technology | Creating music by concatenative synthesis |
US7511216B2 (en) * | 2007-07-27 | 2009-03-31 | Manfred Clynes | Shaping amplitude contours of musical notes |
US7977562B2 (en) * | 2008-06-20 | 2011-07-12 | Microsoft Corporation | Synthesized singing voice waveform generator |
US8352270B2 (en) * | 2009-06-09 | 2013-01-08 | Microsoft Corporation | Interactive TTS optimization tool |
JP5293460B2 (ja) | 2009-07-02 | 2013-09-18 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
-
2009
- 2009-07-02 JP JP2009157527A patent/JP5293460B2/ja not_active Expired - Fee Related
-
2010
- 2010-06-29 EP EP10167617A patent/EP2276019B1/en not_active Not-in-force
- 2010-07-01 US US12/828,375 patent/US8115089B2/en active Active
-
2012
- 2012-01-10 US US13/347,573 patent/US8338687B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8115089B2 (en) | 2012-02-14 |
US20120103167A1 (en) | 2012-05-03 |
EP2276019A1 (en) | 2011-01-19 |
US8338687B2 (en) | 2012-12-25 |
JP2011013454A (ja) | 2011-01-20 |
US20110000360A1 (en) | 2011-01-06 |
EP2276019B1 (en) | 2013-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
US9818396B2 (en) | Method and device for editing singing voice synthesis data, and method for analyzing singing | |
CN101308652B (zh) | 一种个性化歌唱语音的合成方法 | |
US20110231193A1 (en) | Synthesized singing voice waveform generator | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP5949607B2 (ja) | 音声合成装置 | |
JP2006084715A (ja) | 素片セット作成方法および装置 | |
JP6784022B2 (ja) | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム | |
JP2011048335A (ja) | 歌声合成システム、歌声合成方法及び歌声合成装置 | |
CN112331222A (zh) | 一种转换歌曲音色的方法、系统、设备及存储介质 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP2003345400A (ja) | ピッチ変換装置、ピッチ変換方法及びプログラム | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP6314828B2 (ja) | 韻律モデル学習装置、韻律モデル学習方法、音声合成システム、および韻律モデル学習プログラム | |
JP5699496B2 (ja) | 音合成用確率モデル生成装置、特徴量軌跡生成装置およびプログラム | |
JP2022065566A (ja) | 音声合成方法およびプログラム | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2022065554A (ja) | 音声合成方法およびプログラム | |
JPH06318094A (ja) | 音声規則合成装置 | |
JP2016151709A (ja) | 音声合成装置及び音声合成プログラム | |
CN116013246A (zh) | 说唱音乐自动生成方法及系统 | |
JP4603290B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2019168620A (ja) | 合成音生成装置、方法、及びプログラム | |
JP2015068863A (ja) | 音声合成装置、音声合成方法及び音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5293460 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |