JP6083764B2 - 歌声合成システム及び歌声合成方法 - Google Patents
歌声合成システム及び歌声合成方法 Download PDFInfo
- Publication number
- JP6083764B2 JP6083764B2 JP2014551125A JP2014551125A JP6083764B2 JP 6083764 B2 JP6083764 B2 JP 6083764B2 JP 2014551125 A JP2014551125 A JP 2014551125A JP 2014551125 A JP2014551125 A JP 2014551125A JP 6083764 B2 JP6083764 B2 JP 6083764B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- singing voice
- singing
- pitch
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 37
- 238000003786 synthesis reaction Methods 0.000 title claims description 36
- 238000001308 synthesis method Methods 0.000 title claims description 5
- 238000004458 analytical method Methods 0.000 claims description 92
- 238000013500 data storage Methods 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 33
- 238000012937 correction Methods 0.000 claims description 32
- 230000005236 sound signal Effects 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 19
- 230000002194 synthesizing effect Effects 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 239000011295 pitch Substances 0.000 description 100
- 230000006870 function Effects 0.000 description 12
- 230000010354 integration Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 230000010365 information processing Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 230000008602 contraction Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
- G10H1/0041—Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
- G10H1/0058—Transmission between separate instruments or between individual components of a musical system
- G10H1/0066—Transmission between separate instruments or between individual components of a musical system using a MIDI interface
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/091—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith
- G10H2220/101—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters
- G10H2220/106—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters using icons, e.g. selecting, moving or linking icons, on-screen symbols, screen regions or segments representing musical elements or parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/455—Gensound singing voices, i.e. generation of human voices for musical applications, vocal singing sounds or intelligible words at a desired pitch or with desired vocal effects, e.g. by phoneme synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
- Signal Processing (AREA)
Description
データ保存部3は、音楽音響信号及び該音楽音響信号と時間的に対応付けられた歌詞を含む歌詞データ(時刻情報付きの歌詞)を保存する。音楽音響信号は、伴奏音(背景音)を含む音楽音響信号、ガイド歌声と伴奏音を含む音楽音響信号、またはガイドメロディと伴奏音を含む音楽音響信号のいずれでもよい。なお伴奏音、ガイド歌声及びガイドメロディは、MIDIファイル等に基づいて作成された合成音であってもよい。なお歌詞データは、読み仮名のデータとして入力されている。漢字仮名交じりの歌詞のテキストファイルに対し、その読み仮名と時刻情報を付与しておく必要がある。この時刻情報の付与は、手作業も可能だが、正確さと手軽さを考慮して、事前に歌詞のテキストと仮歌を用意し、VocaListener(商標)[中野倫靖,後藤真孝 VocaListener:ユーザ歌唱の音高および音量を真似る歌声合成システム 情報処理学会論文誌,52(12):3853-3867, 2011.]を用いて、形態素解析と信号処理による歌詞のアラインメントを行うことにより、時刻情報の付与を行ってもよい。なお仮歌は、音素の発音時刻さえ正しければ良く、録音の品質が多少低くても、無伴奏歌唱であれば推定結果に影響は少ない。ここで、形態素解析の結果や、歌詞アラインメントに誤りがあった場合には、VocaListenerのGUIによって正しく訂正することができる。
3 データ保存部
5 表示部
6 表示画面
7 音楽音響信号再生部
8 ヘッドフォン
9 文字選択部
11 録音部
13 推定分析データ保存部
15 推定分析結果表示部
17 データ選択部
18 データ訂正部
19 データ編集部
21 統合歌唱データ作成部
23 歌声再生部
Claims (19)
- 音楽音響信号及び前記音楽音響信号と時間的に対応付けられた歌詞を含む歌詞データが保存されたデータ保存部と、
前記歌詞データに基づいて歌詞の少なくとも一部を表示する表示画面を備えた表示部と、
前記表示画面に表示された前記歌詞中の文字を選択する選択操作が行われると、選択された前記歌詞の文字に対応する前記音楽音響信号の信号部分またはその直前の信号部分から前記音楽音響信号を再生する音楽音響信号再生部と、
前記音楽音響信号再生部が前記音楽音響信号の再生を複数回行っている間、再生された音楽を聴きながら歌い手が歌唱する歌声を複数歌唱回分録音する録音部と、
前記録音部で録音した複数歌唱回分の前記歌声ごとに前記歌声から音素単位で複数の音素の時間的区間を推定し、推定した前記複数の音素の時間的区間と一緒に、前記歌声の音高、音量及び音色を分析することにより得た音高データ、音量データ及び音色データを保存する推定分析データ保存部と、
前記推定分析データ保存部に保存された前記複数の音素の時間的区間と一緒に推定分析結果を反映した音高反映データ、音量反映データ及び音色反映データを前記表示画面に表示する推定分析結果表示部と、
前記表示画面に表示された前記複数歌唱回分の歌声ごとの推定分析結果の中から、前記音素の時間的区間ごとに前記音高データ、前記音量データ及び前記音色データをユーザが選択することを可能にするデータ選択部と、
前記データ選択部を利用して選択された前記音高データ、前記音量データ及び前記音色データを前記音素の時間的区間ごとに統合して統合歌声データを作成する統合歌唱データ作成部と、
前記統合歌声データを再生する歌声再生部とからなる歌声合成システム。 - 前記音楽音響信号は伴奏音を含む音楽音響信号、ガイド歌声と伴奏音を含む音楽音響信号、またはガイドメロディと伴奏音を含む音楽音響信号である請求項1に記載の歌声合成システム。
- 前記伴奏音、前記ガイド歌声及び前記ガイドメロディが、MIDIファイルに基づいて作成された合成音である請求項2に記載の歌声合成システム。
- 前記データ選択部で選択した前記音高データ、前記音量データ及び前記音色データの少なくともひとつを前記音素の時間的区間に対応づけて変更するデータ編集部を更に備え、
前記データ編集部によるデータの変更が実施されると、前記推定分析データ保存部はその結果を再保存する請求項1に記載の歌声合成システム。 - 前記データ選択部は、前記音素の時間的区間ごとに最後に歌われた歌声の前記音高データ、前記音量データ及び前記音色データを自動的に選択する自動選択機能を有している請求項1に記載の歌声合成システム。
- 前記推定分析データ保存部で推定する前記音素の時間的区間は、前記音素単位の開始時刻から終了時刻までの時間であり、
前記データ編集部は、前記音素の時間的区間の前記開始時刻及び終了時刻を変更すると、前記音素の時間的区間の変更に対応づけて前記音高データ、前記音量データ及び前記音色データの時間的区間を変更することを特徴とする請求項4に記載の歌声合成システム。 - 前記データ選択部で選択した前記音高及び前記音素の時間的区間に推定の誤りがあった場合に、誤りを訂正するデータ訂正部を更に備え、
前記データ訂正部によるデータの訂正が実施されると、前記推定分析データ保存部は再度推定を行って、その結果を再保存する請求項1または4に記載の歌声合成システム。 - 前記推定分析結果表示部は、前記複数歌唱回分の歌声ごとの前記推定分析結果を歌唱の順番が判るように前記表示画面に表示する機能を有している請求項1に記載の歌声合成システム。
- 同じ歌の一部または全部を同じ歌い手が、複数回歌唱したときの歌声を録音する録音部と、
前記録音部で録音した複数歌唱回分の前記歌声ごとに前記歌声から音素単位で複数の音素の時間的区間を推定し、推定した前記複数の音素の時間的区間と一緒に、前記歌声の音高、音量及び音色を分析することにより得た音高データ、音量データ及び音色データを保存する推定分析データ保存部と、
前記推定分析データ保存部に保存された前記複数の音素の時間的区間と一緒に推定分析結果を反映した音高反映データ、音量反映データ及び音色反映データを表示画面に表示する推定分析結果表示部と、
前記表示画面に表示された前記複数歌唱回分の歌声ごとの推定分析結果の中から、前記音素の時間的区間ごとに前記音高データ、前記音量データ及び前記音色データをユーザが選択することを可能にするデータ選択部と、
前記データ選択部を利用して選択された前記音高データ、前記音量データ及び前記音色データを前記音素の時間的区間ごとに統合して統合歌声データを作成する統合歌唱データ作成部と、
前記統合歌声データを再生する歌声再生部とからなる歌声合成システム。 - 音楽音響信号及び前記音楽音響信号と時間的に対応付けられた歌詞を含む歌詞データをデータ保存部に保存するデータ保存ステップと、
前記歌詞データに基づいて前記歌詞の少なくとも一部を表示部の表示画面に表示する表示ステップと、
前記表示画面に表示された前記歌詞中の文字を選択する選択操作が行われると、選択された前記歌詞の文字に対応する前記音楽音響信号の信号部分またはその直前の信号部分から前記音楽音響信号を音楽音響信号再生部で再生する再生ステップと、
前記音楽音響信号再生部が前記音楽音響信号の再生を複数回行っている間、再生された音楽を聴きながら歌い手が歌唱する歌声を複数歌唱回分録音部で録音する録音ステップと、
前記録音部で録音した複数歌唱回分の前記歌声ごとに前記歌声から音素単位で複数の音素の時間的区間を推定し、推定した前記複数の音素の時間的区間と一緒に、前記歌声の音高、音量及び音色を分析することにより得た音高データ、音量データ及び音色データを推定分析データ保存部に保存する推定分析保存ステップと、
前記推定分析データ保存部に保存された前記複数の音素の時間的区間と一緒に推定分析結果を反映した音高反映データ、音量反映データ及び音色反映データを前記表示画面に表示する推定分析結果表示ステップと、
前記表示画面に表示された前記複数歌唱回分の歌声ごとの推定分析結果の中から、前記音素の時間的区間ごとに前記音高データ、前記音量データ及び前記音色データをデータ選択部を用いてユーザが選択するデータ選択ステップと、
前記データ選択部を利用して選択された前記音高データ、前記音量データ及び前記音色データを前記音素の時間的区間ごとに統合して統合歌声データを作成する統合歌唱データ作成ステップと、
前記統合歌声データを再生する歌声再生ステップとからなる歌声合成方法。 - 前記音楽音響信号は伴奏音を含む音楽音響信号、ガイド歌声と伴奏音を含む音楽音響信号、またはガイドメロディと伴奏音を含む音楽音響信号である請求項10に記載の歌声合成方法。
- 前記伴奏音、前記ガイド歌声及び前記ガイドメロディが、MIDIファイルに基づいて作成された合成音である請求項11に記載の歌声合成方法。
- 前記データ選択ステップで選択した前記音高データ、前記音量データ及び前記音色データの少なくともひとつを前記音素の時間的区間に対応づけて変更するデータ編集ステップを更に備えている請求項10に記載の歌声合成方法。
- 前記データ選択ステップでは、前記音素の時間的区間ごとに最後に歌われた歌声の前記音高データ、前記音量データ及び前記音色データを自動的に選択する自動選択ステップを有している請求項12に記載の歌声合成方法。
- 前記推定分析保存ステップで推定する前記音素の時間的区間は、前記音素単位の開始時刻から終了時刻までの時間であり、
前記データ編集ステップでは、前記音素の時間的区間の前記開始時刻及び終了時刻を変更すると、前記音素の時間的区間の変更に対応づけて前記音高データ、前記音量データ及び前記音色データの時間的区間を変更することを特徴とする請求項13に記載の歌声合成方法。 - 前記データ選択ステップで選択した前記音高及び前記音素の時間的区間の推定に誤りがあったときにその誤りを訂正するデータ訂正ステップを更に備え、
前記データ訂正ステップでデータの訂正が実施されると、前記推定分析保存ステップで再度推定を行って、その結果を前記推定分析データ保存部に再保存する請求項10または13に記載の歌声合成方法。 - 前記推定分析結果表示ステップでは、前記複数歌唱回分の歌声ごとの前記推定分析結果を歌唱の順番が判るように前記表示画面に表示する請求項10に記載の歌声合成方法。
- 前記請求項10乃至17のいずれか1項に記載のステップをコンピュータで実現するためのコンピュータ読み取り可能なコンピュータプログラムを記憶した非一時的な記憶媒体。
- 同じ歌の一部または全部を同じ歌い手が、複数回歌唱したときの歌声を録音するステップと、
前記録音ステップで録音した複数歌唱回分の前記歌声ごとに前記歌声から音素単位で複数の音素の時間的区間を推定し、推定した前記複数の音素の時間的区間と一緒に、前記歌声の音高、音量及び音色を分析することにより得た音高データ、音量データ及び音色データを推定分析データ保存部に保存する推定分析保存ステップと、
前記推定分析データ保存部に保存された前記複数の音素の時間的区間と一緒に推定分析結果を反映した音高反映データ、音量反映データ及び音色反映データを表示画面に表示する推定分析結果表示ステップと、
前記表示画面に表示された前記複数歌唱回分の歌声ごとの推定分析結果の中から、前記音素の時間的区間ごとに前記音高データ、前記音量データ及び前記音色データをデータ選択部によりユーザが選択することを可能にするデータ選択ステップと、
前記データ選択ステップで選択された前記音高データ、前記音量データ及び前記音色データを前記音素の時間的区間ごとに統合して統合歌声データを作成する統合歌唱データ作成ステップと、
前記統合歌声データを再生する歌声再生ステップとからなる歌声合成方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012265817 | 2012-12-04 | ||
JP2012265817 | 2012-12-04 | ||
PCT/JP2013/082604 WO2014088036A1 (ja) | 2012-12-04 | 2013-12-04 | 歌声合成システム及び歌声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014088036A1 JPWO2014088036A1 (ja) | 2017-01-05 |
JP6083764B2 true JP6083764B2 (ja) | 2017-02-22 |
Family
ID=50883453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014551125A Expired - Fee Related JP6083764B2 (ja) | 2012-12-04 | 2013-12-04 | 歌声合成システム及び歌声合成方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9595256B2 (ja) |
EP (1) | EP2930714B1 (ja) |
JP (1) | JP6083764B2 (ja) |
WO (1) | WO2014088036A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101992572B1 (ko) * | 2018-08-30 | 2019-09-30 | 유영재 | 음향 리뷰 기능을 갖는 음향 편집 장치 및 이를 이용한 음향 리뷰 방법 |
KR102035448B1 (ko) * | 2019-02-08 | 2019-11-15 | 세명대학교 산학협력단 | 음성 악기 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2930714B1 (en) * | 2012-12-04 | 2018-09-05 | National Institute of Advanced Industrial Science and Technology | Singing voice synthesizing system and singing voice synthesizing method |
CN106463111B (zh) | 2014-06-17 | 2020-01-21 | 雅马哈株式会社 | 基于字符的话音生成的控制器与系统 |
JP6569246B2 (ja) * | 2015-03-05 | 2019-09-04 | ヤマハ株式会社 | 音声合成用データ編集装置 |
JP6728754B2 (ja) * | 2015-03-20 | 2020-07-22 | ヤマハ株式会社 | 発音装置、発音方法および発音プログラム |
US9595203B2 (en) * | 2015-05-29 | 2017-03-14 | David Michael OSEMLAK | Systems and methods of sound recognition |
US9972300B2 (en) * | 2015-06-11 | 2018-05-15 | Genesys Telecommunications Laboratories, Inc. | System and method for outlier identification to remove poor alignments in speech synthesis |
CN106653037B (zh) * | 2015-11-03 | 2020-02-14 | 广州酷狗计算机科技有限公司 | 音频数据处理方法和装置 |
CN106782627B (zh) * | 2015-11-23 | 2019-08-27 | 广州酷狗计算机科技有限公司 | 音频文件的重录方法及装置 |
CN106898339B (zh) * | 2017-03-29 | 2020-05-26 | 腾讯音乐娱乐(深圳)有限公司 | 一种歌曲的合唱方法及终端 |
CN106898340B (zh) * | 2017-03-30 | 2021-05-28 | 腾讯音乐娱乐(深圳)有限公司 | 一种歌曲的合成方法及终端 |
US20180366097A1 (en) * | 2017-06-14 | 2018-12-20 | Kent E. Lovelace | Method and system for automatically generating lyrics of a song |
JP6569712B2 (ja) * | 2017-09-27 | 2019-09-04 | カシオ計算機株式会社 | 電子楽器、電子楽器の楽音発生方法、及びプログラム |
JP2019066649A (ja) * | 2017-09-29 | 2019-04-25 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
JP6988343B2 (ja) * | 2017-09-29 | 2022-01-05 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
CN108549642B (zh) * | 2018-04-27 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 评价音高信息的标注质量的方法、装置及存储介质 |
CN108922537B (zh) * | 2018-05-28 | 2021-05-18 | Oppo广东移动通信有限公司 | 音频识别方法、装置、终端、耳机及可读存储介质 |
JP6610714B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610715B1 (ja) | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
CN110189741B (zh) * | 2018-07-05 | 2024-09-06 | 腾讯数码(天津)有限公司 | 音频合成方法、装置、存储介质和计算机设备 |
CN111627417B (zh) * | 2019-02-26 | 2023-08-08 | 北京地平线机器人技术研发有限公司 | 播放语音的方法、装置及电子设备 |
JP7059972B2 (ja) | 2019-03-14 | 2022-04-26 | カシオ計算機株式会社 | 電子楽器、鍵盤楽器、方法、プログラム |
CN110033791B (zh) * | 2019-03-26 | 2021-04-09 | 北京雷石天地电子技术有限公司 | 一种歌曲基频提取方法及装置 |
CN112489608B (zh) * | 2019-08-22 | 2024-07-16 | 北京峰趣互联网信息服务有限公司 | 生成歌曲的方法、装置、电子设备及存储介质 |
US11430431B2 (en) * | 2020-02-06 | 2022-08-30 | Tencent America LLC | Learning singing from speech |
CN111402858B (zh) * | 2020-02-27 | 2024-05-03 | 平安科技(深圳)有限公司 | 一种歌声合成方法、装置、计算机设备及存储介质 |
CN111798821B (zh) * | 2020-06-29 | 2022-06-14 | 北京字节跳动网络技术有限公司 | 声音转换方法、装置、可读存储介质及电子设备 |
US11495200B2 (en) * | 2021-01-14 | 2022-11-08 | Agora Lab, Inc. | Real-time speech to singing conversion |
CN113781988A (zh) * | 2021-07-30 | 2021-12-10 | 北京达佳互联信息技术有限公司 | 字幕显示方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3662969B2 (ja) * | 1995-03-06 | 2005-06-22 | 富士通株式会社 | カラオケシステム |
JPH09101784A (ja) * | 1995-10-03 | 1997-04-15 | Roland Corp | 自動演奏装置のカウントイン制御装置 |
JP3379414B2 (ja) * | 1997-01-09 | 2003-02-24 | ヤマハ株式会社 | パンチイン装置、パンチイン方法及びプログラムを記録した媒体 |
US6304846B1 (en) * | 1997-10-22 | 2001-10-16 | Texas Instruments Incorporated | Singing voice synthesis |
JPH11352981A (ja) | 1998-06-05 | 1999-12-24 | Nippon Dorekkusuhiru Technology Kk | 音響装置およびそれを内蔵する玩具 |
US6683241B2 (en) * | 2001-11-06 | 2004-01-27 | James W. Wieder | Pseudo-live music audio and sound |
JP2004117817A (ja) * | 2002-09-26 | 2004-04-15 | Roland Corp | 自動演奏プログラム |
JP3864918B2 (ja) * | 2003-03-20 | 2007-01-10 | ソニー株式会社 | 歌声合成方法及び装置 |
JP2005234718A (ja) | 2004-02-17 | 2005-09-02 | Yamaha Corp | 音声素片データの取引方法、音声素片データ提供装置、課金額管理装置、音声素片データ提供プログラム、課金額管理プログラム |
JP2008020798A (ja) * | 2006-07-14 | 2008-01-31 | Yamaha Corp | 歌唱指導装置 |
KR20070099501A (ko) * | 2007-09-18 | 2007-10-09 | 테크온팜 주식회사 | 노래 학습 시스템 및 방법 |
US8244546B2 (en) * | 2008-05-28 | 2012-08-14 | National Institute Of Advanced Industrial Science And Technology | Singing synthesis parameter data estimation system |
JP5331494B2 (ja) | 2009-01-19 | 2013-10-30 | 株式会社タイトー | カラオケサービスシステム、端末装置 |
WO2011002933A2 (en) * | 2009-06-30 | 2011-01-06 | Museami, Inc. | Vocal and instrumental audio effects |
JP5360489B2 (ja) | 2009-10-23 | 2013-12-04 | 大日本印刷株式会社 | 音素符号変換装置および音声合成装置 |
US9147385B2 (en) * | 2009-12-15 | 2015-09-29 | Smule, Inc. | Continuous score-coded pitch correction |
GB2500471B (en) | 2010-07-20 | 2018-06-13 | Aist | System and method for singing synthesis capable of reflecting voice timbre changes |
JP5375868B2 (ja) * | 2011-04-04 | 2013-12-25 | ブラザー工業株式会社 | 再生方法切替装置、再生方法切替方法及びプログラム |
JP5895740B2 (ja) * | 2012-06-27 | 2016-03-30 | ヤマハ株式会社 | 歌唱合成を行うための装置およびプログラム |
JP5958866B2 (ja) * | 2012-08-01 | 2016-08-02 | 国立研究開発法人産業技術総合研究所 | 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム |
JP5821824B2 (ja) * | 2012-11-14 | 2015-11-24 | ヤマハ株式会社 | 音声合成装置 |
EP2930714B1 (en) * | 2012-12-04 | 2018-09-05 | National Institute of Advanced Industrial Science and Technology | Singing voice synthesizing system and singing voice synthesizing method |
JP5817854B2 (ja) * | 2013-02-22 | 2015-11-18 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP5949607B2 (ja) * | 2013-03-15 | 2016-07-13 | ヤマハ株式会社 | 音声合成装置 |
EP2960899A1 (en) * | 2014-06-25 | 2015-12-30 | Thomson Licensing | Method of singing voice separation from an audio mixture and corresponding apparatus |
-
2013
- 2013-12-04 EP EP13861040.7A patent/EP2930714B1/en not_active Not-in-force
- 2013-12-04 US US14/649,630 patent/US9595256B2/en not_active Expired - Fee Related
- 2013-12-04 WO PCT/JP2013/082604 patent/WO2014088036A1/ja active Application Filing
- 2013-12-04 JP JP2014551125A patent/JP6083764B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101992572B1 (ko) * | 2018-08-30 | 2019-09-30 | 유영재 | 음향 리뷰 기능을 갖는 음향 편집 장치 및 이를 이용한 음향 리뷰 방법 |
KR102035448B1 (ko) * | 2019-02-08 | 2019-11-15 | 세명대학교 산학협력단 | 음성 악기 |
Also Published As
Publication number | Publication date |
---|---|
WO2014088036A1 (ja) | 2014-06-12 |
EP2930714A1 (en) | 2015-10-14 |
JPWO2014088036A1 (ja) | 2017-01-05 |
EP2930714A4 (en) | 2016-11-09 |
US20150310850A1 (en) | 2015-10-29 |
EP2930714B1 (en) | 2018-09-05 |
US9595256B2 (en) | 2017-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6083764B2 (ja) | 歌声合成システム及び歌声合成方法 | |
US7825321B2 (en) | Methods and apparatus for use in sound modification comparing time alignment data from sampled audio signals | |
Jin et al. | Voco: Text-based insertion and replacement in audio narration | |
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
EP1849154B1 (en) | Methods and apparatus for use in sound modification | |
US8729374B2 (en) | Method and apparatus for converting a spoken voice to a singing voice sung in the manner of a target singer | |
JP5024711B2 (ja) | 歌声合成パラメータデータ推定システム | |
US7487092B2 (en) | Interactive debugging and tuning method for CTTS voice building | |
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
CN106971703A (zh) | 一种基于hmm的歌曲合成方法及装置 | |
Umbert et al. | Expression control in singing voice synthesis: Features, approaches, evaluation, and challenges | |
CN101111884B (zh) | 用于声学特征的同步修改的方法和装置 | |
JP2004264676A (ja) | 歌唱合成装置、歌唱合成プログラム | |
JP2011028230A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
Gupta et al. | Deep learning approaches in topics of singing information processing | |
JP6756151B2 (ja) | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 | |
CN108922505A (zh) | 信息处理方法及装置 | |
JP2009217141A (ja) | 音声合成装置 | |
TWI377558B (en) | Singing synthesis systems and related synthesis methods | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP5953743B2 (ja) | 音声合成装置及びプログラム | |
Rosenzweig | Interactive Signal Processing Tools for Analyzing Multitrack Singing Voice Recordings | |
CN114550690A (zh) | 歌曲合成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6083764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |