JP6299141B2 - 楽音情報生成装置および楽音情報生成方法 - Google Patents
楽音情報生成装置および楽音情報生成方法 Download PDFInfo
- Publication number
- JP6299141B2 JP6299141B2 JP2013216251A JP2013216251A JP6299141B2 JP 6299141 B2 JP6299141 B2 JP 6299141B2 JP 2013216251 A JP2013216251 A JP 2013216251A JP 2013216251 A JP2013216251 A JP 2013216251A JP 6299141 B2 JP6299141 B2 JP 6299141B2
- Authority
- JP
- Japan
- Prior art keywords
- musical tone
- information
- musical
- sound
- tone information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title description 15
- 238000012937 correction Methods 0.000 claims description 22
- 230000014509 gene expression Effects 0.000 claims description 9
- 239000011295 pitch Substances 0.000 description 80
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241001414851 Susana Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 230000001846 repelling effect Effects 0.000 description 1
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
本発明は、歌詞に応じて生成される楽音情報に自由度を持たせることを目的とする。
好ましい態様において、前記楽音情報には、各形態素について、前記音高に加え、音の長さ、音の強弱、音高の時間変化および音の強弱の時間変化のうち少なくともいずれか一つが含まれる。
好ましい態様において、前記第1の楽音情報は音楽的な表現を代表し、前記第2の楽音情報は非音楽的な表現を代表する。
好ましい態様において、前記指定部は、前記パラメータの値と当該値が適用される期間とを指定する。
本発明は、他の観点において、互いに異なる抑揚表現に対応する第1の楽音情報と第2の楽音情報とを記憶するステップと、歌詞を入力するステップと、楽音情報の歌らしさまたは話し言葉らしさを表す指標であるパラメータを指定するステップと、該入力された歌詞を構成する複数の形態素に各々に対し、少なくとも音高を含む楽音情報を生成するステップと、該指定されたパラメータに基づいて、前記歌詞に対応して生成された複数の楽音情報を一括して補正するステップとを有し、前記補正するステップにおいて、その補正量を、前記第1の楽音情報と前記第2の楽音情報と前記パラメータとを用いて決定することを特徴とする楽音情報生成方法を提供する。
なお、歌らしさが「100%」、「0%」という概念は、抑揚の程度の表現の仕方の一例にすぎない。例えば、2つの楽音情報は、それぞれ音楽的(または歌唱的)な表現を代表するものと、非音楽的(または非歌唱的)な表現を代表するもの把握することも可能である。要するに、2つの楽音情報は互いに異なる抑揚表現に対応する。
例えば、日本語の場合、五十音の清音とこれに濁音、半濁音、長音、促音、撥音、拗音を組み合わせてえられる音、およびこれらの音を複数組み合わせたものを形態素と定義することができる。このように形態素の定義は任意であり、言語によって適切な適宜は異なり得るが、本発明はすべての言語に適用することが可能である。
以下では、入力される言語は日本語であり、形態素として五十音およびこれらの濁音、半濁音、長音、促音、撥音、拗音の組み合わせ(五十音等という)を採用する。すなわち、入力された歌詞は五十音等に分解され、分解された各音に対して楽音情報の付与が行われる例を示す。
決定部16は、入力部12にて入力された歌詞を構成する複数の形態素に各々に対し、少なくとも音高を含む楽音情報を生成する。具体的には、決定部16は、既存の形態素解析アルゴリズムを用いて、歌詞から単語や文章から形態素を抽出する。続いて、決定部16は、データベース15を参照し、各形態素に対し楽音情報を生成する。一の形態素についての楽音情報には、当該形態素を発音する際の音高が少なくとも含まれ、好ましくは、これに加えて音長の情報が含まれる。好ましい態様において、楽音情報は、音程や音長の情報に加えて、強弱(音量)についての情報を含んでいてもよい。この実施例では、音高および音長のみを含む楽音情報が生成される例を説明する。
例えば、第1の楽音情報については、歌詞の時間軸方向のタイミングを保つ(すなわち各形態素の発音タイミング間の間隔を一定にする)ように、既存の音声合成技術を用いて作成される。この際、例えば形態素または形態素の一定のまとまりに対応付けられた楽音情報(音程や音程の時間変化に関する情報)をデータベース15からから読み出して使用して参照してもよい。あるいは、既存の音声合成技術を用いてピッチカーブ情報を生成し、このピッチカーブ情報に基づいて第1のメロディを生成してもよい。なお、生成された第1のメロディや第2のメロディは、入力部12を用いてユーザが修正できるようにしてもよい。換言すると、入力された歌詞に対応する第1のメロディおよび第2のメロディは、自動的または半自動的に決定される。なお、第2の楽音情報は、全ての音高および音量が一定であるという情報(換言すると、実質的な楽音情報が存在しない状態)であってもよい。
生成された第1のメロディおよび第2のメロディは、補正部17における補正処理の基準として用いられる。
この画面は、大きく、エリアR1とエリアR2とボタンB1とボタンB2によって構成される。
エリアR1は、歌詞すなわちテキスト情報を入力するフィールドである。エリアR2には、パラメータを指定するためのオブジェクトとしてスライダD1および入力フィールドF1が配置される。ユーザはスライダD1を動かすもしくは入力フィールドF1内に数値を入力することにより、入力された歌詞が放音部にて発音されたときに歌らしく聞こえるのか話し言葉らしく聞こえるのかを規定するパラメータの値(0%〜100%)を指定する。ここでは、歌らしさ100%は話し言葉らしさ0%と同義であり、歌らしさ0%は話し言葉らしさ100%と同義であると定義している。ユーザは所望の歌詞を入力し、所望のパラメータを指定し、ボタンB1を押すと、その内容が制御部11に供給される。同図は、歌詞として「おなかすいたな」が入力され、パラメータ(歌らしさ60%)が指定された例を表す。
決定部16は、入力された歌詞「おなかすいたな」を構成する形態素として「お」、「な」、「か」、「す」、「い」、「た」、「な」を抽出する。決定部16は、データベース15の抑揚情報を参照し、歌らしさ100%の場合と、歌らしさ0%の場合とのそれぞれについて、各形態素ついて、発音タイミング(発音開始時点および発音終了時点)音高(の変化)を決定する。この結果、100%の場合について図4に示すピッチカーブが、0%の場合について図5に示すピッチカーブが、それぞれ一例として得られる。
話し言葉に対応するピッチカーブの決定においては、話し言葉らしく聞こえるようにするため、歌詞を構成する文や単語が持つ抑揚感を逸脱しない範囲で、(ア)各形態素の発音の音程の幅(最高音と最低音の差)が比較的小さく(換言すると、抑揚に乏しい)、(イ)連続的な音程値をとる(換言すると、発音中にピッチが連続的に時間変化する)、(ウ)発音持続時間が短め(典型的には、1つの形態素の発音が十六分音符に相当長さ)となるように設定するのが好ましい。
補正後の各形態素に対応するピッチカーブPfinal(t)は、
Pfinal(t;α*tA(i)*(1-α)*tB(i)<t<α*tA(j)*(1-α)tB(j))=
α*PA(t;tA(i)≦(1-α)tA<(j))+(1-α)*PB(t;tB(i)≦t<tB(j))・・・(1)
と表すことができる。
これは、各形態素の発音開始時刻、終了時刻、発音持続時間、当該形態素の部分に対応する2つのピッチカーブを係数αで重み付けして重ね合わせることに相当する。
なお、補間の方法としては、線形補完に替えて、非線形補間や、その他の既存演算アルゴリズムを用いることができる。
なお、一の形態素が子音と母音とで構成される場合は、発音の音程や音長さを決定するのは実質的に母音だといえるので、形態素を子音と母音とに分解し、子音と母音とのそれぞれについての楽音情報に対して処理をしてもよい。例えば、楽音情報(音高や発音持続時間)を母音のみに付与する。こうすることで、音程や音長が変化しても、発音が不自然に聞こえることを防ぐことができる。
仮に、手作業で形態素ごとにピッチ等を調整する場合、全体のバランスをとるのが大変な場合であるが、この実施例によれば、予め用意されたモデルに基づいて基準ピッチカーブを計算し、これに基づいて全体を一括して補正することによって最終的なメロディが決定されるため、得られたメロディ全体の整合性が崩れる虞は小さい。
上記実施例に対して種々の変形を行うことが可能である。以下、変形を行う際の観点について例示する。
図7は、歌詞を入力する画面の他の例を表す図である。エリアR2において、スライダD1および入力フィールドF1に加え、スライダD2と入力フィールドF2が設けられる。スライダD1、入力フィールドF1は、音程について、歌らしさ(話し言葉らしさ)の度合いを指定するためのものであり、スライダD2,入力フィールドF2は、速度(発音時間=音の長さ)について、歌らしさ(話し言葉らしさ)の度合いを指定するためのものである。すなわち、この入力画面では、音程と速度のそれぞれについて、独立に、歌らしさ(話し言葉らしさ)を指定することができる。換言すると、歌らしさ(話し言葉らしさ)を規定するパラメータが2つ用意されている。
あるいは、これらの要素を個別に指定するか、一つのパラメータで指定するか(一括指定)を、ユーザに選択させてもよい。一括指定するためのパラメータは、所定の規則によって個別パラメータの組み合わせに対応づけられている。よって、一括指定した場合は、その一のパラメータ(例えば「60%」)に対して、個別のパラメータ(例えば、「音程」については基準音程の60%、速度については基準速度の70%、アクセントについては基準アクセントの65%、強弱については基準値の55%という値、ビブラートについては基準値の50%)が決定される。なお、音程、速度、アクセント、強弱、ブブラートの振幅や周期等に対する基準値の設定方法は任意である。例えば、ビブラートについては、歌らしさ100%においては所定の振幅および周期が設定され、歌らしさが0%(話し言葉らしさ100%)に近づくに従って少なくとも振幅が減少するように設定される。
具体的には、図10に示すように、歌詞を入力する際に、歌詞とパラメータを適用させたい部分とその内容とを、スクリプト言語によって記述する。同図の第1文の例では、「おなか」という歌詞部分の前後にタグを付加することで、「おなか」という歌詞部分がパラメータの適用対象であることを表し、パラメータの種類が"Rate song“という再生音の速度を表すものであって、その値が−20%であることを記述している。同図の第2文の例では、「すいたな」の歌詞部分に対し、基準よりも70%増しの速度で発音することを記述している。この入力内容に基づいて制御部11にて生成されるメロディは、「おなか」という歌詞部分が基準よりも−20%の速度(つまり2割遅い速度)で発音され、「すいたな」の歌詞部分は基準よりも70%増しの速度で発音される。
ここで、発音速度(音長)の基準は、例えば、歌らしさ100%における発音速度(音長)であってもよいし、別途、入力画面においてユーザ指定した値(0%〜100%)に対応する発音速度(音長)であってもよい。
この例によれば、全体として、歌らしさを指定しつつ、特定の歌詞部分についてのみ有効な速度パラメータを指定することができるので、細かいニュアンスを表現することが可能となる。
11:制御部
12:入力部
13:記憶部
14:表示部
15:データベース
16:決定部
17:補正部
18:放音部
Claims (5)
- 互いに異なる抑揚表現に対応する第1の楽音情報と第2の楽音情報とを記憶する記憶部と、
歌詞を入力する入力部と、
楽音情報の歌らしさまたは話し言葉らしさを表す指標であるパラメータを指定する指定部と、
前記入力部にて入力された歌詞を構成する複数の形態素に各々に対し、少なくとも音高を含む楽音情報を生成する生成部と、
前記指定部により指定されたパラメータに基づいて、前記歌詞に対応して生成された複数の楽音情報を一括して補正する補正部であって、その補正量を前記第1の楽音情報と前記第2の楽音情報と前記パラメータとを用いて決定する前記補正部と
を有する楽音情報生成装置。 - 前記楽音情報には、各形態素について、前記音高に加え、音の長さ、音の強弱、音高の時間変化および音の強弱の時間変化のうち少なくともいずれか一つが含まれる
ことを特徴とする請求項1に記載の楽音情報生成装置。 - 前記第1の楽音情報は音楽的な表現を代表し、前記第2の楽音情報は非音楽的な表現を代表する
ことを特徴とする請求項1または2に記載の楽音情報生成装置。 - 前記指定部は、前記パラメータの値と当該値が適用される期間とを指定する
ことを特徴とする請求項1ないし3のいずれか一つの記載の楽音情報生成装置。 - 互いに異なる抑揚表現に対応する第1の楽音情報と第2の楽音情報とを記憶するステップと、
歌詞を入力するステップと、
楽音情報の歌らしさまたは話し言葉らしさを表す指標であるパラメータを指定するステップと、
該入力された歌詞を構成する複数の形態素に各々に対し、少なくとも音高を含む楽音情報を生成するステップと、
該指定されたパラメータに基づいて、前記歌詞に対応して生成された複数の楽音情報を一括して補正するステップと
を有し、
前記補正するステップにおいて、その補正量を、前記第1の楽音情報と前記第2の楽音情報と前記パラメータとを用いて決定することを特徴とする楽音情報生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216251A JP6299141B2 (ja) | 2013-10-17 | 2013-10-17 | 楽音情報生成装置および楽音情報生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216251A JP6299141B2 (ja) | 2013-10-17 | 2013-10-17 | 楽音情報生成装置および楽音情報生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015079130A JP2015079130A (ja) | 2015-04-23 |
JP6299141B2 true JP6299141B2 (ja) | 2018-03-28 |
Family
ID=53010590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013216251A Expired - Fee Related JP6299141B2 (ja) | 2013-10-17 | 2013-10-17 | 楽音情報生成装置および楽音情報生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6299141B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7419768B2 (ja) * | 2019-11-29 | 2024-01-23 | ヤマハ株式会社 | 楽曲生成方法および楽曲生成システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315081A (ja) * | 2000-01-01 | 2000-11-14 | Yamaha Corp | 自動作曲装置及び方法並びに記憶媒体 |
JP4720974B2 (ja) * | 2004-12-21 | 2011-07-13 | 株式会社国際電気通信基礎技術研究所 | 音声発生装置およびそのためのコンピュータプログラム |
JP5625321B2 (ja) * | 2009-10-28 | 2014-11-19 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP2011175006A (ja) * | 2010-02-23 | 2011-09-08 | Sony Corp | 情報処理装置、自動作曲方法、学習装置、学習方法、及びプログラム |
KR102038171B1 (ko) * | 2012-03-29 | 2019-10-29 | 스뮬, 인코포레이티드 | 타겟 운율 또는 리듬이 있는 노래, 랩 또는 다른 가청 표현으로의 스피치 자동 변환 |
-
2013
- 2013-10-17 JP JP2013216251A patent/JP6299141B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015079130A (ja) | 2015-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
KR101274961B1 (ko) | 클라이언트단말기를 이용한 음악 컨텐츠 제작시스템 | |
US9355634B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon | |
CN108053814B (zh) | 一种模拟用户歌声的语音合成系统及方法 | |
US20220076651A1 (en) | Electronic musical instrument, method, and storage medium | |
CN105957515A (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
CN111418006A (zh) | 声音合成方法、声音合成装置及程序 | |
JP2017040867A (ja) | 情報処理装置 | |
JP2011028130A (ja) | 音声合成装置 | |
US20210005176A1 (en) | Sound processing method, sound processing apparatus, and recording medium | |
JP4277697B2 (ja) | 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP3513071B2 (ja) | 音声合成方法及び音声合成装置 | |
JP6299141B2 (ja) | 楽音情報生成装置および楽音情報生成方法 | |
JP2007271910A (ja) | 合成音声生成装置 | |
US11437016B2 (en) | Information processing method, information processing device, and program | |
JP6809608B2 (ja) | 歌唱音生成装置及び方法、プログラム | |
JP2002041074A (ja) | ボーカルデータ生成装置および歌唱装置 | |
JP2006349787A (ja) | 音声合成方法および装置 | |
JP7186476B1 (ja) | 音声合成装置 | |
CN113255313B (zh) | 音乐生成方法、装置、电子设备和存储介质 | |
JP6191094B2 (ja) | 音声素片切出装置 | |
JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180212 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6299141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |