JP5943618B2 - 音符列設定装置および音符列設定方法 - Google Patents
音符列設定装置および音符列設定方法 Download PDFInfo
- Publication number
- JP5943618B2 JP5943618B2 JP2012012888A JP2012012888A JP5943618B2 JP 5943618 B2 JP5943618 B2 JP 5943618B2 JP 2012012888 A JP2012012888 A JP 2012012888A JP 2012012888 A JP2012012888 A JP 2012012888A JP 5943618 B2 JP5943618 B2 JP 5943618B2
- Authority
- JP
- Japan
- Prior art keywords
- note
- string
- sound
- unit
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000012545 processing Methods 0.000 claims description 36
- 230000002940 repellent Effects 0.000 claims description 4
- 239000005871 repellent Substances 0.000 claims description 4
- 239000011295 pitch Substances 0.000 description 21
- 230000006870 function Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000010304 firing Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001846 repelling effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。音声合成装置100は、利用者が指定した歌詞の文字列X0の歌唱旋律として好適な音符列を設定してその音符列の歌唱音の音声信号Vを生成する信号処理装置であり、演算処理装置12と記憶装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。なお、以下の説明では、ラップ音楽の歌唱音を合成する場合を想定する。
解析処理部30は、指定文字列X内の各音単位x[n]と各音符との対応(譜割)を指定する連結情報列Yを生成する。図4には、図2の部分(A)の指定文字列Xの譜割が例示されている。図4に示すように、特定音符列Mの各音符には単数または複数の音単位x[n]が割当てられる。解析処理部30が生成する連結情報列Yは、指定文字列X内で特定音符列M内の1個の音符に割当てられる1個以上の音単位x[n]の範囲を指定する情報である。なお、図4に示すように、音符列M[k]にてタイで連結された複数の音符は1個の音符として取扱う。
図4に示すように、指定文字列Xのうち連結情報y[2]に対応する音単位x[2]「ー」と直
前の音単位x[1]「キョ」とを連結した文字列「キョー」(すなわち音単位x[n]の2個分
)が特定音符列M内の1個の音符に割当てられる。また、図2の部分(B)の例示では連結
情報y[7]が0であるから、図4に示すように、指定文字列Xのうち連結情報y[7]に対応
する音単位x[7]「ス」と直前の音単位x[6]「デ」とを連結した文字列「デス」が特定音
符列M内の1個の音符に割当てられる。なお、3個以上の音単位x[n]が連結情報y[n]に
応じて連結される場合もある。他方、図2に例示された音単位x[3]〜x[5]の各々は、自
身の連結情報y[n]および直後の連結情報y[n+1]の双方が1であるから、図4に示すよう
に、各音単位x[n]が単独で特定音符列M内の1個の音符に割当てられる。
以上に説明した通り、第1実施形態の解析処理部30は、複数(例えば全通り)の連結情報列Yのうち指定文字列Xに対して条件付確率P(Y|X)が最大となる連結情報列Yを選択する。
素性f1:音単位x[n]が母音であり、連結情報y[n]が0である場合に発火する。
素性f2:音単位x[n]が撥音であり、連結情報y[n]が0である場合に発火する。
素性f3:音単位x[n]が長音であり、連結情報y[n]が0である場合に発火する。
素性f4:音単位x[n]が促音であり、連結情報y[n]が0である場合に発火する。
図3の音符列取得部40は、文字列取得部22が取得した指定文字列Xと解析処理部30が生成した連結情報列Yとに応じた1個の音符列M[k]を記憶装置14内のK個の特定音符列M[1]〜M[K]から特定音符列Mとして選択する。第1実施形態の音符列取得部40は、連結情報列Y内の各連結情報y[n]が指定する連結の有無を指定文字列Xの各音単位x[n]に適用した譜割文字列Z(図2の部分(C))内の譜割単位z[m]の個数に対応する音符数の音符列M[k]を特定音符列Mとして取得する。図6は、第1実施形態の音符列取得部40のブロック図である。図6に示すように、音符列取得部40は、第1選択部41と第2選択部42とを含んで構成される。
E1=|2−1|+|1−1|+|1−1|+|1−1|+|2−1|=2
E2=|2−2|+|1−2|+|1−2|+|1−2|+|2−2|=3
なお、以上の演算では、基準長TZと継続長TMとに共通する所定長T0の表記を省略した。したがって、誤差指標値E1および誤差指標値E2の演算式における数値「2」は16分音符の2個分(8分音符)の時間長2T0を意味し、数値「1」は16分音符の1個分の時間長T0を意味する。以上の例示では誤差指標値E1が誤差指標値E2を下回るから、第2選択部42は、候補音符列MC1を特定音符列Mとして選択する。以上が音符列取得部40の具体的な構成および動作である。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
素性f5:音単位x[n]を含む単語の品詞が名詞であり、連結情報y[n]が0である場合に発火する。
素性f6:音単位x[n]が無声化し、連結情報y[n]が0である場合に発火する。
第3実施形態の音声合成装置100は、第1実施形態と同様にラップ音楽の歌唱音を合成する。図7は、多数のラップ音楽の傾向を加味して決定された以下の条件を基礎とする記譜法で特定のラップ音楽(歌詞「キョーワハレデス」)の歌唱音を表現した譜面である。
条件1:各音符の音価(継続長)の基本単位は16分音符である。ただし、8分音符以上の音価の3連符の各々を音価の基本単位とすることも可能である。
条件2:音符を規定する音階は、所定の根音(基本音高)を中心として上下に2段階の合計5段階の音高で構成される。例えば、図7の例示のように、1半音を単位として根音(root)からの音高差が「−5」,「−2」,「0(根音自身)」,「+3」および「+5」となるマイナーペンタトニックスケールが採用される。
条件3:1個の音符に単数または複数のモーラが内包され得る。
素性f7:直前の音単位x[n-1]にグリッサンドが付与され(より詳細には、直前の音単位x[n-1]が、グリッサンドの付与された音符に割当てられた複数の音単位のなかで先頭の音単位であり)、連結情報y[n]が0である場合に発火する。
素性f8:直前の音単位x[n-1]がアクセントであり、連結情報y[n]が0である場合に発火する。
素性f7a:直前の音単位x[n-1]に上昇方向のグリッサンドが付与され(より詳細には、直前の音単位x[n-1]が、上昇方向のグリッサンドの付与された音符に割当てられた複数の音単位のなかで先頭の音単位であり)、連結情報y[n]が0である場合に発火する。
素性f7b:直前の音単位x[n-1]に下降方向のグリッサンドが付与され(より詳細には、直前の音単位x[n-1]が、下降方向のグリッサンドの付与された音符に割当てられた複数の音単位のなかで先頭の音単位であり)、連結情報y[n]が0である場合に発火する。
第1実施形態では、指定文字列Xから生成された譜割文字列Z内の譜割単位z[m]と同数の音符で構成される音符列M[k]を候補音符列MCとして選択したが、譜割文字列Z内の譜割単位z[m]の個数が音符列M[1]〜M[K]の音符数の最大値を上回るような長い指定文字列Xを利用者が指定する可能性もある。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (6)
- 複数の音単位を時系列に配列した指定文字列に対応する音符列を設定する装置であって、
前記指定文字列内で相前後する各音単位間の連結の有無を音単位毎に指定する連結情報を時系列に配列した連結情報列を、前記指定文字列が観測された条件のもとで連結情報列が生起する条件付確率を最大化する確率モデルにより生成する解析処理手段と、
前記連結情報列が指定する連結の有無を前記指定文字列の各音単位に適用して得られる各譜割単位に対応する複数の音符を時系列に配列した音符列を取得する音符列取得手段と
を具備する音符列設定装置。 - 前記音符列取得手段は、複数の音符を時系列に配列した複数の音符列のうち、前記連結情報列が指定する連結の有無を前記指定文字列の各音単位に適用して得られる譜割単位の個数に対応する音符数の音符列を選択する
請求項1の音符列設定装置。 - 前記音符列取得手段は、
前記譜割単位の個数に対応する音符数の複数の候補音符列を前記複数の音符列から選択する第1選択手段と、
前記各譜割単位を構成する音単位の個数に応じた基準長と、前記候補音符列内で当該譜割単位に対応する音符の継続長との差異に応じた誤差指標値を、前記複数の候補音符列の各々について算定し、前記各候補音符列の誤差指標値に応じて1個の候補音符列を選択する第2選択手段とを含む
請求項2の音符列設定装置。 - 前記確率モデルは、複数の素性で規定される条件付確率場の確率モデルであり、
前記複数の素性は、
音単位が母音であり連結情報が連結を指定する場合に発火する素性と、
音単位が撥音であり連結情報が連結を指定する場合に発火する素性と、
音単位が長音であり連結情報が連結を指定する場合に発火する素性と、
音単位が促音であり連結情報が連結を指定する場合に発火する素性と、
音単位が特定の品詞を構成し、連結情報が連結を指定する場合に発火する素性と、
音単位が無声化音であり連結情報が連結を指定する場合に発火する素性と
のうちの少なくとも1種類の素性を含む
請求項1から請求項3の何れかの音符列設定装置。 - 処理対象の文字列を区分して複数の指定文字列を生成する文字列取得手段を具備し、
前記複数の指定文字列の各々について、前記解析処理手段による連結情報列の生成と、前記音符列取得手段による音符列の取得とが実行される
請求項1から請求項4の何れかの音符列設定装置。 - 複数の音単位を時系列に配列した指定文字列に対応する音符列を設定する方法であって、
コンピュータシステムが、
前記指定文字列内で相前後する各音単位間の連結の有無を音単位毎に指定する連結情報を時系列に配列した連結情報列を、前記指定文字列が観測された条件のもとで連結情報列が生起する条件付確率を最大化する確率モデルにより生成し、
前記連結情報列が指定する連結の有無を前記指定文字列の各音単位に適用して得られる各譜割単位に対応する複数の音符を時系列に配列した音符列を取得する
音符列設定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012888A JP5943618B2 (ja) | 2012-01-25 | 2012-01-25 | 音符列設定装置および音符列設定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012888A JP5943618B2 (ja) | 2012-01-25 | 2012-01-25 | 音符列設定装置および音符列設定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013152337A JP2013152337A (ja) | 2013-08-08 |
JP5943618B2 true JP5943618B2 (ja) | 2016-07-05 |
Family
ID=49048733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012012888A Expired - Fee Related JP5943618B2 (ja) | 2012-01-25 | 2012-01-25 | 音符列設定装置および音符列設定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5943618B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016177277A (ja) * | 2015-03-20 | 2016-10-06 | ヤマハ株式会社 | 発音装置、発音方法および発音プログラム |
JP6728754B2 (ja) | 2015-03-20 | 2020-07-22 | ヤマハ株式会社 | 発音装置、発音方法および発音プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011175006A (ja) * | 2010-02-23 | 2011-09-08 | Sony Corp | 情報処理装置、自動作曲方法、学習装置、学習方法、及びプログラム |
JP5560769B2 (ja) * | 2010-02-26 | 2014-07-30 | 大日本印刷株式会社 | 音素符号変換装置および音声合成装置 |
-
2012
- 2012-01-25 JP JP2012012888A patent/JP5943618B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013152337A (ja) | 2013-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2733696B1 (en) | Voice synthesizing method and voice synthesizing apparatus | |
EP2980786B1 (en) | Voice analysis method and device, voice synthesis method and device and medium storing voice analysis program | |
US9818396B2 (en) | Method and device for editing singing voice synthesis data, and method for analyzing singing | |
JP5949607B2 (ja) | 音声合成装置 | |
JP2011048335A (ja) | 歌声合成システム、歌声合成方法及び歌声合成装置 | |
JP5974436B2 (ja) | 楽曲生成装置 | |
JP2016161919A (ja) | 音声合成装置 | |
EP3631789A1 (en) | System and method for automatically generating musical output | |
JP2016033662A (ja) | ターゲット文字列の推定 | |
JP5943618B2 (ja) | 音符列設定装置および音符列設定方法 | |
JP2013104878A (ja) | 楽曲生成装置 | |
JP2014095856A (ja) | 音声処理装置 | |
Delalez et al. | Vokinesis: syllabic control points for performative singing synthesis. | |
JP6167503B2 (ja) | 音声合成装置 | |
JP6044284B2 (ja) | 音声合成装置 | |
US20220044662A1 (en) | Audio Information Playback Method, Audio Information Playback Device, Audio Information Generation Method and Audio Information Generation Device | |
JP2017156495A (ja) | 歌詞生成装置および歌詞生成方法 | |
JP6828530B2 (ja) | 発音装置及び発音制御方法 | |
JP2018151548A (ja) | 発音装置及びループ区間設定方法 | |
JP4622356B2 (ja) | 音声合成用スクリプト生成装置及び音声合成用スクリプト生成プログラム | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP5974473B2 (ja) | 曲編集装置、曲編集方法及びプログラム | |
KR101427666B1 (ko) | 악보 편집 서비스 제공 방법 및 장치 | |
JP2013156544A (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JPWO2019003350A1 (ja) | 歌唱音生成装置及び方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150108 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5943618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |