JP5900076B2 - 平文歌詞復元装置 - Google Patents
平文歌詞復元装置 Download PDFInfo
- Publication number
- JP5900076B2 JP5900076B2 JP2012066547A JP2012066547A JP5900076B2 JP 5900076 B2 JP5900076 B2 JP 5900076B2 JP 2012066547 A JP2012066547 A JP 2012066547A JP 2012066547 A JP2012066547 A JP 2012066547A JP 5900076 B2 JP5900076 B2 JP 5900076B2
- Authority
- JP
- Japan
- Prior art keywords
- lyrics
- data
- plaintext
- plain text
- singing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
(A:第1実施形態)
図1は、この発明の第1実施形態の平文歌詞復元装置10Aの構成例を示すブロック図である。この平文歌詞復元装置10Aは、歌唱合成用に生成されたシーケンスデータ(以下、歌唱合成用シーケンスデータ)に埋め込まれている歌詞(すなわち、歌唱合成用歌詞)から平文歌詞を復元して出力する装置である。ここで、歌唱合成用シーケンスデータの具体例としては、図2(A)に示す歌唱合成用スコアや図2(B)に示すXML形式のシーケンスデータが挙げられる。
Interface Card)などの各種入出力インタフェースの集合体である。平文歌詞復元装置10Aに外部機器を接続する場合、当該外部機器は外部機器インタフェース部130に含まれる各種入出力インタフェースのうちの好適なものに接続される。本実施形態では、平文歌詞の復元対象となる曲の歌唱合成用シーケンスデータは外部機器インタフェース部130を介して平文歌詞復元装置10Aに入力される。より詳細に説明すると、本実施形態では、平文歌詞の復元対象となる曲の歌唱合成用シーケンスデータを記憶した外部機器が外部機器インタフェース部130に接続され、外部機器インタフェース部130を介して当該外部機器から平文歌詞復元装置10Aに当該歌唱合成用シーケンスデータが入力される。つまり、外部機器インタフェース部130(より正確には、各種入出力インタフェース)は、平文歌詞復元装置10Aに対して歌唱合成用シーケンスデータを入力するための入力手段の役割を果たす。例えば、平文歌詞復元装置10Aに歌唱合成用シーケンスデータを与える外部機器がインターネットなどの電気通信回線を介して平文歌詞復元装置10Aに接続される場合には、外部機器インタフェース部130に含まれるNICが上記入力手段の役割を果たす。
ルールa1(特殊記号の削除)
前述したように、歌唱合成用シーケンスデータの作成過程では、自然言語で記述された平文歌詞に含まれる表意文字(日本語で平文歌詞が記述されている場合には漢字)を平仮名などの表音文字により書き下す編集に加えて、歌唱合成特有の各種特殊記号を挿入する編集が行われることが多い。このような特殊記号の一例としては、合成された歌唱音において息継ぎを再現してリアルさを向上させるためのブレス記号「br」、複数の音節に分割される英単語を音節単位に分割して音符に割り当てるための音節区切り記号「‐
」(半角ハイフン+半角スペース)、発音記号を事後的に入力する場所を予め確保しておくために挿入されるデフォルト歌詞「a」などが挙げられる。このルールa1にしたがった変換処理は、図3(A)に示すように、歌唱合成特有の特殊記号を削除し、言語的により自然な平文歌詞を復元するための処理である。なお、本実施形態において複数の音節に分割される英単語を音節単位に分割して音符に割り当てるための音節区切り記号として「半角ハイフン+半角スペース」を用いるが、例えば「Good-bye」のように、本来的に含まれる「半角ハイフン」と上記音節区切り記号とを「半角ハイフン」の直後に「半角スペース」が後続するか否かによって区別するようにしても良く、本来的に含まれる「半角ハイフン」との区別を容易にするため音節区切り記号を構成する文字として「半角ハイフン」以外の文字を用いても良い。
歌唱合成用シーケンスデータの作成過程では、平文歌詞が長音記号を含んでいる場合に当該歌詞に対応する音符の数に合わせて長音記号の数を調整する編集が行われる場合がある。例えば、「ピーナッツ」という単語を「ピーーナッツ」と書き換えるといった具合である。また、平文歌詞を構成する単語に促音が含まれている場合には、当該単語に対応する音符の数に合わせて「促音」を「1または複数の長音記号+促音」に置き換えることも一般に行われる。例えば、「えっと」という単語を「えーーーっと」に置き換えるといった具合である。このルールa2にしたがった変換処理は、図3(B)に示すように、歌唱合成に特有な長音記号の調整を解除し(すなわち、「連続する複数の長音記号」の「1つの長音記号」への置き換え、および「1または複数の長音記号+促音」の「促音」への置き換え)、日本語としてより自然な平文歌詞を復元するための処理である。
歌唱合成用シーケンスデータの作成過程では、主語を表す格助詞「は」(発音は「Wa」)を「わ」に置き換える編集が行われる。これは、歌唱音声を表す波形データの生成の際に、主語を表す格助詞「は」に対応する音素が「Ha」と誤変換されることを回避するためである。また、目的語を表す格助詞「を」を「お」に置き換える変換が行われる場合もある。このルールa3にしたがった変換処理は、図3(c)に示すように、歌唱合成に特有な格助詞の置き換えを解除し、日本語としてより自然な平文歌詞を復元するための処理である。
次いで、本発明の第2実施形態について説明する。前述した第1実施形態では、歌唱合成用シーケンスデータに埋め込まれている歌唱合成用歌詞に対して、予め定められたルールにしたがって「特殊記号の削除」、「メリスマ調整の解除」、および「格助詞の置き換えの解除」を施して平文歌詞を復元する場合について説明した。これに対して本実施形態では、形態素解析を利用して平文歌詞の復元を行う点が上記第1実施形態と異なる。
図6は、この発明の第3実施形態の平文歌詞復元装置10Cの構成例を示す図である。この平文歌詞復元装置10Cは、前述した平文歌詞復元装置10Bと同様に形態素解析を利用して平文歌詞の復元を行う装置である。ただし、平文歌詞復元装置10Cは、平文歌詞の復元の際に補助情報を利用して形態素解析の精度を高めるようにした点が平文歌詞復元装置10Bと異なり、平文歌詞復元装置10Cの不揮発性記憶部144には、平文歌詞復元プログラム144b1に換えて平文歌詞復元プログラム144c1が格納されている点が平文歌詞復元装置10Bと異なる。
一般に、曲における音高の時間変化(例えば、メロディ)は、歌詞を話し言葉として発音したときの高低アクセントやストレスに準じていることが多い。したがって、音高を示す音符データを補助情報として利用する場合には、音符データにより示される音高の時間変化に基づいて各音符に合わせて発音する平文歌詞の高低アクセントを推定することができ、アクセントの推定結果に基づいて形態素の取捨選択(例えば、音符データにより示される音高の時間変化から推定された高低アクセントとは異なる高低アクセントを有する形態素を除外するなど)を行って、平文歌詞を構成する形態素を特定することができる。この場合、形態素解析用辞書144b2に各形態素の高低アクセントを示すデータが登録されている必要があることは言うまでも無い。
一般に、メロディの間に挿入される音量の小さい部分や休符は、歌詞における文節の区切り位置に対応していることが多い。したがって、音量を示す音符データを補助情報として利用する場合には、音符データにより示される音量の時間変化や休符の位置に基づいて平文歌詞における文節の区切り位置を推定することができ、その推定結果に基づいて形態素の取捨選択(推定された文節区切り位置を跨ぐような形態素を除外するなど)を行って、平文歌詞を構成する形態素を特定することができる。
形態素解析用辞書144b2に登録されている単語であっても、一般的な歌詞等における使用頻度が低い単語(例えば、古語や特殊な固有名詞など)は、平文歌詞の復元対象の曲においても同様に歌詞として使用されている可能性は低いと考えられる。したがって、形態素解析用辞書144b2に一般的な歌詞等における使用頻度を示すデータが登録されており、当該使用頻度を補助情報として利用する場合には、形態素解析において辞書にマッチしたとしても、一般的な歌詞としての使用頻度が低いものであれば平文歌詞を構成する形態素の候補から除外するようにすれば良い。
以上本発明の第1〜第3実施形態について説明したが、この実施形態に以下の変形を加えても勿論良い。
(1)上記各実施形態では、平文歌詞の復元対象の曲の歌唱合成用シーケンスデータを平文歌詞復元装置へ入力し、この歌唱合成用シーケンスデータから歌唱合成用歌詞データ(すなわち、当該曲の歌唱合成用歌詞を表すデータ)を生成し、さらにこの歌唱合成用歌詞データの表す歌唱合成用歌詞から平文歌詞を復元する場合について説明した。しかし、第1実施形態の平文歌詞復元装置10Aおよび第2実施形態の平文歌詞復元装置10Bに対しては歌唱合成用歌詞データを直接入力しても良く、第3実施形態の平文歌詞復元装置10Cに対しては歌唱合成用歌詞データと、平文歌詞の復元対象の曲を構成する各音に関する情報(例えば、音高)を示すデータであって、前記歌唱合成用歌詞データと時間軸を同じくする音符データとを直接入力しても良い。なお、上記各実施形態では、曲を構成する音の並びを表すデータとして音符データを用いたが、当該音の音高が所謂12半音に限定されないことは言うまでも無い。
Claims (5)
- 曲を構成する音の並びを表す音データと、前記音の並びを構成する各音に合わせて発音する表音文字を表す歌唱合成用歌詞データと、を受け取る入力手段と、
前記歌唱合成用歌詞データの表す表音文字列に含まれる形態素を形態素解析により特定して平文歌詞を復元する手段であって、前記形態素解析により共通の表音文字列から複数の形態素の候補が得られた場合に複数の形態素の候補の取捨選択を前記音データを利用して行う平文歌詞復元手段と、
前記平文歌詞復元手段により復元された平文歌詞を表す平文歌詞データを出力する出力手段と、有し、
前記音データは、前記音の並びを構成する各音に合わせて発音する歌詞の音量を示すデータを含み、
前記平文歌詞復元手段は、前記音データにより示される音量の変化に基づいて前記平文歌詞における文節の区切り位置を推定し、文節の区切り位置の推定結果を利用して形態素の取捨選択を行うこと
を特徴とする平文歌詞復元装置。 - 前記音データは、前記音の並びを構成する各音の音高を示すデータを含み、
前記平文歌詞復元手段は、前記音データにより示される前記曲の音高の時間変化に基づいて前記平文歌詞を構成する各形態素のアクセントを推定し、アクセントの推定結果を利用して形態素の取捨選択を行うことを特徴とする請求項1に記載の平文歌詞復元装置。 - 前記平文歌詞復元手段は、前記音データを利用した取捨選択によっても前記平文歌詞を構成する形態素を一意に特定できない場合には、形態素の候補をユーザに提示して何れか1の候補の選択を促すことを特徴とする請求項1または請求項2に記載の平文歌詞復元装置。
- 前記歌唱合成用歌詞データの表す文字列には、歌唱合成用の特殊記号の付与、メリスマ調整、および格助詞の置き換えの少なくとも1つが施されており、
前記平文歌詞復元手段は、前記歌唱合成用歌詞データの表す文字列に対して、特殊記号の削除、メリスマ調整の解除、および格助詞の置き換えの解除を予め定められたルールにしたがって施した後に前記形態素解析を施すことを特徴とする請求項1〜3の何れか1項に記載の平文歌詞復元装置。 - 前記出力手段は、前記歌唱合成用の特殊記号と前記音データの示す情報の少なくとも一方を付加情報として前記平文歌詞データとともに出力することを特徴とする請求項1〜4の何れか1項に記載の平文歌詞復元装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012066547A JP5900076B2 (ja) | 2012-03-23 | 2012-03-23 | 平文歌詞復元装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012066547A JP5900076B2 (ja) | 2012-03-23 | 2012-03-23 | 平文歌詞復元装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013196659A JP2013196659A (ja) | 2013-09-30 |
JP5900076B2 true JP5900076B2 (ja) | 2016-04-06 |
Family
ID=49395449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012066547A Active JP5900076B2 (ja) | 2012-03-23 | 2012-03-23 | 平文歌詞復元装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5900076B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3675287B2 (ja) * | 1999-08-09 | 2005-07-27 | ヤマハ株式会社 | 演奏データ作成装置 |
-
2012
- 2012-03-23 JP JP2012066547A patent/JP5900076B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013196659A (ja) | 2013-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11157553B2 (en) | Sheet music search and discovery system | |
US9355634B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
US10204617B2 (en) | Voice synthesis method and voice synthesis device | |
Chow et al. | A musical approach to speech melody | |
US20160034446A1 (en) | Estimation of target character train | |
KR102168529B1 (ko) | 인공신경망을 이용한 가창음성 합성 방법 및 장치 | |
JP4736483B2 (ja) | 歌データ入力プログラム | |
JP6003115B2 (ja) | 歌唱合成用シーケンスデータ編集装置および歌唱合成用シーケンスデータ編集方法 | |
US20220044662A1 (en) | Audio Information Playback Method, Audio Information Playback Device, Audio Information Generation Method and Audio Information Generation Device | |
JP4584511B2 (ja) | 規則音声合成装置 | |
JP5900076B2 (ja) | 平文歌詞復元装置 | |
JP4613817B2 (ja) | 運指表示装置、及びプログラム | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
Schoenberger | Music, Mind, and Language in Chinese Poetry and Performance: The Voice Extended | |
De'Ath | Phonetic Transcription-What It Doesn't Tell Us | |
JP5169602B2 (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
JP4026512B2 (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
JP2008020622A (ja) | オーサリングシステムおよびプログラム | |
JP2002182675A (ja) | 音声合成装置、ボーカルデータ生成装置および歌唱装置 | |
Williams | Word stress assignment in a text-to-speech synthesis system for British English | |
Subramanian | Carnatic music-automatic computer synthesis of gamakams | |
Subramanian | Generating Computer Music from Skeletal Notations for Carnatic Music Compositions | |
Ekpenyong et al. | A Template-Based Approach to Intelligent Multilingual Corpora Transcription | |
JP2020181141A (ja) | 歌詞入力方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160222 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5900076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |