JP7503870B1 - 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置 - Google Patents

楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置 Download PDF

Info

Publication number
JP7503870B1
JP7503870B1 JP2023177135A JP2023177135A JP7503870B1 JP 7503870 B1 JP7503870 B1 JP 7503870B1 JP 2023177135 A JP2023177135 A JP 2023177135A JP 2023177135 A JP2023177135 A JP 2023177135A JP 7503870 B1 JP7503870 B1 JP 7503870B1
Authority
JP
Japan
Prior art keywords
voice
singer
singing
language
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023177135A
Other languages
English (en)
Inventor
敏昭 植野
Original Assignee
ギャラクシー・ネット株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ギャラクシー・ネット株式会社 filed Critical ギャラクシー・ネット株式会社
Priority to JP2023177135A priority Critical patent/JP7503870B1/ja
Application granted granted Critical
Publication of JP7503870B1 publication Critical patent/JP7503870B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】歌唱技量や演技技量等の技量未熟者に対するデビュー機会を拡大する。【解決手段】楽曲制作支援サーバ、PC、プロ歌手のマイク、新人歌手のマイク及びCDライターを含み構成されている楽曲制作支援システムにおいて、楽曲制作支援プログラムは、第1歌手の歌声データを収録する第1歌声収録手段、第1歌手の歌声データに基づいて、第1歌手の声質変換モデルを作成する声質変換モデル作成手段、第2歌手により歌唱された楽曲の歌声データを収録する第2歌声収録手段及び第2歌手により歌唱された楽曲の歌声データを、第1歌手の声質変換モデルにより第1歌手の声質に変換する声質変換手段として楽曲制作支援サーバを機能させる。【選択図】図7

Description

本発明は、楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置に関する。
従来より、新人歌手が歌手デビューするに際し、ボイストレーニング等をしっかり積むなど、相当な歌唱力訓練が必要である。ただ歌唱力訓練をいくら積んだとしても、オーディション等の審査でその実力がプロ並に評価されるなど、優れた歌唱力の持ち主でない限り、歌唱力が未熟な歌手にとって、現実的な歌手デビューは極めて困難であった。
また、歌手の楽曲(例えば新人歌手のデビュー曲)を制作する場合にあたっては、制作の度にとても多くの時間、労力、費用を要しているという現状がある。例えば、1曲のレコーディングに何時間もの時間がかかる上に、その後のピッチ調整や歌声にメロディ・伴奏のmix編集作業にも数日を要する。さらにレコーディングスタジオや収録機器、高価なパソコン及び編集ソフトウェアといったものの経費、ならびに、関係者(歌手、音楽プロデューサー、技術スタッフ等)の労力及び人件費も少なくない。
ところで近年、AI技術の急速な発達により、歌唱声質変換にかかる技術が知られている。例えば特許文献1に記載される発明においては、カラオケ等において、歌唱ユーザによって指定されたターゲットのボーカルモデルを用いて、当該歌唱ユーザによって予約された楽曲に基づいて歌唱を行うユーザの声質をターゲットの声質に変換して出力する歌唱声質変換プログラム及び歌唱声質変換装置が記載されている。
特開2023-013684号公報
しかしながら、特許文献1に記載される発明においては、歌唱ユーザの声質をターゲットと称される特定の歌手の声質に変換するものであるため、歌唱ユーザの歌唱力を特定の歌手のようなプロ並みの歌唱に飛躍させるものではない。このため、歌唱ユーザの歌唱力が未熟な場合、特定の歌手の声質に変換されたとしても、その歌唱力は未熟なもののままである。
本発明者は、上述したように、例えば新人歌手が歌手デビューするにあたり、いくら本人が希望しても歌唱力が未熟な歌手にとって現実的な歌手デビューは極めて困難であること、楽曲を収録する場合にあたっては、収録の度にとても多くの時間、労力、費用を要しているという現状に鑑みて、AI技術による歌唱声質変換技術によって、プロ歌手のボーカル歌声を、新人歌手の歌声に変換し出力することにより、歌唱力如何にかかわらず、勿論ボイストレーニングなどの歌唱力訓練は全く必要なしに、誰でも自分の声質でプロ並みの「歌声」を手に入れることができると考えた。また従来と比較し、本発明によれば、楽曲制作にかかる時間、労力、費用といったコストも大幅に削減できることから、誰でも短期間に少ないコストで以って歌手デビューが可能であると考えた。
本発明は、上記の点に鑑み提案されたものであり、一つの側面において、歌唱技量や演技技量等の技量未熟者に対するデビュー機会の拡大を目的とする。
上記の課題を解決するため、本発明に係る楽曲制作支援プログラムは、第1歌手の歌声データを収録する第1歌声収録手段、前記第1歌手の歌声データに基づいて、前記第1歌手の声質変換モデルを作成する声質変換モデル作成手段、第2歌手により第1言語で歌唱された楽曲の第1言語歌声データを収録し、前記第2歌手又は第3歌手により第2言語で歌唱された前記楽曲の第2言語歌声データを収録する第2歌声収録手段、前記第1言語歌声データ及び前記第2言語歌声データを、前記第1歌手の声質変換モデルにより前記第1歌手の声質にそれぞれ変換する声質変換手段、として機能させる。
上記の課題を解決するため、本発明に係る音楽再生装置は、上記楽曲制作支援プログラムにより出力された前記第1言語楽曲データ及び前記第2言語楽曲データを記憶した記憶部と、前記第1言語楽曲データと対応付けられた第1言語再生操作部と、前記第2言語楽曲データと対応付けられた第2言語再生操作部と、前記第1言語再生操作部が操作された場合に前記第1言語楽曲を再生し、前記第2言語再生操作部が操作された場合に前記第2言語楽曲を再生する音楽出力部と、を備える。
上記の課題を解決するため、本発明に係る演技音声制作支援プログラムは、第1声優の音声データを収録する第1音声収録手段、前記第1声優の音声データに基づいて、前記第1声優の声質変換モデルを作成する声質変換モデル作成手段、第2声優により演技された台本の演技音声データを収録する第2音声収録手段、前記第2声優により演技された前記台本の演技音声データを、前記第1声優の声質変換モデルにより前記第1声優の声質に変換する声質変換手段、として機能させる。
本発明の実施の形態によれば、一つの側面において、歌唱技量や演技技量等の技量未熟者に対するデビュー機会の拡大することができる。
本実施形態に係る楽曲制作支援システムのシステム構成例を示す図である。 本実施形態に係る楽曲制作支援サーバのハードウェア構成例を示す図である。 本実施形態に係る楽曲制作支援サーバのソフトウェア構成例を示す図である。 本実施形態に係るDBのデータ構成例を示す図である。 本実施形態に係るDBのデータ構成例を示す図である。 本実施形態に係る楽曲制作支援システムに係るフローチャート1である。 本実施形態に係る楽曲制作支援システムに係るフローチャート2である。 本実施形態に係る楽曲制作支援システムに係るフローチャート3である。 本実施形態に係る音楽再生装置の外観例を示す図である。 本実施形態に係る演技音声制作支援サーバのソフトウェア構成例を示す図である。 本実施形態に係る演技音声映像制作支援システムに係るフローチャート1である。 本実施形態に係る演技音声映像制作支援システムに係るフローチャート2である。 本実施形態に係る演技音声映像制作支援システムに係るフローチャート3である。 本実施形態に係る楽曲制作支援システムのシステム構成例を示す図である。 本実施形態に係る楽曲制作支援サーバのソフトウェア構成例を示す図である。
本発明の実施形態について、図面を参照しつつ詳細に説明する。
[実施形態1]
<システム構成>
図1は、本実施形態に係る楽曲制作支援システムのシステム構成例を示す図である。図1の楽曲制作支援システム100は、楽曲制作支援サーバ10、PC20、プロ歌手のマイク30、新人歌手のマイク40、及びCDライター50を含み構成されている。
楽曲制作支援サーバ10は、予め歌唱技能の高い歌手(以下例えばプロ歌手と呼ぶ)のボーカル歌声を用意しておくとともに、声質変換技術により、ターゲット歌手(以下例えば歌手デビューする新人歌手と呼ぶ)の声質特徴を抽出し、プロ歌手のボーカル歌声をターゲットの新人歌手の声質に変換することにより、ターゲット歌手のための楽曲制作支援を行うサーバ装置である。楽曲制作支援サーバ10は、声質変換後の歌声をターゲット歌手の歌声の基本周波数と合わせるためのピッチ調節、ピッチ調節した声質変換後のボーカル(及びハモリボーカル)にリバーブかけたり、ステレオ変換、ノイズ除去など編集し、メロディや伴奏とMixし、最終的な楽曲(例えば新人歌手のデビュー曲)を完成させる。
PC(Personal Computer)20は、楽曲制作支援サーバ10にインターネットを含むネットワークを介してアクセスし、楽曲制作にかかる操作を行うための操作端末である。PC20は、例えばパーソナルコンピュータ、タブレット端末又はスマートフォンなどにより実現され、所定のアプリケーションプログラム(例えば汎用ウェブブラウザや専用アプリ等)がインストールされる。なお、PC20に楽曲制作支援サーバ10の有する機能を実現するプログラムをインストールすることで、PC20と楽曲制作支援サーバ10を一体装置として実現してもよい。
プロ歌手は、当該プロ歌手の歌唱力の高いボーカル歌声を予め用意する目的で、レコーディング、即ちマイク30を用いて、新人歌手の楽曲として発売させたい楽曲(例えば新人歌手のデビュー曲)そのものを歌唱することで、プロ歌手の歌声を収録保存する。また、プロ歌手の歌声は、従来通りの方法でレコーディングスタジオで収録したものを使用してもよい。
新人歌手は、歌手デビューする新人歌手の声質変換モデルを作成する目的で、マイク40を用いて新人歌手の歌声(サンプル)を収録保存する。声質変換モデルの元となる歌唱曲は、所定の楽曲であって10曲程度分が望ましいが、新人歌手の声質特徴を抽出可能である限りにおいて1曲でもよい。所定の楽曲は、新人歌手のデビュー曲と同一曲を含んでもよいし、新人歌手の声質特徴を抽出可能である限りにおいて必ずしも含まなくともよい。また新人歌手の声質特徴を抽出可能である限りにおいて、必ずしも新人歌手の歌声でなくともよく、例えば会話音声や朗読音声であってもよい。
CDライター50は、完成した最終的な楽曲(例えば新人歌手のデビュー曲)を、記憶媒体の一例としてのCD(Compact Disc)に焼き付ける装置である。こうして制作された楽曲のCDが新人歌手のデビュー曲として販売される。
本実施形態に係る楽曲制作支援システム100によれば、音程が不安定であったり、ビブラートなどの歌い方ができないなど、歌唱技能の低い新人歌手であっても、プロの歌手の歌声をその新人歌手による声質の歌声に変換できるので、変換後の歌声をCDにして販売したり、音楽データファイルとして音楽配信することで、誰でも短期間に低コストで歌手デビューすることが可能となる。
なお、楽曲制作支援サーバ10とPC20とがインターネット等で接続されるなど互いに遠隔地に所在する場合、プロ歌手のマイク30、新人歌手のマイク40、及びCDライター50は、PC20側に接続してもよい。
(ハードウェア構成)
図2は、本実施形態に係る楽曲制作支援サーバのハードウェア構成例を示す図である。楽曲制作支援サーバ10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、HDD(Hard Disk Drive)14、通信装置15、及びGPU(Graphics Processing Unit)16を有する。
CPU11及びGPU16は、各種プログラムの実行や演算処理を行う。ROM12は、起動時に必要なプログラムなどが記憶されている。RAM13は、CPU11での処理を一時的に記憶したり、データを記憶したりする作業エリアである。HDD14は、各種データ及びプログラムを格納する。通信装置15は、通信ネットワークや通信ケーブルを介して他装置とのデータ通信を行う。
(ソフトウェア構成)
図3は、本実施形態に係る楽曲制作支援サーバのソフトウェア構成例を示す図である。楽曲制作支援サーバ10は、主な機能部として、歌声収録部101、声質変換モデル作成部102、入力受付部103、声質変換部104、歌声編集部105、Mix編集部106、完成楽曲出力部107、及び記憶部109(非図示)を有する。
歌声収録部101は、第1歌手(新人歌手等)の歌声データを収録し、第2歌手(日本人プロ歌手等)及び第3歌手(外国人プロ歌手等)により歌唱された楽曲の歌声データを収録する機能を有している。
声質変換モデル作成部102は、第1歌手の歌声データに基づいて、第1歌手の声質変換モデル109bを作成する機能を有している。
入力受付部103は、声質変換処理の実行に際し、新人歌手、プロ歌手、楽曲、言語など声質変換に関する情報の入力をユーザから受け付ける。
声質変換部104は、第2歌手及び第3歌手により歌唱された楽曲の歌声データを、第1歌手の声質変換モデル109bにより第1歌手の声質に変換する機能を有している。
歌声編集部105は、声質変換歌声データ(第1歌手の声質に変換された楽曲の歌声データ)を対象に、例えばターゲットとなる新人歌手の歌声の基本周波数と合わせるためのピッチ調節、ピッチ調節した声質変換後のボーカル(及びハモリボーカル)歌声にリバーブかけたり、ステレオ変換、ノイズ除去など、各種編集処理を行う機能を有している。
Mix編集部106は、各種編集処理された声質変換歌声データを対象に、メロディ又は伴奏データをMixする機能を有している。
完成楽曲出力部107は、各種編集処理、Mixされた声質変換歌声データ(楽曲の歌声データ)を、第1歌手により歌唱された楽曲データとして出力する機能を有している。出力は、第1歌手により歌唱された楽曲データを、外部記憶媒体(CD等)に記憶したり、インターネットを含むネットワークを介して外部サーバに音楽配信する。
記憶部109は、事前学習済みベースモデル109a、新人歌手の声質変換モデル109b、新人歌手情報DB109c、プロ歌手歌声保存DB109d、声質変換歌声保存DB109e、楽曲DB109f、完成楽曲DB109gを記憶する機能を有している。
なお、これら各機能部は、本発明に係る機能部であって、楽曲制作支援サーバ10が楽曲制作支援に必要な各種機能部を他にも備えていることは言うまでもない。また各機能部は、楽曲制作支援サーバ10を構成するコンピュータのCPU、GPU、ROM、RAM等のハードウェア資源上で実行されるプログラムによって実現されるものである。これらの機能部は、「手段」、「モジュール」、「ユニット」、又は「回路」に読替えてもよい。また、楽曲制作支援サーバ10における記憶部109の各DBは、ネットワーク上の外部記憶装置に配置することも可能である。また、上記コンピュータプログラム及びアプリケーションプログラムは、コンピュータが読み取り可能な記憶媒体に格納されていてもよい。
(各種DB)
図4(a)は、本実施形態に係る新人歌手情報DBのデータ構成例を示す図である。新人歌手情報DB109cは、声質変換モデルに声質を学習させたい学習ターゲットとしての、例えば新人歌手の歌手情報が予め登録されたDBである。本実施形態に係る新人歌手情報DB109cは、例えば新人歌手の「新人歌手ID」、「氏名」、「性別」、「所属」などのデータ項目を有する。なお、新人歌手情報DB109cに登録される新人歌手は、その声質の声質変換モデル109bが作成済みの歌手とする。
図4(b)は、本実施形態に係るプロ歌手歌声保存DBのデータ構成例を示す図である。プロ歌手歌声保存DB109dは、プロ歌手の歌手情報と、当該プロ歌手による楽曲(例えば新人歌手のデビュー曲)の歌声データが予め登録されたDBである。本実施形態に係るプロ歌手歌声保存DB109dは、例えば「プロ歌手歌声ID」、プロ歌手の「氏名」、「楽曲ID」、「プロ歌手歌声データ」、「言語」などのデータ項目を有する。
このうち「楽曲ID」は、当該プロ歌手が歌唱した楽曲を特定するためのIDである。楽曲DB109fの楽曲IDと対応する。「プロ歌手歌声データ」は、当該プロ歌手が予め当該楽曲(例えば新人歌手のデビュー曲)を歌唱することで収録された歌声データファイルである。「言語」は、当該楽曲の歌詞言語である。同一曲であっても、歌詞が外国語等の他言語化される場合がある。このような場合、当該プロ歌手が日本語歌詞の当該楽曲を歌唱するとともに、他言語歌詞の当該楽曲を歌唱することで、他言語歌詞分のプロ歌手歌声データが得られる。
また仮に、当該プロ歌手が他言語での当該楽曲の歌唱が困難の場合、他のプロ歌手が他言語で当該楽曲の歌唱を行うことにより、他言語歌詞分のプロ歌手歌声データを得てもよい。例えば図4(b)に示すプロ歌手歌声保存DB109dには、同一の楽曲ID「M0001」は、プロ歌手Mの歌唱力でもって当該楽曲が日本語歌詞で歌い上げたプロ歌手歌声データ(プロ歌手歌声ID「P0001」)と、英語ネイティブであるプロ歌手Nの歌唱力でもって当該楽曲が英語歌詞で歌い上げたプロ歌手歌声データ(プロ歌手歌声ID「P0002」)とが保存されている。
図5(a)は、本実施形態に係る声質変換歌声保存DBのデータ構成例を示す図である。声質変換歌声保存DB109eは、プロ歌手によるプロ歌手歌声データを、ターゲットの新人歌手の声質に変換して保存したDBである。本実施形態に係る声質変換歌声保存DB109eは、例えば「声質変換歌声ID」、「新人歌手ID」、「プロ歌手歌声ID」、「楽曲ID」、「声質変換歌声データ」などのデータ項目を有する。
このうち「新人歌手ID」は、声質変換後の歌声(声質)の持ち主であるターゲットの新人歌手の新人歌手IDを示す。「プロ歌手歌声ID」は、声質変換前の歌声の持ち主であるプロ歌手のプロ歌手歌声IDを示す。「楽曲ID」は、当該プロ歌手が歌唱した楽曲(例えば新人歌手のデビュー曲)の楽曲IDを示す。「声質変換歌声データ」は、プロ歌手によるプロ歌手歌声データが、ターゲットの新人歌手の声質に変換された後の歌声データである。
図5(b)は、本実施形態に係る楽曲DB109fのデータ構成例を示す図である。楽曲DBは、新人歌手の楽曲として発売させたい楽曲(例えば新人歌手のデビュー曲)の情報が予め登録されたDBである。本実施形態に係る楽曲DB109fは、例えば「楽曲ID」、「楽曲タイトル」、「メロディ・伴奏データ」などのデータ項目を有する。
このうち「メロディ・伴奏データ」は、当該楽曲のメロディ・伴奏などの音声データである。ターゲットの新人歌手の声質に変換された後の歌声質変換歌声データが、メロディ・伴奏データとMix編集されることで、最終的な楽曲が完成する。
図5(c)は、本実施形態に係る完成楽曲DBのデータ構成例を示す図である。完成楽曲DB109gは、新人歌手の楽曲として発売する楽曲(例えば新人歌手のデビュー完成曲)の情報が保存されたDBである。本実施形態に係る完成楽曲DB109gは、例えば「完成楽曲ID」、「完成楽曲データ」、「楽曲タイトル」、「新人歌手ID」、「プロ歌手歌声ID」などのデータ項目を有する。
このうち「完成楽曲データ」は、ターゲットの新人歌手の声質に変換された後の歌声質変換歌声データが、メロディ・伴奏データとMix編集されることで完成した最終的な楽曲(例えば新人歌手のデビュー完成曲)の楽曲データである。「楽曲タイトル」は、発売する当該楽曲のタイトルを示す。「新人歌手ID」は、完成楽曲の歌い手とする新人歌手の新人歌手IDを示す。「プロ歌手歌声ID」は、声質変換前の楽曲を実際に歌唱したプロ歌手歌声のプロ歌手歌声IDを示す。
なお、本実施形態に係る上記DBのデータ構成はあくまで一例であり、他のデータ項目があってもよい。
<情報処理>
(声質変換モデル作成処理)
図6は、本実施形態に係る楽曲制作支援システムに係るフローチャート1である。楽曲制作支援サーバ10のCPU又はGPUが本フローチャート処理を実現可能なプログラムを読み込んで実行させることで、各ステップ(以下、「S」と表記する)を実現することができる。
S1:楽曲制作支援サーバ10は、マイク40を介して、声質変換モデルを作成するための元となる新人歌手の歌声を収録(取得)する。具体的に、新人歌手は所定の楽曲を例えば10曲程度分歌唱する。なお説明上、当該新人歌手のその歌唱力は低いものとする。
S2:楽曲制作支援サーバ10は、収録した新人歌手の歌声の特徴に基づいて、当該新人歌手の声質変換モデル109bを作成する。声質変換モデル作成について具体的には、HuBERT(Hidden Unit Bidirectional Encoder Representationd form Transformers)をベースにするとよい。声質変換モデル作成時には、特定の人の声を一から作成するのではなく、まず一般的な人の声の事前学習済みベースモデル109aを作成しておく。このモデルは、多くの言語圏のたくさんの人の発話データを学習し、人間の一般的な声の特性を持つものである。この事前学習済みベースモデル109aに、学習したい人(例えば新人歌手)の声の情報を上から重ねるようにして個々人の声質変換モデルを作成すると、学習対象の人の大量のデータを用意する必要がなく、少量の声で学習し、新人歌手の声質変換モデルを生成することが可能である。
このように、学習時は変換先である新人歌手の声質特徴量(音声特徴量)を事前学習済みベースモデル109aに入力することで精度の高い声質変換モデル109bを迅速に作成することができる。声質変換(推論)時は変換元であるプロ歌手の声質特徴量(音声特徴量)を、作成した声質変換モデル109bによって新人歌手の歌声に声質変換することになる。
なお、本実施形態に係る事前学習済みベースモデル109aは、日本語のみならず多言語における多数の人間の歌声や音声を事前学習したものであり、様々な言語の母音子音を学習したベースモデルを利用することができる。また事前学習済みベースモデル109aは、J-POP、洋楽、アニメソング、演歌、ゲームソングといったように、楽曲ジャンル毎に特化したベースモデルを用意してもよい。例えばアニメソングジャンル毎に特化したベースモデルの場合は、アニソンジャンルにおけるプロ歌手の歌声データがさらに追加学習・移転学習されうる。
(プロ歌手歌声保存処理)
上述したように、予めプロ歌手が新人歌手の楽曲として発売させたい楽曲(例えば新人歌手のデビュー曲)そのものを歌唱することで、プロ歌手による当該楽曲の歌声データが収録されてプロ歌手歌声保存DB109dに保存される。
また本実施形態に係る楽曲は英語歌詞版が存在する。このような場合、当該プロ歌手が日本語歌詞の当該楽曲を歌唱するとともに、他言語歌詞の当該楽曲を歌唱することで、他言語歌詞分のプロ歌手歌声データが得られる。当該プロ歌手が他言語での当該楽曲の歌唱が困難の場合、他のプロ歌手が他言語で当該楽曲の歌唱を行うことにより、他言語化分のプロ歌手歌声データを得てもよい。例えば図4(b)に示されるように、本実施形態にプロ歌手歌声保存DB109dにおいては、異なるプロ歌手M及びプロ歌手Nによる、異なる言語歌詞(日本語及び英語)により歌唱された同一楽曲(楽曲ID:M0001)のプロ歌手歌声データがそれぞれ保存されている。例えばプロ歌手Mは日本語ネイティブの歌手であり、プロ歌手Nは英語ネイティブの歌手である。
また楽曲がハモリボーカルを含むような楽曲である場合には、プロ歌手の歌声データとして、当該プロ歌手によるメインボーカルの歌声データのみならず、当該プロ歌手又は他のプロ歌手によるハモリボーカルの歌声データが別に、プロ歌手歌声保存DB109dに保存される。
(声質変換処理)
図7は、本実施形態に係る楽曲制作支援システムに係るフローチャート2である。
S21:楽曲制作支援サーバ10は、PC20を介して、新人歌手、プロ歌手、楽曲、及び言語の入力を受け付ける。これら入力については、新人歌手情報DB109cに登録された新人歌手の中から、プロ歌手歌声保存DB109dに保存されたプロ歌手の氏名、楽曲、言語の中から選択的に入力することも可能である。
S22:楽曲制作支援サーバ10は、S21で上記入力を受け付けると、プロ歌手歌声保存DB109dに保存された該当のプロ歌手歌声データを、当該新人歌手の声質変換モデル109bを用いて、該当の新人歌手の声質に変換する。より具体的に、プロ歌手歌声データに基づいて抽出されたプロ歌手の歌声特徴量(音声特徴量)を、当該新人歌手の声質変換モデル109bに入力し、出力として新人歌手の声質に変換されたプロ歌手歌声データを得る。
S23:楽曲制作支援サーバ10は、S22で得られた新人歌手の声質に変換後のプロ歌手歌声データを、声質変換歌声データとして、例えば図5(a)に示されるように、当該新人歌手の新人歌手ID、当該プロ歌手のプロ歌手ID、当該楽曲の楽曲IDなどとともに、声質変換歌声保存DB109eに保存する。ここで保存された声質変換後のプロ歌手歌声データは、その声質が当該新人歌手のものであるため、あたかも当該新人歌手が当該プロ歌手相当の歌唱力でもって当該楽曲を歌唱しているように聞こえるボーカル音声データである。
また、上述したように当該楽曲がハモリボーカルを含むような楽曲である場合、プロ歌手の歌声データとして、当該プロ歌手によるメインボーカルの歌声データと、ハモリボーカルの歌声データとがプロ歌手歌声保存DB109dにセットで保存される。この場合、楽曲制作支援サーバ10は、S21で上記入力を受け付けると、当該新人歌手の声質変換モデル109bを用いて、プロ歌手歌声保存DB109dに保存されたメインボーカルの歌声データを当該新人歌手の声質に変換するとともに、ハモリボーカルの歌声データを当該新人歌手の声質に変換することができる。また楽曲制作支援サーバ10は、新人歌手の声質に変換後のメインボーカルのプロ歌手歌声データとハモリボーカルのプロ歌手歌声データとを、声質変換歌声データとして、当該新人歌手の新人歌手ID、当該プロ歌手のプロ歌手ID、当該楽曲の楽曲IDなどとともに、声質変換歌声保存DB109eに保存する。
(編集処理)
図8は、本実施形態に係る楽曲制作支援システムに係るフローチャート3である。
S31:楽曲制作支援サーバ10は、声質変換歌声保存DB109eに保存された声質変換歌声データを対象に各種編集処理を行う。各種編集処理は、例えばターゲットとなる新人歌手の歌声の基本周波数と合わせるためのピッチ調節、ピッチ調節した声質変換後のボーカル(及びハモリボーカル)歌声にリバーブかけたり、ステレオ変換、ノイズ除去などがある。
S32:楽曲制作支援サーバ10は、各種編集処理された声質変換歌声データを、例えば図5(b)に示されるように、楽曲DB109fに当該楽曲に対応して保存されたメロディ・伴奏データとMixし、最終的な楽曲(例えば新人歌手のデビュー曲)を完成させる。
S33:楽曲制作支援サーバ10は、完成させた最終的な楽曲(例えば新人歌手のデビュー曲)を、例えば図5(c)に示されるように、完成楽曲データとして完成楽曲保存DB109gに保存する。その後、完成楽曲データは、例えば新人歌手のデビュー曲として、CDライター50によりCDに焼き付け・包装されたり、音楽データファイルとして音楽配信される。
以下に完成楽曲データにかかる属性情報例を示す。
例1:
・完成楽曲ID:M0001
・新人歌手氏名:A
・新人歌手ID:S0001
・楽曲タイトル:「ルビーめんたい」
・楽曲ID:M0001
・プロ歌手氏名:M
・プロ歌手歌声ID:P0001
・言語:日本語
新人歌手Aのデビュー曲の楽曲タイトルは「ルビーめんたい」である。実際のところは、プロ歌手Mの歌唱力でもって当該楽曲を日本語で歌い上げた歌声が、当該新人歌手のその声質に変換されたものをボーカル音声として制作されたものである。
例1が示すように、完成楽曲データは、プロ歌手の歌唱力でもって当該楽曲を歌い上げた歌声が、当該新人歌手のその声質に変換されたものをボーカル音声として制作されたものである。このため、音程が不安定であったり、ビブラートなどの歌い方ができないなど、歌唱技能の低い新人歌手(歌の下手な新人歌手)であっても、プロの歌手レベルの歌声で、誰でも短期間に低コストで歌手デビューすることが可能となる。
例2:
・完成楽曲ID:M0002
・新人歌手氏名:A
・新人歌手ID:S0001
・楽曲タイトル:「Ruby Mentai」
・楽曲ID:M0001
・プロ歌手氏名:N
・プロ歌手歌声ID:P0002
・言語:英語
新人歌手Aの海外デビュー曲の楽曲タイトルは「Ruby Mentai」(英語歌詞)である。実際のところは、英語ネイティブのプロ歌手Nの歌唱力でもって当該楽曲を英語で歌い上げた歌声が、当該新人歌手のその声質に変換されたものをボーカル音声として制作されたものである。
例2が示すように、プロ歌手の歌声はどんな言語の歌声であっても、そのプロ歌手歌声データが当該言語で歌い上げられた歌声のデータである限り、新人歌手の声質に変換できるため、新人歌手が当該言語を全く話せなくともましてはその言語歌詞を歌い上げられなくとも、新人歌手の声質でプロ歌手の歌声による当該言語歌詞の歌声を制作することが可能である。これにより、当該外国語のプロ歌手から収録した歌声を用いて、新人歌手の声質に変換し、当該外国でCDを販売したり、配信することにより誰でも容易に世界中の国で歌手デビューすることができる。
また、既に日本で知名度のある歌唱力の高い有名歌手であっても、日本以外の外国語が苦手な場合がある。しかしながら、同様に有名歌手の歌声を、当該外国語のプロ歌手から収録した歌声を用いて、外国語歌詞の歌声に変換できるので、日本の有名歌手が世界中の国で容易に歌手デビューすることができる。例えば、某有名プロアニメソング歌手による世界的にも有名となった日本発アニメソングに適用すれば、世界中の人々は同じ有名な歌手の歌声で自国歌詞のアニメソングを聞くことができる。
<応用例>
図9は、本実施形態に係る音楽再生装置の外観例を示す図である。本実施形態に係る音楽再生装置60は、CPU(非図示)、RAM(非図示)、記憶部(非図示)、表示部61、操作部62-64、音楽出力部(非図示)、USBインターフェース65等を有する。
CPUは、操作部から入力される制御信号に基づいて、記憶部に記憶されている各種プログラムを読み出し、RAMのワークエリアに展開し、プログラムを実行する。記憶部には、各種プログラム(制御プログラムや音楽再生プログラム等)、本実施形態に係る楽曲制作支援システム100により作成された「完成楽曲データ」が記憶される。表示部61は、CPUから出力される表示信号に従って、装置の動作状態、再生楽曲及び設定等の各種画面を表示する。
操作部は、電源ON/OFFボタン62、「完成楽曲データ」の再生/停止を切り替える再生ボタン63、再生音量を大小調整する音量調整ボタン64等を備えている。
音楽出力部は、DAコンバータ、アンプ、スピーカー等におり構成され、再生操作された音楽をスピーカーから出力する。USBインターフェース65は、USB規格に従った通信を行う。「完成楽曲データ」は例えばUSBインターフェースを介して記憶部に記憶される。
ここで、図9に示されるように本実施形態に係る再生ボタン63は、2つずつのボタンが対を形成しており、具体的に、再生ボタン63-1a及び再生ボタン63-1b、再生ボタン63-2a及び再生ボタン63-2b、再生ボタン63-3a及び再生ボタン63-3b、再生ボタン63-4a及び再生ボタン63-4の、合計8つのボタンを有している。
そして各々の再生ボタンにはそれぞれ「完成楽曲データ」が1つずつ対応付けられており、ユーザは再生ボタンが押下操作されると、音楽再生装置60は、押下操作された再生ボタンに対応付けられた「完成楽曲データ」を再生する。再生ボタン63-1a及び再生ボタン63-1bに対応付けられた「完成楽曲データ」にかかる属性情報例を示す。
再生ボタン63-1a:
・完成楽曲ID:M0001
・新人歌手氏名:A
・新人歌手ID:S0001
・楽曲タイトル:「ルビーめんたい」
・楽曲ID:M0001
・プロ歌手氏名:M
・プロ歌手歌声ID:P0001
・言語:日本語
再生ボタン63-1b:
・完成楽曲ID:M0002
・新人歌手氏名:A
・新人歌手ID:S0001
・楽曲タイトル:「Ruby Mentai」
・楽曲ID:M0001
・プロ歌手氏名:N
・プロ歌手歌声ID:P0002
・言語:英語
再生ボタン63-1a及び再生ボタン63-1bに対応付けられた「完成楽曲データ」は、いずれも新人歌手Aのデビュー曲の楽曲タイトルは「ルビーめんたい」である。但し、再生ボタン63-1aに対応付けられた「完成楽曲データ」は、プロ歌手Mの歌唱力でもって当該楽曲(日本語歌詞)を日本語で歌い上げた歌声が、当該新人歌手Aのその声質に変換されたものをボーカル音声として制作されたものである。これに対し、再生ボタン63-1bに対応付けられた「完成楽曲データ」は、英語ネイティブのプロ歌手Nの歌唱力でもって当該楽曲(英語歌詞)を英語で歌い上げた歌声が、当該新人歌手Aのその声質に変換されたものをボーカル音声として制作されたものである。
即ち、ユーザが再生ボタン63-1aを押下操作した場合、新人歌手Aの歌声による楽曲タイトル「ルビーめんたい」(日本語歌詞)が再生されるのに対し、ユーザが再生ボタン63-1bを押下操作した場合、新人歌手Aの歌声による楽曲タイトル「Ruby Mentai」(英語歌詞)が再生される。
本実施形態に係る音楽再生装置60によれば、複数(例えば2つ)ずつのボタンが対なした再生ボタン操作により、同一歌手歌声による同一楽曲ではあるもののその歌詞言語を容易に切り替えて選曲・再生し、これを聴くことができる。例えば、同じアニメソングを同じ歌手の歌声で、日本語歌詞で聴いたり、英語などの他言語歌詞で聴くことができる。また繰り返し言語を切り替えて、様々な言語歌詞で聴き比べ、歌詞の意味を理解しながら、真似て歌うことで、様々な言語の発音学習に役立てることも可能である。
なお、本実施形態に係る音楽再生装置60は合計8つのボタンを有しているため、「完成楽曲データ」との対応付けはユーザが任意に設定可能である。8つのボタンの場合における各々のボタンと「完成楽曲データ」との対応付け一例を以下に示す。
・再生ボタン63-1a:楽曲A(日本語歌詞)
・再生ボタン63-1b:楽曲A(英語歌詞)
・再生ボタン63-2a:楽曲B(日本語歌詞)
・再生ボタン63-2b:楽曲B(中国語歌詞)
・再生ボタン63-3a:楽曲C(日本語歌詞)
・再生ボタン63-3b:楽曲C(英語歌詞)
・再生ボタン63-4a:楽曲C(中国語歌詞)
・再生ボタン63-4b:楽曲C(タイ語歌詞)
[実施形態2]
上記実施形態1においては、楽曲制作支援システム100を用いて、歌唱技能の低い新人歌手であっても、プロの歌手レベルの歌声で、誰でも短期間に低コストで歌手デビューする仕組みについて説明した。実施形態2においては、同様の仕組みを用いて、音声演技技能の低い新人声優であっても、プロの声優レベルの演技音声で、誰でも短期間に低コストで声優デビューする仕組みについて説明する。声優とは、アニメ等の映像作品に自身の姿を見せずに声だけで出演し演技する者をいう。広義の意味でナレータも含む。
なお例えば、実施形態1に係る楽曲制作支援システム100、楽曲制作支援サーバ10、新人歌手、プロ歌手などは、実施形態2においては、それぞれ演技音声映像制作支援システム200、演技音声制作支援サーバ70、新人声優、プロ声優に読み替えることができる。
(ソフトウェア構成)
図10は、本実施形態に係る演技音声制作支援サーバのソフトウェア構成例を示す図である。演技音声制作支援サーバ70は、主な機能部として、音声収録部701、声質変換モデル作成部702、入力受付部703、声質変換部704、演技音声編集部705、Mix編集部706、完成映像作品出力部707、及び記憶部709(非図示)を有する。
音声収録部701は、第1声優(新人声優等)の音声データを収録し、第2声優(日本人プロ声優等)及び第3声優(外国人プロ声優等)により歌唱された楽曲の演技音声データを収録する機能を有している。
声質変換モデル作成部702は、第1声優の音声データに基づいて、第1声優の声質変換モデル709bを作成する機能を有している。
入力受付部703は、声質変換処理の実行に際し、新人声優、プロ声優、映像作品、言語など声質変換に関する情報の入力をユーザから受け付ける。
声質変換部704は、第2声優及び第3声優により演技された台本の演技音声データを、第1声優の声質変換モデル709bにより第1声優の声質に変換する機能を有している。
演技音声編集部705は、声質変換演技音声データ(第1声優の声質に変換された台本の演技音声データ)を対象に、各種編集処理を行う機能を有している。
Mix編集部706は、各種編集処理された声質変換演技音声データを対象に、映像データをMixする機能を有している。
完成映像作品出力部707は、各種編集処理、Mixされた声質変換演技音声データ(台本の演技音声データ)を、第1声優により演技された完成映像作品データとして出力する機能を有している。
記憶部709は、事前学習済みベースモデル709a、新人声優の声質変換モデル709b、新人声優情報DB709c、プロ声優演技音声保存DB709d、声質変換歌声保存DB709e、映像作品DB709f、完成映像作品DB709gを記憶する機能を有している。
(声質変換モデル作成処理)
図11は、本実施形態に係る演技音声映像制作支援システムに係るフローチャート1である。演技音声制作支援サーバ70のCPU又はGPUが本フローチャート処理を実現可能なプログラムを読み込んで実行させることで、各ステップを実現することができる。
S51:演技音声制作支援サーバ70は、マイク40を介して、声質変換モデルを作成するための元となる新人声優の音声を収録(取得)する。具体的に、新人声優は所定の台本を例えば数冊程度分朗読する。なお説明上、当該新人声優のその演技力は低いものとする。
S52:演技音声制作支援サーバ70は、収録した新人声優の音声の特徴に基づいて、当該新人声優の声質変換モデル709bを作成する。声質変換モデル作成について具体的には、例えば公知の声質変換による学習と声質変換を適用することができる。
事前学習モデルのベースモデルが存在することで、学習対象の人の大量のデータを用意する必要がなく、数分の音声データがあれば、ターゲットとする新人声優の声質特徴量を精度よく学習することが可能である。なお、本実施形態に係る事前学習済みベースモデル709aは、日本語のみならず多言語における多数の人間の音声を事前学習したものであり、様々な言語の母音子音を学習したベースモデルを利用する。
(プロ声優演技音声保存処理)
予めプロ声優が新人声優の演技音声として制作したい映像作品の台本の台詞を演技することで、プロ声優の演技音声データが、プロ声優演技音声保存DB709dに保存される。
なお、当該プロ声優が日本語台詞の当該台本を演技するとともに、他言語台詞の当該台本を演技することで、他言語化分のプロ声優演技音声データが得られる。なお、当該プロ声優が他言語での当該映像作品の台本演技が困難である場合、他のプロ声優が他言語で当該台本演技を行うことにより、他言語化分のプロ声優演技音声データを得てもよい。
(声質変換処理)
図12は、本実施形態に係る演技音声映像制作支援システムに係るフローチャート2である。
S61:演技音声制作支援サーバ70は、PC20を介して、新人声優、プロ声優、台本、及び言語の入力を受け付ける。なおこれら入力については、新人声優情報DB709cに登録された新人声優の中から、プロ声優演技音声保存DB709dに保存されたプロ声優の氏名、台本、言語の中から選択的に入力することが可能である。
S62:演技音声制作支援サーバ70は、S61で上記入力を受け付けると、プロ声優演技音声保存DB709dに保存されたプロ声優演技音声データを、当該新人声優の声質変換モデル709bを用いて、新人声優の声質に変換する。
S63:演技音声制作支援サーバ70は、S62で得られた新人声優の声質に変換後のプロ声優演技音声データを、声質変換演技音声データとして、当該新人声優の新人声優ID、当該プロ声優のプロ声優ID、当該台本の台本IDなどとともに、声質変換演技音声保存DB709eに保存する。ここで保存された声質変換後の演技音声は、その声質が当該新人声優のものであるため、あたかも当該新人声優が当該プロ声優相当の演技力でもって当該台本を演技しているように聞こえる演技音声である。
(編集処理)
図13は、本実施形態に係る演技音声映像制作支援システムに係るフローチャート3である。
S71:演技音声制作支援サーバ70は、声質変換演技音声保存DB709eに保存された声質変換演技音声データを対象に各種編集処理を行う。各種編集処理は、例えばノイズ除去などがある。
S72:演技音声制作支援サーバ70は、各種編集処理された声質変換演技音声データを、映像作品DB709fに当該台本に対応して保存された映像データと効果音やBGMとMixし、最終的な映像作品を完成させる。
本実施形態によれば、プロ声優の演技力でもって当該台本を読み上げた演技音声が、当該新人声優のその声質に変換されたものを演技音声とした完成映像作品データが制作される。このため、抑揚が不安定であったり、滑舌がよくないなど、演技技能の低い新人声優であっても、プロの声優レベルの演技音声で、誰でも短期間に低コストで声優デビューすることが可能となる。
また、プロ声優の演技音声はどんな言語台詞の演技音声であっても、そのプロ声優演技音声データが当該言語台詞で読み上げられた演技音声のデータである限り、新人声優の声質に変換できるため、新人声優が当該言語台詞の台本を全く読めなくとも、新人声優の声質でプロ歌声優レベルの当該言語の演技音声を制作することが可能である。これにより、外国語のプロ声優から収録した外国語による演技音声を用いて、新人声優の声質に変換し、当該外国で映像作品を販売したり、配信することにより誰でも容易に世界中の国で声優デビューすることができる。
また、既に日本で知名度のある歌唱力の高い有名声優であっても、日本以外の外国語が苦手な場合がある。しかしながら、同様に有名声優の音声を、当該外国語が堪能なプロ声優から収録した演技音声を用いて、外国語発話による演技音声に変換できるので、日本の有名声優が世界中の国で容易に声優デビューすることができる。
[実施形態3]
実施形態3においては、上記実施形態1に係る楽曲制作支援システム100を変形して、実在しない歌手(以下、仮想歌手と呼ぶ)の声質変換モデルを作成し、バーチャルな実在しない人物を歌手デビューさせるものである。
図14は、本実施形態に係る楽曲制作支援システムのシステム構成例を示す図である。図14の楽曲制作支援システム300は、楽曲制作支援サーバ80、PC20、プロ歌手のマイク30、複数人の歌手らのマイク40、及びCDライター50を含み構成されている。
楽曲制作支援サーバ10は、予め歌唱技能の高い歌手(以下例えばプロ歌手と呼ぶ)のボーカル歌声を用意しておくとともに、声質変換技術により、ターゲット歌手(実在しない仮想歌手)の声質特徴を抽出し、プロ歌手のボーカル歌声をターゲットの仮想歌手の声質に変換することにより、ターゲット歌手のための楽曲制作支援を行うサーバ装置である。また楽曲制作支援サーバ80は、声質変換後の歌声をターゲット歌手の歌声の基本周波数と合わせるためのピッチ調節、ピッチ調節した声質変換後のボーカル(及びハモリボーカル)にリバーブかけたり、ステレオ変換、ノイズ除去など編集し、メロディや伴奏とMixし、最終的な楽曲(例えば仮想歌手のデビュー曲)を完成させる。
プロ歌手は、当該プロ歌手のボーカル歌声を予め用意する目的で、レコーディング、即ちマイク30を用いて、仮想歌手の楽曲として発売させたい楽曲(例えば仮想歌手のデビュー曲)そのものを歌唱することで、プロ歌手の歌声を収録保存する。なお、プロ歌手のボーカル歌声について、プロ歌手が実際に歌唱した歌声に代えて、従来の歌声生成ソフト等で生成されたボーカル歌声でもよい。この場合、例えばプロ歌手であっても人間が歌えない音域や歌唱テクニックのボーカル歌声を作成することができる。
歌手A、B、C、D・・は、仮想歌手の声質変換モデルを作成する目的で、マイク40を用いてこれら歌手らの歌声(サンプル)を収録保存する。
図15は、本実施形態に係る楽曲制作支援サーバのソフトウェア構成例を示す図である。楽曲制作支援サーバ80は、主な機能部として、歌声収録部101、仮想声質変換モデル作成部102-2、入力受付部103、声質変換部104、歌声編集部105、Mix編集部106、完成楽曲出力部107、及び記憶部109(非図示)を有する。図15に示す楽曲制作支援サーバのソフトウェア構成例は、図3と比べると、仮想声質変換モデル作成部102-2及び仮想歌手の声質変換モデル109b-2の点で異なっている。また新人歌手情報DB109cが仮想歌手情報DB109c-2となっている。
実在しない仮想歌手の仮想歌手の声質変換モデル109b-2を作成する方法は、例えば以下の通りである。
・楽曲制作支援サーバ10(歌声収録部101)は、マイク40を介して、声質変換モデルを作成するための元となる複数人分の実在する歌手A、B、C、D・・の歌声を収録(取得)する。その後楽曲制作支援サーバ10(仮想声質変換モデル作成部102-2)は、収録した複数人分の歌手の歌声の特徴に基づいて、当該歌手らの声質変換モデルをそれぞれ人数分作成する。そして複数人分歌手の声質変換モデルを、所定割合(例えば4:3:2:1等)を決めてマージ(混ぜる)し、仮想歌手の声質変換モデル109b-2を作成すると、実在しない声質変換モデルを作成することができる。
・楽曲制作支援サーバ10(歌声収録部101)は、マイク40を介して、声質変換モデルを作成するための元となる複数人分の実在する歌手A、B、C、D・・の歌声を収録(取得)する。その後楽曲制作支援サーバ10(仮想声質変換モデル作成部102-2)は、収録した複数人分の歌手の歌声データを混ぜて学習し、仮想歌手の声質変換モデル109b-2を作成することができる。
・また、上記実在する歌手A、B、C、D・・の歌声に代えて、従来の歌声生成ソフト等で生成された仮想歌手A’、B’、C’、D’・・における複数人分の合成歌声を使用してもよい。
・また、実在する歌手の歌声と従来の歌声生成ソフト等で生成された合成歌声とを混ぜて、上記3例のように声質変換モデルを作成してもよい。
仮想歌手の声質変換モデル109b-2の作成以降、実施形態3に係る楽曲制作支援システム300においては、実施形態1に係る新人歌手を仮想歌手に読み替えることにより、図6-8に示したS2~S33のフローチャートを同様に実施可能であるため、繰り返しの説明は省略する。
本実施形態によれば、プロ歌手の歌唱力でもって当該楽曲を歌い上げた歌声が、実在しない仮想歌手のその声質に変換されたものをボーカル音声とした完成楽曲データが制作される。プロの歌手レベルの歌声で、短期間に低コストで実在しない歌手をデビューさせることが可能となる。こうしてデビューした仮想歌手(アンドロイド歌手ともいえる)及び楽曲は、特定歌手に依存しないため、楽曲視聴における趣向性向上は勿論のこと、著作権等の権利関係調整のハードルが低下しその用途可能性を広げることが可能である。
以上、本実施形態によれば、一つの側面において、歌唱技量や演技技量等の未熟者に対するデビュー機会を拡大することが可能である。なお、本発明の好適な実施の形態により、特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
本発明によって制作された声質変換された歌声を、事前学習モデル生成に加えたり、声質変換モデルの学習データに加えたり、プロ歌手の歌声に加えてもよい。また、本発明により実在しない人間の声質変換モデルを作成して、演技音声制作支援サーバを用いれば、実在しない人間を仮想声優としてデビューさせることもできる。また、歌唱力が未熟な俳優や声優が、映画、テレビドラマ、アニメの中で歌うシーンがある場合、本発明により当該俳優や声優の声質変換モデルを作成し、プロ歌手の歌声を当該俳優や声優の声質に歌声を変換して、その歌声を映像制作に使用することもできる。
10、80 楽曲制作支援サーバ
20 PC
30、40 マイク
50 CDライター
70 演技音声制作支援サーバ
100、300 楽曲制作支援システム
200 演技音声映像制作支援システム
101 歌声収録部
102 声質変換モデル作成部
103 入力受付部
104 声質変換部
105 歌声編集部
106 Mix編集部
107 完成楽曲出力部
108 歌声合成部
109 記憶部
701 音声収録部
702 声質変換モデル作成部
703 入力受付部
704 声質変換部
705 演技音声編集部
706 Mix編集部
707 完成映像作品出力部
709 記憶部

Claims (8)

  1. 第1歌手の歌声データを収録する第1歌声収録手段、
    前記第1歌手の歌声データに基づいて、前記第1歌手の声質変換モデルを作成する声質変換モデル作成手段、
    第2歌手により第1言語で歌唱された楽曲の第1言語歌声データを収録し、前記第2歌手又は第3歌手により第2言語で歌唱された前記楽曲の第2言語歌声データを収録する第2歌声収録手段、
    前記第1言語歌声データ及び前記第2言語歌声データを、前記第1歌手の声質変換モデルにより前記第1歌手の声質にそれぞれ変換する声質変換手段、
    として機能させるための楽曲制作支援プログラム。
  2. 前記声質変換手段により前記第1歌手の声質に変換された前記第1言語歌声データ及び前記第2言語歌声データに、メロディ又は伴奏データをMixする編集手段、
    前記編集手段によりMixされた前記第1言語歌声データ及び前記第2言語歌声データを、前記第1歌手により第1言語で歌唱された第1言語楽曲データ及び前記第1歌手により第2言語で歌唱された第2言語楽曲データとして出力する出力手段、
    として機能させるための請求項1に記載の楽曲制作支援プログラム。
  3. 前記出力手段は、前記第1言語歌声データ及び前記第2言語歌声データを、外部記憶媒体に記憶する記憶装置又は外部サーバに配信する通信装置を含む、
    請求項2に記載の楽曲制作支援プログラム。
  4. 前記楽曲は、アニメソングである、
    請求項1に記載の楽曲制作支援プログラム。
  5. 前記第1歌声収録手段は、
    複数の歌声データを収録し、
    前記声質変換モデル作成手段は
    前記複数の歌声データに基づいて、実在しない前記第1歌手の声質変換モデルを作成する、
    請求項1に記載の楽曲制作支援プログラム。
  6. 請求項に記載の楽曲制作支援プログラムにより出力された前記第1言語楽曲データ及び前記第2言語楽曲データを記憶した記憶部と、
    前記第1言語楽曲データと対応付けられた第1言語再生操作部と、
    前記第2言語楽曲データと対応付けられた第2言語再生操作部と、
    前記第1言語再生操作部が操作された場合に前記第1言語楽曲を再生し、前記第2言語再生操作部が操作された場合に前記第2言語楽曲を再生する音楽出力部と、
    を備える音楽再生装置。
  7. 第1歌手の歌声データを収録する第1歌声収録手段と、
    前記第1歌手の歌声に基づいて、前記第1歌手の声質変換モデルを作成する声質変換モデル作成手段と、
    第2歌手により第1言語で歌唱された楽曲の第1言語歌声データを収録し、前記第2歌手又は第3歌手により第2言語で歌唱された前記楽曲の第2言語歌声データを収録する第2歌声収録手段と、
    前記第1言語歌声データ及び前記第2言語歌声データを、前記第1歌手の声質変換モデルにより前記第1歌手の声質にそれぞれ変換する声質変換手段と、
    を有することを特徴とする楽曲制作支援装置。
  8. 楽曲制作支援装置が、
    第1歌手の歌声データを収録する第1歌声収録ステップと、
    前記第1歌手の歌声に基づいて、前記第1歌手の声質変換モデルを作成する声質変換モデル作成ステップと、
    第2歌手により第1言語で歌唱された楽曲の第1言語歌声データを収録し、前記第2歌手又は第3歌手により第2言語で歌唱された前記楽曲の第2言語歌声データを収録する第2歌声収録ステップと、
    前記第1言語歌声データ及び前記第2言語歌声データを、前記第1歌手の声質変換モデルにより前記第1歌手の声質にそれぞれ変換する声質変換ステップと、
    を実行することを特徴とする楽曲制作支援方法。
JP2023177135A 2023-10-12 2023-10-12 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置 Active JP7503870B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023177135A JP7503870B1 (ja) 2023-10-12 2023-10-12 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023177135A JP7503870B1 (ja) 2023-10-12 2023-10-12 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置

Publications (1)

Publication Number Publication Date
JP7503870B1 true JP7503870B1 (ja) 2024-06-21

Family

ID=91538830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023177135A Active JP7503870B1 (ja) 2023-10-12 2023-10-12 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置

Country Status (1)

Country Link
JP (1) JP7503870B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010014913A (ja) 2008-07-02 2010-01-21 Panasonic Corp 声質変換音声生成装置および声質変換音声生成システム
JP2018005048A (ja) 2016-07-05 2018-01-11 クリムゾンテクノロジー株式会社 声質変換システム
JP2023013684A (ja) 2021-07-16 2023-01-26 クリムゾンテクノロジー株式会社 歌唱声質変換プログラム及び歌唱声質変換装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010014913A (ja) 2008-07-02 2010-01-21 Panasonic Corp 声質変換音声生成装置および声質変換音声生成システム
JP2018005048A (ja) 2016-07-05 2018-01-11 クリムゾンテクノロジー株式会社 声質変換システム
JP2023013684A (ja) 2021-07-16 2023-01-26 クリムゾンテクノロジー株式会社 歌唱声質変換プログラム及び歌唱声質変換装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Songxiang LIU et al.,FastSVC: Fast Cross-Domain Singing Voice Conversion with Feature-Wise Linear Modulation,2021 IEEE International Conference on Multimedia and Expo (ICME),2021年06月09日,DOI: 10.1109/ICME51207.2021.9428161

Similar Documents

Publication Publication Date Title
KR102500087B1 (ko) 오디오 합성 방법, 저장 매체 및 컴퓨터 장비
Corey Audio production and critical listening: Technical ear training
Zagorski-Thomas The stadium in your bedroom: functional staging, authenticity and the audience-led aesthetic in record production
JP3102335B2 (ja) フォルマント変換装置およびカラオケ装置
US9601029B2 (en) Method of presenting a piece of music to a user of an electronic device
Bates Mixing for parlak and bowing for a büyük ses: the aesthetics of arranged traditional music in Turkey
JP6106397B2 (ja) カラオケ装置、及びコンピュータプログラム
JP7503870B1 (ja) 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置
Case Mix smart: Professional techniques for the home studio
JP2023013684A (ja) 歌唱声質変換プログラム及び歌唱声質変換装置
KR100383061B1 (ko) 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법
Cafaro The Evolution of Singing in the Age of Audio Technology.
JP7468111B2 (ja) 再生制御方法、制御システムおよびプログラム
Keelaghan Performing Percussion in an Electronic World: An Exploration of Electroacoustic Music with a Focus on Stockhausen's" Mikrophonie I" and Saariaho's" Six Japanese Gardens"
Bevins Computer technology in modern music: a study of current tools and how musicians use them
Cushing Three solitudes and a DJ: A mashed-up study of counterpoint in a digital realm
JP4716192B2 (ja) 語学学習システム及び語学学習用プログラム
Wells The Crossings: Defining Slave to the Rhythm
Salas Camilo D Salas, Basics of Music Production (Audio Workshop for visually impaired musicians)
Barlindhaug The Kids Want Noise-How Sonic Mediations Change the Aesthetics of Music
Vaitiekūnas Electronic Soundscapes: Field Recordings in performances of Dub Techno and Ambient music.
Wilson An Autoethnography on Film Composition Practice: Integrating Virtual Instruments and the Live Performance Realisation within the DAW
JP3565065B2 (ja) カラオケ装置
Purwacandra et al. Optimization of MIDI Synthesizer On The Illustration of Movie Music
KR20230099934A (ko) 복수의 화자음성을 이용한 음성 변환 장치 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231012

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240604

R150 Certificate of patent or registration of utility model

Ref document number: 7503870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150