JP2016071187A - 音声合成装置、及び音声合成システム - Google Patents
音声合成装置、及び音声合成システム Download PDFInfo
- Publication number
- JP2016071187A JP2016071187A JP2014201116A JP2014201116A JP2016071187A JP 2016071187 A JP2016071187 A JP 2016071187A JP 2014201116 A JP2014201116 A JP 2014201116A JP 2014201116 A JP2014201116 A JP 2014201116A JP 2016071187 A JP2016071187 A JP 2016071187A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- singing
- sound source
- note
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】カラオケ装置が実行する音声合成処理では、歌唱音声データを取得し(S520)、その取得した歌唱音声データに基づいて、入力声質、及び入力歌回を導出する(S530,S540)。そして、記憶装置に記憶された声質歌回データの中で、入力声質及び入力歌回との類似度が基準値以上である声質特徴量及び歌回特徴量を含む声質歌回データに含まれる歌唱者識別情報を特定する(S550)。さらに、記憶装置に記憶された音源データの中から、S550にて特定した歌唱者識別情報を含む音源データを取得し、その取得した音源データに含まれる音源音声データとS510で取得した歌唱音声データとに従って、指定楽曲を歌唱した歌唱音声を音声合成にて生成して出力する(S580,S590)。
【選択図】図5
Description
そこで、本発明は、利用者の声質に類似し、その利用者の歌い方の特徴を真似した歌声を合成する技術の提供を目的とする。
本発明における音声データ取得手段は、音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲を歌唱した歌唱音声データを取得する。分析手段は、その音声データ取得手段で取得した歌唱音声データの声質の特徴量を表す入力声質、及び歌唱音声データの振幅及び基本周波数の少なくともいずれか一方の楽曲を構成する音符の区間内での推移(歌い回し、以下、歌回と称す)を表す入力歌回を導出する。
本発明は、音声データ取得手段と、分析手段と、検索手段と、合成手段とを備えた音声合成システムとしてなされていても良い。
さらに、本発明における検索手段は、類似度が最も高いものから予め規定された規定数までであることを、規定条件を満たすこととして、特定識別情報を特定しても良い。
本発明においては、指定楽曲を構成しかつ歌詞が割り当てられている音符の中で、音声データ取得手段で取得した歌唱音声データによって歌唱された音符を歌唱音符とし、指定楽曲を構成しかつ歌詞が割り当てられている音符の中で、歌唱音符以外の音符を非歌唱音符としても良い。
取得手段は、ボーカル音を含む楽曲の演奏音の音声波形と、そのボーカル音の発声者を表す識別情報を歌唱者識別情報として少なくとも含む楽曲データを取得する。また、抽出手段は、取得手段により取得された楽曲データに含まれるボーカル音を音源音声データとして抽出する。
<音声合成システム>
図1に示す音声合成システム1は、ユーザが指定した楽曲(以下、指定楽曲と称す)を歌唱した合成音声を、ユーザに類似する声にて生成して出力するシステムである。
情報処理装置2は、人が発声した音声を含む音声波形データWD及びその発声した内容を表すMIDI楽曲MDに基づいて、合成音声の生成(即ち、音声合成)に必要な音源データSDを生成する。
カラオケ装置30は、情報処理サーバ10に記憶されたMIDI楽曲MDを演奏すると共に、そのMIDI楽曲MDに対応する楽曲を歌唱した合成音声を、音源データSDに従って生成して出力する。なお、音声合成システム1は、複数のカラオケ装置30を備えている。
<音声波形データ>
音声波形データWDは、楽曲を演奏した演奏音を表す音声データであり、当該楽曲に関する情報が記述された楽曲管理情報と対応付けられている。楽曲管理情報には、楽曲を識別する楽曲識別情報(以下、楽曲IDと称す)が含まれる。
<MIDI楽曲>
MIDI楽曲MDは、楽曲ごとに予め用意されたものであり、楽曲データと、歌詞データとを有している。
<情報処理装置>
情報処理装置2は、入力受付部3と、外部出力部4と、記憶部5と、制御部6とを備えた周知の情報処理装置(例えば、パーソナルコンピュータ)である。
<情報処理サーバ>
情報処理サーバ10は、通信部12と、記憶部14と、制御部16とを備えている。
<カラオケ装置>
カラオケ装置30は、通信部32と、入力受付部34と、楽曲再生部36と、記憶部38と、音声制御部40と、映像制御部46と、制御部50とを備えている。
<音源データ生成処理>
情報処理装置2の制御部6が実行する音源データ生成処理について説明する。
さらに、音源データ生成処理では、制御部6は、音符ボーカルVo(a,i)のそれぞれに、複数の分析窓を設定する(S150)。このS150での分析窓の設定では、制御部6は、複数個の分析窓が時間軸に沿って互いに隣接するように設定する。この分析窓は、音符NO(a,i)の時間長よりも短い時間長を有した区間である。
<音声合成処理>
次に、カラオケ装置30の制御部50が実行する音声合成処理について説明する。
音声合成処理では、続いて、制御部50は、マイク入力部44に接続されたマイク62を介して入力された音声の波形を表す歌唱音声データを取得する(S520)。このS520にて取得する歌唱音声データは、指定楽曲における一部の区間を、カラオケ装置の利用者が歌唱した音声である。
入力声質Ykは、母音ごとのメル周波数ケプストラム(MFCC)を表した声質特徴量である。この入力声質Ykの算出手法は、「音符ボーカルVo」を「歌唱音声データ」へと読み替えることを除けば、音源データ生成処理におけるS150、及びS180と同様であるため、ここでの詳しい説明は省略する。
具体的に、本実施形態のS580では、制御部50は、予め規定された設定条件を満たしていれば、S550で特定した歌唱者IDを含む音源データSDを取得する。そして、制御部50は、その取得した音源データSDに含まれる音符ボーカルVoに従って、現時点で合成音声を生成すべき音符に割り当てられた歌詞を歌唱した歌唱音声を音声合成にて生成する。ここで言う設定条件とは、現時点で合成音声を生成すべき音符の音符プロパティpが、S520にて取得した歌唱音声データによって表される音声に発した音符の音符プロパティpと不一致であることである。
[実施形態の効果]
以上説明したように、本実施形態の音声合成処理においては、歌唱音声データを分析し、その歌唱音声データを生成するための歌唱を実施した人物(即ち、利用者)の声質や歌い方の特徴を特定する。そして、その特定した利用者の声質や歌い方の特徴に類似し、当該利用者とは異なる他の人物の音声から生成した音源データを特定し、その特定した音源データを、歌唱音声を生成する音声合成の音源の少なくとも一部として利用する。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
Claims (5)
- 音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲を歌唱した歌唱音声データを取得する音声データ取得手段と、
前記音声データ取得手段で取得した歌唱音声データの声質の特徴量を表す入力声質、及び前記歌唱音声データの振幅及び基本周波数の少なくともいずれか一方の前記楽曲を構成する音符の区間内での推移を表す入力歌回を導出する分析手段と、
音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に割り当てられた歌詞を発声した音声波形を表し前記発声した人が互いに異なる音源音声データごとに導出され、前記音源音声データにおける声質の特徴量である声質特徴量と、前記音源音声データの振幅及び基本周波数の少なくともいずれか一方の当該音源音声データでの音符に対応する音符対応区間内での推移を表す歌回特徴量と、前記発声した人を識別する歌唱者識別情報とを対応付けた声質歌回データであって第1記憶装置に記憶された声質歌回データの中で、前記分析手段で導出した入力声質及び入力歌回との類似度が、予め規定された基準値以上であることを含む規定条件を満たす前記声質特徴量及び前記歌回特徴量を含む声質歌回データに含まれる歌唱者識別情報を特定する検索手段と、
前記音源音声データが前記歌唱者識別情報ごとに対応付けられた音源データであって第2記憶装置に記憶された音源データの中から、前記検索手段で特定した歌唱者識別情報である特定識別情報を含む音源データを取得し、その取得した音源データに含まれる音源音声データと前記音声データ取得手段で取得した歌唱音声データとに従って、指定された楽曲である指定楽曲を歌唱した歌唱音声を音声合成にて生成して出力する合成手段と
を備えることを特徴とする音声合成装置。 - 音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲を歌唱した歌唱音声データを取得する音声データ取得手段と、
前記音声データ取得手段で取得した歌唱音声データの声質の特徴量を表す入力声質、及び前記歌唱音声データの振幅及び基本周波数の少なくともいずれか一方の前記楽曲を構成する音符の区間内での推移を表す入力歌回を導出する分析手段と、
音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に割り当てられた歌詞を発声した音声波形を表し前記発声した人が互いに異なる音源音声データごとに導出され、前記音源音声データにおける声質の特徴量である声質特徴量と、前記音源音声データの振幅及び基本周波数の少なくともいずれか一方の当該音源音声データでの音符に対応する音符対応区間内での推移を表す歌回特徴量と、前記発声した人を識別する歌唱者識別情報とを対応付けた声質歌回データであって第1記憶装置に記憶された声質歌回データの中で、前記分析手段で導出した入力声質及び入力歌回との類似度が、予め規定された基準値以上であることを含む規定条件を満たす前記声質特徴量及び前記歌回特徴量を含む声質歌回データに含まれる歌唱者識別情報を特定する検索手段と、
前記音源音声データが前記歌唱者識別情報ごとに対応付けられた音源データであって第2記憶装置に記憶された音源データの中から、前記検索手段で特定した歌唱者識別情報である特定識別情報を含む音源データを取得し、その取得した音源データに含まれる音源音声データと前記音声データ取得手段で取得した歌唱音声データとに従って、指定された楽曲である指定楽曲を歌唱した歌唱音声を音声合成にて生成して出力する合成手段と
を備えることを特徴とする音声合成システム。 - 前記検索手段は、
前記類似度が最も高いものから予め規定された規定数までであることを、前記規定条件を満たすこととして、前記特定識別情報を特定する
ことを特徴とする請求項2に記載の音声合成システム。 - 前記合成手段は、
前記指定楽曲を構成しかつ歌詞が割り当てられている音符の中で、前記音声データ取得手段で取得した歌唱音声データによって歌唱された音符を歌唱音符とし、前記指定楽曲を構成しかつ歌詞が割り当てられている音符の中で、前記歌唱音符以外の音符を非歌唱音符とし、
前記音声データ取得手段で取得した歌唱音声データに基づいて音声合成することで、前記歌唱音符に割り当てられた歌詞の歌唱音声を生成し、前記検索手段で特定し、かつ、前記特定識別情報と対応付けられた前記音源音声データに基づいて音声合成することで、前記非歌唱音符に割り当てられた歌詞の歌唱音声を生成する
ことを特徴とする請求項3に記載の音声合成システム。 - ボーカル音を含む楽曲の演奏音の音声波形と、そのボーカル音の発声者を表す識別情報を前記歌唱者識別情報として少なくとも含む楽曲データを取得する取得手段と、
前記取得手段により取得された楽曲データに含まれる前記ボーカル音を前記音源音声データとして抽出する抽出手段と、
前記抽出手段で抽出した音源音声データのうち、前記音符対応区間それぞれに対応する前記音源音声データの区間である音符ボーカルを特定する特定手段と、
前記特定手段にて特定した前記音符ボーカルの振幅及び基本周波数の少なくともいずれか一方の前記音符対応区間内での推移を前記歌回特徴量として導出する第1導出手段と、
前記特定手段にて特定した前記音符ボーカルごとに、各音符ボーカルにおける声質の特徴量を導出し、前記声質の特徴量の代表値を前記声質特徴量として導出する第2導出手段と、
前記第1導出手段で導出された歌回特徴量と、前記第2導出手段で導出された声質特徴量と、前記歌唱者識別情報とを対応付けることで前記声質歌回データを生成する生成手段と、
前記生成手段で生成された声質歌回データを、前記第1記憶装置に記憶する記憶制御手段と
を備えることを特徴とする請求項2から請求項4までのいずれか一項に記載の音声合成システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014201116A JP6252420B2 (ja) | 2014-09-30 | 2014-09-30 | 音声合成装置、及び音声合成システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014201116A JP6252420B2 (ja) | 2014-09-30 | 2014-09-30 | 音声合成装置、及び音声合成システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016071187A true JP2016071187A (ja) | 2016-05-09 |
JP6252420B2 JP6252420B2 (ja) | 2017-12-27 |
Family
ID=55866776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014201116A Active JP6252420B2 (ja) | 2014-09-30 | 2014-09-30 | 音声合成装置、及び音声合成システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6252420B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562633A (zh) * | 2020-11-30 | 2021-03-26 | 北京有竹居网络技术有限公司 | 一种歌唱合成方法、装置、电子设备及存储介质 |
CN113781993A (zh) * | 2021-01-20 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 定制音色歌声的合成方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10177396A (ja) * | 1996-12-18 | 1998-06-30 | Brother Ind Ltd | 音声合成装置及び発音訓練装置 |
JP2007256618A (ja) * | 2006-03-23 | 2007-10-04 | Yamaha Corp | 検索装置 |
JP2007304489A (ja) * | 2006-05-15 | 2007-11-22 | Yamaha Corp | 楽曲練習支援装置、制御方法及びプログラム |
JP2009244790A (ja) * | 2008-03-31 | 2009-10-22 | Daiichikosho Co Ltd | 歌唱指導機能を備えるカラオケシステム |
JP2011013454A (ja) * | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
-
2014
- 2014-09-30 JP JP2014201116A patent/JP6252420B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10177396A (ja) * | 1996-12-18 | 1998-06-30 | Brother Ind Ltd | 音声合成装置及び発音訓練装置 |
JP2007256618A (ja) * | 2006-03-23 | 2007-10-04 | Yamaha Corp | 検索装置 |
JP2007304489A (ja) * | 2006-05-15 | 2007-11-22 | Yamaha Corp | 楽曲練習支援装置、制御方法及びプログラム |
JP2009244790A (ja) * | 2008-03-31 | 2009-10-22 | Daiichikosho Co Ltd | 歌唱指導機能を備えるカラオケシステム |
JP2011013454A (ja) * | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562633A (zh) * | 2020-11-30 | 2021-03-26 | 北京有竹居网络技术有限公司 | 一种歌唱合成方法、装置、电子设备及存储介质 |
CN113781993A (zh) * | 2021-01-20 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 定制音色歌声的合成方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6252420B2 (ja) | 2017-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6060867B2 (ja) | 情報処理装置,データ生成方法,及びプログラム | |
JP5598516B2 (ja) | カラオケ用音声合成システム,及びパラメータ抽出装置 | |
JP2022120188A (ja) | 楽曲再生システム、楽曲再生システムの制御方法およびプログラム | |
JP6252420B2 (ja) | 音声合成装置、及び音声合成システム | |
JP6098422B2 (ja) | 情報処理装置、及びプログラム | |
JP2017181793A (ja) | 音響処理装置、及びプログラム | |
JP6075314B2 (ja) | プログラム,情報処理装置,及び評価方法 | |
JP6260565B2 (ja) | 音声合成装置、及びプログラム | |
JP2013210501A (ja) | 素片登録装置,音声合成装置,及びプログラム | |
JP6075313B2 (ja) | プログラム,情報処理装置,及び評価データ生成方法 | |
JP6056799B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP6406182B2 (ja) | カラオケ装置、及びカラオケシステム | |
JP6365483B2 (ja) | カラオケ装置,カラオケシステム,及びプログラム | |
JP6011506B2 (ja) | 情報処理装置,データ生成方法,及びプログラム | |
JP6252517B2 (ja) | 音声合成装置、及びプログラム | |
JP6260499B2 (ja) | 音声合成システム、及び音声合成装置 | |
JP5983670B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP6380305B2 (ja) | データ生成装置、カラオケシステム、及びプログラム | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JP6281447B2 (ja) | 音声合成装置,及び音声合成システム | |
JP6365561B2 (ja) | カラオケシステム、カラオケ装置、及びプログラム | |
JP5845857B2 (ja) | パラメータ抽出装置、音声合成システム | |
JP6252408B2 (ja) | 表示制御装置,及び表示制御システム | |
JP2016071188A (ja) | 採譜装置、及び採譜システム | |
KR101321446B1 (ko) | 음성 인식을 이용한 가사 표시 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6252420 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |