JP6075313B2 - プログラム,情報処理装置,及び評価データ生成方法 - Google Patents
プログラム,情報処理装置,及び評価データ生成方法 Download PDFInfo
- Publication number
- JP6075313B2 JP6075313B2 JP2014060253A JP2014060253A JP6075313B2 JP 6075313 B2 JP6075313 B2 JP 6075313B2 JP 2014060253 A JP2014060253 A JP 2014060253A JP 2014060253 A JP2014060253 A JP 2014060253A JP 6075313 B2 JP6075313 B2 JP 6075313B2
- Authority
- JP
- Japan
- Prior art keywords
- note
- data
- music
- singing
- vocal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Auxiliary Devices For Music (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
この種の歌唱評価技術として、歌唱音声における音高の推移に基づく基準点数に、付加点数を加えた評価点数を算出する技術が提案されている。この種の歌唱評価技術における基準点数は、歌唱旋律を構成する音符ごとに規定された1つの音高を表すリファレンスデータと、歌唱音声における音高とのズレが小さいほど高い点数となるように算出される。また、付加点数は、歌唱音声から検出した歌唱技巧(例えば、しゃくりやこぶしなど)の回数が多いほど高い点数となるように算出される。
そこで、本発明は、楽曲における歌手特有の特徴を表現して歌唱することを評価可能な評価データを提供することを目的とする。
ここで、例えば、情報処理装置の利用者が、評価データを生成するために用いた楽曲とは異なる楽曲について歌唱した歌声を、評価データを用いて評価する場合を想定する。この場合、利用者が歌唱した楽曲の各音符について、評価データにおける特徴変化量と、歌声から検出した音符それぞれでの振幅または基本周波数の推移との相関が高いほど、情報処理装置の利用者は、歌手特有の歌い方の特徴を表現できていると言える。
楽譜データには、音符の音高が含まれる。この場合、本発明のプログラムにおいては、対応付ステップを、コンピュータにさらに実行させても良い。この対応付ステップでは、第2取得ステップで取得した楽譜データに含まれる音符の音高及び第1時間長と、第1決定ステップで決定された特徴変化量とを、対応する音符ごとに対応付ける。
ここで、楽曲における音符のうちの1つを対象音符と称し、楽曲における時間軸に沿って対象音符の直前の音符を前音符と称し、楽曲における時間軸に沿って対象音符の直後の音符を後音符と称す。
また、本発明における第1決定ステップでは、設定ステップと、変化量決定ステップとをコンピュータに実行させても良い。設定ステップでは、音符ボーカルデータに、少なくとも2つ以上の分析窓を時間軸に沿って連続するように設定する。変化量決定ステップでは、設定ステップにて音符ボーカルデータに設定された分析窓それぞれにおける音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の値を決定し、その決定した分析窓それぞれにおける音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の値を時間軸に沿って配置することで、特徴変化量を決定する。
本発明のプログラムにおいては、歌唱取得ステップと、第2特定ステップと、第2決定ステップと、評価決定ステップとをコンピュータにさらに実行させても良い。
本発明は、第1取得手段と、抽出手段と、第2取得手段と、特定手段と、決定手段と、生成手段とを備えた情報処理装置としてなされていても良い。
なお、本発明は、第1取得手順と、抽出手順と、第2取得手順と、特定手順と、決定手順と、生成手順とを情報処理装置が実行する評価データ生成方法としてなされていても良い。
すなわち、本発明としての情報処理装置や評価データ生成方法によって生成された評価データを用いて歌声を評価すれば、その評価結果を、楽曲を歌唱したプロの歌手特有の歌い方における特徴の表現を評価したものとすることができる。
〈システム構成〉
図1に示すカラオケ装置30は、ユーザが指定した楽曲を演奏すると共に、その楽曲の演奏中にユーザが歌唱した歌唱音声を評価する装置である。このカラオケ装置30において実行される評価は、指定した楽曲において表現されるプロの歌手の歌い方における特徴を、ユーザが歌唱音声によって表現している度合いである。
情報処理装置3は、楽曲ごとに用意された楽曲データWD及びMIDI楽曲MDに基づいて、基準特徴量SFを算出する。ここで言う基準特徴量SFとは、楽曲を歌唱する歌手ごとの歌い方における特徴を表すデータであり、特許請求の範囲における評価データの一例である。
次に、楽曲データWDは、特定の楽曲ごとに予め用意されたものであり、楽曲に関する情報が記述された楽曲管理情報と、楽曲の演奏音を表す原盤波形データとを備えている。楽曲管理情報には、楽曲を識別する楽曲識別情報(以下、楽曲IDと称す)と、楽曲を歌唱したプロの歌手を識別する歌手識別情報(以下、歌手IDと称す)とが含まれる。
MIDI楽曲MDは、楽曲ごとに予め用意されたものであり、演奏データと、歌詞データとを有している。
情報処理装置3は、記憶部5と、制御部6とを備えた周知の情報処理装置(例えば、パーソナルコンピュータ(PC))である。
情報処理サーバ10は、通信部12と、記憶部14と、制御部16とを備えている。
このうち、通信部12は、通信網を介して、情報処理サーバ10が外部との間で通信を行う。すなわち、情報処理サーバ10は、通信網を介してカラオケ装置30と接続されている。なお、ここで言う通信網は、有線による通信網であっても良いし、無線による通信網であっても良い。
カラオケ装置30は、通信部32と、入力受付部34と、楽曲再生部36と、記憶部38と、音声制御部40と、映像制御部46と、制御部50とを備えている。
制御部50は、ROM52,RAM54,CPU56を少なくとも有した周知のコンピュータを中心に構成されている。ROM52,RAM54,CPU56は、それぞれ、ROM7,RAM8,CPU9と同様に構成されている。
次に、情報処理装置3の制御部6が実行する特徴量算出処理について説明する。
この特徴量算出処理は、処理プログラムを起動するための起動指令が、情報処理装置3の入力受付部(図示せず)を介して入力されたタイミングで起動される。
ただし、上記(1)式におけるvib_per(a,i)は、各音符ボーカルVo(a,i)におけるスペクトルピークの突出精度を表す指標である。このvib_perは、周波数解析結果(即ち、振幅スペクトル)のピーク値を、周波数解析結果の平均値で除すことで求めれば良い。また、上記(1)式におけるvip_depは、各音符ボーカルVo(a,i)の標準偏差である。
対象音符属性とは、音符NO(a,i)の属性を表す情報である。この対象音符属性には、音符NO(a,i)の音階(音高)、音符長(第1時間長の一例)、歌詞の音節、及び歌詞の母音を含む。また、前音符属性とは、時間軸に沿って音符NO(a,i)の一つ前の音符(以下、前音符と称す)NO(a,i−1)の属性を表す情報である。この前音符属性には、前音符NO(a,i)の音階(音高)、音符長、歌詞の音節、及び前音符NO(a,i−1)と音符NO(a,i)との間の時間長(即ち、無音期間)を含む。
特徴量算出処理では、続いて、制御部6は、S210で特定した各音符NO(a,i)の音符プロパティp(a,i)を、対応する音符NO(a,i)の歌唱振幅ベクトルA(a,i)、歌唱音高ベクトルF(a,i)、及び技巧特徴量S(a,i)と対応付ける(S220)。
つまり、特徴量算出処理では、歌手の歌い方における特徴を表す基準特徴量SFを歌手ごとに生成する。この特徴量算出処理にて生成される基準特徴量SFは、図4に示すように、歌手の歌手IDと、共通する音符プロパティpにおける歌唱振幅ベクトルA、歌唱音高ベクトルF、及び技巧特徴量Sのそれぞれの代表値と、その共通する音符プロパティpが対応付けられたものである。
次に、情報処理サーバ10の制御部16が実行する採点基準生成処理について説明する。
その後、本採点基準生成処理を終了する。
次に、カラオケ装置30の制御部50が実行するカラオケ採点処理について説明する。
このカラオケ採点処理は、カラオケ採点処理を実行するための処理プログラムを起動する指令が入力されると起動される。
具体的には、制御部50は、採点基準MSにおける各音符NO(c,i)の歌唱振幅ベクトルA(c,i)と、S580にて算出した歌声振幅ベクトルAA(c,i)との相関値を、対応する音符NO(c,i)ごとに算出する。そして、制御部50は、音符NO(c,i)ごとに算出した相関値の全音符NOに渡る相加平均を振幅正確度として算出する。つまり、振幅正確度は、楽曲cを歌唱するプロの歌手の歌い方における特徴のうち、音符NO(c,i)に対応する区間内での音圧の推移の類似性が高いほど高い値となる。
つまり、カラオケ採点処理では、制御部50は、ユーザに指定された楽曲を演奏する。これと共に、カラオケ採点処理では、制御部50は、楽曲の演奏中に入力された歌唱データを解析して歌唱特徴量(即ち、歌声振幅ベクトルAA、及び歌声音高ベクトルFF)及び歌唱技巧量SSを算出する。さらに、カラオケ採点処理では、制御部50は、歌声振幅ベクトルAAと歌唱振幅ベクトルA(c,i)との相関値を振幅正確度(即ち、評価点の1つ)として、歌声音高ベクトルFFと歌唱音高ベクトルFとの相関値を音高正確度(即ち、評価点の1つ)として算出する。カラオケ採点処理では、制御部50は、歌唱技巧量SSと技巧特徴量Sとの相関値を技巧正確度(評価点の1つ)として算出する。
[実施形態の効果]
以上説明したように、特徴量算出処理が実行されることで算出される歌唱振幅ベクトルA(a,i)は、音符ボーカルVo(a,i)の振幅が音符NO(a,i)に対応する区間内で推移したものである。また、特徴量算出処理が実行されることで算出される歌唱音高ベクトルF(a,i)は、音符ボーカルVo(a,i)の基本周波数f0が音符NO(a,i)に対応する区間内で推移したものである。
このように、音符プロパティpに歌詞に関する情報を含むことで、特徴量算出処理では、音符NOの音高と音符長と歌詞の音節と歌詞の母音との組み合わせが一致する音符ごとに、歌唱振幅ベクトルA及び歌唱音高ベクトルFの代表値を算出できる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
Claims (7)
- ボーカル音を含む楽曲を表す楽曲データを第1記憶部から取得する第1取得ステップと、
前記第1取得ステップにより取得された楽曲データから、前記ボーカル音を表すボーカルデータを抽出する抽出ステップと、
前記楽曲を構成する複数の音符から構成される楽譜データであって、前記音符ごとの演奏時間である第1時間長と、前記複数の音符間の時間長である第2時間長とを含む楽譜データを第2記憶部から取得する第2取得ステップと、
前記抽出ステップで抽出したボーカルデータと、前記第2取得ステップで取得した楽譜データの前記第1時間長及び前記第2時間長とに基づいて、前記楽曲における歌唱旋律を構成する音符それぞれに対応する前記ボーカルデータの区間である音符ボーカルデータを特定する特定ステップと、
前記特定ステップにて特定した前記音符ボーカルデータに基づいて、前記音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の前記音符に対応する区間内での推移を表す特徴変化量を決定する第1決定ステップと、
前記第1決定ステップにより決定された前記特徴変化量を用いて、歌唱を評価するための評価データを生成する生成ステップと、
をコンピュータに実行させ、
前記楽譜データには、前記音符の音高を含み、
前記第2取得ステップで取得した楽譜データに含まれる前記音符の音高及び前記第1時間長と、前記第1決定ステップで決定された特徴変化量とを、対応する前記音符ごとに対応付ける対応付ステップを、
前記コンピュータにさらに実行させ、
さらに、前記生成ステップは、
少なくとも、前記音符の音高と前記第1時間長との組み合わせが共通である前記音符を、所定の条件を満たす音符として、前記所定の条件を満たす音符ごとに前記特徴変化量の代表値を決定し、その決定した前記特徴変化量の代表値を含む前記評価データを生成する
ことを特徴とするプログラム。 - 前記楽譜データには、前記楽曲の歌唱旋律を構成する音符に割り当てられた歌詞の音節を表す歌詞情報を含み、
前記対応付ステップは、
前記第2取得ステップで取得した楽譜データに含まれる前記音符の音高、前記第1時間長、及び前記歌詞情報と、前記第1決定ステップで決定された特徴変化量とを、対応する音符ごとに対応付け、
前記生成ステップは、
前記音符の音高と、前記第1時間長と、前記歌詞情報との組み合わせが共通である前記音符を、前記所定の条件を満たす音符として、前記所定の条件を満たす音符ごとに前記特徴変化量の代表値を決定する
ことを特徴とする請求項1に記載のプログラム。 - 前記生成ステップは、
前記楽曲を歌唱した歌手ごとに、前記評価データを生成する
ことを特徴とする請求項1または請求項2に記載のプログラム。 - 前記第1決定ステップは、
前記音符ボーカルデータに、少なくとも2つ以上の分析窓を時間軸に沿って連続するように設定する設定ステップと、
前記設定ステップにて前記音符ボーカルデータに設定された前記分析窓それぞれにおける前記音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の値を決定し、その決定した前記分析窓それぞれにおける前記音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の値を時間軸に沿って配置することで、前記特徴変化量を決定する変化量決定ステップと
を前記コンピュータに実行させることを特徴とする請求項1から請求項3までのいずれか一項に記載のプログラム。 - 所定の楽曲の演奏中に入力された音声を表す歌唱データを取得する歌唱取得ステップと、
前記歌唱取得ステップにより取得された前記歌唱データに基づいて、前記所定の楽曲の歌唱旋律を構成する対象音符に対応する前記歌唱データの区間である音符歌唱データを特定する第2特定ステップと、
前記第2特定ステップにて特定した前記音符歌唱データに基づいて、前記音符歌唱データの振幅及び基本周波数の少なくともいずれか一方の前記対象音符に対応する区間内での推移を表す歌唱変化量を決定する第2決定ステップと、
前記第2決定ステップで決定された歌唱変化量と、前記生成ステップで生成された特徴変化量との相関値を決定し、その決定した前記相関値が高いほど高い評価とする評価決定ステップと、
を前記コンピュータにさらに実行させることを特徴とする請求項1から請求項4までのいずれか一項に記載のプログラム。 - ボーカル音を含む楽曲を表す楽曲データを第1記憶部から取得する第1取得手段と、
前記第1取得手段により取得された楽曲データから、前記ボーカル音を表すボーカルデータを抽出する抽出手段と、
前記楽曲を構成する複数の音符から構成される楽譜データであって、前記音符ごとの演奏時間である第1時間長と、前記複数の音符間の時間長である第2時間長とを含む楽譜データを第2記憶部から取得する第2取得手段と、
前記抽出手段で抽出したボーカルデータと、前記第2取得手段で取得した楽譜データの前記第1時間長及び前記第2時間長とに基づいて、前記楽曲における歌唱旋律を構成する音符それぞれに対応する前記ボーカルデータの区間である音符ボーカルデータを特定する特定手段と、
前記特定手段にて特定した前記音符ボーカルデータに基づいて、前記音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の前記音符に対応する区間内での推移を表す特徴変化量を決定する決定手段と、
前記決定手段により決定された前記特徴変化量を用いて、歌唱を評価するための評価データを生成する生成手段と、
を備え、
前記楽譜データには、前記音符の音高を含み、
前記第2取得手段にて取得した楽譜データに含まれる前記音符の音高及び前記第1時間長と、前記決定手段により決定された特徴変化量とを、対応する前記音符ごとに対応付ける対応付手段をさらに備え、
さらに、前記生成手段は、
少なくとも、前記音符の音高と前記第1時間長との組み合わせが共通である前記音符を、所定の条件を満たす音符として、前記所定の条件を満たす音符ごとに前記特徴変化量の代表値を決定し、その決定した前記特徴変化量の代表値を含む前記評価データを生成する
ことを特徴とする情報処理装置。 - ボーカル音を含む楽曲を表す楽曲データを第1記憶部から、情報処理装置が取得する第1取得手順と、
前記第1取得手順により取得された楽曲データから、前記ボーカル音を表すボーカルデータを、前記情報処理装置が抽出する抽出手順と、
前記楽曲を構成する複数の音符から構成される楽譜データであって、前記音符ごとの演奏時間である第1時間長と、前記複数の音符間の時間長である第2時間長とを含む楽譜データを第2記憶部から、前記情報処理装置が取得する第2取得手順と、
前記抽出手順で抽出したボーカルデータと、前記第2取得手順で取得した楽譜データの前記第1時間長及び前記第2時間長とに基づいて、前記楽曲における歌唱旋律を構成する音符それぞれに対応する前記ボーカルデータの区間である音符ボーカルデータを、前記情報処理装置が特定する特定手順と、
前記特定手順にて特定した前記音符ボーカルデータに基づいて、前記音符ボーカルデータの振幅及び基本周波数の少なくともいずれか一方の前記音符に対応する区間での推移を表す特徴変化量を、前記情報処理装置が決定する決定手順と、
前記決定手順により決定された前記特徴変化量を用いて、歌唱を評価するための評価データを、前記情報処理装置が生成する生成手順と、
を備え、
前記楽譜データには、前記音符の音高を含み、
前記第2取得手順にて取得した楽譜データに含まれる前記音符の音高及び前記第1時間長と、前記決定手段により決定された特徴変化量とを、対応する前記音符ごとに対応付ける対応付手順をさらに備え、
さらに、前記生成手順は、
少なくとも、前記音符の音高と前記第1時間長との組み合わせが共通である前記音符を、所定の条件を満たす音符として、前記所定の条件を満たす音符ごとに前記特徴変化量の代表値を決定し、その決定した前記特徴変化量の代表値を含む前記評価データを生成する
ことを特徴とする評価データ生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014060253A JP6075313B2 (ja) | 2014-03-24 | 2014-03-24 | プログラム,情報処理装置,及び評価データ生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014060253A JP6075313B2 (ja) | 2014-03-24 | 2014-03-24 | プログラム,情報処理装置,及び評価データ生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015184447A JP2015184447A (ja) | 2015-10-22 |
JP6075313B2 true JP6075313B2 (ja) | 2017-02-08 |
Family
ID=54351048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014060253A Active JP6075313B2 (ja) | 2014-03-24 | 2014-03-24 | プログラム,情報処理装置,及び評価データ生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6075313B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6365483B2 (ja) * | 2015-09-24 | 2018-08-01 | ブラザー工業株式会社 | カラオケ装置,カラオケシステム,及びプログラム |
CN107507628B (zh) * | 2017-08-31 | 2021-01-15 | 广州酷狗计算机科技有限公司 | 唱歌评分方法、装置及终端 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3430811B2 (ja) * | 1996-08-27 | 2003-07-28 | ヤマハ株式会社 | カラオケ装置 |
JP2007232750A (ja) * | 2006-02-27 | 2007-09-13 | Yamaha Corp | カラオケ装置、制御方法およびプログラム |
JP5109909B2 (ja) * | 2008-09-30 | 2012-12-26 | ブラザー工業株式会社 | 難易度推定システムおよびプログラム |
-
2014
- 2014-03-24 JP JP2014060253A patent/JP6075313B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015184447A (ja) | 2015-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6060867B2 (ja) | 情報処理装置,データ生成方法,及びプログラム | |
JP5598516B2 (ja) | カラオケ用音声合成システム,及びパラメータ抽出装置 | |
JP6075313B2 (ja) | プログラム,情報処理装置,及び評価データ生成方法 | |
JP6075314B2 (ja) | プログラム,情報処理装置,及び評価方法 | |
JP5292702B2 (ja) | 楽音信号生成装置及びカラオケ装置 | |
JP6056799B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP6252420B2 (ja) | 音声合成装置、及び音声合成システム | |
JP5782972B2 (ja) | 情報処理システム,プログラム | |
JP2013210501A (ja) | 素片登録装置,音声合成装置,及びプログラム | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JP6260565B2 (ja) | 音声合成装置、及びプログラム | |
JP6011506B2 (ja) | 情報処理装置,データ生成方法,及びプログラム | |
JP5983670B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP6365483B2 (ja) | カラオケ装置,カラオケシステム,及びプログラム | |
JP6406182B2 (ja) | カラオケ装置、及びカラオケシステム | |
JP5413380B2 (ja) | 楽曲データ修正装置 | |
JP6252408B2 (ja) | 表示制御装置,及び表示制御システム | |
JP6380305B2 (ja) | データ生成装置、カラオケシステム、及びプログラム | |
JP6281447B2 (ja) | 音声合成装置,及び音声合成システム | |
JP6252421B2 (ja) | 採譜装置、及び採譜システム | |
JP6090043B2 (ja) | 情報処理装置、及びプログラム | |
JP6260499B2 (ja) | 音声合成システム、及び音声合成装置 | |
JP5569307B2 (ja) | プログラム、及び編集装置 | |
JP6365561B2 (ja) | カラオケシステム、カラオケ装置、及びプログラム | |
JP5845857B2 (ja) | パラメータ抽出装置、音声合成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160524 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6075313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |