JP6252408B2 - 表示制御装置,及び表示制御システム - Google Patents

表示制御装置,及び表示制御システム Download PDF

Info

Publication number
JP6252408B2
JP6252408B2 JP2014175829A JP2014175829A JP6252408B2 JP 6252408 B2 JP6252408 B2 JP 6252408B2 JP 2014175829 A JP2014175829 A JP 2014175829A JP 2014175829 A JP2014175829 A JP 2014175829A JP 6252408 B2 JP6252408 B2 JP 6252408B2
Authority
JP
Japan
Prior art keywords
note
singing
data
feature
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014175829A
Other languages
English (en)
Other versions
JP2016051034A (ja
Inventor
典昭 阿瀬見
典昭 阿瀬見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2014175829A priority Critical patent/JP6252408B2/ja
Publication of JP2016051034A publication Critical patent/JP2016051034A/ja
Application granted granted Critical
Publication of JP6252408B2 publication Critical patent/JP6252408B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Auxiliary Devices For Music (AREA)

Description

本発明は、歌唱技巧の実現の成否を通知する技術に関する。
従来、楽曲を構成する構成音それぞれの音高及び音長を表す楽曲データに従って、当該楽曲を演奏するカラオケ装置が知られている(特許文献1参照)。
特許文献1に記載されたカラオケ装置では、楽曲の演奏中に入力された音声を順次周波数解析した結果に従って特定した歌唱音高から、構成音の音高である基準音高を減算して特定音高差を導出する。これと共に、特許文献1に記載されたカラオケ装置では、基準音高を軸として歌唱音高と対称となるように、歌唱音高を特定音高差の2倍分シフトした音高の補助音を出力する。このとき、補助音の音量は、特定音高差が大きいほど大きく、特定音高差が「0」であれば「0(即ち、消音した状態)」となるように制御される。
特開2010−231070号公報
特許文献1に記載されたカラオケ装置の利用者は、補助音が出力されている場合、歌唱音高と基準音高との間にズレが生じていることを認識できる。そして、歌唱音が補助音に引っ張られることで、歌唱音の音高を基準音高に近づけることができる。
しかしながら、特許文献1に記載されたカラオケ装置では、当該楽曲において用いられるべき歌唱技巧を、利用者が実現できているか否かを、利用者に認識させることができず、その歌唱技巧を利用者に実現させることができないという課題がある。
つまり、従来の技術では、楽曲にて用いられるべき歌唱技巧の実現の成否を利用者に認識させることができず、かつ、その歌唱技巧を利用者に実現させることができないという課題がある。
そこで、本発明は、歌唱技巧の実現の成否を利用者に認識させ、その歌唱技巧を利用者に実現させることが可能な技術を提供することを目的とする。
上記目的を達成するためになされた本発明は、楽曲に関する情報の表示を制御する表示制御装置に関する。
本発明においては、音高と音価との組み合わせからなる音符を複数有し、複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲のうち、指定された1つの楽曲を特定楽曲とし、特定楽曲を構成する音符であって、歌詞が割り当てられた音符を構成音符とする。
そして、本発明の表示制御装置は、特徴データ取得手段と、特徴量算出手段と、比較手段と、表示制御手段とを備えている。
特徴データ取得手段は、歌唱特徴データを取得する。ここで言う歌唱特徴データは、指定された歌手である指定歌手が楽曲を歌唱したボーカル音を含む楽曲データから、ボーカ
ル音を表すボーカルデータを抽出するステップと、楽曲を構成する複数の音符から構成される楽譜データを取得するステップと、その取得した楽譜データを構成する各音符及びボーカルデータに基づいて、楽曲における歌唱旋律を構成する音符それぞれに対応するボーカルデータの区間である音符ボーカルデータを特定して、各音符ボーカルデータに対応する音符にて指定歌手が用いる歌唱技巧の特徴量を表す技巧特徴量を決定するステップと、特定楽曲の楽譜を表す対象楽譜データを取得し、その取得した対象楽譜データに含まれる構成音符に、構成音符の音高,音価、及び当該構成音符に割り当てられた歌詞の組み合わせである音符プロパティが一致する音符での技巧特徴量を対応付けることで、特定楽曲を構成する構成音符の各々での指定歌手の技巧特徴量を表す歌唱特徴データを生成するステップとを実行することで生成されたものである。
特徴量算出手段は、特定楽曲の演奏中に入力された音声データを解析し、音声データにて表現された構成音符それぞれでの歌唱技巧の特徴量を表す歌唱特徴量を算出する。比較手段は、特徴データ取得手段で取得した歌唱特徴データに含まれる技巧特徴量と、特徴量算出手段で算出された歌唱特徴量とを、互いに対応する構成音符ごとに比較する。表示制御手段は、比較手段での比較の結果、技巧特徴量と歌唱特徴量との差分である技巧差分が、予め規定された規定条件を満たしていなければ、当該構成音符の音符プロパティと同一の音符プロパティを有し、かつ、当該構成音符とは異なる構成音符である対象音符に対して用いるべき歌唱技巧を表示する表示制御を実行する。
このような表示制御装置によれば、技巧差分が規定条件を満たしていない構成音符の音符プロパティと同一の音符プロパティを有し、かつ、当該構成音符とは異なる構成音符(即ち、対象音符)に対して用いるべき歌唱技巧を表示できる。
この結果、表示制御装置の利用者は、楽曲にて用いるべき歌唱技巧を実現できたか否かを認識できる。
しかも、本発明の表示制御装置によれば、対象音符に対して用いるべき歌唱技巧を表示している。そして、この表示を視認した利用者は、当該対象音符を歌唱する際にその歌唱技巧を実現するように留意する。このため、本発明の表示制御装置によれば、利用者自身が歌唱した際の歌唱技巧を、指定歌手が歌唱した場合に用いる歌唱技巧に近づけることができる。
このような表示制御装置によれば、利用者自身の歌唱を指定歌手の歌唱態様に近づけることができる。
これらのことから、本発明の表示制御装置によれば、歌唱技巧の実現の成否を利用者に認識させ、その歌唱技巧を利用者が実現可能となる。
本発明における表示制御手段は、歌唱特徴データに含まれる技巧特徴量が歌唱技巧を実行したことを表し、かつ、歌唱特徴量が歌唱技巧を未実行であることを表している場合、技巧差分が規定条件を満たしていないものとし、歌唱技巧での歌唱が未実行である旨を表示することを表示制御として実行しても良い。
このような表示制御装置によれば、歌唱技巧での歌唱が未実行である旨を利用者に認識させることができる。
また、本発明における表示制御手段は、歌唱特徴データに含まれる技巧特徴量が歌唱技巧を未実行であることを表し、かつ、歌唱特徴量が歌唱技巧を実行したことを表している場合、技巧差分が規定条件を満たしていないものとし、歌唱技巧での歌唱が不要である旨を表示することを表示制御として実行しても良い。
このような表示制御装置によれば、歌唱技巧が不要である旨、即ち、歌唱技巧が過剰で
あることを利用者に認識させることができる。
さらに、本発明における歌唱技巧として、「ビブラート」を含んでいても良い。この場合、表示制御手段は、比較手段での比較の結果、歌唱特徴量におけるビブラートの特徴量と、技巧特徴量におけるビブラートの特徴量との差分が予め規定された第1閾値範囲を超えていれば、技巧差分が規定条件を満たしていないものとすれば良い。
このような表示制御装置によれば、歌唱技巧としての「ビブラート」の成否を利用者に認識させることができる。
また、本発明における歌唱技巧として、「しゃくり」を含んでいても良い。「しゃくり」とは、時間軸に沿って連続し、互いに異なる音高を有した2つの音符を含む音符群に対して発声音高を変化させつつ連続して歌唱する技巧である。この場合、表示制御手段は、比較手段での比較の結果、歌唱特徴量におけるしゃくりの特徴量と、技巧特徴量におけるしゃくりの特徴量との差分が予め規定された第2閾値範囲を超えていれば、技巧差分が規定条件を満たしていないものとすれば良い。
このような表示制御装置によれば、歌唱技巧としての「しゃくり」の成否を利用者に認識させることができる。
ところで、本発明は、ボーカル取得手段と、楽譜取得手段と、特徴量決定手段と、特徴生成手段と、特徴データ取得手段と、特徴量算出手段と、比較手段と、表示制御手段とを備え、楽曲に関する情報の表示を制御する表示制御システムとしてなされていても良い。
本発明の表示制御システムにおいては、ボーカル取得手段が、楽曲データからボーカルデータを抽出する。楽譜取得手段は、楽譜データを取得する。特徴量決定手段は、楽譜取得手段で取得した楽譜データを構成する各音符及びボーカル取得手段で取得したボーカルデータに基づいて、音符ボーカルデータを特定して、各音符ボーカルデータにおける技巧特徴量を決定する。特徴生成手段が、特定楽曲の楽譜を表す対象楽譜データを取得し、その取得した対象楽譜データに含まれる構成音符に、音符プロパティが一致する音符での技巧特徴量を対応付けることで、歌唱特徴データを生成する。
さらに、本発明の表示制御システムにおいては、特徴データ取得手段が、特徴生成手段で生成した歌唱特徴データを取得する。特徴量算出手段は、特定楽曲の演奏中に入力された音声データを解析し、歌唱特徴量を算出する。比較手段が、特徴データ取得手段で取得した歌唱特徴データに含まれる技巧特徴量と、特徴量算出手段で算出された歌唱特徴量とを、互いに対応する構成音符ごとに比較する。
そして、表示制御手段が、比較手段での比較の結果、技巧差分が、予め規定された規定条件を満たしていなければ、当該構成音符の音符プロパティと同一の音符プロパティを有し、かつ、当該構成音符とは異なる構成音符である対象音符に対して用いるべき歌唱技巧を表示する表示制御を実行する。
このようなシステムであっても、請求項1に係る発明と同様の効果を得ることができる。
カラオケシステムの概略構成を示すブロック図である。 技巧特徴生成処理の処理手順を示すフローチャートである。 技巧特徴データの概要を説明する説明図である。 歌唱特徴生成処理の処理手順を示すフローチャートである。 歌唱特徴データの概要を説明する説明図である。 カラオケ演奏処理の処理手順を示すフローチャートである。 カラオケ演奏処理における表示の一例を示す図である。 カラオケ演奏処理における表示の態様を示す図である。
以下に本発明の実施形態を図面と共に説明する。
<システム構成>
図1に示すカラオケシステム1は、ユーザが指定した楽曲である特定楽曲を演奏すると共に、ユーザが指定した歌手である指定歌手が特定楽曲を歌唱した場合に表出する指定歌手の歌唱技巧の特徴を表示させるシステムである。
このようなカラオケシステム1は、情報処理装置2と、情報処理サーバ10と、カラオケ装置30とを備えている。
情報処理装置2は、楽曲ごとに用意された楽曲データWD及びMIDI楽曲MDに基づいて技巧特徴データSFを算出する。ここで言う技巧特徴データSFとは、歌手の歌い方における特徴を表すデータである。ここで言う歌手には、プロの歌手、及びアマチュアの歌手を含む。
情報処理サーバ10には、情報処理装置2にて算出された技巧特徴データSF及びMIDI楽曲MDに基づいて、特定楽曲を指定歌手が歌唱した場合の歌唱技巧の特徴量を表す歌唱特徴データMSを生成する。
カラオケ装置30は、情報処理サーバ10に記憶されたMIDI楽曲MDに従って特定楽曲を演奏すると共に、情報処理サーバ10にて生成された歌唱特徴データMSに基づいて、指定歌手が特定楽曲を歌唱した場合の歌唱技巧の特徴を報知する。
<楽曲データ>
次に、楽曲データWDは、特定の楽曲ごとに予め用意されたものであり、楽曲に関する情報が記述された楽曲管理情報と、楽曲の演奏音を表す原盤波形データとを備えている。楽曲管理情報には、楽曲を識別する楽曲識別情報(以下、楽曲IDと称す)と、当該楽曲を歌唱した歌手を識別する歌手識別情報(以下、歌手IDと称す)とが含まれる。
本実施形態の原盤波形データは、複数の楽器の演奏音と、歌唱旋律を歌手が歌唱したボーカル音とを含む音声データである。この音声データは、非圧縮音声ファイルフォーマットの音声ファイルによって構成されたデータであっても良いし、音声圧縮フォーマットの音声ファイルによって構成されたデータであっても良い。
なお、以下では、原盤波形データに含まれる楽器の演奏音を表す音声波形データを伴奏データと称し、原盤波形データに含まれるボーカル音を表す音声波形データをボーカルデータと称す。
本実施形態の伴奏データに含まれる楽器の演奏音としては、打楽器(例えば、ドラム,太鼓,シンバルなど)の演奏音,弦楽器(例えば、ギター,ベースなど)の演奏音,打弦楽器(例えば、ピアノ)の演奏音,及び管楽器(例えば、トランペットやクラリネットなど)の演奏音がある。
<MIDI楽曲>
MIDI楽曲MDは、楽曲ごとに予め用意されたものであり、楽曲管理情報と、演奏データと、歌詞データとを有している。
このうち、楽曲管理情報は、楽曲IDと、歌手IDとを含む。
演奏データは、周知のMIDI(Musical Instrument Digital Interface)規格によって、一つの楽曲の楽譜を表したデータである。こ
の演奏データは、楽曲IDと、当該楽曲にて用いられる楽器ごとの楽譜を表す楽譜トラックとを少なくとも有している。
そして、楽譜トラックには、MIDI音源から出力される個々の演奏音について、少なくとも、音高(いわゆるノートナンバー)と、MIDI音源が演奏音を出力する期間(以下、音符長と称す)とが規定されている。楽譜トラックにおける音符長は、当該演奏音の出力を開始するまでの当該楽曲の演奏開始からの時間を表す演奏開始タイミング(いわゆるノートオンタイミング)と、当該演奏音の出力を終了するまでの当該楽曲の演奏開始からの時間を表す演奏終了タイミング(いわゆるノートオフタイミング)とによって規定されている。
すなわち、楽譜トラックでは、ノートナンバーと、ノートオンタイミング及びノートオフタイミングによって表される音符長とによって、1つの音符NOが規定される。そして、楽譜トラックは、音符NOが演奏順に配置されることによって、1つの楽譜として機能する。なお、楽譜トラックは、例えば、鍵盤楽器、弦楽器、打楽器、及び管楽器などの楽器ごとに用意されている。このうち、本実施形態では、特定の楽器(例えば、ヴィブラフォン)が、楽曲における歌唱旋律を担当する楽器として規定されている。
一方、歌詞データは、楽曲の歌詞に関するデータであり、歌詞テロップデータと、歌詞出力データとを備えている。歌詞テロップデータは、楽曲の歌詞を構成する文字(以下、歌詞構成文字とする)を表す。歌詞出力データは、歌詞構成文字の出力タイミングである歌詞出力タイミングを、演奏データの演奏と対応付けるタイミング対応関係が規定されたデータである。
具体的に、本実施形態におけるタイミング対応関係では、演奏データの演奏を開始するタイミングに、歌詞テロップデータの出力を開始するタイミングが対応付けられている。さらに、タイミング対応関係では、楽曲の時間軸に沿った各歌詞構成文字の歌詞出力タイミングが、演奏データの演奏開始からの経過時間によって規定されている。これにより、楽譜トラックに規定された個々の演奏音の音符NOと、歌詞構成文字それぞれとが対応付けられる。
<情報処理装置>
情報処理装置2は、入力受付部3と、外部出力部4と、記憶部5と、制御部6とを備えた周知の情報処理装置(例えば、パーソナルコンピュータ)である。
入力受付部3は、外部からの情報や指令の入力を受け付ける入力機器である。ここでの入力機器とは、例えば、キーやスイッチ、可搬型の記憶媒体(例えば、CDやDVD、フラッシュメモリ)に記憶されたデータを読み取る読取ドライブ、通信網を介して情報を取得する通信ポートなどである。外部出力部4は、外部に情報を出力する出力装置である。ここでの出力装置とは、可搬型の記憶媒体にデータを書き込む書込ドライブや、通信網に情報を出力する通信ポートなどである。
記憶部5は、記憶内容を読み書き可能に構成された周知の記憶装置である。記憶部5には、少なくとも1つの楽曲データWDと、少なくとも1つのMIDI楽曲MDとが、共通する楽曲ごとに対応付けられて記憶されている。
制御部6は、ROM7,RAM8,CPU9を備えた周知のマイクロコンピュータを中心に構成された周知の制御装置である。ROM7は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを記憶する。RAM8は、処理プログラムやデータを一時的に記憶する。CPU9は、ROM7やRAM8に記憶された処理プログラムに従って各処理を実行する。
本実施形態のROM7には、技巧特徴生成処理を、制御部6が実行するための処理プログラムが記憶されている。技巧特徴生成処理は、記憶部5に記憶されている楽曲データWD及びMIDI楽曲MDに基づいて、技巧特徴データSFを生成する処理である。
<情報処理サーバ>
情報処理サーバ10は、通信部12と、記憶部14と、制御部16とを備えている。
このうち、通信部12は、通信網を介して、情報処理サーバ10が外部との間で通信を行う。すなわち、情報処理サーバ10は、通信網を介してカラオケ装置30と接続されている。なお、ここで言う通信網は、有線による通信網であっても良いし、無線による通信網であっても良い。
記憶部14は、記憶内容を読み書き可能に構成された周知の記憶装置である。この記憶部14には、少なくとも1つのMIDI楽曲MDが記憶される。なお、図1に示す符号「n」は、情報処理サーバ10の記憶部14に記憶されているMIDI楽曲MDを識別する識別子であり、1以上の自然数である。さらに、記憶部14には、情報処理装置2がデータ生成処理を実行することで生成された技巧特徴データSFが記憶される。なお、図1に示す符号「m」は、情報処理サーバ10の記憶部14に記憶されている技巧特徴データSFを識別する識別子であり、1以上の自然数である。
制御部16は、ROM18,RAM20,CPU22を備えた周知のマイクロコンピュータを中心に構成された周知の制御装置である。ROM18は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを記憶する。RAM20は、処理プログラムやデータを一時的に記憶する。CPU22は、ROM18やRAM20に記憶された処理プログラムに従って各処理を実行する。
制御部16のROM18には、歌唱特徴生成処理を、制御部16が実行するための処理プログラムが格納されている。歌唱特徴生成処理は、カラオケ装置30のユーザが指定した楽曲(即ち、特定楽曲)を、そのユーザが模範とする人物として指定した指定歌手が歌唱した場合に表出する歌唱技巧の特徴を表す歌唱特徴データMSを生成する処理である。なお、指定歌手は、特定楽曲を歌唱した独自の(オリジナルな)歌手自身であっても良いし、特定楽曲を歌唱した独自の歌手とは異なる歌手であっても良い。
<カラオケ装置>
カラオケ装置30は、通信部32と、入力受付部34と、楽曲再生部36と、記憶部38と、音声制御部40と、映像制御部46と、制御部50とを備えている。
通信部32は、通信網を介して、カラオケ装置30が外部との間で通信を行う。入力受付部34は、外部からの操作に従って情報や指令の入力を受け付ける入力機器である。ここでの入力機器とは、例えば、キーやスイッチ、リモコンの受付部などである。楽曲再生部36は、情報処理サーバ10からダウンロードしたMIDI楽曲MDに基づく楽曲の演奏を実行する。
この楽曲再生部36は、例えば、MIDI音源である。音声制御部40は、音声の入出力を制御するデバイスであり、出力部42と、マイク入力部44とを備えている。マイク入力部44には、マイク62が接続される。これにより、マイク入力部44は、マイク62を介して入力された音声を取得する。出力部42にはスピーカ60が接続されている。出力部42は、楽曲再生部36によって再生される楽曲の音源信号、マイク入力部44からの歌唱音の音源信号をスピーカ60に出力する。スピーカ60は、出力部42から出力される音源信号を音に換えて出力する。
映像制御部46は、制御部50から送られてくる映像データに基づく映像または画像の出力を行う。映像制御部46には、映像または画像を表示する表示部64が接続されている。
制御部50は、ROM52,RAM54,CPU56を少なくとも有した周知のコンピュータを中心に構成されている。ROM52は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを記憶する。RAM54は、処理プログラムやデータを一時的に記憶する。CPU56は、ROM52やRAM54に記憶された処理プログラムに従って各処理を実行する。
制御部50のROM52には、カラオケ演奏処理を、制御部50が実行するための処理プログラムが格納されている。カラオケ演奏処理は、ユーザが指定した特定楽曲を演奏すると共に、歌唱特徴データMSに基づいて、その特定楽曲を指定歌手が歌唱した場合に表出する歌唱技巧の特徴を表示部64に表示する処理である。
<技巧特徴生成処理>
次に、情報処理装置2の制御部6が実行する技巧特徴生成処理について説明する。
この技巧特徴生成処理は、処理プログラムを起動するための起動指令が、情報処理装置2の入力受付部3を介して入力されたタイミングで起動される。
そして、図2に示す技巧特徴生成処理が起動されると、まず、制御部6は、情報処理装置2の入力受付部(図示せず)を介して入力された歌手IDを取得する(S105)。続いて、制御部6は、情報処理装置2の記憶部5に記憶されている全ての楽曲データWDの中から、S105にて取得した歌手IDを含む一つの楽曲データWDを取得する(S110)。
さらに、技巧特徴生成処理では、制御部6は、情報処理装置2の記憶部5に記憶されている全てのMIDI楽曲MDの中から、S110で取得した楽曲データWDと同一の楽曲IDが対応付けられた一つのMIDI楽曲MDを取得する(S120)。すなわち、S110及びS120では、制御部6は、同一の楽曲に対する楽曲データWD及びMIDI楽曲MDを取得する。
続いて、制御部6は、S110にて取得した楽曲データWD(以下、「取得楽曲データ」と称す)における各音符に対応する各音の再生時間に、S120で取得したMIDI楽曲MD(以下、「取得MIDI」と称す)を構成する各音符の演奏タイミングが一致するように、その取得MIDIを調整する(S130)。このS130における取得MIDIを調整する手法として、周知の手法(例えば、特許第5310677号に記載の手法)を用いることが考えられる。特許第5310677号に記載の手法では、具体的には、制御部6は、取得MIDIをレンダリングし、その取得MIDIのレンダリング結果と取得楽曲データの原盤波形データとの双方を規定時間単位でスペクトルデータに変換する。そして、双方のスペクトルデータ上の時間が同期するように、各演奏音の演奏開始タイミング及び演奏終了タイミングを修正する。なお、スペクトルデータ上の時間が同期するように調整する際には、DPマッチングを用いても良い。
技巧特徴生成処理では、制御部6は、取得楽曲データWDに含まれる原盤波形データを取得する(S140)。続いて、制御部6は、S140にて取得した原盤波形データから、ボーカルデータと伴奏データとを分離して抽出する(S150)。このS150における伴奏データとボーカルデータとの分離手法として、周知の手法(例えば、特開2008−134606に記載された“PreFEst”)を使って推定された音高および調波成分を利用する手法が考えられる。なお、PreFEstとは、原盤波形データにおいて最も優勢な音声波形をボーカルデータとみなしてボーカルの音高(即ち、基本周波数)およ
び調波成分の大きさを推定する手法である。
さらに、制御部6は、S130にて時間調整が実施されたMIDI楽曲MD(以下、「調整済MIDI」と称す)と、S150で抽出したボーカルデータとに基づいて、音符ボーカルVo(a,i)を特定する(S160)。音符ボーカルVo(a,i)とは、ボーカルデータにおいて、歌唱旋律を構成する各音符NO(a,i)に対応する区間である。S160においては、制御部6は、S150で抽出したボーカルデータに、調整済MIDIにおける演奏開始タイミングnnt(a,i)及び演奏終了タイミングnft(a,i)を照合することで、音符ボーカルVo(a,i)を特定する。なお、符号aは、楽曲を識別する符号であり、符号iは、楽曲における歌唱旋律の音符NOを識別する符号である。
さらに、技巧特徴生成処理では、制御部6は、各音符ボーカルVo(a,i)での複数の歌唱技巧についての評価を表す技巧特徴量S(a,i)を決定する(S170)。ここで言う複数の歌唱技巧には、少なくとも“ビブラート”,“しゃくり”を含む。なお、“しゃくり”とは、時間軸に沿って連続し、互いに異なる音高を有した2つの音符を含む音符群に対して発声音高を変化させつつ連続して歌唱する技巧である。
このうち、“ビブラート”についての技巧特徴量(以下、「ビブラート特徴量」と称す)vibの算出では、制御部6は、まず、音符ボーカルVo(a,i)それぞれについて周波数解析(DFT)を実施する。そして、制御部6は、下記(1)式に従って、ビブラート特徴量vibを算出する。
vib(a,i)=vib_per(a,i)×vip_dep(a,i) (1)
ただし、上記(1)式におけるvib_per(a,i)は、各音符ボーカルVo(a,i)におけるスペクトルピークの突出精度を表す指標である。このvib_perは、周波数解析結果(即ち、振幅スペクトル)のピーク値を、周波数解析結果の平均値で除すことで求めれば良い。また、上記(1)式におけるvip_depは、各音符ボーカルVo(a,i)の標準偏差である。
“しゃくり”についての技巧特徴量(以下、「しゃくり特徴量」と称す)rise(a,i)の算出では、制御部6は、まず、ボーカルデータの音高時間変化を微分した微分変化を算出する。続いて、制御部6は、各音符NO(a,i)の演奏開始タイミングnnt(a,i)以前で、微分変化が時間軸に沿って正の値となったタイミングを特定する。さらに、制御部6は、その特定した各タイミングから演奏開始タイミングnnt(a,i)までの区間におけるボーカルデータの音高時間変化と予め規定された模範曲線との相互相関値を、しゃくり特徴量rise(a,i)として算出する。
さらに、技巧特徴生成処理では、制御部6は、各音符ボーカルVo(a,i)に対応する音符NO(a,i)の音符プロパティp(a,i)を特定する(S180)。本実施形態のS180では、具体的には、制御部6は、取得MIDIから、その取得MIDIに規定された各音符NO(a,i)の情報を音符プロパティp(a,i)として抽出して特定する。
ここで言う音符プロパティp(a,i)には、特定音符属性と、前音符属性と、後音符属性とを含む。
特定音符属性とは、音符NO(a,i)の属性を表す情報である。この特定音符属性には、音符NO(a,i)の音階(音高)、音符長、歌詞の音節、及び歌詞の母音を含む。また、前音符属性とは、時間軸に沿って音符NO(a,i)の一つ前の音符(以下、前音符と称す)NO(a,i−1)の属性を表す情報である。この前音符属性には、前音符N
O(a,i)の音階(音高)、音符長、歌詞の音節、及び前音符NO(a,i−1)と音符NO(a,i)との間の時間長(即ち、無音期間)を含む。
さらに、後音符属性とは、時間軸に沿って特定音符NO(a,i)の一つ後の音符(以下、後音符と称す)NO(a,i+1)の属性を表す情報である。この後音符属性には、音階(音高)、音符長、歌詞の音節、及び音符NO(a,i)と後音符NO(a,i+1)との間の時間長(即ち、無音期間)を含む。
なお、音符プロパティp(a,i)における音符長、及び音符間の時間長は、予め規定された階級へと量子化されたものでも良い。
技巧特徴生成処理では、続いて、制御部6は、S180で特定した各音符NO(a,i)の音符プロパティp(a,i)を、対応する音符NO(a,i)の技巧特徴量S(a,i)と対応付ける(S190)。
さらに、技巧特徴生成処理では、制御部6は、S105にて取得した歌手IDが対応付けられた楽曲のうち、予め設定された設定条件を満たす全楽曲について、S110からS190のステップを完了したか否かを判定する(S200)。ここで言う設定条件とは、S105にて取得した歌手IDが対応付けられ、楽曲データWDとMIDI楽曲MDとの双方が用意されていることである。
このS200での判定の結果、設定条件を満たす全楽曲について、S110からS190のステップを完了していなければ(S200:NO)、制御部6は、技巧特徴生成処理をS110へと戻す。そして、制御部6は、S105にて指定された歌手IDが対応付けられた楽曲データWDの中から、新たな楽曲データWDを取得し(S110)、さらに、その楽曲データWDに対応するMIDI楽曲MDを取得して(S120)、S130からS200のステップを実行する。
一方、S200での判定の結果、全楽曲について、S110からS190のステップを完了していれば(S200:YES)、制御部6は、技巧特徴生成処理をS210へと移行させる。
そのS210では、制御部6は、技巧特徴量S(a,i)について、対応付けられた音符プロパティpが共通するものごとに代表値を算出する。
すなわち、本実施形態のS210では、制御部6は、特定音符属性と前音符属性と後音符属性との全てが共通する音符NOごとに、それらの属性が共通する音符NOにおける技巧特徴量Sそれぞれの相加平均を、技巧特徴量Sの代表値として算出する。つまり、S210では、技巧特徴量Sの代表値として、各音符プロパティpごとに、ビブラート特徴量vibの代表値と、しゃくり特徴量riseの代表値とが算出される。
このS210にて代表値として算出する相加平均は、技巧特徴量S(a,i)を算出した全ての楽曲の範囲内で実施する。なお、S210において算出する代表値は、相加平均の結果に限るものではなく、中央値や最頻値であっても良い。
続いて、制御部6は、S210にて算出された技巧特徴量Sの代表値を、対応する音符プロパティp及び歌手IDと対応付けることで、技巧特徴データSFを生成して記憶部5に記憶する(S220)。
その後、制御部6は、本技巧特徴生成処理を終了する。
つまり、技巧特徴生成処理では、歌手の歌い方における特徴を表す技巧特徴データSFを歌手ごとに生成する。この技巧特徴生成処理にて生成される技巧特徴データSFは、図
3に示すように、歌手の歌手IDと、共通する音符プロパティpにおける技巧特徴量Sの代表値と、その共通する音符プロパティpが対応付けられたものである。
なお、情報処理装置2の制御部6が技巧特徴生成処理を実行することで生成される技巧特徴データSFは、可搬型の記憶媒体を用いて情報処理サーバ10の記憶部14に記憶されても良い。情報処理装置2と情報処理サーバ10とが通信網を介して接続されている場合には、情報処理装置2の記憶部5に記憶された技巧特徴データSFは、通信網を介して転送されることで、情報処理サーバ10の記憶部14に記憶されても良い。
<歌唱特徴生成処理>
次に、情報処理サーバ10の制御部16が実行する歌唱特徴生成処理について説明する。
図4に示す歌唱特徴生成処理が起動されると、制御部16は、記憶部14に記憶されている全てのMIDI楽曲MDの中から1つのMIDI楽曲MDを取得する(S310)。このS310にて制御部16が取得する1つのMIDI楽曲MDは、カラオケ演奏処理のS510(詳しくは後述)にて指定された楽曲に対応するMIDI楽曲MDであっても良いし、情報処理サーバ10に接続された入力装置(図示せず)を介して指定された楽曲に対応するMIDI楽曲MDであっても良い。
続いて、制御部16は、S310にて取得したMIDI楽曲MDを分析し、そのMIDI楽曲MDにおける歌唱旋律を構成する各音符NO(b,i)の音符プロパティp(b,i)を特定する(S320)。ここでの符号bは、S310にて取得したMIDI楽曲MDに対応する楽曲を識別する符号である。
そして、歌唱特徴生成処理では、制御部16は、記憶部14に記憶されている全ての技巧特徴データSFの中から、1つの技巧特徴データSFを取得する(S330)。このS330にて制御部16が取得する1つの技巧特徴データSFは、カラオケ演奏処理のS520(詳しくは後述)にて指定された歌手(即ち、指定歌手)に対応する技巧特徴データSFであっても良いし、情報処理サーバ10に接続された入力装置(図示せず)を介して指定された歌手に対応する技巧特徴データSFであっても良い。
続いて、制御部16は、歌唱特徴データMSを生成する(S340)。このS340での歌唱特徴データMSの生成は、S320での分析によって特定された各音符NO(b,i)に、S330にて取得した技巧特徴データSFに含まれる技巧特徴量Sであり、かつ特定の条件を満たす技巧特徴量Sの代表値を割り当てることで実現する。なお、ここで言う特定の条件とは、各音符NO(b,i)における音符プロパティp(b,i)と一致する音符プロパティpが対応付けられた技巧特徴量Sであることである。
ところで、技巧特徴量Sの中に、特定の条件を満たす技巧特徴量Sが存在しない場合も考えられる。この場合のS340では、制御部16は、音符NO(b,i)の音符プロパティp(b,i)に近接する音符プロパティpが対応付けられた技巧特徴量Sの代表値を、その音符NO(b,i)に割り当てれば良い。ここで言う近接する音符プロパティpとは、例えば、音階が1音違う、音符長が1階級違うことなどである。また、上記の方法とは別に、制御部16は、時間及び周波数の2つの軸について、両隣の2つの音符NO(b,i−1),NO(b,i+1)に対応する技巧特徴量Sの代表値を平均した値を、その音符NO(b,i)に割り当てても良い。
さらに、S340では、制御部16は、生成した歌唱特徴データMSに、S310にて取得したMIDI楽曲MDに含まれる楽曲IDと、S330にて取得した技巧特徴データSFに含まれる歌手ID(即ち、指定歌手の歌手ID)とを付与して記憶部14に記憶す
る。
その後、本歌唱特徴生成処理を終了する。
つまり、歌唱特徴生成処理では、図5に示すように、MIDI楽曲MDにおける歌唱旋律を構成する各音符NO(b,i)に、その音符NO(b,i)の音符プロパティpと共通する音符プロパティpが対応付けられた技巧特徴量Sの代表値を割り当てる。これにより、情報処理サーバ10の制御部16は、歌唱特徴データMSを生成する。
<カラオケ演奏処理>
次に、カラオケ装置30の制御部50が実行するカラオケ演奏処理について説明する。
このカラオケ演奏処理は、カラオケ演奏処理を実行するための処理プログラムを起動する指令が入力されると起動される。
図6に示すカラオケ演奏処理では、起動されると、制御部50は、まず、入力受付部34を介して指定された楽曲(即ち、特定楽曲)に対応するMIDI楽曲MDを、情報処理サーバ10の記憶部14から取得する(S510)。続いて、制御部50は、情報処理サーバ10の記憶部14に格納されている全ての歌唱特徴データMSの中から、入力受付部34を介して指定された指定歌手が特定楽曲を歌唱した場合の歌唱技巧を表す歌唱特徴データMSを取得する(S520)。
さらに、カラオケ演奏処理では、制御部50は、S510にて取得したMIDI楽曲MD及びS520にて取得した歌唱特徴データMSに基づいて、技巧音符NOを特定する(S530)。ここで言う技巧音符NOとは、指定歌手が特定楽曲を歌唱する場合に、歌唱技巧が用いられる特定楽曲上の音符である。具体的に本実施形態においては、予め規定された閾値以上の技巧特徴量Sと対応付けられた音符NO(c,i)それぞれを技巧音符NO(c,i)として特定すれば良い。つまり、MIDI楽曲MDの音符NO(c,i)において、その音符NO(c,i)に対応する“ビブラート特徴量vib”が第1閾値以上であれば、指定歌手が「ビブラート」を用いる技巧音符NO(c,i)であるものと特定する。また、歌唱特徴データMSの音符NO(c,i)において、その音符NO(c,i)に対応する“しゃくり特徴量rise”が第2閾値以上であれば、指定歌手が「しゃくり」を用いる技巧音符NO(c,i)であるものと特定する。
なお、ここでの符号cは、S510にて取得したMIDI楽曲MDに対応する楽曲を識別する符号である。
さらに、S530では、制御部50は、技巧音符NO(c,i)それぞれに対して技巧情報を初期値に設定する。本実施形態における技巧情報とは、各技巧音符NO(c,i)にて指定歌手が用いる歌唱技巧の種類を表す情報である。
続いて、制御部50は、S510にて取得したMIDI楽曲MDを演奏し、歌詞を含む各種情報を表示部64に表示する(S540)。
具体的にS540におけるMIDI楽曲MDの演奏では、制御部50は、楽曲再生部36にMIDI楽曲MDを時間軸に沿って順次出力する。そのMIDI楽曲MDを取得した楽曲再生部36は、楽曲の演奏を行う。そして、楽曲再生部36によって演奏された楽曲の音源信号が、出力部42を介してスピーカ60へと出力される。すると、スピーカ60は、音源信号を音に換えて出力する。
また、S540では、制御部50は、各種情報を表す画像信号を映像制御部46に出力する。その画像信号を取得した映像制御部46は、楽曲再生部36での特定楽曲の演奏に同期させて、各種情報を表示部64に表示する。なお、表示部64に表示される各種情報には、特定楽曲の各音符NOにおける歌詞の他に、技巧情報、及び各技巧音符NO(c,i)において、カラオケ装置30のユーザが歌唱技巧を再現できたか否かを表す成否情報
を含む。
本実施形態においては、図7に示すように特定楽曲の歌唱旋律を構成する各音符NOがピアノロール状に表示されても良い。この場合、そのピアノロール状に表示された各音符NO上に、その音符NOに割り当てられた歌詞が表示されても良い。さらに、本実施形態においては、技巧音符NO(c,i)にて用いられる歌唱技巧が「ビブラート」であれば、「ビブラート」を意味するアイコンが技巧情報として、当該技巧音符NOに表示されても良い。「ビブラート」を意味するアイコンは、“波形”のアイコンであっても良い。なお、技巧音符NO(c,i)にて用いられる歌唱技巧が「しゃくり」であれば、「しゃくり」を意味するアイコンが技巧情報として、当該技巧音符NOに表示されても良い。「しゃくり」を意味するアイコンは、“上向きの矢印”のアイコンであっても良い。
続いて、カラオケ演奏処理では、制御部50は、マイク62及びマイク入力部44を介して入力された音声を歌唱音声データとして取得する(S550)。そして、制御部50は、S530にて取得した歌唱音声データを記憶部38に記憶する(S560)。
続いて、カラオケ演奏処理では、制御部50は、記憶部38に記憶されている歌唱音声データに基づいて、楽曲における時間軸に沿った歌唱音声データから、音符歌唱データVos(c,i)を抽出する(S570)。ここで言う音符歌唱データVosとは、現時点音符NO(c,i)を歌唱した歌唱波形である。この音符歌唱データの特定は、例えば、「ボーカルデータ」を「歌唱音声データ」へと読み替えた上で、特徴量算出処理におけるS160と同様の手法を用いれば良い。
続いて、カラオケ演奏処理では、制御部50は、各音符歌唱データVos(c,i)における歌唱技巧の特徴量を表す歌唱特徴量SS(c,i)を算出する(S580)。ここで言う歌唱特徴量SS(c,i)には、歌声ビブラート特徴量Vvib(c,i)と、歌声しゃくり特徴量Vrise(c,i)とを含む。
このうち、歌声ビブラート特徴量Vvib(c,i)は、音符歌唱データVos(c,i)における“ビブラート”についての歌唱技巧量である。歌声しゃくり特徴量Vrise(c,i)は、音符歌唱データVos(c,i)における“しゃくり”についての歌唱技巧量である。これらの歌声ビブラート特徴量Vvib(c,i)、歌声しゃくり特徴量Vrise(c,i)の算出方法は、「ボーカルデータ」を「歌唱音声データ」へと、「音符ボーカル」を「音符歌唱データ」へと読み替えた上で、特徴量算出処理におけるS170と同様の手法を用いれば良い。
カラオケ演奏処理では、続いて、制御部50は、S520にて取得した歌唱特徴データに含まれる技巧特徴量S(c,i)と、S580にて算出した歌唱特徴量SS(c,i)とを、現時点音符NO(c,i)について比較する(S590)。そして、制御部50は、S590での比較の結果、技巧特徴量S(c,i)と歌唱特徴量SS(c,i)との差分である技巧差分が、予め規定された規定条件を満たしているか否かを判定する(S590)。ここで言う規定条件とは、指定歌手が用いた歌唱技巧をユーザが再現できていることを表す条件である。規定条件として、技巧差分が、予め規定された閾値範囲内であることが考えられる。
例えば、技巧音符NO(c,i)において、ビブラート特徴量vib(c,i)から歌声ビブラート特徴量Vvib(c,i)を減算した結果の絶対値が、予め規定された第1規定閾値以上であれば、技巧差分が規定条件を満たしているもの、即ち、指定歌手が用いた「ビブラート」をユーザが再現できていないものと判定すれば良い。また、技巧音符NO(c,i)において、しゃくり特徴量rise(c,i)から歌声しゃくり特徴量Vr
ise(c,i)を減算した結果の絶対値が、予め規定された第2規定閾値以上であれば、技巧差分が規定条件を満たしているもの、即ち、指定歌手が用いた「しゃくり」をユーザが再現できていないものと判定すれば良い。
そして、S590での判定の結果、技巧差分が規定条件を満たしていれば(S600:YES)、制御部50は、カラオケ演奏処理をS610へと移行させる。
そのS610では、制御部50は、現時点音符NOに対する成否情報、及び対象音符NOの技巧情報の表示態様を標準態様に設定する。なお、対象音符NOとは、現時点音符NO(c,i)の音符プロパティpと同一の音符プロパティpを有した音符NOの中で、特定楽曲における時間軸に沿って現時点音符よりも後に登場する音符NOである。
すなわち、S610では、図8に示すように、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」を用いている場合にユーザが「ビブラート」または「しゃくり」を再現できていれば、現時点音符NOに対して、「ビブラート」または「しゃくり」を再現できていることを意味する成功アイコンが、成否情報として表示されるように設定することを、成否情報の標準態様の設定として実行する。ここでの成功アイコンは、例えば、二重丸である。また、S610では、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」を用いている場合にユーザが「ビブラート」または「しゃくり」を再現できていれば、全ての対象音符NOに対する技巧情報の設定を初期設定に維持することを、技巧情報の標準態様の設定として実行する。
その後、制御部50は、詳しくは後述するS650へとカラオケ演奏処理を移行させる。
一方、S590での比較の結果、技巧差分が規定条件を満たしていなければ(S600:NO)、制御部50は、カラオケ演奏処理をS620へと移行させる。そのS620では、制御部50は、技巧特徴量S(c,i)と歌唱特徴量SS(c,i)とのズレが、歌唱者強調を表しているか歌唱者不再現を表しているかを判定する。ここで言う歌唱者強調とは、指定歌手が用いる歌唱技巧に対して、ユーザが歌唱技巧を強調して歌唱し過ぎている状態である。一方、歌唱者不再現とは、指定歌手が用いる歌唱技巧に対して、ユーザが歌唱技巧を再現できていない状態である。
本実施形態においては、現時点音符NOが技巧音符以外の音符NOであり、かつ、歌唱特徴量SS(c,i)が、ユーザが歌唱技巧を実行したことを表している場合には、歌唱者強調であるものと判定する。具体的には、技巧特徴量Sから歌唱者特徴量SSを減算した結果が、負の値であり、かつ、その絶対値が予め規定された第1規定閾値を上回っていれば、歌唱者強調であるものと判定する。
一方、本実施形態においては、現時点音符NOが技巧音符であり、かつ、歌唱特徴量SS(c,i)が、ユーザが歌唱技巧を実行したことを表していない場合には、歌唱者強調でない(歌唱者不再現である)ものと判定する。具体的には、技巧特徴量Sから歌唱者特徴量SSを減算した結果が、正の値であり、かつ、その絶対値が予め規定された第2規定閾値を上回っていれば、歌唱者不再現であるものと判定する。
そして、S620での判定の結果、歌唱者強調であれば(S620:YES)、制御部50は、現時点音符NOに対する成否情報、及び対象音符NOの技巧情報の表示態様を、抑制態様に設定する(S630)。
すなわち、S630では、図8に示すように、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」などの歌唱技巧を用いていない場合にユーザが「ビブラート」または「しゃくり」を用いて歌唱していれば、現時点音符NOに対して、「ビブラー
ト」または「しゃくり」が不要であることを意味する抑制アイコンが、成否情報として表示されるように設定することを、成否情報の抑制態様の設定として実行する。ここでの抑制アイコンは、例えば、「×印」である。また、S630では、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」などの歌唱技巧を用いていない場合にユーザが「ビブラート」または「しゃくり」を用いて歌唱していれば、全ての対象音符NOに対する技巧情報として、抑制アイコンを表示することを、技巧情報の抑制態様の設定として実行する。
その後、制御部50は、カラオケ演奏処理をS650へと移行させる。
一方、S620での判定の結果、歌唱者強調でなければ(即ち、歌唱者不再現であれば)(S620:NO)、制御部50は、現時点音符NOに対する成否情報、及び対象音符NOの技巧情報の表示態様を、強調態様に設定する(S640)。
すなわち、S640では、図8に示すように、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」などの歌唱技巧を用いている場合にユーザが「ビブラート」または「しゃくり」を用いて歌唱していなければ、現時点音符NOに対して、「ビブラート」または「しゃくり」を用いるべきであることを意味する第1強調アイコンが、成否情報として表示されるように設定することを、成否情報の強調態様の設定として実行する。第1強調アイコンは、例えば、技巧情報のアイコンを破線としたアイコンである。
また、S640では、現時点音符NOにおいて指定歌手が「ビブラート」または「しゃくり」などの歌唱技巧を用いている場合にユーザが「ビブラート」または「しゃくり」を用いて歌唱していなければ、全ての対象音符NOに対する技巧情報として、「ビブラート」または「しゃくり」を用いるべきであることを意味する第2強調アイコンを表示することを、技巧情報の強調態様の設定として実行する。第2強調アイコンは、例えば、技巧情報を表すアイコンを拡大したアイコンである。
その後、制御部50は、カラオケ演奏処理をS650へと移行させる。
カラオケ演奏処理では、制御部50は、続いて、特定楽曲の演奏が終了したか否かを判定する(S650)。このS650での判定の結果、特定楽曲の演奏が終了していなければ(S650:NO)、制御部50は、カラオケ演奏処理をS540へと戻す。そのS540では、制御部50は、現時点音符NOに対する成否情報を表示すると共に、対象音符NOに対する技巧情報を、S610,S630,S640にて設定した表示態様にて表示する。その後、S550からS650までのステップを繰り返す。
一方、S650での判定の結果、特定楽曲の演奏が終了していれば(S650:YES)、制御部50は、カラオケ演奏処理を終了する。
つまり、本実施形態のカラオケ演奏処理では、特定楽曲の演奏中に入力された音声データを解析し、その音声データにて表現された各音符(構成音符)NOでの歌唱技巧の特徴量を表す歌唱特徴量SSを算出する。その算出した歌唱特徴量Sと、歌唱特徴データMSに含まれる技巧特徴量Sとを、互いに対応する音符NOごとに比較する。そして、比較の結果、技巧特徴量Sと歌唱特徴量SSとの差分である技巧差分が、予め規定された規定条件を満たしていなければ、現時点音符NOの音符プロパティpと同一の音符プロパティpを有し、かつ、現時点音符NOとは異なる音符NOである対象音符NOに対して用いるべき歌唱技巧を表示する表示制御を実行する。
その表示制御では、現時点音符NOにおいて指定歌手が歌唱技巧を用いている場合にその歌唱技巧をユーザが再現できていれば、現時点音符NOに対して、歌唱技巧を再現できていることを意味する成功アイコンを成否情報として表示する。また、その現時点音符NOに対応する全ての対象音符NOに、「ビブラート」を意味する“波形”のアイコンを技
巧情報として表示する。
表示制御では、現時点音符NOにおいて指定歌手が歌唱技巧を用いていない場合に歌唱技巧を用いてユーザが歌唱していれば、現時点音符NOに対して、歌唱技巧が不要であることを意味する抑制アイコンを表示する。また、その現時点音符NOに対応する全ての対象音符NOに、技巧情報として抑制アイコンを表示する。
さらに、表示制御では、現時点音符NOにおいて指定歌手が歌唱技巧を用いている場合にその歌唱技巧を用いてユーザが歌唱していなければ、現時点音符NOに対して、歌唱技巧を用いるべきであることを意味する第1強調アイコンを成否情報として表示する。また、その現時点音符NOに対応する全ての対象音符NOに、歌唱技巧を用いるべきであることを意味する第2強調アイコンを技巧情報として表示する。
なお、本実施形態のカラオケシステム1が、特許請求の範囲に記載された表示制御システムの一例であり、カラオケ装置30が、特許請求の範囲に記載された表示制御装置の一例である。
[実施形態の効果]
以上説明したように、カラオケ装置30によれば、技巧差分が規定条件を満たしていない音符NOの音符プロパティpと同一の音符プロパティpを有し、かつ、当該音符NOとは異なる音符(即ち、対象音符)NOに対して用いるべき歌唱技巧を表示できる。
この結果、カラオケ装置30の利用者は、楽曲にて用いるべき歌唱技巧を実現できたか否かを認識できる。
しかも、カラオケ装置30によれば、対象音符NOに対して用いるべき歌唱技巧を表示している。そして、この表示を視認した利用者は、当該対象音符NOを歌唱する際にその歌唱技巧を実現するように留意する。このため、カラオケ装置30によれば、利用者自身が歌唱した際の歌唱技巧を、指定歌手が歌唱した場合に用いる歌唱技巧に近づけることができ、利用者自身の歌唱を指定歌手の歌唱態様に近づけることができる。
これらのことから、カラオケ装置30によれば、歌唱技巧の実現の成否を利用者に認識させ、その歌唱技巧を利用者が実現可能となる。
特に、カラオケ演奏処理においては、技巧特徴量S(c,i)が歌唱技巧を実行したことを表し、かつ、歌唱特徴量SS(c,i)が歌唱技巧を未実行であることを表している場合、現時点音符NO(c,i)において、歌唱技巧を未実行である旨を表示している。このため、カラオケ装置30によれば、歌唱技巧での歌唱が未実行である旨を利用者に認識させることができる。
また、カラオケ演奏処理においては、技巧特徴量S(c,i)が歌唱技巧を未実行であることを表し、かつ、歌唱特徴量SS(c,i)が歌唱技巧を実行したことを表している場合、現時点音符NO(c,i)において、歌唱技巧が不要である旨を表示している。このため、カラオケ装置30によれば、歌唱技巧が不要である旨、即ち、歌唱技巧が過剰であることを利用者に認識させることができる。
なお、カラオケ演奏処理においては、「ビブラート」及び「しゃくり」を歌唱技巧として、技巧特徴量S(c,i)と歌唱特徴量SS(c,i)との比較を実行している。このため、カラオケ装置30によれば、「ビブラート」または「しゃくり」の成否を利用者に認識させることができる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能
である。
例えば、上記実施形態のカラオケ演奏処理においては、特定楽曲の演奏中に、対象音符NOに対する技巧情報及び成否情報の表示態様を変更していたが、本発明における表示制御は、これに限るものではない。すなわち、表示制御は、特定楽曲を演奏する際に、その特定楽曲を過去に演奏した際に技巧特徴量Sと歌唱特徴量SSとを比較した結果に従った成否情報及び技巧情報を、全ての技巧音符に対して表示するようにしても良い。
さらには、本発明における表示制御として、特定楽曲の演奏が終了した後に、各技巧音符に対する、技巧特徴量Sと歌唱特徴量SSとを比較した結果を表示することを実施しても良い。の場合、上記実施形態のカラオケ演奏処理において、特定楽曲の演奏中に順次実行していた技巧特徴量S(c,i)と歌唱特徴量SS(c,i)との比較は、特定楽曲の演奏が終了した後に音符NOごとに実行しても良い。
また、上記実施形態においては、歌唱特徴生成処理を情報処理サーバ10が実行していたが、歌唱特徴生成処理を実行する装置は、情報処理サーバ10に限るものではない。すなわち、歌唱特徴生成処理を実行する装置は、情報処理装置2であっても良いし、カラオケ装置30であっても良い。
なお、上記実施形態の構成の一部を省略した態様も本発明の実施形態である。また、上記実施形態と変形例とを適宜組み合わせて構成される態様も本発明の実施形態である。また、特許請求の範囲に記載した文言によって特定される発明の本質を逸脱しない限度において考え得るあらゆる態様も本発明の実施形態である。
また、本発明は、前述した表示制御装置の他、表示制御を実現するためにコンピュータが実行するプログラム、音声合成の方法等、種々の形態で実現することができる。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
カラオケ演奏処理のS520を実行することで得られる機能が、特許請求の範囲に記載された特徴データ取得手段の一例であり、S550〜S580を実行することで得られる機能が、特徴量算出手段の一例である。また、カラオケ演奏処理のS590を実行することで得られる機能が、特許請求の範囲に記載された比較手段の一例であり、S540,S600〜S640を実行することで得られる機能が、特許請求の範囲に記載された表示制御手段の一例である。
技巧特徴生成処理のS110〜S150を実行することで得られる機能が、特許請求の範囲に記載されたボーカル取得手段の一例であり、S120を実行することで得られる機能が、特許請求の範囲に記載された楽譜取得手段の一例であり、S170,S210を実行することで得られる機能が、特許請求の範囲に記載された特徴量決定手段の一例である。また、歌唱特徴生成処理のS310〜S340を実行することで得られる機能が、特許請求の範囲に記載された特徴生成手段の一例である。
1…音声合成システム 2…情報処理装置 3…入力受付部 4…外部出力部 5,14,38…記憶部 6,16,50…制御部 7,18,52…ROM 8,20,54…RAM 9,22,56…CPU 10…情報処理サーバ 12,32…通信部 30…カラオケ装置 34…入力受付部 36…楽曲再生部 40…音声制御部 42…出力部 44…マイク入力部 46…映像制御部 60…スピーカ 62…マイク 64…表示部

Claims (6)

  1. 楽曲に関する情報の表示を制御する表示制御装置であって、
    音高と音価との組み合わせからなる音符を複数有し、前記複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲のうち、指定された1つの楽曲を特定楽曲とし、前記特定楽曲を構成する音符であって、前記歌詞が割り当てられた音符を構成音符とし、
    指定された歌手である指定歌手が前記楽曲を歌唱したボーカル音を含む楽曲データから、前記ボーカル音を表すボーカルデータを抽出するステップと、前記楽曲を構成する複数の音符から構成される楽譜データを取得するステップと、その取得した楽譜データを構成する各音符及び前記ボーカルデータに基づいて、前記楽曲における歌唱旋律を構成する音符それぞれに対応する前記ボーカルデータの区間である音符ボーカルデータを特定して、各音符ボーカルデータに対応する音符にて前記指定歌手が用いる歌唱技巧の特徴量を表す技巧特徴量を決定するステップと、前記特定楽曲の楽譜を表す対象楽譜データを取得し、その取得した対象楽譜データに含まれる前記構成音符に、前記構成音符の音高,音価、及び当該構成音符に割り当てられた歌詞の組み合わせである音符プロパティが一致する音符での前記技巧特徴量を対応付けることで、前記特定楽曲を構成する構成音符の各々での前記指定歌手の技巧特徴量を表す歌唱特徴データを生成するステップとを実行することで生成された、前記歌唱特徴データを取得する特徴データ取得手段と、
    前記特定楽曲の演奏中に入力された音声データを解析し、前記音声データにて表現された前記構成音符それぞれでの歌唱技巧の特徴量を表す歌唱特徴量を算出する特徴量算出手段と、
    前記特徴データ取得手段で取得した歌唱特徴データに含まれる技巧特徴量と、前記特徴量算出手段で算出された歌唱特徴量とを、互いに対応する構成音符ごとに比較する比較手段と、
    前記比較手段での比較の結果、前記技巧特徴量と前記歌唱特徴量との差分である技巧差分が、予め規定された規定条件を満たしていなければ、当該構成音符の音符プロパティと同一の音符プロパティを有し、かつ、当該構成音符とは異なる構成音符である対象音符に対して用いるべき歌唱技巧を表示する表示制御を実行する表示制御手段と
    を備えることを特徴とする表示制御装置。
  2. 前記表示制御手段は、
    前記歌唱特徴データに含まれる技巧特徴量が前記歌唱技巧を実行したことを表し、かつ、前記歌唱特徴量が前記歌唱技巧を未実行であることを表している場合、前記技巧差分が前記規定条件を満たしていないものとし、前記歌唱技巧での歌唱が未実行である旨を表示することを前記表示制御として実行する
    ことを特徴とする請求項1に記載の表示制御装置。
  3. 前記表示制御手段は、
    前記歌唱特徴データに含まれる技巧特徴量が前記歌唱技巧を未実行であることを表し、かつ、前記歌唱特徴量が前記歌唱技巧を実行したことを表している場合、前記技巧差分が前記規定条件を満たしていないものとし、前記歌唱技巧での歌唱が不要である旨を表示することを前記表示制御として実行する
    ことを特徴とする請求項1または請求項2に記載の表示制御装置。
  4. 前記歌唱技巧には、ビブラートを含み、
    前記表示制御手段は、
    前記比較手段での比較の結果、前記歌唱特徴量におけるビブラートの特徴量と、前記技巧特徴量におけるビブラートの特徴量との差分が予め規定された第1閾値範囲を超えていれば、前記技巧差分が前記規定条件を満たしていないものとする
    ことを特徴とする請求項1から請求項3までのいずれか一項に記載の表示制御装置。
  5. 前記歌唱技巧には、時間軸に沿って連続し、互いに異なる音高を有した2つの音符を含む音符群に対して発声音高を変化させつつ連続して歌唱する、しゃくりを含み、
    前記表示制御手段は、
    前記比較手段での比較の結果、前記歌唱特徴量におけるしゃくりの特徴量と、前記技巧特徴量におけるしゃくりの特徴量との差分が予め規定された第2閾値範囲を超えていれば、前記技巧差分が前記規定条件を満たしていないものとする
    ことを特徴とする請求項1から請求項4までのいずれか一項に記載の表示制御装置。
  6. 楽曲に関する情報の表示を制御する表示制御システムであって、
    音高と音価との組み合わせからなる音符を複数有し、前記複数の音符のうちの少なくとも一部に歌詞が割り当てられた楽曲のうち、指定された1つの楽曲を特定楽曲とし、前記特定楽曲を構成する音符であって、前記歌詞が割り当てられた音符を構成音符とし、
    指定された歌手である指定歌手が歌唱したボーカル音を含む楽曲データから、前記ボーカル音を表すボーカルデータを抽出するボーカル取得手段と、
    前記楽曲を構成する複数の音符から構成される楽譜データを取得する楽譜取得手段と、
    前記楽譜取得手段で取得した楽譜データを構成する各音符及び前記ボーカル取得手段で取得したボーカルデータに基づいて、前記楽曲における歌唱旋律を構成する音符それぞれに対応する前記ボーカルデータの区間である音符ボーカルデータを特定して、各音符ボーカルデータにおける前記指定歌手が用いる歌唱技巧である特定技巧の特徴量を表す技巧特徴量を決定する特徴量決定手段と、
    前記特定楽曲の楽譜を表す対象楽譜データを取得し、その取得した対象楽譜データに含まれる前記構成音符に、前記構成音符の音高,音価、及び当該構成音符に割り当てられた歌詞の組み合わせである音符プロパティが一致する音符での前記技巧特徴量を対応付けることで、前記特定楽曲を構成する構成音符の各々での前記指定歌手の技巧特徴量を表す歌唱特徴データを生成する特徴生成手段と、
    前記特徴生成手段で生成した歌唱特徴データを取得する特徴データ取得手段と、
    前記特定楽曲の演奏中に入力された音声データを解析し、前記音声データにて表現された前記構成音符それぞれでの歌唱技巧の特徴量を表す歌唱特徴量を算出する特徴量算出手段と、
    前記特徴データ取得手段で取得した歌唱特徴データに含まれる技巧特徴量と、前記特徴量算出手段で算出された歌唱特徴量とを、互いに対応する構成音符ごとに比較する比較手段と、
    前記比較手段での比較の結果、前記技巧特徴量と前記歌唱特徴量との差分である技巧差分が、予め規定された規定条件を満たしていれば、当該構成音符の音符プロパティと同一の音符プロパティを有し、かつ、当該構成音符とは異なる構成音符である対象音符に対して用いるべき歌唱技巧を表示する表示制御を実行する表示制御手段と
    を備えることを特徴とする表示制御システム。
JP2014175829A 2014-08-29 2014-08-29 表示制御装置,及び表示制御システム Active JP6252408B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014175829A JP6252408B2 (ja) 2014-08-29 2014-08-29 表示制御装置,及び表示制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014175829A JP6252408B2 (ja) 2014-08-29 2014-08-29 表示制御装置,及び表示制御システム

Publications (2)

Publication Number Publication Date
JP2016051034A JP2016051034A (ja) 2016-04-11
JP6252408B2 true JP6252408B2 (ja) 2017-12-27

Family

ID=55658583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014175829A Active JP6252408B2 (ja) 2014-08-29 2014-08-29 表示制御装置,及び表示制御システム

Country Status (1)

Country Link
JP (1) JP6252408B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007232750A (ja) * 2006-02-27 2007-09-13 Yamaha Corp カラオケ装置、制御方法およびプログラム
JP4479701B2 (ja) * 2006-08-08 2010-06-09 ヤマハ株式会社 楽曲練習支援装置、動的時間整合モジュールおよびプログラム
JP2008139426A (ja) * 2006-11-30 2008-06-19 Yamaha Corp 評価用データのデータ構造、カラオケ装置及び記録媒体

Also Published As

Publication number Publication date
JP2016051034A (ja) 2016-04-11

Similar Documents

Publication Publication Date Title
JP6060867B2 (ja) 情報処理装置,データ生成方法,及びプログラム
JP5598516B2 (ja) カラオケ用音声合成システム,及びパラメータ抽出装置
JP6075314B2 (ja) プログラム,情報処理装置,及び評価方法
JP6075313B2 (ja) プログラム,情報処理装置,及び評価データ生成方法
JP6056799B2 (ja) プログラム、情報処理装置、及びデータ生成方法
WO2023058173A1 (ja) 音制御装置およびその制御方法、電子楽器、プログラム
JP5782972B2 (ja) 情報処理システム,プログラム
JP6406273B2 (ja) カラオケ装置,及びプログラム
JP6260565B2 (ja) 音声合成装置、及びプログラム
JP6252408B2 (ja) 表示制御装置,及び表示制御システム
JP5983670B2 (ja) プログラム、情報処理装置、及びデータ生成方法
JP6365483B2 (ja) カラオケ装置,カラオケシステム,及びプログラム
JP6281447B2 (ja) 音声合成装置,及び音声合成システム
JP2013210501A (ja) 素片登録装置,音声合成装置,及びプログラム
JP6406182B2 (ja) カラオケ装置、及びカラオケシステム
JP6380305B2 (ja) データ生成装置、カラオケシステム、及びプログラム
JP6011506B2 (ja) 情報処理装置,データ生成方法,及びプログラム
JP5810947B2 (ja) 発声区間特定装置、音声パラメータ生成装置、及びプログラム
JP5418525B2 (ja) カラオケ装置
JP6252517B2 (ja) 音声合成装置、及びプログラム
JP5569307B2 (ja) プログラム、及び編集装置
JP5287782B2 (ja) 歌唱補助装置、及びプログラム
JP6260499B2 (ja) 音声合成システム、及び音声合成装置
JP6365561B2 (ja) カラオケシステム、カラオケ装置、及びプログラム
JP5549651B2 (ja) 歌詞出力データ修正装置,及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171113

R150 Certificate of patent or registration of utility model

Ref document number: 6252408

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150