以下、本発明の一実施形態におけるカラオケシステム100について、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。
<実施形態>
[全体構成]
本発明の一実施形態に係るカラオケシステム100は、合成歌唱音を生成することができる電子楽器(例えば、電子鍵盤装置)を用いてカラオケをする場合に、演奏者に対し、電子楽器の演奏操作を支援するための画像(以下「操作支援画像」という)を表示する機能を有している。
図1は、本発明の一実施形態におけるカラオケシステム100の構成を示すブロック図である。カラオケシステム100は、カラオケ装置1、制御端末2、電子鍵盤装置3、カラオケ用サーバ1000、および歌唱合成用サーバ2000を備える。カラオケ装置1、制御端末2、カラオケ用サーバ1000および歌唱合成用サーバ2000は、LAN(Local Area Network)、WAN(Wide Area Network)またはインターネットなどのネットワークNWを介して接続されている。
カラオケ装置1は、歌唱曲が指定されると、その歌唱曲の伴奏を再生するとともに、歌唱曲に関連付けられた映像や歌詞テロップを表示画面に表示させる機能を有している。歌唱曲の伴奏等は、カラオケ装置1の大容量記憶装置から読み出して再生される。指定された歌唱曲に対応する楽曲データが記憶されていない場合には、カラオケ用サーバ1000からダウンロードできるようになっている。
制御端末2は、スマートフォン、ノートパソコンなどの携帯型の情報端末であってもよいし、デスクトップパソコン等の据え置き型の情報端末であってもよい。また、制御端末2によって実行される機能は、制御端末2に対してアプリケーションプログラムをインストールして実行することにより実現されてもよい。なお、本実施形態では、制御端末2は、カラオケ装置1および電子鍵盤装置3に対してネットワークNWを介さずに近距離無線通信によって接続されるが、ネットワークNWを介した通信によって接続されてもよい。近距離無線通信としては、例えば、Bluetooth(登録商標)、赤外線通信などを用いた通信手段を用いることができる。
カラオケ用サーバ1000は、カラオケ装置1においてカラオケを提供するために必要な楽曲データを、曲IDに対応付けて記憶している記憶装置を備える。カラオケ用サーバ1000としては、公知のカラオケ用サーバを用いることができる。楽曲データには、カラオケで提供される歌唱曲に関連するデータ、例えば、ガイドメロディデータ(主旋律データともいう)、伴奏データ、歌詞データなどが含まれている。
ガイドメロディデータは、歌唱曲のメロディ(主旋律)を示すデータである。伴奏データは、歌唱曲の伴奏を示すデータである。ガイドメロディデータおよび伴奏データは、MIDI形式で表現されたデータであってもよい。さらに、ガイドメロディデータおよび伴奏データには、タイミングデータ(時間データ)を付加してもよい。このとき、ガイドメロディデータおよび伴奏データは、音高、発音レベル等の音楽要素を示すデータであり、時間データは、発音タイミングや発音時間を示すデータである。
歌詞データは、歌唱曲の歌詞を規定するデータであり、複数の文字データを含む。文字データは、例えばJIS(日本規格協会)規格に基づいたキャラクタコードであり、各文字に対応してそれぞれキャラクタコードが設定されている。また、歌詞データには、歌詞データに関連付けられたタイミングデータ(時間データ)も含まれる。この時間データは、表示される歌詞(文字)を色替えするタイミングを示すデータや歌唱曲の進行位置を示すためのデータが含まれている。この時間データを用いれば、歌唱曲の進行位置と、その進行位置において歌唱すべき歌詞の対応付けなどが可能となる。
歌唱合成用サーバ2000は、電子鍵盤装置3を用いた歌唱を行うために必要な各種制御データを記憶する記憶装置を備える。電子鍵盤装置3を用いた歌唱を行うために必要な制御データには、例えば、電子鍵盤装置3の動作や発音を規定する各種設定を行うための設定データや演奏者が電子鍵盤装置3を操作するに際しての操作支援画像を提供するためのガイド用シーケンスデータが含まれる。勿論、ここに挙げた設定データやガイド用シーケンスデータは、制御データの一例に過ぎず、歌唱合成用サーバ2000に記憶される制御データは、これらのデータに限定されるものではない。
上述した設定データは、曲IDに対応付けて記憶されていてもよい。例えば、曲IDに対応する楽曲データのメロディ(主旋律)の音域に合わせて電子鍵盤装置3の音色を設定するための音色設定データ(音域設定データ)や、楽曲データごとに対応するビブラート、リバーブ、ピッチベンド等のエフェクト効果を与えるためのエフェクト効果設定データなどを含むことができる。
ガイド用シーケンスデータとは、歌詞データを構成する各文字に対し音高が割り当てられたデータである。ガイド用シーケンスデータは、演奏者が電子鍵盤装置3を演奏するに際しての操作支援画像を表示するために使用される。ガイド用シーケンスデータの詳細については後述する。
電子鍵盤装置3は、演奏操作子として鍵盤を備えた電子楽器の一例である。電子鍵盤装置3は、任意の鍵を押鍵すると、その鍵に対応する音高で予め設定された文字に対応する音(合成歌唱音)を発音することができる。したがって、鍵盤の操作により、簡単に合成歌唱音による歌唱を行うことができる。なお、本実施形態では、電子楽器の一例として電子鍵盤装置を例に示すが、本発明は、演奏操作子を備えた電子楽器全般に適用することが可能である。
続いて、カラオケ装置1、制御端末2および電子鍵盤装置3について、ハードウェア構成を説明する。
[カラオケ装置のハードウェア構成]
図2は、本発明の一実施形態におけるカラオケ装置の構成を示すブロック図である。カラオケ装置1は、制御部101、記憶部103、操作部105、表示制御部106、画像表示部107、通信部109、およびオーディオ信号処理部111を含む。これらの各構成は、バスを介して接続されている。また、オーディオ信号処理部111には、オーディオ信号の入力を受け付ける入力端子113およびスピーカ115が接続されている。入力端子113に入力されるオーディオ信号は、この例では、電子鍵盤装置3によって供給されたり、マイクロフォンから供給されたりする。
制御部101は、CPUなどの演算処理回路を含む。制御部101は、記憶部103に記憶された制御プログラムをCPUにより実行して、各種機能をカラオケ装置1において実現させる。記憶部103は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク等の記憶装置で構成される。記憶部103は、上述した制御プログラムを記憶する。制御プログラムは、ネットワーク経由でダウンロードされてもよいが、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。以下に説明する制御端末2および電子鍵盤装置3で用いられる制御プログラムについても同様に提供されてもよい。また、記憶部103は、カラオケ用サーバ1000からダウンロードした楽曲データや画像表示部107に表示する画像データを一時的に記憶するバッファとしても機能してもよい。
操作部105は、操作パネルなどの装置であり、入力された操作に応じた指示信号を制御部101に出力する。画像表示部107は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、表示制御部106による制御に基づいた画面が表示される。なお、操作部105と画像表示部107とを一体化して、タッチパネル型の画像表示部を構成してもよい。
表示制御部106は、画像表示部107に表示される画像を制御するDSP(Digital Signal Processor)であって、制御部101からの指示に応じて、マイクロプログラムに従って自立的に画像表示用データを生成する。表示される画像としては、歌唱曲に関連した映像、歌詞テロップなどが一般的であるが、本実施形態では、電子鍵盤装置3の演奏者に対して操作支援を行うための操作支援画像を表示する。表示制御部106のより詳細な機能については後述する。
通信部109は、制御部101の制御に基づいて、ネットワークNWを介してカラオケ用サーバ1000や歌唱合成用サーバ2000に接続したりする。また、近距離無線通信や無線LANによって制御端末2や電子鍵盤装置3と接続することも可能である。
オーディオ信号処理部111は、MIDI形式の信号からオーディオ信号を生成する音源、A/Dコンバータ、D/Aコンバータ等を含む。入力端子113から入力されたオーディオ信号は、オーディオ信号処理部111に出力され、オーディオ信号処理部111においてA/D変換されて制御部101に出力される。入力されたオーディオ信号は、記憶部103にバッファされて、歌唱の評価等に用いられてもよい。また、伴奏データは、制御部101によって読み出され、オーディオ信号処理部111においてオーディオ信号に変換され、スピーカ115から歌唱曲の伴奏音として出力される。このとき、入力端子113に入力されたオーディオ信号を伴奏音に合成して出力してもよい。
[制御端末のハードウェア構成]
制御端末2は、カラオケ装置1に対する制御(例えば、歌唱曲の指定、音量調整、トランスポーズ等)を実行したり、電子鍵盤装置3に対する制御(例えば、歌詞の設定、音色等の設定等)を実行したりする。また、カラオケ装置1が歌唱合成用サーバ2000と直接通信することができない場合に、歌唱合成用サーバ2000に記憶されたガイド用シーケンスデータをカラオケ装置1に転送したり、各種制御データを電子鍵盤装置3に転送したりする機能を持たせることもできる。
図3は、本発明の一実施形態における制御端末の構成を示すブロック図である。制御端末2は、制御部201、記憶部203、操作部205、表示制御部206、画像表示部207、および通信部209を含む。これらの各構成は、バスを介して接続されている。
制御部201は、CPUなどの演算処理回路を含む。制御部201は、記憶部203に記憶された制御プログラムをCPUにより実行して、各種機能を制御端末2において実現させる。記憶部203は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク等の記憶装置で構成される。記憶部203は、上述した制御プログラムを記憶する。
操作部205は、操作パネルなどの装置であり、入力された操作に応じた信号を制御部201に出力する。画像表示部207は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、表示制御部206による制御に基づいた画面が表示される。なお、操作部205と画像表示部207とを一体化して、タッチパネル型の画像表示部を構成してもよい。
表示制御部206は、画像表示部207に表示される画像を制御するDSPであって、制御部201からの指示に応じて、マイクロプログラムに従って自立的に画像表示用データを生成する。
通信部209は、制御部201の制御に基づいて、ネットワークNWを介してカラオケ用サーバ1000や歌唱合成用サーバ2000に接続したりする。また、近距離無線通信、無線LAN経由の通信、またはUSBケーブル等の通信ケーブルを用いた通信によってカラオケ装置1や電子鍵盤装置3と接続することも可能である。
[電子鍵盤装置のハードウェア構成]
電子鍵盤装置3は、演奏操作子である鍵盤の操作に応じて、予め設定された設定データ内容に従って合成歌唱音を生成する装置(電子楽器)である。本実施形態では、生成された合成歌唱音は、入力端子113を介してカラオケ装置1のスピーカ115から出力されるが、電子鍵盤装置3に設けられたスピーカから出力されるように構成してもよい。
図4は、本発明の一実施形態における電子鍵盤装置の構成を示すブロック図である。電子鍵盤装置3は、制御部301、記憶部303、操作部305、表示制御部306、画像表示部307、合成歌唱音生成部308、通信部309、および鍵盤310を含む。これらの各構成は、バスを介して接続されている。なお、本実施形態では、電子鍵盤装置3において歌詞を表示できるように表示制御部306及び画像表示部307が設けられているが、歌詞を表示する必要がなければ省略することもできる。
制御部301は、CPUなどの演算処理回路を含む。制御部301は、記憶部303に記憶された制御プログラムをCPUにより実行して、各種機能を電子鍵盤装置3において実現させる。記憶部303は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク等の記憶装置で構成される。記憶部303は、上述した制御プログラムを記憶する。
記憶部303は、合成歌唱音を示すオーディオ信号を生成する際に用いる設定データ(音色設定データ、エフェクト効果設定データ等)、歌詞データ、及び合成歌唱音を生成するための音声素片等を記憶する。歌詞データとしては、少なくとも指定された歌唱曲の歌詞を示す文字データが記憶されていればよい。また、歌詞データは、カラオケ装置1から供給されてもよいし、制御端末2から供給されてもよい。
操作部305は、スイッチ、ボリュームつまみ、静電容量センサなどの装置であり、入力された操作に応じた指示信号を制御部301に出力する。
画像表示部307は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、表示制御部306による制御に基づいた画面が表示される。なお、操作部305と画像表示部307とを一体化して、タッチパネル型の画像表示部を構成してもよい。
合成歌唱音生成部308は、上述した音色設定データ等の設定データ、歌詞データ、後述する演奏信号、及び音声素片等に基づいて、歌唱すべき歌詞に対応する音(合成歌唱音)を生成する。合成歌唱音の生成に関しては、公知の技術を用いることができる。例えば、上述した特許文献1、2に記載された技術を用いてもよい。
通信部309は、制御部301の制御に基づいて、カラオケ装置1や制御端末2との通信を行う。ここで行われる通信は、近距離無線通信や無線LAN経由の通信であってもよいし、USBケーブル等の通信ケーブルを用いた通信であってもよい。
鍵盤310は、複数の鍵が配列されている。各鍵を操作すると、その操作に応じた演奏信号が制御部301に出力される。演奏信号は、操作された鍵の位置を示す情報(キーナンバ)、押鍵したことを示す情報(キーオン)もしくは離鍵したことを示す情報(キーオフ)、および押鍵速度(ベロシティ)等を含む。具体的には、押鍵されると、キーオン、ベロシティおよびキーナンバが対応付けられて出力され、離鍵するとキーオフが出力される。合成歌唱音生成部308は、この演奏信号を用いて、合成歌唱音を生成する。
ここで、合成歌唱音生成部308による合成歌唱音の生成処理の一例について説明する。図5は、本発明の一実施形態における合成歌唱音生成部における処理を説明するフローチャートである。
歌唱曲の指定や歌詞データのダウンロードの完了等を契機として図5に示す処理が開始されると、まず、合成歌唱音生成部308は、指定された歌唱曲の歌詞データが示す歌詞の最初の文字をポインタで指定する(ステップS301)。歌詞データは、記憶部303に確保された所定のメモリ領域に記憶しておけばよい。本実施形態では、所定のメモリ領域に現在指定されている歌唱曲の歌詞データを記憶し、演奏者によって歌唱曲が選択されるたびに当該メモリ領域の内容を更新する構成とする。しかし、予め複数の歌詞データを記憶しておき、演奏者によって歌唱曲が選択されると、その識別番号等を用いて歌唱すべき歌詞データを選択することも可能である。
歌唱すべき歌詞の最初の文字が指定されたら、鍵盤310に対して押鍵操作(演奏操作)が行われたか否かを判定し(ステップS303)、押鍵が行われるまで待機する(ステップS303;No)。押鍵操作が行われたか否かは、鍵盤310から出力されたキーオン信号を制御部301が取得することにより認識することができる。
制御部301がキーオン信号を取得し、鍵盤310に対して押鍵操作が行われたことを認識すると(ステップS303;Yes)、制御部301は、ポインタで指定されている文字データを読み出し(ステップS305)、合成歌唱音生成部308に転送する。このとき、押鍵操作が行われた鍵の位置を示すキーナンバも合成歌唱音生成部308に転送される。
合成歌唱音生成部308では、キーナンバにより指定される音高情報と読み出した文字を発声させるための音声素片とを用いて、読み出した文字に対応する発音(合成歌唱音)を示すオーディオ信号が生成される(ステップS307)。例えば、読み出した文字が「か(ka)」であり、押鍵操作された鍵が「C4」である場合には、C4の音高で「か(ka)」を発声させる合成歌唱音が生成される。このように生成された合成歌唱音は、通信部309を介してカラオケ装置1へ送信され、再生される。勿論、電子鍵盤装置3がスピーカを備えるのであれば、当該スピーカから再生してもよい。
現在ポインタで指定されている文字の合成歌唱音を生成したら、指定されている文字(読み出した文字)が歌詞の最後の文字であるか否かが判断される(ステップS309)。指定されている文字が歌詞の最後の文字ではない場合(ステップS309;No)、上述したメモリ領域に記憶されている次の文字にポインタを移動させて指定し(ステップS311)、次の押鍵操作まで待機する(ステップS303;No)。その後、同様の手順で、歌詞に沿って順番に文字が指定されていき、最後の文字になった場合(ステップS309;Yes)には、再びステップS301に戻る。勿論、ポインタを歌詞データの先頭に戻すことなく処理を終了してもよい。
以上の処理により、押鍵操作に応じた音高に調整された歌詞が合成歌唱音として順次生成される。これらの合成歌唱音は、オーディオ信号としてカラオケ装置1に対して出力される。なお、操作部305等に対する所定の操作を受け付けると、強制的に次の文字が指定されるようにしてもよい。
また、歌詞をフレーズ単位で区分する情報を取得している場合には、所定の操作を受け付けると、いずれかのフレーズ(直前または直後など)の最初の文字が強制的に指定されるようにしてもよい。例えば、歌詞データ中の文字データとしてスペースやスラッシュなど特定の記号を示すデータが存在する場合に、その存在する位置をフレーズ区切りと判定したり、歌詞データ中のタイミングデータ内にフレーズ区切りを示す位置情報を持たせ、該位置情報の示す位置をフレーズ区切りと判定したりしてもよい。
[ガイド用シーケンスデータの構成]
続いて、表示制御部106の動作を説明する前に、その動作の前提となるガイド用シーケンスデータについて説明する。図6は、本発明の一実施形態におけるガイド用シーケンスデータを説明する図である。具体的には、図6(A)は、カラオケ用サーバ1000から提供される楽曲データに含まれるガイドメロディと歌詞の一部を五線譜の形式で表したものである。図6(B)は、歌唱合成用サーバ2000から提供されるガイド用シーケンスデータに含まれる主旋律を表すデータ(例えばノートデータ)と歌詞の一部を五線譜の形式で表したものである。
本実施形態のカラオケシステム100において、電子鍵盤装置3から正確な合成歌唱音を発音させるためには、演奏者は、適切なタイミングで歌詞を所望の音高で発音させたり、発音中の音高変化を行ったりする必要がある。タイミングについては、通常の歌唱時と同様に演奏者自身で判断できるため、特別な操作支援は不要である。したがって、演奏者に対する操作支援情報としては、指定した歌唱曲の伴奏に合わせて電子鍵盤装置3のどの鍵を押鍵するかを示す情報があればよい。これにより、押鍵タイミングをユーザーが伴奏から判断して、そのタイミングで正しい鍵を押鍵することにより、伴奏に合った合成歌唱音を発音させ、カラオケを楽しむことができる。
そこで、図6(A)を参照すると、カラオケ用サーバ1000から提供される楽曲データに含まれるガイドメロディと歌詞をそのまま五線譜形式にすると、必ずしも音高と歌詞とが対応していない場合がある。すなわち、「い」、「く」、「も」、「の」という歌詞(文字)は、それぞれ1つずつ音符(つまり、音高)が対応しているが、「つ」には音高が対応しておらず、八分音符の「ド」には歌詞が対応していない。
したがって、カラオケ用サーバ1000の楽曲データをそのまま上述した操作支援情報として用いると、「つ」の歌詞を発音することができないという問題が生じうる。また、八分音符の「ド」を押鍵したときには、図5を用いて説明したように、キーオン信号の出力に応じて次の歌詞が指定されてしまうため、四分音符の「ド」で歌唱すべきである「の」が発音されてしまうことになる。結果として、その後に続く歌詞と音高とがずれてしまい、正しい合成歌唱音を発音することができなくなるおそれがある。
そこで、本実施形態では、カラオケ用サーバ1000に記憶されている歌唱曲と同じ歌唱曲について、ガイド用シーケンスデータを用意し、歌唱合成用サーバ2000の記憶部に記憶している。図6(B)に示すように、ガイド用シーケンスデータは、楽曲データを変換して、歌詞の文字が変化するタイミングおよびメロディの音高が変化するタイミングのすべてについて、必ず1つの文字と1つの音高とが対応するように構成されている。つまり、歌詞を構成する各文字(音引き線「ー」を含む)すべてに必ず1つの音高が割り当てられるように構成されている。これにより、電子鍵盤装置3の押鍵操作と文字送りの推移が一致することとなり、正しい合成歌唱音の発音が可能となる。
なお、楽曲データをガイド用シーケンスデータに変換する手法の一例としては、楽曲データ中に含まれる歌詞データとガイドメロディデータとを比較することにより、音符のタイミングと文字のタイミングとが一致しない箇所を抽出し、音符のみ存在する時間位置には、直前の文字を継続して発音する記号として音引き線「ー」を追加し、文字のみ存在する時間位置には、直前の音符と同じキーナンバの音符を追加すればよい。歌詞として音引き線「ー」を追加した場合、これに対応して鍵が押された際には直前の文字の母音を合成歌唱音として発音することが好ましい。したがって、音符のみ存在する時間位置には、歌詞として音引き線「ー」を追加する代わりに、適切な母音を追加してもよい(例えば、図6(B)の例において、「いくつもおの」等と変換してもよい。)。
なお、本実施形態では、歌詞を構成する各文字すべてに必ず1つの音高が割り当てられるようにガイド用シーケンスデータを構成する例を示したが、これに限定されるものではない。例えば、テンポの速い楽曲等で、1回のキーオン操作で2文字の歌詞を発音させることが自然な場合においては、2文字の歌詞に1つの音高が割り当てられるようにガイド用シーケンスデータを構成してもよい。この場合、該当する2文字の歌詞データに対して1つの音高が対応する旨の情報を含めておき、キーオン信号で1文字目を発音し、キーオフ信号で2文字目を発音するといった構成で対応することが可能である。
以上のように、本実施形態のカラオケシステム100では、カラオケ用サーバ1000から提供される楽曲データをそのまま使用するのではなく、その楽曲データに対応するガイド用シーケンスデータを使用している。これにより、電子鍵盤装置3の合成歌唱音を用いてカラオケを楽しむ際に、電子鍵盤装置3の操作を支援する操作支援画像を表示するという課題に適したデータを表示制御部106に対して提供することができる。
なお、本実施形態では、ガイド用シーケンスデータを歌唱合成用サーバ2000に予め記憶しておく例を示したが、ガイド用シーケンスデータは、カラオケシステム100を構成する各装置のいずれに記憶されていてもよい。また、予め記憶しておくだけに限らず、歌唱曲が指定されるたびに、その都度カラオケ用サーバ1000から提供される楽曲データに基づいてガイド用シーケンスデータを生成してもよい。この場合、ガイド用シーケンスデータの生成は、カラオケシステム100を構成する各装置のいずれで行ってもよい。例えば、カラオケ装置1が、カラオケ用サーバ1000からダウンロードした楽曲データに基づいてガイド用シーケンスデータを生成してもよい。また、楽曲によっては、カラオケ用サーバからダウンロードした楽曲データをそのままガイド用シーケンスデータとして用いてもよい。
[カラオケ装置における表示制御部の構成]
カラオケ装置1が備える表示制御部106のより詳細な構成について説明する。なお、以下に説明する各構成の一部または全部は、ハードウェアによって実現されてもよいし、ソフトウェアを実行することによって実現されてもよい。ソフトウェアの実行により実現する場合、カラオケ装置1の制御部101が、記憶部103から制御プログラムを読み出して実行することにより、表示制御部106の一部または全部の機能が実現される。
図7は、本発明の一実施形態における表示制御部106の構成を示すブロック図である。本実施形態のカラオケ装置1における表示制御部106は、ガイド用シーケンスデータ取得部11、表示データ生成部13、キーオン信号取得部15、および画像更新部17を含む。ただし、ガイド用シーケンスデータ取得部11とキーオン信号取得部15は共通の信号受信手段として構成することもできるし、表示データ生成部13と画像更新部17の両者の機能をDSP(Digital Signal Processor)等で構成してもよい。また、制御部101がソフトウェアを実行することにより表示制御部106としての機能を兼ねてもよい。
ガイド用シーケンスデータ取得部11は、歌唱合成用サーバ2000から提供されたガイド用シーケンスデータを取得する。カラオケ装置1と歌唱合成用サーバ2000とはネットワークNWを介して通信可能に接続されているため、例えばガイド用シーケンスデータ取得部11は、公知のプロトコルを使用したネットワーク通信処理部として構築することができる。ガイド用シーケンスデータ取得部11は、ガイド用シーケンスデータを1曲単位で取得してもよいし、フレーズ単位で取得してもよい。また、指定された歌唱曲の伴奏に合わせてリアルタイムに取得してもよい。取得されたガイド用シーケンスデータは、記憶部103に記憶すればよい。
表示データ生成部13は、ガイド用シーケンスデータに基づいて、歌詞データを構成する各文字に対して割り当てられた音高とその音高が割り当てられた順序とを示す操作支援画像に対応する表示データを生成する。操作支援画像は、演奏者に対し、どのような順序でどの音高の鍵を操作すべきかを示す支援情報を提供する。具体的な画像の内容については後述する。表示データ生成部13は、記憶部103からガイド用シーケンスデータを読み出し、ガイド用シーケンスデータに含まれる主旋律を表すデータ(例えばノートデータ)及び歌詞データに基づいて、操作支援画像を生成することができる。また、その際、音符または歌詞の並び順に従って鍵盤を押鍵する順序を決定することができる。
なお、表示データ生成部13は、指定された歌唱曲の伴奏が開始される前に、予め1曲分の操作支援画像を生成してもよいし、フレーズ単位で操作支援画像を生成してもよい。また、上述のようにガイド用シーケンスデータをリアルタイムに取得する場合には、表示データの生成をリアルタイムに処理することも可能である。いずれにしても記憶部103の所定のメモリ領域をバッファとして機能させることができる。
また、表示データ生成部13は、通常のカラオケ装置で画像表示部に表示される映像(歌唱曲に関連した映像等)や歌詞テロップを表示するための表示データをも生成する機能を有する。さらに、表示データ生成部13は、これらの映像等に対して上述した操作支援画像を合成する処理も行う。合成処理は、公知の技術を用いることができ、例えば二画面合成処理であってもよいし、αブレンディング処理であってもよい。また、これらの合成処理を行う際には、記憶部103のRAM等を作業領域として使用すればよい。
キーオン信号取得部15は、電子鍵盤装置3から出力された鍵盤の押鍵を示すキーオン信号を取得する。カラオケ装置1と電子鍵盤装置3とは近距離無線通信介して接続されているため、例えばキーオン信号取得部15は、Bluetooth(登録商標)を用いた通信処理部として構築することができる。
画像更新部17は、キーオン信号取得部15から取得したキーオン信号に応じて、上述した操作支援画像を更新する。後述するように、操作支援画像は、演奏者が鍵盤を押鍵するごとに、次に操作すべき鍵を知らせるように内容が変更される。つまり、画像更新部17では、押鍵操作を示すキーオン信号を契機として、操作支援画像を更新して内容を変更する。なお、押鍵操作を示すキーオン操作があった場合には、指示通りの鍵が押されたか否かに関わらず画像を更新する。
なお、本実施形態では、カラオケ装置1の表示制御部106を例に挙げて説明したが、各構成は、制御端末2または電子鍵盤装置3の表示制御部が備えていてもよい。さらに、上述した各構成は、表示制御部だけで構成されるものに限らず、本実施形態のカラオケシステム100内で分散処理により実現されるものであってもよい。例えば、ガイド用シーケンスデータ取得部及び表示データ生成部を制御端末2が備え、画像表示部、キーオン信号取得部及び画像更新部をカラオケ装置1が備えるといったように、各構成が異なる装置に分散して存在していてもよい。
ここで、表示制御部106による操作支援画像の表示処理の一例について説明する。図8は、本発明の一実施形態における表示制御部による操作支援画像の表示処理を説明するフローチャートである。
カラオケ装置1の記憶部103にガイド用シーケンスデータがダウンロードされると、制御部101の指示により表示制御部106の画像表示処理が開始される。まず、記憶部103に記憶されたガイド用シーケンスデータから1フレーズ分の音符情報(例えばノートデータ)及び文字情報(歌詞の一部)を取得する(ステップS101)。
次に、取得した音符情報及び文字情報とそれらの並び順に基づいて、1フレーズ分の操作支援画像を表す表示データを生成し、表示する(ステップS102)。操作支援画像の詳細については後述するが、例えば鍵盤の画像、鍵盤を構成する各鍵を押す順番を示す数字、及び歌詞の一部などが表示される。
操作支援画像を表示したら押鍵操作があるまで待機する(ステップS103)。押鍵操作が行われたら、音符及び文字をそれぞれ1文字分繰り下げた操作支援画像に更新し、表示する(ステップS104)。音符を1文字分繰り下げるとは、押鍵すべき鍵の位置を示す表示を、次の押鍵すべき鍵の位置に変更することを指す。また、文字を1文字分繰り下げるとは、歌唱すべき文字を示す表示を、次に歌唱すべき文字を示す表示に変更することを指す。
操作支援画像の更新が完了したら、1フレーズ分の処理が終了したか否かを判定する(ステップS105)。1フレーズ分の処理が終了していない場合(ステップS105;No)、再びステップS103に戻って押鍵操作があるまで待機する。このようにステップS103からS105までを順次繰り返すことにより、1フレーズ分の操作支援画像が順次更新表示される。
1フレーズ分の処理が終了したと判定された場合(ステップS105;Yes)、処理したフレーズが最後のフレーズであったか否かが判定される(ステップS106)。このとき、最後のフレーズでない場合(ステップS106;No)には、ステップS101に戻って、ガイド用シーケンスデータから次のフレーズの音符情報及び文字情報を取得する。最後のフレーズであった場合(ステップS106;Yes)には、画像表示処理を終了する。
以上のような処理により、操作支援画像の表示処理が行われる。なお、1フレーズ分の処理が完了した後に次のフレーズの処理を開始する例を示したが、1フレーズの終わりから2〜3文字目の処理が終了したら、現在のフレーズに対応する操作支援画像とともに次のフレーズに対応する操作支援画像を表示してもよい。例えば、現在の操作支援画像に対し次の操作支援画像を重ねて表示したり、画面端などに次の操作支援画像を小さく表示したりするなど、様々な表示態様を採用することができる。
以上説明した表示制御部106の動作によって表示される操作支援画像の具体的な内容について説明する。本実施形態のカラオケシステム100では、操作支援画像は、カラオケ装置1の画像表示部107に表示される。なお、ここでは操作支援画像の内容に着目して説明するが、実際には、画像表示部107の画面の下部に、映像及び歌詞テロップとともに合成表示される。ただし、操作支援画像の位置は、画面の下部に限らず、上部に配置しても左右端部のいずれかに配置してもよい。その場合、後述する文字の移動方向や鍵盤の向きは、操作支援画像を配置する位置に応じて適宜変更することが可能である。
[操作支援画像の構成例1]
図9は、本発明の一実施形態における操作支援画像の一例を示す図である。図9(A)は、指定された歌唱曲のあるフレーズの開始直後に表示される操作支援画像20aを示しており、図9(B)は、図9(A)の状態から1回押鍵したときに表示される操作支援画像30aを示している。なお、図9では、歌詞(文字)も表示する例を示しているが、歌詞は必須ではなく、少なくとも押鍵する順番が分かるものであればよい。
図9(A)に示す例では、ピアノの鍵盤を表す画像21が表示され、鍵盤を構成する各鍵22には、押鍵する順番に複数の数字23が表示されている。歌詞表示領域24には、歌唱すべき歌詞の一部を表す文字25が表示されている。歌詞表示領域24のうち、第1領域24aには、最初に歌唱すべき文字(ここでは、「い」)が表示され、第2領域24bには、後続する歌唱すべき文字(ここでは、「く」、「つ」、「も」、「ー」及び「の」)が表示される。なお、第1領域24aに表示された文字は、矢印で示すように、下方に徐々に降りてくるように表示されてもよい。
このとき、各数字23の表示位置と各文字25の表示位置とは、それぞれ1対1で対応している。つまり、各数字23が、各文字25に対し音高が割り当てられた順序を示しており、かつ、演奏者が押鍵する順番を示している。なお、一度に表示する数字23及び文字25の数は、1フレーズに含まれる数としてもよいし、任意の数としてもよい。
図9(A)に示す操作支援画像20aを画面上で確認した演奏者は、指定された歌唱曲の伴奏に合わせて最初に歌唱すべき文字「い」に該当する鍵(すなわち、数字「1」が割り当てられている鍵)を押鍵する。この押鍵により出力されたキーオン信号に応じて、電子鍵盤装置3の合成歌唱音生成部308は、上述した図5のフローに従って「い」の合成歌唱音を「ミ」の音高で生成し、当該合成歌唱音に対応するオーディオ信号がカラオケ装置1に送られるとともにスピーカ115から発音される。なお、演奏者が指示と異なる鍵を押鍵した場合は、押鍵した音高に基づく文字「い」の合成歌唱音が発音される。
図9(B)は、以上の手順で「い」の発音をした直後の操作支援画像30aを示している。図9(B)に示す操作支援画像30aでは、発音された文字「い」は画面上から消え、第2領域24bに控えていた歌唱すべき次の文字(すなわち、数字「2」が割り当てられた文字)である「く」が、第2領域24bから第1領域24aに移動している。演奏者は、図9(B)に示す操作支援画像30aを確認することにより、次に押鍵すべき鍵がその前の鍵より1オクターブ高い「ミ」であること、及び歌唱すべき歌詞が「く」であることを認識することができる。
以上のように、演奏者は、押鍵するたびに変更される操作支援画像を画面上で確認することにより、次に操作すべき鍵盤の位置を知ることができる。また、画面上に表示された単位(例えばフレーズ単位)で、その先の複数の押鍵操作の順序が予測できるため、手の位置などを予め準備でき、演奏をスムーズに行うことができる。さらに、歌詞(文字)を確認することにより、フレーズ単位等で先を見越しながら合成歌唱音の発音タイミングを判断することができる。したがって、演奏操作に不慣れであっても容易に正しい合成歌唱音を発音させることが可能となり、電子楽器の操作に不慣れな人であっても、カラオケに行って気軽に電子楽器を用いた歌唱を楽しむことができるようになる。
なお、図9(A)に示す例では、文字「の」について強調表示が施されている(具体的には、二重丸で囲ってある)。この強調表示は、文字「の」の部分でビブラート、リバーブ、ピッチベンドといったエフェクト効果を与える旨の指示を示している。強調表示の態様としては、他にも他の文字と色分けしたり網掛けをしたりするなど、様々な態様を適用することができる。さらに、特定のマークを付すことによりどのようなエフェクト効果の指示であるのかについても区別できるようにすることも可能である。
また、図9(A)及び図9(B)に示す例では、鍵盤操作を進めても数字の表示変更は行われないが、例えば、数字「1」の表示された鍵を押鍵すると、数字「1」が消えるとともに、数字「2」以降が1つずつ繰り上がる(つまり、数字「2」が数字「1」になり、数字「3」が数字「2」になる)ように表示を変更してもよい。
また、図9(A)及び図9(B)に示す例では、発音した文字は第1領域24aから消え、次に歌唱すべき文字が第2領域24bから第1領域24aに移動するが、発音した文字がその場で消えていくように表示を変更することも可能である。勿論、表示を消さずに色を変更するなど、既に発音したことが演奏者に分かるように他の態様で表示変更を行うことも可能である。
[操作支援画像の構成例2]
図10は、本発明の一実施形態における操作支援画像の一例を示す図である。図10(A)は、指定された歌唱曲のあるフレーズの開始直後に表示される操作支援画像20bを示しており、図10(B)は、図10(A)の状態から1回押鍵したときに表示される操作支援画像30bを示している。なお、図10では、歌詞(文字)も表示する例を示しているが、歌詞は必須ではなく、少なくとも押鍵する順番が分かるものであればよい。
図10(A)に示す例では、ピアノの鍵盤を表す画像31が表示され、鍵盤を構成する各鍵32には、現時点で押鍵すべき鍵32aに対し第1の強調表示が施され、2番目に押鍵すべき鍵32bに対し第2の強調表示が施され、3番目に押鍵すべき鍵32cに対し第3の強調表示が施されている。つまり、演奏者は、操作支援画像20bを確認することにより、第1の強調表示が施されている鍵を、押鍵すべき鍵と認識することができる。
なお、図10(A)の例では、鍵32b及び鍵32cを押鍵すべき順序が区別できるように強調表示を施しているが、鍵32b及び鍵32cの順序を区別せずに、同一の強調表示を施すことも可能である。
歌詞表示領域33には、歌唱すべき歌詞の一部を表す文字34が表示されている。各文字34は、押鍵すべき順序が早いものほど鍵の近くの位置に表示される。これにより、演奏者は、次に押鍵すべき鍵32aに加えて、そのとき発音すべき歌詞(文字)を確認することができる。なお、各文字の位置は、矢印で示すように、徐々に鍵32に近づくように下から連続的に位置が変化する態様としてもよいし、押鍵するごとに鍵32に近づくように段階的に位置が変化する態様であってもよい。なお、歌詞表示領域33に一度に表示する文字34の数は、1フレーズに含まれる数としてもよいし、任意の数としてもよい。
図10(A)に示す操作支援画像20bを画面上で確認した演奏者は、指定された歌唱曲の伴奏に合わせて現時点で歌唱すべき文字「つ」に該当する鍵(第1の強調表示が施された鍵32a)を押鍵する。この押鍵により出力されたキーオン信号に応じて、電子鍵盤装置3の合成歌唱音生成部308は、上述した図5のフローに従って「つ」の合成歌唱音を「ミ」の音高で生成し、当該合成歌唱音に対応するオーディオ信号がカラオケ装置1に送られるとともにスピーカ115から発音される。
図10(B)は、以上の手順で「つ」の発音をした直後の操作支援画像30bを示している。図10(B)に示す操作支援画像30bでは、発音された文字「つ」は画面上から消え、歌詞表示領域33において、次に歌唱すべき文字である「も」が最も鍵32に近づく。具体的には、図10(A)において次に押鍵すべき鍵として第2の強調表示が施されていた鍵32bが、図10(B)では第1の強調表示に変更され、この鍵32bに文字「も」が最も近づいた状態となる。同様に、文字「ー」及び「の」もそれぞれ鍵32cに近づき、鍵32cの強調表示は、第2の強調表示に変更される。
演奏者は、図10(B)に示す操作支援画像30bを確認することにより、次に押鍵すべき鍵が「レ」であること、及び歌唱すべき歌詞が「も」であることを認識することができる。
以上のように、演奏者は、押鍵するたびに変更される操作支援画像を画面上で確認することにより、次に操作すべき鍵盤の位置を知ることができ、演奏操作に不慣れであっても容易に正しい合成歌唱音を発音させることが可能となる。これにより、電子楽器の操作に不慣れな人であっても、カラオケに行って気軽に電子楽器を用いた歌唱を楽しむことができるようになる。
なお、図10(A)に示す例では、文字「の」について二重線で強調表示が施されているが、その意味合いは、図9について説明したとおりであるため、ここでの説明は省略する。勿論、図9と同様に、強調表示の態様としては、他にも他の文字と色分けしたり網掛けをしたりするなど、様々な態様を適用することができる。さらに、特定のマークを付すことによりどのようなエフェクト効果の指示であるのかについても区別できるようにすることも可能である。
[操作支援画像の構成例3]
本実施形態における操作支援画像は、図6(B)に示したような五線譜の形式で表示されてもよい。すなわち、ガイド用シーケンスデータに含まれる時間情報から、図6(B)に示すように、現在歌唱すべきフレーズの音高を示す音符とその音符に対応する歌詞(文字)とを対応付けて付加した画像を操作支援画像として表示することもできる。
本実施形態では、通常のカラオケ用サーバから提供される楽曲データではなく、電子鍵盤装置3での演奏による歌唱を行うためのガイド用シーケンスデータに基づいて表示データを作成しているため、歌詞データを構成する各文字に対し、常に音高が割り当てられている。したがって、現在歌唱すべきフレーズの音高を示す音符とその音符に対応する歌詞(文字)とを対応付けて付加した画像を操作支援画像として参照すれば、演奏者は、正しい音高と歌詞で合成歌唱音による歌唱を行うことができる。
<他の実施形態>
上述した実施形態においては、電子鍵盤装置3から取得したキーオン信号を契機として操作支援画像が更新される。つまり、キーオン信号が取得されないと操作支援画像は更新されないため、演奏者が伴奏のスピードについていけなくなると、伴奏と操作支援画像との間に時間的なずれが生じる場合がある。また、演奏者が操作を誤って一度に2つの鍵を押してしまった場合、歌詞が余計に1つ進んでしまうため、その後の音高と歌詞との対応にずれが生じてしまう場合がある。
このような場合に備え、他の実施形態における電子鍵盤装置3の操作部305は、フレーズ単位で操作支援画像を先送りする旨の指示信号(以下「スキップ指示信号」という)を出力する操作子を含み得る。カラオケ装置1の表示制御部106に含まれる画像更新部17は、電子鍵盤装置3からスキップ指示信号を取得すると、次のフレーズの操作支援画像が表示されるように操作支援画像の更新処理を行う。これにより、演奏操作が遅れてしまった場合や誤操作を行ってしまった場合に、演奏者が強制的に操作支援画像をフレーズ単位で先送りすることができ、演奏の遅延やずれをリセットすることができる。
また、演奏者が自らの操作によりフレーズを先送りする構成に代えて、カラオケ装置1の制御部101が、伴奏と演奏操作のずれ(位相差)を自動的に検出し、そのずれが所定の閾値を超えたときに、次のフレーズの操作支援画像となるように画像更新処理部17を制御する構成とすることも可能である。この場合、例えば制御部101が、伴奏データに含まれる時間データと、操作支援画像が示している現時点で歌唱すべき歌詞の歌詞データ中における位置とを比較することにより伴奏と演奏操作のずれを検出し、そのずれが所定の閾値を超えた場合に、画像更新部17に対し、上述したスキップ指示信号を送信する構成とすればよい。また、これに替えて、指示された音高と異なる鍵を連続して操作している等のユーザーの演奏ミスを検出した場合に、上述したスキップ信号を送信してもよい。なお、伴奏と演奏操作のずれを検出するプロセスは、例えば図8に示した操作支援画像の表示処理のフローにおいて、ステップS103の押鍵操作を待機する間に実行してもよい。その際、伴奏と演奏操作のずれが検出された場合には、ステップS101に戻って、次のフレーズの操作支援画像を表示するとよい。
また、上述した実施形態では、カラオケ装置1の表示制御部106が操作支援画像を生成及び表示することを例に挙げて説明したが、制御端末2または電子鍵盤装置3の表示制御部が操作支援画像の生成及び表示処理を行ってもよい。つまり、カラオケ用サーバ1000及びカラオケ装置1としては既存の装置を用い、操作支援画像の生成処理や表示処理を制御端末2または電子鍵盤装置3の表示制御部や画像表示部を用いて行うことも可能である。このことは、例えば電子鍵盤装置3の演奏を、制御端末2の画像表示部207に表示された操作支援画像を見ながら行ったり、電子鍵盤装置3自身が備える画像表示部307に表示された操作支援画像を見ながら行ったりすることができることを意味する。
また、上述したように表示制御部としての機能は、カラオケシステム100内で分散処理により実現されてもよいため、カラオケ装置1及び制御端末2で表示制御部としての機能を分担することも可能である。例えば、歌唱合成用サーバ2000からのガイド用シーケンスデータのダウンロード及び表示データの生成を制御端末2の表示制御部206が行い、電子鍵盤装置3からのキーオン信号の取得及びキーオン信号の取得を契機とする操作支援画像の更新処理をカラオケ装置1の表示制御部106が行ってもよい。
以上のように、カラオケシステム100においては、カラオケ装置1、制御端末2、および電子鍵盤装置3はそれぞれの機能がそれぞれの装置において実現されていたが、各装置の一部の機能または全体の機能が他の装置で実現されてもよい。例えば、制御端末2における機能の一部または全部が電子鍵盤装置3において実現されてもよい。制御端末2における機能の全部が電子鍵盤装置3において実現される場合には、制御端末2と電子鍵盤装置3とが一体型の装置であることと等しい。また、これとは逆にさらに多くの装置を用いて、各機能が実現されていてもよい。例えば、電子鍵盤装置3のうち、合成歌唱音生成部308を備えた装置(合成歌唱音生成装置)と、鍵盤310の部分を備えた装置(例えば、MIDIキーボードなど)とを別々に構成してもよい。このとき、合成歌唱音生成装置は、制御端末2に含まれていてもよい。
また、合成歌唱音は、演奏者が演奏操作子の一例である鍵盤310の鍵を押鍵することによって生成されていた。しかし、演奏操作子は鍵以外であってもよく、例えば、ギターシンセサイザ(ギター型のコントローラ)の弦であってもよいし、ウインドシンセサイザ(管楽器型のコントローラ)のキーであってもよい。