<第1実施形態>
図1〜図4を参照して、第1実施形態に係るカラオケ装置1について説明する。
一台のカラオケ装置1は、複数の利用者で使用することができる。図1に示すように、本実施形態では、一台のカラオケ装置1を利用者U1及び利用者U2の2名で利用する例について説明を行う。利用者U1は携帯端末M1を所有し、利用者U2は携帯端末M2を所有している。
携帯端末は、一般的なスマートフォン、タブレット端末等である。携帯端末は、各携帯端末を識別するための端末識別情報、及びカラオケ専用のアプリケーションソフトウェア(以下、「カラオケ用アプリ」という)等を記憶している。
カラオケ用アプリは、携帯端末からカラオケ装置1に対する各種操作を行ったり、カラオケ装置1から送信される各種情報を、携帯端末の表示画面に表示したり、携帯端末が備えるスピーカから放音するためのソフトウェアである。これらの動作は、カラオケ用アプリを実行している携帯端末と、カラオケ装置1とをペアリングすることにより行うことができる。ペアリングとは、所定の携帯端末と所定のカラオケ装置とが通信可能となるように、関連付けを行うことをいう。
==カラオケ装置==
カラオケ装置1は、利用者が選曲した楽曲のカラオケ演奏及び利用者がカラオケ歌唱を行うための装置である。図2に示すように、カラオケ装置1は、カラオケ本体10、スピーカ20、第1の表示装置30、第2の表示装置31、マイク40、及びリモコン装置50を備える。
スピーカ20はカラオケ本体10からの放音信号に基づいてカラオケ演奏音や歌唱音声を放音するための構成である。第1の表示装置30及び第2の表示装置31は、カラオケ本体10から出力される映像信号に基づいて所定の映像を表示するための構成である。本実施形態に係る第1の表示装置30及び第2の表示装置31は、「表示部」の一例である。マイク40は、入力される利用者の音声(カラオケ歌唱の音声)をアナログの歌唱音声信号に変換してカラオケ本体10に入力するための構成である。
(カラオケ本体のハードウェア)
図2に示すように、カラオケ本体10は、制御部11、通信部12、記憶部13、音響処理部14、表示処理部15、及び操作部16を備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
カラオケ本体10は、選曲された楽曲のカラオケ演奏制御、歌詞や背景映像等の表示制御、マイク40を通じて入力された音声の処理といった、カラオケ歌唱に関する各種の制御を行う。
制御部11は、CPU11aおよびメモリ11bを備える。CPU11aは、メモリ11bに記憶された動作プログラムを実行することにより各種の制御機能を実現する。メモリ11bは、CPU11aに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶装置である。
通信部12は、ルーター(図示なし)を介してカラオケ本体10を通信回線に接続するためのインターフェースを提供する。カラオケ装置1は、通信部12を介してペアリングされた携帯端末と通信可能となっている。
記憶部13は、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。記憶部13は、カラオケ装置1によりカラオケ演奏を行うための複数の楽曲データ等を記憶する(詳細は後述)。
音響処理部14は、制御部11の制御に基づき、楽曲に対するカラオケ演奏の制御およびマイク40を通じて入力された歌唱音声の処理を行う。音響処理部14は、MIDI音源14a、ミキサ14b、及びアンプ14cを含む(詳細は後述)。
表示処理部15は、制御部11の制御に基づき、第1の表示装置30及び第2の表示装置31における各種表示に関する処理を行う。たとえば、表示処理部15は、ある楽曲のカラオケ演奏時における背景映像に歌詞や各種アイコンが重ねられた映像を第1の表示装置30に表示する処理を行う一方、ある楽曲のPV映像を第2の表示装置31に表示する処理を行う(詳細は後述)。
操作部16は、パネルスイッチおよびリモコン受信回路などからなり、利用者によるカラオケ装置1のパネルスイッチあるいはリモコン装置50の操作に応じて選曲信号、演奏中止信号などの操作信号を制御部11に対して出力する。制御部11は、操作部16からの操作信号を検出し、対応する処理を実行する。
リモコン装置50は、カラオケ本体10に対する各種操作をおこなうための装置である。利用者はリモコン装置50を用いて歌唱を希望する楽曲の選曲(予約)等を行うことができる。
(カラオケ本体のソフトウェア)
図3はカラオケ本体10のソフトウェア構成例を示す図である。カラオケ本体10は、データ記憶部100、演奏制御部200、表示制御部300、第1の判定部400、及び配信部500を備える。データ記憶部100は、記憶部13の記憶領域の一部として提供される。演奏制御部200、表示制御部300、第1の判定部400、及び配信部500は、CPU11aがメモリ11bに記憶されるプログラムを実行することにより実現される。
[データ記憶部]
データ記憶部100は、楽曲データと、当該楽曲データに関連付けられた第1の映像データ及び第2の映像データとを記憶する。
楽曲データは、カラオケ演奏を行うためのデータである。楽曲データは、個々の楽曲を特定するための識別情報(楽曲ID)が付与されている。楽曲データは、伴奏データ、リファレンスデータ等を含む。伴奏データは、カラオケ演奏音の元となるMIDI形式のデータである。伴奏データは演奏区間が設定されている。演奏区間は、たとえば、前奏区間、Aメロ、Bメロ、サビ、間奏区間、後奏区間である。リファレンスデータは、利用者によるカラオケ歌唱を採点する際の基準として用いられるデータである。
楽曲データは、歌詞データ、属性情報等を含んでいてもよい。歌詞データは、カラオケ演奏に合わせて第1の表示装置30等に表示させる歌詞(歌詞テロップ)を示すデータである。属性情報は、曲名、歌手名、作詞・作曲者名、及びジャンル等の楽曲に関する情報である。
映像データは、各種映像を第1の表示装置30等に表示させるためのデータである。一の楽曲に関連付けられている映像データの数は特に限られない。また、表示装置にどの映像を表示させるか(複数の表示装置がある場合に、どの表示装置にどの映像を表示させるか)は、楽曲毎に予め設定されていてもよいし、利用者が楽曲を選曲する際に都度、設定してもよい。本実施形態においては、第1の表示装置30に表示される映像のデータを「第1の映像データ」とし、第2の表示装置31に表示される映像のデータを「第2の映像データ」として説明する。
映像データは、当該データが関連付けられている楽曲に関するものであってもよいし、当該楽曲と関係のないものであってもよい。当該楽曲に関する映像データは、たとえば、背景映像、本人映像(PV映像等)、ライブ映像、CG映像、インタビュー映像、トーク映像等のデータである。また、当該楽曲と関係ない映像データは、たとえば、当該楽曲を歌唱するアーティストの別の楽曲のPV映像、ヒーリング映像等である。
ここで、映像データの中には音声データを含むものがある。たとえば、背景映像の映像データは、音声データを含まない。一方、PV映像やライブ映像の映像データは、楽曲を歌唱するアーティストを撮影した映像データに、アーティストの歌唱の音声データや実際の演奏を録音した音声データ(演奏の音声データ)が含まれている。また、インタビュー映像の映像データの場合、たとえば楽曲の歌詞内容を解説するアーティストを撮影した映像データに、解説するアーティストの肉声を録音した音声データが含まれている。本実施形態においては、第1の映像データに含まれる音声データを「第1の音声データ」とし、第2の映像データに含まれる音声データを「第2の音声データ」として説明する。
[演奏制御部]
演奏制御部200は、音響処理部14を制御し、伴奏データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ20から放音させる。
たとえば、利用者U1により楽曲Xが選曲された場合、演奏制御部200は、データ記憶部100から楽曲Xの楽曲データを読み出し、楽曲データに含まれる伴奏データをMIDI音源14aに入力する。MIDI音源14aは、当該伴奏データに基づいて楽音信号(カラオケ演奏音の元となる信号)を生成する。ミキサ14bは、当該楽音信号およびマイク40から出力される歌唱音声信号を適当な比率でミキシングしてアンプ14cに出力する。アンプ14cは、ミキサ14bからのミキシング信号を増幅し、放音信号としてスピーカ20へ出力する。これにより、スピーカ20からは放音信号に基づく楽曲Xのカラオケ演奏音(MIDI形式のデータに基づく演奏音)およびマイク40からの歌唱音声が放音される。なお、マイク40からの出力が無い場合(たとえば、楽曲Xの前奏区間や間奏区間の場合)、演奏制御部200は、カラオケ演奏音のみを放音させる。
また、演奏制御部200は、伴奏データの代わりに映像データに含まれる音声データに基づいてカラオケ演奏音を放音させることも可能である。具体的に、演奏制御部200は、第1の映像データに含まれる第1の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ20から放音させる。
たとえば、利用者U1により選曲された楽曲Xの楽曲データに対し、第1の映像データとしてライブ映像のデータが関連付けられていたとする。この場合、演奏制御部200は、データ記憶部100から楽曲Xのライブ映像のデータに含まれる音声データ(演奏の音声データ)を読み出し、演奏音信号としてミキサ14bに入力する。ミキサ14bは、当該演奏音信号およびマイク40から出力される歌唱音声信号を適当な比率でミキシングしてアンプ14cに出力する。アンプ14cは、ミキサ14bからのミキシング信号を増幅し、放音信号としてスピーカ20へ出力する。これにより、スピーカ20からは放音信号に基づく楽曲Xのカラオケ演奏音(実際の演奏に基づく生演奏音)およびマイク40からの歌唱音声が放音される。
カラオケ演奏音の放音に、伴奏データを用いるか、映像データに含まれる音声データを用いるかは、楽曲毎に予め設定されていてもよいし、利用者が楽曲を選曲する際に都度、設定してもよい。また、第1の映像データに第1の音声データが含まれているかどうかによって自動で判断してもよい。すなわち、選曲された楽曲Xの第1の映像データに第1の音声データが含まれない場合、演奏制御部200は、楽曲Xの伴奏データに基づいてカラオケ演奏音を放音させる。一方、選曲された楽曲Xの第1の映像データに第1の音声データ(演奏の音声データ)が含まれている場合、演奏制御部200は、当該第1の音声データに基づいてカラオケ演奏音を放音させる。なお、第1の映像データが第1の音声データを含む場合であっても、伴奏データに基づいてカラオケ演奏を行うことも可能である。この場合、演奏処理部200は、第1の映像データに含まれる第1の音声データに基づく演奏処理を行わない(第1の音声データ(演奏の音声データ)の読み出しを行わない)。
[表示制御部]
表示制御部300は、カラオケ装置1における各種表示制御を行う。具体的に、表示制御部300は、カラオケ演奏音の放音に合わせて、第1の映像データに基づく第1の映像及び第2の映像データに基づく第2の映像を表示部に表示させる。
たとえば、利用者U1により選曲された楽曲Xに対し、ライブ映像の映像データ及びインタビュー映像の映像データが関連付けられていたとする。また、ライブ映像の映像データが第1の映像データとして設定され、インタビュー映像の映像データが第2の映像データとして設定されていたとする。
この場合、表示制御部300は、楽曲Xのカラオケ演奏音の放音に合わせて、データ記憶部100から読み出した第1の映像データに基づくライブ映像を第1の表示装置30に表示させる。同時に、表示制御部300は、データ記憶部100から読み出した第2の映像データに基づくインタビュー映像を第2の表示装置31に表示させる。この例におけるライブ映像は「第1の映像」の一例であり、インタビュー映像は「第2の映像」の一例である。
[第1の判定部]
第1の判定部400は、第2の映像データに第2の音声データが含まれている場合、当該第2の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。
まず、第1の判定部400は、利用者によって選曲された楽曲の楽曲データに関連付けられている映像データのうち、第2の映像データに相当する映像データに音声データが含まれているかどうかを判定する。本実施形態において、第1の判定部400は、第2の表示装置31に表示される映像の映像データに音声データ(第2の音声データ)が含まれているかどうかを判定する。
ここで、第2の表示装置31に表示される映像の映像データが背景映像のデータの場合、当該映像データには、上述の通り、第2の音声データに相当するデータは含まれていない。第2の音声データが含まれていないと判定した場合、第1の判定部400は、以降の処理を行わない。なお、この場合であっても、表示制御部300は、カラオケ演奏音の放音に合わせて、背景映像を第2の表示装置31に表示させる。
一方、第2の表示装置31に表示される映像の映像データがライブ映像のデータやインタビュー映像のデータの場合、当該映像データには、第2の音声データに相当するデータが含まれている。この場合、第1の判定部400は、第2の音声データが含まれていると判定する。
次に、第1の判定部400は、第2の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。
演奏音とは、第2の映像データ(第2の音声データ)が関連付けられている楽曲のカラオケ演奏音の他、他の楽曲のカラオケ演奏音やBGM等、何らかのメロディを持った音である。また、歌唱音声とは、第2の映像データ(第2の音声データ)が関連付けられている楽曲の歌唱音声の他、他の楽曲の歌唱音声等、歌唱された際に得られるメロディを持った音声である。
演奏音または歌唱音声かどうかの判定は、公知の手法を用いることができる。たとえば、第1の判定部400は、第2の音声データを解析し、楽曲の演奏音に特有のビートパターンが含まれているかを判定する(特開2008−233812号公報参照)。また、第1の判定部400は、第2の音声データに対して高速フーリエ変換を行って周波数特性を取得し、取得された周波数特性から楽音に特有の倍音成分が含まれているかを判定する(特許第5577787号参照)。特有のビートパターンが含まれている場合や、特有の倍音成分が含まれている場合、第1の判定部400は、第2の音声データに基づく音声が、楽曲の演奏音であると判定する。
また、第1の判定部400は、第2の音声データに基づく音声がいかなる演奏音でもないと判定した場合、更に第2の音声データに対して高速フーリエ変換を行って音声信号の音高の時間的変化を取得し、変化の幅が所定値以上であれば、歌唱音声であると判定し、所定値よりも小さい場合には、非歌唱音声(たとえば、会話に基づく音声)であると判定する(特開2012−58277号公報参照)。なお、演奏音かどうかの判定と歌唱音声かどうかの判定を行う順番はどちらを先に行ってもよい。或いは、両方の判定処理を並行して行うことでもよい。
ここで、第2の音声データに基づく音声が、何らかの演奏音または歌唱音声であると判定した場合、第1の判定部400は、その判定結果を演奏制御部200に出力する。
たとえば、第2の音声データに基づく音声がライブ映像に含まれる演奏音や歌唱音声である場合、カラオケ演奏音やカラオケ歌唱音の放音中にライブ映像に含まれる音声データに基づく演奏音や歌唱音声を重ねて聴取させる必要性がない。従って、当該判定結果が出力された場合、演奏制御部200は、ライブ映像に含まれる音声データに基づく音声の放音を行わない。なお、音声の放音を行わない場合であっても、表示制御部300は、カラオケ演奏音の放音に合わせて、ライブ映像を第2の表示装置31に表示させる。
一方、第2の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定した場合、第1の判定部400は、その判定結果を演奏制御部200及び配信部500に出力する。
たとえば、第2の音声データに基づく音声がインタビュー映像に含まれる音声であっても、放音させればカラオケ演奏音や利用者の歌唱音声が聴き取り難くなる。従って、当該判定結果が出力された場合にも、演奏制御部200は、インタビュー映像に含まれる音声データに基づく音声の放音を行わない。一方、この場合、当該音声データは利用者の携帯端末に配信される(後述)。なお、音声の放音を行わない場合であっても、表示制御部300は、カラオケ演奏音の放音に合わせて、インタビュー映像を第2の表示装置31に表示させる。
[配信部]
配信部500は、第2の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、第2の音声データを利用者の携帯端末に対して配信する。
上述のようにインタビュー映像を第2の表示装置31に表示させた場合、利用者はインタビュー映像を見ることができても、第2の音声データに基づく音声は放音されないのでインタビュー映像中で何が話されているのかを聴くことができない。そこで、配信部500は、当該インタビュー映像の音声データを利用者の携帯端末に配信する。
具体的に、第1の判定部400から、第2の音声データ(インタビュー映像の音声データ)に基づく音声が、カラオケ演奏音及び歌唱音声のいずれでもないという判定結果が出力された場合、配信部500は、データ記憶部100から第2の映像データに含まれる第2の音声データを読み出し、ペアリングされている携帯端末に対して当該音声データを配信する。携帯端末は、配信された音声データをカラオケ用アプリで処理し、スピーカから放音させることができる。つまり、利用者は、自己の携帯端末を介して、配信された音声データに基づく音声を聴くことができる。なお、表示される第2の映像との同期を取るため、配信部500は、第2の映像の表示に合わせて、ストリーミング形式で音声データの配信を行うことが好ましい。また、配信は、カラオケ装置1とペアリングされた全ての携帯端末に対して行ってもよいし、カラオケ歌唱を行っていない利用者の携帯端末のみ(たとえば、図1の例で利用者U1がカラオケ歌唱を行っている場合に利用者U2の携帯端末M2のみ)に対して行うことでもよい。
==カラオケ装置1の動作について==
次に、図4を参照して本実施形態におけるカラオケ装置1の動作の具体例について述べる。図4は、カラオケ装置1の動作例を示すフローチャートである。この例では利用者U1が楽曲Xを選曲してカラオケ歌唱を行い、利用者U2が聴衆としてカラオケ歌唱を聴く。また、楽曲Xの楽曲データに対し、第1の映像データ(第1の音声データを含まない)、及び第2の映像データ(第2の音声データを含む)が関連付けられているとする。
第1の判定部400は、予め、第2の映像データに第2の音声データが含まれているかどうかを判定する。上述の通り、この例では、第2の映像データが第2の音声データを含む。この場合、第1の判定部400は、当該第2の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する(何らかの演奏音または歌唱音声かどうかの判定。ステップ10)。この例では、第2の音声データに基づく音声が、いかなる演奏音でもなく、歌唱音声でもないと判定されたとする。
その後、演奏制御部200は、楽曲Xの楽曲データに基づくカラオケ演奏音をスピーカ20から放音させる(カラオケ演奏音の放音。ステップ11)。また、表示制御部300は、カラオケ演奏音の放音に合わせて、第1の映像データに基づく第1の映像を第1の表示装置30に表示させ、第2の映像データに基づく第2の映像を第2の表示装置31に表示させる(映像の表示。ステップ12)。
利用者U1は、第1の表示装置30に表示された歌詞テロップの入った映像を見ながら、カラオケ演奏に合わせてカラオケ歌唱を行う。この場合、演奏制御部200は、カラオケ歌唱により得られる歌唱音声信号に基づく歌唱音声をスピーカ20から放音させる(歌唱音声の放音。ステップ13)。聴衆である利用者U2は、カラオケ演奏音及び利用者U1の歌唱音声を聴きながら、第1の表示装置30及び第2の表示装置31に表示される映像を見ることができる。
ここで、ステップ10の判定結果に基づいて、配信部500は、第2の音声データを利用者U1の携帯端末M1及び利用者U2の携帯端末M2に対して配信する(第2の音声データの配信。ステップ14)。この場合、カラオケ歌唱を行っていない利用者U2は、第2の表示装置31に表示される映像を見ながら、当該映像に含まれる音声を自己の携帯端末M2を介して聴くことができる。
配信部500は、楽曲Xのカラオケ演奏が終了するまで(ステップ15でYの場合)、カラオケ演奏に合わせて第2の音声データを配信する。
なお、ステップ10の判定結果で、第2の音声データに基づく音声が、何らかの演奏音または歌唱音声であると判定された場合、配信部500は、第2の音声データの配信を行わない。
以上の通り、本実施形態に係るカラオケ装置1は、利用者U1が所有する携帯端末M1及び利用者U2が所有する携帯端末M2と通信可能であって、データ記憶部100、演奏制御部200、表示制御部300、第1の判定部400、及び配信部500を有する。データ記憶部100は、カラオケ演奏を行うための楽曲データと、当該楽曲データに関連付けられた第1の映像データ及び第2の映像データとを記憶する。演奏制御部200は、楽曲データに含まれる伴奏データまたは第1の映像データに含まれる第1の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ20から放音させる。表示制御部300は、カラオケ演奏音の放音に合わせて、第1の映像データに基づく第1の映像を第1の表示装置30に表示させ、第2の映像データに基づく第2の映像を第2の表示装置31に表示させる。第1の判定部400は、第2の映像データに第2の音声データが含まれている場合、当該第2の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。配信部500は、第2の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、当該第2の音声データを利用者U1の携帯端末M1及び利用者U2の携帯端末M2に対して配信する。
このようなカラオケ装置1によれば、第2の表示装置31に表示される映像に含まれる音声が、何らかの演奏音や歌唱音声と異なる場合であっても、当該音声がスピーカ20から放音されることは無い。従って、利用者は、カラオケ装置1から放音されるカラオケ演奏音や歌唱音声が聴き取り難くなることが無い。一方、第2の表示装置31に表示される映像を見た利用者が、当該映像に含まれる音声を聴きたいと思った場合には、自己の携帯端末を介して当該映像に含まれる音声を聴くことができる。すなわち、本実施形態に係るカラオケ装置1によれば、カラオケ演奏音や歌唱音声と合わせて、第2の表示装置31に表示される映像に含まれる音声を聴くことが可能となる。
<第2実施形態>
次に、図5〜図6Bを参照して、第2実施形態に係るカラオケ装置1について説明する。
第1実施形態で述べたように、たとえば、第2の音声データがインタビュー映像に含まれる音声データであっても、放音させればカラオケ演奏音や利用者の歌唱音声が聴き取り難くなる。一方、カラオケ演奏には、カラオケ歌唱を行わない間奏区間がある。この間奏区間においては、カラオケ演奏音や歌唱音声と異なる音声を放音させたとしても歌唱音声が聴き取り難くなることは無い。本実施形態では、間奏区間において、カラオケ装置1のスピーカ20からカラオケ演奏音や歌唱音声と異なる音声を放音する構成について説明を行う。なお、第1実施形態と同様の構成については説明を省略する。
(カラオケ本体のソフトウェア)
図5はカラオケ本体10のソフトウェア構成例を示す図である。カラオケ本体10は、データ記憶部100、演奏制御部200、表示制御部300、第1の判定部400、配信部500、及び第2の判定部600を備える。データ記憶部100は、記憶部13の記憶領域の一部として提供される。演奏制御部200、表示制御部300、第1の判定部400、配信部500、及び第2の判定部600は、CPU11aがメモリ11bに記憶されるプログラムを実行することにより実現される。
[第2の判定部]
第2の判定部600は、放音されるカラオケ演奏音が、楽曲の間奏区間に対応するカラオケ演奏音であるか否かを判定する。間奏区間に対応するカラオケ演奏音であるかどうかは、伴奏データに基づいて判定できる。
ある楽曲のカラオケ演奏が行われる場合、第2の判定部600は、当該ある楽曲の伴奏データを参照し、現在放音されているカラオケ演奏音が間奏区間に対応するカラオケ演奏音であるかどうかを判定する。間奏区間に対応するカラオケ演奏音であると判定した場合、第2の判定部600は、その判定結果を演奏制御部200に出力する。
[演奏制御部]
本実施形態に係る演奏制御部200は、第2の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、且つ放音されるカラオケ演奏音が間奏区間のカラオケ演奏音であると判定された場合、第2の音声データに基づく音声をスピーカ20から放音させる。
具体的に、演奏制御部200は、データ記憶部100から第2の音声データを読み出し、音声信号としてミキサ14bに入力する。ミキサ14bは、当該音声信号および楽曲の楽音信号を適当な比率でミキシングしてアンプ14cに出力する。アンプ14cは、ミキサ14bからのミキシング信号を増幅し、放音信号としてスピーカ20へ出力する。これにより、スピーカ20からは放音信号に基づく楽曲のカラオケ演奏音および第2の音声データに基づく音声(たとえば、インタビューの音声)が放音される。
なお、この場合にも、表示制御部300は、カラオケ演奏音の放音に合わせて、インタビュー映像を第2の表示装置31に表示させる。また、第2の音声データに基づく音声をスピーカ20から放音させる場合、配信部500は、携帯端末に対する第2の音声データの配信を継続して行ってもよいし、一時的に停止してもよい。携帯端末に対する第2の音声データの配信を停止した後、間奏区間が終了した場合、配信部500は、第2の音声データの配信を再開する。
更に、第2の音声データに基づく音声をスピーカ20から放音させる場合、演奏制御部200は、カラオケ演奏音の音量を所定値下げて放音させることも可能である。カラオケ演奏音の音量は、予め基準値が設定されており、リモコン装置50等を介して利用者が任意の値に設定できる。所定値は、間奏区間に放音するカラオケ演奏音の音量を決定するための値であって、上記基準値からどれだけ音量を下げるかを規定する値である。所定値は、予め一の値が設定されていてもよいし、カラオケ演奏の都度、設定されることでもよい。
==カラオケ装置1の動作について==
次に、図6A及び図6Bを参照して本実施形態におけるカラオケ装置1の動作の具体例について述べる。図6A及び図6Bは、カラオケ装置1の動作例を示すフローチャートである。この例では利用者U1が楽曲Xを選曲してカラオケ歌唱を行い、利用者U2が聴衆としてカラオケ歌唱を聴く。また、楽曲Xの楽曲データに対し、第1の映像データ(第1の音声データを含まない)、及び第2の映像データ(第2の音声データを含む)が関連付けられているとする。ステップ20〜ステップ24は、第1実施形態のステップ10〜ステップ14と同様であるため説明を省略する。なお、この例においても、ステップ20において、第2の音声データに基づく音声が、いかなる演奏音でもなく、歌唱音声でもないと判定されたとする。
第2の音声データの配信が開始された後、第2の判定部600は、ステップ21で放音されるカラオケ演奏音が、楽曲Xの間奏区間に対応するカラオケ演奏音であるか否かを判定する。
ステップ21で放音されるカラオケ演奏音が、楽曲Xの間奏区間に対応するカラオケ演奏音であると判定された場合(ステップ25でYの場合)、第2の判定部600は、その判定結果を演奏制御部200に出力する。この場合、演奏制御部200は、第2の音声データに基づく音声をスピーカ20から放音させる(第2の音声データに基づく音声の放音。ステップ26)。
一方、ステップ21で放音されるカラオケ演奏音が、楽曲Xの間奏区間に対応するカラオケ演奏音でないと判定された場合(ステップ27でYの場合)、演奏制御部200は、第2の音声データに基づく音声の放音を終了する(第2の音声データに基づく音声の放音を終了。ステップ28)。
演奏処理部200、配信部500、及び第2の判定部600は、楽曲Xのカラオケ演奏が終了するまで(ステップ29でYの場合)、ステップ25〜ステップ28の処理を繰り返し行う。
以上の通り、本実施形態に係るカラオケ装置1は、放音されるカラオケ演奏音が、楽曲の間奏区間に対応するカラオケ演奏音であるか否かを判定する第2の判定部600を有する。また、第2の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、且つ放音されるカラオケ演奏音が間奏区間のカラオケ演奏音であると判定された場合、演奏制御部200は、第2の音声データに基づく音声を放音させる。
このようなカラオケ装置1によれば、間奏区間においてスピーカ20から第2の音声データに基づく音声を放音することができるため、利用者は当該音声を直接(携帯端末を介することなく)聴くことができる。また、間奏区間においては、歌唱音声が放音されることが無いため、歌唱音声が聴き取り難くなることは無い。
また、第2の音声データに基づく音声を放音させる場合、演奏制御部200は、カラオケ演奏音の音量を所定値下げて放音させることができる。この場合、第2の音声データに基づく音声をよりはっきりと聴き取ることができる。
<その他>
上記実施形態では、一の表示装置に対して一の映像を表示させる例について述べたがこれに限られない。たとえば、カラオケ装置1が有する表示装置が一つの場合には、二つの映像(第1の映像及び第2の映像)を一画面に分割表示させることも可能である。この場合、当該一の表示装置が「表示部」に相当する。
また、上記実施形態では、楽曲が選曲される都度、第1の判定部400による判定処理を行う例について述べたがこれに限られない。たとえば、予め第1の判定部400により、第2の映像データに第2の音声データが含まれているかどうか、及び第2の音声データが含まれている場合に、当該第2の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定しておく。この判定結果を映像データに関連付けておくことにより、楽曲が選曲される都度、第1の判定部400で判定処理を行う手間を省くことができる。
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。