JP2015045796A

JP2015045796A - デュエット歌唱の歌唱者選択に特徴を有する通信カラオケシステム、及び、その制御方法

Info

Publication number: JP2015045796A
Application number: JP2013177756A
Authority: JP
Inventors: 石川　雅康; Masayasu Ishikawa; 雅康石川
Original assignee: Daiichikosho Co Ltd
Current assignee: Daiichikosho Co Ltd
Priority date: 2013-08-29
Filing date: 2013-08-29
Publication date: 2015-03-12
Anticipated expiration: 2033-08-29
Also published as: JP6182394B2

Abstract

【課題】カラオケ装置を利用するルーム利用者とユーザー端末を利用する端末利用者のそれぞれにデュエット歌唱を行わせるに際し、募集対象の利用者を多く集め、デュエット歌唱を成立し易くするとともに、伝送遅延によるデュエット歌唱への悪影響を抑制する。【解決手段】ホスト装置１は、募集対象である端末利用者のユーザー端末３に応募用動画データとカラオケデータを配信する。募集に対して応募通知した端末利用者の中から決定された端末利用者のユーザー端末３は、各データを再生してルーム利用者の音声とカラオケ演奏音を出力し、これにあわせてデュエット歌唱される端末利用者の歌唱音とカラオケ演奏音との混合音信号を生成して、ルーム利用者が利用するカラオケ装置２に伝送路４を通じて送信する。カラオケ装置２は混合音信号を再生して端末利用者の音声とカラオケ演奏音を出力し、ルーム利用者は、端末利用者の音声等にあわせてデュエット歌唱する。【選択図】図７

Description

本発明は、サーバーとカラオケ装置とユーザー端末のそれぞれを伝送路によって通信可能に接続し、カラオケ装置を利用する第１利用者とユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせる通信カラオケシステム、及び、その制御方法に関し、特に第２利用者の選択に特徴を有するものに関する。

拠点間を伝送路によって通信可能に接続し、各拠点の間で通信デュエットを行わせる通信カラオケシステムが知られている。例えば、特許文献１に記載の通信カラオケシステムでは、Ａ地点の通信カラオケシステムとＢ地点の通信カラオケシステムとの間で同期処理を行った後、ガイドデータを相互に送信し、受信したガイドデータに基づいて同一のガイドデータを同時に再生させている。すなわち、この通信カラオケシステムでは、カラオケ楽曲の再生を各カラオケシステムで同時に開始させている。

また、最近は１人で行う１人カラオケも人気である。この１人カラオケは、カラオケ歌唱の練習、ストレスの解消、時間潰しといった様々な目的で行われている。このような背景から、１人カラオケの専門店や専用ルームも増加しつつある。

特開２０１０−１１２９８１号公報

ところで、１人カラオケを行っていた利用者が、気が変わってデュエット歌唱を希望するケースが想定される。この場合、希望時点におけるカラオケルームの利用者のみを対象にデュエット歌唱の募集を行うと、募集対象の利用者を多数集めることが難しく、結果としてデュエット歌唱が行えないケースが頻発する可能性がある。

また、通信デュエットに関して、拠点間を接続する伝送路の遅延状態は一定であるとは限らないし、各通信カラオケシステムでの処理負荷も同じとは限らない。このため、前述の通信カラオケシステムでは、ガイドデータの再生タイミングが相互に揃うとは限らない。そして、ガイドデータの再生タイミングがずれてしまうと、音声と演奏音がずれることとなり、デュエット歌唱を十分に楽しませることが難しくなる。

本発明は、これらの事情に鑑みてなされたものであり、その目的は、募集対象の利用者を多く集め、デュエット歌唱を成立し易くすることにある。また、伝送遅延によるデュエット歌唱への悪影響を抑制することにある。

前記目的を達成するため、本発明は、サーバーとカラオケ装置とユーザー端末のそれぞれを伝送路によって通信可能に接続し、前記カラオケ装置を利用する第１利用者と前記ユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせる通信カラオケシステムであって、前記サーバーは、カラオケ歌唱音の基となる前記第１利用者の歌唱音データ、及び、カラオケ演奏音の基となる当該カラオケ歌唱音と同じ楽曲の演奏音データを記憶するサーバー側記憶手段と、前記第１利用者による募集要求に応じ、前記歌唱音データと前記演奏音データの組を、前記ユーザー端末に配信するデータ配信手段を備え、前記ユーザー端末は、配信された前記歌唱音データと前記演奏音データを記憶する端末側記憶手段と、記憶された前記歌唱音データと前記演奏音データを再生し、前記第１利用者のカラオケ歌唱音を前記カラオケ演奏音と同期させて出力するデータ再生手段と、前記データ再生手段によるデータ再生時の前記第２利用者の歌唱音と前記カラオケ演奏音との混合音信号を生成する混合音信号生成手段と、生成された前記混合音信号を前記カラオケ装置に送信する信号送信手段を備え、前記カラオケ装置は、送信された前記混合音信号を受信して再生し、前記第２利用者のカラオケ歌唱音及び前記カラオケ演奏音を出力する信号再生手段を備えることを特徴とする。

本発明によれば、歌唱音データ及び演奏音データが複数のユーザー端末へ配信されることから、カラオケルームの利用者のみを対象にするよりも、募集対象の利用者を多く集めることができ、ひいてはデュエット歌唱を成立し易くさせることができる。

また、本発明によれば、第２利用者は、ユーザー端末で再生及び出力された、歌唱音データ及び演奏音データに基づく第１利用者のカラオケ歌唱音及びカラオケ演奏音とデュエット歌唱を行う。そして、このデュエット歌唱に伴って混合音信号が生成及び送信される。一方、第１利用者は、カラオケ装置で再生及び出力された、混合音信号に基づく第２利用者のカラオケ歌唱音及びカラオケ演奏音とデュエット歌唱を行う。このように、各利用者のカラオケ歌唱音の信号が伝送路を介して往復されないことから、伝送遅延によるデュエット歌唱への悪影響を抑制できる。

前述の通信カラオケシステムにおいて、前記サーバー側記憶手段は、歌唱の巧拙を示す指標情報を複数の利用者のそれぞれについて記憶し、前記データ配信手段は、前記第１利用者の指標情報と前記第２利用者の指標情報とを参照し、前記歌唱音データと前記演奏音データの組の配信対象となる前記ユーザー端末を定めることが好ましい。この構成では、データの配信対象となるユーザー端末が、歌唱の巧拙を示す指標情報に基づいて定められることから、第１利用者に適した歌唱レベルの第２利用者を選別できる。

前述の通信カラオケシステムにおいて、前記ユーザー端末は、前記募集要求に対する応募回答を前記サーバーに送信する応募手段を備え、前記サーバーは、複数の前記ユーザー端末から前記応募回答があった場合に１つの前記ユーザー端末を選択し、選択したユーザー端末と前記カラオケ装置のそれぞれに決定通知を送信するユーザー端末選択手段を備えることが好ましい。この構成では、複数の応募回答があった場合において、デュエット対象の第２利用者を、当該第２利用者と第１利用者のそれぞれに通知できる。

前述の通信カラオケシステムにおいて、前記サーバー側記憶手段は、前記歌唱音データと共に取得された、歌唱映像の基となる前記第１利用者の歌唱映像データを記憶し、前記データ配信手段は、前記歌唱映像データを前記歌唱音データ及び前記演奏音データと組にして前記ユーザー端末に配信し、前記端末側記憶手段は、配信された前記歌唱映像データを記憶し、前記データ再生手段は、記憶された前記歌唱映像データを再生し、前記第１利用者の歌唱映像を前記第１利用者のカラオケ歌唱音及び前記カラオケ演奏音と同期させて表示し、前記ユーザー端末は、前記データ再生手段によるデータ再生時における前記第２利用者の映像信号を生成する映像信号生成手段を備え、前記信号送信手段は、生成された映像信号を前記混合音信号と共に前記カラオケ装置に送信し、前記信号再生手段は、送信された映像信号を受信して再生し、前記第２利用者の歌唱映像を表示することが好ましい。この構成では、映像付きのデュエット歌唱を各利用者に楽しませることができる。

また、本発明は、サーバーとカラオケ装置と複数のユーザー端末のそれぞれを伝送路によって通信可能に接続した通信カラオケシステムを用い、前記カラオケ装置を利用する第１利用者と前記ユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせる制御方法であって、カラオケ歌唱音の基となる前記第１利用者の歌唱音データ、及び、カラオケ演奏音の基となる当該カラオケ歌唱音と同じ楽曲の演奏音データを、前記サーバーが備えるサーバー側記憶手段に記憶させる記憶ステップと、前記第１利用者による募集要求に応じ、複数の前記ユーザー端末の中からデュエット歌唱を行わせる候補となる１以上の前記ユーザー端末を、前記サーバーに抽出させる抽出ステップと、抽出された前記ユーザー端末に対し、前記歌唱音データと前記演奏音データの組を、前記サーバーから配信させ、前記ユーザー端末が備える端末側記憶手段に記憶させるデータ配信ステップと、応募の意思を有する前記第２利用者の操作によって前記ユーザー端末から送信された応募回答を前記サーバーに受信させ、デュエット歌唱を行わせる１つの前記ユーザー端末を前記サーバーに選択させる端末選択ステップと、前記歌唱音データと前記演奏音データの同期再生時における前記第２利用者の歌唱音と前記カラオケ演奏音との混合音信号を、選択された前記ユーザー端末に生成させると共に、当該ユーザー端末から前記カラオケ装置へ送信させる混合音信号送信ステップと、送信された前記混合音信号を前記カラオケ装置に受信及び再生させ、前記第２利用者のカラオケ歌唱音及び前記カラオケ演奏音を出力させる混合音信号再生ステップとを行うことを特徴とする。

本発明によれば、サーバーとカラオケ装置とユーザー端末のそれぞれを伝送路によって通信可能に接続した通信カラオケシステムを用いて、カラオケ装置を利用する第１利用者とユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせるに際し、募集対象となる第２利用者を多く集めることができ、デュエット歌唱を成立し易くすることができる。また、伝送遅延によるデュエット歌唱への悪影響を抑制することができる。

通信カラオケシステムの概略構成を説明する図である。ホスト装置の構成を説明するブロック図である。顧客情報を説明する概念図である。カラオケ装置の構成を説明するブロック図である。カラオケ本体の構成を説明するブロック図である。ユーザー端末の構成を説明するブロック図である。ホスト装置、カラオケ装置、及びユーザー端末が伝送路を介して通信可能に接続された状態を説明する概念図である。カラオケ装置、ホスト装置、及び、ユーザー端末の動作を説明するフローチャートである。カラオケ装置からホスト装置への歌唱動画データの送信を説明する概念図である。ホスト装置から各ユーザー端末への募集用動画データ及びカラオケデータの組の送信を説明する概念図である。ユーザー端末及びカラオケ装置のそれぞれでデュエット歌唱を行っている状態を説明する概念図である。

まず本発明の第１実施形態について説明する。図１に示す通信カラオケシステムは、ホスト装置１とカラオケ装置２とユーザー端末３とを有している。そして、これらが伝送路４を介して通信可能に接続されている。カラオケ装置２は、例えばカラオケ店ＫＢの各カラオケルームＲＭに設置されている。

詳細は後述するが、伝送路４を通じたデュエット歌唱（以下、通信デュエットという）に際し、ユーザー端末３は、ホスト装置１から配信された募集用動画データ及びカラオケデータを再生する。また、カラオケ装置２は、ユーザー端末３から伝送路４を通じて送信された端末利用者の歌唱音とカラオケ演奏音との混合音信号を出力する。以下、各装置について説明する。

ホスト装置１は、サーバーとして機能し、顧客情報などの各種情報を蓄積して管理する。図２に示すように、ホスト装置１は、ホスト側制御部１１と、ホスト側通信部１２と、ホスト側記憶部１３とを有している。ホスト側制御部１１は、ホスト装置１における制御の中心となる部分であり、ＣＰＵ１１ａやメモリ１１ｂを有している。ＣＰＵ１１ａは、メモリ１１ｂに記憶された動作プログラムに従って各種の制御を実行する。メモリ１１ｂは、ＣＰＵ１１ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶素子である。ホスト側通信部１２は、ホスト装置１を伝送路４に接続するためのインタフェースを提供する。そして、ホスト側制御部１１とホスト側通信部１２の組は、歌唱音データと演奏音データの組（後述する募集用動画データとカラオケデータの組）を、ユーザー端末３に配信するデータ配信手段に相当する。

ホスト側記憶部１３は、大容量の情報を記憶する記憶装置であり、サーバー側記憶手段に相当する。このホスト側記憶部１３は、ハードディスクドライブ等によって構成されており、その一部領域は、顧客情報記憶領域、歌唱録音データ記憶領域、映像録画データ記憶領域、募集用動画データ記憶領域、カラオケデータ記憶領域として用いられている。

顧客情報記憶領域は、利用者（顧客）の属性情報や履歴情報が記憶される領域である。属性情報としては、例えば図３（ａ）に示すように、利用者ＩＤ、住所、電話番号、年齢、性別、職業、及び平均点が記憶されている。これらの中で、利用者ＩＤは、利用者を識別するための情報であり、個々の利用者に対して付与される。平均点は、その利用者が歌唱した楽曲の採点値の平均である。また、履歴情報としては、例えば図３（ｂ）や図３（ｃ）に示すように、楽曲ＩＤ、利用店舗、歌唱日時、及び採点値が記憶されている。これらの中で、楽曲ＩＤは、過去に歌唱したカラオケ楽曲を識別するための情報である。採点値は、当該カラオケ楽曲を歌唱した際にカラオケ装置２の採点処理で付与された点数であり、歌唱の巧拙を示す指標である。なお、この顧客情報記憶領域に記憶される利用者の一部が、ユーザー端末３の利用者でもある。

図２に示す歌唱録音データ記憶領域は、カラオケ歌唱時のマイク入力音を記録した音声のデータ（以下歌唱録音データという）が記憶される領域であり、映像録画データ記憶領域は、カラオケ歌唱時の利用者や室内を撮影した映像のデータ（以下映像録画データという）が記憶される領域である。歌唱録音データ及び映像録画データは、カラオケルームＲＭで行われたカラオケ歌唱を録音及び録画したデータであり、カラオケルームＲＭの利用者（ルーム利用者）の要求に応じてカラオケ装置２からアップロードされる。

歌唱録音データ及び映像録画データの組（すなわち歌唱動画データ）は、利用者ＩＤ、楽曲ＩＤ、及び履歴情報と対応付けられた状態で記憶されている。すなわち、ホスト側記憶部１３は、カラオケ楽曲の歌唱に伴って取得された歌唱動画データを、利用者を示す利用者ＩＤ、カラオケ楽曲を示す楽曲ＩＤ、及び履歴情報に対応付けた状態で蓄積して記憶する。

この歌唱動画データは、例えばオフラインでのデュエット歌唱（以下コラボレーション歌唱という）をする際に利用される。コラボレーション歌唱では、ルーム利用者によって選択された歌唱動画データが、ホスト装置１からカラオケ装置２へダウンロードされ、カラオケ演奏音信号と共に再生される。この再生により、カラオケルームＲＭでは、歌唱動画データに基づく音声（カラオケ歌唱音）、及びカラオケ演奏音信号に基づくカラオケ演奏音が出力され、歌唱動画データに基づく映像（歌唱映像）が表示される。そして、歌唱動画データに基づく音声及びカラオケ演奏音にあわせて歌唱することで、ルーム利用者は、歌唱動画データの歌唱者とデュエットを行っている雰囲気を味わうことができる。なお、コラボレーション歌唱では、利用者が録画しアップロードした歌唱動画が公開され、ルーム利用者はそれらの中から好みの歌唱動画を選択するが、通信デュエットにおいては、使用される歌唱動画は公開されず、ホスト装置１が決定したユーザー端末３に対してのみ個別に配信される。

募集用動画データ記憶領域は、募集用動画データが記憶される領域である。この募集用動画データは、ルーム利用者（第１利用者）が通信デュエットの相手を募集する場合に、ホスト装置１からユーザー端末３へ配信される。本実施形態の募集用動画データは、歌唱時の音声が録音された募集用音声データ（歌唱音データに相当する）と、歌唱時の映像が録画された募集用録画データ（歌唱映像データに相当する）の組とで構成されている。この募集用動画データは、ユーザー端末３での再生に適したデータ形式が採用されており、利用者ＩＤや楽曲ＩＤに対応付けられた状態で募集用動画データ記憶領域に記憶されている。

この募集用動画データは、例えばデュエット相手の募集を決めたルーム利用者が、カラオケルームＲＭでカラオケ歌唱を録音及び録画することで得られた募集用の歌唱動画データから作成される。また、募集用動画データは、歌唱録音データ記憶領域や映像録画データ記憶領域に記憶されているコラボレーション歌唱用の歌唱動画データから作成することもできる。

カラオケデータ記憶領域は、カラオケデータが記憶される領域である。このカラオケデータは、通信デュエットの相手を募集する時に、募集用動画データとともにホスト装置１からユーザー端末３へ配信される。本実施形態のカラオケデータは、カラオケ楽曲の演奏音が録音された募集用演奏音データとカラオケ楽曲の歌詞が記録された募集用歌詞データの組で構成されており、募集用動画データと同様にユーザー端末３での再生に適したデータ形式が採用されている。本実施形態におけるカラオケデータは、通信デュエット対象曲の全てに対して予め作成されており、楽曲ＩＤに対応付けられた状態で記憶されている。

次に、カラオケ装置２について説明する。カラオケ装置２は、カラオケ演奏、及び、カラオケ歌唱時の音声録音や映像録画等を行うものであり、例えば図４に示すように、カラオケ本体２１と、スピーカー２２と、モニタ２３と、歌唱マイク２４と、ビデオカメラ２５と、リモコン装置２６とを有している。

カラオケ本体２１は、選択されたカラオケ楽曲の演奏制御、歌詞及び背景映像の表示制御、歌唱マイク２４で生成されたマイク信号の処理、録音及び録画制御といった、カラオケ歌唱に関する各種の制御を行う部分である。このカラオケ本体２１については、後で詳しく説明する。

スピーカー２２は、カラオケ本体２１に接続されており、カラオケ本体２１から出力される放音信号に基づいて音を出力する。例えば、個々のカラオケルームＲＭで行われる通常のカラオケ歌唱では、ルーム利用者の音声及びカラオケ本体２１に記憶されている楽曲データに基づいて再生されるカラオケ演奏音の混合音がスピーカー２２から出力される。また、通信デュエットでは、ユーザー端末３を利用する端末利用者の音声、及び、カラオケ演奏音が混合された混合音信号が、ユーザー端末３から伝送路４を通じてカラオケ本体２１へ送信される。そして、カラオケ本体２１では、受信した混合音信号に基づく端末利用者の音声、及び、カラオケ演奏音に、ルーム利用者の音声をさらに混合し、混合後の放音信号をスピーカー２２に出力する。これにより、スピーカー２２からは、ルーム利用者の音声、端末利用者の音声、及び、カラオケ演奏音の混合音が出力される。

従って、カラオケ本体２１とスピーカー２２の組は、ユーザー端末３から送信された混合音信号を受信して再生し、端末利用者（第２利用者）のカラオケ歌唱音及びカラオケ演奏音を出力する信号再生手段（音声信号再生手段）に相当する。

モニタ２３は、カラオケ本体２１に接続されており、カラオケ本体２１からの映像信号に基づいて映像を画面に表示する。例えば、歌唱対象のカラオケ楽曲における歌詞や背景映像を表示させる。また、通信デュエットでは、ユーザー端末３から伝送路４を通じてカラオケ本体２１へ送信された映像信号に基づき、端末利用者の映像がモニタ２３に表示される。

従って、カラオケ本体２１とモニタ２３の組は、ユーザー端末３から送信された映像信号を受信して再生し、端末利用者の歌唱映像を表示する信号再生手段（映像信号再生手段）に相当する。

歌唱マイク２４はカラオケ本体２１に接続されており、ルーム利用者の音声等をマイク信号に変換してカラオケ本体２１に入力させる。このマイク信号はカラオケ本体２１で適宜調整され、カラオケ演奏音等と混合される。ビデオカメラ２５は、カラオケルームＲＭを撮影することで、映像信号を生成する。このビデオカメラ２５もカラオケ本体２１に接続されており、生成された映像信号がカラオケ本体２１に入力される。そして、カラオケ本体２１は、入力された映像信号に基づく映像をモニタ２３に表示させたり、入力された映像信号を変換して歌唱録画データを生成したりする。

リモコン装置２６は、カラオケ本体２１との間で情報を送受信するための双方向通信可能な短距離無線通信部を備えており、カラオケ楽曲の予約時などに操作される。カラオケ楽曲の予約時において、リモコン装置２６からは、演奏対象の楽曲を識別するための楽曲ＩＤを含んだ操作信号が送信される。そして、カラオケ本体２１は、ルーム利用者が選択したカラオケ楽曲を待ち行列で管理する。

また、本実施形態のリモコン装置２６は、ルーム利用者を認証するときに用いられたり、通信デュエットの相手を募集するときに用いられたりする。その際、ルーム利用者による操作に応じた操作情報をホスト装置１に対して送信する。この場合において、ホスト装置１に対しては、操作信号が近隣のルーター装置ＲＴ１及び伝送路４を介して送信される。このような動作をするリモコン装置２６は、操作情報送信手段に相当する。

次に、カラオケ本体２１について詳細に説明する。図５に示すように、カラオケ本体２１は、本体側制御部３１と、本体側通信部３２と、本体側記憶部３３と、音源部３４と、音響処理部３５と、表示処理部３６と、映像入力部３７と、操作部３８とを有している。そして、これらの各部がバスＢＳ１を介して通信可能な状態に接続されている。

本体側制御部３１は、カラオケ本体２１における制御の中心となる部分であり、ＣＰＵ３１ａやメモリ３１ｂを有している。ＣＰＵ３１ａは、メモリ３１ｂに記憶された動作プログラムに従って各種の制御を実行する。例えば、操作部３８からの操作を受け付ける操作入力処理やシーケンサとして動作するシーケンサ処理を行う。メモリ３１ｂは、ＣＰＵ３１ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶素子である。

本体側通信部３２は、ルーター装置ＲＴ１を介してカラオケ本体２１を伝送路４に接続するためのインタフェースを提供する。このため、本体側通信部３２は、ルーター装置ＲＴ１との間で情報の送受信を行う。そして、本体側通信部３２は、本体側制御部３１によって動作が制御される。

本体側記憶部３３は、各種のデータを記憶する大容量の記憶装置であり、例えばハードディスクドライブによって構成されている。この本体側記憶部３３には、例えば、楽曲データ記憶領域、背景映像データ記憶領域、歌唱録音データ記憶領域、及び映像録画データ記憶領域が設けられる。

楽曲データ記憶領域には、リモコン装置２６で選択されたカラオケ楽曲を演奏するための楽曲データが記憶され、背景映像データ記憶領域には、モニタ２３に背景映像を表示させるための背景映像データが記憶される。

楽曲データには、ＭＩＤＩデータと歌詞データとが含まれる。ＭＩＤＩデータは、電子楽器による音楽の演奏情報（演奏データ）であり、時系列のノート情報によって構成される。ノート情報は、例えば発音や消音のタイミング、キーの押圧力、音量や音質、再生テンポ（ピッチ）などを制御する各種の命令によって構成される。歌詞データは、カラオケ楽曲における歌詞テロップをモニタ２３で表示させるためのデータである。なお、これらのＭＩＤＩデータと歌詞データは、カラオケ装置２で演奏可能なカラオケ楽曲のそれぞれについて、楽曲ＩＤに対応付けられた状態で記憶されている。

歌唱録音データ記憶領域には、カラオケ歌唱時に録音された歌唱録音データが記憶され、映像録画データ記憶領域には、カラオケ歌唱時に撮影された映像録画データが記憶される。そして、歌唱録音データや映像録画データは、ルーム利用者の要求に応じてカラオケ装置２からホスト装置１へアップロードされる。

音源部３４は、ＭＩＤＩデータに基づいてカラオケ演奏音信号を生成する部分であり、ＣＰＵ３４ａと、メモリ３４ｂと、波形メモリ３４ｃとを有している。ＣＰＵ３４ａは、メモリ３４ｂに記憶された動作プログラムに従って各種の制御を実行する。メモリ３４ｂは、ＣＰＵ３４ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶素子である。波形メモリ３４ｃは、対象楽器が奏でた様々な音の波形データを読み出し可能に記憶する記憶素子である。この音源部３４は、本体側制御部３１がシーケンサ処理を行うと、ＭＩＤＩデータに応じて波形データを加工し、加工後の楽音信号を音響処理部３５に出力する。

音響処理部３５は、カラオケ演奏音信号の処理、及び、歌唱マイク２４で生成されたマイク信号の処理を行う部分である。例えば、カラオケ楽曲の演奏制御において、音響処理部３５は、音源部３４から出力された楽音信号をアナログ変換し、カラオケ演奏音信号を生成する。また、歌唱マイク２４からのマイク信号が入力されると、適宜調整を施して音声信号を生成する。この音声信号は、カラオケ演奏音信号と混合されてスピーカー２２に出力される。また、通信デュエットにおいて、音響処理部３５は、伝送路４を通じて受信した混合音信号と音声信号とを混合してスピーカー２２に出力する。加えて、カラオケ歌唱を録音する場合、音響処理部３５は、生成した音声信号をデジタルの歌唱録音データに変換して本体側記憶部３３に記憶させる。

表示処理部３６は、カラオケ演奏時における背景映像の表示等の制御を行う。通常のカラオケ演奏時において、表示処理部３６には背景映像データが入力されており、この背景映像データのデコードが行われる。そして、表示処理部３６は、デコードで生成された背景映像の映像信号に歌詞テロップを合成し、合成後の映像信号をモニタ２３に出力する。その際、表示処理部３６は、本体側制御部３１でのシーケンサ処理で出力される歌詞データに基づき、歌詞テロップを合成する。また、シーケンサ処理で出力される色換え命令に従って、歌詞テロップの表示色を変更する。その結果、モニタ２３には、背景映像に歌詞テロップが重ねられた映像が表示され、かつ、カラオケ楽曲の進行にあわせて歌詞テロップの表示色が変更される。また、通信デュエットにおいて、表示処理部３６は、伝送路４を通じて受信した映像信号をモニタ２３に出力する。ここで、歌詞付きの映像信号を受信した場合には映像信号をそのまま出力し、歌詞のない映像信号を受信した場合には歌詞テロップを合成した映像信号を出力する。

映像入力部３７は、ビデオカメラ２５からの映像信号を取り込む部分であり、例えばインタフェース回路によって構成されている。カラオケ歌唱の映像撮影時において、ビデオカメラ２５からはルーム利用者等を撮影した映像信号が出力される。そして、映像入力部３７は、入力された映像信号を表示処理部３６に出力する。これにより、モニタ２３には、ルーム利用者の映像が表示される。また、映像入力部３７は、入力された映像信号をデジタルの映像録画データに変換して本体側記憶部３３に記憶させることも行う。

また、後述するように、通信デュエット時においてユーザー端末３からは、端末利用者等を撮影した映像信号が伝送路４を通じて送信される。この場合において、映像入力部３７は、受信した映像信号を表示処理部３６に出力する。これにより、モニタ２３には端末利用者の映像が表示される。

操作部３８は、パネルスイッチやリモコン受信回路などからなっており、パネルスイッチやリモコン装置２６の操作に応じた操作信号を本体側制御部３１に対して出力する。本体側制御部３１は、操作入力処理を行うことで操作信号を検出し、対応する処理を実行する。なお、パネルスイッチやリモコン装置２６は、操作を選択するための種々のキースイッチ（図示せず）を備えている。そして、リモコン装置２６を通じた操作により、通常のカラオケ歌唱や通信デュエットを選択して実行できる。

次に、ユーザー端末３について説明する。ユーザー端末３は、端末利用者が保有する装置であり、図１に示すように、パーソナルコンピュータ３Ａ、タブレットコンピュータ３Ｂ、及び、携帯電話機３Ｃ等が該当する。このユーザー端末３にインストールされたアプリケーションソフトウェアを実行することで、ユーザー端末３を簡易型のカラオケ端末として利用できる。また、ホスト装置１からのプッシュ通知をユーザー端末３に送信することもできる。

図６（ａ）に示すように、ユーザー端末３は、端末側制御部４１と、第１通信部４２と、第２通信部４３と、端末側記憶部４４と、入力操作部４５と、カメラ制御部４６と、音声制御部４７と、表示制御部４８とを有しており、これらがバスＢＳ２を介して通信可能な状態に接続されている。また、カメラ制御部４６にはカメラユニット４９が接続され、音声制御部４７にはマイクユニット５０及びスピーカーユニット５１が接続され、表示制御部４８には表示ユニット５２が接続されている。

端末側制御部４１は、ユーザー端末３における制御の中心となる部分であり、ＣＰＵ４１ａやメモリ４１ｂを備えている。ＣＰＵ４１ａは、メモリ４１ｂに記憶された動作プログラムに従って各種の制御を実行する。メモリ４１ｂは、ＣＰＵ４１ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶素子である。

第１通信部４２は、基地局ＢＴＳやルーター装置ＲＴ２と通信可能に接続するためのインタフェースを提供する。この第１通信部４２は、端末側制御部４１によって動作が制御され、基地局ＢＴＳに対して電気通信事業者の回線を利用した無線通信を行い、ルーター装置ＲＴ２に対して短距離無線通信や有線通信を行う。ユーザー端末３は、基地局ＢＴＳやルーター装置ＲＴ２を介して伝送路４に接続され、ホスト装置１やカラオケ装置２との間で各種データや各種信号を送受信する。

なお、第１通信部４２は、デュエット歌唱時において、端末利用者（第２利用者）によるカラオケ歌唱音とカラオケ演奏音とを混合した混合音信号をカラオケ装置２に向けて送信する。このため、第１通信部４２と、この第１通信部４２の動作を制御する端末側制御部４１の組は、混合音信号をカラオケ装置２に送信する信号送信手段に相当する。

第２通信部４３は、ヘッドセット５３と通信可能に接続するためのインタフェースを提供する。この第２通信部４３は、ヘッドセット５３に対して短距離無線通信や有線通信を行う。ヘッドセット５３を用いることで端末利用者は、ユーザー端末３で表示される映像を視ることができ、ユーザー端末３から出力される音声を聴くこと、ユーザー端末３に音声を入力することをハンズフリーで行うこともできる。

端末側記憶部４４は、ユーザー端末３で使用される情報を記憶する記憶装置である。図６（ｂ）に示すように、端末側記憶部４４の一部領域は、アプリケーション記憶領域、募集用動画データ記憶領域、カラオケデータ記憶領域として用いられている。

アプリケーション記憶領域は、アプリケーションソフトウェアがインストールされる領域である。このアプリケーションソフトウェアは、ユーザー端末３を簡易型のカラオケ端末として利用させるためのものであり、端末利用者からの指示に基づいて端末側制御部４１によって実行される。

募集用動画データ記憶領域は、ホスト装置１の募集用動画データ記憶領域と同様に募集用動画データが記憶される領域である。すなわち、伝送路４を通じてホスト装置１から送信された募集用動画データが記憶される領域である。

カラオケデータ記憶領域もまた、ホスト装置１のカラオケデータ記憶領域と同様にカラオケデータが記憶される領域である。すなわち、伝送路４を通じてホスト装置１から送信されたカラオケデータが記憶される領域である。

前述したように、募集用動画データは、歌唱音データに相当する募集用音声データと、歌唱映像データに相当する募集用録画データの組で構成されている。また、カラオケデータは、演奏音データに相当する募集用演奏音データと、歌詞データに相当する募集用歌詞データの組で構成されている。このため、これらのデータを記憶する端末側記憶部４４は、端末側記憶手段に相当する。

なお、本実施形態では、ユーザー端末３のＯＳ自身、あるいはアプリケーションソフトウェアがＭＩＤＩ音源を搭載しており、ホスト装置１はユーザー端末３に募集用演奏音データとして、ＭＩＤＩデータとキー／テンポ設定情報を送信するが、ユーザー端末３がＭＩＤＩ音源を搭載していない場合には、ホスト装置１からはＭＩＤＩデータに基づいて音源を鳴らしたオーディオデータを送信する。このオーディオデータは、カラオケ装置２で募集用歌唱音声データが録音される際に、同時に分離可能に録音しておくことができる。

入力操作部４５は、端末利用者によって入力操作される部分であり、例えばタッチパネル、キーボード、マウス、トラックボールといった各種入力デバイスによって構成される。そして、端末側制御部４１には、入力操作部４５への入力操作に応じた操作信号が出力される。この操作信号に基づき、端末側制御部４１は端末利用者の入力操作を認識する。例えば、入力操作部４５への操作により、後述する応募通知をホスト装置１へ送信（回答）することができる。この場合において、端末側制御部４１、入力操作部４５、第１通信部４２の組は、応募手段に相当する。

カメラ制御部４６は、カメラユニット４９に対する制御など撮影に関する制御を行う部分である。例えば、カメラユニット４９の動作を制御したり、カメラユニット４９での撮影で得られた映像信号を取り込んだりする。このカメラ制御部４６は、端末側制御部４１からの制御に従って動作を行う。

音声制御部４７は、音声信号の入出力など音声に関する制御を行う部分である。例えば、マイクユニット５０で変換されたマイク信号を取り込んだり、スピーカーユニット５１に対して放音信号を出力したり、第２通信部４３に接続されたヘッドセット５３との間でマイク信号や放音信号をやりとりしたりする。

さらに、音声制御部４７は、通信デュエットにおいて、端末側記憶部４４に記憶された募集用音声データ及び募集用演奏音データを同期再生すると共に、ヘッドセット５３或いはマイクユニット５０からのマイク信号を混合する。これにより、ヘッドセット５３或いはスピーカーユニット５１からは、募集用音声データに基づくルーム利用者の歌唱音声と、募集用演奏音データに基づくカラオケ演奏音と、端末利用者の歌唱音声とが出力される。

この音声制御部４７もまた、端末側制御部４１からの制御に従って動作を行う。このため、端末側制御部４１、音声制御部４７、及び、スピーカーユニット５１（又はヘッドセット５３）の組は、記憶された募集用音声データ（歌唱音データ）と募集用演奏音データ（演奏音データ）を再生し、ルーム利用者（第１利用者）のカラオケ歌唱音をカラオケ演奏音と同期させて出力するデータ再生手段（音声データ再生手段）に相当する。

加えて、音声制御部４７は、募集用音声データに基づくカラオケ歌唱音にあわせて、端末利用者による歌唱音のマイク信号をマイクユニット５０或いはヘッドセット５３から取得する。そして、音声制御部４７は、募集用演奏音データの再生によって得られた演奏音信号をマイク信号と混合することで混合音信号を生成する。生成された混合音信号は、第１通信部４２を介してカラオケ装置２に送信される。

このため、端末側制御部４１と音声制御部４７の組は、データ再生時の端末利用者の歌唱音とカラオケ演奏音との混合音信号を生成する混合音信号生成手段に相当する。また、端末側制御部４１と第１通信部４２の組は、生成された混合音信号をカラオケ装置２に送信する信号送信手段に相当する。

表示制御部４８は、表示ユニット５２に対する制御など表示に関する制御を行う部分である。例えば、端末側記憶部４４に記憶された募集用録画データを募集用音声データ等と同期再生し、募集用録画データに基づく映像を表示ユニット５２に表示させる。また、表示制御部４８は、デュエット相手の募集に関して必要な情報を表示ユニット５２に表示させたり、カメラユニット４９で撮影された端末利用者の映像を表示ユニット５２に表示させたりする。なお、ホスト装置１が送信する募集用演奏音データに歌詞情報を含ませることも可能である。このように構成すれば、受信したユーザー端末３の表示ユニット５２に、歌詞を色変えしながら他の映像と合成して表示することができる。

この表示制御部４８もまた、端末側制御部４１からの制御に従って動作を行う。このため、端末側制御部４１、表示制御部４８、及び、表示ユニット５２の組は、記憶された募集用録画データ（歌唱映像データ）を再生し、ルーム利用者（第１利用者）の歌唱映像をルーム利用者のカラオケ歌唱音及びカラオケ演奏音と同期させて表示させるデータ再生手段（録画データ再生手段）に相当する。

次に、上記構成を有する通信カラオケシステムの動作について説明する。このカラオケシステムは、通信デュエットの処理に特徴を有している。このため、通信デュエットの動作を中心に説明を行う。

図７に示すように、この通信カラオケシステムでは、ホスト装置１とカラオケ装置２とユーザー端末３とが、伝送路４を介して相互に通信可能な状態で接続されている。図７の例では、便宜上、１台のカラオケ装置２と３台のユーザー端末３を例示したが、実際には多数のカラオケ装置２及びユーザー端末３が接続されている。

この通信カラオケシステムでは、ルーム利用者（第１利用者）がデュエット歌唱を希望するとき、ホスト装置１（サーバー）に依頼をすることで、ホスト装置１が複数の端末利用者（第２利用者）に対して募集をかける。すなわち、ホスト装置１は、ルーム利用者による募集用動画データをカラオケデータとともに複数のユーザー端末３へ配信する。募集用動画データを視聴した端末利用者が募集に応じると、募集に応じた端末利用者とルーム利用者との間で通信デュエットが行われる。

この通信デュエットにおいて、募集に応じた端末利用者のユーザー端末３では、配信された募集用動画データ及びカラオケデータが再生される。このため、端末利用者は、募集用動画データに基づく音声及びカラオケデータに基づくカラオケ演奏音に対してデュエット歌唱を行う。そして、ユーザー端末３は、端末利用者の歌唱音声とカラオケ演奏音を混合した混合音信号を生成し、伝送路４を通じてカラオケ装置２へ送信する。カラオケ装置２は、受信した混合音信号を再生し、端末利用者の歌唱音声をカラオケ演奏音とともに出力する。ルーム利用者は、端末利用者の歌唱音声及びカラオケ演奏音に対してデュエット歌唱を行う。

図８は、通信デュエットにおける各装置の動作を説明するフローチャートである。同図に示すように、通信デュエットを行うに際し、ルーム利用者の認証処理（Ｓ１０）、募集用動画データの生成処理（Ｓ２０）、配信対象となる端末利用者の選定処理（Ｓ３０）、デュエット相手となる端末利用者の決定処理（Ｓ４０）、及び、デュエット歌唱処理（Ｓ５０）が行われる。以下、各処理について具体的に説明する。

ルーム利用者の認証処理（Ｓ１０）において、ルーム利用者（歌唱者）はリモコン装置２６を操作し、ログイン処理を行う（Ｓ１１）。このログイン処理では、利用者ＩＤやパスワードが入力される。そして、ホスト装置１は、ルーム利用者の認証処理を行う（Ｓ１２）。この認証処理では、入力された利用者ＩＤとパスワードの組み合わせが正しいか否かが判定され、正しい場合にルーム利用者が特定される。

募集用動画データの生成処理（Ｓ２０）は、募集用動画データを生成してホスト装置１に記憶させる処理である。この処理では、まずルーム利用者がデュエット歌唱を行うカラオケ楽曲を選択して予約する（Ｓ２１）。これにより、選択されたカラオケ楽曲が待ち行列で管理される。また、ルーム利用者は、カラオケ装置２を歌唱動画の記録モードに設定し、歌唱中の様子を録音並びに録画できる状態にする。その後、選択したカラオケ楽曲が演奏されるので、ルーム利用者は演奏音にあわせて自身のパートを歌唱する。そして、歌唱中の様子が録音並びに録画され、歌唱録音データ及び映像録画データとして本体側記憶部３３に記憶される（Ｓ２２）。

納得のいく動画が得られたならば、ルーム利用者はカラオケ装置２（リモコン装置２６）を操作してアップロードを指示する。これにより、図９に示すように、歌唱動画データ（歌唱録音データ，映像録画データ）がアップロードされる（Ｓ２３）。一方、ホスト装置１は、アップロードされた歌唱動画データをホスト側記憶部１３に記憶する（Ｓ２４）。あわせて、ホスト装置１は、歌唱動画データを変換し、募集用動画データ（募集用音声データ，募集用録画データ）を生成してホスト側記憶部１３に記憶する（Ｓ２５）。

端末利用者の選定処理（Ｓ３０）は、募集用動画データ等の配信対象となる端末利用者を選定する処理である。この選定処理において、ルーム利用者は、カラオケ装置２を操作してホスト装置１に募集依頼を行う（Ｓ３１）。例えば、リモコン装置２６を操作して、募集に際して端末利用者にアピールするメッセージを作成したり、募集条件を設定したりする。その後、募集用ボタンを操作することで、メッセージや募集条件等を含む募集コマンドがホスト装置１へ送信される。

募集コマンドを受信したホスト装置１は、候補者の抽出処理を行う（Ｓ３２）。この抽出処理において、ホスト装置１は、ホスト側記憶部１３の顧客情報記憶領域に記憶された利用者の属性情報や履歴情報を参照し、募集を依頼したルーム利用者に適する端末利用者を抽出する。例えば、ホスト装置１は、選択されたカラオケ楽曲の歌唱経験の有無、ルーム利用者の採点値及び端末利用者の採点値、性別、年齢等を参照し、候補者となる端末利用者を抽出する。なお、候補者として抽出されるか否かを端末利用者が設定可能とし、許可設定されている端末利用者のみを抽出対象とする構成にしてもよい。

候補者となる端末利用者を抽出したならば、ホスト装置１とカラオケ装置２との間で候補者絞込処理（Ｓ３３）と絞込指示（Ｓ３４）が行われる。例えば、ホスト装置１は、候補者となる端末利用者が記載された候補者リストをカラオケ装置２に送信する。一方、カラオケ装置２では、リモコン装置２６やモニタ２３を利用し、受信した候補者リストをルーム利用者に提示する。そして、ルーム利用者の指示に基づく絞込指示が行われると、その絞込条件等の情報がカラオケ装置２からホスト装置１へ送信される。これにより、ホスト装置１は、絞込条件を加味した新たな候補者リストを作成し、カラオケ装置２に送信する。このような処理を繰り返し、ルーム利用者が納得したならば、その旨を示す情報がホスト装置１に送信され、候補者となる１名ないし複数の端末利用者が確定する。なお、個人情報に配慮し、ルーム利用者は候補者人数だけを指定し、ホスト装置１はその人数以下の端末利用者を候補者として確定してもよい。

デュエット相手の決定処理（Ｓ４０）は、候補者となる端末利用者の中からデュエット相手を決定する処理である。この決定処理において、ホスト装置１のホスト側制御部１１は、ユーザー端末選択手段として機能する。そして、ホスト装置１は、候補者として確定された端末利用者に対し、ルーム利用者がデュエット相手を募集中である旨を通知する（Ｓ４１）。例えば、図１０に示すように、ホスト装置１は、確定された端末利用者のユーザー端末３に対し、募集内容の情報を募集用動画データ及びカラオケデータとともに配信する。なお、募集内容は、例えばカラオケ楽曲やルーム利用者のニックネームである。そして、これらの募集内容の情報、募集用動画データ、及び、カラオケデータは、ユーザー端末３に受信され（Ｓ４２）、端末側記憶部４４に記憶される。なお、これらの処理において、ホスト装置１が有するホスト側制御部１１とホスト側通信部１２の組は、データ配信手段として機能する。

募集に対して興味を持った端末利用者は、ユーザー端末３に記憶された募集用動画データ及びカラオケデータを、当該ユーザー端末３によって同期再生する（Ｓ４３）。そして、応募の意思を固めた端末利用者は、ユーザー端末３を操作して応募通知（応募回答）を送信する（Ｓ４４）。例えば、応募通知として、応募の意思を示す応募コマンドを端末利用者の利用者ＩＤと共に送信する。この応募通知はホスト装置１にて受信される（Ｓ４５）。応募通知の受信によってホスト装置１は、デュエット相手となる端末利用者を決定し、決定通知を送信する（Ｓ４６）。この決定通知は、決定された端末利用者のユーザー端末３とカラオケ装置２のそれぞれに受信される（Ｓ４７，Ｓ４８）。

なお、多数の端末利用者から応募通知が送信された場合、ホスト装置１は、所定人数の端末利用者を適宜選択する。例えば、応募通知の受信順に端末利用者を選択してもよいし、所定期間内に応募通知を受信した端末利用者の中から、採点値が最も高い端末利用者を選択してもよい。そして、決定された端末利用者のユーザー端末３とカラオケ装置２に決定通知が送信されるので、デュエット対象の端末利用者を、当該端末利用者とルーム利用者のそれぞれに通知できる。

デュエット歌唱処理（Ｓ５０）は、決定された端末利用者とルーム利用者のそれぞれにデュエット歌唱を行わせる処理である。この処理では、決定された端末利用者のユーザー端末３から開始予告が送信され（Ｓ５１）、この開始予告がカラオケ装置２に受信される（Ｓ５２）。これにより、カラオケ装置２ではモニタ２３で予告表示が行われ、ルーム利用者はデュエット歌唱が開始されることを認識できる。

その後、端末利用者とルーム利用者のそれぞれがデュエット歌唱を行う（Ｓ５３，Ｓ５４）。ここでは、図１１に示すように、ユーザー端末３で募集用動画データがカラオケデータと共に再生される。このため、端末利用者は、これらのデータに基づく音声及び映像を視聴しながらデュエット歌唱を行う。そして、ユーザー端末３では、端末利用者の音声とカラオケ演奏音とが混合され、混合音信号が生成される。この混合音信号は、カメラユニット４９で撮影された端末利用者の映像を示す映像信号とともに、伝送路４を介してカラオケ装置２に送信される。カラオケ装置２では、混合音信号及び映像信号を再生することで、端末利用者の音声及びカラオケ演奏音をスピーカー２２から出力させ、端末利用者の映像をモニタ２３に表示させる。ルーム利用者は、端末利用者の音声や映像を視聴しながらデュエット歌唱を行う。

本実施形態の通信カラオケシステムでは、端末利用者（第２利用者）は、ユーザー端末３で再生及び出力された歌唱動画データ及びカラオケデータ（歌唱音データ及び演奏音データ）に基づく、ルーム利用者（第１利用者）のカラオケ歌唱音及びカラオケ演奏音とデュエット歌唱を行う。そして、このデュエット歌唱に伴って混合音信号が生成され、ルーム利用者が利用するカラオケ装置２に送信される。一方、ルーム利用者は、カラオケ装置２で再生及び出力された、混合音信号に基づく端末利用者のカラオケ歌唱音及びカラオケ演奏音とデュエット歌唱を行う。

このように、歌唱動画データ及びカラオケデータがユーザー端末３へ配信されることから、カラオケルームＲＭの利用者のみを対象にするよりも、募集対象の利用者を多く集めることができ、ひいてはデュエット歌唱を成立し易くさせることができる。また、各利用者のカラオケ歌唱音の信号が伝送路４を介して往復されないことから、伝送遅延によるデュエット歌唱への悪影響を抑制できる。

また、データの配信対象となるユーザー端末３を抽出するに際し、ホスト側制御部１１（データ配信手段）は、ルーム利用者と端末利用者の採点値（指標情報）を参照しているので、ルーム利用者に適した歌唱レベルの端末利用者を選別できる。

以上の実施形態の説明は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明はその趣旨を逸脱することなく、変更、改良され得ると共に本発明にはその等価物が含まれる。

例えば、前述の実施形態では、映像と音声の両方でデュエット歌唱を行わせるシステムについて説明したが、音声のみでデュエット歌唱を行わせるシステムにも同様に適用できる。

また、候補者となる端末利用者の抽出に際し、端末利用者の採点値を用いたが、これに限定されるものではなく、種々の方法を用いることができる。

また、通信デュエット時におけるカラオケ装置２での歌詞表示に関し、ユーザー端末３からの映像信号に合成してもよく、カラオケ装置２の歌詞表示機能を用いてもよい。

また、ユーザー端末３に配信された募集用動画データやカラオケデータに関し、デュエット歌唱の終了後において自動的に消去させるようにしてもよい。

さらに、或る端末利用者とのデュエット歌唱が終了した場合、募集に応じた他の端末利用者とルーム利用者とによるデュエット歌唱を、引き続き行わせてもよい。

１…ホスト装置，２…カラオケ装置，３…ユーザー端末，３Ａ…パーソナルコンピュータ，３Ｂ…タブレットコンピュータ，３Ｃ…携帯電話機，４…伝送路，１１…ホスト側制御部，１１ａ…ＣＰＵ，１１ｂ…メモリ，１２…ホスト側通信部，１３…ホスト側記憶部，２１…カラオケ本体，２２…スピーカー，２３…モニタ，２４…歌唱マイク，２５…ビデオカメラ，２６…リモコン装置，３１…本体側制御部，３１ａ…ＣＰＵ，３１ｂ…メモリ，３２…本体側通信部，３３…本体側記憶部，３４…音源部，３４ａ…ＣＰＵ，３４ｂ…メモリ，３４ｃ…波形メモリ，３５…音響処理部，３６…表示処理部，３７…映像入力部，３８…操作部，４１…端末側制御部，４１ａ…ＣＰＵ，４１ｂ…メモリ，４２…第１通信部，４３…第２通信部，４４…端末側記憶部，４５…入力操作部，４６…カメラ制御部，４７…音声制御部，４８…表示制御部，４９…カメラユニット，５０…マイクユニット，５１…スピーカーユニット，５２…表示ユニット，５３…ヘッドセット，ＫＢ…カラオケ店，ＲＭ…カラオケルーム，ＲＴ１…ルーター装置，ＲＴ２…ルーター装置，ＢＴＳ…基地局，ＢＳ１…バス，ＢＳ２…バス

Claims

サーバーとカラオケ装置とユーザー端末のそれぞれを伝送路によって通信可能に接続し、前記カラオケ装置を利用する第１利用者と前記ユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせる通信カラオケシステムであって、
前記サーバーは、
カラオケ歌唱音の基となる前記第１利用者の歌唱音データ、及び、カラオケ演奏音の基となる当該カラオケ歌唱音と同じ楽曲の演奏音データを記憶するサーバー側記憶手段と、
前記第１利用者による募集要求に応じ、前記歌唱音データと前記演奏音データの組を、前記ユーザー端末に配信するデータ配信手段を備え、
前記ユーザー端末は、
配信された前記歌唱音データと前記演奏音データを記憶する端末側記憶手段と、
記憶された前記歌唱音データと前記演奏音データを再生し、前記第１利用者のカラオケ歌唱音を前記カラオケ演奏音と同期させて出力するデータ再生手段と、
前記データ再生手段によるデータ再生時の前記第２利用者の歌唱音と前記カラオケ演奏音との混合音信号を生成する混合音信号生成手段と、
生成された前記混合音信号を前記カラオケ装置に送信する信号送信手段を備え、
前記カラオケ装置は、
送信された前記混合音信号を受信して再生し、前記第２利用者のカラオケ歌唱音及び前記カラオケ演奏音を出力する信号再生手段を備えることを特徴とする通信カラオケシステム。
前記サーバー側記憶手段は、歌唱の巧拙を示す指標情報を複数の利用者のそれぞれについて記憶し、
前記データ配信手段は、前記第１利用者の指標情報と前記第２利用者の指標情報とを参照し、前記歌唱音データと前記演奏音データの組の配信対象となる前記ユーザー端末を定めることを特徴とする請求項１に記載の通信カラオケシステム。
前記ユーザー端末は、前記募集要求に対する応募回答を前記サーバーに送信する応募手段を備え、
前記サーバーは、複数の前記ユーザー端末から前記応募回答があった場合に１つの前記ユーザー端末を選択し、選択したユーザー端末と前記カラオケ装置のそれぞれに決定通知を送信するユーザー端末選択手段を備えることを特徴とする請求項１又は２に記載の通信カラオケシステム。
前記サーバー側記憶手段は、前記歌唱音データと共に取得された、歌唱映像の基となる前記第１利用者の歌唱映像データを記憶し、
前記データ配信手段は、前記歌唱映像データを前記歌唱音データ及び前記演奏音データと組にして前記ユーザー端末に配信し、
前記端末側記憶手段は、配信された前記歌唱映像データを記憶し、
前記データ再生手段は、記憶された前記歌唱映像データを再生し、前記第１利用者の歌唱映像を前記第１利用者のカラオケ歌唱音及び前記カラオケ演奏音と同期させて表示し、
前記ユーザー端末は、前記データ再生手段によるデータ再生時における前記第２利用者の映像信号を生成する映像信号生成手段を備え、
前記信号送信手段は、生成された映像信号を前記混合音信号と共に前記カラオケ装置に送信し、
前記信号再生手段は、送信された映像信号を受信して再生し、前記第２利用者の歌唱映像を表示することを特徴とする請求項１から３の何れか１項に記載の通信カラオケシステム。
サーバーとカラオケ装置と複数のユーザー端末のそれぞれを伝送路によって通信可能に接続した通信カラオケシステムを用い、前記カラオケ装置を利用する第１利用者と前記ユーザー端末を利用する第２利用者のそれぞれにデュエット歌唱を行わせる制御方法であって、
カラオケ歌唱音の基となる前記第１利用者の歌唱音データ、及び、カラオケ演奏音の基となる当該カラオケ歌唱音と同じ楽曲の演奏音データを、前記サーバーが備えるサーバー側記憶手段に記憶させる記憶ステップと、
前記第１利用者による募集要求に応じ、複数の前記ユーザー端末の中からデュエット歌唱を行わせる候補となる１以上の前記ユーザー端末を、前記サーバーに抽出させる抽出ステップと、
抽出された前記ユーザー端末に対し、前記歌唱音データと前記演奏音データの組を、前記サーバーから配信させ、前記ユーザー端末が備える端末側記憶手段に記憶させるデータ配信ステップと、
応募の意思を有する前記第２利用者の操作によって前記ユーザー端末から送信された応募回答を前記サーバーに受信させ、デュエット歌唱を行わせる１つの前記ユーザー端末を前記サーバーに選択させる端末選択ステップと、
前記歌唱音データと前記演奏音データの同期再生時における前記第２利用者の歌唱音と前記カラオケ演奏音との混合音信号を、選択された前記ユーザー端末に生成させると共に、当該ユーザー端末から前記カラオケ装置へ送信させる混合音信号送信ステップと、
送信された前記混合音信号を前記カラオケ装置に受信及び再生させ、前記第２利用者のカラオケ歌唱音及び前記カラオケ演奏音を出力させる混合音信号再生ステップとを行うことを特徴とする通信カラオケシステムの制御方法。