JP6924119B2

JP6924119B2 - カラオケ装置

Info

Publication number: JP6924119B2
Application number: JP2017209753A
Authority: JP
Inventors: 幸裕金子
Original assignee: Daiichikosho Co Ltd
Current assignee: Daiichikosho Co Ltd
Priority date: 2017-10-30
Filing date: 2017-10-30
Publication date: 2021-08-25
Anticipated expiration: 2037-10-30
Also published as: JP2019082570A

Description

本発明はカラオケ装置に関する。

カラオケ装置は、カラオケ演奏に合わせて、表示装置（ディスプレイ）に歌詞テロップや背景映像を表示させることができる。

また、一台のカラオケ装置に対して複数の表示装置を設けることも可能である。たとえば特許文献１には、複数の映像出力端子を備え、カラオケ演奏中に複数のディスプレイに異なる映像を表示できるカラオケ装置が開示されている。

或いは、非特許文献１及び２には、２つの表示装置を備えるカラオケ装置が開示されている。この表示装置には、歌詞テロップや背景映像の他、本人映像（プロモーションビデオ映像（ＰＶ映像）等）、ライブ映像、ＣＧ映像等、様々な映像が表示可能となっている。

特開２０１６−１９７１７２号公報

"ＬＩＶＥＤＡＭＳＴＡＤＩＵＭ（ＤＡＭ−ＸＧ７０００）"、［ｏｎｌｉｎｅ］、株式会社第一興商、［平成２９年１０月１６日検索］、インターネット＜ＵＲＬ：http://www.dkkaraoke.co.jp/business/karaoke#service/products/livedam#stadium/＞ "デュアル映像"、［ｏｎｌｉｎｅ］、ｃｌｕｂＤＡＭ．ｃｏｍ、［平成２９年１０月１６日検索］、インターネット＜ＵＲＬ：https://www.clubdam.com/app/dam/dam/bbcontents/dual/allList.html?page#no=1&main#movie#id=99&sub#movie#id＞

ここで、表示装置に表示可能な映像の中には、演奏音や歌唱音声を含む映像だけでなく、新曲リリースに関するアーティストのインタビュー映像やアーティスト自身のトーク映像がある。

２つの表示装置に異なる映像を表示した場合、利用者はいずれの映像も楽しむことができる。しかし、カラオケ装置が映像に含まれる演奏音や歌唱音声、或いはインタビュー映像やトーク映像に含まれる音声をカラオケ演奏やカラオケ歌唱に合わせて放音すると、利用者はカラオケ演奏音や歌唱音声が聴き取り難くなる。

一方、カラオケ歌唱を聴く利用者の中には、表示されるインタビュー映像やトーク映像でアーティストが何を話しているのか聴きたいと考える者もいる。

本発明の目的は、カラオケ演奏音や歌唱音声と合わせて、表示装置に表示される映像に含まれる音声を聴くことを可能とするカラオケ装置を提供することにある。

上記目的を達成するための主たる発明は、利用者が所有する携帯端末と通信可能なカラオケ装置であって、カラオケ演奏を行うための楽曲データと、当該楽曲データに関連付けられた第１の映像データ及び第２の映像データとを記憶するデータ記憶部と、前記楽曲データに含まれる伴奏データまたは前記第１の映像データに含まれる第１の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカから放音させる演奏制御部と、前記カラオケ演奏音の放音に合わせて、前記第１の映像データに基づく第１の映像及び前記第２の映像データに基づく第２の映像を表示部に表示させる表示制御部と、前記第２の映像データに第２の音声データが含まれている場合、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する第１の判定部と、前記第２の音声データに基づく音声が、前記演奏音及び前記歌唱音声のいずれでもないと判定された場合、当該第２の音声データを前記利用者の携帯端末に対して配信する配信部と、を有することを特徴とするカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。

本発明によれば、カラオケ演奏音や歌唱音声と合わせて、表示装置に表示される映像に含まれる音声を聴くことを可能とする。

第１実施形態に係るカラオケ装置、利用者、及び携帯端末を示す図である。第１実施形態に係るカラオケ装置のハードウェア構成例を示す図である。第１実施形態に係るカラオケ本体のソフトウェア構成例を示す図である。第１実施形態に係るカラオケ装置の処理を示すフローチャートである。第２実施形態に係るカラオケ本体のソフトウェア構成例を示す図である。第２実施形態に係るカラオケ装置の処理を示すフローチャートである。第２実施形態に係るカラオケ装置の処理を示すフローチャートである。

＜第１実施形態＞
図１〜図４を参照して、第１実施形態に係るカラオケ装置１について説明する。

一台のカラオケ装置１は、複数の利用者で使用することができる。図１に示すように、本実施形態では、一台のカラオケ装置１を利用者Ｕ１及び利用者Ｕ２の２名で利用する例について説明を行う。利用者Ｕ１は携帯端末Ｍ１を所有し、利用者Ｕ２は携帯端末Ｍ２を所有している。

携帯端末は、一般的なスマートフォン、タブレット端末等である。携帯端末は、各携帯端末を識別するための端末識別情報、及びカラオケ専用のアプリケーションソフトウェア（以下、「カラオケ用アプリ」という）等を記憶している。

カラオケ用アプリは、携帯端末からカラオケ装置１に対する各種操作を行ったり、カラオケ装置１から送信される各種情報を、携帯端末の表示画面に表示したり、携帯端末が備えるスピーカから放音するためのソフトウェアである。これらの動作は、カラオケ用アプリを実行している携帯端末と、カラオケ装置１とをペアリングすることにより行うことができる。ペアリングとは、所定の携帯端末と所定のカラオケ装置とが通信可能となるように、関連付けを行うことをいう。

＝＝カラオケ装置＝＝
カラオケ装置１は、利用者が選曲した楽曲のカラオケ演奏及び利用者がカラオケ歌唱を行うための装置である。図２に示すように、カラオケ装置１は、カラオケ本体１０、スピーカ２０、第１の表示装置３０、第２の表示装置３１、マイク４０、及びリモコン装置５０を備える。

スピーカ２０はカラオケ本体１０からの放音信号に基づいてカラオケ演奏音や歌唱音声を放音するための構成である。第１の表示装置３０及び第２の表示装置３１は、カラオケ本体１０から出力される映像信号に基づいて所定の映像を表示するための構成である。本実施形態に係る第１の表示装置３０及び第２の表示装置３１は、「表示部」の一例である。マイク４０は、入力される利用者の音声（カラオケ歌唱の音声）をアナログの歌唱音声信号に変換してカラオケ本体１０に入力するための構成である。

（カラオケ本体のハードウェア）
図２に示すように、カラオケ本体１０は、制御部１１、通信部１２、記憶部１３、音響処理部１４、表示処理部１５、及び操作部１６を備える。各構成はインターフェース（図示なし）を介してバスＢに接続されている。

カラオケ本体１０は、選曲された楽曲のカラオケ演奏制御、歌詞や背景映像等の表示制御、マイク４０を通じて入力された音声の処理といった、カラオケ歌唱に関する各種の制御を行う。

制御部１１は、ＣＰＵ１１ａおよびメモリ１１ｂを備える。ＣＰＵ１１ａは、メモリ１１ｂに記憶された動作プログラムを実行することにより各種の制御機能を実現する。メモリ１１ｂは、ＣＰＵ１１ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶装置である。

通信部１２は、ルーター（図示なし）を介してカラオケ本体１０を通信回線に接続するためのインターフェースを提供する。カラオケ装置１は、通信部１２を介してペアリングされた携帯端末と通信可能となっている。

記憶部１３は、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。記憶部１３は、カラオケ装置１によりカラオケ演奏を行うための複数の楽曲データ等を記憶する（詳細は後述）。

音響処理部１４は、制御部１１の制御に基づき、楽曲に対するカラオケ演奏の制御およびマイク４０を通じて入力された歌唱音声の処理を行う。音響処理部１４は、ＭＩＤＩ音源１４ａ、ミキサ１４ｂ、及びアンプ１４ｃを含む（詳細は後述）。

表示処理部１５は、制御部１１の制御に基づき、第１の表示装置３０及び第２の表示装置３１における各種表示に関する処理を行う。たとえば、表示処理部１５は、ある楽曲のカラオケ演奏時における背景映像に歌詞や各種アイコンが重ねられた映像を第１の表示装置３０に表示する処理を行う一方、ある楽曲のＰＶ映像を第２の表示装置３１に表示する処理を行う（詳細は後述）。

操作部１６は、パネルスイッチおよびリモコン受信回路などからなり、利用者によるカラオケ装置１のパネルスイッチあるいはリモコン装置５０の操作に応じて選曲信号、演奏中止信号などの操作信号を制御部１１に対して出力する。制御部１１は、操作部１６からの操作信号を検出し、対応する処理を実行する。

リモコン装置５０は、カラオケ本体１０に対する各種操作をおこなうための装置である。利用者はリモコン装置５０を用いて歌唱を希望する楽曲の選曲（予約）等を行うことができる。

（カラオケ本体のソフトウェア）
図３はカラオケ本体１０のソフトウェア構成例を示す図である。カラオケ本体１０は、データ記憶部１００、演奏制御部２００、表示制御部３００、第１の判定部４００、及び配信部５００を備える。データ記憶部１００は、記憶部１３の記憶領域の一部として提供される。演奏制御部２００、表示制御部３００、第１の判定部４００、及び配信部５００は、ＣＰＵ１１ａがメモリ１１ｂに記憶されるプログラムを実行することにより実現される。

［データ記憶部］
データ記憶部１００は、楽曲データと、当該楽曲データに関連付けられた第１の映像データ及び第２の映像データとを記憶する。

楽曲データは、カラオケ演奏を行うためのデータである。楽曲データは、個々の楽曲を特定するための識別情報（楽曲ＩＤ）が付与されている。楽曲データは、伴奏データ、リファレンスデータ等を含む。伴奏データは、カラオケ演奏音の元となるＭＩＤＩ形式のデータである。伴奏データは演奏区間が設定されている。演奏区間は、たとえば、前奏区間、Ａメロ、Ｂメロ、サビ、間奏区間、後奏区間である。リファレンスデータは、利用者によるカラオケ歌唱を採点する際の基準として用いられるデータである。

楽曲データは、歌詞データ、属性情報等を含んでいてもよい。歌詞データは、カラオケ演奏に合わせて第１の表示装置３０等に表示させる歌詞（歌詞テロップ）を示すデータである。属性情報は、曲名、歌手名、作詞・作曲者名、及びジャンル等の楽曲に関する情報である。

映像データは、各種映像を第１の表示装置３０等に表示させるためのデータである。一の楽曲に関連付けられている映像データの数は特に限られない。また、表示装置にどの映像を表示させるか（複数の表示装置がある場合に、どの表示装置にどの映像を表示させるか）は、楽曲毎に予め設定されていてもよいし、利用者が楽曲を選曲する際に都度、設定してもよい。本実施形態においては、第１の表示装置３０に表示される映像のデータを「第１の映像データ」とし、第２の表示装置３１に表示される映像のデータを「第２の映像データ」として説明する。

映像データは、当該データが関連付けられている楽曲に関するものであってもよいし、当該楽曲と関係のないものであってもよい。当該楽曲に関する映像データは、たとえば、背景映像、本人映像（ＰＶ映像等）、ライブ映像、ＣＧ映像、インタビュー映像、トーク映像等のデータである。また、当該楽曲と関係ない映像データは、たとえば、当該楽曲を歌唱するアーティストの別の楽曲のＰＶ映像、ヒーリング映像等である。

ここで、映像データの中には音声データを含むものがある。たとえば、背景映像の映像データは、音声データを含まない。一方、ＰＶ映像やライブ映像の映像データは、楽曲を歌唱するアーティストを撮影した映像データに、アーティストの歌唱の音声データや実際の演奏を録音した音声データ（演奏の音声データ）が含まれている。また、インタビュー映像の映像データの場合、たとえば楽曲の歌詞内容を解説するアーティストを撮影した映像データに、解説するアーティストの肉声を録音した音声データが含まれている。本実施形態においては、第１の映像データに含まれる音声データを「第１の音声データ」とし、第２の映像データに含まれる音声データを「第２の音声データ」として説明する。

［演奏制御部］
演奏制御部２００は、音響処理部１４を制御し、伴奏データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ２０から放音させる。

たとえば、利用者Ｕ１により楽曲Ｘが選曲された場合、演奏制御部２００は、データ記憶部１００から楽曲Ｘの楽曲データを読み出し、楽曲データに含まれる伴奏データをＭＩＤＩ音源１４ａに入力する。ＭＩＤＩ音源１４ａは、当該伴奏データに基づいて楽音信号（カラオケ演奏音の元となる信号）を生成する。ミキサ１４ｂは、当該楽音信号およびマイク４０から出力される歌唱音声信号を適当な比率でミキシングしてアンプ１４ｃに出力する。アンプ１４ｃは、ミキサ１４ｂからのミキシング信号を増幅し、放音信号としてスピーカ２０へ出力する。これにより、スピーカ２０からは放音信号に基づく楽曲Ｘのカラオケ演奏音（ＭＩＤＩ形式のデータに基づく演奏音）およびマイク４０からの歌唱音声が放音される。なお、マイク４０からの出力が無い場合（たとえば、楽曲Ｘの前奏区間や間奏区間の場合）、演奏制御部２００は、カラオケ演奏音のみを放音させる。

また、演奏制御部２００は、伴奏データの代わりに映像データに含まれる音声データに基づいてカラオケ演奏音を放音させることも可能である。具体的に、演奏制御部２００は、第１の映像データに含まれる第１の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ２０から放音させる。

たとえば、利用者Ｕ１により選曲された楽曲Ｘの楽曲データに対し、第１の映像データとしてライブ映像のデータが関連付けられていたとする。この場合、演奏制御部２００は、データ記憶部１００から楽曲Ｘのライブ映像のデータに含まれる音声データ（演奏の音声データ）を読み出し、演奏音信号としてミキサ１４ｂに入力する。ミキサ１４ｂは、当該演奏音信号およびマイク４０から出力される歌唱音声信号を適当な比率でミキシングしてアンプ１４ｃに出力する。アンプ１４ｃは、ミキサ１４ｂからのミキシング信号を増幅し、放音信号としてスピーカ２０へ出力する。これにより、スピーカ２０からは放音信号に基づく楽曲Ｘのカラオケ演奏音（実際の演奏に基づく生演奏音）およびマイク４０からの歌唱音声が放音される。

カラオケ演奏音の放音に、伴奏データを用いるか、映像データに含まれる音声データを用いるかは、楽曲毎に予め設定されていてもよいし、利用者が楽曲を選曲する際に都度、設定してもよい。また、第１の映像データに第１の音声データが含まれているかどうかによって自動で判断してもよい。すなわち、選曲された楽曲Ｘの第１の映像データに第１の音声データが含まれない場合、演奏制御部２００は、楽曲Ｘの伴奏データに基づいてカラオケ演奏音を放音させる。一方、選曲された楽曲Ｘの第１の映像データに第１の音声データ（演奏の音声データ）が含まれている場合、演奏制御部２００は、当該第１の音声データに基づいてカラオケ演奏音を放音させる。なお、第１の映像データが第１の音声データを含む場合であっても、伴奏データに基づいてカラオケ演奏を行うことも可能である。この場合、演奏処理部２００は、第１の映像データに含まれる第１の音声データに基づく演奏処理を行わない（第１の音声データ（演奏の音声データ）の読み出しを行わない）。

［表示制御部］
表示制御部３００は、カラオケ装置１における各種表示制御を行う。具体的に、表示制御部３００は、カラオケ演奏音の放音に合わせて、第１の映像データに基づく第１の映像及び第２の映像データに基づく第２の映像を表示部に表示させる。

たとえば、利用者Ｕ１により選曲された楽曲Ｘに対し、ライブ映像の映像データ及びインタビュー映像の映像データが関連付けられていたとする。また、ライブ映像の映像データが第１の映像データとして設定され、インタビュー映像の映像データが第２の映像データとして設定されていたとする。

この場合、表示制御部３００は、楽曲Ｘのカラオケ演奏音の放音に合わせて、データ記憶部１００から読み出した第１の映像データに基づくライブ映像を第１の表示装置３０に表示させる。同時に、表示制御部３００は、データ記憶部１００から読み出した第２の映像データに基づくインタビュー映像を第２の表示装置３１に表示させる。この例におけるライブ映像は「第１の映像」の一例であり、インタビュー映像は「第２の映像」の一例である。

［第１の判定部］
第１の判定部４００は、第２の映像データに第２の音声データが含まれている場合、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。

まず、第１の判定部４００は、利用者によって選曲された楽曲の楽曲データに関連付けられている映像データのうち、第２の映像データに相当する映像データに音声データが含まれているかどうかを判定する。本実施形態において、第１の判定部４００は、第２の表示装置３１に表示される映像の映像データに音声データ（第２の音声データ）が含まれているかどうかを判定する。

ここで、第２の表示装置３１に表示される映像の映像データが背景映像のデータの場合、当該映像データには、上述の通り、第２の音声データに相当するデータは含まれていない。第２の音声データが含まれていないと判定した場合、第１の判定部４００は、以降の処理を行わない。なお、この場合であっても、表示制御部３００は、カラオケ演奏音の放音に合わせて、背景映像を第２の表示装置３１に表示させる。

一方、第２の表示装置３１に表示される映像の映像データがライブ映像のデータやインタビュー映像のデータの場合、当該映像データには、第２の音声データに相当するデータが含まれている。この場合、第１の判定部４００は、第２の音声データが含まれていると判定する。

次に、第１の判定部４００は、第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。

演奏音とは、第２の映像データ（第２の音声データ）が関連付けられている楽曲のカラオケ演奏音の他、他の楽曲のカラオケ演奏音やＢＧＭ等、何らかのメロディを持った音である。また、歌唱音声とは、第２の映像データ（第２の音声データ）が関連付けられている楽曲の歌唱音声の他、他の楽曲の歌唱音声等、歌唱された際に得られるメロディを持った音声である。

演奏音または歌唱音声かどうかの判定は、公知の手法を用いることができる。たとえば、第１の判定部４００は、第２の音声データを解析し、楽曲の演奏音に特有のビートパターンが含まれているかを判定する（特開２００８−２３３８１２号公報参照）。また、第１の判定部４００は、第２の音声データに対して高速フーリエ変換を行って周波数特性を取得し、取得された周波数特性から楽音に特有の倍音成分が含まれているかを判定する（特許第５５７７７８７号参照）。特有のビートパターンが含まれている場合や、特有の倍音成分が含まれている場合、第１の判定部４００は、第２の音声データに基づく音声が、楽曲の演奏音であると判定する。

また、第１の判定部４００は、第２の音声データに基づく音声がいかなる演奏音でもないと判定した場合、更に第２の音声データに対して高速フーリエ変換を行って音声信号の音高の時間的変化を取得し、変化の幅が所定値以上であれば、歌唱音声であると判定し、所定値よりも小さい場合には、非歌唱音声（たとえば、会話に基づく音声）であると判定する（特開２０１２−５８２７７号公報参照）。なお、演奏音かどうかの判定と歌唱音声かどうかの判定を行う順番はどちらを先に行ってもよい。或いは、両方の判定処理を並行して行うことでもよい。

ここで、第２の音声データに基づく音声が、何らかの演奏音または歌唱音声であると判定した場合、第１の判定部４００は、その判定結果を演奏制御部２００に出力する。

たとえば、第２の音声データに基づく音声がライブ映像に含まれる演奏音や歌唱音声である場合、カラオケ演奏音やカラオケ歌唱音の放音中にライブ映像に含まれる音声データに基づく演奏音や歌唱音声を重ねて聴取させる必要性がない。従って、当該判定結果が出力された場合、演奏制御部２００は、ライブ映像に含まれる音声データに基づく音声の放音を行わない。なお、音声の放音を行わない場合であっても、表示制御部３００は、カラオケ演奏音の放音に合わせて、ライブ映像を第２の表示装置３１に表示させる。

一方、第２の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定した場合、第１の判定部４００は、その判定結果を演奏制御部２００及び配信部５００に出力する。

たとえば、第２の音声データに基づく音声がインタビュー映像に含まれる音声であっても、放音させればカラオケ演奏音や利用者の歌唱音声が聴き取り難くなる。従って、当該判定結果が出力された場合にも、演奏制御部２００は、インタビュー映像に含まれる音声データに基づく音声の放音を行わない。一方、この場合、当該音声データは利用者の携帯端末に配信される（後述）。なお、音声の放音を行わない場合であっても、表示制御部３００は、カラオケ演奏音の放音に合わせて、インタビュー映像を第２の表示装置３１に表示させる。

［配信部］
配信部５００は、第２の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、第２の音声データを利用者の携帯端末に対して配信する。

上述のようにインタビュー映像を第２の表示装置３１に表示させた場合、利用者はインタビュー映像を見ることができても、第２の音声データに基づく音声は放音されないのでインタビュー映像中で何が話されているのかを聴くことができない。そこで、配信部５００は、当該インタビュー映像の音声データを利用者の携帯端末に配信する。

具体的に、第１の判定部４００から、第２の音声データ（インタビュー映像の音声データ）に基づく音声が、カラオケ演奏音及び歌唱音声のいずれでもないという判定結果が出力された場合、配信部５００は、データ記憶部１００から第２の映像データに含まれる第２の音声データを読み出し、ペアリングされている携帯端末に対して当該音声データを配信する。携帯端末は、配信された音声データをカラオケ用アプリで処理し、スピーカから放音させることができる。つまり、利用者は、自己の携帯端末を介して、配信された音声データに基づく音声を聴くことができる。なお、表示される第２の映像との同期を取るため、配信部５００は、第２の映像の表示に合わせて、ストリーミング形式で音声データの配信を行うことが好ましい。また、配信は、カラオケ装置１とペアリングされた全ての携帯端末に対して行ってもよいし、カラオケ歌唱を行っていない利用者の携帯端末のみ（たとえば、図１の例で利用者Ｕ１がカラオケ歌唱を行っている場合に利用者Ｕ２の携帯端末Ｍ２のみ）に対して行うことでもよい。

＝＝カラオケ装置１の動作について＝＝
次に、図４を参照して本実施形態におけるカラオケ装置１の動作の具体例について述べる。図４は、カラオケ装置１の動作例を示すフローチャートである。この例では利用者Ｕ１が楽曲Ｘを選曲してカラオケ歌唱を行い、利用者Ｕ２が聴衆としてカラオケ歌唱を聴く。また、楽曲Ｘの楽曲データに対し、第１の映像データ（第１の音声データを含まない）、及び第２の映像データ（第２の音声データを含む）が関連付けられているとする。

第１の判定部４００は、予め、第２の映像データに第２の音声データが含まれているかどうかを判定する。上述の通り、この例では、第２の映像データが第２の音声データを含む。この場合、第１の判定部４００は、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する（何らかの演奏音または歌唱音声かどうかの判定。ステップ１０）。この例では、第２の音声データに基づく音声が、いかなる演奏音でもなく、歌唱音声でもないと判定されたとする。

その後、演奏制御部２００は、楽曲Ｘの楽曲データに基づくカラオケ演奏音をスピーカ２０から放音させる（カラオケ演奏音の放音。ステップ１１）。また、表示制御部３００は、カラオケ演奏音の放音に合わせて、第１の映像データに基づく第１の映像を第１の表示装置３０に表示させ、第２の映像データに基づく第２の映像を第２の表示装置３１に表示させる（映像の表示。ステップ１２）。

利用者Ｕ１は、第１の表示装置３０に表示された歌詞テロップの入った映像を見ながら、カラオケ演奏に合わせてカラオケ歌唱を行う。この場合、演奏制御部２００は、カラオケ歌唱により得られる歌唱音声信号に基づく歌唱音声をスピーカ２０から放音させる（歌唱音声の放音。ステップ１３）。聴衆である利用者Ｕ２は、カラオケ演奏音及び利用者Ｕ１の歌唱音声を聴きながら、第１の表示装置３０及び第２の表示装置３１に表示される映像を見ることができる。

ここで、ステップ１０の判定結果に基づいて、配信部５００は、第２の音声データを利用者Ｕ１の携帯端末Ｍ１及び利用者Ｕ２の携帯端末Ｍ２に対して配信する（第２の音声データの配信。ステップ１４）。この場合、カラオケ歌唱を行っていない利用者Ｕ２は、第２の表示装置３１に表示される映像を見ながら、当該映像に含まれる音声を自己の携帯端末Ｍ２を介して聴くことができる。

配信部５００は、楽曲Ｘのカラオケ演奏が終了するまで（ステップ１５でＹの場合）、カラオケ演奏に合わせて第２の音声データを配信する。

なお、ステップ１０の判定結果で、第２の音声データに基づく音声が、何らかの演奏音または歌唱音声であると判定された場合、配信部５００は、第２の音声データの配信を行わない。

以上の通り、本実施形態に係るカラオケ装置１は、利用者Ｕ１が所有する携帯端末Ｍ１及び利用者Ｕ２が所有する携帯端末Ｍ２と通信可能であって、データ記憶部１００、演奏制御部２００、表示制御部３００、第１の判定部４００、及び配信部５００を有する。データ記憶部１００は、カラオケ演奏を行うための楽曲データと、当該楽曲データに関連付けられた第１の映像データ及び第２の映像データとを記憶する。演奏制御部２００は、楽曲データに含まれる伴奏データまたは第１の映像データに含まれる第１の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカ２０から放音させる。表示制御部３００は、カラオケ演奏音の放音に合わせて、第１の映像データに基づく第１の映像を第１の表示装置３０に表示させ、第２の映像データに基づく第２の映像を第２の表示装置３１に表示させる。第１の判定部４００は、第２の映像データに第２の音声データが含まれている場合、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する。配信部５００は、第２の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、当該第２の音声データを利用者Ｕ１の携帯端末Ｍ１及び利用者Ｕ２の携帯端末Ｍ２に対して配信する。

このようなカラオケ装置１によれば、第２の表示装置３１に表示される映像に含まれる音声が、何らかの演奏音や歌唱音声と異なる場合であっても、当該音声がスピーカ２０から放音されることは無い。従って、利用者は、カラオケ装置１から放音されるカラオケ演奏音や歌唱音声が聴き取り難くなることが無い。一方、第２の表示装置３１に表示される映像を見た利用者が、当該映像に含まれる音声を聴きたいと思った場合には、自己の携帯端末を介して当該映像に含まれる音声を聴くことができる。すなわち、本実施形態に係るカラオケ装置１によれば、カラオケ演奏音や歌唱音声と合わせて、第２の表示装置３１に表示される映像に含まれる音声を聴くことが可能となる。

＜第２実施形態＞
次に、図５〜図６Ｂを参照して、第２実施形態に係るカラオケ装置１について説明する。

第１実施形態で述べたように、たとえば、第２の音声データがインタビュー映像に含まれる音声データであっても、放音させればカラオケ演奏音や利用者の歌唱音声が聴き取り難くなる。一方、カラオケ演奏には、カラオケ歌唱を行わない間奏区間がある。この間奏区間においては、カラオケ演奏音や歌唱音声と異なる音声を放音させたとしても歌唱音声が聴き取り難くなることは無い。本実施形態では、間奏区間において、カラオケ装置１のスピーカ２０からカラオケ演奏音や歌唱音声と異なる音声を放音する構成について説明を行う。なお、第１実施形態と同様の構成については説明を省略する。

（カラオケ本体のソフトウェア）
図５はカラオケ本体１０のソフトウェア構成例を示す図である。カラオケ本体１０は、データ記憶部１００、演奏制御部２００、表示制御部３００、第１の判定部４００、配信部５００、及び第２の判定部６００を備える。データ記憶部１００は、記憶部１３の記憶領域の一部として提供される。演奏制御部２００、表示制御部３００、第１の判定部４００、配信部５００、及び第２の判定部６００は、ＣＰＵ１１ａがメモリ１１ｂに記憶されるプログラムを実行することにより実現される。

［第２の判定部］
第２の判定部６００は、放音されるカラオケ演奏音が、楽曲の間奏区間に対応するカラオケ演奏音であるか否かを判定する。間奏区間に対応するカラオケ演奏音であるかどうかは、伴奏データに基づいて判定できる。

ある楽曲のカラオケ演奏が行われる場合、第２の判定部６００は、当該ある楽曲の伴奏データを参照し、現在放音されているカラオケ演奏音が間奏区間に対応するカラオケ演奏音であるかどうかを判定する。間奏区間に対応するカラオケ演奏音であると判定した場合、第２の判定部６００は、その判定結果を演奏制御部２００に出力する。

［演奏制御部］
本実施形態に係る演奏制御部２００は、第２の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、且つ放音されるカラオケ演奏音が間奏区間のカラオケ演奏音であると判定された場合、第２の音声データに基づく音声をスピーカ２０から放音させる。

具体的に、演奏制御部２００は、データ記憶部１００から第２の音声データを読み出し、音声信号としてミキサ１４ｂに入力する。ミキサ１４ｂは、当該音声信号および楽曲の楽音信号を適当な比率でミキシングしてアンプ１４ｃに出力する。アンプ１４ｃは、ミキサ１４ｂからのミキシング信号を増幅し、放音信号としてスピーカ２０へ出力する。これにより、スピーカ２０からは放音信号に基づく楽曲のカラオケ演奏音および第２の音声データに基づく音声（たとえば、インタビューの音声）が放音される。

なお、この場合にも、表示制御部３００は、カラオケ演奏音の放音に合わせて、インタビュー映像を第２の表示装置３１に表示させる。また、第２の音声データに基づく音声をスピーカ２０から放音させる場合、配信部５００は、携帯端末に対する第２の音声データの配信を継続して行ってもよいし、一時的に停止してもよい。携帯端末に対する第２の音声データの配信を停止した後、間奏区間が終了した場合、配信部５００は、第２の音声データの配信を再開する。

更に、第２の音声データに基づく音声をスピーカ２０から放音させる場合、演奏制御部２００は、カラオケ演奏音の音量を所定値下げて放音させることも可能である。カラオケ演奏音の音量は、予め基準値が設定されており、リモコン装置５０等を介して利用者が任意の値に設定できる。所定値は、間奏区間に放音するカラオケ演奏音の音量を決定するための値であって、上記基準値からどれだけ音量を下げるかを規定する値である。所定値は、予め一の値が設定されていてもよいし、カラオケ演奏の都度、設定されることでもよい。

＝＝カラオケ装置１の動作について＝＝
次に、図６Ａ及び図６Ｂを参照して本実施形態におけるカラオケ装置１の動作の具体例について述べる。図６Ａ及び図６Ｂは、カラオケ装置１の動作例を示すフローチャートである。この例では利用者Ｕ１が楽曲Ｘを選曲してカラオケ歌唱を行い、利用者Ｕ２が聴衆としてカラオケ歌唱を聴く。また、楽曲Ｘの楽曲データに対し、第１の映像データ（第１の音声データを含まない）、及び第２の映像データ（第２の音声データを含む）が関連付けられているとする。ステップ２０〜ステップ２４は、第１実施形態のステップ１０〜ステップ１４と同様であるため説明を省略する。なお、この例においても、ステップ２０において、第２の音声データに基づく音声が、いかなる演奏音でもなく、歌唱音声でもないと判定されたとする。

第２の音声データの配信が開始された後、第２の判定部６００は、ステップ２１で放音されるカラオケ演奏音が、楽曲Ｘの間奏区間に対応するカラオケ演奏音であるか否かを判定する。

ステップ２１で放音されるカラオケ演奏音が、楽曲Ｘの間奏区間に対応するカラオケ演奏音であると判定された場合（ステップ２５でＹの場合）、第２の判定部６００は、その判定結果を演奏制御部２００に出力する。この場合、演奏制御部２００は、第２の音声データに基づく音声をスピーカ２０から放音させる（第２の音声データに基づく音声の放音。ステップ２６）。

一方、ステップ２１で放音されるカラオケ演奏音が、楽曲Ｘの間奏区間に対応するカラオケ演奏音でないと判定された場合（ステップ２７でＹの場合）、演奏制御部２００は、第２の音声データに基づく音声の放音を終了する（第２の音声データに基づく音声の放音を終了。ステップ２８）。

演奏処理部２００、配信部５００、及び第２の判定部６００は、楽曲Ｘのカラオケ演奏が終了するまで（ステップ２９でＹの場合）、ステップ２５〜ステップ２８の処理を繰り返し行う。

以上の通り、本実施形態に係るカラオケ装置１は、放音されるカラオケ演奏音が、楽曲の間奏区間に対応するカラオケ演奏音であるか否かを判定する第２の判定部６００を有する。また、第２の音声データに基づく音声が、演奏音及び歌唱音声のいずれでもないと判定された場合、且つ放音されるカラオケ演奏音が間奏区間のカラオケ演奏音であると判定された場合、演奏制御部２００は、第２の音声データに基づく音声を放音させる。

このようなカラオケ装置１によれば、間奏区間においてスピーカ２０から第２の音声データに基づく音声を放音することができるため、利用者は当該音声を直接（携帯端末を介することなく）聴くことができる。また、間奏区間においては、歌唱音声が放音されることが無いため、歌唱音声が聴き取り難くなることは無い。

また、第２の音声データに基づく音声を放音させる場合、演奏制御部２００は、カラオケ演奏音の音量を所定値下げて放音させることができる。この場合、第２の音声データに基づく音声をよりはっきりと聴き取ることができる。

＜その他＞
上記実施形態では、一の表示装置に対して一の映像を表示させる例について述べたがこれに限られない。たとえば、カラオケ装置１が有する表示装置が一つの場合には、二つの映像（第１の映像及び第２の映像）を一画面に分割表示させることも可能である。この場合、当該一の表示装置が「表示部」に相当する。

また、上記実施形態では、楽曲が選曲される都度、第１の判定部４００による判定処理を行う例について述べたがこれに限られない。たとえば、予め第１の判定部４００により、第２の映像データに第２の音声データが含まれているかどうか、及び第２の音声データが含まれている場合に、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定しておく。この判定結果を映像データに関連付けておくことにより、楽曲が選曲される都度、第１の判定部４００で判定処理を行う手間を省くことができる。

上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１カラオケ装置
２０スピーカ
３０第１の表示装置
３１第２の表示装置
１００データ記憶部
２００演奏制御部
３００表示制御部
４００第１の判定部
５００配信部
６００第２の判定部
Ｍ１、Ｍ２携帯端末

Claims

利用者が所有する携帯端末と通信可能なカラオケ装置であって、
カラオケ演奏を行うための楽曲データと、当該楽曲データに関連付けられた第１の映像データ及び第２の映像データとを記憶するデータ記憶部と、
前記楽曲データに含まれる伴奏データまたは前記第１の映像データに含まれる第１の音声データに基づくカラオケ演奏音、及びカラオケ歌唱が行われた場合に得られる歌唱音声信号に基づく歌唱音声をスピーカから放音させる演奏制御部と、
前記カラオケ演奏音の放音に合わせて、前記第１の映像データに基づく第１の映像及び前記第２の映像データに基づく第２の映像を表示部に表示させる表示制御部と、
前記第２の映像データに第２の音声データが含まれている場合、当該第２の音声データに基づく音声が、何らかの演奏音または歌唱音声かどうかを判定する第１の判定部と、
前記第２の音声データに基づく音声が、前記演奏音及び前記歌唱音声のいずれでもないと判定された場合、当該第２の音声データを前記利用者の携帯端末に対して配信する配信部と、
を有することを特徴とするカラオケ装置。
放音される前記カラオケ演奏音が、楽曲の間奏区間に対応するカラオケ演奏音であるか否かを判定する第２の判定部を有し、
前記第２の音声データに基づく音声が、前記演奏音及び前記歌唱音声のいずれでもないと判定された場合、且つ放音される前記カラオケ演奏音が前記間奏区間のカラオケ演奏音であると判定された場合、前記演奏制御部は、前記第２の音声データに基づく音声を放音させることを特徴とする請求項１記載のカラオケ装置。
前記第２の音声データに基づく音声を放音させる場合、前記演奏制御部は、前記カラオケ演奏音の音量を所定値下げて放音させることを特徴とする請求項２記載のカラオケ装置。