JP2008197269A - データ再生装置、データ再生方法およびプログラム - Google Patents

データ再生装置、データ再生方法およびプログラム Download PDF

Info

Publication number
JP2008197269A
JP2008197269A JP2007031063A JP2007031063A JP2008197269A JP 2008197269 A JP2008197269 A JP 2008197269A JP 2007031063 A JP2007031063 A JP 2007031063A JP 2007031063 A JP2007031063 A JP 2007031063A JP 2008197269 A JP2008197269 A JP 2008197269A
Authority
JP
Japan
Prior art keywords
data
audio data
time
video
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007031063A
Other languages
English (en)
Other versions
JP4595948B2 (ja
Inventor
Takuro Sone
卓朗 曽根
Takahiro Tanaka
孝浩 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007031063A priority Critical patent/JP4595948B2/ja
Publication of JP2008197269A publication Critical patent/JP2008197269A/ja
Application granted granted Critical
Publication of JP4595948B2 publication Critical patent/JP4595948B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れにあわせ、当該楽曲に対応したデータの再生を簡単に行うことができるデータ再生装置、データ再生方法およびプログラムを提供すること。
【解決手段】本発明のデータ再生装置を有する映像表示装置は、楽曲検索部100によってライブ楽音データから対応するリファレンス楽音データを特定し、タイムアライメント部102によって行われるライブ楽音データと特定したリファレンス楽音データとの比較によって生成した時刻情報に基づいて、データ読出部103がリファレンス楽音データと時間同期された歌詞データを読み出すことにより、ライブ楽音データと歌詞データを時間同期して再生することが可能となり、ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れにあわせて事前に準備したデータを再生することができる。
【選択図】図2

Description

本発明は、入力されたデータと同期して、他のデータを再生する技術に関する。
一般的なカラオケ装置においては、例えば、MIDI(Musical Instruments Digital Interface:登録商標)形式の伴奏用データ、楽曲の歌詞テロップを表示するシーケンスデータおよび映像データなどから構成された楽曲データをそれぞれ同期させて再生することにより、利用者はその楽曲のカラオケを楽しむことができる。特許文献1には、伴奏データと映像データを別個にサーバから受信してそれらを同期させて再生させる技術が開示されている。また、特許文献2においては、ライブ演奏のような臨場感のあるカラオケ演奏を提供する技術が開示されている。
また、歌詞を表示させる技術は、カラオケ装置だけで用いられるわけではなく、テレビ放送などにおける歌番組においても用いられている。また、テレビ放送においては、生放送の歌番組などで歌手が歌唱に合わせて歌詞テロップを表示する場合、オペレータが楽曲の進行にあわせて、所定のタイミングで歌詞を表示させるようにしている。
特開2003−15675号公報 特開2000−347676号公報
しかし、特許文献1に開示された技術を用いる場合には、伴奏データはMIDI形式のデータの再生であるため、MIDI形式のデータを再生できる音源を用いた再生のため、音質が劣る場合や、テンポが単調な演奏となってしまう場合があった。また、特許文献2に開示された技術の場合には、ライブ演奏のような臨場感が得られるが、楽曲の進行が単調ではないため、歌詞テロップを表示させるためなどのシーケンスデータについては、楽曲の進行に合わせて事前に作成しておく必要があった。また、テレビ放送などにおいて上述したようなオペレータの作業は、本番においてミスは許されず、事前に楽曲の進行と歌詞の表示を行うタイミングとを合わせる練習をしておく必要があり、非常に負担が大きかった。
本発明は、上述の事情に鑑みてなされたものであり、ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れにあわせ、当該楽曲に対応したデータの再生を簡単に行うことができるデータ再生装置、データ再生方法およびプログラムを提供することを目的とする。
上述の課題を解決するため、本発明は、データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段と、外部から供給される第2のオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定手段と、前記外部から供給される第2のオーディオデータと前記特定手段によって特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、前記時刻情報と前記同期情報の対応関係に基づいて、前記特定手段によって特定された第1のオーディオデータと組になっている第1のデータを前記記憶手段から読み出すデータ読出手段と、前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段とを具備することを特徴とするデータ再生装置を提供する。
また、別の好ましい態様において、前記特定手段は、外部から供給される第2のオーディオデータの一部分のデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定してもよい。
また、別の好ましい態様において、収音によってオーディオデータを生成する収音手段をさらに具備し、前記特定手段は、外部から供給される第2のオーディオデータに代えて、前記収音手段によって生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定してもよい。
また、別の好ましい態様において、前記特定手段に再度第1のオーディオデータを特定させる再特定指示手段をさらに具備してもよい。
また、本発明は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出す指示手段と、前記指示手段の指示に応答して前記サーバから送信されたデータを第1のオーディオデータおよびデータ各部についての時刻を規定する同期情報を有した第1のデータとして受信する受信手段と、前記受信手段によって受信した第1のオーディオデータと第1のデータとを記憶する記憶手段と、外部から供給される第2のオーディオデータと前記記憶手段に記憶された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から第1のデータを読み出すデータ読出手段と、前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段とを具備することを特徴とするデータ再生装置を提供する。
また、本発明は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出す指示手段と、前記指示手段の指示に応答して前記サーバから送信されたデータを楽曲情報データとして受信する受信手段と、データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段と、前記楽曲情報データに基づいて、前記記憶手段に記憶されている複数の第1のオーディオデータから第1のオーディオデータを選択する選択手段と、外部から供給される第2のオーディオデータと前記選択手段によって選択された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、前記時刻情報と前記同期情報の対応関係に基づいて、前記選択手段によって選択された第1のオーディオデータと組になっている第1のデータを前記記憶手段から読み出すデータ読出手段と、前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段とを具備することを特徴とするデータ再生装置を提供する。
また、別の好ましい態様において、前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、外部から供給される第2のオーディオデータを前記サーバへ送信してもよい。
また、別の好ましい態様において、前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、外部から供給される第2のオーディオデータの一部を前記サーバへ送信してもよい。
また、別の好ましい態様において、収音によってオーディオデータを生成する収音手段をさらに具備し、前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、前記収音手段によって生成したオーディオデータを前記サーバへ送信してもよい。
また、別の好ましい態様において、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を前記指示手段に再度出させる再特定指示手段をさらに具備してもよい。
また、別の好ましい態様において、複数の映像データが入力され、前記複数の映像データのうち一の映像データに係る映像に対して、他の映像データに係る映像をスーパーインポーズする映像合成手段をさらに具備し、前記遅延手段は、外部から供給され、前記第2のオーディオデータと時間同期がとられた第2の映像データを前記所定量遅延させ、前記映像合成手段は、前記遅延手段によって遅延された第2の映像データに係る映像に対して、前記映像データ生成手段によって生成された第1の映像データに係る映像をスーパーインポーズしてもよい。
また、本発明は、外部から供給される第2のオーディオデータに基づいて、記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定過程と、外部から供給される第2のオーディオデータと前記特定過程において特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント過程と、データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記特定過程において特定された第1のオーディオデータと組になっている第1のデータを読み出すデータ読出過程と、前記データ読出過程において読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成過程と、前記外部から供給される第2のオーディオデータを所定量遅延させる遅延過程とを備えることを特徴とするデータ再生方法を提供する。
また、別の好ましい態様において、収音によってオーディオデータを生成する収音過程とをさらに備え、前記特定過程は、外部から供給される第2のオーディオデータに代えて、前記収音過程において生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定してもよい。
また、別の好ましい態様において、コンピュータに、外部から供給される第2のオーディオデータに基づいて、記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定機能と、外部から供給される第2のオーディオデータと前記特定機能によって特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント機能と、データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記特定機能において特定された第1のオーディオデータと組になっている第1のデータを読み出すデータ読出機能と、前記データ読出機能によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成機能と、前記外部から供給される第2のオーディオデータを所定量遅延させる遅延機能とを実現させるためのコンピュータ読み取り可能なプログラムを提供する。
また、別の好ましい態様において、収音によってオーディオデータを生成する収音機能とをさらに備え、前記特定機能は、外部から供給される第2のオーディオデータに代えて、前記収音機能によって生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定してもよい。
本発明によれば、ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れにあわせ、当該楽曲に対応したデータの再生を簡単に行うことができるデータ再生装置、データ再生方法およびプログラムを提供することができる。
以下、本発明の一実施形態について説明する。
<実施形態>
図1は、本発明の本実施形態に係るデータ再生装置を有する映像表示装置1のハードウエアの構成を示すブロック図である。
CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているプログラムを読み出して、RAM(Random Access Memory)13にロードして実行することにより、映像表示装置1の各部について、バス10を介して制御する。また、RAM13は、CPU11が記憶された各データの加工などを行う際のワークエリアとして機能する。
さらに、RAM13は、内部に有するライブデータバッファ領域13aに、通信部17から受信するストリーミング再生するためのライブ映像データ(第2の映像データ)、ライブ楽音データ(第2のオーディオデータ)を一時的にバッファする機能を有する。そして、CPU11は、RAM13にバッファされたライブ映像データ、ライブ楽音データを読み出し、後述するような処理を行ってストリーミング再生を行う。また、RAM13は、ライブ楽音データの一部を記憶するための基準データ記憶領域1002を有している。基準データ記憶領域1002については、後述する。
ここで、ライブ映像データは、楽曲の生演奏を撮影した映像(以下、ライブ映像という)の映像データである。また、ライブ楽音データは、楽曲の生演奏を録音した音声(以下、ライブ演奏)のオーディオデータであって、ライブ演奏には、歌手の歌声(以下、ライブボーカルという)や伴奏などが含まれている。
記憶部(記憶手段)14は、例えば、ハードディスクなどの大容量記憶手段であって、楽曲データ記憶領域14aに、各楽曲のリファレンスデータとなるリファレンス楽曲データを記憶する。リファレンス楽曲データは、リファレンス楽音データ(第1のオーディオデータ)と歌詞データ(第1のデータ)を有している。リファレンス楽音データは、楽曲の見本となる歌声や伴奏を含む演奏(以下、リファレンス演奏という)を録音したオーディオデータであって、その再生時刻を示すタイムコードが付されている。歌詞データは、楽曲の歌詞を示すテキストデータと当該テキストデータの各テキストの表示タイミングを示すデータとを有するシーケンスデータであって、シーケンスデータの読み出し時刻を示すタイムコード(同期情報)が付されている。そして、リファレンス楽音データと歌詞データは、同じタイムコードによって読み出すことにより時間同期して再生することができ、楽曲の見本となる歌声にあった歌詞が表示されるようになっている。ここで、各リファレンス楽曲データは、それぞれの楽曲を識別するための情報(以下、楽曲情報データという)を有している。なお、楽曲を識別するための情報は、楽曲名や認識番号など、当該楽曲を特定できる情報であれば何でもよい。
表示部15は、映像を画面に表示する液晶ディスプレイなどの表示デバイスであって、入力された映像データに基づいて表示を行う。また、映像表示装置1を操作するためのメニュー画面などの各種画面を表示する。操作部16は、例えばキーボードやマウスなどであり、映像表示装置1の利用者が操作部16を操作すると、その操作内容を表すデータがCPU11へ出力される。
通信部17は、有線、無線などによって、データを受信するチューナなどの通信手段であって、上述したように、本実施形態においては、ライブ映像データ、ライブ楽音データを受信して、RAM13のライブデータバッファ領域13aにバッファする機能を有している。
音声出力部18は、スピーカなどの放音手段を有し、入力されたオーディオデータに基づいて放音する。
次に、CPU11が、ROM12に記憶されたプログラムを実行することによって実現する機能について説明する。図2は、CPU11が実現する機能を示したソフトウエアの構成を示すブロック図である。また、図3は、図2における楽曲検索部100の詳細の構成を示すブロック図である。
楽曲検索部(特定手段)100は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データを取得し、このライブ楽音データに基づいて、当該ライブ楽音データに対応する楽曲の楽曲情報データを楽曲データ選択部101に出力するものである。まず、楽曲検索部100について、図3を用いて説明する。
楽曲検索部100は、楽音データ取得部1001、基準データ記憶領域1002および検索処理部1003を有している。楽音データ取得部1001は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データのうちライブ演奏の最初の所定時間分(本実施形態においては3秒)のライブ楽音データを取得(以下、取得したデータを基準データという)し、基準データ記憶領域1002に記憶させる。そして、楽音データ取得部1001は、基準データ記憶領域1002への記憶が終了すると、検索処理部1003に対して、検索処理の開始を指示する。
検索処理部1003は、楽音データ取得部1001から検索処理の開始を指示されると、検索処理を開始する。以下、検索処理について説明する。まず、検索処理部1003は、基準データ記憶領域1002に記憶された基準データと記憶部14の楽曲データ記憶領域14aに記憶されている各リファレンス楽曲データに係るリファレンス楽音データの最初の部分と比較し、基準データと最も類似する、すなわち類似度が最も高いリファレンス楽音データを特定する。そして、検索処理部1003は、特定したリファレンス楽音データに対応する楽曲情報データを楽曲データ選択部101に出力する。ここで、類似度の算出は、例えば、DP(Dynamic Programming:動的計画法)マッチングにおいて算出されるDPマッチングスコアの累算値に基づいて行えばよい。DPマッチングおよびDPマッチングスコアについては後述する。
図2に戻って説明を続ける。楽曲データ選択部101は、楽曲検索部100から出力された楽曲情報データに基づいて、通信部17が受信している各データの楽曲を認識する。そして、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データの中から、認識した楽曲に対応するリファレンス楽曲データを選択し、そのリファレンス楽曲データのリファレンス楽音データおよび歌詞データを読み出す。そして、楽曲データ選択部101は、読み出したリファレンス楽音データをタイムアライメント部(タイムアライメント手段)102へ出力するとともに、読み出した歌詞データについては、後述するデータ読出部(データ読出手段)103に読み出されるまでRAM13にバッファしておく。
タイムアライメント部102は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データを取得し、当該ライブ楽音データと、楽曲データ選択部101から出力されたリファレンス楽音データとを比較して、ライブ演奏とリファレンス演奏との楽曲の進行のずれを検出し、当該楽曲の進行のずれに基づいてタイムコード(時刻情報)を出力する機能を有している。
ここで、楽曲の進行のずれは、それぞれのデータを所定時間長のフレーム単位に分離し、その各々に対してFFT(Fast Fourier Transform)を施して、それぞれのデータのスペクトルを算出し、これらの各フレーム間で類似したスペクトルを対応付けることにより検出する。また、楽曲の進行のずれを検出する機能について、本実施形態ではDP(Dynamic Programming:動的計画法)マッチングを用いる。具体的には以下のような処理となる。
タイムアライメント部102は、図4に示すような座標平面(以下、DPプレーンという)をRAM13に形成する。このDPプレーンの縦軸は、ライブ楽音データをそれぞれ所定時間長のフレーム単位に分離してその各々に対してFFTを施して得られたスペクトルについて、各フレームのスペクトルの絶対値の対数に逆フーリエ変換をかけて得られるパラメータ(ケプストラム)をa1、a2、a3・・・anとして、時間軸に従って並べたものである。また、横軸のb1、b2、b3・・・bnは、リファレンス楽音データについて、上記同様に時間軸に従って並べたものである。ここで、縦軸のa1、a2、a3・・・anの間隔と横軸のb1、b2、b3・・・bnの間隔は、いずれもフレームの時間長と対応している。このDPプレーンにおける各格子点の各々には、a1、a2、a3・・・anの各パラメータと、b1、b2、b3・・・bnの各パラメータのユークリッド距離を夫々示す値であるDPマッチングスコアが対応付けられている。例えば、a1とb1とにより位置決めされる格子点(a1,b1)には、ライブ楽音データの一連のフレームのうち最初のフレームから得たパラメータとリファレンス楽音データの一連のフレームのうち最初のフレームから得たパラメータのユークリッド距離を示す値が対応付けられることになる。
そして、タイムアライメント部102は、このような構造を成すDPプレーンを形成した後、a1とb1とにより位置決めされる始端にあたる格子点(a1,b1)からanとbnとにより位置決めされる終端にあたる格子点(an,bn)に至る全経路を探索し、探索した経路ごとに、その始端から終端までの間に辿る各格子点のDPマッチングスコアを累算して累算値を求める。なお、始端と終端は各データの最初のフレームと最後のフレームということではなく、各データから所定のフレーム数を単位として行われ、この単位における最初のフレームから最後のフレームまで行われて、これが順次処理され各データの最後のフレームまで処理されていく。
そして、DPマッチングスコアの累算値が最小となる経路をDPプレーン上から特定し、その経路上の各格子点によって、ライブ楽音データの各フレームにリファレンス楽音データの各フレームが対応付けられる。この対応関係により楽曲の進行のずれを検出することができる。例えば、図3に示すDPプレーン上に記された経路においては、a1とb1により位置決めされる格子点(a1,b1)からその右上のa2とb2により位置決めされる格子点(a2,b2)に進んでいることが分かる。この場合、a2のフレームとb2のフレームとの時間軸上の位置は当初から同じである。一方、この経路においては、a2とb2により位置決めされる格子点(a2,b2)からその右のa2とb3により位置決めされる格子点(a2,b3)に進んでいる。楽曲の進行のずれが無ければ格子点(a3,b3)へ進み、b3のフレームの時間軸上の位置に対応すべきフレームはa3のフレームとなるものであるが、格子点(a2,b3)に進んでいることから、b3のフレームはa3ではなくa2のフレームの時間軸上の位置と同じであると対応付けられ、楽曲の進行のずれが発生していることになる。すなわち、リファレンス楽音データのフレームb3までに進行する演奏の内容が、ライブ楽音データのフレームa2までに進行していることになるから、この時点においては、リファレンス演奏よりもライブ演奏の方が早く進んでいることになる。このようにして、楽曲の進行のずれを検出することができる。そして、ライブ楽音データの全てのフレームに対して、リファレンス楽音データのフレームを対応付けて、楽曲の進行のずれを検出する。以上がDPマッチングの仕組みである。
次に、タイムアライメント部102が検出した楽曲の進行のずれに基づいてタイムコードを順次出力する機能について説明する。タイムアライメント部102は、上述したように、ライブ楽音データの各フレームに対してリファレンス楽音データのフレームを対応付けるから、入力されたライブ楽音データの時間軸上の位置をリファレンス楽音データの時間軸上の位置(以下、再生位置という)として認識することができる。また、この再生位置の時間変化によりテンポを認識することができる。タイムアライメント部102は、所定の間隔で、認識した再生位置とテンポに基づいてタイムコードを生成し、順次出力する。もし、タイムアライメント部102から順次出力されたタイムコードを参照してリファレンス楽音データを読み出して再生したとすれば、リファレンス演奏の時間軸が伸縮され、ライブ演奏と同等な楽曲の進行で再生することができる。なお、楽曲データ選択部101から出力されるリファレンス楽音データは、楽曲検索部100において検索に要する時間が存在する分、ライブ楽音データに比べて遅れていることになるから、検索に要する時間によっては、楽曲の最初の部分についてはライブ楽音データとリファレンス楽音データの対応付けを行わず、楽曲途中からの対応付けを行うこととなる。この場合は、楽曲におけるイントロ部分が終了した後から対応付けを始めるようにすればよい。これは、リファレンス楽音データにイントロの終了を示す情報を付加して、タイムアライメント部102がその情報を読み取った場合に対応付けを始めるようにすることにより実現できる。
図2に戻って、説明を続ける。データ読出部103は、タイムアライメント部102から順次出力されるタイムコードと、歌詞データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした歌詞データを読み出し、データ処理部104に順次出力していく。そして、データ処理部(映像データ生成手段)104は、データ読出部103から順次出力された歌詞データに基づいて歌詞映像データ(第1の映像データ)を生成し、映像合成部(映像合成手段)106に出力する。ここで、楽曲の歌詞を示すテキストデータとそのテキストの表示タイミングを示すデータを有する歌詞データは、タイムアライメント部102から出力されたタイムコードを参照して読み出すことによりデータ読出部103から出力されるシーケンスデータであるから、歌詞映像データは、楽曲の歌詞の表示タイミングがライブ演奏の楽曲の進行にあわせて表示される映像のデータとして生成される。
遅延部(遅延手段)105は、CPU11によってライブデータバッファ領域13aから読み出されたライブ映像データとライブ楽音データに所定時間の遅延処理を行って出力する。ここで、所定時間は、上述したタイムアライメント部102がライブ楽音データを取得してから、データ処理部104が歌詞映像データを出力するまでの処理に必要な時間が設定されている。このようにすると、遅延部105から出力されたライブ楽音データ、ライブ映像データと、データ処理部104から出力された歌詞映像データは時間同期したものとなる。
映像合成部106は、遅延部105から出力されたライブ映像データに係るライブ映像に対して、データ処理部104から出力された歌詞映像データに係る歌詞の映像(以下、歌詞映像という)をスーパーインポーズした合成映像データを生成して表示部15へ出力する。ここで、合成映像データは、遅延部105において所定時間の遅延処理を行ったライブ映像データに係るライブ映像に対して、時間同期した歌詞映像、すなわち楽曲の歌詞がライブ演奏の楽曲の進行にあわせて表示される映像をスーパーインポーズしたものであり、ライブ映像に楽曲の歌詞映像が合成されることによって、その歌詞映像がライブボーカル、ライブ演奏、ライブ映像に合った映像の映像データとして生成される。
このようにして、表示部15には合成映像データが出力され、音声出力部18にはライブ楽音データが出力されることにより、本実施形態に係るデータ再生装置を有する映像表示装置1は、入力されたデータの楽曲を認識し、もともとのライブ映像に対して時間同期、すなわち楽曲の進行に合わせた歌詞映像が合成された映像と楽曲とを再生することができる。また、楽曲のイントロ部において検索処理を終了させるようにすれば、最初の歌詞映像が表示される前に終了させることもできる。
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
<変形例1>
実施形態においては、楽曲検索部100は、ライブ楽音データの取得を自動的に行い、楽曲の検索結果に基づいて、楽曲情報データを出力していたが、利用者が操作部16を操作して、楽曲検索部100に再度検索処理を行わせることができるようにしてもよい。この場合は、操作部16が操作されてから所定時間分のライブ楽音データを取得して、基準データとして扱えばよい。このようにすると、楽曲の検索結果が対応する楽曲になっていなかった場合に、表示部15に表示される歌詞映像がライブボーカルと一致しないものになっていても、再度検索処理を行わせることができる。また、基準データとなるライブ楽音データの領域が異なることにより、ライブ楽音データとリファレンス楽音データの類似度も異なるようになり、正しい楽曲の検索結果が得られることも期待することができる。
<変形例2>
実施形態においては、楽曲検索部100は、基準データと各リファレンス楽曲データに係るリファレンス楽音データの最初の部分と比較し、基準データと最も類似する、すなわち類似度が最も高いリファレンス楽音データを特定し、特定したリファレンス楽音データに対応する楽曲情報データを楽曲データ選択部101に出力していたが、類似度が最も高いリファレンス楽音データを特定するのではなく、類似度が高いリファレンス楽音データを複数特定し、利用者がその中から一のリファレンス楽音データを選択するようにしてもよい。この場合は、CPU11は、楽曲検索部100が特定した複数のリファレンス楽音データに対応する楽曲情報データに基づいて、楽曲の名称などを表示部15に既に表示されているライブ映像にスーパーインポーズするようにして表示させればよい。そして、利用者は、音声出力部から出力されるライブ演奏を聴きながら、または、表示部15に表示されているライブ映像を見ながら、操作部16を操作して、表示された複数の楽曲の名称から、一の楽曲を選択するようにすればよい。そして、楽曲検索部100は、利用者によって選択された楽曲に対応する楽曲情報データを楽曲データ選択部101へ出力すればよい。このようにすれば、一度でより正確な楽曲を特定することができる。
<変形例3>
実施形態においては、楽曲検索部100は、取得したライブ楽音データを基準データとして、検索処理を行っていたが、利用者が入力する音声データを基準データとして検索処理を行なうようにしてもよい。この場合は、図5のように、映像表示装置1に、マイクロフォンなどの収音手段と収音手段によって収音された音から音声データを生成する音声データ生成手段とを有する音声入力部21を具備させればよい。そして、利用者は、操作部16を操作して、楽曲検索部100に音声データを入力するタイミング、すなわち音声入力部21から音声を収音させるタイミングを指定して、そのタイミングで発音すればよい。ここで、当該発音は、利用者が楽曲のメロディや歌詞を歌ったものであってもよいし、楽器を演奏したものであってもよい。このようにすれば、事前に曲がわかっている場合には、事前に楽曲を特定しておくことができる。
<変形例4>
実施形態においては、楽曲検索部100が楽曲情報データを出力して、楽曲を特定するまでの処理は、全て映像表示装置1において行っていたが、一部の処理について通信部17を介して映像表示装置1と通信可能なサーバなどに行なわせてもよい。例えば、各リファレンス楽曲データを楽曲データ記憶領域14aに記憶させる代わりに、サーバの記憶部に記憶させ、検索処理部1003、楽曲データ選択部101の処理をサーバに行なわせてもよい。この場合には、楽曲検索部100の処理は、以下のように行われる。
まず、楽音データ取得部1001は、基準データを基準データ記憶領域1002に記憶させた後、サーバと通信を行い、サーバの検索処理部に検索処理の開始を指示するとともに、基準データ記憶領域1002に記憶させた基準データをサーバに送信する。そして、サーバの楽曲処理部は、送信された基準データとサーバの記憶部に記憶されたリファレンス楽曲データに係るリファレンス楽音データと比較して、類似度の高いリファレンス楽音データを特定する。その後、サーバの楽曲データ選択部は、特定したリファレンス楽音データに係るリファレンス楽曲データを映像表示装置1に送信する。映像表示装置1のCPU11は、送信されたリファレンス楽曲データのうち、リファレンス楽音データをRAM13にバッファした後にタイムアライメント部102に出力するとともに、歌詞データをデータ読出部103に読み出されるまでRAM13にバッファしておく。このようにすれば、映像表示装置1において行われる処理の一部をサーバにおいて行うようにしても、実施形態と同様な効果を得ることができる。
なお、上記に加えて楽音データ取得部1001の処理をサーバに行なわせるようにしてもよい。この場合は、映像表示装置1は、サーバの楽音データ取得部にライブ楽音データを取得させ、基準データ記憶領域1002をサーバの記憶部に確保して基準データを記憶させればよい。ここで、サーバのライブ楽音データの取得は、映像表示装置1がライブ楽音データを取得するとともに、映像表示装置1から通信部17を介してサーバに送信することによって行なってもよいし、映像表示装置1がライブ楽音データを取得した取得元の情報をサーバに送信して、サーバが当該取得元から取得するようにしてもよい。
このように、映像表示装置1において行われる処理の一部をサーバにおいて行う態様は、様々な組み合わせで可能であり、検索処理部1003の処理のみをサーバに行なわせてもよいし、楽音データ取得部1001と検索処理部1003の処理をサーバに行なわせてもよい。なお、この場合には、サーバから映像表示装置1へは楽曲情報データが送信されることになる。
<変形例5>
実施形態においては、楽音データ取得部1001は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データのうちライブ演奏の最初の所定時間分を取得し、これを基準データとして基準データ記憶領域1002に記憶させていたが、最初ではなく、途中から所定時間分を取得するようにしてもよい。この場合、利用者が操作部16を操作して、楽音データ取得部1001がライブ楽音データの取得を行うタイミングを指示するようにすればよい。このようにすれば、利用者が操作部16を操作するまでは、楽曲検索部100は、楽曲情報データを出力することはないから、ライブ映像に歌詞映像が表示されることがなく、歌詞映像を表示させたいときに利用者が操作部16を操作して、表示させることができる。
<変形例6>
実施形態においては、楽音データ取得部1001は、ライブ楽音データの取得のうちライブ演奏の最初の所定時間分を取得して、これを基準データとして基準データ記憶領域1002に記憶させ、基準データ記憶領域1002への記憶が終了すると、検索処理部1003に対して、検索処理の開始を指示していたが、ライブ楽音データの取得を開始するとともに、検索処理部1003に対して、検索処理の開始を指示してもよい。この場合、検索処理部1003は、基準データ記憶領域1002に順次記憶されていく基準データとリファレンス楽音データを比較すればよい。このようにすると、基準データのデータ量が徐々に増えることによって、類似度の高いリファレンス楽音データの数が絞られて、精度良くリファレンス楽音データを特定することができる。なお、リファレンス楽音データの特定が終了したら、楽音データ取得部1001はライブ楽音データの取得を停止すればよい。
<変形例7>
実施形態においては、検索処理部1003は、基準データとリファレンス楽音データを比較することにより、類似度の高いリファレンス楽音データを特定していたが、基準データおよびリファレンス楽音データのそれぞれが示すデータの特徴量を比較することにより類似度の高いリファレンス楽音データを特定するようにしてもよい。この場合には、楽曲データ記憶領域14aに記憶されている各リファレンス楽曲データは、リファレンス楽音データの特徴量を示す特徴量データを有するようにし、検索処理部1003は、基準データから特徴量を抽出して、当該特徴量と、リファレンス楽曲データの特徴量データとを比較することにようにすればよい。ここで、特徴量は、音程の変動、音量の変動などオーディオデータから抽出できる特徴量であれば、どのようなものであってもよく、検索処理部1003は、楽曲データ記憶領域14aに記憶されている特徴量データと同じ特徴量を基準データから抽出すればよい。なお、楽曲データ記憶領域14aには必ずしも特徴量データが記憶されている必要はなく、検索処理部1003にリファレンス楽音データの特徴量も抽出させてもよい。このようにすれば、より簡易にリファレンス楽音データの特定を行うことができる。
<変形例8>
実施形態においては、タイムアライメント部102におけるライブ楽音データとリファレンス楽音データとの対応付けは、楽曲検索部100における検索時間によっては、楽曲の途中から対応付けを行うようにしていたが、検索時間によらず、楽曲の最初から対応付けを行なうようにしてもよい。この場合には、タイムアライメント部102は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データを取得するとともにRAM13にバッファし、楽曲データ選択部101からリファレンス楽曲データが出力されるまで、ライブ楽音データをバッファし続ければよい。その後、実施形態におけるタイムアライメント部102の処理を行なうようにすればよい。ここで、ライブ楽音データをバッファする際には、取得したタイミングに応じてタイムコードを付しておくことにより、楽曲データ選択部101からリファレンス楽音データが出力されたときに、各データの最初からDPマッチングを行うことができるとともに、ライブ楽音データの現在の再生位置とリファレンス楽音データの位置の対応の目安として用いることができる。なお、ライブ楽音データをRAM13にバッファしなくても、ライブ楽音データの再生が開始されてからの時間を認識する手段を設けるだけでも、ライブ楽音データの現在の再生位置とリファレンス楽音データの位置の対応の目安として用いることが可能である。
<変形例9>
実施形態においては、楽音データ取得部1001は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データを取得する処理を行っていたが、CPU11によって読み出される前、すなわちライブ楽音データがライブデータバッファ領域13aにバッファされ始めると同時に、ライブ楽音データの取得を行なってもよい。このようにすると、CPU11によってライブ楽音データが読み出される前に楽曲検索部100において検索処理を開始することができるため、タイムアライメント部102におけるライブ楽音データとリファレンス楽音データの対応付けを早い段階で始めることが可能となる。
<変形例10>
実施形態においては、入力される情報にライブ映像データが含まれていたが、入力されるデータには映像データが含まれなくてもよい。この場合は、図6に示すように、映像合成部106を用いずに、データ処理部104は、歌詞映像データをそのまま表示部15へ出力するようにすればよい。このように、入力される情報には映像データを含む必要はなく、オーディオデータが含まれていればよいから、例えば、携帯オーディオから出力される音声データ、ラジオ放送など、様々な装置からのデータ入力に対応できる。この場合、通信部17をそれぞれのデータ入力に対応した通信手段とすればよい。
<変形例11>
実施形態においては、リファレンス楽音データと対応する歌詞データは、楽曲の歌詞を示すテキストデータと当該テキストデータの各テキストの表示タイミングを示すデータとを有するシーケンスデータであったが、楽曲の歌詞をリファレンス楽音データと時間同期して再生できるようにしたタイムコードの付された映像データ(第1のデータ)であってもよい。この場合、以下のようにすればよい。データ読出部103は、実施形態に示したようにタイムコードを参照し、映像データである歌詞データを読み出して、データ処理部104に順次出力する。これにより、データ読出部103から順次出力された歌詞データは、読み出されるときに楽曲の進行に合わせるように時間軸が伸縮されてデータ処理部104に出力される。そして、データ処理部104は、この時間軸が伸縮された歌詞データを歌詞映像データ(第1の映像データ)として生成して出力する。このようにすれば、歌詞データが映像データであっても、本発明の効果を奏することができる。なお、映像データについては、歌詞データに限らず、楽曲の楽譜など、入力されたオーディオデータ(実施形態においてはライブ楽音データ)の楽曲の進行に合わせて表示させたい映像のデータなら、どのような映像データでもよい。
<変形例12>
実施形態においては、楽曲の進行に合わせて歌詞を表示させるようにしていたが、これに加えて、外部の他の装置を楽曲の進行に合わせて制御するようにしてもよい。この場合は、以下のような構成とすればよい。図7に示すように、例えば、AUX(Auxiliary)端子などの制御信号出力部19を設け、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データは、リファレンス楽音データ、歌詞データに加え、制御信号データを有するようにする。ここで、制御信号データは、AUX端子に接続される外部の装置を制御する信号とその制御のタイミングを示すデータを有するシーケンスデータであって、歌詞データと同様にリファレンス楽音データと時間同期して外部の装置を制御できるようにタイムコードが付されている。
そして、図8に示すように、実施形態における楽曲データ選択部101の動作に加えて、楽曲データ記憶領域14aに記憶されている制御信号データを読み出す。そして、制御信号データをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムアライメント部102から順次出力されるタイムコードと、制御信号データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした制御信号データを読み出し、制御信号出力部19に順次出力していく。このようにすると、データ再生装置を有する映像表示装置1は、制御信号出力部に接続される外部の装置が、楽曲の進行にあわせて出力される制御信号に基づいて制御されるため、楽曲の進行にあわせて外部の装置を動作させることができる。なお、外部の装置には、照明、音響機器、ロボットなど、制御信号によって制御できるものであれば、どのようなものにも適用できる。この場合は、制御信号データは、制御したい装置にあわせたデータとしておけばよい。さらに、複数の外部の装置を同時に制御したい場合には、複数の制御信号データを用意しておき、制御信号出力部19に複数の装置を接続できるようにしておけばよい。この接続は、有線接続であってもよいし、無線接続であってもよく、信号が伝達できるものであればよい。
<変形例13>
実施形態においては、楽曲の進行に合わせて歌詞を表示させるようにしていたが、これに加えて、ライブ演奏に別の楽音を楽曲の進行に合わせて再生するようにしてもよい。この場合は、以下のような構成とすればよい。図9に示すように、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データは、リファレンス楽音データ、歌詞データに加え、MIDIデータを有するようにする。ここで、MIDIデータには、歌詞データと同様に、リファレンス楽音データと時間同期して再生できるように時刻情報が付されている。
そして、図10に示すように、楽曲データ選択部101は、実施形態における動作に加えて、楽曲データ記憶領域14aに記憶されているMIDIデータを読み出す。そして、MIDIデータをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムアライメント部102から順次出力されるタイムコードと、MIDIデータに付された時刻情報とを対応させるようにして、楽曲データ選択部101がRAM13にバッファしたMIDIデータを読み出し、再生部107に順次出力する。ここで、時刻情報がタイムコードである場合には、そのまま対応させればよいが、デュレーションなどタイムコード以外の相対時刻を表す情報である場合には、CPU11はリファレンス楽音データと時間同期して再生できるように設定されるテンポなどを参照してタイムコードを生成して対応させればよい。これにより、データ読出部103から順次出力されたMIDIデータは、読み出されるときに楽曲の進行に合わせるように読み出され再生部107に出力される。そして、再生部107は、このMIDIデータを再生してオーディオデータであるMIDI楽音データを生成し、音声合成部108へ出力する。一方、遅延部105によって遅延処理されたライブ楽音データも音声合成部108へ出力される。そして、音声合成部108は、ライブ楽音データに係るライブ演奏とMIDI楽音データに係るMIDI演奏とをミキシングした音を合成楽音データとして生成し、音声出力部18へ出力する。なお、ライブ楽音データとMIDI楽音データとをミキシングせずに別々に音声出力部18に出力するようにしてもよい。この場合は、それぞれのデータについて音声出力部18においてミキシングしてもよいし、ミキシングせず異なる放音手段から放音するようにしてもよい。ここで、再生部107は、MIDIデータを再生することができる音源部を有することによって、MIDI楽音データを生成することができる。なお、音源部によって生成されるオーディオデータの楽音の発音内容を示すシーケンスデータであれば、必ずしもMIDIデータでなくてもよい。
また、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データのMIDIデータに代えて、リファレンス楽音データと時間同期して再生できるようにタイムコードの付されたオーディオデータである追加楽音データとしてもよい。この場合は、以下のように処理される。まず、楽曲データ選択部101は、楽曲データ記憶領域14aに記憶されている追加楽音データを読み出す。そして、追加楽音データをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムアライメント部102から順次出力されるタイムコードと、追加楽音データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした追加楽音データを読み出し、再生部107に順次出力する。これにより、データ読出部103から順次出力された追加楽音データは、読み出されるときに楽曲の進行に合わせるように時間軸が伸縮されて再生部107に出力される。そして、再生部107は、この時間軸が伸縮された追加楽音データを新たなオーディオデータとして、音声合成部108へ出力する。その後はMIDIデータの場合と同様に処理すればよい。このようにすれば、映像だけでなく様々な音についても、楽曲の進行にあわせて出力することができる。
<変形例14>
実施形態においては、通信部17は、有線、無線などによって、データを受信するチューナなどの通信手段であって、ライブ映像データ、ライブ楽音データ、楽曲情報データを受信していたが、図1に破線で示したように、データ入力部20を設けて、これらのデータがデータ入力部20から入力されるようにしてもよい。例えば、これらのデータが、DVD(Digital Versatile Disc)などの記録メディアに記録されたデータであれば、データ入力部は、DVDに記録されたデータを読み取れる光学ドライブであればよい。このようにしても、実施形態と同様な効果を得ることができる。
<変形例15>
実施形態においては、遅延部105を設け、CPU11によってライブデータバッファ領域13aから読み出されたライブ映像データとライブ楽音データにタイムアライメント部102がライブ楽音データを取得してから、データ処理部104が歌詞映像データを出力するまでの処理に必要な時間(以下、遅延時間という)の遅延処理を行って出力していた。一方、図11に示すように、タイムアライメント部102からのタイムコードの出力は、タイムコード予測部109を介してデータ読出部103に出力されるようにしてもよい。この場合は、タイムコード予測部109は、タイムアライメント部102から順次出力されるタイムコードを参照して、遅延時間後にタイムアライメント部102から出力されるタイムコードを予測する。そして、タイムコード予測部109は、予測したタイムコードをデータ読出部103に順次出力すればよい。ここで、タイムコードの予測は、タイムアライメント部102から順次出力されたタイムコードのうち、過去の所定の数のタイムコードを参照し、これらのタイムコードの示す時間軸上の位置の変化量から、遅延時間後のタイムコードを推定すればよい。なお、タイムコードの予測は、遅延時間後にタイムアライメント部102から出力されるタイムコードを予測すればよいから、上記方法に限らず、所定のアルゴリズムに基づいて行なえばよい。このようにすれば、遅延部105を用いたライブ楽音データ、ライブ演奏データの遅延をさせずに、実施形態の効果を得ることができる。
<変形例16>
実施形態においては、タイムアライメント部102は、楽曲の進行のずれを検出する機能について、DPマッチングを用いていたが、異なった手法によって楽曲の進行のずれを検出するようにしてもよい。例えば、HMM(Hidden Markov Model:隠れマルコフモデル)を用いてもよいし、比較対象である各データから波形の特徴量(音程、音量など)を抽出して比較するようにしてもよい。すなわち、各データの比較をして、各データ間の類似する部分を対応させることができる手法であればどのような手法でもよい。このようにしても、実施形態と同様な効果を得ることができる。
実施形態に係る映像表示装置のハードウエアの構成を示すブロック図である。 実施形態に係る映像表示装置のソフトウエアの構成を示すブロック図である。 楽曲検索部のソフトウエアの構成を示すブロック図である。 DPマッチングを行う際のDPプレーンを示す説明図である。 変形例3に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例10に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例12に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例12に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例13に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例13に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例15に係る映像表示装置のソフトウエアの構成を示すブロック図である。
符号の説明
1…映像表示装置、10…バス、11…CPU、12…ROM、13…RAM、13a…ライブデータバッファ領域、14…記憶部、14a…楽曲データ記憶領域、15…表示部、16…操作部、17…通信部、18…音声出力部、19…制御信号出力部、20…データ入力部、21…音声入力部、100…楽曲検索部、1001…楽音データ取得部、1002…基準データ記憶領域、1003…検索処理部、101…楽曲データ選択部、102…タイムアライメント部、103…データ読出部、104…データ処理部、105…遅延部、106…映像合成部、107…再生部、108…音声合成部、109…タイムコード予測部

Claims (15)

  1. データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段と、
    外部から供給される第2のオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定手段と、
    前記外部から供給される第2のオーディオデータと前記特定手段によって特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記特定手段によって特定された第1のオーディオデータと組になっている第1のデータを前記記憶手段から読み出すデータ読出手段と、
    前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、
    前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段と
    を具備することを特徴とするデータ再生装置。
  2. 前記特定手段は、外部から供給される第2のオーディオデータの一部分のデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定すること
    を特徴とする請求項1に記載のデータ再生装置。
  3. 収音によってオーディオデータを生成する収音手段
    をさらに具備し、
    前記特定手段は、外部から供給される第2のオーディオデータに代えて、前記収音手段によって生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定すること
    を特徴とする請求項1に記載のデータ再生装置。
  4. 前記特定手段に再度第1のオーディオデータを特定させる再特定指示手段
    をさらに具備することを特徴とする請求項1乃至請求項3のいずれかに記載のデータ再生装置。
  5. ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出す指示手段と、
    前記指示手段の指示に応答して前記サーバから送信されたデータを第1のオーディオデータおよびデータ各部についての時刻を規定する同期情報を有した第1のデータとして受信する受信手段と、
    前記受信手段によって受信した第1のオーディオデータと第1のデータとを記憶する記憶手段と、
    外部から供給される第2のオーディオデータと前記記憶手段に記憶された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から第1のデータを読み出すデータ読出手段と、
    前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、
    前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段と
    を具備することを特徴とするデータ再生装置。
  6. ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出す指示手段と、
    前記指示手段の指示に応答して前記サーバから送信されたデータを楽曲情報データとして受信する受信手段と、
    データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段と、
    前記楽曲情報データに基づいて、前記記憶手段に記憶されている複数の第1のオーディオデータから第1のオーディオデータを選択する選択手段と、
    外部から供給される第2のオーディオデータと前記選択手段によって選択された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント手段と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記選択手段によって選択された第1のオーディオデータと組になっている第1のデータを前記記憶手段から読み出すデータ読出手段と、
    前記データ読出手段によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成手段と、
    前記外部から供給される第2のオーディオデータを所定量遅延させる遅延手段と
    を具備することを特徴とするデータ再生装置。
  7. 前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、外部から供給される第2のオーディオデータを前記サーバへ送信すること
    を特徴とする請求項5または請求項6に記載のデータ再生装置。
  8. 前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、外部から供給される第2のオーディオデータの一部を前記サーバへ送信すること
    を特徴とする請求項5または請求項6に記載のデータ再生装置。
  9. 収音によってオーディオデータを生成する収音手段
    をさらに具備し、
    前記指示手段は、ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を出すとともに、前記収音手段によって生成したオーディオデータを前記サーバへ送信すること
    を特徴とする請求項5または請求項6に記載のデータ再生装置。
  10. ネットワークに接続されたサーバに第1のオーディオデータを特定させる指示を前記指示手段に再度出させる再特定指示手段
    をさらに具備することを特徴とする請求項5乃至請求項9のいずれかに記載のデータ再生装置。
  11. 複数の映像データが入力され、前記複数の映像データのうち一の映像データに係る映像に対して、他の映像データに係る映像をスーパーインポーズする映像合成手段をさらに具備し、
    前記遅延手段は、外部から供給され、前記第2のオーディオデータと時間同期がとられた第2の映像データを前記所定量遅延させ、
    前記映像合成手段は、前記遅延手段によって遅延された第2の映像データに係る映像に対して、前記映像データ生成手段によって生成された第1の映像データに係る映像をスーパーインポーズすること
    を特徴とする請求項1乃至請求項10のいずれかに記載のデータ再生装置。
  12. 外部から供給される第2のオーディオデータに基づいて、記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定過程と、
    外部から供給される第2のオーディオデータと前記特定過程において特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント過程と、
    データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記特定過程において特定された第1のオーディオデータと組になっている第1のデータを読み出すデータ読出過程と、
    前記データ読出過程において読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成過程と、
    前記外部から供給される第2のオーディオデータを所定量遅延させる遅延過程と
    を備えることを特徴とするデータ再生方法。
  13. 収音によってオーディオデータを生成する収音過程と
    をさらに備え、
    前記特定過程は、外部から供給される第2のオーディオデータに代えて、前記収音過程において生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定すること
    を特徴とする請求項12に記載のデータ再生方法。
  14. コンピュータに、
    外部から供給される第2のオーディオデータに基づいて、記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定する特定機能と、
    外部から供給される第2のオーディオデータと前記特定機能によって特定された第1のオーディオデータとを所定時間長のフレーム単位で対応付けて、対応する部分についての時刻を示す時刻情報を生成するタイムアライメント機能と、
    データ各部についての時刻を規定する同期情報を有した第1のデータと第1のオーディオデータとを組にして複数記憶する記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記特定機能において特定された第1のオーディオデータと組になっている第1のデータを読み出すデータ読出機能と、
    前記データ読出機能によって読み出された第1のデータに基づいて、第1の映像データを生成する映像データ生成機能と、
    前記外部から供給される第2のオーディオデータを所定量遅延させる遅延機能と
    を実現させるためのコンピュータ読み取り可能なプログラム。
  15. 収音によってオーディオデータを生成する収音機能と
    をさらに備え、
    前記特定機能は、外部から供給される第2のオーディオデータに代えて、前記収音機能によって生成したオーディオデータに基づいて、前記記憶手段に記憶された複数の第1のオーディオデータから第1のオーディオデータを特定すること
    を特徴とする請求項14に記載のコンピュータ読み取り可能なプログラム。
JP2007031063A 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム Expired - Fee Related JP4595948B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007031063A JP4595948B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007031063A JP4595948B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008197269A true JP2008197269A (ja) 2008-08-28
JP4595948B2 JP4595948B2 (ja) 2010-12-08

Family

ID=39756289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007031063A Expired - Fee Related JP4595948B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4595948B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093632A (ja) * 2010-10-28 2012-05-17 Yamaha Corp 音響処理装置
GB2559156A (en) * 2017-01-27 2018-08-01 Robert Mead Paul Live audio signal processing system
CN115442540A (zh) * 2022-08-31 2022-12-06 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149242A (ja) * 1992-11-02 1994-05-27 Matsushita Electric Ind Co Ltd 自動演奏装置
JPH08123818A (ja) * 1994-10-25 1996-05-17 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索システム及び音楽情報検索方法
JPH1124674A (ja) * 1997-06-27 1999-01-29 Ricoh Co Ltd 情報処理装置
JPH11120198A (ja) * 1997-10-20 1999-04-30 Sony Corp 楽曲検索装置
JP2002049631A (ja) * 2000-08-01 2002-02-15 Sony Corp 情報提供装置および方法、並びに記録媒体
JP2002055994A (ja) * 2000-08-10 2002-02-20 Sony Corp 情報処理装置および方法、情報処理システム、並びに記録媒体
JP2002196769A (ja) * 2000-12-22 2002-07-12 Nec Corp 曲名確定システム
JP2002215143A (ja) * 2001-01-18 2002-07-31 Yamaha Corp 楽曲データ出力装置及び楽曲データ出力方法
JP2002215626A (ja) * 1999-02-15 2002-08-02 Matsushita Electric Ind Co Ltd 端末装置、情報転送システム及びプログラム記録媒体
JP2002215632A (ja) * 2001-01-18 2002-08-02 Nec Corp 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法
JP2002278571A (ja) * 2001-03-16 2002-09-27 Denon Ltd ディスク再生装置
JP2003202872A (ja) * 2001-12-28 2003-07-18 Daiichikosho Co Ltd 電子目次本機能付きカラオケリモコン装置
JP2006039412A (ja) * 2004-07-29 2006-02-09 Gaiax Co Ltd カラオケ運営システム
JP2006195385A (ja) * 2005-01-17 2006-07-27 Matsushita Electric Ind Co Ltd 音楽再生装置および音楽再生プログラム

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149242A (ja) * 1992-11-02 1994-05-27 Matsushita Electric Ind Co Ltd 自動演奏装置
JPH08123818A (ja) * 1994-10-25 1996-05-17 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索システム及び音楽情報検索方法
JPH1124674A (ja) * 1997-06-27 1999-01-29 Ricoh Co Ltd 情報処理装置
JPH11120198A (ja) * 1997-10-20 1999-04-30 Sony Corp 楽曲検索装置
JP2002215626A (ja) * 1999-02-15 2002-08-02 Matsushita Electric Ind Co Ltd 端末装置、情報転送システム及びプログラム記録媒体
JP2002049631A (ja) * 2000-08-01 2002-02-15 Sony Corp 情報提供装置および方法、並びに記録媒体
JP2002055994A (ja) * 2000-08-10 2002-02-20 Sony Corp 情報処理装置および方法、情報処理システム、並びに記録媒体
JP2002196769A (ja) * 2000-12-22 2002-07-12 Nec Corp 曲名確定システム
JP2002215143A (ja) * 2001-01-18 2002-07-31 Yamaha Corp 楽曲データ出力装置及び楽曲データ出力方法
JP2002215632A (ja) * 2001-01-18 2002-08-02 Nec Corp 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法
JP2002278571A (ja) * 2001-03-16 2002-09-27 Denon Ltd ディスク再生装置
JP2003202872A (ja) * 2001-12-28 2003-07-18 Daiichikosho Co Ltd 電子目次本機能付きカラオケリモコン装置
JP2006039412A (ja) * 2004-07-29 2006-02-09 Gaiax Co Ltd カラオケ運営システム
JP2006195385A (ja) * 2005-01-17 2006-07-27 Matsushita Electric Ind Co Ltd 音楽再生装置および音楽再生プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093632A (ja) * 2010-10-28 2012-05-17 Yamaha Corp 音響処理装置
GB2559156A (en) * 2017-01-27 2018-08-01 Robert Mead Paul Live audio signal processing system
CN115442540A (zh) * 2022-08-31 2022-12-06 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质
CN115442540B (zh) * 2022-08-31 2024-05-03 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP4595948B2 (ja) 2010-12-08

Similar Documents

Publication Publication Date Title
US8027631B2 (en) Song practice support device
JP2006195385A (ja) 音楽再生装置および音楽再生プログラム
JP5151245B2 (ja) データ再生装置、データ再生方法およびプログラム
JP4458096B2 (ja) データ再生装置、データ再生方法およびプログラム
JP4595948B2 (ja) データ再生装置、データ再生方法およびプログラム
WO2018207936A1 (ja) 譜面自動検出方法および装置
JP4595947B2 (ja) データ再生装置、データ再生方法およびプログラム
JP5012263B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2007233077A (ja) 評価装置、制御方法及びプログラム
JP5092589B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2009169103A (ja) 練習支援装置
JP4873162B2 (ja) 映像コンテンツ再生装置
JP4470947B2 (ja) データ再生装置、データ再生方法およびプログラム
JP4506750B2 (ja) コンテンツ再生装置
JP6252420B2 (ja) 音声合成装置、及び音声合成システム
JP6260565B2 (ja) 音声合成装置、及びプログラム
JP2006276560A (ja) 音楽再生装置および音楽再生方法
JP2008197272A (ja) データ再生装置、データ再生方法およびプログラム
JP2008244888A (ja) 通信装置、通信方法およびプログラム
JP6657866B2 (ja) 音響効果付与装置及び音響効果付与プログラム
JP2009244790A (ja) 歌唱指導機能を備えるカラオケシステム
JP4539647B2 (ja) コンテンツ再生装置
JP2008244890A (ja) 通信装置、通信方法およびプログラム
JP5012269B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP4967747B2 (ja) 通信装置、通信方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees