JP4458096B2 - データ再生装置、データ再生方法およびプログラム - Google Patents

データ再生装置、データ再生方法およびプログラム Download PDF

Info

Publication number
JP4458096B2
JP4458096B2 JP2007031064A JP2007031064A JP4458096B2 JP 4458096 B2 JP4458096 B2 JP 4458096B2 JP 2007031064 A JP2007031064 A JP 2007031064A JP 2007031064 A JP2007031064 A JP 2007031064A JP 4458096 B2 JP4458096 B2 JP 4458096B2
Authority
JP
Japan
Prior art keywords
data
time
information
audio data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007031064A
Other languages
English (en)
Other versions
JP2008197270A (ja
Inventor
卓朗 曽根
孝浩 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007031064A priority Critical patent/JP4458096B2/ja
Publication of JP2008197270A publication Critical patent/JP2008197270A/ja
Application granted granted Critical
Publication of JP4458096B2 publication Critical patent/JP4458096B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、入力されたデータと同期して、他のデータを再生する技術に関する。
一般的なカラオケ装置においては、例えば、MIDI(Musical Instruments Digital Interface:登録商標)形式の伴奏用データ、楽曲の歌詞テロップを表示するシーケンスデータおよび映像データなどから構成された楽曲データをそれぞれ同期させて再生することにより、利用者はその楽曲のカラオケを楽しむことができる。特許文献1には、伴奏データと映像データを別個にサーバから受信してそれらを同期させて再生させる技術が開示されている。また、特許文献2においては、ライブ演奏のような臨場感のあるカラオケ演奏を提供する技術が開示されている。
また、歌詞を表示させる技術は、カラオケ装置だけで用いられるわけではなく、テレビ放送などにおける歌番組においても用いられている。また、テレビ放送においては、生放送の歌番組などで歌手が歌唱に合わせて歌詞テロップを表示する場合、オペレータが楽曲の進行にあわせて、所定のタイミングで歌詞を表示させるようにしている。
特開2003−15675号公報 特開2000−347676号公報
しかし、特許文献1に開示された技術を用いる場合には、伴奏データはMIDI形式のデータの再生であるため、MIDI形式のデータを再生できる音源を用いた再生のため、音質が劣る場合や、テンポが単調な演奏となってしまう場合があった。また、特許文献2に開示された技術の場合には、ライブ演奏のような臨場感が得られるが、楽曲の進行が単調ではないため、歌詞テロップを表示させるためなどのシーケンスデータについては、楽曲の進行に合わせて事前に作成しておく必要があった。また、テレビ放送などにおいて上述したようなオペレータの作業は、本番においてミスは許されず、事前に楽曲の進行と歌詞の表示を行うタイミングとを合わせる練習をしておく必要があり、非常に負担が大きかった。
本発明は、上述の事情に鑑みてなされたものであり、ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れに追従したデータの再生を簡単に行うことができるデータ再生装置、データ再生方法およびプログラムを提供することを目的とする。
上述の課題を解決するため、本発明は、音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶する記憶手段と、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント手段と、前記タイムアライメント手段によって順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント手段が生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測手段と、前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータを読み出すデータ読出手段と、前記データ読出手段によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成手段とを具備することを特徴とするデータ再生装置を提供する。
また、本発明は、音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶する記憶手段と、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント手段と、前記タイムアライメント手段によって順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント手段が生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測手段と、前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータと前記第2のデータとを読み出すデータ読出手段と、前記データ読出手段によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成手段とを具備することを特徴とするデータ再生装置を提供する。
また、別の好ましい態様において、前記データ読出手段によって読み出された第2のデータに基づいてオーディオデータを生成する音源部をさらに具備し、前記第2のデータは、前記音源部によって生成されるオーディオデータに係る楽音の発音内容を示すシーケンスデータであってもよい。
また、別の好ましい態様において、前記記憶手段に記憶される第1のオーディオデータは、複数のトラックを有し、前記データ読出手段は、さらに前記時刻情報と前記第1のオーディオデータのデータ各部に規定された時刻の対応関係に基づいて、前記記憶手段から前記第1のオーディオデータを読み出してもよい。
また、別の好ましい態様において、操作によって利用者の指示を入力する操作手段と、前記操作手段の操作に基づいて前記第1のオーディオデータの各トラックのうち、一部のトラックを選択するトラック選択手段と、前記データ読出手段によって読み出された第1のオーディオデータは、前記トラック選択手段によって選択されたトラック以外のデータであってもよい。
また、別の好ましい態様において、操作によって利用者の指示を入力する操作手段と、前記操作手段の操作に基づいて前記第1のオーディオデータの各トラックのうち、一部のトラックを選択するトラック選択手段と、前記タイムアライメント手段は、前記取得した第2のオーディオデータの各部と、前記第1のオーディオデータのうち前記トラック選択手段によって選択されたトラックの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成してもよい。
また、別の好ましい態様において、前記予め設定された設定時間は、前記タイムアライメント手段に第2のオーディオデータが取得されてから前記映像データ生成手段によって第1の映像データを生成するまでの時間として設定されていてもよい。
また、別の好ましい態様において、複数の映像データが入力され、前記複数の映像データのうち一の映像データに係る映像に対して、他の映像データに係る映像をスーパーインポーズする映像合成手段をさらに具備し、前記映像合成手段は、外部から供給され、前記第2のオーディオデータと時間同期がとられた第2の映像データに係る映像に対して、前記映像データ生成手段によって生成された第1の映像データに係る映像をスーパーインポーズしてもよい。
また、本発明は、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と記憶手段に記憶された音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント過程と、前記タイムアライメント過程において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント過程おいて生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測過程と、前記第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶する前記記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記第1のデータを読み出すデータ読出過程と、前記データ読出過程において読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成過程とを備えることを特徴とするデータ再生方法を提供する。
また、本発明は、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と記憶手段に記憶された音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント過程と、前記タイムアライメント過程において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント過程において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測過程と、前記第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶する前記記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記第1のデータと前記第2のデータとを読み出すデータ読出過程と、前記データ読出過程において読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成過程とを備えることを特徴とするデータ再生方法を提供する。
また、本発明は、記憶手段を有するコンピュータに、前記記憶手段に音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶させるとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶させる記憶機能と、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント機能と、前記タイムアライメント機能において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント機能において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測機能と、前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータを読み出すデータ読出機能と、前記データ読出機能によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成機能とを実現させるためのプログラムを提供する。
また、本発明は、記憶手段を有するコンピュータに、前記記憶手段に音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶させるとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶させる記憶機能と、外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント機能と、前記タイムアライメント機能において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント機能において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測機能と、前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータと前記第2のデータとを読み出すデータ読出機能と、前記データ読出機能によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成機能とを実現させるためのプログラムを提供する。
本発明によれば、ライブ演奏のように楽曲のテンポの変動があっても、楽曲の流れに追従したデータの再生を簡単に行うことができるデータ再生装置、データ再生方法およびプログラムを提供することができる。
以下、本発明の一実施形態について説明する。
<実施形態>
図1は、本発明の本実施形態に係るデータ再生装置を有する映像表示装置1のハードウエアの構成を示すブロック図である。
CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているプログラムを読み出して、RAM(Random Access Memory)13にロードして実行することにより、映像表示装置1の各部について、バス10を介して制御する。また、RAM13は、CPU11が記憶された各データの加工などを行う際のワークエリアとして機能する。
さらにRAM13は、内部に有するライブデータバッファ領域13aに、通信部17から受信するストリーミング再生するためのライブ映像データ(第2の映像データ)、ライブ楽音データ(第2のオーディオデータ)を一時的にバッファする機能を有するとともに、当該各データに対応する楽曲に関する情報のデータ(以下、楽曲情報データという)についても、通信部17において受信して記憶する。なお、楽曲に関する情報は、楽曲名や認識番号など、当該楽曲を特定できる情報であれば何でもよい。そして、CPU11は、RAM13にバッファされたライブ映像データ、ライブ楽音データを読み出し、後述するような処理を行ってストリーミング再生を行う。
ここで、ライブ映像データは、楽曲の生演奏を撮影した映像(以下、ライブ映像という)の映像データである。また、ライブ楽音データは、楽曲の生演奏を録音した音声(以下、ライブ演奏)のオーディオデータであって、ライブ演奏には、歌手の歌声(以下、ライブボーカルという)や伴奏などが含まれている。
記憶部(記憶手段)14は、例えば、ハードディスクなどの大容量記憶手段であって、楽曲データ記憶領域14aに、各楽曲のリファレンスデータとなるリファレンス楽曲データを記憶する。リファレンス楽曲データは、リファレンス楽音データ(第1のオーディオデータ)と歌詞データ(第1のデータ)を有している。リファレンス楽音データは、楽曲の見本となる歌声や伴奏を含む演奏(以下、リファレンス演奏という)を録音したオーディオデータであって、その再生時刻を示すタイムコードが付されている。歌詞データは、楽曲の歌詞を示すテキストデータと当該テキストデータの各テキストの表示タイミングを示すデータとを有するシーケンスデータであって、シーケンスデータの読み出し時刻を示すタイムコード(同期情報)が付されている。そして、リファレンス楽音データと歌詞データは、同じタイムコードによって読み出すことにより時間同期して再生することができ、楽曲の見本となる歌声にあった歌詞が表示されるようになっている。
表示部15は、映像を画面に表示する液晶ディスプレイなどの表示デバイスであって、入力された映像データに基づいて表示を行う。また、映像表示装置1を操作するためのメニュー画面などの各種画面を表示する。操作部16は、例えばキーボードやマウスなどであり、映像表示装置1の利用者が操作部16を操作すると、その操作内容を表すデータがCPU11へ出力される。
通信部17は、有線、無線などによって、データを受信するチューナなどの通信手段であって、上述したように、本実施形態においては、ライブ映像データ、ライブ楽音データ、楽曲情報データを受信して、RAM13のライブデータバッファ領域13aにバッファする機能を有している。
音声出力部18は、スピーカなどの放音手段を有し、入力されたオーディオデータに基づいて放音する。
次に、CPU11が、ROM12に記憶されたプログラムを実行することによって実現する機能について説明する。図2は、CPU11が実現する機能を示したソフトウエアの構成を示すブロック図である。
楽曲データ選択部101は、ライブデータバッファ領域13aから楽曲情報データを読み取り、通信部17が受信している各データの楽曲を認識する。そして、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データの中から、認識した楽曲に対応するリファレンス楽曲データを選択し、そのリファレンス楽曲データのリファレンス楽音データおよび歌詞データを読み出す。そして、楽曲データ選択部101は、読み出したリファレンス楽音データをタイムアライメント部(タイムアライメント手段)102へ出力するとともに、読み出した歌詞データについては、後述するデータ読出部(データ読出手段)103に読み出されるまでRAM13にバッファしておく。
タイムアライメント部102は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データを取得し、当該ライブ楽音データと、楽曲データ選択部101から出力されたリファレンス楽音データとを比較して、ライブ演奏とリファレンス演奏との楽曲の進行のずれを検出し、当該楽曲の進行のずれに基づいてタイムコード(対応情報)を出力する機能を有している。
ここで、楽曲の進行のずれは、それぞれのデータを所定時間長のフレーム単位に分離し、その各々に対してFFT(Fast Fourier Transform)を施して、それぞれのデータのスペクトルを算出し、これらの各フレーム間で類似したスペクトルを対応付けることにより検出する。また、楽曲の進行のずれを検出する機能について、本実施形態ではDP(Dynamic Programming:動的計画法)マッチングを用いる。具体的には以下のような処理となる。
タイムアライメント部102は、図3に示すような座標平面(以下、DPプレーンという)をRAM13に形成する。このDPプレーンの縦軸は、ライブ楽音データをそれぞれ所定時間長のフレーム単位に分離してその各々に対してFFTを施して得られたスペクトルについて、各フレームのスペクトルの絶対値の対数に逆フーリエ変換をかけて得られるパラメータ(ケプストラム)をa1、a2、a3・・・anとして、時間軸に従って並べたものである。また、横軸のb1、b2、b3・・・bnは、リファレンス楽音データについて、上記同様に時間軸に従って並べたものである。ここで、縦軸のa1、a2、a3・・・anの間隔と横軸のb1、b2、b3・・・bnの間隔は、いずれもフレームの時間長と対応している。このDPプレーンにおける各格子点の各々には、a1、a2、a3・・・anの各パラメータと、b1、b2、b3・・・bnの各パラメータのユークリッド距離を夫々示す値であるDPマッチングスコアが対応付けられている。例えば、a1とb1とにより位置決めされる格子点(a1,b1)には、ライブ楽音データの一連のフレームのうち最初のフレームから得たパラメータとリファレンス楽音データの一連のフレームのうち最初のフレームから得たパラメータのユークリッド距離を示す値が対応付けられることになる。
そして、タイムアライメント部102は、このような構造を成すDPプレーンを形成した後、a1とb1とにより位置決めされる始端にあたる格子点(a1,b1)からanとbnとにより位置決めされる終端にあたる格子点(an,bn)に至る全経路を探索し、探索した経路ごとに、その始端から終端までの間に辿る各格子点のDPマッチングスコアを累算して累算値を求める。なお、始端と終端は各データの最初のフレームと最後のフレームということではなく、各データから所定のフレーム数を単位として行われ、この単位における最初のフレームから最後のフレームまで行われて、これが順次処理され各データの最後のフレームまで処理されていく。
そして、DPマッチングスコアの累算値が最小となる経路をDPプレーン上から特定し、その経路上の各格子点によって、ライブ楽音データの各フレームにリファレンス楽音データの各フレームが対応付けられる。この対応関係により楽曲の進行のずれを検出することができる。例えば、図3に示すDPプレーン上に記された経路においては、a1とb1により位置決めされる格子点(a1,b1)からその右上のa2とb2により位置決めされる格子点(a2,b2)に進んでいることが分かる。この場合、a2のフレームとb2のフレームとの時間軸上の位置は当初から同じである。一方、この経路においては、a2とb2により位置決めされる格子点(a2,b2)からその右のa2とb3により位置決めされる格子点(a2,b3)に進んでいる。楽曲の進行のずれが無ければ格子点(a3,b3)へ進み、b3のフレームの時間軸上の位置に対応すべきフレームはa3のフレームとなるものであるが、格子点(a2,b3)に進んでいることから、b3のフレームはa3ではなくa2のフレームの時間軸上の位置と同じであると対応付けられ、楽曲の進行のずれが発生していることになる。すなわち、リファレンス楽音データのフレームb3までに進行する演奏の内容が、ライブ楽音データのフレームa2までに進行していることになるから、この時点においては、リファレンス演奏よりもライブ演奏の方が早く進んでいることになる。このようにして、楽曲の進行のずれを検出することができる。そして、ライブ楽音データの全てのフレームに対して、リファレンス楽音データのフレームを対応付けて、楽曲の進行のずれを検出する。以上がDPマッチングの仕組みである。
次に、タイムアライメント部102が検出した楽曲の進行のずれに基づいてタイムコードを順次出力する機能について説明する。タイムアライメント部102は、上述したように、ライブ楽音データの各フレームに対してリファレンス楽音データのフレームを対応付けるから、入力されたライブ楽音データの時間軸上の位置をリファレンス楽音データの時間軸上の位置(以下、再生位置という)として認識することができる。また、この再生位置の時間変化によりテンポを認識することができる。タイムアライメント部102は、所定の間隔で、認識した再生位置とテンポに基づいてタイムコードを生成し、順次出力する。もし、タイムアライメント部102から順次出力されたタイムコードを参照してリファレンス楽音データを読み出して再生したとすれば、リファレンス演奏の時間軸が伸縮され、ライブ演奏と同等な楽曲の進行で再生することができる。
図2に戻って、説明を続ける。タイムコード予測部(予測手段)105は、タイムアライメント部102から順次出力されるタイムコードを参照し、タイムアライメント部102から予め設定された設定時間後に出力されると予測されるタイムコードを算出して出力する機能を有している。本実施形態においては、以下に説明するようにして予測を行う。なお、設定時間は、タイムアライメント部102がライブ楽音データを取得してから、データ処理部104が歌詞映像データを出力するまでの処理に必要な時間として設定されている。このようにすると、CPU11によって読み出されたライブ楽音データ、ライブ映像データと、後述するデータ処理部104から出力された歌詞映像データは時間同期したものとすることができる。
図4は、縦軸にはタイムアライメント部102から出力されるタイムコードが表す時刻を表し、横軸には時間軸として、タイムアライメント部102からタイムコードが出力された時点の絶対的な時刻を表した図である。ここで、図中のT0、T1、T2、・・・は、タイムアライメント部102から出力されたタイムコードについて、当該タイムコードが出力された時刻と当該タイムコードが表す時刻をプロットしたものである。以下、タイムコードが出力される時間間隔については「1CK」とし、Tnにおける出力されるタイムコードはTCnとし、Tnが示す座標は(nCK,TCn)と表記する。
また、T’1、T’2、・・・は、タイムアライメント部102からタイムコードが出力されてから、設定時間後(本実施形態においては、2CK後とする)に出力されるとタイムコード予測部105によって予測されたタイムコード(以下、予測タイムコード(時刻情報)という)について、当該予測タイムコードがタイムアライメント部102から出力されるべき時刻と当該予測タイムコードが表す時刻をプロットしたものである。そして、上記同様にT’nが示す座標は(n+2CK,TC’n)と表記する。ここで、TC’nは、時刻n+2CKに出力されると予測されるタイムコードであって、タイムコード予測部105からT’1が出力される時刻がn+2CKであることを意味するものではない。すなわち、タイムコード予測部105は、タイムアライメント部102からの出力から2CK後のタイムコードを予測して出力するから、TC’nが出力されるタイミングは、タイムアライメント部102からTCnが出力されて、TC’nの算出が終了した時点となる。
Tempo(1)は、T0からT1におけるテンポを示すものであり、2点の傾き(TC1−TC0)/1CKに相当している。ここで、図中における破線部分は、Tempoが示す2点の傾きを表す線である。以下、T1からT2におけるテンポはTempo(2)とし、同様にしてTn−1からTnにおけるテンポはTempo(n)という。
タイムコード予測部105は、本実施形態においては、以下の式(1)に基づいて予測を行う。
TC’n = (TC’’n + TC’’’n)/2 ・・・(1)
TC’’n = TC’n−1 + Tempo(n−1)
TC’’’n = TCn + 2×Tempo(n)
すなわち、TC’’nは、TC’n−1において、直前のテンポTempo(n−1)が維持された場合に、次に出力されるべきタイムコードである。また、TC’’’nは、TCnがタイムアライメント部102から出力され、TCnからそのときのテンポTempo(n)で2CK後まで維持された場合に出力されるべきタイムコードである。そして、TC’nは、TC’’nとTC’’’nの平均を取って算出されるものである。ここで、(n+2CK,TC’’n)のプロットはT’’nとし、(n+2CK,TC’’’n)のプロットはTC’’’nとして表記する。なお、タイムコード予測部105から最初に出力されるタイムコード(図4(a)の場合には、TC’1)は、直前に出力されるべきタイムコードが存在しないから、TC’1=TC’’’1とすればよい。
以下、上記式に基づいて、タイムコード予測部105から出力される予測タイムコードについて、図4(a)〜(c)を用いて、順に説明する。図4の各図は、図4(a)の状態において、1CK経過ごとの状態変化を示したものである。まず、図4(a)における状況の説明を行う。図4(a)は、タイムアライメント部102から時刻2CKまでタイムコードが出力された状態の図である。タイムアライメント部102から時刻1CKにTC1(T1に相当)が出力され、タイムコード予測部105からTC’1が出力される。さらに、タイムアライメント部102から時刻2CKにTC2(T2に相当)が出力され、タイムコード予測部105は、2CK後に出力されると予測されるTC’2を算出して出力する。図4(a)においては、テンポの変動が無い(Tempo(1)=Tempo(2))ため、TC’’2=TC’’’2=TC’2となる。
次に、図4(b)においては、図4(a)の状態の後、ライブ演奏がリファレンス演奏に比べ遅れたとき、すなわちTempo(3)がTempo(2)に比べて小さくなったときの状態を示している。タイムアライメント部102から時刻3CKにTC3が出力されると、タイムコード予測部105は、TC’3を算出して出力する。ここで、上述したように、TC’’3は、タイムコード予測部105がTC’2を出力した後に、Tempo(2)が維持された場合に出力されるべきタイムコードであり、TC’’’3は、タイムアライメント部102からTC3を出力した後に、Tempo(3)が2CK後まで維持された場合に出力されるべきタイムコードである。そして、T’3は、TC’’3とTC’’’3を平均したものである。このようにすると、図示のように、TC’3は、ライブ演奏の遅れに追従して、TC’’3に比べて前の時刻を示すようになる。
図4(c)は、図4(b)の状態の後、ライブ演奏のテンポが戻った場合を示している。そして、図4(b)の時と同様にして、タイムアライメント部102から時刻4CKにTC4が出力されると、タイムコード予測部105は、TC’’4とTC’’’4の平均をとることによりTC’4を算出して出力する。そして、タイムアライメント部102からタイムコードTC5、TC6、・・・と順次出力されると、タイムコード予測部105は、当該出力されたタイムコードの2CK後に出力されると予測される予測タイムコードTC’5、TC’6、・・・を順次算出して出力する。以上がタイムコード予測部105の説明である。
図2に戻って、説明を続ける。データ読出部103は、タイムコード予測部105から順次出力される予測タイムコードと、歌詞データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした歌詞データを読み出し、データ処理部104に順次出力していく。そして、データ処理部(映像データ生成手段)104は、データ読出部103から順次出力された歌詞データに基づいて歌詞映像データ(第1の映像データ)を生成し、映像合成部(映像合成手段)106に出力する。ここで、楽曲の歌詞を示すテキストデータとそのテキストの表示タイミングを示すデータを有する歌詞データは、タイムコード予測部105から出力された予測タイムコードを参照して読み出すことによりデータ読出部103から出力されるシーケンスデータであるから、歌詞映像データは、楽曲の歌詞の表示タイミングがライブ演奏の楽曲の進行に追従して表示されるとともに、タイムアライメント部102から設定時間後に出力されると予測されるタイムコードである予測タイムコードによって読み出しているから、CPU11によって読み出されたライブ楽音データ、ライブ映像データと時間同期した映像のデータとして生成される。
映像合成部106は、CPU11によって読み出されたライブ映像データに係るライブ映像に対して、データ処理部104から出力された歌詞映像データに係る歌詞の映像(以下、歌詞映像という)をスーパーインポーズした合成映像データを生成して表示部15へ出力する。ここで、合成映像データは、CPU11によって読み出されたライブ映像データに係るライブ映像に対して、時間同期した歌詞映像、すなわち楽曲の歌詞がライブ演奏の楽曲の進行に追従して表示される映像をスーパーインポーズしたものであり、ライブ映像に楽曲の歌詞映像が合成されることによって、その歌詞映像がライブボーカル、ライブ演奏、ライブ映像に追従した映像の映像データとして生成される。
このようにして、表示部15には合成映像データが出力され、音声出力部18にはライブ楽音データが出力されることにより、本実施形態に係るデータ再生装置を有する映像表示装置1は、もともとのライブ映像に対して時間同期、すなわち楽曲の進行に追従した歌詞映像が合成された映像と楽曲とを再生することができる。
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
<変形例1>
実施形態においては、タイムコード予測部105は、タイムアライメント部102から順次出力されたタイムコードに基づいて、予測タイムコードを算出して出力していた。この際、タイムアライメント部102は、タイムコードを順次出力する代わりに認識した再生位置(対応情報)を順次出力し、タイムコード予測部105は、当該再生位置に基づいて、予測タイムコードを算出して出力してもよい。この場合には、タイムコード予測部105は、予測タイムコードの算出と同様にして設定時間後の再生位置を予測すればよい。そして、当該予測した再生位置に基づいて、予測タイムコードを算出して生成すればよい。なお、タイムアライメント部102は、認識した再生位置に加えて、認識したテンポについても出力してもよい。この場合には、タイムコード予測部105は、再生位置とテンポに基づいて予測タイムコードを算出すればよい。このようにしても、実施形態と同様な効果を得ることができる。
<変形例2>
タイムコード予測部105における予測タイムコードを算出する方法は、実施形態に説明した方法に限られる必要は無く、所定時間後のタイムコードを予測するものであればどのようなものであってもよい。例えば、実施形態における式(1)は、TC’n = (TC’’n + TC’’’n)/2として、TC’’nとTC’’’nの平均値をTC’nとしていたが、TC’n = (α×TC’’n + β×TC’’’n)/(α+β)として、TC’’nとTC’’’nの加重平均をとってもよい。これは、設定時間の長さに応じて、αとβとを適切な値とすればよい。この値を変えることで、予測タイムコードをタイムコードの変化に緩やかに追従させることも、急激に追従させることもできる。
また、タイムコード予測部105は、タイムアライメント部102から出力されたタイムコードにおいて、Tn−1とTnの2点の傾きからTempo(n)を算出していたが、何点かの移動平均をとってもよい。この場合は、例えば、TCn−1をTCn−3からTCn−1までの平均、TCnをTCn−2からTCnまでの平均とみなし、移動平均からTempo(n)を算出すればよい。このようにすれば、Tempo(n)の急激な変化が少なくなり、より自然に変化する予測タイムコードを算出することができる。
さらに、ライブ演奏において、楽曲の一部が省略されるなど、再生位置が大きく変化して、タイムアライメント部102から順次出力されるタイムコードの示す時刻が所定の変化量より大きく変化した場合には、タイムコード予測部105における予測タイムコードの算出を一旦中止し、所定時間経過後に再度予測タイムコードの算出を行なうようにしてもよい。このようにすると、中止せずに算出し続ける場合よりも、予測タイムコードをタイムアライメント部102から出力されるタイムコードと大きく乖離することなく、追従させることができる。所定の変化量、所定時間は、それぞれプログラムに設定されていてもよいし、利用者が操作部16を介して、設定するようにしてもよい。
その他、Tempoのように1次関数によって予測するだけでなく、予め定められたTempoの変化などを考慮した関数(例えば、Tempoが徐々に大きくなっている場合には、今後も大きくなっていくような変化量を考慮するなど)に基づいて予測するようにしてもよく、タイムアライメント部102におけるライブ楽音データとリファレンス楽音データの対応付けの結果に基づいて、所定時間後の対応を予測できるものであればどのような処理を行ってもよい。
<変形例3>
実施形態においては、通信部17がライブ楽音データを受信して、RAM13のライブデータバッファ領域13aにバッファしていたが、ライブ楽音データを用いる代わりに利用者が入力する音声データを用いてもよい。この場合は、図5のように、映像表示装置1に、マイクロフォンなどの収音手段と収音手段によって収音された音から音声データを生成する音声データ生成手段とを有する音声入力部21を具備させればよい。なお、音声入力部21において生成された音声データは、ライブデータバッファ領域13aにバッファされる。なお、音声データは、直接タイムアライメント部102などに出力してもよい。また、入力する音声データに楽曲情報データが含まれていない場合、例えば、マイクロフォンで収音した場合などは、利用者は操作部16を操作して、収音に対応した楽曲情報データを入力すればよい。このようにすると、例えば、利用者が演奏する楽曲に追従して歌詞映像を表示することもできる。
<変形例4>
実施形態においては、入力される情報にライブ映像データが含まれていたが、入力されるデータには映像データが含まれなくてもよい。この場合は、図6に示すように、映像合成部106を用いずに、データ処理部104は、歌詞映像データをそのまま表示部15へ出力するようにすればよい。このように、入力される情報には映像データを含む必要はなく、オーディオデータが含まれていればよいから、例えば、携帯オーディオから出力される音声データ、ラジオ放送など、様々な装置からのデータ入力に対応できる。この場合、通信部17をそれぞれのデータ入力に対応した通信手段とすればよい。
<変形例5>
実施形態においては、リファレンス楽音データと対応する歌詞データは、楽曲の歌詞を示すテキストデータと当該テキストデータの各テキストの表示タイミングを示すデータとを有するシーケンスデータであったが、楽曲の歌詞をリファレンス楽音データと時間同期して再生できるようにしたタイムコードの付された映像データ(第1のデータ)であってもよい。この場合、以下のようにすればよい。データ読出部103は、実施形態に示したように予測タイムコードを参照し、映像データである歌詞データを読み出して、データ処理部104に順次出力する。これにより、データ読出部103から順次出力された歌詞データは、読み出されるときに楽曲の進行に合わせるように時間軸が伸縮されてデータ処理部104に出力される。そして、データ処理部104は、この時間軸が伸縮された歌詞データを歌詞映像データ(第1の映像データ)として生成して出力する。このようにすれば、歌詞データが映像データであっても、本発明の効果を奏することができる。なお、映像データについては、歌詞データに限らず、楽曲の楽譜など、入力されたオーディオデータ(実施形態においてはライブ楽音データ)の楽曲の進行に合わせて表示させたい映像のデータなら、どのような映像データでもよい。
<変形例6>
実施形態においては、楽曲の進行に合わせて歌詞を表示させるようにしていたが、これに加えて、外部の他の装置を楽曲の進行に合わせて制御するようにしてもよい。この場合は、以下のような構成とすればよい。図7に示すように、例えば、AUX(Auxiliary)端子などの制御信号出力部19を設け、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データは、リファレンス楽音データ、歌詞データに加え、制御信号データ(第2のデータ)を有するようにする。ここで、制御信号データは、AUX端子に接続される外部の装置を制御する信号とその制御のタイミングを示すデータを有するシーケンスデータであって、歌詞データと同様にリファレンス楽音データと時間同期して外部の装置を制御できるようにタイムコード(同期情報)が付されている。
そして、図8に示すように、実施形態における楽曲データ選択部101の動作に加えて、楽曲データ記憶領域14aに記憶されている制御信号データを読み出す。そして、制御信号データをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムコード予測部105から順次出力される予測タイムコードと、制御信号データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした制御信号データを読み出し、制御信号出力部19に順次出力していく。このようにすると、データ再生装置を有する映像表示装置1は、制御信号出力部に接続される外部の装置が、楽曲の進行にあわせて出力される制御信号に基づいて制御されるため、楽曲の進行に追従して外部の装置を動作させることができる。なお、外部の装置には、照明、音響機器、ロボットなど、制御信号によって制御できるものであれば、どのようなものにも適用できる。この場合は、制御信号データは、制御したい装置にあわせたデータとしておけばよい。さらに、複数の外部の装置を同時に制御したい場合には、複数の制御信号データを用意しておき、制御信号出力部19に複数の装置を接続できるようにしておけばよい。この接続は、有線接続であってもよいし、無線接続であってもよく、信号が伝達できるものであればよい。
<変形例7>
実施形態においては、楽曲の進行に合わせて歌詞を表示させるようにしていたが、これに加えて、ライブ演奏に別の楽音を楽曲の進行に合わせて再生するようにしてもよい。この場合は、以下のような構成とすればよい。図9に示すように、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データは、リファレンス楽音データ、歌詞データに加え、MIDIデータ(第2のデータ)を有するようにする。ここで、MIDIデータには、歌詞データと同様に、リファレンス楽音データと時間同期して再生できるように時刻情報(同期情報)が付されている。
そして、図10に示すように、楽曲データ選択部101は、実施形態における動作に加えて、楽曲データ記憶領域14aに記憶されているMIDIデータを読み出す。そして、MIDIデータをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムコード予測部105から順次出力される予測タイムコードと、MIDIデータに付された時間情報とを対応させるようにして、楽曲データ選択部101がRAM13にバッファしたMIDIデータを読み出し、再生部(音源部)107に順次出力する。ここで、時刻情報がタイムコードである場合には、そのまま対応させればよいが、デュレーションなどタイムコード以外の相対時刻を表す情報である場合には、CPU11はリファレンス楽音データと時刻同期して再生できるように設定されるテンポなどを参照してタイムコードを生成して対応させればよい。これにより、データ読出部103から順次出力されたMIDIデータは、読み出されるときに楽曲の進行に合わせるように読み出され再生部107に出力される。そして、再生部107は、このMIDIデータを再生してオーディオデータであるMIDI楽音データを生成し、音声合成部108へ出力する。一方、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データも音声合成部108へ出力される。そして、音声合成部108は、ライブ楽音データに係るライブ演奏とMIDI楽音データに係るMIDI演奏とをミキシングした音を合成楽音データとして生成し、音声出力部18へ出力する。なお、ライブ楽音データとMIDI楽音データとをミキシングせずに別々に音声出力部18に出力するようにしてもよい。この場合は、それぞれのデータについて音声出力部18においてミキシングしてもよいし、ミキシングせず異なる放音手段から放音するようにしてもよい。ここで、再生部107は、MIDIデータを再生することができる音源部を有することによって、MIDI楽音データを生成することができる。なお、音源部によって生成されるオーディオデータの楽音の発音内容を示すシーケンスデータであれば、必ずしもMIDIデータでなくてもよい。
また、楽曲データ記憶領域14aに記憶されているリファレンス楽曲データのMIDIデータに代えて、リファレンス楽音データと時間同期して再生できるようにタイムコード(同期情報)の付されたオーディオデータである追加楽音データ(第2のデータ)としてもよい。この場合は、以下のように処理される。まず、楽曲データ選択部101は、楽曲データ記憶領域14aに記憶されている追加楽音データを読み出す。そして、追加楽音データをデータ読出部103に読み出されるまでRAM13にバッファしておく。データ読出部103は、歌詞データを読み出すときと同様に、タイムコード予測部105から順次出力される予測タイムコードと、追加楽音データに付されたタイムコードとを対応させるようにして、楽曲データ選択部101がRAM13にバッファした追加楽音データを読み出し、再生部107に順次出力する。これにより、データ読出部103から順次出力された追加楽音データは、読み出されるときに楽曲の進行に合わせるように時間軸が伸縮されて再生部107に出力される。そして、再生部107は、この時間軸が伸縮された追加楽音データを新たなオーディオデータとして、音声合成部108へ出力する。その後はMIDIデータの場合と同様に処理すればよい。このようにすれば、映像だけでなく様々な音についても、楽曲の進行にあわせて出力することができる。
<変形例8>
変形例3においては、音声入力部21によって、利用者が演奏する楽曲に合わせて歌詞映像を表示することができたが、さらに楽曲の演奏を再生することにより、カラオケ装置のようにして用いることもできる。この場合には、以下のような構成とすればよい。まず、図11に示すように、記憶部14の楽曲データ記憶領域14aに記憶されているリファレンス楽音データを楽曲のパートごとに録音したトラック(本変形例においては、ボーカルトラック、ギタートラック、ピアノトラック、ベーストラック、ドラムトラック)を有するオーディオデータとする。また、利用者は、操作部(トラック選択手段)16を操作して、演奏するトラック(本変形例においてはボーカル)を選択する。
そして、図12に示すソフトウエアの構成において、楽曲データ選択部101は、読み出したリファレンス楽音データについて、タイムアライメント部102へ出力するとともに、データ読出部103に読み出されるまでRAM13に歌詞データとともにバッファしておく。タイムアライメント部102は、操作部16を操作して選択されたボーカルトラックと、音声入力部21によって収音されて生成した音声データ(以下、本変形例においては、当該音声データをライブ楽音データという)とを比較する。一方、データ読出部103は、実施形態における歌詞データを読み出す場合と同様にして予測タイムコードに基づいてリファレンス楽音データを読み出し、当該リファレンス楽音データを再生部107へ順次出力する。これにより、データ読出部103から順次出力されたリファレンス楽音データは、読み出されるときに利用者によるボーカルの進行に追従するように時間軸が伸縮されて再生部107に出力される。そして、再生部107は、この時間軸が伸縮されたリファレンス楽音データを再生楽音データとして、音声合成部108へ出力する。以下、音声合成部108の構成について、図13を用いて説明する。
音声合成部108は、リファレンストラック選択部1082、およびトラック合成部1083を有する。リファレンストラック選択部1082は、入力された再生楽音データのうち、操作部16の操作によって選択されたボーカルトラック以外のトラックを有する再生楽音データをトラック合成部1083に出力する。
トラック合成部1083は、CPU11によってライブデータバッファ領域13aから読み出されたライブ楽音データと、リファレンストラック選択部1082から出力されたボーカルトラック以外のトラックを有する再生楽音データをミキシングして、合成楽音データを音声出力部18へ出力する。このようにして生成された合成楽音データを音声出力部18から放音すると、利用者のボーカルの進行にあわせて時間伸縮されたボーカル以外のリファレンス演奏が放音されるから、ボーカルの進行に追従して演奏が時間同期するカラオケ装置のようにすることもできる。なお、リファレンストラック選択部1082の処理は必ずしも音声合成部108において行なわれなくてもよい。この場合は、リファレンストラック選択部1082の処理は、リファレンス楽音データが楽曲データ記憶領域14aから読み出されてから音声出力部18において放音されるまでのどのタイミングでもよい。また、必ずしもボーカルトラックを除外しなくてもよいし、除外する代わりに音量を低減する処理を行なってもよい。さらに、リファレンス楽音データに代えて、またはリファレンス楽音データとともに、変形例7のようにMIDIデータを用いても同様な効果を得ることができる。
<変形例9>
変形例3、変形例8においては、楽曲情報データは操作部16を操作して利用者によって入力されていたが、音声入力部21によって収音されて生成した音声データ(以下、本変形例においては、当該音声データをライブ楽音データという)に基づいて、楽曲情報データを生成してもよい。この場合は、図14に示すように楽曲検索部100を設ければよい。ここで、楽曲検索部100は、入力されたライブ楽音データの一部と楽曲データ記憶領域14aに記憶されているリファレンス楽音データの一部(トラック単位でもよい)とを比較して、対応する楽曲を特定し、特定した楽曲の楽曲情報データを出力すればよい。このようにすれば、利用者が自ら楽曲を指定することなく、楽曲情報データを生成して楽曲を特定することができる。なお、これは変形例3、8に限らず実施形態、他の変形例において、楽曲情報データが提供されなかった場合においても適用することができる。
<変形例10>
実施形態においては、通信部17は、有線、無線などによって、データを受信するチューナなどの通信手段であって、ライブ映像データ、ライブ楽音データ、楽曲情報データを受信していたが、図1に破線で示したように、データ入力部20を設けて、これらのデータがデータ入力部20から入力されるようにしてもよい。例えば、これらのデータが、DVD(Digital Versatile Disc)などの記録メディアに記録されたデータであれば、データ入力部は、DVDに記録されたデータを読み取れる光学ドライブであればよい。このようにしても、実施形態と同様な効果を得ることができる。
<変形例11>
実施形態においては、タイムアライメント部102は、楽曲の進行のずれを検出する機能について、DPマッチングを用いていたが、異なった手法によって楽曲の進行のずれを検出するようにしてもよい。例えば、HMM(Hidden Markov Model:隠れマルコフモデル)を用いてもよいし、比較対象である各データから波形の特徴量(音程、音量など)を抽出して比較するようにしてもよい。すなわち、各データの比較をして、各データ間の類似する部分を対応させることができる手法であればどのような手法でもよい。このようにしても、実施形態と同様な効果を得ることができる。
実施形態に係る映像表示装置のハードウエアの構成を示すブロック図である。 実施形態に係る映像表示装置のソフトウエアの構成を示すブロック図である。 DPマッチングを行う際のDPプレーンを示す説明図である。 タイムコード予測部における処理の説明図である。 変形例3に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例4に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例6に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例6に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例7に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例7に係る映像表示装置のソフトウエアの構成を示すブロック図である。 変形例8に係る映像表示装置のハードウエアの構成を示すブロック図である。 変形例8に係る映像表示装置のソフトウエアの構成を示すブロック図である。 音声合成部のソフトウエアの構成を示すブロック図である。 変形例9に係る映像表示装置のソフトウエアの構成を示すブロック図である。
符号の説明
1…映像表示装置、10…バス、11…CPU、12…ROM、13…RAM、13a…ライブデータバッファ領域、14…記憶部、14a…楽曲データ記憶領域、15…表示部、16…操作部、17…通信部、18…音声出力部、19…制御信号出力部、20…データ入力部、21…音声入力部、100…楽曲検索部、101…楽曲データ選択部、102…タイムアライメント部、103…データ読出部、104…データ処理部、105…タイムコード予測部、106…映像合成部、107…再生部、108…音声合成部、1082…リファレンストラック選択部、1083…トラック合成部

Claims (12)

  1. 音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶する記憶手段と、
    外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント手段と、
    前記タイムアライメント手段によって順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント手段が生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測手段と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータを読み出すデータ読出手段と、
    前記データ読出手段によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成手段と
    を具備することを特徴とするデータ再生装置。
  2. 音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶する記憶手段と、
    外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント手段と、
    前記タイムアライメント手段によって順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント手段が生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測手段と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータと前記第2のデータとを読み出すデータ読出手段と、
    前記データ読出手段によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成手段と
    を具備することを特徴とするデータ再生装置。
  3. 前記データ読出手段によって読み出された第2のデータに基づいてオーディオデータを生成する音源部をさらに具備し、
    前記第2のデータは、前記音源部によって生成されるオーディオデータに係る楽音の発音内容を示すシーケンスデータである
    ことを特徴とする請求項2に記載のデータ再生装置。
  4. 前記記憶手段に記憶される第1のオーディオデータは、複数のトラックを有し、
    前記データ読出手段は、さらに前記時刻情報と前記第1のオーディオデータのデータ各部に規定された時刻の対応関係に基づいて、前記記憶手段から前記第1のオーディオデータを読み出す
    ことを特徴とする請求項1乃至請求項3のいずれかに記載のデータ再生装置。
  5. 操作によって利用者の指示を入力する操作手段と、
    前記操作手段の操作に基づいて前記第1のオーディオデータの各トラックのうち、一部のトラックを選択するトラック選択手段と、
    前記データ読出手段によって読み出された第1のオーディオデータは、前記トラック選択手段によって選択されたトラック以外のデータである
    ことを特徴とする請求項4に記載のデータ再生装置。
  6. 操作によって利用者の指示を入力する操作手段と、
    前記操作手段の操作に基づいて前記第1のオーディオデータの各トラックのうち、一部のトラックを選択するトラック選択手段と、
    前記タイムアライメント手段は、前記取得した第2のオーディオデータの各部と、前記第1のオーディオデータのうち前記トラック選択手段によって選択されたトラックの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成する
    ことを特徴とする請求項4または請求項5に記載のデータ再生装置。
  7. 前記予め設定された設定時間は、前記タイムアライメント手段に第2のオーディオデータが取得されてから前記映像データ生成手段によって第1の映像データを生成するまでの時間として設定されている
    ことを特徴とする請求項1乃至請求項6のいずれかに記載のデータ再生装置。
  8. 複数の映像データが入力され、前記複数の映像データのうち一の映像データに係る映像に対して、他の映像データに係る映像をスーパーインポーズする映像合成手段をさらに具備し、
    前記映像合成手段は、外部から供給され、前記第2のオーディオデータと時間同期がとられた第2の映像データに係る映像に対して、前記映像データ生成手段によって生成された第1の映像データに係る映像をスーパーインポーズする
    ことを特徴とする請求項1乃至請求項7のいずれかに記載のデータ再生装置。
  9. 外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と記憶手段に記憶された音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント過程と、
    前記タイムアライメント過程において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント過程おいて生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測過程と、
    前記第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶する前記記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記第1のデータを読み出すデータ読出過程と、
    前記データ読出過程において読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成過程と
    を備えることを特徴とするデータ再生方法。
  10. 外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と記憶手段に記憶された音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント過程と、
    前記タイムアライメント過程において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント過程において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測過程と、
    前記第1のオーディオデータを記憶するとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶する前記記憶手段から、前記時刻情報と前記同期情報の対応関係に基づいて、前記第1のデータと前記第2のデータとを読み出すデータ読出過程と、
    前記データ読出過程において読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成過程と
    を備えることを特徴とするデータ再生方法。
  11. 記憶手段を有するコンピュータに、
    前記記憶手段に音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶させるとともに、データ各部についての時刻を規定する同期情報を有した第1のデータを記憶させる記憶機能と、
    外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント機能と、
    前記タイムアライメント機能において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント機能において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測機能と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータを読み出すデータ読出機能と、
    前記データ読出機能によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成機能と
    を実現させるためのプログラム。
  12. 記憶手段を有するコンピュータに、
    前記記憶手段に音声の波形を示しデータ各部に時刻が規定された第1のオーディオデータを記憶させるとともに、データ各部についての時刻を規定する同期情報を有した第1のデータおよび第2のデータを記憶させる記憶機能と、
    外部から供給される音声の波形を示す第2のオーディオデータの各部を順次取得し、当該取得した第2のオーディオデータの各部と前記第1のオーディオデータの各部とを比較することによりデータ各部を対応付けて、当該取得した第2のオーディオデータの各部に対応する前記第1のオーディオデータに規定された時刻に応じた対応情報を順次生成するタイムアライメント機能と、
    前記タイムアライメント機能において順次生成された対応情報の変化に基づいて、予め定められた設定時間後に前記タイムアライメント機能において生成すると予測される対応情報を算出し、算出した対応情報を時刻情報として生成する予測機能と、
    前記時刻情報と前記同期情報の対応関係に基づいて、前記記憶手段から前記第1のデータと前記第2のデータとを読み出すデータ読出機能と、
    前記データ読出機能によって読み出された第1のデータに基づいて第1の映像データを生成する映像データ生成機能と
    を実現させるためのプログラム。
JP2007031064A 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム Expired - Fee Related JP4458096B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007031064A JP4458096B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007031064A JP4458096B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008197270A JP2008197270A (ja) 2008-08-28
JP4458096B2 true JP4458096B2 (ja) 2010-04-28

Family

ID=39756290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007031064A Expired - Fee Related JP4458096B2 (ja) 2007-02-09 2007-02-09 データ再生装置、データ再生方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4458096B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5098932B2 (ja) * 2008-09-30 2012-12-12 株式会社Jvcケンウッド 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム
JP5672960B2 (ja) * 2010-10-28 2015-02-18 ヤマハ株式会社 音響処理装置
EP2485213A1 (en) * 2011-02-03 2012-08-08 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Semantic audio track mixer
JP2015179116A (ja) * 2014-03-18 2015-10-08 株式会社エクシング サーバ装置、カラオケ用通信端末装置、プログラム及びデータ提供方法
EP3869495B1 (en) * 2020-02-20 2022-09-14 Antescofo Improved synchronization of a pre-recorded music accompaniment on a user's music playing

Also Published As

Publication number Publication date
JP2008197270A (ja) 2008-08-28

Similar Documents

Publication Publication Date Title
JP4124247B2 (ja) 楽曲練習支援装置、制御方法及びプログラム
JP5151245B2 (ja) データ再生装置、データ再生方法およびプログラム
JP4458096B2 (ja) データ再生装置、データ再生方法およびプログラム
JP2004205817A (ja) カラオケ装置
JP4595947B2 (ja) データ再生装置、データ再生方法およびプログラム
JP5012263B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP4595948B2 (ja) データ再生装置、データ再生方法およびプログラム
JP2008145977A (ja) コンテンツ再生装置
JP5092589B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2009169103A (ja) 練習支援装置
JP4470947B2 (ja) データ再生装置、データ再生方法およびプログラム
JP4506750B2 (ja) コンテンツ再生装置
JP4561735B2 (ja) コンテンツ再生装置およびコンテンツ同期再生システム
JP2008197272A (ja) データ再生装置、データ再生方法およびプログラム
JP5672960B2 (ja) 音響処理装置
JP4506748B2 (ja) コンテンツ再生装置
JP2008244888A (ja) 通信装置、通信方法およびプログラム
JP4539647B2 (ja) コンテンツ再生装置
JP4182898B2 (ja) カラオケ装置
JP5012269B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP4967747B2 (ja) 通信装置、通信方法およびプログラム
JP2009244790A (ja) 歌唱指導機能を備えるカラオケシステム
JP4506749B2 (ja) コンテンツ再生装置
JP4561736B2 (ja) コンテンツ再生装置
JP2008244890A (ja) 通信装置、通信方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100119

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100201

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140219

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees