JP2005250242A - 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体 - Google Patents

情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2005250242A
JP2005250242A JP2004062324A JP2004062324A JP2005250242A JP 2005250242 A JP2005250242 A JP 2005250242A JP 2004062324 A JP2004062324 A JP 2004062324A JP 2004062324 A JP2004062324 A JP 2004062324A JP 2005250242 A JP2005250242 A JP 2005250242A
Authority
JP
Japan
Prior art keywords
information
lyrics
data
management
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004062324A
Other languages
English (en)
Inventor
Tsuyoshi Sato
強司 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2004062324A priority Critical patent/JP2005250242A/ja
Publication of JP2005250242A publication Critical patent/JP2005250242A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 ボーカル音の情報を歌詞情報として提示する情報処理装置を提供する。
【解決手段】 オーディオ情報Dau中のボーカル情報を音声認識して歌詞情報Dsongを生成する音声認識処理部2と、歌詞情報Dsongとボーカル情報とを関連付ける管理情報IFO#iを生成する情報管理部3と、オーディオ情報Dauと歌詞情報Dsong及び管理情報IFO#iを記憶する記憶部4と、記憶部4に記憶された歌詞情報Dxsongを視認可能な歌詞としてディスプレイ等に表示させる歌詞情報再生部5と、記憶部4に記憶されたオーディオ情報Dyauを受聴可能な音としてスピーカ等から出力させるオーディオ情報再生部6を備えて構成する。ユーザ等が所定の指示をすると、音声認識処理部2及び情報管理部3が生成する歌詞情報Dsong及び管理情報IFO#iとオーディオ情報Dauとを記憶部4が記憶し、また、歌詞情報再生部5とオーディオ情報再生部6が管理情報IFO#iに基づいて記憶部4に記憶されているオーディオ情報Dauと歌詞情報Dsongを再生して歌詞と音楽等を視聴可能に提示する。
【選択図】 図1

Description

本発明は、例えば音楽等のオーディオ情報に含まれているボーカル情報を音声認識し、その認識結果を文字等からなる歌詞情報として記憶、提示等を行う情報処理装置と情報処理方法に関するものである。
近年、文字情報や、音楽等のオーディオ情報等をデジタルデータに変換したデジタルコンテンツとして情報処理することで、情報のマルチメディア化が促進され、ユーザ等の利便性の向上が図られるようになってきた。
例えば、特開2002−244670号公報に開示されているゲーム機器等のコンピュータを備えた装置にあっては、音声データと、歌手の歌っている歌詞に係る歌詞データとが記録された記録媒体から音声データと歌詞データを再生し、音声データに基づいてスピーカ等から音楽を出力させつつ、歌詞データに基づいて音楽内のボーカル音(歌手の歌声)に合わせて歌詞をディスプレイ等に表示することにより、ユーザ等が歌詞を見ながら音楽に合わせて、いわゆるカラオケを楽しむことが可能となっている。
また、特開2003−228375号公報に開示されている音楽データ送受信システムでは、インターネット等の伝送メディアを通じて送信されてくる音楽データと文字情報(テキストデータ)とを受信し、文字情報(テキストデータ)を音楽データに合わせて再生しディスプレイ等に表示することにより、カラオケ等を行うことができるようになっている。
特開2002−244670号公報 特開2003−228375号公報
ところで、上記特開2002−244670号公報に開示されているゲーム機器等のコンピュータを備えた装置では、記録媒体に予め記録されている音声データと歌詞データとを再生することにより、歌詞を音楽に合わせてディスプレイ等に表示するため、音楽データは記録されているが歌詞データが記録されていない音楽CDや音楽DVD等の記録媒体を情報再生しても、歌詞を表示することができないという課題がある。
また、上記特開2003−228375号公報に開示されている音楽データ送受信システムでは、音楽データと文字情報(テキストデータ)とを受信し、文字情報(テキストデータ)を音楽データに合わせて再生することにより、歌詞を音楽に合わせてディスプレイ等に表示するため、文字情報(テキストデータ)を有しない音楽データが配信されてくる場合には、歌詞を表示することができないという課題がある。
また、カラオケを楽しもうとするユーザ等に限らず、再生中の音楽から歌手の歌っている歌詞を知りたいと欲するユーザ等や、気に入った歌詞に対応する音楽を聴きたいと欲するユーザ等が存在しており、こうしたユーザ等の要求に応え得る情報処理装置等の開発が望まれている。
本発明は、このような課題に鑑みてなされたものであり、例えばオーディオ情報に含まれているボーカル音の情報を音声認識し、その認識結果を文字等からなる歌詞情報として記憶、提示等を行うことにより、ユーザビリティの向上等を実現し得る情報処理装置と情報処理方法を提供することを目的とするものである。
本発明は、このような課題に鑑みてなされたものであり、例えばオーディオ情報に含まれているボーカル音の情報を音声認識し、その認識結果を文字等からなる歌詞情報として提示等を行うことにより、ユーザビリティの向上等を実現し得る情報処理装置と情報処理方法を提供することを目的とするものである。
請求項1に記載の発明に係る情報処理装置は、信号源から供給されるオーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成する音声認識処理手段と、前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成する情報管理手段と、前記オーディオ情報、前記ボーカル情報、前記歌詞情報、及び前記管理情報を記憶する記憶手段と、を備えることを特徴とする。
請求項9に記載の発明に係る情報処理方法は、信号源から供給されるオーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成する音声認識処理工程と、前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成する情報管理工程と、前記オーディオ情報、前記歌詞情報、及び前記管理情報を記憶する記憶工程と、を備えることを特徴とする。
請求項10に記載の発明に係る情報処理用プログラムは、信号源から供給されるオーディオ情報の処理をコンピュータに行わせる情報処理用プログラムであって、
前記オーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成させる音声認識処理ステップと、前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成させる情報管理ステップと、前記オーディオ情報、前記歌詞情報、及び前記管理情報を記憶させる記憶ステップと、を備えることを特徴とする。
請求項11に記載の発明に係る記録媒体は、請求項10に記載の情報処理用プログラムを記録していることを特徴とする。
本発明の実施の形態に係る情報処理装置を図1を参照して説明する。図1(a)は、本実施形態の情報処理装置の構成を表したブロック図、図1(b)は、本情報処理装置に設けられている記憶部に記憶されるデータの構成を模式的に表した図である。
図1(a)において、この情報処理装置1は、音声認識処理部2、情報管理部3、記憶部4、歌詞情報再生部5、オーディオ情報再生部6及び制御部7を備えて構成されており、信号源8から出力される所定のサンプリングレートに従ってデジタル変換されたデジタルデータ列から成るオーディオ信号(以下「デジタルオーディオデータ」という)Dauを入力し、デジタルオーディオデータDauに含まれているボーカル音の信号成分(以下「ボーカル音のデータ列」という)を音声認識することにより、文字等からなる歌詞データDsongを生成する等の信号処理を行う。
信号源8は、上述した所定のサンプリングレートを有するデジタルオーディオデータDauを出力する電子回路や装置であり、デジタルオーディオデータDauを出力する電子回路や装置であれば何でもよい。
例えば、CD(Compact Disc)やDVD(Digital Versatile Disc)等の記録媒体(以下「ストレージ媒体」という)に記録されているオーディオ情報を再生してデジタルオーディオデータDauを出力する再生プレーヤや、インターネット等の伝送メディアを通じて配信されてくるオーディオ情報を受信してデジタルオーディオデータDauを出力する受信機等が信号源8に該当する。
音声認識処理部2は、デジタルオーディオデータDauに含まれているボーカル音のデータ列を抽出し、その抽出したデータ列について音声認識処理を行うことにより、歌詞データDsongを生成して出力する。
例えば、図1(b)に模式的に示すようなボーカル音のデータ列を有するデジタルオーディオデータDauが信号源8から供給され、そのボーカル音が「あの町」というデータ列と、「この町」というデータ列と、「日が暮れる」というデータ列を含んでいた場合、音声認識処理部2は、「あの町」というボーカル音のデータ列を音声認識処理することにより、「あの町」という文字列からなる歌詞データDsongを生成し、また、「この町」というボーカル音のデータ列を音声認識処理することにより、「この町」という文字列からなる歌詞データDsongを生成し、また、「日が暮れる」というボーカル音のデータ列を音声認識処理することにより、「日が暮れる」という文字列からなる歌詞データDsongを生成して、生成順(時間経過順)に出力する。
情報管理部3は、デジタルオーディオデータDauと歌詞データDsongを入力し、歌詞データDsongとデジタルオーディオデータDau中のボーカル音のデータ列とを、管理データIFO#iに基づいて関連付けを行い、歌詞データDsongとデジタルオーディオデータDau及び管理データIFO#iを記憶部4に時間経過順に記憶させる。
例えば、図1(b)に模式的に示すように、音声認識処理部2から、「あの町」と「この町」と「日が暮れる」という各歌詞データDsongが出力された場合、情報管理部3は、これらの各歌詞データDsongに対応するボーカル音のデータ列の開始時点又は時間範囲を特定し、それら時間情報を有する管理データIFO#1,IFO#2,IFO#3に基づいて、各歌詞データDsongとボーカル音のデータ列との関連付けを行い、歌詞データDsongとデジタルオーディオデータDau及び管理データIFO#iを記憶部4に記憶させる。
より詳細に述べれば、例えば図1(b)に示すデジタルオーディオデータDauが時点t1から時点tnまでの時間範囲を有する楽曲タイトルを形成しており、ボーカル音「あの町」のデータ列が時点t1から時点t2までの時間範囲、ボーカル音「この町」のデータ列が時点t3から時点t4までの時間範囲、ボーカル音「日が暮れる」のデータ列が時点t5から時点t6までの時間範囲であったとする。
この場合、情報管理部3は、ボーカル音「あの町」のデータ列の開始時点t1又は時間範囲t1〜t2を示す時間情報を有する管理データIFO#1によって、歌詞データ「あの町」とボーカル音「あの町」のデータ列との関連付けを行い、また、ボーカル音「この町」のデータ列の開始時点t3又は時間範囲t3〜t4を示す時間情報を有する管理データIFO#2によって、歌詞データ「この町」とボーカル音「この町」のデータ列との関連付けを行い、また、ボーカル音「日が暮れる」のデータ列の開始時点t5又は時間範囲t5〜t6を示す時間情報を有する管理データIFO#3によって、歌詞データ「日が暮れる」とボーカル音「日が暮れる」のデータ列との関連付けを行う。
そして、情報管理部3は、時点t1から時点tnまでの全時間範囲のデジタルオーディオデータDauによって構成されている楽曲タイトルに属するデータ群として、管理データIFO#1,IFO#2,IFO#3,…と、各歌詞データDsongと、デジタルオーディオデータDauとを時間経過に従って順次に記憶部4に記憶させていく。
また、制御部7には、各楽曲タイトルのデジタルオーディオデータDauの開始時点から終了時点までの経過時間を計測するためのタイムベースが内蔵されており、情報管理部3が該タイムベースによって計時される時間情報を利用して、上述の時間情報を有する管理データIFO#iを作成するようになっている。
記憶部4は、上述したように、情報管理部4から供給される管理データIFO#iと歌詞データDsongとデジタルオーディオデータDauとを楽曲タイトル毎に記憶する。更に、記憶部4は、既に記憶した管理データIFO#iと歌詞データDsongとデジタルオーディオデータDauを、後述の制御部7からの指令に従って出力する。
歌詞情報再生部5は、制御部7の制御の下で、記憶部4に記憶されている歌詞データが供給される。そして、その供給される歌詞データ(以下、記憶部4から出力される歌詞データを符号Dxsongで表す)をビデオ信号に変換して出力することにより、例えばディスプレイ等に歌詞を視認可能に表示させる。
オーディオ情報再生部6は、制御部7の制御の下で、記憶部4に記憶されているデジタルオーディオデータが供給される。そして、その供給されるデジタルオーディオデータ(以下、記憶部4から出力されるデジタルオーディオデータを符号Dyauで表す)を、所定のサンプリングレートに従ってアナログのオーディオ信号に変換して出力することにより、例えばスピーカ等によって音を再生させる。
制御部7は、演算及び制御機能を有するマイクロプロセッサ(MPU)等を有し、図示していない操作部を介してユーザ等からの指令を受けると、該指令に従って、本信号処理装置1全体の動作を集中制御する。
更に、制御部7は、次に述べる代表的な制御機能を有している。
〈第1の制御機能〉
ユーザ等が上述の操作部を操作して、「記録開始」の指令を行うと、制御部7は、信号源8にデジタルオーディオデータDauを出力させる。
すなわち、信号源8がCDやDVD等のストレージ媒体を情報再生する再生プレーヤである場合、それらのストレージ媒体に記録されているオーディオ情報の読み取り及び再生を開始させることにより、デジタルオーディオデータDauを出力させる。
また、信号源8がインターネット等から配信されてくるオーディオ情報を受信する受信機等であれば、受信を開始させることによりデジタルオーディオデータDauを出力させる。
そして、音声認識処理部2に、デジタルオーディオデータDauに含まれているボーカル音のデータ列に基づいて音声認識処理を行わせることで、歌詞データDsongを生成させると共に、情報管理部3に、歌詞データDsongと音声認識が行われた上述のボーカル音のデータ列とを関連付けて管理するための管理データIFO#iを生成させ、記憶部4にそれら管理データIFO#iと歌詞データDsongとデジタルオーディオデータDauを記憶させる。
かかる機能により、ユーザ等は、歌詞データを有していないデジタルオーディオデータDauから歌詞データDsongを生成させ、デジタルオーディオデータDau及び管理データIFO#iと共に、記憶部4に記憶させることが可能となっている。
〈第2の制御機能〉
ユーザ等が操作部を操作して、記憶部4に既に記憶されている所望の楽曲タイトルの歌詞データDxsongを再生(以下「歌詞再生」という)すべき旨の指令を行うと、制御部7は、その指令された楽曲タイトルの歌詞データDxsongを管理データIFO#iに基づいて検索し、記憶部4から歌詞データDxsongを出力させると共に歌詞情報再生部5に供給させ、歌詞情報再生部5にその歌詞データDxsongに基づくビデオ信号Sxoutを生成させて出力させる。
かかる機能により、歌詞情報再生部5がビデオ信号Sxoutをディスプレイ等に供給することで、ユーザ等の所望する楽曲タイトルの全ての歌詞をディスプレイ等に表示させることが可能となっている。
〈第3の制御機能〉
ユーザ等が上述の操作部を操作することにより、記憶部4に既に記憶されている所望の楽曲タイトルを指定し、更に所望の再生速度を指定して、該楽曲タイトルのデジタルオーディオデータDyauを再生(以下「オーディオ再生」という)すべき旨の指令をすると、制御部7は、その指令された楽曲タイトルのデジタルオーディオデータDyauを管理データIFO#iに基づいて検索し、記憶部4から出力させてオーディオ情報再生部6に供給させる。そして、オーディオ情報再生部6にユーザ等から指令された再生速度に従って、デジタルオーディオデータDyauに基づくオーディオ信号Syoutを生成させて出力させる。
かかる機能により、オーディオ情報再生部6がオーディオ信号Syoutをスピーカ等に供給することで、ユーザ等の指令した再生速度に相当する音調で、楽曲タイトルの音楽等を鳴動させる。
また、ユーザ等が上述の「歌詞再生」と「オーディオ再生」を適宜の順序で指令することが可能となっている。すなわち、ユーザ等が上述の「歌詞再生」と「オーディオ再生」を適宜の順序で指令すると、制御部7は、指令された適宜の順序で上述の〈第2の制御機能〉と〈第3の制御機能〉を起動し、指令された楽曲タイトルの歌詞データDxsongとデジタルオーディオデータDyauを記憶部4から出力させて歌詞情報再生部5とオーディオ情報再生部6に夫々供給させ、歌詞データDxsongに基づくビデオ信号SxoutとデジタルオーディオデータDyauに基づくオーディオ信号Syoutを生成させて出力させ、ディスプレイ等に歌詞を表示させつつ、スピーカ等にユーザ等の指令した再生速度に相当する音調で楽曲タイトルの音楽等を鳴動させる。
したがって、ユーザ等は「歌詞再生」のみ又は「オーディオ再生」のみの指令を行うことができる他、「歌詞再生」と「オーディオ再生」との両者を併せて指令し、楽曲タイトルの音楽等を聴きながら歌詞を観ることが可能となっている。
また、ユーザ等が人間の聴覚特性に相当する再生速度、別言すれば、CDプレーヤやDVDプレーヤ等で規格化されている1倍速の再生速度を指令して「歌詞再生」と「オーディオ再生」とを指令すると、歌詞を観ながら楽曲タイトルの音楽等を本来の音調で再生させることができる。また、ユーザ等が1倍速より遅い再生速度又は1倍速より速い再生速度速を指令すれば、歌詞を観ながら楽曲タイトルの音楽等を本来の音調より遅い又は速い音調で再生させることが可能となっている。
〈第4の制御機能〉
ユーザ等が上述の操作部を操作することにより、記憶部4に既に記憶されている所望の楽曲タイトルを指定し、該楽曲タイトルのデジタルオーディオデータDyauに含まれているボーカル音のデータと、該ボーカル音のデータに対応する歌詞データとを同期させて再生(以下「同期再生」という)をするための指令をすると、制御部7は、その指令された楽曲タイトルの歌詞データDxsongとデジタルオーディオデータDyauを管理データIFO#iに基づいて検索し、記憶部4からその歌詞データDxsongとデジタルオーディオデータDyauを出力させて歌詞情報再生部5とオーディオ情報再生部6に夫々供給させ、歌詞データDxsongに基づくビデオ信号SxoutとデジタルオーディオデータDyauに基づくオーディオ信号Syoutを生成させて出力させ、ディスプレイ等に歌詞を表示させつつ、スピーカ等によって楽曲タイトルの音楽等を鳴動させる。
ここで、「同期再生」が指令されると、制御部7の制御に従ってオーディオ情報再生部6がデジタルオーディオデータDyauを1倍速の再生速度で再生処理を行うことによってオーディオ信号Syoutを生成し、歌詞情報再生部5が管理データIFO#iに基づいてデジタルオーディオデータDyauに含まれているボーカル音に対応する歌詞データDxsongを1倍速の再生速度に合わせて再生処理することによりビデオ信号Sxoutを生成する。
したがって、スピーカ等からは、楽曲タイトルの音楽等が本来の音調で出力されると共に、ディスプレイ等には、その音楽等の音調に合わせて且つボーカル音に同期して歌詞が順次に表示される。
かかる機能によれば、ユーザ等は、楽曲タイトル本来の音調の音楽等を受聴しながら、その音楽等に含まれているボーカル音に同期して表示される歌詞を観ることが可能となっている。
〈第5の制御機能〉
ユーザ等が上述の操作部を操作して、「記録再生開始」の指令を行うと、制御部7は、信号源8にデジタルオーディオデータDauを出力させる。すなわち、信号源8がCDやDVD等のストレージ媒体を情報再生する再生プレーヤである場合、それらのストレージ媒体に記録されているオーディオ情報の読み取り及び再生を開始させることにより、デジタルオーディオデータDauを出力させる。また、信号源8がインターネット等から配信されてくるオーディオ情報を受信する受信機等であれば、受信を開始させることによりデジタルオーディオデータDauを出力させる。
そして、音声認識処理部2に、デジタルオーディオデータDauに含まれているボーカル音のデータ列に基づいて音声認識処理を行わせることで、歌詞データDsongを生成させると共に、情報管理部3に、歌詞データDsongと音声認識が行われた上述のボーカル音のデータ列とを関連付けて管理するための管理データIFO#iを生成させ、記憶部4にそれら管理データIFO#iと歌詞データDsongとデジタルオーディオデータDauを記憶させていく。
ここで、制御部7は、デジタルオーディオデータDauを所定の時間分に相当するデータ量だけ記憶部4に記憶させた後、既に記憶済みとなっている歌詞データDxsongとデジタルオーディオデータDyauを記憶部4から順次に出力させ、歌詞情報再生部5とオーディオ情報再生部6に供給させる。
つまり、制御部7は、所定の時間分に相当するデータ量のデジタルオーディオデータDauを記憶部4にいわゆるバッファリングさせ、そのバッファリングが完了すると、記憶部4に対して所謂FIFO(ファーストインファイストアウト)処理を行わせることによって、管理データIFO#iと歌詞データDsongとデジタルオーディオデータDauを引き続き記憶させつつ、記憶済みとなった歌詞データDxsongとデジタルオーディオデータDyauを歌詞情報再生部5とオーディオ情報再生部6へ供給させていく。
このように、予め所定の時間分に相当するデータ量のデジタルオーディオデータDauを記憶部4にいわゆるバッファリングさせることにより、引き続いて所謂FIFO処理を行う際に、記憶部4から出力させる歌詞データDxsongとデジタルオーディオデータDyauが欠乏することを未然に防止している。
更に、記憶部4から上述の記憶させたデジタルオーディオデータDyauと歌詞データDxsongを出力させる際、制御部7は、管理データIFO#iに含まれている時間情報に基づいて、デジタルオーディオデータDyauに含まれているボーカル音のデータ列と、歌詞データDxsongとを同期させて、歌詞情報再生部5とオーディオ情報再生部6に供給させる。これにより、オーディオ信号Syoutに基づいてスピーカ等から発せられるボーカル音の発生タイミングと、ビデオ信号Sxoutに基づいてディスプレイ等に表示される歌詞の表示タイミングとを時間的に合わせて再生を行わせる。
かかる機能によれば、ユーザ等はデジタルオーディオデータDauと歌詞データDxsong等を記憶部4にいわゆる録音させながら、音楽等と歌詞を視聴することが可能となっている。
〈第6の制御機能〉
上述の〈第3の制御機能〉又は〈第4の制御機能〉若しくは〈第5の制御機能〉によって、スピーカ等から音楽等が出力されている際、ユーザ等が所望のボーカル音が発せられた時点で、歌詞を表示すべき旨の指令(「歌詞検索表示」という)を行うと、制御部7は、その指令された時点に再生が行われているボーカル音のデータ列に対応している時間情報を有している管理データIFO#iを記憶部4から検索する。更に、検索した管理データIFO#iに対応している歌詞データDxsongを検出し、その検出した歌詞データDxsongを記憶部4から歌詞情報再生部5へ出力させ、ディスプレイ等に歌詞を表示させる。
例えば、記憶部4に既に記憶されている図1(b)に示したデジタルオーディオデータに基づいてオーディオ情報再生部6が再生を行い、スピーカ等に音楽を出力させている際、ユーザ等が例えば「日が暮れる」というボーカル音が発せられた時点で、歌詞を表示すべき旨の指令を行うと、制御部7は、その指令された時点に再生が行われているボーカル音「日が暮れる」のデータ列に対応している時間情報を有する管理データIFO#3を記憶部4から検索する。更に、その検索した管理データIFO#3に対応している歌詞データ「日が暮れる」を検出して、その検出した歌詞データDxsongを記憶部4から歌詞情報再生部5へ出力させて、ディスプレイ等に、その「日が暮れる」という歌詞を表示させる。
かかる機能により、ユーザ等はスピーカ等から出力される音楽を聴きながら、所望のボーカル音に対応する歌詞をディスプレイ等に表示させることが可能となっている。
〈第7の制御機能〉
上述の〈第2の制御機能〉又は〈第4の制御機能〉若しくは〈第5の制御機能〉によって、ディスプレイ等に歌詞が表示されている際、ユーザ等がそのディスプレイ等に表示されている所望の歌詞を操作部を介して指定(「音検索」という)すると、制御部7は、指定された歌詞に対応する管理データIFO#iを記憶部4から検索し、更にその検索した管理データIFO#iに含まれている時間情報に基づいて、上述の指定された歌詞に対応するボーカル音のデータ列の開始時点を検出する。そして、検出したボーカル音のデータ列の開始時点からデジタルオーディオデータDyauを記憶部4から出力させ、オーディオ情報再生部6へ供給させる。
例えば、図1(b)に示した歌詞データ「あの町」と「この町」と「日が暮れる」等に基づいて、それらの各歌詞がディスプレイ等に表示されている状態で、ユーザ等が、例えば、「この町」の歌詞部分を指定すると、制御部7は、その歌詞に対応する管理データIFO#2を記憶部4から検索する。そして、検索した管理データIFO#2に含まれている時間情報、すなわち、ボーカル音「この町」のデータ列の開始時点t3を検出し、記憶部4に対して開始時点t3からデジタルオーディオデータDyauを出力させ、オーディオ情報再生部6へ供給させる。
更に、ユーザ等がディスプレイ等に表示されている複数の歌詞列を所望の範囲で指定すると、管理データIFO#iに基づいて該範囲内の先頭の歌詞から最後の歌詞までに相当するデジタルオーディオデータDyauを記憶部4から出力させ、オーディオ情報再生部6へ供給させる。
更に、ユーザ等がディスプレイ等に表示されている所望の歌詞を指定し、更に操作部を操作していわゆる頭出しの指定をすると、管理データIFO#iに基づいて再生中の音楽の先頭のデジタルオーディオデータDyauを検索し、該検索した先頭のデジタルオーディオデータDyauと共にそれに続くデジタルオーディオデータを順次に記憶部4から出力させ、オーディオ情報再生部6へ供給させることにより、再生途中の音楽を最初から再生させる。
これらの機能により、ユーザ等は、ディスプレイ等に表示させた所望の歌詞に対応する音楽等の部分や範囲、或いは先頭から受聴することが可能となっている。
〈第8の制御機能〉
ユーザ等が、〈第4の制御機能〉又は〈第5の制御機能〉において説明した「同期再生」又は「記録再生」の指令をする際、ボーカル音をミュートさせるための「ミュート再生」を併せて指令すると、制御部7は、各管理データIFO#iに含まれている時間情報に基づいて、記憶部4に記憶されている該デジタルオーディオデータDyauに含まれている各ボーカル音のデータ列を検出し、検出したデータ列を除去したデジタルオーディオデータDyauを生成してオーディオ情報再生部6側に供給すると共に、上述の除去した各ボーカル音のデータ列に対応する歌詞データDxsongを同期させて歌詞情報再生部5側に供給する。
かかる機能によれば、ユーザ等は、表示される歌詞を観ながら、ボーカル音が消音された伴奏等に合わせて歌う、いわゆるカラオケを行うことができる。
すなわち、ユーザ等が「同期再生」と「ミュート再生」を併せて指令すると、上述したように、〈第4の制御機能〉によって1倍速での再生が行われるため、楽曲タイトル本来の音調の伴奏等に合わせて、歌詞を観ながらカラオケを行うことができるようになっている。
〈第9の制御機能〉
ユーザ等は、上述した〈第1の機能〉〜〈第8の機能〉の何れかを夫々個別に指定することが可能であるが、制御部7に予め決められている所定の組合せに従って、それらの機能を組み合わせて指定すると、制御部7は、それらの指定された複数の機能を合わせた制御を行うことにより、ユーザ等に対してバリエーションのある楽しみ方を提供することが可能となっている。
以上説明したように、本実施形態の情報処理装置1によれば、デジタルオーディオデータに含まれているボーカル音のデータ列を音声認識し、その認識結果を歌詞データとして記憶し、更にその歌詞データを表示等するようにしたので、オーディオ情報は記録されているが歌詞情報が記録されていないCDやDVD等のストレージ媒体を情報再生してボーカル音に対応する歌詞をユーザ等に提示等したり、インターネット等の伝送メディアを通じて配信されてくる歌詞情報を含まないオーディオ情報を再生してボーカル音に対応する歌詞をユーザ等に提示等したりすることができ、ユーザビリティの向上を図ることができる。
また、歌詞データと、その歌詞データに対応しているデジタルオーディオデータ中のボーカル音のデータ列とを管理データに基づいて関連付けを行って管理するので、その管理データを利用することによって、上述した歌詞を指定してその歌詞に対応するボーカル音を再生させたり、それとは逆に、ボーカル音を指定して歌詞を表示させたり、カラオケを行うことを可能にする等、ユーザビリティの向上を実現し得る各種機能への応用が可能である。
なお、以上の実施形態の説明では、CDやDVD等のストレージ媒体を情報再生する再生プレーヤや、インターネット等の伝送メディアと組み合わせて使用される所謂オーディオ機器としての情報処理装置について説明した。
しかし、本実施形態は、かかる場合に限定されるものではなく、上述した音声認識処理部2と、情報管理部3と、歌詞情報再生部5と、オーディオ情報再生部6及び制御部7に相当する機能を、情報処理用プログラムとしてのコンピュータプログラム(エンジン)で実現し、そのコンピュータプログラムをパーソナルコンピュータ(PC)等にインストールして、マイクロプロセッサ(MPU)に実行させることにより、そのパーソナルコンピュータに備えられている記憶部4に該当するハードディスク等の大容量記憶装置に、歌詞データとデジタルオーディオデータ及び管理データを記憶させ、更にそれらの記憶された歌詞データとデジタルオーディオデータを再生させて、パーソナルコンピュータに接続等されているディスプレイやスピーカから出力させるようにしてもよい。
また、上記のコンピュータプログラムをストレージ媒体に記録しておき、このストレージ媒体を再生することでコンピュータに機能を実行させるようにしてもよい。
また、音楽等の情報と共に上記のコンピュータプログラムをストレージ媒体に記録しておき、このストレージ媒体から音楽等の情報を再生する際、コンピュータプログラムをコンピュータに実行させることで、音楽等に含まれるボーカル音を音声認識させ、歌詞を作成させる等の機能を発揮させるようにしてもい。
また、以上の実施形態の説明では、管理データIFO#iに含まれている時間情報を介して、歌詞データDsongとデジタルオーディオデータDau中のボーカル音のデータ列とを関連付けて管理するようにしているが、時間情報以外の情報によって、歌詞データDsongとデジタルオーディオデータDau中のボーカル音のデータ列との関連付けを行うようにしてもよい。
例えば、情報管理部3において、歌詞データDsongと、その歌詞データDsongに対応するデジタルオーディオデータDau中のボーカル音のデータ列との関連付けを行う附箋データやIDデータ、番号データ等の識別機能を有するデータを生成し、その識別機能を有するデータを介して歌詞データとボーカル音のデータ列とをリンクさせるようにしてもよい。
かかる構成によれば、例えば、上述したディスプレイ等に表示された歌詞をユーザ等が指定すると、識別機能を有するデータを介して、記憶部4に記憶されているボーカル音のデータ列を検出して出力させ、オーディオ情報再生部6にユーザ等が指定した歌詞に対応するボーカル音等を再生するためのオーディオ信号Syoutを生成させることができる。
また、ディスプレイ等に表示された歌詞をユーザ等が指定するための手段として、タッチパネル型のディスプレイを歌詞情報再生部5に接続し、ユーザ等が接触した表示面上の歌詞を制御部7が検出することにより、該歌詞に対応する記憶部4中に記憶されているボーカル音のデータ列を検出するようにしてもよい。
次に、より具体的な実施例を図2を参照して説明する。図2は、CDやDVD等のストレージ媒体を再生する再生プレーヤから供給されるデジタルオーディオデータDauを処理する情報処理装置の構成を表したブロック図であり、図1と同一又は相当する部分を同一符号で示している。
図2において、この情報処理装置1は、音声抽出部2xa、音声認識部2xb、辞書データ記憶部2xc、歌詞情報管理部3x、ハードディスクHDDx等を有する大容量の記憶部4x、ビデオ信号生成部5、再生速度検出部9、記憶再生制御部8a、圧縮処理部10、オーディオ情報管理部3y、ハードディスクHDDy等を有する大容量の記憶部4y、伸張処理部6ya、オーディオ信号生成部6yb、主制御部8b及び操作部13を備えて構成されている。
そして、信号源としての再生プレーヤ2から出力されるデジタルオーディオデータDauが音声抽出部2xaと圧縮処理部10に供給され、更に再生プレーヤ2から出力される再生速度を示す信号(符号略)が再生速度検出部9に供給され、ビデオ信号生成部5の出力にディスプレイ11等の表示手段が接続され、オーディオ信号生成部6ybの出力にスピーカ12等が接続されるようになっている。
ここで、本実施例の情報処理装置1と、図1(a)に示した実施形態に係る情報処理装置1との構成を対比すると、図2に示す音声抽出部2xaと音声認識部2xbと辞書データ記憶部2xcが、図1(a)に示した音声認識処理部2に相当している。歌詞情報管理部3xとオーディオ情報管理部3yが、図1(a)に示した情報管理部3に相当している。記憶部4x,4yが、図1(a)に示した記憶部4に相当している。ビデオ信号生成部5が、図1(a)に示した歌詞情報再生部5に相当している。伸張処理部6yaとオーディオ信号生成部6ybが、図1(a)に示したオーディオ情報再生部6に相当し、記憶再生制御部7aと主制御部7bが、図1(a)に示した制御部7に相当している。
再生速度検出部9は、再生プレーヤ8から出力される再生速度を示す信号を検出することにより、ストレージ媒体DSCの再生中の再生速度を示す再生速度検出データDpdを記憶再生制御部8aに供給する。すなわち、再生プレーヤ8は、CDやDVD等のストレージ媒体DSCを再生する際、ストレージ媒体DSCの再生速度を通常の1倍速の他、それより遅い速度や高速で再生することが可能であり、それら様々な速度で再生中に、再生速度を示す信号を出力するようになっている。そこで、再生速度検出部9は、再生プレーヤ8から出力される再生速度を示す信号を実時間で検出し、上述の再生速度検出データDpdを記憶再生制御部8aに供給する。
音声抽出部2xaは、再生プレーヤ8から供給されるデジタルオーディオデータDauを入力する。なお、デジタルオーディオデータDauは、所定のサンプリングレートでサンプリングされたデータ列であり、例えばこのデジタルオーディオデータDauをD/A変換器でアナログ信号に変換してスピーカを駆動すると、可聴周波数の音を鳴動させることが可能な信号となっている。
そして、音声抽出部2xaは、人間の声の主成分の周波数帯域、例えば500Hzから3kHzまでの範囲を通過周波数帯域とするデジタルフィルタで形成されており、記憶再生制御部8aから指示される再生速度に従って、デジタルオーディオデータDauをデジタルフィルタリングすることにより、デジタルオーディオデータDauに含まれているボーカル音のデータ列Dx1を抽出して出力する。
すなわち、再生プレーヤ8が1倍速で再生処理を行っている場合には、記録再生制御部8aは、音声抽出部2xaに対して、1倍速に相当する演算速度で上述のデジタルフィルタリングの処理を行わせ、2倍速で再生処理を行っている場合には、音声抽出部2xaに対して2倍速に相当する演算速度で上述のデジタルフィルタリングの処理を行わせ、4倍速で再生処理を行っている場合には、4倍速に相当する演算速度で上述のデジタルフィルタリングの処理を行わせるというように、再生プレーヤ8の再生速度に比例した演算速度でデジタルフィルタリングを行わせる。
従って、例えば1倍速の再生速度よりも低速又は高速の再生が行われると、それに応じてあたかも低周波数又は高周波数でサンプリングされたような密度の変化したデジタルオーディオデータDauが音声抽出部2xaに供給されることになるが、上述の音声抽出部2xaにおけるデジタルフィルタリングの演算速度も低速又は高速の再生速度に比例して可変制御される結果、デジタルオーディオデータDauに対して再生速度とは無関係にデジタルフィルタリングを行うことが可能となっている。
音声認識部2xbは、ボーカル音のデータ列Dx1について音声認識を行い、その認識結果に相当する文字データを辞書データ記憶部2xcから読み出して文字データ列からなる歌詞データDsongを作成して出力する。
例えば、「あの町」というボーカル音のデータ列Dx1を音声認識すると、その認識結果に基づいて「あの町」という文字データからなる歌詞データDsongを作成して出力する。
歌詞情報管理部3xは、歌詞データDsongに相当するボーカル音の発生期間を示す時間データを有する管理データIFOxを作成し、歌詞データDsongに付加して出力する。例えば、上述の「あの町」というボーカル音のデータ列Dx1が時間t1〜t2の期間に生じていた場合には、その歌詞データDsongに、時間t1〜t2を示す時間データを有する管理データIFOxを対応付け、歌詞データDsongとして出力する。
なお、記憶再生制御部7aには、各楽曲タイトルのデジタルオーディオデータDauの開始時点から終了時点までの経過時間を計測するためのタイムベースが内蔵されており、歌詞情報管理部3xが該タイムベースによって計時される時間情報を利用して、上述の時間データを有する管理データIFOxを作成するようになっている。
記憶部3xは、歌詞情報管理部3xからの歌詞データDsongと管理データIFOxをハードディスクHDDx等に記憶させ、所定のディレクトリ構造に従ってファイル管理する。
圧縮処理部10は、デジタルオーディオデータDauを、MPEGオーディオ等の所定のデータ圧縮方式に従ってデータ圧縮することにより、データ量を低減したデジタルオーディオデータDaucにして出力する。
オーディオ情報管理部3yは、上述の音声認識部2xbが音声認識を行ったボーカル音のデータ列Dx1の時間幅t1〜t2に相当する時間データを有する管理データIFOyを作成し、デジタルオーディオデータDaucと共に出力する。
記憶部4yは、オーディオ情報管理部3yからの管理データIFOyとデジタルオーディオデータDaucをハードディスクHDDy等に記憶させ、所定のディレクトリ構造に従ってファイル管理する。
そして、主として、再生速度検出部9、音声抽出部2xa、音声認識部2xb、辞書データ記憶部2xc、歌詞情報管理部3x、圧縮処理部10、オーディオ情報管理部3yによって、再生プレーヤ8から楽曲タイトル毎に供給されるデジタルオーディオデータDauを記憶部4yにおいて記憶させると共に、ボーカル音のデータ列Dx1に関連する歌詞データDsongを記憶部4yにおいて記憶させるデータ記憶系統が構成されている。
ビデオ信号生成部5は、記憶部4xに記憶されている歌詞データDsong(なお、記憶部4yから出力される歌詞データを符号Dxsongで表している)が供給されると、その歌詞データDxsongに基づいてビデオ信号Sxoutを生成し、ディスプレイ11等に供給することによって歌詞を表示させる。
伸張処理部6yaは、記憶部4yから出力されるデジタルオーディオデータDyaucをデータ伸張し、データ伸張したデジタルオーディオデータDyauを出力する。すなわち、上述の圧縮処理部10においてMPEGオーディオ等のデータ圧縮方式でデータ圧縮されたデジタルオーディオデータDaucが記憶部4yに記憶されている。そこで、伸張処理部6yaは、記憶部4yからそのデジタルオーディオデータDauc(なお、記憶部4yから出力されるデジタルオーディオデータを符号Dyaucで表している)が供給されるとデータ伸張を行い、データ圧縮前の状態のデジタルオーディオデータDyauを出力する。
オーディオ信号生成部6ybは、デジタルオーディオデータDyauに基づいてアナログのオーディオ信号Syoutを生成し、スピーカ12等に供給することによって音を出力させる。
そして、主として、ビデオ信号生成部5と伸張処理部6yaとオーディオ信号生成部6ybによって、記憶部4xに記憶されている歌詞データDxsongに基づく歌詞の表示と、記憶部4yに記憶されているデジタルオーディオデータDyaucに基づく音の再生を行う再生系統が構成されている。
記憶再生制御部7aは、主制御部7bから供給される制御信号C2の指令内容に従って、上述のデータ記憶系統と再生系統を制御する。
主制御部7bは、演算及び制御機能を有するマイクロプロセッサ(MPU)等を有し、操作部13を介してユーザ等からの指令を受けると、該指令に従って、本信号処理装置1全体の動作を集中制御すると共に、指令された内容に従って、再生プレーヤ8を制御するための制御信号C1と、記憶再生制御部7aを制御するための制御信号C2を出力する。
次に、かかる構成を有する本信号処理装置1の動作を説明する。
本信号処理装置1は、ユーザ等が操作部13を操作して所望の指令を行うと、記憶再生制御部7aと主制御部7bが、実施形態の説明で述べた〈第1の制御機能〉から〈第9の制御機能〉と同様の制御機能を発揮することで、ユーザ等の指令に従った動作を行うようになっている。
〈ユーザ等が記録開始の指令をした場合〉
ユーザ等が操作部13を操作して、「記録開始」の指令を行うと、主制御部7bが記憶再生制御部7aに指令して、〈第1の制御機能〉に基づく動作を行わせる。
すなわち、記憶再生制御部7aは、上述のデータ記憶系統を制御して、再生プレーヤ8から楽曲タイトル毎に供給されるデジタルオーディオデータDauを音声抽出部2xaと圧縮処理部10に入力させる。そして、音声抽出部2xaがデジタルオーディオデータDauに含まれているボーカル音のデータ列Dx1を抽出し、音声認識部2xbがデータ列Dx1に基づいて音声認識を行うことによって歌詞データDsongを生成し、更に歌詞情報管理部3xが管理データIFOxを生成し、これら歌詞データDsong及び管理データIFOxを順次に記憶部4xが記憶していく。更に、圧縮処理部10がデータ圧縮したデジタルオーディオデータDaucを生成し、オーディオ情報管理部3yが管理データIFOyを生成し、これらデジタルオーディオデータDauc及び管理データIFOyを順次に記憶部4yが記憶していく。
このように、ユーザ等が「記録開始」の指令を行うと、再生プレーヤ8にセットした所望のCDやDVDに記憶されているデジタルオーディオデータDauからボーカル音に相当する歌詞データDsongを生成させ、データ圧縮したデジタルオーディオデータDaucと共に歌詞データDsongを記憶部4x,4yに記憶させておくことが可能となっている。
〈ユーザ等が歌詞再生の指令をした場合〉
ユーザ等が操作部13を操作し、所望の楽曲タイトルを指定して「歌詞再生」の指令を行うと、主制御部7bが記憶再生制御部7aに指令して、〈第2の制御機能〉に基づく動作を行わせる。
すなわち、記憶再生制御部7aは、その指令された楽曲タイトルの歌詞データDxsongを管理データIFOxに基づいて検索し、記憶部4から歌詞データDxsongを出力させると共にビデオ信号生成部5に供給させることにより、ビデオ信号生成部5からその歌詞データDxsongに基づくビデオ信号Sxoutを出力させ、ディスプレイ11等に歌詞を表示させる。
かかる機能により、ユーザ等は、記憶部4xに記憶させておいた歌詞データDsongに基づいて歌詞をディスプレイ11等に表示させて、観ることが可能となっている。
〈ユーザ等がオーディオ再生をした場合〉
ユーザ等が操作部13を操作することにより、記憶部4yに既に記憶されている所望の楽曲タイトルを指定し、更に所望の再生速度を指定して「オーディオ再生」の指令を行うと、主制御部7bが記憶再生制御部7aに指令して、〈第3の制御機能〉に基づく動作を行わせる。
すなわち、記憶再生制御部7aは、その指令された楽曲タイトルのデジタルオーディオデータDyaucを管理データIFOyに基づいて検索し、記憶部4yからデジタルオーディオデータDyaucを出力させる。そして、伸張処理部6yaとオーディオ信号生成部6ybによって、そのデジタルオーディオデータDyaucに基づくオーディオ信号Syoutを、指令された再生速度に従って生成させて出力させる。
かかる機能により、オーディオ信号生成部6ybがオーディオ信号Syoutをスピーカ等に供給することで、ユーザ等の指令した再生速度に相当する音調で、楽曲タイトルの音楽等を鳴動させる。
また、ユーザ等が上述の「歌詞再生」と「オーディオ再生」を適宜の順序で指令すると、記憶再生制御部7aは、指令された適宜の順序で上述の〈第2の制御機能〉と〈第3の制御機能〉を起動し、管理データIFOx,IFOyに基づいて、指令された楽曲タイトルの歌詞データDxsongとデジタルオーディオデータDyaucを検索し、記憶部4xから歌詞データDxsongを出力させて、ビデオ信号生成部5に供給させると共に、記憶部4yからデジタルオーディオデータDyaucを出力させて、伸張処理部6yaとオーディオ信号生成部6yb側に供給させる。これにより、ビデオ信号生成部5とオーディオ信号生成部6ybが、歌詞データDxsongに基づくビデオ信号SxoutとデジタルオーディオデータDyaucに基づくオーディオ信号Syoutを生成し、ディスプレイ11等に歌詞を表示させつつ、スピーカ12等にユーザ等の指令した再生速度に相当する音調で楽曲タイトルの音楽等を鳴動させる。
したがって、ユーザ等は「歌詞再生」のみ又は「オーディオ再生」のみの指令を行うことができる他、「歌詞再生」と「オーディオ再生」との両者を併せて指令し、楽曲タイトルの音楽等を聴きながら歌詞を観ることが可能となっている。
また、ユーザ等が人間の聴覚特性に相当する再生速度、別言すれば、CDプレーヤやDVDプレーヤ等で規格化されている1倍速の再生速度を指令して「歌詞再生」と「オーディオ再生」とを指令すると、歌詞を観ながら楽曲タイトルの音楽等を本来の音調で再生させることができる。また、ユーザ等が1倍速より遅い再生速度又は1倍速より速い再生速度速を指令すれば、歌詞を観ながら楽曲タイトルの音楽等を本来の音調より遅い又は速い音調で再生させることが可能となっている。
〈ユーザ等が同期再生を指令した場合〉
また、ユーザ等が操作部13を操作することにより、記憶部4yに既に記憶されている所望の楽曲タイトルを指定して、「同期再生」の指令を行うと、主制御部7bが記憶再生制御部7aに指令して、〈第4の制御機能〉に基づく動作を行わせる。
すなわち、記憶再生制御部7aは、上述の再生系統を制御し、記憶部4xに記憶されている歌詞データDxsongに基づく歌詞の表示と、記憶部4yに記憶されているデジタルオーディオデータDyaucに基づく音の再生を行わせる。
更に、この同期再生の際、記憶再生制御部7aは、記憶部4x,4yに記憶されている管理データIFOx,IFOyを調べ、管理データIFOx,IFOyで関係付けられている歌詞データDxsongとデジタルオーディオデータDyauc中のボーカル音のデータ列とを時間的に同期させて、記憶部4x,4yからビデオ信号生成部5と伸張処理部6ya側へ出力させることにより、ディスプレイ11等に表示される歌詞の表示タイミングとスピーカ12等から発せられるボーカル音の発生タイミングとを時間的に同期させる。
更に、「同期再生」の際には、記憶再生制御部7aの制御に従ってオーディオ信号生成部6ybが、伸張処理部6yaから供給されるデジタルオーディオデータDyauを1倍速の再生速度で再生処理することによってオーディオ信号Syoutを生成し、ビデオ信号生成部5が管理データIFOxに基づいてデジタルオーディオデータDyauに含まれているボーカル音のデータ列に対応する歌詞データDxsongを1倍速の再生速度に合わせて再生処理することによりビデオ信号Sxoutを生成する。
したがって、スピーカ12等からは、楽曲タイトルの音楽等が本来の音調で出力されると共に、ディスプレイ11等には、その音楽等の音調に合わせて且つボーカル音に同期して歌詞が順次に表示される。
かかる機能によれば、ユーザ等は、楽曲タイトル本来の音調の音楽等を聴きながら、その音楽等に含まれているボーカル音に同期して表示される歌詞を観ることが可能となっている。
また、ユーザ等が操作部13を操作することにより、「記録再生」の指令を行うと、主制御部7bが記憶再生制御部7aに指令して、〈第5の制御機能〉に基づく動作を行わせる。
すなわち、記憶再生制御部7aは、上述のデータ記憶系統と再生系統を制御して、再生プレーヤ8から楽曲タイトル毎に供給されるデジタルオーディオデータDauを音声抽出部2xaと圧縮処理部10に入力させる。そして、音声抽出部2xaがデジタルオーディオデータDauに含まれているボーカル音のデータ列Dx1を抽出し、音声認識部2xbがデータ列Dx1に基づいて音声認識を行うことによって歌詞データDsongを生成し、更に歌詞情報管理部3xが管理データIFOxを生成し、これら歌詞データDsong及び管理データIFOxを順次に記憶部4xが記憶していく。更に、圧縮処理部10がデータ圧縮したデジタルオーディオデータDaucを生成し、オーディオ情報管理部3yが管理データIFOyを生成し、これらデジタルオーディオデータDauc及び管理データIFOyを順次に記憶部4yが記憶していく。
そして、記憶再生制御部7aは、所定の時間分に相当するデータ量のデジタルオーディオデータDaucを記憶部4yにいわゆるバッファリングさせた後、記憶部4x,4yに対して所謂FIFO(ファーストインファイストアウト)処理を行わせることによって、管理データIFOx,IFOyと歌詞データDsongとデジタルオーディオデータDaucを引き続き記憶させつつ、記憶済みとなった歌詞データDxsongとデジタルオーディオデータDyaucをビデオ信号生成部5と伸張処理部6ya側へ出力させていく。
更に、記憶再生制御部7aは、記憶部4x,4yから歌詞データDxsongとデジタルオーディオデータDyaucを出力させる際、管理データIFOx,IFOyに含まれている時間情報に基づいて、歌詞データDxsongと、デジタルオーディオデータDyauに含まれているボーカル音のデータ列とを同期させて、ビデオ信号生成部5と伸張処理部6ya側へ出力させていく。
これにより、オーディオ信号生成部6ybから出力されるオーディオ信号Syoutに基づいてスピーカ12等から発せられるボーカル音の発生タイミングと、ビデオ信号生成部5から出力されるビデオ信号Sxoutに基づいてディスプレイ11等に表示される歌詞の表示タイミングとを時間的に合わせて再生を行わせる。
かかる機能によれば、ユーザ等は、所望のCDやDVDを再生プレーヤ8にセットして、デジタルオーディオデータDaucと歌詞データDsong等を記憶部4にいわゆる録音させながら、音楽等と歌詞を視聴することが可能となっている。
また、スピーカ12等から音が発せられている状態で、ユーザ等が所望のボーカル音が発せられた時点で操作部13を操作し、歌詞を表示すべき旨の指令を行うと、主制御部7bから記憶再生制御部7aに、歌詞を表示すべき旨の制御信号C2が供給される。そして、記憶再生制御部7aは、その指令された時点に再生が行われているボーカル音のデータ列に対応している管理データIFOxを記憶部4xから検索すると共に、検索した管理データIFOxに対応している歌詞データDxsongを検出し、その検出した歌詞データDxsongを記憶部4xからビデオ信号生成部5へ出力させて、ディスプレイ11等に歌詞を表示させる。
これにより、ユーザ等はスピーカ12等から出力される音楽等を聴きながら、所望のボーカル音に対応する歌詞をディスプレイ11等に表示させることが可能となっている。
また、ディスプレイ11等に歌詞が表示されている状態で、ユーザ等がそのディスプレイ11等に表示されている所望の歌詞を操作部13を介して指定すると、主制御部7bから記憶再生制御部7aに、歌詞が指定された旨の制御信号C2が供給される。そして、記憶再生制御部7aは、指定された歌詞に対応する管理データIFOyを記憶部4yから検索し、更にその検索した管理データIFOyに基づいて、上述の指定された歌詞に対応するボーカル音のデータ列の開始時点を検出し、検出したボーカル音のデータ列の開始時点からデジタルオーディオデータDyaucを記憶部4yから出力させ、伸張処理部6yaを介してオーディオ信号生成部6ybへ供給させる。
これにより、ユーザ等は、ディスプレイ11等に表示させた所望の歌詞に対応する音楽の部分をスピーカ12等から出力させて受聴することが可能となっている。
更に、ユーザ等がディスプレイ11等に表示されている複数の歌詞列を所望の範囲で指定すると、記憶再生制御部7aは、管理データIFOyに基づいて該範囲内の先頭の歌詞から最後の歌詞までに相当するデジタルオーディオデータDyaucを記憶部4yから出力させ、伸張処理部6yaを介してオーディオ信号生成部6yaに供給させ、スピーカ12等を鳴動させる。これにより、ユーザ等は、所望の歌詞の範囲内の音楽等をボーカル音と共に受聴することができる。
更に、ユーザ等がディスプレイ11等に表示されている所望の歌詞を指定し、更に操作部13を操作していわゆる頭出しの指定をすると、記憶再生制御部7aは、管理データIFOyに基づいて再生中の音楽の先頭のデジタルオーディオデータDyaucを検索し、該検索した先頭のデジタルオーディオデータDyaucと共にそれに続くデジタルオーディオデータを順次に記憶部4yから出力させ、伸張処理部6yaを介してオーディオ信号生成部6yaに供給させる。これにより、ユーザ等はディスプレイ11に表示されている歌詞を指定するだけで、その歌詞の属する音楽等を頭から聴き直す等の操作を行うことが可能となっている。
ユーザ等が、上述の「同期再生」又は「記録再生」の指令をする際、ボーカル音をミュートさせるための「ミュート再生」を併せて指令すると、主制御部7bからの指令を受けて記憶再生制御部7aが、各管理データIFOyに含まれている時間情報に基づいて、記憶部4yに記憶されているデジタルオーディオデータDyaucに含まれている各ボーカル音のデータ列を検出し、検出したデータ列を除去したデジタルオーディオデータDyaucを生成して、伸張処理部6yaを介してオーディオ信号生成部6ybに供給すると共に、管理データIFOxに基づいて、上述の除去した各ボーカル音のデータ列に対応する歌詞データDxsongを検索し、その歌詞データDxsongを上述の除去した各ボーカル音のデータ列に同期させて記憶部4yから出力さて、ビデオ信号生成部5に供給させる。
そして、ビデオ信号生成部5が歌詞データDxsongに基づいてビデオ信号Sxoutを生成して、ディスプレイ11等に歌詞を表示させ、オーディオ信号生成部6ybがボーカル音のデータ列が除去されたデジタルオーディオデータDyauに基づいてオーディオ信号Syoutを生成して、スピーカ12等に音楽等を鳴動させる。
かかる機能によれば、ユーザ等は、表示される歌詞を観ながら、ボーカル音が消音された伴奏等に合わせて歌う、いわゆるカラオケを行うことができる。
すなわち、ユーザ等が「同期再生」と「ミュート再生」を併せて指令すると、上述したように、〈第4の制御機能〉によって1倍速での再生が行われるため、楽曲タイトル本来の音調の伴奏等に合わせて、歌詞を観ながらカラオケを行うことができる。
以上説明したように、本実施例の情報処理装置1によれば、デジタルオーディオデータに含まれているボーカル音のデータ列を音声認識し、その認識結果を歌詞データとして記憶し、更にその歌詞データを表示等するようにしたので、オーディオ情報は記録されているが歌詞情報が記録されていないCDやDVD等のストレージ媒体を情報再生して、ボーカル音に対応する歌詞をユーザ等に提示等することができ、ユーザビリティの向上を図ることができる。
また、歌詞データと、その歌詞データに対応しているデジタルオーディオデータ中のボーカル音のデータ列とを管理データに基づいて関連付けを行って管理するので、その管理データを利用することによって、上述した歌詞を指定してその歌詞に対応するボーカル音を再生させたり、それとは逆に、ボーカル音を指定して歌詞を表示させる等、ユーザビリティの向上を実現し得る各種機能への応用が可能である。
また、ユーザ等が「同期再生」又は「記録再生」と「ミュート再生」を併せて指令すると、オーディオ情報は記録されているが歌詞情報が記録されていないCDやDVD等のストレージ媒体を使用しても、カラオケを行うことができることから、ユーザビリティの向上を図ることができる等の効果が発揮される。
なお、以上の実施例の説明では、CDやDVD等のストレージ媒体を情報再生する再生プレーヤから供給されるデジタルオーディオデータを処理するオーディオ機器としての情報処理装置について説明した。
しかし、本実施例は、かかる場合に限定されるものではなく、上述したデータ記憶系統と再生系統と記憶再生制御部7a、主制御部7bに相当する機能をコンピュータプログラム(エンジン)で実現し、そのコンピュータプログラムをパーソナルコンピュータ(PC)等にインストールして、マイクロプロセッサ(MPU)に実行させることにより、そのパーソナルコンピュータに備えられている記憶部4x,4yに該当するハードディスク等の大容量記憶装置に、歌詞データとデジタルオーディオデータ及び管理データを記憶させ、更にそれらの記憶された歌詞データとデジタルオーディオデータを再生させて、パーソナルコンピュータに接続等されているディスプレイやスピーカから出力させるようにしてもよい。
また、ディスプレイ11等に表示された歌詞をユーザ等が指定するための手段として、タッチパネル型のディスプレイをビデオ信号生成部5に接続し、ユーザ等が接触した表示面上の歌詞を記憶再生制御部7aが検出することにより、該歌詞に対応する記憶部4y中に記憶されているボーカル音のデータ列を検出するようにしてもよい。
本発明の情報処理装置に係る実施形態の構成を表したブロック図、及び本情報処理装置に設けられている記憶部に記憶されるデータの構成を模式的に表した図である。 本発明の情報処理装置に係る実施例の構成を表したブロック図である。
符号の説明
1…情報処理装置
2…音声認識処理部
3…情報管理部
4…記憶部
5…歌詞情報再生部
6…オーディオ情報再生部
7…制御部
8…信号源

Claims (11)

  1. 信号源から供給されるオーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成する音声認識処理手段と、
    前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成する情報管理手段と、
    前記オーディオ情報、前記ボーカル情報、前記歌詞情報、及び前記管理情報を記憶する記憶手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記記憶手段に記憶されている前記歌詞情報を視認可能な歌詞として提示する歌詞情報再生手段を備えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記記憶手段に記憶された前記オーディオ情報を受聴可能な音として提示するオーディオ情報再生手段を備えることを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記記憶手段に記憶されている前記歌詞情報を視認可能な歌詞として提示する歌詞情報再生手段と、
    前記記憶手段に記憶されている前記オーディオ情報を受聴可能な音として提示するオーディオ情報再生手段と、
    前記記憶手段に記憶されている前記管理情報に基づいて前記視認可能な歌詞及び前記受聴可能な音を同期させて提示するように前記歌詞情報再生手段と前記オーディオ情報再生手段とを制御する制御手段と、
    を備えることを特徴とする請求項1に記載の情報処理装置。
  5. 前記制御手段は、前記オーディオ情報、前記ボーカル情報、前記歌詞情報、及び前記管理情報を前記記憶手段に記憶させつつ、前記記憶手段に記憶させた前記管理情報に基づいて前記視認可能な歌詞及び前記受聴可能な音を提示するように前記歌詞情報再生手段と前記オーディオ情報再生手段とを制御することを特徴とする請求項4に記載の情報処理装置。
  6. 前記オーディオ情報再生手段が提示した受聴可能な音に含まれるボーカル音が指定された際に、指定されたボーカル音に対応するボーカル情報と関連付けられている歌詞情報を前記管理情報に基づいて検出し、検出した歌詞情報を視認可能な歌詞として前記歌詞情報再生手段に提示させる制御手段を備えることを特徴とする請求項3に記載の情報処理装置。
  7. 前記歌詞情報再生手段が提示した歌詞が指定された際に、指定された歌詞と関連付けられているボーカル情報を前記管理情報に基づいて検出し、検出したボーカル情報を含んでいるオーディオ情報を受聴可能な音として前記オーディオ情報再生手段に提示させる制御手段を備えることを特徴とする請求項3に記載の情報処理装置。
  8. 前記制御手段は、前記管理情報に基づいて前記オーディオ情報からボーカル情報を除去し、除去された前記オーディオ情報を受聴可能な音として提示するように前記オーディオ再生手段を制御することを特徴とする請求項4又は5に記載の情報処理装置。
  9. 信号源から供給されるオーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成する音声認識処理工程と、
    前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成する情報管理工程と、
    前記オーディオ情報、前記歌詞情報、及び前記管理情報を記憶する記憶工程と、
    を備えることを特徴とする情報処理方法。
  10. 信号源から供給されるオーディオ情報の処理をコンピュータに行わせる情報処理用プログラムであって、
    前記オーディオ情報に含まれているボーカル情報を音声認識して歌詞情報を生成させる音声認識処理ステップと、
    前記歌詞情報と、前記ボーカル情報とを関連付ける管理情報を生成させる情報管理ステップと、
    前記オーディオ情報、前記歌詞情報、及び前記管理情報を記憶させる記憶ステップと、
    を備えることを特徴とする情報処理用プログラム。
  11. 請求項10に記載の情報処理用プログラムを記録していることを特徴とする記録媒体。
JP2004062324A 2004-03-05 2004-03-05 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体 Pending JP2005250242A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004062324A JP2005250242A (ja) 2004-03-05 2004-03-05 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004062324A JP2005250242A (ja) 2004-03-05 2004-03-05 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2005250242A true JP2005250242A (ja) 2005-09-15

Family

ID=35030760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004062324A Pending JP2005250242A (ja) 2004-03-05 2004-03-05 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2005250242A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079413A (ja) * 2005-09-16 2007-03-29 Yamaha Corp オーディオ再生装置、オーディオ配信システム、オーディオ再生プログラムおよびオーサリングプログラム
JP2009017960A (ja) * 2007-07-10 2009-01-29 Taiyo Elec Co Ltd 遊技機
JP2010085581A (ja) * 2008-09-30 2010-04-15 Victor Co Of Japan Ltd 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム
JP2013039458A (ja) * 2012-11-28 2013-02-28 Taiyo Elec Co Ltd 遊技機

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079413A (ja) * 2005-09-16 2007-03-29 Yamaha Corp オーディオ再生装置、オーディオ配信システム、オーディオ再生プログラムおよびオーサリングプログラム
JP2009017960A (ja) * 2007-07-10 2009-01-29 Taiyo Elec Co Ltd 遊技機
JP2010085581A (ja) * 2008-09-30 2010-04-15 Victor Co Of Japan Ltd 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム
JP2013039458A (ja) * 2012-11-28 2013-02-28 Taiyo Elec Co Ltd 遊技機

Similar Documents

Publication Publication Date Title
US9601029B2 (en) Method of presenting a piece of music to a user of an electronic device
JP4174940B2 (ja) カラオケ装置
JP2004233698A (ja) 音楽支援装置、音楽支援サーバ、音楽支援方法およびプログラム
JP2007264569A (ja) 検索装置、制御方法及びプログラム
JPH1031494A (ja) カラオケ装置
JP2008286946A (ja) データ再生装置、データ再生方法およびプログラム
JP2000156049A (ja) オーディオメディアおよびメディア再生装置
JP2005250242A (ja) 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体
JP4327165B2 (ja) 楽曲再生装置
JPH1091173A (ja) 楽音再生装置
JP4994890B2 (ja) 録音した自分の歌声と模範歌唱とを厳しく比較できるカラオケ装置
JP2000137490A (ja) カラオケ装置
KR0130364B1 (ko) 가라오케 시스템의 문자 디스플레이 제어방법
JP3673385B2 (ja) 音楽演奏装置
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
JP7295777B2 (ja) カラオケ装置
JP7312683B2 (ja) カラオケ装置
JP2005037848A (ja) 楽音発生装置及びそのプログラム
JP2011154290A (ja) 部分的に一人二重唱になる楽曲の歌唱を支援するカラオケ装置
JP7299810B2 (ja) カラオケ装置
JP2001312288A (ja) 音楽データ処理装置
JP2009244607A (ja) デュエットパート歌唱生成システム
JP4539647B2 (ja) コンテンツ再生装置
JP2007233078A (ja) 評価装置、制御方法及びプログラム
JP2002197488A (ja) リップシンクデータ生成装置並びに方法、情報記憶媒体、及び情報記憶媒体の製造方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090227