JP3878180B2 - カラオケ装置、カラオケ方法、ならびに、プログラム - Google Patents

カラオケ装置、カラオケ方法、ならびに、プログラム Download PDF

Info

Publication number
JP3878180B2
JP3878180B2 JP2004012763A JP2004012763A JP3878180B2 JP 3878180 B2 JP3878180 B2 JP 3878180B2 JP 2004012763 A JP2004012763 A JP 2004012763A JP 2004012763 A JP2004012763 A JP 2004012763A JP 3878180 B2 JP3878180 B2 JP 3878180B2
Authority
JP
Japan
Prior art keywords
data
input
section
unit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004012763A
Other languages
English (en)
Other versions
JP2005208196A (ja
Inventor
一喜 冨永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konami Digital Entertainment Co Ltd
Original Assignee
Konami Digital Entertainment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konami Digital Entertainment Co Ltd filed Critical Konami Digital Entertainment Co Ltd
Priority to JP2004012763A priority Critical patent/JP3878180B2/ja
Publication of JP2005208196A publication Critical patent/JP2005208196A/ja
Application granted granted Critical
Publication of JP3878180B2 publication Critical patent/JP3878180B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は、カラオケ装置、カラオケ方法、ならびに、これらをコンピュータにて実現するプログラムに関する。
従来から、種々のカラオケ装置が提供されている。カラオケ装置では、MIDI(Musical Instrument Digital Interface)データ等で用意された楽曲データや、PCM(Pulse Code Modulation)データ等で用意された音声波形データをあらかじめ用意しており、これを伴奏データとして音声出力するとともに、音声出力のタイミングに合わせてテレビジョン装置等の画面に歌詞を表示する。また、カラオケ装置に接続されたマイクから歌い手の音声波形データの入力を受け付け、これと、上記の伴奏データとを適宜混合(mixing;ミキシング)して、スピーカから音声出力する。伴奏データは、CD−ROM(Compact Disk Read Only Memory)やDVD−ROM(Digital Versatile Disk ROM)などの情報記録媒体に記録されている場合もあるし、コンピュータ通信網を介して、他の記憶装置から取得可能に構成されている場合もある。
さらに、コンピュータ技術の発展に伴い、各家庭にあるゲーム装置を利用して、カラオケを楽しむことができる環境が整いつつある。このようなゲーム装置を利用したカラオケでは、ビデオ出力はテレビジョン装置などに接続され、歌詞等を表示するのに用いられる。マイクはゲーム装置に直結され、マイクから入力された音声は、ゲーム装置用のDVD−ROMに記憶された伴奏データやコンピュータ通信網を介してダウンロードされた伴奏データとミキシングされて、テレビジョン装置やステレオ装置の音声入力を介してスピーカから出力される。
従来、カラオケ装置は、マイクから入力された歌い手の歌唱の様子を示す音声データを周波数分析や音量分析して、その時間変化を、あらかじめ用意された採点用の周波数成分や音量の時間変化とリアルタイムに対比して、採点を行うのが一般的であった。
しかしながら、採点をリアルタイムで行うと、早く歌い出してしまったり、歌い出しが遅れたり、等の時間的なずれを検知することは難しい。一方で、歌唱の各小節が正しいタイミングで歌われているか否かは、歌の上手下手に大きく関わるため、これを採点に用いたいという要望は大きい。
そこで、カラオケにおいて歌唱の時間的なずれを適切に検知して歌い手に提示する技術が強く求められている。
本発明は、歌唱の時間的なずれを適切に検知して歌い手に提示するのに好適なカラオケ装置、カラオケ方法、ならびに、これらをコンピュータによって実現するプログラムを提供することを目的とする。
以上の目的を達成するため、本発明の原理にしたがって、下記の発明を開示する。
本発明の第1の観点に係るカラオケ装置は、入力受付部、分析部、記憶部、抽出部、および、出力部を備え、以下のように構成する。
すなわち、入力受付部は、音声データの入力を受け付ける。
典型的には、カラオケ装置に接続されたマイクから、歌い手の歌唱の様子が音声データとして入力されることとなる。
一方、分析部は、入力を受け付けられた音声データの特徴情報を分析する。特徴情報としては、典型的には、音声データの周波数成分や音量、または、これらの双方などを採用することができる。
周波数成分の分析には、典型的には、高速フーリエ変換を用いたり、各音程(やこれをさらに細分化した周波数帯)ごとに複数用意されたバンドパスフィルタを用いる。そして、成分の強度が最も高いものを、歌い手の歌唱の音程とする。
音量の分析は、音声データの振幅や振幅の自乗などをそのまま利用するのが一般的であるが、上記歌い手の歌唱の音程の成分の強度を音量として採用しても良い。
なお、歌い出しなどの歌唱の時間的なずれを検知するためには、音程と音量の両方が必要でない場合も多い。したがって、いずれか一方のみを特徴情報として採用して、時間的なずれを検知するのでも良いし、両方を特徴情報として採用するのでも良い。
さらに、記憶部は、分析された特徴情報を、当該入力の受付開始からの経過時間に対応付けて、記憶する。
典型的には、所定の時間間隔(サンプリング間隔)で、分析された特徴情報をRAM(Randome Access Memory)やハードディスクなどの外部記憶装置に用意された配列に順に記憶していく。このサンプリング間隔は、時間的なずれを検知するための精度と、配列を用意する記憶装置の容量とを勘案して適宜選択することができる。
そして、抽出部は、当該入力の受付開始の後、所定の対比条件が満たされる場合、あらかじめ用意された採点データの特徴情報の経過時間に対する変化と、記憶された音声データの特徴情報の経過時間に対する変化と、を対比して、前者の変化と後者の変化とのずれが所定の範囲を超える後者の区間を抽出する。
ここで、「採点データ」とは、典型的には、歌唱の見本となるべき音程や音量で演奏を行うための演奏データである。したがって、「採点データ」をかりにそのまま演奏すれば、歌い手の見本となるべき音程・音量である楽器が演奏されたかのような音声出力される。
また、「採点データ」と「音声データ」の差異が大きければ、歌い手の歌唱が下手であることになり、一致の度合が高ければ、歌い手の歌唱が上手であることになる。
上記のように、所定の対比条件が満たされるまでは、マイクから入力された音声データを分析した特徴情報は記憶部に記憶されているのみであり、時間的なずれの検知は行わない。所定の対比条件が満たされて初めて、時間的なずれの大きさと、当該ずれが生じている区間を抽出する。したがって、典型的には、歌い手が1曲を歌い終わってから時間的なずれを検知することとなる。
なお、抽出される「区間」は、採点データに対するものであり、後述するように、歌唱の時間的なずれを歌い手に提示する場合には、RAMなどに記憶された特徴情報を用いるのではなく、採点データを用いて提示する。
また、「所定の対比条件」としては、1曲を歌い終わっているか否か、という条件を採用するのが典型的であるが、歌い手がコントローラ等を介して対比をするようにカラオケ装置に指示を出した場合に満たされることとしても良いし、歌い始めてから所定の時間が経過が経過したときに満たされるものとして設定しておいても良い。
一方、出力部は、記憶された特徴情報のうち、抽出された区間とそのずれの情報を出力する。
出力は、音声による出力、画面表示による出力など、種々の手法が考えられる。また、ずれの大きさをそのまま提示したり、わかりやすく提示したりするほか、ずれの大きさや、ずれが生じている区間の数や時間長によって歌唱に採点付けを行い、採点結果を出力する手法を採用することもできる。
本発明によれば、カラオケにおいて、歌い方に時間的なずれがある場合にはそれを検出して、歌い手にこれを報告することができるようになる。
また、本発明のカラオケ装置において、出力部は、抽出された区間に対応付けられる採点データを音声により出力するように構成することができる。
すなわち、採点データと音声データとに時間的なずれが生じている区間について、正しい音程、正しい強弱、正しいテンポである採点データを音声により再生出力するのである。
本発明によれば、歌のどの区間について、ユーザの歌唱に時間的なずれが生じているかを、ユーザは、正しい音程、正しい強弱、正しいテンポで再生される音声により知ることができるため、自己の歌唱において問題が生じている部分を容易に把握することができるようになり、研鑽を積むのに役立てることができる。
また、本発明のカラオケ装置は、再生部をさらに備え、以下のように構成することができる。
すなわち、再生部は、入力を受け付けられた音声データと、伴奏データと、を再生する。
典型的なカラオケ装置においては、ユーザはアカペラ(伴奏なし)で歌唱を行うのではなく、伴奏データをスピーカなどで音声出力するとともに、ユーザの歌唱を当該音声出力に混合して出力する。再生部は、このようなミキシング再生を行うのである。
一方、入力受付部は、当該伴奏データの再生の開始により当該入力の受付を開始する。
すなわち、本発明では、ユーザの歌唱に係る音声入力の処理を開始する契機として、伴奏データの再生開始を用いる。これによって、伴奏データが再生される前の音声入力は、かりに入力があったとしても、歌唱に係る音声データではないとして処理の対象とはしない。
さらに、当該所定の対比条件は、当該伴奏データの再生の終了により満たされる。
「所定の対比条件」として、伴奏の終了を採用することにより、ユーザが1曲を歌い終わっていることを確認するのである。
そして、出力部は、抽出された区間に対応付けられる伴奏データを、当該区間に対応付けられる採点データとともに、音声により出力する。
上記発明では、ずれが生じている区間に対応する採点データを再生することによって、歌のうちのどの区間について歌唱に時間のずれが生じていたかを知らせていたが、本発明では、当該採点データの再生とともに伴奏データを再生する。
本発明によれば、ユーザはカラオケの伴奏データを聞いて歌を歌うことができるようになる一方で、歌い始めに時間的なずれが生じた場合には、その区間についての伴奏データと採点データとが再生されるので、歌のうちのどの区間について歌唱に時間のずれが生じていたかを、さらに容易に知ることができるようになる。
また、本発明のカラオケ装置において、出力部は、当該伴奏データの音声による出力に対して、当該採点データを、当該区間に対するずれだけ時間的にずらして、音声により出力するように構成することができる。
たとえば、ある区間について、歌い始めが○○秒遅れた場合に、これを出力部が知らせる際には、当該区間に対応する伴奏データの再生から○○秒遅れて採点データを再生するようにする。
本発明によれば、どの程度歌い出し等に時間的なずれが生じていたかを、伴奏データの再生と採点データの再生とを時間的にずらすことによって、ユーザは容易に知ることができるようになる。
また、本発明のカラオケ装置において、出力部は、当該採点データの区間に対応付けられた文字または図形を、当該採点データの音声による出力に同期させて画面表示して出力するように構成することができる。
一般にカラオケにおいては、伴奏データの再生に合わせて歌詞を表す文字を画面に表示する。本発明の一形態においては、出力部において採点データを再生する際に、採点データの再生の進行状況に同期させて、その歌詞を表示するのである。また、図形を同期させて画面表示する場合は、採点データがどの程度再生されたかを表す棒グラフ等の図形の長さの変化を採点データの音声出力に同期させる等が考えられる。
本発明によれば、歌い出し等に時間的なずれが生じていた部分について、当該採点データの再生に合わせて、当該採点データの区間に対応付けられた歌詞などが画面に時間を追って表示されるので、ユーザは、採点データにおける時間経過を容易に知ることができるようになる。
また、本発明のカラオケ装置において、出力部は、当該採点データの区間に対応付けられた文字または図形を、当該採点データを当該区間に対するずれだけ時間的にずらさずに音声により出力したとした場合の出力に同期させてさらに画面表示して出力するように構成することができる。
上記発明では、採点データの再生に同期させて歌詞等の文字や図形を表示していたが、本発明では、さらに、「当該採点データを当該区間に対するずれだけ時間的にずらさずに音声により出力したとした場合の出力」に同期させて(いわば伴奏データの出力に同期させて)、さらに歌詞等の文字や図形を表示する。たとえば、歌詞を表示する場合に、検知された時間のずれが○○秒遅れであった場合は、正しく歌えたとした場合の歌詞表示(伴奏に合った歌詞表示)がされるとともに、○○秒遅れで同じ歌詞が別途表示されることとなる。棒グラフ等で進行状況を提示する場合は、正しく歌ったとした場合の進行状況の棒グラフ等の表示から○○秒遅れで別の棒グラフ等が表示されることとなる。
本発明では、歌い出し等に時間的なずれが生じていた部分について、その時間的なずれだけずらして2つの表示を行うことにより、ずれが生じていた部分やずれの大きさをわかりやすくユーザに提示することができるようになる。
また、 本発明のカラオケ装置において、出力部は、当該伴奏データの音声による出力に対して当該採点データを当該区間に対するずれだけ時間的にずらして、当該ずらした音声を所定の第1出力系統を介して音声により出力し、当該伴奏データの音声による出力に対して当該採点データを時間的にずらさずに当該ずらさない音声を所定の第2出力系統を介して音声により出力するように構成することができる。
たとえば、本発明のカラオケ装置がステレオ再生可能なものである場合、右チャンネルと左チャンネルのいずれか一方を第1出力系統に、他方が第2出力系統に、それぞれ対応付けることができる。そして、第1出力系統のチャンネルからはユーザの歌唱に即した採点データの音声出力を行い、第2出力系統のチャンネルからは正しく歌えたとした場合の採点データの音声出力を行うのである。これらのほか、伴奏データも音声出力されるため、第2出力系統のチャンネルからの採点データの音声出力と伴奏データの音声出力とは、歌唱の見本となるべく同期していることになる。
本発明では、ヘッドホンを用いて音声出力を聞いた場合は特に、ユーザは、歌い出し等の時間的なずれを左右の音の時間差によって知得することができるようになる。
また、本発明は、以下のように構成することができる。
すなわち、分析部は、音声データの特徴情報として、周波数成分および音量の両方を分析する。
上記発明では、時間的なずれが検知できるのであれば、周波数成分のみを特徴情報としても良いし、音量のみを特徴情報としても良いし、周波数成分と音量の両方を合わせて特徴情報としても良い、としていたが、本発明では、周波数成分と音量の両方を合わせて特徴情報とする。
一方、出力部は、「当該採点データを音声により出力」するのにかえて、「『前記抽出された採点データの区間に対応する当該記憶された特徴情報の経過時間に対する変化の区間を』音声により出力」する。
上記発明では、時間的なずれが生じていた部分を音声によりユーザに知らせるために、採点データを再生することとしていたが、本実施形態では、ユーザの声がマイク等を介して入力された音声データの周波数成分および音量の変化のうち、時間的なずれが生じていた部分を音声出力する。
本発明によれば、ユーザの歌い方を録音してそのまま再生するのではなく、その周波数成分(音程)および音量のみをあらかじめ分析しておいて、歌い方に時間的なずれが生じた区間についてその音程・音量で音声再生をしてユーザの歌い方をある程度再現することにより、歌い方に問題がある部分について、ユーザにわかりやすく提示することができるようになる。
本発明のその他の観点に係るカラオケ方法は、入力受付部、分析部、記憶部、抽出部、および、出力部を備えるカラオケ装置において使用されるカラオケ方法であって、入力受付工程、分析工程、記憶工程、抽出工程、および、出力工程を備え、以下のように構成する。
すなわち、入力受付工程では、当該入力受付部が、音声データの入力を受け付ける。
一方、分析工程では、当該分析部が、入力を受け付けられた音声データの特徴情報を分析する。
さらに、記憶工程では、当該記憶部に、分析された特徴情報を、当該入力の受付開始からの経過時間に対応付けて、記憶する。
そして、抽出工程では、当該抽出部が、当該入力の受付開始の後、所定の対比条件が満たされる場合、記憶された音声データの特徴情報の経過時間に対する変化を、あらかじめ用意された採点データの経過時間に対する変化と対比して、前者の変化と後者の変化とのずれが所定の閾値を超える区間を抽出する。
一方、出力工程では、当該出力部が、記憶された特徴情報のうち、抽出された区間の情報を出力する。
本発明の他の観点に係るプログラムは、コンピュータを、上記のカラオケ装置の各部として機能させ、もしくは、コンピュータに、上記のカラオケ方法の各工程を実行させるように構成する。
また、本発明のプログラムは、コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリ等のコンピュータ読取可能な情報記録媒体に記録することができる。上記プログラムは、当該プログラムが実行されるコンピュータとは独立して、コンピュータ通信網を介して配布・販売することができる。また、上記情報記録媒体は、当該コンピュータとは独立して配布・販売することができる。
本発明によれば、歌唱の時間的なずれを適切に検知して歌い手に提示するのに好適なカラオケ装置、カラオケ方法、ならびに、これらをコンピュータによって実現するプログラムを提供することができる。
以下に本発明の実施形態を説明する。以下では、理解を容易にするため、ゲーム装置に本発明が適用される実施形態を説明するが、各種のコンピュータ、PDA、携帯電話などの情報処理装置においても同様に本発明を適用することができる。すなわち、以下に説明する実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
図1は、本発明の実施形態の1つに係るカラオケ装置が実現される典型的なゲーム装置の概要構成を示す模式図である。以下、本図を参照して説明する。
ゲーム装置100は、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、インターフェース104と、コントローラ105と、外部メモリ106と、画像処理部107と、DVD(Digital Versatile Disk)−ROMドライブ108と、NIC(Network Interface Card)109と、を備える。
ゲーム用のプログラムおよびデータを記憶したDVD−ROMをDVD−ROMドライブ108に装着して、ゲーム装置100の電源を投入することにより、当該プログラムが実行され、本実施形態のカラオケ装置が実現される。
CPU 101は、ゲーム装置100全体の動作を制御し、各構成要素と接続され制御信号やデータをやりとりする。また、CPU 101は、レジスタ(図示せず)という高速アクセスが可能な記憶域に対してALU(Arithmetic Logic Unit)(図示せず)を用いて加減乗除等の算術演算や、論理和、論理積、論理否定等の論理演算、ビット和、ビット積、ビット反転、ビットシフト、ビット回転等のビット演算などを行うことができる。さらに、マルチメディア処理対応のための加減乗除等の飽和演算や、三角関数等、ベクトル演算などを高速に行えるように、CPU 101自身が構成されているものや、コプロセッサを備えて実現するものがある。
ROM 102には、電源投入直後に実行されるIPL(Initial Program Loader)が記録され、これが実行されることにより、DVD−ROMに記録されたプログラムをRAM 103に読み出してCPU 101による実行が開始される。また、ROM 102には、ゲーム装置100全体の動作制御に必要なオペレーティングシステムのプログラムや各種のデータが記録される。
RAM 103は、データやプログラムを一時的に記憶するためのもので、DVD−ROMから読み出したプログラムやデータ、その他ゲームの進行やチャット通信に必要なデータが保持される。また、CPU 101は、RAM 103に変数領域を設け、当該変数に格納された値に対して直接ALUを作用させて演算を行ったり、RAM 103に格納された値を一旦レジスタに格納してからレジスタに対して演算を行い、演算結果をメモリに書き戻す、などの処理を行う。
インターフェース104を介して接続されたコントローラ105は、ユーザがカラオケなどのゲーム実行の際に行う操作入力を受け付ける。
インターフェース104を介して着脱自在に接続された外部メモリ106には、カラオケのプレイ状況(過去に歌った楽曲や採点結果等)を示すデータ、ゲームの進行状態を示すデータ、チャット通信のログ(記録)のデータなどが書き換え可能に記憶される。ユーザは、コントローラ105を介して指示入力を行うことにより、これらのデータを適宜外部メモリ106に記録することができる。
DVD−ROMドライブ108に装着されるDVD−ROMには、ゲームを実現するためのプログラムとゲームに付随する画像データや音声データが記録される。CPU 101の制御によって、DVD−ROMドライブ108は、これに装着されたDVD−ROMに対する読み出し処理を行って、必要なプログラムやデータを読み出し、これらはRAM 103等に一時的に記憶される。
画像処理部107は、DVD−ROMから読み出されたデータをCPU 101や画像処理部107が備える画像演算プロセッサ(図示せず)によって加工処理した後、これを画像処理部107が備えるフレームメモリ(図示せず)に記録する。フレームメモリに記録された画像情報は、所定の同期タイミングでビデオ信号に変換され画像処理部107に接続されるモニタ(図示せず)へ出力される。これにより、各種の画像表示が可能となる。
画像演算プロセッサは、2次元の画像の重ね合わせ演算やαブレンディング等の透過演算、各種の飽和演算を高速に実行できる。
また、仮想3次元空間に配置され、各種のテクスチャ情報が付加されたポリゴン情報を、Zバッファ法によりレンダリングして、所定の視点位置から仮想3次元空間に配置されたポリゴンを俯瞰したレンダリング画像を得る演算の高速実行も可能である。
さらに、CPU 101と画像演算プロセッサが協調動作することにより、文字の形状を定義するフォント情報にしたがって、文字列を2次元画像としてフレームメモリへ描画したり、各ポリゴン表面へ描画することが可能である。フォント情報は、ROM 102に記録されているが、DVD−ROMに記録された専用のフォント情報を利用することも可能である。
NIC 109は、ゲーム装置100をインターネット等のコンピュータ通信網(図示せず)に接続するためのものであり、LAN(Local Area Network)を構成する際に用いられる10BASE−T/100BASE−T規格にしたがうものや、電話回線を用いてインターネットに接続するためのアナログモデム、ISDN(Integrated Services Digital Network)モデム、ADSL(Asymmetric Digital Subscriber Line)モデム、ケーブルテレビジョン回線を用いてインターネットに接続するためのケーブルモデム等と、これらとCPU 101との仲立ちを行うインターフェース(図示せず)により構成される。
音声処理部110は、DVD−ROMから読み出した音声データをアナログ音声信号に変換し、これに接続されたスピーカ(図示せず)から出力させる。また、CPU 101の制御の下、ゲームの進行の中で発生させるべき効果音や楽曲データを生成し、これに対応した音声をスピーカから出力させる。
音声処理部110は、DVD−ROMに記録された音声データがMIDIデータである場合には、これが有する音源データを参照して、MIDIデータをPCMデータに変換する。また、ADPCM形式やOgg Vorbis形式等の圧縮済音声データである場合には、これを展開してPCMデータに変換する。PCMデータは、そのサンプリング周波数に応じたタイミングでD/A(Digital/Analog)変換を行って、スピーカに出力することにより、音声出力が可能となる。
さらに、ゲーム装置100には、インターフェース104を介してマイク111を接続することができる。この場合、マイク111からのアナログ信号に対しては、適当なサンプリング周波数でA/D変換を行い、PCM形式のディジタル信号として、音声処理部110でのミキシング等の処理ができるようにする。
ゲーム装置100をカラオケ装置として利用する場合には、DVD−ROMから読み出した音声データ、もしくは、NIC 109を介してコンピュータ通信網から取得した音声データを伴奏データとし、マイクから入力された音声データを歌唱データとして、伴奏データと歌唱データを音声処理部110がミキシングし、スピーカから出力する。また、スピーカにかえて、ヘッドホン(図示せず)やイヤフォン(図示せず)を用いて、音声を出力させることもできる。
このほか、ゲーム装置100は、ハードディスク等の大容量外部記憶装置を用いて、ROM 102、RAM 103、外部メモリ106、DVD−ROMドライブ108に装着されるDVD−ROM等と同じ機能を果たすように構成してもよい。
(カラオケ装置の構成)
図2は、上記ゲーム装置100等の上に実現されるカラオケ装置の概要構成を示す説明図である。図3は、当該カラオケ装置にて実行されるカラオケ方法の制御の流れを示すフローチャートである。以下、本図を参照して説明する。
本実施形態に係るカラオケ装置201は、入力受付部202、分析部203、記憶部204、抽出部205、出力部206、および、表示部207、操作部208を備え、ゲーム装置100上に実現される。
まず、カラオケ装置201は、表示部207にメッセージを表示して、カラオケをしたい楽曲をユーザに選択させる(ステップS301)。ここで、表示部207としては、画像処理部107を用い、メッセージは、テレビジョン装置などのモニタに表示される。
そして、ユーザが、コントローラ105などにより構成される操作部208を用いて、所望の楽曲を選択すると、選択された楽曲の伴奏データと採点データを、コンピュータ通信網を介してNIC 109経由で接続されたカラオケサーバ装置からダウンロードする(ステップS302)。
本実施形態では、伴奏データと採点データは、MIDIデータとして提供される。MIDIデータは、複数の音源に対応付けられる複数のチャンネルからなる。各チャンネルは、たとえば、ピアノ、ギター、ベース、ドラムなどの楽器に割り当てられており、ゲーム装置100の音声処理部110にあらかじめ用意された音源データに対応付けられている。
MIDIデータの指令は、先の指令を出してからどれだけ時間が経過してからこの指令を実行するかを示す経過時間、どのチャンネルに対する指令かを表す番号(チャンネル指定がない場合もある。)、音高・音程、音量、音の演出効果を示す識別子ならびにパラメータを含むものが一般的であるが、ベンダーが自由に利用できるように予約された指令(「システム・エクスクルーシブ」と呼ばれる。)もある。
本実施形態では、伴奏データは、上記のような伴奏に用いられる音源(楽器)に割り当てられたチャンネルに対応付けられるMIDIデータによって表現される。一方、採点データは、通常のカラオケの伴奏には用いない音源に割り当てられたチャンネルに対応付けられる。
したがって、採点データを、何らかの音源に割り当てて再生すれば、カラオケを歌う際の見本となる音程・音量で(カラオケの歌詞を無視してハミングしたかのように)再生されることになる。
また、後述するように、本実施形態では、歌唱の時間的なずれを検知するが、その検知を行う単位を1小節ごとに行う。すなわち、「この小節は、○○秒歌い始めが遅れている」「この小節は、○○秒歌い始めが進んでいる」のような情報を検知することによって、ユーザの歌唱の実力向上に役立てようとしている。
そこで、小節と小節の区切は、上記のシステム・エクスクルーシブに適当なベンダ拡張命令を定義して、これを用いることによって表現する。
このように、MIDIデータの「経過時間」の情報を逐次加算していけば、演奏開始からの経過時間を知ることができる。また、「システム・エクスクルーシブ」によって、時間のずれを検出する区間の区切を表現する。さらに、採点用のデータを扱うチャンネルを伴奏用のデータとは別に設けることによって、カラオケをプレイするとき(ユーザが歌うとき)には、採点データのチャンネルを再生しないこととし、後述するように時間のずれを再現する際に採点データのチャンネルを再現することができる。
このほか、カラオケにおいては、歌詞が伴奏に同期して画面に表示される。そこで、このような歌詞データもMIDIデータの「システム・エクスクルーシブ」に含めるようにすることが望ましい。CPU 101は、MIDIデータを音声処理部110に引き渡して処理させるのと同時に、音声処理部110がどこまでMIDIデータを処理したのかを監視し、それに応じて、MIDIデータから歌詞データを走査して、画像処理部107を制御して対応する歌詞データをモニタに表示させるのである。その詳細については、後述する。
尚、MIDIデータを用いなくとも、上記のような機能を果たす独自のフォーマットで、採点データや伴奏データを表現した場合にも、本発明の範囲に含まれる。たとえば、採点データは1チャンネルのMIDIデータで表現し、伴奏データはOgg Vorbis形式の音声データで表現する等である。この場合は、伴奏データと採点データとに矛盾が生じないように、それぞれの経過時間や区間の定義等に整合性を持たせるようにデータを定義する必要がある。
また、本実施形態は、いわゆるネットワークカラオケに相当するものであり、ダウンロードしたMIDIデータはRAM 103に一時的に格納される。また、ハードディスク等の外部記憶装置を有する場合には、そちらに蓄積保存することとしても良い。また、採点データや伴奏データとして、DVD−ROMやCD−ROMに記録されたものを利用することとし、DVD−ROMドライブ108を用いてこれらの情報を読み出すように構成することも可能である。
次に、CPU 101は、RAM 103に記憶したMIDIデータを指定して、当該MIDIデータを演奏するように音声処理部110に指示を出す(ステップS303)。すると、音声処理部110は、MIDIデータを順次解釈し、適切な音源データを取得してPCMデータに変換し、これをD/A変換してスピーカから出力する、という処理を、以降のCPU 101における処理と並行して行うこととなる。なお、音声処理部110は、後述するように、マイク111から入力された音声データと伴奏データとのミキシングも行う。
ついで、CPU 101は、演奏を開始してからの経過時間を記憶する領域をRAM 103内に確保し、当該経過時間領域に値0(演奏を開始した時刻であることを意味する。)を格納する(ステップS304)。
ついで、音声処理部110に、MIDIデータの演奏を開始してから経過時間が、RAM 103内の経過時間領域に格納された経過時間に所定の間隔値を加算したものとなるまで待機する(ステップS305)。ここで待機するためには、音声処理部110に、演奏開始からの経過時間を問い合わせ、上記条件が満たされるまでこれを繰り返すのでも良いし、割込処理を利用するのでも良い。
また、「所定の間隔値」は、マイク111から入力されるPCMデータをバッファリングできる時間長などの定数としても良いし、現在演奏されているMIDIデータのテンポに応じて変化させても良い。また、1小節の時間長を所定の整数で割った長さ(たとえば、4分音符の長さの256分の1等。)、とするのでも良い。以下では、理解を容易にするため、定数dであるとする。
そして、CPU 101は、RAM 103に記憶されたMIDIデータを走査して、「RAM 103内の経過時間領域に格納された経過時間」から、「RAM 103内の経過時間領域に格納された経過時間に所定の間隔値を加算した経過時間」までの間(以下「繰り返し単位」という。)に、処理すべきものとして指定されている歌詞データを抽出し(ステップS306)、当該歌詞データにしたがって画像処理部107に指示を出して、モニタに歌詞を表示させる(ステップS307)。
カラオケにおいては、歌い手のために、モニタにこれから歌うべき歌詞を表示し、伴奏が進むにつれて歌うべき場所の歌詞の色が変化していくという処理を行うことが一般的であるが、適切に歌詞データをMIDIデータ内に埋め込んでおくことによって、これを実現することができる。
さらに、CPU 101は、歌い手がマイク111を介して歌声を入力し、マイク111やこれをインターフェース104や適切なサンプリング周波数でD/A変換を行うことによって得られるPCMデータのうち、今回の繰り返し単位の間に入力されたものを取得してRAM 103に保存し(ステップS308)、当該PCMデータを音声処理部110に渡して伴奏データとミキシングさせて、スピーカから再生させる(ステップS309)。
「所定の間隔値」を十分に小さくすれば、ステップS308〜ステップS309の処理によって歌声が遅れる度合は十分に無視できる。なお、マイク111から入力されるPCMデータは、CPU 101の処理とは並行して音声処理部110に渡されるものとして、ミキシングによる遅延が生じないようにしても良い。
上記のように、本処理では、伴奏が開始されて以降にマイク111から入力されたPCMデータを処理の対象とするため、伴奏が開始される以前にマイク111に音声が入力されたとしても、その入力は無視されることになる。
さて、ここで得られるPCMデータは、今回の繰り返し単位の間に入力が受け付けられたものである。そこで、CPU 101は、PCMデータを分析して、以下のような情報を得る(ステップS310)。したがって、CPU 101は、分析部203として機能する。
(a)現在のPCMデータの基本周波数。これによって現在の歌声の音程が判明する。たとえば、PCMデータを高速フーリエ変換することによって周波数スペクトルを得れば、最も成分が大きい周波数が基本周波数となる。このほか、複数の互に異なる周波数帯の信号を通過させるバンドパスフィルタを用意して、これらの出力のうち、最も大きい成分を出力したバンドパスフィルタの周波数帯を基本周波数としても良い。
(b)現在のPCMデータの変位の2乗平均(パワー)。これによって現在の歌声の大きさが判明する。たとえば、PCMデータは、数値の列と見ることができるが、「当該数値の列に含まれるそれぞれの数値の自乗の平均」から、「当該数値の列に含まれる数値の平均の自乗」を減算すれば、「PCMデータの変位の2乗平均」が得られる。
そして、これらの特徴情報を、RAM 103に保存する(ステップS311)。したがって、RAM 103は、CPU 101と共働して、記憶部204として機能する。
以下、理解を容易にするため、演奏を開始してからi回目の繰り返し単位(「演奏開始からの経過時間id」から「演奏開始からの経過時間(i+1)d」までの間)における基本周波数はf[i]と、パワーはa[i]と書くこととする。
尚、RAM 103の容量が小さいために、1曲のカラオケをプレイした場合のすべてのf[i]やa[i]を記憶させることができない場合がある。その場合は、適宜間引を行えば良い。
たとえば、N回に1回だけ記憶させるとするならば、iがNの倍数のときにだけRAM 103にf[i],a[i]を記憶させることとし、このf[i],a[i]は、「演奏開始からの経過時間id」から、「演奏開始からの経過時間(i+N)d」までの間における基本周波数とパワーであるものとして扱えば良い。すなわち、f[i] = f[i+1] = … = f[i+N-1],a[i] = a[i+1] = … = a[i+N-1],であるものとして扱えば良いのである。尚、以下では、理解を容易にするため、N=1であるものとして説明する。
このほか、ミキシングをする際の「所定の間隔値」と分析を行う際の「所定の間隔値」とを、異なる値とすることによっても、分析された結果のデータの容量を調節することができる。
そして、ステップS305においてRAM 103内の経過時間領域に格納された値にdを加算して更新し(ステップS312)MIDIデータの演奏が終わっていないか調べ(ステップS313)、終わっていなければ(ステップS313;No)、ステップS305に戻る。
なお、ステップS313における判断は、「伴奏が終了したか否か」に相当するが、ユーザがコントローラ105を操作することによって途中で歌唱を中止した場合には、直ちに抽出処理を終了して、以降の処理に進むようにしても良い。この場合は、以降の処理で対象となる区間として、ステップS312で直前に処理を行った区間を最後の区間とすることとなる。
一方終わっていれば、後述する抽出処理を実行し(ステップS314)、その抽出の結果を後述する出力処理によって出力して(ステップS315)、本処理を終了する。
図4は、抽出処理の制御の流れを示すフローチャートである。
上記のように、RAM 103には、時間間隔dで分析した結果得られた基本周波数の数列f[0],f[1],f[2],…とパワーの数列a[0],a[1],a[2],…とが記憶されている。
一方、採点用データとして、MIDIデータのあるチャンネルに、演奏開始からの経過時間に対応付けることが可能なように音程データと音量データとが採点データとして埋め込まれている。MIDIデータを走査すれば、各データ断片が処理されるべき「演奏開始からの経過時間」を得ることができ、音程データからは対応する基本周波数を得ることができる。また、音量はパワーと相関がある。典型的には、音量の2乗がパワー、あるいは、音量そのものがパワーである。
そこで、演奏開始からの経過時間をtとしたときの、tにおける採点データの基本周波数をg(t)、パワーをb(t)と書くこととする。
また、MIDIデータには、小節ごとの区切のデータも含まれている。そこで、i番目の小節が始まる「演奏開始からの経過時間」をs(i)と書くこととすると、i番目の小節は、「演奏開始からの経過時間t」がs(i)≦t<s(i+1)である区間になる。
そこで、対比のために、当該区間の採点データから、対比用の基本周波数g(s(i)),g(s(i)+d),…,g(s(i+1)-d)、および、パワーb(s(i)),b(s(i)+d),…,b(s(i+1)-d)を得る。これらはいずれも、(s(i+1)-s(i))/d個の数値データであるから、(s(i+1)-s(i))/d次元のベクトルと見ることができる。そこで以下では、前者をベクトルG[i]と、後者をベクトルB[i]と、それぞれ書くこととする。
一方、採点データに対する入力された音声データ(歌声)の時間的なずれをδdとすると、これに対応する歌声の区間の基本周波数はf[s(i)/d+δ],f[s(i)/d+δ+1],…,f[s(i+1)d+δ-1]パワーは、a[s(i)/d+δ],a[s(i)/d+δ+1],…,a[s(i+1)d+δ-1]となる。
そこで、これらも(s(i+1)-s(i))/d次元のベクトルと見て、前者をF[i,δ]と、後者をA[i,δ]と、それぞれ書くこととする。
さて、時間的なずれがδdであることから、G[i]とF[i,u]の相関の値、および、B[i]とA[i,u]の相関の値は、いずれも、u = δで極大となるべきである。逆に言えば、ある所定の範囲でuを変化させて、これらの相関の値を求め、これが最大となるuをδとすれば、時間的なずれδdを求めることができる。これは、通信技術におけるスライド同期に相当する。なお、歌声のサンプリングの精度を考えれば、得られるずれの精度はd程度であるから、u,δとしては整数を考えれば十分である。
uを変化させる範囲については、歌がどの程度までずれることを想定するか、によって、適宜決めれば良い。たとえば、前後L秒までのずれを検出するのであれば、-L/d≦u≦L/dの範囲でuを変化させればよい。
さて、相関の値の具体的な計算方法であるが、1つの手法としては、2つのベクトルp,qがあるときに、これらの相関の値は、ベクトルp,qがなす角の余弦(cosine)とする手法がある。すなわち、(p・q)/(|p| |q|)をp,qの相関の値C(p,q)とするのである。
N次元ベクトルpのi番目の要素をp[i]と表記することとすると、ベクトルの内積p・qは、以下の計算によって求めることができる。
p・q = Σi=0 N-1p[i]q[i]
また、ベクトルの大きさ|p|は、以下の計算によって求めることができる。
|p| = (p・p)1/2
さて、本実施形態では、基本周波数の相関と、パワーの相関と、の、2つの値が求められる。したがって、それぞれについて時間的なずれを求めても良いが、両者が異なる場合に、ユーザに両方の値を出力してもユーザがとまどうことも多い。
そこで、あらかじめ正定数KおよびHを定めておき、i番目の区間について、-L/d≦u≦L/dの範囲でuを変化させて
z(i,u) = K C(G[i],F[i,u]) + H C(B[i],A[i,u])
を計算し、その値が極大となるuを求めて、これをδとすれば良い。
なお、δ = 0の場合はずれがなく、δが正の場合は、歌唱が伴奏に比べて遅れていることになり、δが負の場合は、歌唱が伴奏に比べて進んでいることになる。
以下、具体的に抽出処理について述べる。
まず、CPU 101は、RAM 103内に用意された変数領域iに0を格納する(ステップS401)。
そして、CPU 101は、RAM 103内に記憶されたMIDIデータを走査して、i番目の区間の開始時間s(i)と終了時間s(i+1)を求める(ステップS402)。
ついで、CPU 101は、RAM 103内に記憶されたMIDIデータを走査して、採点データを調べ、ベクトルG[i]およびベクトルB[i]を取得する(ステップS403)。
さらに、CPU 101は、これらのベクトルの大きさ|G[i]|および|B[i]|を計算する(ステップS404)。
次に、CPU 101は、RAM 103内に用意された変数領域uに値-L/dを、変数領域δに値0を、変数領域mに値0を、それぞれ格納する(ステップS405)。
そして、u≦L/dである間(ステップS406)、以下のステップS407〜ステップS412を繰り返す。
RAM 103内に記憶されたPCMデータ(マイク111から入力された音声を前述のようにサンプリングしたもの)から、ベクトルF[i,u]およびベクトルA[i,u]を取得する(ステップS407)。
次に、CPU 101は、これらのベクトルの大きさ|F[i,u]|および|A[i,u]|を計算する(ステップS408)。
さらに、CPU 101は、相関値z[i,u]を計算する(ステップS409)。
そして、CPU 101は、z[i,u]>mであるか否かを調べ(ステップS410)、そうである場合(ステップS410;Yes)、変数領域δに値uを、変数領域mに値z[i,u]を、それぞれ格納する(ステップS411)、
ついで、uの値を1増やし(ステップS412)、ステップS406に戻る。
さて、ステップS406〜ステップS412の繰り返しが終わったら(ステップS406;No)、CPU 101は、i番目の区間についての時間のずれをδdであるとして、この情報をRAM 103に記録する(ステップS413)。本実施形態では、あらかじめ、RAM 103にずれを記憶するための配列wを用意し、CPU 101が、i番目の区間についての時間のずれを、当該配列のi番目の要素w[i]に記憶させる。
そして、終了時間s(i+1)がMIDIデータの演奏時間に至ったか否かを調べ(ステップS414)、至っていない場合(ステップS414;No)、iを1増やして(ステップS415)、ステップS402に戻る。一方、至った場合(ステップS414;Yes)、本処理を終了する。
このようにして、各区間についての時間のずれが抽出された後は、当該時間のずれを歌い手に知らせる必要がある。最も単純には、配列wの要素を順に画面に表示して、各小節(区間)ごとにどれだけの時間のずれがあったかを知らせる手法がある。
もっとも、本実施形態では、さらに歌い手に時間のずれをわかりやすく通知するための工夫を行っている。以下では、このための出力処理の詳細について説明する。
図5は、出力処理の制御の流れを示すフローチャートである。本実施形態では、歌い手の歌唱の時間のずれを、主として聴覚によって知らせる手法を採用する。以下、本図を参照して説明する。
上記のように、RAM 103内の配列wに各区間の時間のずれが格納されているので、まず、CPU 101は、当該配列のうち、時間のずれの絶対値|w[i]|を大きい順に上位から所定の数だけ選択する(ステップS501)。
次に、CPU 101は、ステップS501で選択されたものから、絶対値|w[i]|が所定の閾値よりも大きいものをさらに選択する(ステップS502)。ここでの「所定の閾値」とは、これよりも時間が短かければ、人間の聴覚には、遅れたり進んだりしているとは認識できないような、短かい時間を、あらかじめ設定すればよい。
そして、CPU 101は、ステップS502において選択された配列の要素の数が0個であるか否かを調べる(ステップS503)。0個である場合(ステップS503;Yes)、歌い手の歌い出しは正確である旨を報告して(ステップS504)、本処理を終了する。
一方、ステップS502において選択された配列の要素の数が0個でない場合(ステップS503;No)、CPU 101は、ステップS502において選択された配列の要素を、所定の順序に並べる(ステップS505)。ここで、所定の順序としては、以下のような態様が考えられる。
(a)添字iの順番。すなわち、歌の中でそれぞれの区間が出現する順。
(b)時間のずれの絶対値の大きい順。すなわち、歌唱の中での、ずれが大きい順。
(c)時間のずれの値の順またはその逆順。すなわち、歌唱の中での遅れまたは進みが大きい順。
次に、ステップS502において選択された配列の要素に対応する区間のそれぞれについて、ステップS505において得られた順に、ステップS507〜ステップS513の処理を繰り返す(ステップS506)。
当該区間がi番目の小節であるとすると、CPU 101は、w[i]の正であるか否かを判断する(ステップS507)。
w[i]が正である場合(ステップS507;Yes)、CPU 101は、音声処理部110に対して、i番目の区間のMIDIデータのうち、伴奏データに係るチャンネルの再生を開始する旨の指示を出す(ステップS508)。そして、CPU 101は、w[i]に相当する時間だけ待機してから(ステップS509)、音声処理部110に対して、i番目の区間のMIDIデータのうち、採点データに係るチャンネルの再生を開始する旨の指示を出す(ステップS510)。
上記のように、採点データに係るチャンネルは、カラオケのプレイ時には音源を割り当てず、再生も行わない(ただし、見本音声として、たとえば小さな音量で再生するようにしてもよい。)。一方、出力時には、採点データに係るチャンネルに適当な音源(伴奏に使われていない音源データや、正弦波、方形波のように容易に生成できる音源データ等。)を当該採点データに割り当てて再生を行う。
一方、w[i]が正でない場合(ステップS507;No)、CPU 101は、i番目の区間のMIDIデータのうち、採点データに係るチャンネルの再生を開始する旨の指示を出す(ステップS511)。そして、|w[i]|に相当する時間だけ待機してから(ステップS512)、音声処理部110に対して、i番目の区間のMIDIデータのうち、伴奏データに係るチャンネルの再生を開始する旨の指示を出す(ステップS513)。
ステップS506〜ステップS513の処理の繰り返しが終わったら、本処理を終了する。
本実施形態によれば、ユーザの歌唱データそのものをすべて録音する必要がないため、RAM 103などの記憶容量に制限があるゲーム装置100などの安価なハードウェアにおいても、伴奏と歌唱とのずれをユーザが聴覚によって知得することができる。
なお、ハードディスクなどを外部記憶装置として備えるゲーム装置100においては、伴奏データと採点データとの再生開始の時間をずらして再生するのではなく、ユーザの歌唱のPCMデータをそのまま(もしくは適宜圧縮して)録音し、伴奏データの当該区間と、当該区間の再生時に録音されたPCMデータと、を同時にミキシングして再生することとしても良い。この場合には、よりリアルに、ユーザの歌唱のずれを再現することができる。
また、上記実施形態では、原則として伴奏の開始から終了までにマイク111から入力された音声データの時間のずれを検出してこれを報告しようとするが、ある一定の範囲の区間について何回も練習したい場合には、ユーザの指示入力によって、「伴奏全体の開始から終了まで」にかえて、「ユーザが指定した範囲の区間」について、上記の処理を実行しても良い。
また、上記実施形態では、時間のずれが生じている区間のうち上位のものについて、歌唱と伴奏とを当該区間についてのみ再生する。したがって、ある小節のみにおいて時間のずれが生じていた場合は、当該小節のみが出力されることとなる。
しかしながら、時間のずれが生じている場合には、その前後の様子も合わせて再生した方が、ユーザにわかりやすいことも多い。
そこで、i (i≧1)番目の区間について出力の処理を行う場合には、伴奏データについては、i-1番目の区間からi+1番目の区間まで順に連続して再生することとしても良い。この場合、採点データについては、i-1番目の区間の再生を開始してからs(i-1) + w[i]だけ時間が経過した後に再生を開始する。
これによって、特に、歌い出しが早い場合に、そのずれをわかりやすくユーザに提示することができるようになる。
このほか、カラオケ装置でステレオ出力ができる場合においては、採点データの再生の際に、一方の出力(たとえば、左側出力)では、伴奏データに同期して採点データを再生し、他方の出力(たとえば、右側出力)では、上記のように伴奏データとはw[i]を考慮して時間をずらして採点データを再生するようにしても良い。
この場合は、正しい歌い出し(見本)とユーザが行った歌唱(実際)の歌い出しとが、ヘッドホンやスピーカの左右からずれて再生されるため、ユーザはずれの程度をわかりやすく把握できるようになる。
また、上記のように、カラオケ装置においては、採点データ(を伴奏データと時間のずれなく再生したもの)に同期して歌詞がモニタに表示される。そこで、「伴奏データと同期して採点データを再生したとした場合の歌詞表示」と、「伴奏データとw[i]だけ時間をずらして採点データを再生した場合の歌詞表示」と、を画面の異なる位置に表示することとしても良い。
たとえば、スピーカやヘッドホンの左右から採点データを「見本」と「実際」として再生する場合には、「見本」に対応する歌詞の表示を画面上段に、「実際」に対応する歌詞の表示を画面下段に、それぞれ行うものとする。
一般に、カラオケにおける歌詞の表示は、歌詞に含まれる文字の色を、歌の進行に合わせて変更する形態をとることが多い。
上記実施形態によれば、「見本」となる歌詞表示と、「実際」の歌詞表示とが、時間をずらして行われるので、ユーザは、聴覚のみならず視覚を通じても、自分の歌唱の時間のずれを容易に知得できるようになる。
上記のように、本発明によれば、歌唱の時間的なずれを適切に検知して歌い手に提示するのに好適なカラオケ装置、カラオケ方法、ならびに、これらをコンピュータによって実現するプログラムを提供することができ、カラオケボックス等の専用施設に利用されるカラオケ装置の他、汎用ゲーム装置や汎用コンピュータ上に実現されるカラオケ装置においても、本発明を適用することができる。
本発明の実施形態に係るカラオケ装置が実現される典型的なゲーム装置の概要構成を示す模式図である。 本実施形態のカラオケ装置の概要構成を示す説明図である。 本実施形態のカラオケ装置にて実行されるカラオケ方法の制御の流れを示すフローチャートである。 本実施形態のカラオケ装置にて実行される抽出処理の制御の流れを示すフローチャートである。 本実施形態のカラオケ装置にて実行される出力処理の制御の流れを示すフローチャートである。
符号の説明
100 ゲーム装置
101 CPU
102 ROM
103 RAM
104 インターフェース
105 コントローラ
106 外部メモリ
107 画像処理部
108 DVD−ROMドライブ
109 NIC
110 音声処理部
111 マイク
201 カラオケ装置
202 入力受付部
203 分析部
204 記憶部
205 抽出部
206 出力部

Claims (6)

  1. 音声データの入力を受け付ける入力受付部、
    あらかじめ用意された伴奏データを再生し、前記入力受付部が音声入力の受付を開始していれば、前記入力を受け付けられた音声データを当該伴奏データに混合して再生する再生部、
    前記入力を受け付けられた音声データの特徴情報を分析する分析部、
    前記分析された特徴情報を、当該入力の受付開始からの経過時間に対応付けて、記憶する記憶部、
    当該伴奏データの再生が終了した後に、あらかじめ用意された採点データの特徴情報の経過時間に対する変化と、前記記憶された音声データの特徴情報の経過時間に対する変化と、を対比して、前者の変化と後者の変化との時間的なずれが所定の範囲を超える後者の区間を抽出する抽出部、および、
    前記記憶された特徴情報のうち、前記抽出された区間について、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、当該区間に対する時間的なずれだけ時間的にずらして混合し、音声により出力する出力部
    を備え
    前記入力受付部は、当該伴奏データの再生の開始により当該音声データの入力の受付を開始する
    ことを特徴とするカラオケ装置。
  2. 請求項1に記載のカラオケ装置であって、
    前記出力部は、当該採点データの区間に対応付けられた文字または図形を、当該採点データの音声による出力に同期させて画面表示して出力する
    ことを特徴とするカラオケ装置
  3. 請求項2に記載のカラオケ装置であって、
    前記出力部は、前記再生部による当該伴奏データの再生に同期させて、当該採点データに対応付けられた文字または図形を画面表示して出力し、
    前記出力部は、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、当該区間に対する時間的なずれだけ時間的にずらして混合し、音声により出力する際に、当該伴奏データの出力に同期させて、当該採点データに対応付けられた文字または図形を時間的にずらさずに画面表示して出力する
    ことを特徴とするカラオケ装置
  4. 請求項1から3のいずれか1項に記載のカラオケ装置であって、
    前記出力部は、第1出力系統と第2出力系統とを有し、
    当該第1出力系統を介して、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、当該区間に対する時間的なずれだけ時間的にずらして混合し、音声により出力し、
    当該第2出力系統を介して、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、時間的にずらさずに混合し、音声により出力する
    ことを特徴とするカラオケ装置
  5. 入力受付部、再生部、分析部、記憶部、抽出部、および、出力部を備えるカラオケ装置において使用されるカラオケ方法であって、
    当該入力受付部が、音声データの入力を受け付ける入力受付工程、
    当該再生部が、あらかじめ用意された伴奏データを再生し、前記入力受付工程にて音声入力の受付が開始されていれば、前記入力を受け付けられた音声データを当該伴奏データに混合して再生する再生工程、
    当該分析部が、前記入力を受け付けられた音声データの特徴情報を分析する分析工程、
    当該記憶部に、前記分析された特徴情報を、当該入力の受付開始からの経過時間に対応付けて、記憶する記憶工程、
    当該伴奏データの再生が完了した後に、当該抽出部が、あらかじめ用意された採点データの経過時間に対する変化と、前記記憶された特徴情報の経過時間に対する変化と、を対比して、前者の変化と後者の変化との時間的なずれが所定の閾値を超える区間を抽出する抽出工程、および、
    当該出力部が、前記記憶された特徴情報のうち、前記抽出された区間について、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、当該区間に対する時間的なずれだけ時間的にずらして混合し、音声により出力する出力工程
    を備え
    前記入力受付工程では、当該伴奏データの再生の開始により当該音声データの入力の受付を開始する
    ことを特徴とするカラオケ方法。
  6. コンピュータを、
    音声データの入力を受け付ける入力受付部、
    あらかじめ用意された伴奏データを再生し、前記入力受付部が音声入力の受付を開始していれば、前記入力を受け付けられた音声データを当該伴奏データに混合して再生する再生部、
    前記入力を受け付けられた音声データの特徴情報を分析する分析部、
    前記分析された特徴情報を、当該入力の受付開始からの経過時間に対応付けて、記憶する記憶部、
    当該伴奏データの再生が終了した後に、あらかじめ用意された採点データの特徴情報の経過時間に対する変化と前記記憶された音声データの特徴情報の経過時間に対する変化と、を対比して、前者の変化と後者の変化との時間的なずれが所定の範囲を超える後者の区間を抽出する抽出部、および、
    前記記憶された特徴情報のうち、前記抽出された区間について、当該採点データのうち当該区間に対応付けられる部分と、当該伴奏データのうち当該区間に対応付けられる部分と、を、当該区間に対する時間的なずれだけ時間的にずらして混合し、音声により出力する出力部
    として機能させ、
    前記入力受付部は、当該伴奏データの再生の開始により当該音声データの入力の受付を開始する
    ように機能させることを特徴とするプログラム。
JP2004012763A 2004-01-21 2004-01-21 カラオケ装置、カラオケ方法、ならびに、プログラム Expired - Lifetime JP3878180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004012763A JP3878180B2 (ja) 2004-01-21 2004-01-21 カラオケ装置、カラオケ方法、ならびに、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004012763A JP3878180B2 (ja) 2004-01-21 2004-01-21 カラオケ装置、カラオケ方法、ならびに、プログラム

Publications (2)

Publication Number Publication Date
JP2005208196A JP2005208196A (ja) 2005-08-04
JP3878180B2 true JP3878180B2 (ja) 2007-02-07

Family

ID=34899044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004012763A Expired - Lifetime JP3878180B2 (ja) 2004-01-21 2004-01-21 カラオケ装置、カラオケ方法、ならびに、プログラム

Country Status (1)

Country Link
JP (1) JP3878180B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5061211B2 (ja) * 2010-03-26 2012-10-31 株式会社コナミデジタルエンタテインメント 音声入力システム、音声入力システムの制御方法、及びプログラム
AU2013206204A1 (en) 2012-06-07 2014-01-09 Aristocrat Technologies Australia Pty Limited A gaming system and a method of gaming
JP7169530B2 (ja) 2018-03-26 2022-11-11 カシオ計算機株式会社 録音再生装置、録音再生装置の制御方法及び制御プログラム並びに電子楽器
US11445238B2 (en) * 2019-05-10 2022-09-13 Cinewav Pte. Ltd. System and method for synchronizing audio content on a mobile device to a separate visual display system

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3785232B2 (ja) * 1996-10-16 2006-06-14 株式会社エクシング カラオケ採点装置及びカラオケ装置
JP3975528B2 (ja) * 1997-10-14 2007-09-12 ヤマハ株式会社 カラオケ装置
JP3615378B2 (ja) * 1997-12-26 2005-02-02 三洋電機株式会社 カラオケシステム
JP4174940B2 (ja) * 2000-02-04 2008-11-05 ヤマハ株式会社 カラオケ装置
JP3760833B2 (ja) * 2001-10-19 2006-03-29 ヤマハ株式会社 カラオケ装置

Also Published As

Publication number Publication date
JP2005208196A (ja) 2005-08-04

Similar Documents

Publication Publication Date Title
US8492637B2 (en) Information processing apparatus, musical composition section extracting method, and program
JP5241805B2 (ja) タイミング・オフセット許容型カラオケゲーム
KR100320036B1 (ko) 디지털 음악 파일을 악기별로 연주가 가능한 연주용파일로 변환하는 방법 및 그를 이용한 음악 연주시스템
JP3878180B2 (ja) カラオケ装置、カラオケ方法、ならびに、プログラム
WO2010110124A1 (ja) ゲーム装置、テンポ報知方法、情報記録媒体、及び、プログラム
JP2006189471A (ja) プログラム、歌唱力判定方法、ならびに、判定装置
JP4939515B2 (ja) ゲーム装置、ゲーム処理方法、ならびに、プログラム
JP3734801B2 (ja) カラオケ装置、音程判定方法、ならびに、プログラム
JP2022191521A (ja) 録音再生装置、録音再生装置の制御方法及び制御プログラム並びに電子楽器
WO2010084830A1 (ja) 音声処理装置、チャットシステム、音声処理方法、情報記憶媒体、ならびに、プログラム
JP3751596B2 (ja) カラオケ装置、出力音量制御方法、ならびに、プログラム
JP3908719B2 (ja) カラオケ装置、歌唱力判定方法、ならびに、プログラム
JP2005148599A (ja) カラオケ装置、カラオケ方法、および、プログラム
JP3892433B2 (ja) カラオケ装置、カラオケ方法、ならびに、プログラム
JP2002268637A (ja) 拍子判定装置、及びプログラム
JP4294712B1 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JP5357805B2 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JP5291742B2 (ja) カラオケ装置、音域測定方法、および、プログラム
JP3854263B2 (ja) カラオケ装置、カラオケ方法、ならびに、プログラム
JP4714230B2 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JPH08123448A (ja) 音声信号の波形解析を用いた画像処理装置
JP3875203B2 (ja) カラオケ装置、歌唱力採点方法、ならびに、プログラム
JP2007108779A (ja) カラオケ装置、歌唱力判定方法、ならびに、プログラム
JP2007160065A (ja) ゲーム機
JP2005049758A (ja) カラオケ装置、音声処理方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050428

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060427

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061101

R150 Certificate of patent or registration of utility model

Ref document number: 3878180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131110

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250