JP5428458B2 - Evaluation device - Google Patents
Evaluation device Download PDFInfo
- Publication number
- JP5428458B2 JP5428458B2 JP2009082065A JP2009082065A JP5428458B2 JP 5428458 B2 JP5428458 B2 JP 5428458B2 JP 2009082065 A JP2009082065 A JP 2009082065A JP 2009082065 A JP2009082065 A JP 2009082065A JP 5428458 B2 JP5428458 B2 JP 5428458B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- scoring
- data
- unit
- karaoke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
本発明は、歌唱を評価する技術に関する。 The present invention relates to a technique for evaluating a song.
カラオケ装置を用いて行われた利用者の歌唱の巧拙を採点する技術が知られている。例えば、特許文献1〜3には、カラオケ演奏を再生するカラオケ装置において、利用者の歌唱の採点を行う技術が開示されている。また、特許文献4,5には、教師がコンピュータ装置を用いて遠隔にいる生徒の歌声を再生し、生徒の歌声の添削を行い、その添削結果を生徒に送信する技術が開示されている。また、特許文献6には、通信カラオケシステムのサーバが、歌唱者の使用する通信端末にカラオケデータを配信するとともに通信端末から歌唱者の歌唱音声信号を受信し、カラオケデータの配信が終了した時に、受信した歌唱音声信号に基づいて歌唱者の歌唱力を判定し、その判定結果を通信端末に送信する技術が開示されている。 A technique for scoring the skill of a user's sing performed using a karaoke device is known. For example, Patent Documents 1 to 3 disclose a technique for scoring a user's singing in a karaoke apparatus that reproduces a karaoke performance. Patent Documents 4 and 5 disclose a technique in which a teacher reproduces a student's singing voice using a computer device, corrects the student's singing voice, and transmits the correction result to the student. Moreover, in patent document 6, when the server of a communication karaoke system distributes karaoke data to the communication terminal which a singer uses, a singer's singing voice signal is received from a communication terminal, and distribution of karaoke data is complete | finished. A technique for determining a singer's singing ability based on a received singing voice signal and transmitting the determination result to a communication terminal is disclosed.
ところで、上述した特許文献1〜3のように、各々のカラオケ装置に利用者の歌唱を採点する採点機能を設けると、カラオケ装置のコストが高くなってしまう。また、カラオケ装置では、カラオケ演奏の再生などの処理も行わなくてはならないため、処理負荷の高い精密な採点処理を行うことができない。さらに、新たな採点機能を追加する場合には、カラオケ装置の1つひとつに新たな採点機能を追加しなくてはならないため、その作業に時間と手間がかかってしまう。
本発明は、カラオケ演奏の再生などの処理を行う通信装置以外の装置において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することを目的とする。
By the way, if the scoring function which scores a user's song is provided in each karaoke apparatus like patent documents 1-3 mentioned above, the cost of a karaoke apparatus will become high. In addition, since the karaoke apparatus must perform processing such as reproduction of karaoke performance, it cannot perform precise scoring processing with a high processing load. Furthermore, when adding a new scoring function, it is necessary to add a new scoring function to each karaoke device, which takes time and effort.
An object of the present invention is to evaluate a user's singing voice for each evaluation section in an apparatus other than a communication apparatus that performs processing such as playback of a karaoke performance, and sequentially output the evaluation result.
本発明は、模範となる歌唱音声を表す模範音声データを記憶する第1の記憶手段と、利用者の歌唱音声を表す音声データをストリーミング方式で通信装置から取得する取得手段と、前記取得手段によって取得された音声データを記憶する第2の記憶手段と、前記第2の記憶手段に記憶されている前記音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段と、前記分割手段によって分割された各々の評価区間を時間軸上の位置に応じた順番で選択し、選択された当該評価区間に含まれる音声データを、前記第1の記憶手段に記憶されている当該評価区間に対応する区間に含まれる模範音声データと比較することにより、当該選択された評価区間における前記利用者の歌唱音声を評価し、評価結果を生成する評価手段と、前記評価手段によって各評価区間における評価結果が生成される度に、生成された当該評価結果を前記通信装置に送信する送信手段とを備えることを特徴とする評価装置を提供する。 The present invention includes a first storage unit that stores exemplary voice data representing an exemplary singing voice, an acquisition unit that acquires voice data representing a user's singing voice from a communication device in a streaming manner, and the acquisition unit. Division which divides | segments the time axis | shaft of the said audio | voice data memorize | stored in the 2nd storage means which memorize | stores the acquired audio | voice data, and the said 2nd memory | storage means into the several evaluation area used as the object of evaluation of a song voice And each evaluation section divided by the dividing means in the order corresponding to the position on the time axis, and voice data included in the selected evaluation section is stored in the first storage means. The user's singing voice in the selected evaluation section is evaluated by comparing with the model voice data included in the section corresponding to the evaluation section, and the evaluation result is generated. And means, every time the evaluation results of each evaluation interval is generated by the evaluation unit, generated the evaluation results provide an evaluation device, characterized in that it comprises a transmitting means for transmitting to the communication device.
本発明の好ましい態様において、前記模範音声データには、前記模範となる歌唱音声に含まれる各フレーズの時間軸上の区切り位置を示す区切データが付加されており、前記分割手段は、前記第2の記憶手段に記憶されている音声データの時間軸を、前記第1の記憶手段に記憶されている模範音声データにおいて前記区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割してもよい。 In a preferred aspect of the present invention, delimiter data indicating delimiter positions on the time axis of each phrase included in the exemplary singing voice is added to the exemplary voice data, and the dividing means includes the second voice data. The time axis of the voice data stored in the storage means is divided into a plurality of evaluation sections corresponding to each phrase section delimited by the delimiter data in the model voice data stored in the first storage means. May be.
本発明の好ましい態様において、前記通信装置は種別の異なるものが複数あり、前記評価手段は、前記取得手段が予め決められた種別の通信装置から前記音声データを取得した場合には、当該予め決められた種別とは異なる種別の通信装置から前記音声データを取得した場合よりも簡易な内容で前記評価を行ってもよい。 In a preferred aspect of the present invention, there are a plurality of communication devices of different types, and the evaluation unit determines the predetermined data when the acquisition unit acquires the audio data from a predetermined type of communication device. The evaluation may be performed with simpler content than when the audio data is acquired from a communication device of a type different from the specified type.
本発明によれば、カラオケ演奏の再生などの処理を行う通信装置以外の装置において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することができる。 ADVANTAGE OF THE INVENTION According to this invention, in apparatuses other than a communication apparatus which performs processes, such as reproduction | regeneration of a karaoke performance, a user's song voice can be evaluated for every evaluation area and the evaluation result can be output sequentially.
[構成]
図1は、本実施形態に係る採点システム1の構成を示すブロック図である。同図に示すように、採点システム1は、複数のカラオケ装置10と、採点サーバ装置20とを備えている。採点サーバ装置20とカラオケ装置10とは、インターネットなどのネットワークNを介して接続されている。このカラオケ装置10は、本発明に係る通信装置として機能する。また、採点サーバ装置20は、本発明に係る評価装置として機能する。
[Constitution]
FIG. 1 is a block diagram showing a configuration of a scoring system 1 according to this embodiment. As shown in the figure, the scoring system 1 includes a plurality of
(カラオケ装置)
次に、カラオケ装置10の構成について説明する。このカラオケ装置10は、例えばカラオケ店などに設置されている。図2は、カラオケ装置10の構成を示すブロック図である。同図に示すように、カラオケ装置10は、CPU(Central Processing Unit)11と、メモリ12と、通信部13と、記憶部14と、操作部15と、表示部16と、収音部17と、音源部18と、放音部19とを備えている。CPU11は、メモリ12に記憶されているプログラムを実行することにより、カラオケ装置10の各部を制御する。メモリ12は、例えばROM(Read Only Memory)とRAM(Random Access Memory)とを備えており、CPU11によって用いられるプログラムやデータを記憶する。通信部13は、ネットワークNを介して接続された採点サーバ装置20と通信を行う。記憶部14は、例えばハードディスクを備えており、各々のカラオケ装置10を識別するために用いられる装置IDと、利用者が歌唱を行うときに用いられる複数のカラオケデータDkとを記憶している。このカラオケデータDkには、演奏データと歌詞データとが含まれている。演奏データは、楽曲の演奏音を表すデータである。この演奏音には歌声は含まれていない。歌詞データは、楽曲の歌詞を示すデータである。操作部15は、例えば複数の操作ボタンを備えており、利用者の操作に応じた操作信号をCPU11に入力する。表示部16は、例えば液晶ディスプレイを備えており、CPU11の制御に応じた画像を表示する。収音部17は、例えばマイクロホンとA/D変換部とを備えており、収集した音声に応じたアナログ信号を生成し、生成したアナログ信号をA/D変換によりデジタルデータに変換して出力する。音源部18は、記憶部14に記憶されている演奏データに応じた音声信号を生成して放音部19に供給する。放音部19は、例えばスピーカー、D/A変換部及びアンプを備えており、音源部18から供給された音声信号をD/A変換によりアナログ信号に変換し、変換したアナログ信号を増幅して音声として放出する。
(Karaoke equipment)
Next, the configuration of the
(採点サーバ装置)
次に、採点サーバ装置20の構成について説明する。この採点サーバ装置20は、カラオケ装置10と同じカラオケ店に設置されていてもよいし、カラオケ店とは異なる場所に設置されていてもよい。図3は、採点サーバ装置20の構成を示すブロック図である。同図に示すように、採点サーバ装置20は、CPU21と、メモリ22と、通信部23と、記憶部24と、処理部25とを備えている。CPU21は、メモリ22に記憶されているプログラムを実行することにより、採点サーバ装置20の各部を制御する。メモリ22は、例えばROMとRAMとを備えており、CPU21によって用いられるプログラムやデータを記憶する。通信部23は、ネットワークNを介して接続された各カラオケ装置10と通信を行う。記憶部24は、例えばハードディスクを備えており、模範となる歌唱音声を表す複数の模範歌唱データDrを記憶している。つまり、この記憶部24は、模範となる歌唱音声を表す模範音声データ(模範歌唱データ)を記憶する第1の記憶手段として機能する。この模範歌唱データDrには、模範となる歌唱音声に含まれる各フレーズの時間軸上の区切り位置を示す区切データkが付加されている。処理部25は、例えばDSP(Digital Signal Processor)であり、カラオケ装置10から送信されてくる歌唱データDxと、記憶部24に記憶されている模範歌唱データDrとを比較して、利用者の歌唱の巧拙を評価する採点処理を行う。
(Scoring server device)
Next, the configuration of the
[動作]
次に、本実施形態に係る採点システム1の動作について説明する。図4は、採点システム1の動作を示すシーケンス図である。まず、利用者は、カラオケ装置10の操作部15を操作して、歌唱したい楽曲の楽曲IDを入力し、演奏開始を指示する。この楽曲IDとしては、例えば楽曲の名前や楽曲に割り当てられた番号などが用いられる。CPU11は、この操作に応じて、通信部13によって採点サーバ装置20との通信を確立させた後(ステップS11)、利用者によって入力された楽曲IDと記憶部14に記憶されている装置IDとを採点サーバ装置20に送信する(ステップS12)。このとき、通信部13は、公開されているAPI(Application Programming Interface)を用いて、採点サーバ装置20と通信を行う。カラオケ装置10から楽曲ID及び装置IDが送信されてくると、採点サーバ装置20のCPU21は、この楽曲ID及び装置IDを通信部23によって受信する(ステップS13)。
[Operation]
Next, the operation of the scoring system 1 according to this embodiment will be described. FIG. 4 is a sequence diagram showing the operation of the scoring system 1. First, the user operates the
また、カラオケ装置10のCPU11は、入力された楽曲IDの楽曲のカラオケデータDkを記憶部14から順次読み出し、カラオケ再生処理を行う(ステップS14)。具体的には、CPU11は、記憶部14から読み出したカラオケデータDkに含まれる演奏データを音源部18に供給する。音源部18は、CPU11によって供給された演奏データに応じた音声信号を生成し、生成した音声信号を放音部19に供給して、その音声信号に応じた音声を放出させる。これにより、利用者によって指定された楽曲の演奏が開始される。また、CPU11は、楽曲の演奏と同期するように、記憶部14から読み出したカラオケデータDkに含まれる歌詞データを表示部16に供給する。これにより、利用者によって指定された楽曲の歌詞が表示される。
Further, the
利用者は、楽曲の演奏に合わせて収音部17に向かって歌唱する。このとき、収音部17は、利用者の歌唱音声を収集し、収集した歌唱音声を表す歌唱データDxを生成する。CPU11は、収音部17によって生成された歌唱データDxを順次放音部19に供給し、その歌唱データDxに応じた歌唱音声を楽曲の演奏とともに放出させる。また、CPU11は、収音部17によって生成された歌唱データDxを順次通信部13に供給する。通信部13は、CPU11によって供給された歌唱データDxをストリーミング方式で採点サーバ装置20に送信する(ステップS15)。ストリーミング方式のデータ送信では、データが或るPDU(Protocol Data Unit)単位(例えば、パケット単位)で分割されて送信される。そのため、データの受信側では、データ全体を受信し終わるのを待つことなく、データをPDU単位で受信して処理を行うことができる。
The user sings toward the
カラオケ装置10から歌唱データDxが送信されてくると、採点サーバ装置20のCPU21は、この歌唱データDxを通信部23によって受信し(ステップS16)、受信した歌唱データをメモリ22に記憶させる。つまり、CPU21は、利用者の歌唱音声を表す音声データ(歌唱データ)をストリーミング方式でカラオケ装置10から取得する取得手段として機能する。また、メモリ22は、CPU21によって取得された音声データを記憶する第2の記憶手段として機能する。上述したように、この歌唱データDxはPDU単位で送信されてくる。よって、メモリ22には、PDU単位で送信されてきた歌唱データが順次記憶されていくことになる。
When the song data Dx is transmitted from the
続いて、処理部25は、メモリ22に記憶されている歌唱データDxの時間軸を、採点処理の対象となる複数の採点区間に分割する(ステップS17)。この採点区間は、利用者の歌唱音声の評価の対象となる評価区間として用いられる。つまり、処理部25は、メモリ22に記憶されている音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段として機能する。図5を参照して具体的に説明すると、処理部25は、まず記憶部24に記憶されている模範歌唱データDrにおいて、区切データkによって区切られたフレーズ区間f1,f2,f3,f4・・・を特定する。続いて、処理部25は、メモリ22に記憶されている歌唱データDxの時間軸を、特定した各フレーズ区間に対応する採点区間に分割する。この例では、歌唱データDxの時間軸が、フレーズ区間f1に対応する採点区間h1,フレーズ区間f2に対応する採点区間h2,フレーズ区間f3に対応する採点区間h3,フレーズ区間f4に対応する採点区間h4・・・に分割される。つまり、処理部25は、メモリ22に記憶されている音声データの時間軸を、記憶部24に記憶されている模範音声データにおいて区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割する。
Subsequently, the
続いて、処理部25は、分割した採点区間の中から今回の採点処理の対象となる採点区間を選択する(ステップS18)。この例では、いずれの採点区間についても採点処理が行われていないため、時間軸において先頭の採点区間h1が選択される。続いて、処理部25は、選択した採点区間に含まれる歌唱データDxと記憶部24に記憶されている模範歌唱データDrとに基づいて、採点処理を行う(ステップS19)。具体的には、処理部25は、選択した採点区間に含まれる歌唱データDxと、その採点区間に対応するフレーズ区間に含まれる模範歌唱データDrとを比較して、それらの類似度に応じた点数を算出する。続いて、処理部25は、算出した点数を採点結果とし、その採点結果を表す採点結果データを生成する。つまり、処理部25は、分割された複数の評価区間の中から選択された評価区間に含まれる音声データを、記憶部24に記憶されているその評価区間に対応する区間に含まれる模範音声データと比較することにより、選択された評価区間における利用者の歌唱音声を評価し、評価結果を生成する評価手段として機能する。この例では、図5中の採点区間h1に含まれる歌唱データDxとフレーズ区間f1に含まれる模範歌唱データDrとの類似度に応じた点数が算出され、算出された点数が採点区間h1の採点結果として用いられて、採点区間h1の採点結果を表す採点結果データが生成される。
Subsequently, the
採点結果データが生成されると、CPU21は、この採点結果データを上述したステップS16にて受信された装置IDのカラオケ装置10に通信部23によって送信する(ステップS20)。この例では、図5中の採点区間h1の採点結果を表す採点結果データがカラオケ装置10に送信される。続いて、処理部25は、上述したステップS18にて選択された採点区間が時間軸における最後の採点区間であるか否かを判定する(ステップS21)。この例では、図5に示すように、採点区間h1は時間軸における最後の採点区間ではないため、処理部25は、選択した採点区間が最後の採点区間ではないと判定する(ステップS21:NO)。この場合、処理部25は、上述したステップS18に戻り、次の採点処理の対象となる採点区間を選択する。具体的には、処理部25は、上述にて採点区間h1の採点処理が行われているため、時間軸において採点区間h1の次の採点区間h2を選択する。つまり、処理部25は、分割された各々の評価区間を時間軸上の位置に応じた順番で選択する。続いて、処理部25は、上述と同様に、ステップS19において採点区間h2についての採点処理を行う。そして、CPU21は、ステップS20において採点区間h2の採点結果を表す採点結果データをカラオケ装置10に送信する。つまり、CPU21は、処理部25によって各評価区間における評価結果が生成される度に、生成された評価結果をカラオケ装置10に送信する送信手段として機能する。このようにして、処理部25とCPU21とは、ステップS21において、選択された採点区間が時間軸における最後の採点区間であると判定されるまで、上述したステップS18〜ステップS21の処理を繰り返す。
When the scoring result data is generated, the
一方、カラオケ装置10のCPU11は、上述したステップS14及びS15の処理を行いながら、採点サーバ装置20から採点結果データが送信されてくるまで待機する。そして、採点サーバ装置10から採点結果データが送信されてくると、CPU11は、通信部13によってこの採点結果データを受信する(ステップS22)。続いて、CPU11は、受信した採点結果データが表す採点結果を表示部16に表示させる(ステップS23)。例えば、上述したように、図5中の採点区間h1の採点結果を表す採点結果データが採点サーバ装置20から送信されてきた場合には、採点区間h1の採点結果が表示される。なお、このステップS22〜S23が行われている間も上述したカラオケ再生処理が継続しているため、表示部16には楽曲の歌詞が表示されている。従って、CPU11は、上述したステップS23にて採点結果を表示させるときには、楽曲の歌詞の表示をいったん中断して採点結果を表示させるか、あるいは楽曲の歌詞と採点結果とを合成したものを表示させる。
On the other hand, the
続いて、CPU11は、上述したステップS14のカラオケ再生処理の状況に基づいて、利用者の歌唱が終了したか否かを判定する(ステップS24)。例えば、カラオケ再生処理が終了していない場合、CPU11は、利用者の歌唱が終了していないと判定する(ステップS24:NO)。この場合、CPU11は、上述したステップS22に戻り、新たな採点結果データが送信されてくるまで待機する。そして、採点サーバ装置20から新たな採点結果データが送信されてくると、CPU11は、上述と同様に、ステップS21にてその採点結果データを通信部13によって受信し、ステップS23にてその採点結果データが表す採点結果を表示部16に表示させる。これにより、表示部16には、図5中の各採点区間の採点結果が順次表示されていく。
Subsequently, the
一方、上述したステップS14において、利用者によって指定された楽曲のカラオケデータDkが時間軸における最後の位置まで読み出されて処理されると、カラオケ再生処理が終了する。この場合、CPU11は、利用者の歌唱が終了したと判定し(ステップS24:YES)、通信部13によって採点サーバ装置20との間の通信を切断した後(ステップS25)、この処理を終了する。
On the other hand, when the karaoke data Dk of the music designated by the user is read and processed up to the last position on the time axis in the above-described step S14, the karaoke playback process ends. In this case, CPU11 determines with a user's song having been complete | finished (step S24: YES), and after cut | disconnecting communication with the scoring
以上説明した実施形態によれば、カラオケ演奏の再生処理を行うカラオケ装置10とは異なる採点サーバ装置20において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することができる。また、各々のカラオケ装置10に利用者の歌唱を採点する採点機能を設ける必要がないため、カラオケ装置10のコストを安くすることができる。さらに、採点サーバ装置20側では、カラオケ演奏の再生処理は行われないため、処理負荷の高い精密な採点処理を行うことができる。また、新たな採点機能を追加する場合には、採点サーバ装置20だけに新たな採点機能を追加すればよいため、新たな採点機能を追加する作業を容易に行うことができる。
According to the embodiment described above, in the
[変形例]
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の各変形例を適宜組み合わせてもよい。
(変形例1)
上述した実施形態では、歌唱データの時間軸を模範歌唱データの各フレーズ区間に対応する複数の採点区間に分割していたが、採点区間の分割に用いられる区間はフレーズ区間に限らない。例えば、歌唱データの時間軸を、歌唱データに含まれる各メロディーの時間軸上の区間に対応する複数の採点区間に分割してもよい。あるいは、歌唱データの時間軸を、歌唱データにおいて息継ぎが行われない区間に対応する複数の採点区間に分割してもよい。この息継ぎが行われない区間は、例えば歌唱データを解析して息継ぎが行われたタイミングを検出し、検出した息継ぎのタイミングに基づいて特定すればよい。あるいは、歌唱データにおいて息継ぎが行われる時間軸上の位置が予め決められている場合には、その息継ぎのタイミングに基づいて特定してもよい。
また、カラオケ装置10が採点区間を指定してもよい。この場合、カラオケ装置10のCPU11は、上述した楽曲ID及び装置IDとともに、採点区間を表す採点区間情報を採点サーバ装置20に送信する。そして、採点サーバ装置20の処理部25は、カラオケ装置10から送信された採点区間情報が表す採点区間に基づいて歌唱データの時間軸を分割する。
[Modification]
The above is the description of the embodiment, but the contents of this embodiment can be modified as follows. Further, the following modifications may be combined as appropriate.
(Modification 1)
In the embodiment described above, the time axis of the song data is divided into a plurality of scoring sections corresponding to each phrase section of the model song data, but the section used for dividing the scoring section is not limited to the phrase section. For example, the time axis of the song data may be divided into a plurality of scoring sections corresponding to the sections on the time axis of each melody included in the song data. Alternatively, the time axis of the singing data may be divided into a plurality of scoring sections corresponding to sections in which no breathing is performed in the singing data. The section where the breathing is not performed may be specified based on, for example, analyzing the song data, detecting the timing when the breathing is performed, and detecting the timing of the breathing. Alternatively, when the position on the time axis where breathing is performed in the song data is determined in advance, the position may be specified based on the timing of breathing.
Moreover, the
(変形例2)
上述した実施形態において、例えば歌唱の対象となる楽曲が1番と2番とで構成されている場合には、1番の歌唱が終了した時点で、1番の歌唱全体の採点処理を行うようにしてもよい。この場合、歌唱データには、楽曲の1番と2番との時間軸上の区切り位置を表す区切データが付加されている。採点サーバ装置20の処理部25は、この区切データを含む採点区間の採点処理を終了すると、歌唱データの時間軸において、歌唱が開始される位置から1番の歌唱が終了する位置までの区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。
また、利用者の歌唱が終了した時点で、歌唱全体の採点処理を行うようにしてもよい。この場合、処理部25は、歌唱データの終端を含む採点区間の採点処理を終了すると、歌唱データの時間軸において、歌唱が開始される位置から終了する位置までの区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。
(Modification 2)
In the above-described embodiment, for example, when the song to be sung is composed of No. 1 and No. 2, the first singing is scored as a whole when the first singing is completed. It may be. In this case, delimiter data representing delimiter positions on the time axis between the first and second songs are added to the song data. When the
Moreover, you may make it perform the scoring process of the whole song when a user's song is complete | finished. In this case, when the
さらに、歌唱全体の採点処理を行う場合には、採点処理の内容を変えてもよい。例えば、各評価区間の採点処理では、歌唱データと模範歌唱データとの類似度を表す点数だけを算出し、歌唱の全体を対象とする採点処理では、歌唱データと模範歌唱データとの類似度を表す点数に加えて、「こぶし」や「しゃくり」といった歌唱の技法が用いられた回数を算出してもよい。さらに、類似度に応じた採点に加え、「ビブラート」,「走り」,「タメ」,「抑揚」,「演奏時間」,「低音・高音の明瞭さ」,「デュエットにおける一致度」などを加味し、加点してもよい。また、歌唱の全体を対象とする採点処理では、適切なタイミングで適切な歌唱の技法を用いているか否かに基づいて、上述した点数を算出してもよい。 Furthermore, when scoring the entire song, the content of the scoring process may be changed. For example, in the scoring process of each evaluation section, only the score representing the similarity between the song data and the model song data is calculated, and in the scoring process for the entire song, the similarity between the song data and the model song data is calculated. In addition to the number of points to be represented, the number of times that a singing technique such as “fist” or “shakuri” is used may be calculated. In addition to scoring according to the degree of similarity, "Vibrato", "Running", "Tame", "Intonation", "Performance time", "Clearness of bass and treble", "Duet match", etc. However, points may be added. In the scoring process for the entire song, the above-described score may be calculated based on whether or not an appropriate singing technique is used at an appropriate timing.
(変形例3)
上述した実施形態では、歌唱データがそのまま採点サーバ装置20に送信されていたが、歌唱データに代えて歌唱データの特徴量だけが採点サーバ装置20に送信されてもよい。この特徴量としては、例えば歌唱データの周波数特性、音程又はリズムなどが用いられる。この場合、カラオケ装置10のCPU11は、収音部17によって生成された歌唱データから特徴量を抽出し、抽出した特徴量を通信部13によって採点サーバ装置20に送信する。そして、採点サーバ装置20のCPU21及び処理部25は、カラオケ装置10から送信されてきた特徴量を用いて、上述と同様の処理を行う。
(Modification 3)
In the above-described embodiment, the singing data is transmitted to the
また、利用者の歌唱の途中では、歌唱データの特徴量に基づいて採点処理を行い、利用者の歌唱が終了すると、歌唱データに基づいて歌唱全体を対象とする採点処理を行ってもよい。この場合、カラオケ装置10のCPU11は、利用者の歌唱が終了するまでは、歌唱データから特徴量を抽出し、抽出した特徴量を採点サーバ装置20に送信する。そして、採点サーバ装置20の処理部25は、カラオケ装置10から送信されてきた歌唱データの特徴量を用いて、上述と同様の処理を行う。このように、歌唱データの特徴量だけを用いて採点処理を行う場合には、採点処理の負荷が小さくなるため、採点処理にかかる時間が短くなる。よって、採点結果データを迅速にカラオケ装置10に送信することができる。一方、利用者の歌唱が終了すると、カラオケ装置10のCPU11は、歌唱データそのものを採点サーバ装置20に送信する。カラオケ装置10から歌唱データが送信されてくると、採点サーバ装置20の処理部25は、この歌唱データの時間軸上の全ての区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。このように、歌唱データそのものを用いて採点処理を行う場合には、採点処理において詳細な評価を行うことができる。よって、利用者は、詳細な採点結果を知ることができる。
Moreover, in the middle of a user's song, the scoring process may be performed based on the feature amount of the song data, and when the user's song is finished, the scoring process for the entire song may be performed based on the song data. In this case, the
また、カラオケ装置10のCPU11は、ネットワークNの状態を検出し、ネットワークNの可用帯域が狭い状態である場合には、歌唱データに代えて歌唱データの特徴量を送信してもよい。この場合、採点サーバ装置20のCPU21及び処理部25は、カラオケ装置10から送信されてきた歌唱データの特徴量を用いて、上述と同様の処理を行う。
また、採点サーバ装置20の処理部25は、複数のカラオケ装置10との間で通信が確立された場合には、メモリ22に記憶されている歌唱データから特徴量を抽出し、抽出した特徴量を用いて上述と同様の処理を行ってもよい。これは、複数のカラオケ装置10との間で通信が確立された場合には、各々のカラオケ装置10から送信されてくる歌唱データについて採点処理を行うことになるため、処理部25の処理負荷を低く抑える必要があるためである。
Moreover, CPU11 of the
Moreover, the
(変形例4)
上述した実施形態において、採点サーバ装置20のCPU21は、歌唱を行った利用者に対して課金を行ってもよい。この場合、利用者は、操作部15を操作して、自分のユーザIDを入力する。CPU11は、この操作に応じて、入力されたユーザIDを通信部13によって採点サーバ装置20に送信する。そして、採点サーバ装置20のCPU21は、上述した採点処理の計算量に応じた金額を算出し、カラオケ装置10から送信されてきたユーザIDが表す利用者に対して、算出した金額が課金されるように課金処理を行う。あるいは、CPU21は、利用者に対して予め決められた金額が課金されるように課金処理を行ってもよい。
(Modification 4)
In embodiment mentioned above, CPU21 of the scoring
(変形例5)
上述した実施形態では、採点サーバ装置20に接続される装置がカラオケ装置10だけであったが、採点サーバ装置20に接続される装置はカラオケ装置10に限らない。例えば、携帯電話機や携帯ゲーム機が採点サーバ装置20に接続されてもよい。この場合、これらの機器は、上述したカラオケ装置10と同様に、カラオケ再生処理を行いながら、利用者の歌唱を表す歌唱データを採点サーバ装置20に送信し、採点サーバ装置20から送信されてきた採点結果データが表す採点結果を表示する。つまり、携帯電話機や携帯ゲーム機はいずれも、本発明に係る通信装置として機能する。
(Modification 5)
In the embodiment described above, the
また、採点サーバ装置20は、歌唱データの送信元の種別に応じて、採点処理の内容を変えてもよい。この種別とは、例えばカラオケ装置、ゲーム機、携帯電話機などのように、予め決められた装置の分類であってもよいし、本格的な歌唱音声の評価を得たいときに用いられる装置、簡易な歌唱音声の評価を得たいときに用いられる装置など、使用目的に応じた種別であってもよい。あるいは、装置の処理能力に応じた種別であってもよい。この場合、採点サーバ装置20の記憶部24には、装置の種別と採点処理のアルゴリズムとが対応付けて記憶される。そして、採点サーバ装置20のCPU21は、歌唱データの送信元からその種別を取得し、取得した種別と対応付けて記憶された採点処理のアルゴリズムを特定する。そして、処理部25は、特定されたアルゴリズムを用いて上述した採点処理を行う。
Moreover, the scoring
ここでは、記憶部24において、「カラオケ装置」という種別と、「詳細な評価を行う採点処理のアルゴリズム」とが対応付けて記憶されており、「携帯電話機」という種別と、「簡易な評価を行う採点処理のアルゴリズム」とが対応付けて記憶されている場合を想定する。この場合、例えば、カラオケ装置10から歌唱データと「カラオケ装置」という種別とが送信されてくると、採点サーバ装置20の処理部25は、記憶部24において「カラオケ装置」という種別に対応付けられた「詳細な評価を行う採点処理のアルゴリズム」を用いて採点処理を行う。一方、携帯電話機から歌唱データと「携帯電話機」という種別とが送信されてくると、処理部25は、記憶部24において「携帯電話機」という種別に対応付けられた「簡易な評価を行う採点処理のアルゴリズム」を用いて採点処理を行う。つまり、処理部25は、予め決められた種別の通信装置から音声データを取得した場合には、予め決められた種別とは異なる種別の通信装置から音声データを取得した場合よりも簡易な評価を行う。この簡易な評価とは、採点処理における処理ステップ数が少ない、又は同一の歌唱音声を評価するときの処理時間が少ないことをいう。具体的には、評価項目を少なくする、処理負荷の大きい処理を省くなどによって実現される。なお、ここでは、採点処理のアルゴリズムが2つ設けられて場合を例に挙げて説明したが、評価の簡易度に応じた採点処理のアルゴリズムが3つ以上設けられていてもよい。
Here, in the
(変形例6)
上述した実施形態では、歌唱データと模範歌唱データとの類似度に応じた点数が採点結果として用いられていたが、採点結果として用いられる情報はこれに限らない。例えば、歌唱データと模範歌唱データとの類似度に応じた点数を算出した後に、利用者の歌唱音声において点数の低下する要因を特定し、算出した点数に加えて、点数を高めるためのアドバイスを採点結果として用いてもよい。
(Modification 6)
In the embodiment described above, the score corresponding to the degree of similarity between the singing data and the model singing data is used as the scoring result, but the information used as the scoring result is not limited to this. For example, after calculating the score according to the degree of similarity between the singing data and the model singing data, the factor that decreases the score in the user's singing voice is specified, and in addition to the calculated score, advice for increasing the score is given. It may be used as a scoring result.
(変形例7)
上述した実施形態では、カラオケ装置10と採点サーバ装置20とが別体の装置である構成を例に挙げて説明したが、カラオケ装置10が採点サーバ装置20の機能を有していてもよい。この場合には、例えばカラオケ装置10の間で相互に情報を交換しながら、カラオケ再生処理を行っていないカラオケ装置10又はカラオケ再生処理を行っているが処理の負荷が低いカラオケ装置10を決定し、そのカラオケ装置10が採点サーバ装置20として機能する。あるいは、カラオケ装置10に管理装置が接続されている場合には、管理装置がカラオケ再生処理を行っていないカラオケ装置10又はカラオケ再生処理を行っているが処理の負荷が低いカラオケ装置10を検出し、検出したカラオケ装置10を採点サーバ装置20として動作させてもよい。
(Modification 7)
In the embodiment described above, the configuration in which the
(変形例8)
上述した実施形態では、採点サーバ装置20が歌唱の巧拙を採点する例を挙げて説明したが、採点サーバ装置20が採点する対象は歌唱に限らない。例えば、採点サーバ装置20が、利用者の英会話の巧拙を採点してもよい。ここでは、利用者が携帯電話機やコンピュータ装置などの端末装置に向けて英会話を行い、この端末装置が利用者の英会話を表す音声データを採点サーバ装置20に送信する場合を想定する。この端末装置は、上述したカラオケ装置10と同様に、収音部17と放音部19とを備えており、ネットワークNを介して採点サーバ装置20に接続されている。この場合、採点サーバ装置20の記憶部24には、模範となる英会話を表す模範音声データが予め記憶されている。そして、処理部25は、端末装置から送信されてきた音声データと記憶部24に記憶されている模範音声データとに基づいて、上述と同様に、利用者の英会話の巧拙を表す採点処理を行う。
(Modification 8)
In embodiment mentioned above, although the example which the scoring
(変形例9)
上述した実施形態において、採点サーバ装置20の記憶部24に記憶されている模範音声データDrは、模範となる歌唱音声そのものを表すものであってもよいし、模範となる音声の音符、周波数、リズムなどを表すパラメータであってもよい。要するに、記憶部24には、模範となる歌唱音声を表す模範音声データが記憶されていればよい。つまり、本発明でいう「音声データ」とは、音声そのものを表すデータに限らず、音声の特徴を表すパラメータであってもよい。
(Modification 9)
In the above-described embodiment, the model voice data Dr stored in the
(変形例10)
上述した実施形態において、CPU21にて行われる処理が処理部25にて行われてもよい。また、処理部25にて行われる処理がCPU21にて行われてもよい。さらに、CPU21又は処理部25にて行なわれる処理は、単一又は複数のハードウェア資源によって実現されてもよいし、CPU21が1又は複数のプログラムを実行することにより実現されてもよい。また、このプログラムは、磁気テープや磁気ディスクなどの磁気記録媒体、光ディスクなどの光記録媒体、光磁気記録媒体、半導体メモリなどの、コンピュータ装置が読み取り可能な記録媒体に記憶された状態で提供し得る。また、プログラムを、インターネットなどのネットワーク経由でダウンロードさせることも可能である。
(Modification 10)
In the embodiment described above, the processing performed by the
1…採点システム、10…カラオケ装置、11…CPU、12…メモリ、13…通信部、14…記憶部、15…操作部、16…表示部、17…収音部、18…音源部、19…放音部、20…採点サーバ装置、21…CPU、22…メモリ、23…通信部、24…記憶部、25…処理部。 DESCRIPTION OF SYMBOLS 1 ... Scoring system, 10 ... Karaoke apparatus, 11 ... CPU, 12 ... Memory, 13 ... Communication part, 14 ... Memory | storage part, 15 ... Operation part, 16 ... Display part, 17 ... Sound collection part, 18 ... Sound source part, 19 ... Sound emitting part, 20 ... Scoring server device, 21 ... CPU, 22 ... Memory, 23 ... Communication part, 24 ... Storage part, 25 ... Processing part.
Claims (6)
利用者の歌唱音声を表す音声データをストリーミング方式で通信装置から取得する取得手段と、
前記取得手段によって取得された音声データを記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている前記音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段と、
前記分割手段によって分割された各々の評価区間を時間軸上の位置に応じた順番で選択し、選択された当該評価区間に含まれる音声データを、前記第1の記憶手段に記憶されている当該評価区間に対応する区間に含まれる模範音声データと比較することにより、当該選択された評価区間における前記利用者の歌唱音声を評価し、評価結果を生成する評価手段と、
前記評価手段によって各評価区間における評価結果が生成される度に、生成された当該評価結果を前記通信装置に送信する送信手段とを備え、
前記通信装置は、カラオケ装置とカラオケ装置以外の種別の通信装置とを含み、
前記評価手段は、前記取得手段が前記カラオケ装置から前記音声データを取得した場合と前記カラオケ装置以外の種別の通信装置から前記音声データを取得した場合とで、前記評価の処理内容を変える
ことを特徴とする評価装置。 First storage means for storing exemplary voice data representing an exemplary singing voice;
Acquisition means for acquiring audio data representing a user's singing voice from a communication device in a streaming manner;
Second storage means for storing voice data acquired by the acquisition means;
A dividing unit that divides the time axis of the voice data stored in the second storage unit into a plurality of evaluation sections to be evaluated for singing voice;
Each evaluation section divided by the dividing means is selected in the order according to the position on the time axis, and the audio data included in the selected evaluation section is stored in the first storage means Evaluation means for evaluating the user's singing voice in the selected evaluation section by comparing with the model voice data included in the section corresponding to the evaluation section, and generating an evaluation result;
A transmission unit that transmits the generated evaluation result to the communication device each time an evaluation result in each evaluation section is generated by the evaluation unit ;
The communication device includes a karaoke device and a communication device of a type other than the karaoke device,
The evaluation means changes the processing content of the evaluation between when the acquisition means acquires the voice data from the karaoke device and when the voice data is acquired from a communication device of a type other than the karaoke device. Characteristic evaluation device.
前記分割手段は、前記第2の記憶手段に記憶されている音声データの時間軸を、前記第1の記憶手段に記憶されている模範音声データにおいて前記区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割する
ことを特徴とする請求項1に記載の評価装置。 Separation data indicating the separation position on the time axis of each phrase included in the exemplary singing voice is added to the exemplary voice data,
The dividing unit corresponds to each phrase section delimited by the delimiter data in the model audio data stored in the first storage unit with respect to the time axis of the audio data stored in the second storage unit. The evaluation apparatus according to claim 1, wherein the evaluation device is divided into a plurality of evaluation sections.
ことを特徴とする請求項1又は2に記載の評価装置。 Before Symbol evaluation unit, when the acquisition unit has acquired the voice data from the communication device of the type other than the karaoke apparatus, the evaluation with a simple content than from the karaoke apparatus has acquired the voice data The evaluation device according to claim 1, wherein the evaluation device is performed.
前記評価手段は、前記通信装置から前記特徴量が送信されてきた場合には、当該特徴量に基づいて、前記歌唱音声の評価を行うThe evaluation unit evaluates the singing voice based on the feature amount when the feature amount is transmitted from the communication device.
ことを特徴とする請求項1ないし3のいずれか一項に記載の評価装置。The evaluation apparatus according to any one of claims 1 to 3, wherein
前記通信装置は、前記ネットワークの状態を検出し、当該ネットワークの可用帯域が閾値より狭い状態である場合には、前記利用者の歌唱音声を表す音声データから特徴量を抽出し、当該抽出した特徴量を前記評価装置に送信し、The communication device detects a state of the network, and extracts a feature amount from voice data representing the user's singing voice when an available bandwidth of the network is narrower than a threshold, and the extracted feature Sending the quantity to the evaluation device,
前記評価手段は、前記通信装置から前記特徴量が送信されてきた場合には、当該特徴量に基づいて、前記歌唱音声の評価を行うThe evaluation unit evaluates the singing voice based on the feature amount when the feature amount is transmitted from the communication device.
ことを特徴とする請求項1ないし4のいずれか一項に記載の評価装置。The evaluation apparatus according to any one of claims 1 to 4, wherein
前記評価手段は、前記通信部により複数の通信装置と通信が確立された場合には、前記第2の記憶手段に記憶された前記音声データから特徴量を抽出し、当該抽出した特徴量に基づいて、前記歌唱音声の評価を行うWhen the communication unit establishes communication with a plurality of communication devices, the evaluation unit extracts a feature amount from the audio data stored in the second storage unit, and based on the extracted feature amount To evaluate the singing voice
ことを特徴とする請求項1ないし5のいずれか一項に記載の評価装置。The evaluation apparatus according to any one of claims 1 to 5, wherein
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009082065A JP5428458B2 (en) | 2009-03-30 | 2009-03-30 | Evaluation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009082065A JP5428458B2 (en) | 2009-03-30 | 2009-03-30 | Evaluation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010237257A JP2010237257A (en) | 2010-10-21 |
JP5428458B2 true JP5428458B2 (en) | 2014-02-26 |
Family
ID=43091660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009082065A Active JP5428458B2 (en) | 2009-03-30 | 2009-03-30 | Evaluation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5428458B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013167828A (en) * | 2012-02-16 | 2013-08-29 | Sony Corp | Sound processor, sound processing method, program, electronic device, server device, client device, and sound processing system |
JP5986395B2 (en) * | 2012-02-24 | 2016-09-06 | ブラザー工業株式会社 | Program for portable terminal device, information presentation method, and portable terminal device |
JP6065703B2 (en) * | 2013-03-27 | 2017-01-25 | ブラザー工業株式会社 | Reference data creation system and performance terminal device |
JP2016050974A (en) * | 2014-08-29 | 2016-04-11 | 株式会社第一興商 | Karaoke scoring system |
JP6395652B2 (en) * | 2015-04-01 | 2018-09-26 | 株式会社エクシング | Karaoke device and karaoke program |
JP6432478B2 (en) * | 2015-09-30 | 2018-12-05 | ブラザー工業株式会社 | Singing evaluation system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1195775A (en) * | 1997-09-19 | 1999-04-09 | Ricoh Co Ltd | Music reproducing device |
JP2003173194A (en) * | 2001-12-06 | 2003-06-20 | Yoshitomo Yamazaki | Equipment for judging singing ability |
JP2005345555A (en) * | 2004-05-31 | 2005-12-15 | Daiichikosho Co Ltd | Karaoke system having grading information display function |
-
2009
- 2009-03-30 JP JP2009082065A patent/JP5428458B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010237257A (en) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5428458B2 (en) | Evaluation device | |
JP2007271977A (en) | Evaluation standard decision device, control method, and program | |
KR101813704B1 (en) | Analyzing Device and Method for User's Voice Tone | |
JP6288197B2 (en) | Evaluation apparatus and program | |
JP2007256618A (en) | Search device | |
JP6102076B2 (en) | Evaluation device | |
JP6708537B2 (en) | Karaoke system | |
JP6944357B2 (en) | Communication karaoke system | |
JP5986387B2 (en) | Information processing program, information processing apparatus, lyrics display method, and communication system | |
JP2010237260A (en) | Karaoke machine emphasizing main voice part of chorus music | |
JP2007256619A (en) | Evaluation device, control method and program | |
JP3984830B2 (en) | Karaoke distribution system, karaoke distribution method, and karaoke distribution program | |
JP5678935B2 (en) | Musical instrument performance evaluation device, musical instrument performance evaluation system | |
JP2006251697A (en) | Karaoke device | |
JP6024130B2 (en) | Voice evaluation device | |
WO2019180830A1 (en) | Singing evaluating method, singing evaluating device, and program | |
JP4171680B2 (en) | Information setting device, information setting method, and information setting program for music playback device | |
JP2003131674A (en) | Music search system | |
JP6316099B2 (en) | Karaoke equipment | |
JP6774844B2 (en) | Karaoke system | |
JP2002341880A (en) | Music data distribution system | |
JP6596346B2 (en) | Karaoke system | |
JP2016050974A (en) | Karaoke scoring system | |
JP6144593B2 (en) | Singing scoring system | |
KR102077269B1 (en) | Method for analyzing song and apparatus using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5428458 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |