JP4204941B2 - Karaoke equipment - Google Patents
Karaoke equipment Download PDFInfo
- Publication number
- JP4204941B2 JP4204941B2 JP2003342474A JP2003342474A JP4204941B2 JP 4204941 B2 JP4204941 B2 JP 4204941B2 JP 2003342474 A JP2003342474 A JP 2003342474A JP 2003342474 A JP2003342474 A JP 2003342474A JP 4204941 B2 JP4204941 B2 JP 4204941B2
- Authority
- JP
- Japan
- Prior art keywords
- note
- scoring
- singing
- data
- singing voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
この発明は、歌唱採点機能を備えたカラオケ装置における採点精度の向上に関する。 The present invention relates to an improvement in scoring accuracy in a karaoke apparatus having a singing scoring function.
従来よりカラオケ装置には、歌唱者の歌唱の巧拙を採点する採点機能を備えたものがあった。従来より実用化されている採点機能は、ガイドメロディなどのリファレンスから抽出した音高と歌唱音声から抽出した周波数とを比較するもの(たとえば特許文献1)やこれに音量変化の評価を加味したもの(特許文献2)などがあった。 Conventionally, some karaoke apparatuses have a scoring function for scoring the skill of a singer. The scoring function that has been practically used in the past compares the pitch extracted from the reference such as a guide melody with the frequency extracted from the singing voice (for example, Patent Document 1), and adds the evaluation of the volume change to this. (Patent Document 2).
しかし、ガイドメロディは、機械的に音符(ノートオンイベントデータおよびノートオフイベントデータ)を配列したMIDIデータであるため、正確な拍タイミングに機械的に音高が変化するものである。したがって、いわゆる楽譜どおりに正確に歌唱すれば採点機能で高得点を得ることができるが、このような歌唱は、決して上手いといえるものではない。逆に、伴奏(カラオケ演奏)のうえで音符の長さを自由に変化させて歌唱する「ため」、「ルバート」などの歌唱技巧を用いて歌唱した場合には、上記機械的に正確な音符の長さと歌唱が一致しないため、かえって低い点数になってしまうという問題点があった。 However, since the guide melody is MIDI data in which notes (note-on event data and note-off event data) are mechanically arranged, the pitch changes mechanically at an accurate beat timing. Therefore, if you sing exactly according to the so-called score, you can get a high score with the scoring function, but such singing is never good. On the other hand, when singing with a singing technique such as “for” or “rubbert”, the length of the note is freely changed after accompaniment (karaoke performance), the above mechanically accurate notes Since the length of the song and the singing do not match, there was a problem that the score was rather low.
この発明は、実際の歌唱の巧拙を正確に判定することができるようにした採点機能付きのカラオケ装置を提供することを目的とする。 An object of the present invention is to provide a karaoke apparatus with a scoring function that can accurately determine the skill of actual singing.
請求項1の発明は、カラオケ曲を演奏するとともに、歌唱旋律の各音符の音高情報および区切り情報を含むリファレンスデータをカラオケ曲の演奏と同期して供給する演奏手段と、歌唱音声をサンプリング入力する歌唱音声入力手段と、各音符毎に前記歌唱音声と前記リファレンスデータとを比較し、その周波数差に基づいて、各音符についての合格、不合格を判定し、採点を行う採点手段であって、採点対象音符を含む所定区間の歌唱音声とリファレンスデータとを時間軸方向に相互にずらしてその相互相関が最大となる位置を割り出し、その位置で前記採点対象音符の歌唱音声とリファレンスデータとの比較を行う採点手段と、を備え、前記採点手段は、3度、5度、または演奏中の曲の和音構成音の音程差の音高差のセント数を前記歌唱音声の周波数に加算または減算して前記リファレンスデータとの比較を行い、いずれかで合格の判定を得られた場合には、その採点対象音符について合格の判定をして採点を行うことを特徴とする。 According to the first aspect of the present invention, performance means for playing karaoke music and supplying reference data including pitch information and delimiter information of each note of the singing melody in synchronization with the performance of the karaoke music, and sampling input of the singing voice A singing voice input means that compares the singing voice and the reference data for each note, and, based on the frequency difference, determines the pass / fail for each note , and performs scoring The singing voice and reference data of a predetermined section including the scoring target note are shifted in the time axis direction to determine the position where the cross-correlation is maximum, and the singing voice of the scoring target note and the reference data are determined at that position. and a scoring unit for comparing, said scoring means, 3 degrees, 5 degrees, or the song St. number of pitch difference of pitch difference chord constituent notes of the song being played It makes a comparison between the reference data by adding or subtracting a frequency of the audio, when the resulting determination pass either has a feature to make a scoring by the decision of acceptance for the scoring target note To do.
歌唱音声とリファレンスデータを時間軸方向にずらすことにより、歌唱のタイミングとリファレンスのタイミングがずれていても相互相関をとることによってこれを一致させ、その一致した位置で採点することができ、歌唱者が「ため」や「ルバート」で歌唱した場合でも、歌唱タイミングをリファレンスに合わせて比較して採点することができる。 By shifting the singing voice and the reference data in the time axis direction, even if the timing of the singing and the timing of the reference are shifted, they can be matched by taking the cross-correlation, and can be scored at the matching position. Even when singing with “for” or “rubbert”, the singing timing can be compared and graded according to the reference.
請求項2の発明は、前記所定区間として、前記採点対象音符およびその直後の音符を用いることを特徴とする。 The invention of claim 2 is characterized in that the scoring target note and a note immediately after the scoring target note are used as the predetermined section.
この発明では、比較する音符(ノート)のみでなく、その直後のノートを含む区間を相互にずらせて歌唱音声とリファレンスの周波数差が最小になる位置を検出することにより、音換えタイミングをより正確に検出することができ、「ため」や「ルバート」の歌唱をより正確に採点することができる。 In the present invention, not only the note (note) to be compared but also the section including the immediately following note are mutually shifted to detect the position at which the frequency difference between the singing voice and the reference is minimized, thereby making the sound change timing more accurate. It is possible to detect singing of “for” and “rubbert” more accurately.
請求項3の発明は、前記歌唱旋律の音高情報、および、前記入力された歌唱音声の一方または両方をローパスフィルタ処理するフィルタ手段を備えたことを特徴とする。 According to a third aspect of the present invention, there is provided filter means for performing low-pass filtering on one or both of the pitch information of the singing melody and the inputted singing voice.
この発明では、歌唱旋律の音高情報、歌唱音声の一方または両方をローパスフィルタ処理している。歌唱旋律の音高情報をLPF処理することにより、歌唱旋律の音高情報の不連続で機械的な音高変化がなだらかになり、実際の歌唱者の音高変化に近づけることがでる。また、歌唱音声をLPF処理することにより、ビブラートなどの細かい周波数変動を除去することができ、技巧を凝らした歌唱がかえって低い評価になってしまうことを防止することができる。 In the present invention, one or both of the pitch information of the singing melody and the singing voice are low-pass filtered. By subjecting the pitch information of the singing melody to LPF processing, the pitch information of the singing melody becomes discontinuous and the mechanical pitch change becomes gentle, and the pitch change of the actual singer can be approached. Further, by subjecting the singing voice to LPF processing, fine frequency fluctuations such as vibrato can be removed, and it is possible to prevent the skillful singing from becoming a low evaluation.
以上のようにこの発明によれば、歌唱者が「ため」や「ルバート」の技巧を用いて歌唱した場合でも、ガイドメロディデータなどのリファレンスデータに基づいて正確に採点することができる。 As described above, according to the present invention, even when a singer sings using the technique of “for” or “rubbert”, it is possible to accurately score based on reference data such as guide melody data.
図面を参照してこの発明の実施形態であるカラオケ装置について説明する。
カラオケ装置において、カラオケ曲の演奏はカラオケ曲の楽音を発生しながら背景映像・歌詞テロップをモニタに出力する動作であるが、採点モードを設定すると、このカラオケ曲の演奏に加えて、歌唱者の歌唱音声をリファレンスと比較することによって採点して点数を算出し、曲の終了後に得点を表示する採点動作を実行する。
A karaoke apparatus according to an embodiment of the present invention will be described with reference to the drawings.
In a karaoke device, the performance of a karaoke song is the operation of outputting the background video / lyric telop to the monitor while generating the music of the karaoke song. The singing voice is scored by comparing it with a reference to calculate a score, and a scoring operation is performed to display the score after the end of the song.
図1は、同カラオケ装置のブロック図である。カラオケ装置は、装置全体の動作を制御するCPU10と、これに接続された各種機器で構成されている。CPU10には、ハードディスク11、RAM12、音源13、ミキサ(エフェクタ)14、ボーカルアダプタ19、MPEGデコーダ20、合成回路21、操作部23が接続されている。ハードディスク11は、カラオケ曲を演奏するための曲データやモニタに背景映像を表示するための映像データなどを記憶している。RAM12には、プログラムや曲データを読み出すエリア、および、採点モード時に採点結果等を記録する採点ログエリアなどが設定されている。
FIG. 1 is a block diagram of the karaoke apparatus. The karaoke apparatus is composed of a
音源13は、CPU10が実行する曲シーケンサ31の処理によって入力された曲データ(ノートイベントデータ等)に応じて楽音信号を形成する。形成した楽音信号はミキサ14に入力される。ミキサ14は、音源13が発生した複数の楽音信号、および、マイク17−A/Dコンバータ18を介して入力された歌唱者の歌唱音声信号に対してエコーなどの効果を付与するとともに、これらの信号を適当なバランスでミキシングする。ミキシングされたデジタルの音声信号はサウンドシステム15に入力される。サウンドシステム15はD/Aコンバータおよびパワーアンプを備えており、入力されたデジタル信号をアナログ信号に変換して増幅し、スピーカ16から放音する。ミキサ14が各音声信号に付与する効果およびミキシングのバランスはCPU10によって制御される。
The
また、A/Dコンバータ18によってデジタル信号に変換された歌唱音声信号は、ボーカルアダプタ19にも入力される。ボーカルアダプタ19は、この入力された歌唱音声信号から歌唱周波数を割り出すとともに、CPU10の曲シーケンサ31から入力されたリファレンスの周波数を割り出す。そして、この歌唱周波数とリファレンス周波数を同期させて30ms毎にCPU10(採点モード処理34)に入力する。リファレンスとしては、曲データに含まれるガイドメロディデータが用いられる。また割り出した周波数は、C0からのセント値で表現される。
The singing voice signal converted into a digital signal by the A /
HDD11に記憶されている背景映像データ41は、MPEG2形式にエンコードされており、CPU10が実行する背景映像再生プログラム33は、これを読み出してMPEGデコーダ20に入力する。MPEGデコーダ20は、入力されたMPEGデータをNTSCの映像信号に変換して合成回路21に入力する。合成回路21は、この背景映像の映像信号の上に歌詞テロップや採点結果の表示などのOSDを合成する回路である。この合成された映像信号はモニタディスプレイ22に表示される。
The
操作部23は、パネルスイッチインタフェースやリモコン受信回路などからなっており、利用者によるパネルスイッチやリモコン装置の操作に応じた操作信号をCPU10に入力する。CPU10は、操作入力処理プログラム35によってこの操作信号を検出し、対応する処理を実行する。この操作入力処理プログラム35はシステムプログラムに含まれるものである。
The
パネルスイッチやリモコン装置は、曲番号を選択したり、採点モードなどのモードを選択するための種々のキースイッチを備えている。 The panel switch and the remote control device are provided with various key switches for selecting a song number and selecting a mode such as a scoring mode.
パネルスイッチやリモコン装置で曲番号が入力されると、操作入力処理プログラム35がこれを検出し、カラオケ曲のリクエストであるとしてシーケンサ30に伝達する。シーケンサ30は、これに応じて、この曲番号で識別されるカラオケ曲の曲データをハードディスク11の曲データ記憶エリア40から読み出す。シーケンサ30は、曲シーケンサ31および歌詞シーケンサ32からなっており、歌詞シーケンサ32は、文字パターン作成プログラム32aを含んでいる。曲シーケンサ31は曲データ中の演奏データトラック、ガイドメロディトラックなどのトラックのデータを読み出し、このデータで音源13を制御することによってカラオケ曲の演奏音を発生させる。また、歌詞シーケンサ32は、曲データ中の歌詞トラックのデータを読み出し、このデータに基づいて歌詞テロップの画像パターンを作成して合成回路21に出力する。また、背景映像再生プログラム33は、シーケンサ30からの指示に応じて所定の背景映像データを読み出してMPEGデコーダ20に入力する。
When a song number is input with a panel switch or a remote control device, the operation
ここで、図2を参照してハードディスク11に記憶されている曲データについて説明する。曲データは、同図(A)に示すように、カラオケ曲を演奏するための楽音トラック、ガイドメロディを発生するためのガイドメロディトラック、歌詞テロップを表示するための歌詞トラック、曲の伴奏和音(コード)を指示するコードトラックなどからなっている。曲データは、これ以外にヘッダ、音声データ、音声データ制御トラックなどを有しているが説明を簡略化するためにこの図では省略する。
Here, the music data stored in the
各トラックは、MIDIフォーマットに従って記述されている。たとえば、ガイドメロディトラックは、同図(B)に示すように、ノートオンイベントデータ、ノートオフイベントデータなどのイベントデータと各イベントデータの読み出しタイミングを示すタイミングデータからなっている。ノートオンイベントデータは音高データを含み、このノートオンによって発生する楽音(ガイドメロディ)の音高を指定する。この楽音は次のノートオフイベントデータが読み出されるまで継続する。 Each track is described according to the MIDI format. For example, the guide melody track includes event data such as note-on event data and note-off event data and timing data indicating the read timing of each event data, as shown in FIG. Note-on event data includes pitch data, and designates the pitch of a musical tone (guide melody) generated by note-on. This musical tone continues until the next note-off event data is read out.
タイミングデータは、各イベントデータ間の時間的間隔を示すデュレーションデータや曲のスタート時刻からの絶対時間を示す絶対時間データなどで構成することができる。 The timing data can be composed of duration data indicating the time interval between the event data, absolute time data indicating the absolute time from the start time of the music, and the like.
楽音トラック、ガイドメロディトラックのイベントデータは、上記のように楽音の音高、音量、オン/オフなどを示すノートイベントデータなどで構成され、このノートイベントデータを音源13に入力することにより、音源13はこのイベントデータに対応する楽音を発音したり消音したりする。楽音トラックは、多数の楽器の楽音を発生するために複数トラック(パート)で構成されており、ガイドメロディトラックは、歌唱旋律をガイドするための単旋律のMIDIデータで構成されている。また、コードトラックは、伴奏用のコード(C,G7など)を上記演奏トラック、ガイドメロディトラックと同期して指示するトラックであり、システムエクスクルーシブメッセージとして記述される。
The event data of the musical tone track and the guide melody track is composed of the note event data indicating the pitch, volume, on / off, etc. of the musical tone as described above, and by inputting this note event data to the
一方、歌詞トラックのイベントデータは、このカラオケ曲の歌詞テロップをシステムエクスクルーシブデータでインプリメントしたシーケンスデータであり、楽音トラックやガイドメロディトラックとは異なるイベントデータを有している。イベントデータは、ページ区切りデータ、歌詞表示データなどである。 On the other hand, the event data of the lyrics track is sequence data in which the lyrics telop of the karaoke song is implemented by system exclusive data, and has event data different from the musical tone track and the guide melody track. The event data is page break data, lyrics display data, and the like.
通常モードのカラオケ曲の演奏では、シーケンサ30により上記のようなカラオケ演奏音の発生や歌詞テロップの表示処理動作が行われるが、採点モード時には、これに加えて採点モード処理プログラム34により、採点処理動作が実行される。
In the performance of karaoke music in the normal mode, the
まず図3の機能ブロックを参照して、採点モード時の各部の処理について説明する。マイク17から入力された歌唱音声信号は、A/Dコンバータ18でデジタル音声信号に変換されてボーカルアダプタ19に入力される(同時にミキサ14にも入力されるがここでは採点モードの動作のみについて説明する)。ボーカルアダプタ19では、このデジタル音声信号を歌唱周波数検出部102に入力して歌唱周波数(セント値)を検出する。
First, with reference to the functional block of FIG. 3, the process of each part at the time of scoring mode is demonstrated. The singing voice signal input from the
一方、リファレンス周波数検出部101には、カラオケ曲の演奏に同期して、曲シーケンサ31からリファレンスデータが入力される。リファレンスデータは、上述したようにガイドメロディデータが用いられる。リファレンス周波数検出部101は、入力されたMIDIデータのノートオンイベントデータから音高情報を抽出し、その音高のセント値をリファレンス周波数として出力する。
On the other hand, reference data is input from the
歌唱音声検出部102による歌唱周波数の検出およびリファレンス周波数検出部101によるリファレンス周波数の検出は、30ms毎に同期して実行され、その検出結果が30ms毎に採点モード処理プログラム34に入力される。
The detection of the singing frequency by the singing
また、リファレンス周波数検出部101は、曲シーケンサ31からノートオン/オフイベントデータが入力されると、そのタイミングにノートオン情報、ノートオフ情報を採点モード処理プログラム34に通知する。
Further, when note-on / off event data is input from the
採点モード処理プログラム34では、入力された歌唱周波数およびリファレンス周波数に対してローパスフィルタ(LPF)処理(105、106)を行う。リファレンス周波数に対するLPF処理は、機械的な音高列であるリファレンス(図4(A)参照)の音高変化を滑らかにして人間の歌唱に近づけるための処理である。また、歌唱周波数に対するLPF処理は、ビブラートなどの技巧を除去してフラットな歌唱周波数情報を得るための処理である。
In the scoring
図4(A)はリファレンスとして用いられるガイドメロディデータの例を示す図である。リファレンスデータは、音符が連続しているレガート区間であっても正確な拍タイミングに不連続に音高が変化する機械的なデータである。このような不連続なリファレンスに対してLPF処理を行うことにより、同図(B)に示すように、音符と音符の間ではなだらかに音高が変化するようになり、リファレンスを歌唱者の実際の歌唱に近い音高変化のものにすることができる。なお、音符が途切れる休符の区間やノンレガートで歌唱するところなどは、このLPF処理の対象外にする。これにより、音の無い区間のデータによりLPF処理が不自然な動きになってしまうことを防止することができる。 FIG. 4A shows an example of guide melody data used as a reference. The reference data is mechanical data in which the pitch changes discontinuously at an accurate beat timing even in a legato section in which notes are continuous. By performing LPF processing on such a discontinuous reference, the pitch gradually changes between notes as shown in FIG. It is possible to make the pitch change similar to that of singing. Note that rest sections where notes are interrupted, places where singing with non-legato, etc. are excluded from the LPF processing. As a result, it is possible to prevent the LPF processing from becoming unnatural due to the data of the section without sound.
同図(C)は歌唱音声周波数データの例を示す図である。歌唱音声周波数は、音符(音高)の変わり目でなだらかな音高の移行(いわゆる「しゃくり」)をしているとともに、音の伸ばしの部分では、ビブラートなどの周期的な周波数変化をしている。この歌唱音声周波数データをLPF処理することにより、同図(D)に示すように、しゃくり部分のオーバーシュートやビブラートなどの細かい周波数変化を除去することができ、歌唱しようとしていた周波数を正確に抽出することができるようになる。 FIG. 6C is a diagram showing an example of singing voice frequency data. The singing voice frequency has a gentle transition (so-called “scribbling”) at the transition of notes (pitch), and has a periodic frequency change such as vibrato in the stretched part of the sound. . By performing LPF processing on this singing voice frequency data, it is possible to remove fine frequency changes such as overshoot and vibrato in the squeaky part, as shown in Fig. 4 (D), and accurately extract the frequency that was sung. Will be able to.
なお、マイク17から入力された音声信号には歌唱音声信号のみならず種々のノイズが含まれている。このノイズ成分のレベルが大きい場合、周波数検出部102は、このノイズ成分を歌唱音声信号と見なしてその周波数を検出してしまう場合がある。このようなノイズ成分がLPF処理部106に入力されると、その1サンプルだけでなくその後もずっと誤ったデータが出力されてしまう。そこで、歌唱音声の周波数変化と考えにくい、150セント以上の突然の音高変化があった場合には、そのデータを無視して(直前のサンプルデータをもう一度採用して)LPF処理を行うことにより、ノイズによる悪影響を防止することができる。
The audio signal input from the
歌唱周波数およびリファレンス周波数のデータ列は、30ms毎の離散データであるため、上記の処理を好適に達成するため、歌唱周波数に対するLPF処理部106は、カットオフ周波数5.5Hzの2次フィルタを用い、リファレンス周波数に対するLPF処理部105は、カットオフ周波数5Hzの2次フィルタを用いている。
Since the data sequence of the singing frequency and the reference frequency is discrete data every 30 ms, the
また、この実施形態では、歌唱周波数、リファレンス周波数の両方に対してLPF処理を行っているが、この処理は必須ではない。また、どちらか一方のみに対して行っても上記それぞれの効果を得ることができる。 In this embodiment, LPF processing is performed on both the singing frequency and the reference frequency, but this processing is not essential. Moreover, even if it carries out only with respect to either one, the said each effect can be acquired.
LPF処理をされた歌唱周波数およびリファレンス周波数は、採点部107に入力される。採点部107は、歌唱周波数とリファレンス周波数とを比較し、その差分(セント値)を算出し、この差分に基づいて各ノート(音符)毎に合格ノート、不合格ノートを判定する。採点部107には、リファレンス周波数検出部101からノートオン情報・ノートオフ情報が入力されるため、その区間に歌唱周波数が、所定(1〜複数)サンプル以上歌唱旋律の音高に合っていた(周波数許容範囲に入っていた)場合には、「合格ノート」であると判定し、歌唱周波数が歌唱旋律の音高に合った回数が上記所定サンプル未満であった場合には「不合格ノート」であると判定する。
The singing frequency and the reference frequency that have been subjected to the LPF process are input to the
上記の比較において、単に同じタイミングの歌唱周波数とリファレンス周波数とを比較するのではなく、リファレンス周波数を時間軸上で前後に移動させ、両サンプル列の相互相関が最大になる位置で対応する歌唱音声周波数とリファレンス周波数比較するようにしている。相互相関は、 In the above comparison, instead of simply comparing the singing frequency and the reference frequency at the same timing, the reference frequency is moved back and forth on the time axis, and the corresponding singing voice is at a position where the cross-correlation between both sample sequences is maximum. The frequency is compared with the reference frequency. Cross correlation is
の相互相関関数で求めてもよいが、ずらしたときに対応するサンプル同士の差分をとり、その差分の積算値が最小となる位置を最大相関点とするようにしてもよい。 However, it is also possible to take the difference between samples corresponding to each other when shifted and to set the position where the integrated value of the difference is minimum as the maximum correlation point.
図5にリファレンスデータを前後にずらせて相互相関が最大になる点を検出する処理の例を示す。この例では、合格/不合格の判定を行うノートとその次のノートの2ノート分の相互相関をとり、この相互相関が最大となる位置で前のノートについて合格/不合格の判定を行っている。このように複数のノートについて相互相関をとることにより、音の変わり目が明確になり、歌唱音声とリファレンスのノートの対応づけがやりやすくなる。 FIG. 5 shows an example of processing for detecting the point where the cross-correlation is maximized by shifting the reference data back and forth. In this example, the cross-correlation of two notes of the pass / fail decision and the next note is taken, and the pass / fail decision is made for the previous note at the position where the cross-correlation is maximized. Yes. By taking the cross-correlation for a plurality of notes in this way, the transition of the sound becomes clear, and it becomes easy to associate the singing voice with the reference note.
図5(A)はリファレンスメモリに記憶されているリファレンス周波数のサンプルデータ列および歌唱音声メモリに記憶されている歌唱音声周波数のサンプルデータ列である。これを同じタイミングで比較すると同図(B)のようになる。この状態から同図(C)、(D)に示すようにリファレンスデータを遅れ方向にシフトしてゆく。遅れぎみに歌唱されたときに相関が高くなる方向である。さらに逆に同図(E)に示すように、リファレンスデータを進み方向にシフトしてゆく。これはつっこみぎみに歌唱されたときに相関が高くなる方向である。両方向に1サンプルまたは数サンプルずつ所定量シフトしてゆき、シフト毎に相互相関を算出する。そして相互相関が最高の位置で合否の判定を行う。この例では、同図(D)のときに最も交互相関が大きくなっているため、この位置において、前のノートの対応しているリファレンス周波数と歌唱周波数とを比較する。 FIG. 5A shows a sample data sequence of reference frequency stored in the reference memory and a sample data sequence of singing voice frequency stored in the singing voice memory. When this is compared at the same timing, it becomes as shown in FIG. From this state, the reference data is shifted in the delay direction as shown in FIGS. This is the direction in which the correlation increases when sung late. Conversely, as shown in FIG. 5E, the reference data is shifted in the advance direction. This is the direction in which the correlation increases when the song is sung. A predetermined amount is shifted by one sample or several samples in both directions, and the cross-correlation is calculated for each shift. Then, pass / fail is determined at the position where the cross-correlation is the highest. In this example, since the cross-correlation is largest at the time of FIG. 4D, the reference frequency corresponding to the previous note is compared with the singing frequency at this position.
この歌唱音声とリファレンスの相互相関の検出および比較による合格/不合格の判定の処理において、歌唱音声周波数をそのままリファレンス周波数と比較することは勿論であるが、その周波数差が200セント以上大きい場合には、アレンジ、アドリブまたはハーモニーなどの歌唱をしている可能性があるため、歌唱周波数からオクターブ(±1200セント)、3度(±400セント、±300セント)、5度(±700セント)またはそのときの曲の和音(コード)の構成音の音程(音高差)のセント数を加算または減算して上記比較を行い。そのいずれかで合格の判定を得られた場合には、アレンジ、アドリブまたはハーモニーなどの歌唱をしているとして合格の判定をする。 In the pass / fail judgment process by detecting and comparing the cross-correlation between the singing voice and the reference, it is a matter of course that the singing voice frequency is directly compared with the reference frequency, but when the frequency difference is larger than 200 cents. May be arranging, ad-lib or harmony singing, so from the singing frequency octave (± 1200 cents), 3 degrees (± 400 cents, ± 300 cents), 5 degrees (± 700 cents) or The above comparison is performed by adding or subtracting the number of cents of the pitch (pitch difference) of the constituent sounds of the chord of the song at that time. If it is determined that the pass is acceptable, it is determined that the song is arranged, ad-lib or harmony is being performed.
曲が終了すると、採点部107は最終得点の集計を行う。この最終得点の集計は、合格ノート数を全ノート数で除算し、これに50を掛けた値に50を加算して100点満点とするようにしている。すなわち、カラオケ装置におけるエンターテイメント機能であることを考慮し、最低でも50点が出るようにしている。
When the music is finished, the
この最終得点の集計においては、合格ノートのみを採点の対象にしているが不合格ノートの数やそのランクを採点の対象にしてもよい。 In the final score calculation, only the passing notes are targeted for scoring, but the number of rejected notes and their ranks may be subject to scoring.
フローチャートを参照して採点モード処理プログラム34の処理について説明する。
図6は採点処理動作のメインルーチンを示すフローチャートである。この動作ではボーカルアダプタ19からの入力を監視し、入力されたデータに対応した処理を実行する。30ms毎に入力バッファをチェックして歌唱周波数およびリファレンス周波数を取り込むとともにノートオン/オフ情報が入力されているかを確認する。歌唱周波数、リファレンス周波数を取り込むと(s1)、その両方に対してLPF処理を実行する(s5、s7)。そして、LPF処理したリファレンスデータをリストメモリ(図7参照)のリファレンスリストに書き込み(s6)、LPF処理した歌唱音声周波数データはリストメモリの歌唱音声リストに書き込む(s8)。上述したようにこのLPF処理はどちらか一方のみでもよい。
The processing of the scoring
FIG. 6 is a flowchart showing a main routine of scoring processing operation. In this operation, input from the
リファレンス周波数検出部101からノートオン情報が送られてきた場合には(s2)、このノートオン情報をリストメモリの制御データリストに書き込む(s10)。これにより、これ以後に書き込まれたサンプルデータがこのノートオン後のサンプルデータであることがわかる。この動作では、ノートオフ期間中でもサンプルデータをメモリに蓄積するようにしているが、ノートオフ中はサンプルデータを蓄積しないようにしてもよい。また、MIDIのランニングステータスで音高が変更された場合には、ノートオン情報とノートオフ情報を連続して書き込むようにすればよい。 When note-on information is sent from the reference frequency detector 101 (s2), this note-on information is written into the control data list of the list memory (s10). Thus, it can be seen that the sample data written after this is sample data after the note-on. In this operation, the sample data is stored in the memory even during the note-off period, but the sample data may not be stored during the note-off period. Further, when the pitch is changed in the MIDI running status, note-on information and note-off information may be written continuously.
ここで、リストメモリはハードディスク11またはRAM12に設定されるメモリエリアであり、図7に示すように、リファレンス周波数、歌唱周波数のサンプルデータおよびノートオン、ノートオフのイベント情報を入力順に所定量順次記憶するように設定されている。
Here, the list memory is a memory area set in the
リファレンス周波数検出部101からノートオフ情報が送られてきた場合には(s3)、このノートオフ情報をリファレンスメモリ(および歌唱音声メモリ)に書き込むとともに(s11)、今回ノートオフしたノートとその直前のノートの2音符の相互相関をとり、相関が最大の位置で前記直前のノートについて上述した合否判定処理を行う(s12)。 When note-off information is sent from the reference frequency detection unit 101 (s3), the note-off information is written to the reference memory (and the singing voice memory) (s11), and the note that was note-off this time and the immediately preceding note are written. The cross-correlation of the two notes of the note is taken, and the above-described pass / fail determination process is performed on the immediately preceding note at the position where the correlation is maximum (s12).
一方、曲シーケンサ31またはリファレンス周波数検出部101から曲終了メッセージが送られてきたとき(s4)この得点集計処理動作を実行する(s14)。
On the other hand, when a music end message is sent from the
図8は得点集計処理を示すフローチャートである。この動作は、上記メインルーチンのs14で実行される。まず、全ノート数および合格ノート数を集計する(s25)。次に合格ノート数を全ノート数で除算し、この点に50を乗算し、次に50を加算して最終得点を算出する(s26)。算出された最終得点をモニタ22に表示する(s27)。 FIG. 8 is a flowchart showing the score totaling process. This operation is executed in s14 of the main routine. First, the total number of notes and the number of accepted notes are totaled (s25). Next, the number of accepted notes is divided by the total number of notes, this point is multiplied by 50, and then 50 is added to calculate the final score (s26). The calculated final score is displayed on the monitor 22 (s27).
この実施形態では、合否を判定するノート(対象ノート)とその次のノートの2ノートの相互相関を検出するようにしているが、相互相関を検出する区間はこれに限定されない。対象ノートのみ相互相関を検出するようにしても、曲全体またはフレーズ単位の相互相関を検出するようにしてもよい。 In this embodiment, the cross-correlation between the note (target note) for determining pass / fail and the next note of the next note is detected, but the interval for detecting the cross-correlation is not limited to this. The cross-correlation may be detected only for the target note, or the cross-correlation may be detected for the entire song or phrase unit.
また、対象ノートとその次のノートの相互相関を検出して、対象ノートの合否を判定した場合、曲やフレーズの最後の音符については次のノートがないということになるが、この場合には、このノートについては対象ノートのみで相互相関を検出するようにすればよい。 In addition, when the cross-correlation between the target note and the next note is detected and the pass / fail of the target note is determined, there is no next note for the last note of the song or phrase. For this note, the cross-correlation may be detected only by the target note.
10…CPU、11…ハードディスク、12…RAM、13…音源、14…ミキサ、15…サウンドシステム、16…スピーカ、17…マイク、18…A/Dコンバータ、19…ボーカルアダプタ、20…MPEGデコーダ、21…合成回路、22…モニタ、23…操作部、
30…シーケンサ、31…曲シーケンサ、32…歌詞シーケンサ、32a…文字パターン作成プログラム、33…背景映像再生プログラム、34…採点モード処理プログラム、35…操作入力処理プログラム、
40…曲データ記憶エリア、41…背景映像記憶エリア、43…採点ログ、
101…リファレンス周波数検出部、102…歌唱周波数検出部、105、106…ローパスフィルタ処理部、107…採点部
DESCRIPTION OF
30 ... Sequencer, 31 ... Song sequencer, 32 ... Lyric sequencer, 32a ... Character pattern creation program, 33 ... Background video reproduction program, 34 ... Scoring mode processing program, 35 ... Operation input processing program,
40 ... song data storage area, 41 ... background video storage area, 43 ... scoring log,
DESCRIPTION OF
Claims (3)
歌唱音声をサンプリング入力する歌唱音声入力手段と、
各音符毎に前記歌唱音声と前記リファレンスデータとを比較し、その周波数差に基づいて、各音符についての合格、不合格を判定し、採点を行う採点手段であって、採点対象音符を含む所定区間の歌唱音声とリファレンスデータとを時間軸方向に相互にずらしてその相互相関が最大となる位置を割り出し、その位置で前記採点対象音符の歌唱音声とリファレンスデータとの比較を行う採点手段と、
を備え、前記採点手段は、3度、5度、または演奏中の曲の和音構成音の音程差の音高差のセント数を前記歌唱音声の周波数に加算または減算して前記リファレンスデータとの比較を行い、いずれかで合格の判定を得られた場合には、その採点対象音符について合格の判定をして採点を行うことを特徴とするカラオケ装置。 A performance means for playing karaoke songs and supplying reference data including pitch information and break information of each note of the singing melody in synchronization with the performance of the karaoke songs,
Singing voice input means for sampling and inputting singing voice;
The singing voice is compared with the reference data for each note, and based on the frequency difference, a pass or fail is determined for each note , and a scoring unit for scoring, which includes a scoring target note The singing voice of the section and the reference data are shifted relative to each other in the time axis direction to determine the position where the cross-correlation is maximum, and the scoring means for comparing the singing voice of the scoring target note with the reference data at the position,
And the scoring means adds or subtracts the cent number of the pitch difference of the chord component sound of the song being played three times, five times, or the performance of the singing voice to the reference data and A karaoke apparatus characterized in that if a comparison is obtained and a pass determination is obtained, the pass is determined for the target musical score and the scoring is performed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003342474A JP4204941B2 (en) | 2003-09-30 | 2003-09-30 | Karaoke equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003342474A JP4204941B2 (en) | 2003-09-30 | 2003-09-30 | Karaoke equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005107330A JP2005107330A (en) | 2005-04-21 |
JP4204941B2 true JP4204941B2 (en) | 2009-01-07 |
Family
ID=34536729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003342474A Expired - Fee Related JP4204941B2 (en) | 2003-09-30 | 2003-09-30 | Karaoke equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4204941B2 (en) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4687517B2 (en) * | 2006-03-13 | 2011-05-25 | ヤマハ株式会社 | Waveform editing device |
JP4924317B2 (en) * | 2007-09-18 | 2012-04-25 | カシオ計算機株式会社 | Singing diagnosis apparatus and waveform diagnosis processing program |
JP5131130B2 (en) * | 2008-09-30 | 2013-01-30 | ブラザー工業株式会社 | Follow-up evaluation system, karaoke system and program |
JP5125956B2 (en) * | 2008-09-30 | 2013-01-23 | ブラザー工業株式会社 | Range identification system, program |
JP5125957B2 (en) * | 2008-09-30 | 2013-01-23 | ブラザー工業株式会社 | Range identification system, program |
JP5131220B2 (en) * | 2009-02-12 | 2013-01-30 | ブラザー工業株式会社 | Singing pitch difference identification device and program |
JP5298945B2 (en) * | 2009-02-25 | 2013-09-25 | ブラザー工業株式会社 | Pitch determination system, range determination system, and program |
JP5958041B2 (en) | 2012-04-18 | 2016-07-27 | ヤマハ株式会社 | Expression performance reference data generation device, performance evaluation device, karaoke device and device |
WO2016148256A1 (en) * | 2015-03-17 | 2016-09-22 | ヤマハ株式会社 | Evaluation device and program |
CN106548784B (en) * | 2015-09-16 | 2020-04-24 | 广州酷狗计算机科技有限公司 | Voice data evaluation method and system |
JP6365483B2 (en) * | 2015-09-24 | 2018-08-01 | ブラザー工業株式会社 | Karaoke device, karaoke system, and program |
JP7478077B2 (en) | 2020-10-22 | 2024-05-02 | 株式会社第一興商 | Karaoke equipment |
-
2003
- 2003-09-30 JP JP2003342474A patent/JP4204941B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005107330A (en) | 2005-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3293745B2 (en) | Karaoke equipment | |
US7563975B2 (en) | Music production system | |
US20090317783A1 (en) | Song practice support device | |
JP4212446B2 (en) | Karaoke equipment | |
JP4204941B2 (en) | Karaoke equipment | |
JP3996565B2 (en) | Karaoke equipment | |
JP2007334364A (en) | Karaoke machine | |
JP4204940B2 (en) | Karaoke equipment | |
JP4163584B2 (en) | Karaoke equipment | |
JP4222919B2 (en) | Karaoke equipment | |
JP3176273B2 (en) | Audio signal processing device | |
JP4222915B2 (en) | Singing voice evaluation device, karaoke scoring device and programs thereof | |
JP4839967B2 (en) | Instruction device and program | |
JP4271667B2 (en) | Karaoke scoring system for scoring duet synchronization | |
JP3599686B2 (en) | Karaoke device that detects the critical pitch of the vocal range when singing karaoke | |
JP4209751B2 (en) | Karaoke equipment | |
JP4048249B2 (en) | Karaoke equipment | |
JP3613859B2 (en) | Karaoke equipment | |
JP2005107332A (en) | Karaoke machine | |
JP4159961B2 (en) | Karaoke equipment | |
JP4561735B2 (en) | Content reproduction apparatus and content synchronous reproduction system | |
JP2006301019A (en) | Pitch-notifying device and program | |
JP2006259401A (en) | Karaoke machine | |
JP2016180965A (en) | Evaluation device and program | |
JP2000330580A (en) | Karaoke apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081014 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081015 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4204941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131024 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |