JP6144593B2 - Singing scoring system - Google Patents

Singing scoring system Download PDF

Info

Publication number
JP6144593B2
JP6144593B2 JP2013201797A JP2013201797A JP6144593B2 JP 6144593 B2 JP6144593 B2 JP 6144593B2 JP 2013201797 A JP2013201797 A JP 2013201797A JP 2013201797 A JP2013201797 A JP 2013201797A JP 6144593 B2 JP6144593 B2 JP 6144593B2
Authority
JP
Japan
Prior art keywords
singing
scoring
mode
pitch
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013201797A
Other languages
Japanese (ja)
Other versions
JP2015068932A (en
Inventor
橘 聡
聡 橘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2013201797A priority Critical patent/JP6144593B2/en
Publication of JP2015068932A publication Critical patent/JP2015068932A/en
Application granted granted Critical
Publication of JP6144593B2 publication Critical patent/JP6144593B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、歌唱採点システムに関するものであり、特に、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点システムに関するものである。   The present invention relates to a singing scoring system, and in particular, sets a scoring section that is subject to singing scoring so that it is shorter than the singing time of each word that is the lyrics of karaoke music, and in each scoring section The present invention relates to a singing scoring system that compares a singing voice signal input from a microphone with scoring reference data to calculate a singing scoring value.

現在普及しているカラオケシステムでは、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点機能を備えている。このような歌唱採点機能に関する技術は、例えば、特許文献1に記載されている。   The currently popular karaoke system has a singing scoring function that compares a singing voice signal input from a microphone and scoring reference data to calculate a singing scoring value. The technique regarding such a singing scoring function is described in Patent Document 1, for example.

特許文献1に記載されたカラオケ装置は、シーケンサがカラオケ演奏用データを読み出して楽音発生部に入力することによってカラオケ演奏が行われる。カラオケ歌唱者は、カラオケ演奏に合わせて歌唱し、その歌唱音声信号はマイクを介してアンプに入力されるとともにA/Dコンバータにも入力され、デジタルデータに変換される。   In the karaoke apparatus described in Patent Document 1, a karaoke performance is performed by a sequencer reading out data for karaoke performance and inputting it into a musical sound generator. The karaoke singer sings along with the karaoke performance, and the singing voice signal is input to the amplifier via the microphone and also to the A / D converter, and is converted into digital data.

そして、データ抽出部により、デジタル化された歌唱音声信号から音高データ、音量データを抽出し、抽出した音高データ、音量データ(歌唱音声)を比較部に入力する。シーケンサはカラオケ演奏用データに並行して比較用データであるガイドメロディを読み出してこれを比較部に入力する。比較部では、抽出した音高データ、音量データと、ガイドメロディとを比較して、歌唱者の歌唱の巧拙を採点評価するようになっている。   Then, the data extraction unit extracts pitch data and volume data from the digitized singing voice signal, and inputs the extracted pitch data and volume data (singing voice) to the comparison unit. The sequencer reads a guide melody, which is comparison data, in parallel with the karaoke performance data and inputs it to the comparison unit. The comparison unit compares the extracted pitch data, volume data, and guide melody, and evaluates the skill of the singer's singing.

特開平10−69216号公報Japanese Patent Laid-Open No. 10-69216

上述したように、マイクロホンから入力され、A/Dコンバータによりデジタル変換された歌唱音声信号と、ガイドメロディ等の歌唱採点用リファレンスデータとを比較することにより、歌唱採点値を算出することができる。しかし、特に、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点システムでは、歌詞の単語の種類によっては、音高データ(ピッチデータ)を抽出できない場合がある。   As described above, the singing score value can be calculated by comparing the singing voice signal input from the microphone and digitally converted by the A / D converter with the singing score reference data such as a guide melody. However, in particular, a grading section that is subject to singing is set so that it is shorter than the singing time of each word that is the lyrics of the karaoke music, and in each scoring section, the singing voice signal input from the microphone and In a singing scoring system that calculates singing scoring values by comparing with scoring reference data, pitch data (pitch data) may not be extracted depending on the type of words in the lyrics.

そして、音高データ(ピッチデータ)を抽出できない採点区間においては、歌唱者が上手に歌唱しているにも拘わらず、採点リファレンスデータと比較するデータを抽出できないため歌唱採点値が低くなってしまい、正確な歌唱採点を行うことができないという問題があった。   And, in the scoring section where pitch data (pitch data) cannot be extracted, the singing scoring value becomes low because the data compared with the scoring reference data cannot be extracted even though the singer sings well. There was a problem that accurate singing could not be performed.

すなわち、現在のカラオケシステムで利用されているピッチ検出方法では、歌詞に含まれる単語の中の子音部分(s、t、k等)は、原則としてピッチを検出することができない。また、子音の種類に応じて、発音する時間的な長さが異なる。具体的には、同じ長さの「す」と「き」を比較すると、「す」における子音部分「s」の方が、「き」における子音部分「k」よりも発音時間が長い。したがって、採点区間毎にピッチ検出を行うと、サ行の発音は当該区間で子音部分「s」が占める時間が長くなり、カ行の発音よりもピッチ検出の精度が低下してしまう。一方、カ行の発音は当該区間で子音部分「k」が占める時間が短いため、ピッチ検出の精度が低下することは殆どない。   In other words, in the pitch detection method used in the current karaoke system, the pitch cannot be detected in principle for consonant parts (s, t, k, etc.) in words included in the lyrics. Further, the time length of sound generation differs depending on the type of consonant. Specifically, when “su” and “ki” having the same length are compared, the consonant part “s” in “su” has a longer pronunciation time than the consonant part “k” in “ki”. Therefore, if pitch detection is performed for each scoring interval, the time required for the consonant part “s” to occupy the pronunciation of the sub-line becomes longer, and the accuracy of pitch detection is lower than that of the pronunciation of the c-line. On the other hand, in the pronunciation of the K line, since the time occupied by the consonant part “k” in the section is short, the accuracy of pitch detection hardly decreases.

図面を参照して、「す」及び「き」を発音する際の子音部分の長さ、「す」における子音「s」のFFTによる周波数特性の解析結果(以下、FFTと略す、図面も同様)及び母音「u」のFFT、「き」における子音「k」のFFT及び母音「i」のFFTについて説明する。なお、通常の歌唱において、子音部分すなわち「す」の発音における「s」及び「き」の発音における「k」の長さは、それぞれほぼ一定であると考えてよい。一方、母音部分すなわち「す」の発音における「u」及び「き」の発音における「i」の長さに関しては、「す」と「きー」など全体の発音を短く歌唱するか長く歌唱するかで変化する。図5は「す(su)」の発音における子音の長さを示す説明図、図6は子音「s」のFFTを示す説明図、図7は母音「u」のFFTを示す説明図、図8は「き(ki)」の発音における子音の長さを示す説明図、図9は子音「k」のFFTを示す説明図、図10は母音「i」のFFTを示す説明図である。   Referring to the drawings, the length of the consonant part when pronounced "su" and "ki", the analysis result of the frequency characteristics by FFT of the consonant "s" in "su" (hereinafter abbreviated as FFT, the same applies to the drawings) ) And the vowel “u”, the FFT of the consonant “k” and the FFT of the vowel “i” in “ki”. In normal singing, the length of “s” in the pronunciation of the consonant part, that is, “s” and “k” in the pronunciation of “ki” may be considered to be substantially constant. On the other hand, regarding the length of “u” in the pronunciation of the vowel part, that is, “i” in the pronunciation of “su”, the entire pronunciation such as “su” and “ki” is sung short or long. It will change. 5 is an explanatory diagram showing the length of the consonant in the pronunciation of “su”, FIG. 6 is an explanatory diagram showing the FFT of the consonant “s”, and FIG. 7 is an explanatory diagram showing the FFT of the vowel “u”. 8 is an explanatory diagram showing the length of the consonant in the pronunciation of “ki”, FIG. 9 is an explanatory diagram showing the FFT of the consonant “k”, and FIG. 10 is an explanatory diagram showing the FFT of the vowel “i”.

図5に示すように、「す(su)」を発音すると、子音「s」の発音部分は約110msec続く。また、図6に示すように、子音「s」を発音した場合にははっきりとした基音や倍音列が認められず、ピッチを検出することは困難である。一方、図7に示すように、母音「u」を発音した場合には、周波数が約310Hzで相対的に高いレベルを持つ基音とその略整数倍の周波数を持つ倍音列を含んでおり、ピッチを検出することが可能となる。このように、サ行の発音(例えば「す」の発音)では、採点区間において子音部分「s」が占める時間が長いため、正確なピッチ検出を行うことができない。したがって、サ行の音声を含む採点区間において採点の精度を上げるためには、採点方法に工夫を施す必要がある。   As shown in FIG. 5, when “su” is pronounced, the pronunciation of the consonant “s” continues for about 110 msec. Also, as shown in FIG. 6, when the consonant “s” is pronounced, no clear fundamental tone or harmonic sequence is recognized, and it is difficult to detect the pitch. On the other hand, as shown in FIG. 7, when the vowel “u” is pronounced, it includes a fundamental tone having a relatively high level at a frequency of about 310 Hz and a harmonic sequence having a frequency that is substantially an integral multiple of the fundamental tone. Can be detected. As described above, in the pronunciation of the sub-line (for example, the pronunciation of “su”), since the time occupied by the consonant part “s” is long in the scoring interval, accurate pitch detection cannot be performed. Therefore, it is necessary to devise a scoring method in order to improve the scoring accuracy in the scoring section including the voice of the bank.

これに対して、図8に示すように、「き(ki)」を発音すると、子音「k」の発音部分は約25msecであり、子音「s」の発音部分の4分の1以下である。また、図9に示すように、子音「k」を発音した場合には、はっきりとした基音や倍音列が認められず、ピッチを検出することは困難である。一方、図10に示すように、母音「i」を発音した場合には、周波数が約300Hzで相対的に高いレベルを持つ基音とその略整数倍の周波数を持つ倍音列を含んでおり、ピッチを検出することが可能となる。このように、カ行の発音(例えば、「き」の発音)では、所定時間長の採点区間において子音部分「k」が占める時間が極めて短いため、当該子音部分「k」でピッチ検出を行うことができなくても、母音部分「i」において、歌唱採点に必要なピッチ検出を行うことができる。したがって、カ行の音声を含む採点区間では、採点方法の精度が極端に低下することはない。   On the other hand, as shown in FIG. 8, when “ki (ki)” is pronounced, the pronunciation portion of the consonant “k” is about 25 msec, which is less than a quarter of the pronunciation portion of the consonant “s”. . As shown in FIG. 9, when the consonant “k” is pronounced, no clear fundamental tone or harmonic sequence is recognized, and it is difficult to detect the pitch. On the other hand, as shown in FIG. 10, when the vowel “i” is pronounced, it includes a fundamental tone having a relatively high level at a frequency of about 300 Hz and a harmonic sequence having a frequency that is substantially an integral multiple of the fundamental tone. Can be detected. In this way, in the pronunciation of a ka line (for example, the pronunciation of “ki”), the time occupied by the consonant part “k” in the scoring section of a predetermined time length is extremely short, and therefore pitch detection is performed on the consonant part “k”. Even if it is not possible, it is possible to detect the pitch necessary for singing in the vowel part “i”. Therefore, the accuracy of the scoring method does not extremely decrease in the scoring section including the voice of the mosquito line.

図5〜図10から明らかなように、サ行及びカ行のいずれの場合であっても、母音部分は整数倍音のピークがきれいに出ており、基音でピッチ検出が可能であるのに対して、子音部分は基音の周波数域でピッチ検出しようとしてもピークが無いため、ピッチ検出(一波長の測定)ができない。さらに、カ行はサ行と比較して、子音部分「k」の発音時間が短いため、子音部分「k」を無視してピッチ検出を行うことができる。   As is clear from FIG. 5 to FIG. 10, the vowel part has a clear peak of integer overtones, and pitch detection is possible with the fundamental tone in both the case of the S-line and the line-of-line. In the consonant part, there is no peak even if it is attempted to detect the pitch in the frequency range of the fundamental tone. Furthermore, since the pronunciation time of the consonant part “k” is shorter in the ca line than in the sa line, the pitch detection can be performed while ignoring the consonant part “k”.

ところで、上述したように、子音部分「s」を発音した場合のように、ピッチを検出することができない時間が比較的長いと、歌唱採点において音程の評価値が下がる原因となる。一方、ピッチを検出することができない子音部分「s」を含む採点区間であっても、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックが存在する。   By the way, as described above, when the time during which the pitch cannot be detected is relatively long as in the case where the consonant part “s” is pronounced, the evaluation value of the pitch is lowered at the singing score. On the other hand, even in a scoring section including a consonant part “s” where the pitch cannot be detected, the singing is performed well for the listener by performing a characteristic singing method such as changing the pronunciation mode of the consonant. There are singing techniques that sound like this.

しかし、このような特徴的な歌唱方法を行った場合であっても、ピッチを検出することができなければ歌唱採点値が低くなってしまい、実際の歌唱採点値と聴者の感覚とに乖離が生じることになり、歌唱採点に対して聴者が違和感を覚える原因となる。   However, even if such a characteristic singing method is performed, if the pitch cannot be detected, the singing score value becomes low, and there is a discrepancy between the actual singing score value and the listener's sense. This will cause the listener to feel uncomfortable with the singing score.

したがって、特徴的な歌唱方法を行っている場合に、歌唱採点値が高くなるような補正を行うことにより、実際の歌唱採点値と聴者の感覚とが一致し、聴者に対する違和感を与えないだけではなく、特徴的な歌唱テクニックを有している歌唱者にとっても歌唱の楽しさを十分に味わうことができる。   Therefore, when performing a characteristic singing method, by correcting so that the singing score value becomes high, the actual singing score value and the listener's sense are the same, and not just giving the listener a sense of incongruity The singing enjoyment can be fully enjoyed even for singers having characteristic singing techniques.

本発明は、上述した事情に鑑み提案されたもので、歌詞の単語が含む子音の種類に応じて音高データ(ピッチデータ)を抽出できない採点区間が存在する場合であっても、聴者にとって違和感を与えない特徴的な歌唱テクニックを行っている場合には、歌唱採点値に対する補正を行って、歌唱者及び聴者双方がカラオケを楽しむことが可能な歌唱採点システムを提供することを目的とする。   The present invention has been proposed in view of the circumstances described above, and even if there is a scoring section in which pitch data (pitch data) cannot be extracted according to the type of consonant included in the words of the lyrics, the listener feels uncomfortable. When performing a characteristic singing technique that does not give a singing, it is an object to provide a singing scoring system in which both singers and listeners can enjoy karaoke by correcting the singing scoring values.

本発明の歌唱採点システムは、上述した事情に鑑み提案されたもので、以下の特徴点を有している。すなわち、本発明の歌唱採点システムは、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出する歌唱採点システムであって、歌唱採点手段と、子音採点区間特定手段と、ピッチ検出手段と、ピッチ検出判定手段と、特徴的歌唱態様記憶手段と、歌唱態様特定手段と、歌唱態様比較手段とを備えたことを特徴とするものである。   The singing scoring system of the present invention has been proposed in view of the above-described circumstances, and has the following characteristic points. That is, the singing scoring system of the present invention sets a scoring section that is the subject of singing scoring so that the singing time is shorter than the singing time of each word that is the lyrics of karaoke music, and the singing scoring value in each scoring section A singing scoring system for calculating, singing scoring means, consonant scoring section specifying means, pitch detecting means, pitch detection determining means, characteristic singing mode storage means, singing mode specifying means, and singing mode comparing means It is characterized by comprising.

子音採点区間特定手段は、歌詞テロップ情報に基づき、子音が発生する採点区間を特定するための手段である。歌唱採点手段は、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出するための手段である。ピッチ検出手段は、特定された子音採点区間において、入力された歌唱音声信号からピッチ検出を行うための手段である。ピッチ検出判定手段は、ピッチ検出手段がピッチを検出できなかった時間が所定時間以上であるか否かを判定するための手段である。   The consonant scoring section specifying means is means for specifying the scoring section where the consonant is generated based on the lyrics telop information. The singing scoring means is a means for calculating the singing scoring value by comparing the singing voice signal input from the microphone with the scoring reference data. The pitch detection means is means for detecting the pitch from the input singing voice signal in the specified consonant scoring section. The pitch detection determination means is a means for determining whether or not the time when the pitch detection means cannot detect the pitch is a predetermined time or more.

特徴的歌唱態様記憶手段は、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶するための手段である。歌唱態様特定手段は、子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定するための手段である。歌唱態様比較手段は、特定した歌唱態様と、特徴的歌唱態様記憶手段に記憶された特徴的な歌唱態様とを比較するための手段である。   The characteristic singing mode storage unit is a unit for storing a plurality of characteristic singing modes for singing by changing the pronunciation mode of the consonant. The singing mode specifying means is a means for specifying the singing mode based on the singing voice signal input from the microphone in the consonant scoring section. The singing mode comparison unit is a unit for comparing the specified singing mode with the characteristic singing mode stored in the characteristic singing mode storage unit.

そして、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。   Then, the singing scoring means determines that the time when the pitch cannot be detected by the pitch detection judging means is not less than a predetermined time despite the input of the singing voice signal from the microphone, and the specified singing mode is When it matches with any one of the characteristic singing modes, the corrected singing score value is calculated without deducting points for the fact that the pitch could not be detected.

また、上述した構成において、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ歌唱態様特定手段で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出することが可能である。   Further, in the configuration described above, the singing scoring means determines that the time when the pitch cannot be detected by the pitch detection determining means is not less than a predetermined time despite the input of the singing voice signal from the microphone, and When the singing mode specified by the singing mode specifying means matches any one of the characteristic singing modes, the singing voice signal input from the microphone is compared with the scoring reference data, and the rhythm evaluation is performed to detect the pitch. It is possible to calculate the corrected singing score value by performing correction based on the singing score value based on the rhythm evaluation without adopting the singing score value based on.

また、上述した構成において、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ歌唱態様特定手段で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出することが可能である。   Further, in the configuration described above, the singing scoring means determines that the time when the pitch cannot be detected by the pitch detection determining means is not less than a predetermined time despite the input of the singing voice signal from the microphone, and When the singing mode specified by the singing mode specifying unit matches any one of the characteristic singing modes, it is possible to calculate a corrected singing score value by adding bonus points.

このような構成からなる歌唱採点システムでは、カラオケ楽曲の演奏に合わせて利用者が歌唱を行うと、マイクロホンから入力された歌唱音声信号をA/Dコンバータによりデジタル変換して、歌唱採点対象となる採点対象データを生成する。そして、歌唱採点手段により、所定の歌唱採点区間毎に、採点対象データと採点リファレンスデータとを比較して歌唱採点値を算出する。   In the singing scoring system having such a configuration, when a user sings along with the performance of the karaoke music, the singing voice signal input from the microphone is digitally converted by the A / D converter, and becomes a singing scoring target. Generate scoring target data. Then, the singing scoring means calculates the singing scoring value by comparing the scoring target data with the scoring reference data for each predetermined singing scoring section.

また、カラオケ楽曲の進行に伴い出力される歌詞テロップ情報に基づき、子音が発生する採点区間を逐次特定して、当該子音採点区間においてピッチを検出できたか否かで歌唱採点値を修正する。すなわち、ピッチ検出手段により、子音が発生する採点区間として特定された子音採点区間において、歌唱音声信号からピッチ検出を行い、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であるか否かを判定する。ここで、子音採点区間において、聴者が違和感を覚えるようなイレギュラーな歌唱方法で歌唱していない限り、所定時間(例えば、200msec)以上、ピッチを検出できないことになる。   Also, based on the lyrics telop information output as the karaoke music progresses, the scoring section where the consonant is generated is sequentially specified, and the singing scoring value is corrected depending on whether or not the pitch has been detected in the consonant scoring section. That is, in the consonant scoring section specified as the scoring section where the consonant is generated by the pitch detection means, the pitch is detected from the singing voice signal, and the time during which the pitch cannot be detected by the pitch detection determination means is a predetermined time or more. It is determined whether or not. Here, in the consonant scoring section, the pitch cannot be detected for a predetermined time (for example, 200 msec) or more unless the listener sings by an irregular singing method that makes the listener feel uncomfortable.

ところで、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックが存在するため、この歌唱テクニックに相当する特徴的な歌唱態様を記憶しておき、歌唱態様特定手段により、子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定し、歌唱態様比較手段により、特定した歌唱態様と、特徴的な歌唱態様とを比較することにより、特徴的な歌唱方法で歌唱しているか否かを特定することができる。このため、特徴的歌唱態様記憶手段により、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶しておく。具体的には、一般的発音と、特徴的な歌唱態様における特徴的発音とを紐付けしたデータテーブル(特徴的歌唱態様データテーブル)を作成し、これをHDD等の記憶手段に記憶する。   By the way, there is a singing technique that sounds like a singing skill to the listener by performing a characteristic singing method such as changing the consonant pronunciation mode, so a characteristic singing mode equivalent to this singing technique Is stored in the consonant scoring section, the singing mode is specified based on the singing voice signal input from the microphone, and the singing mode specified by the singing mode comparing unit and the characteristic singing By comparing with an aspect, it can be specified whether it is singing by the characteristic singing method. For this reason, the characteristic singing mode storage means stores a plurality of characteristic singing modes for singing by changing the pronunciation mode of consonants. Specifically, a data table (characteristic singing mode data table) in which general pronunciation and characteristic pronunciation in a characteristic singing mode are linked is created and stored in a storage unit such as an HDD.

そして、歌唱採点手段は、実際に歌唱が行われており、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間以上あり、かつ、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックを用いて歌唱を行っていると判定した場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。   The singing scoring means has a time when the pitch cannot be detected for a predetermined time or more despite the fact that the singing voice signal is input from the microphone, and the consonant pronunciation mode is By performing a characteristic singing method such as changing, a penalty for not being able to detect the pitch when it is determined that the song is sung using a singing technique that sounds good to the listener The corrected singing score value is calculated without performing.

本発明の歌唱採点システムによれば、子音が発生する採点区間として特定された子音採点区間において、マイクロホンから入力された歌唱音声信号からピッチを検出することができない時間が所定時間以上の場合であっても、予め定めた特徴的な歌唱方法により歌唱を行っている場合には、ピッチを検出することができない時間が所定時間以上であったことに対する減点を行わずに修正歌唱採点値を算出する。   According to the singing scoring system of the present invention, in the consonant scoring section specified as the scoring section where the consonant is generated, the time when the pitch cannot be detected from the singing voice signal input from the microphone is a predetermined time or more. However, when singing by a predetermined characteristic singing method, the corrected singing score value is calculated without deducting points for the time when the pitch cannot be detected is longer than the predetermined time. .

したがって、ピッチを検出することができない時間が所定時間以上の子音採点区間であっても、歌唱者が自らの歌唱テクニックを駆使して、聴者にとって上手に歌唱していると認識できる特徴的な歌唱方法で歌唱を行っている場合には、歌唱採点値に対する補正を行って歌唱採点値を減点せず、あるいは、さらに加点を行うことにより、聴者に違和感を与えることなく、歌唱者及び聴者双方がカラオケを楽しむことが可能となる。   Therefore, even if it is a consonant scoring section where the pitch cannot be detected for a predetermined time or more, a characteristic singing that can be recognized that the singer is singing well by using his own singing technique When singing by the method, both the singer and the listener can correct the singing score value without degrading the singing score value, or by adding points, so that both the singer and the listener can feel comfortable. It becomes possible to enjoy karaoke.

また、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定すると、音高データ(ピッチデータ)を抽出できない場合があるが、本発明の歌唱採点システムでは、このような歌唱採点区間が存在した場合であっても、歌唱者が特徴的な歌唱方法(歌唱テクニック)を駆使して歌唱を行っている場合には、歌唱者の歌唱テクニックを評価して、聴者の感覚と乖離していない歌唱採点を行うことができる。   Also, if you set a scoring section that is subject to singing so that it is shorter than the singing time of each word that is the lyrics of karaoke music, pitch data may not be extracted. In the singing scoring system of the invention, even when such a singing scoring section exists, if the singer performs a singing using a characteristic singing method (singing technique), Evaluate singing techniques and score singing that does not deviate from the listener's sense.

本発明の実施形態に係る歌唱採点システムを適用したカラオケシステムの構成を示すブロック図。The block diagram which shows the structure of the karaoke system to which the singing scoring system which concerns on embodiment of this invention is applied. 本発明の実施形態に係る歌唱採点システムにおける特徴的歌唱態様データテーブルの構成を示す説明図。Explanatory drawing which shows the structure of the characteristic song aspect data table in the song scoring system which concerns on embodiment of this invention. 本発明の実施形態に係る歌唱採点システムにおける歌唱採点方法の実施例1を示す説明図。Explanatory drawing which shows Example 1 of the singing scoring method in the singing scoring system which concerns on embodiment of this invention. 本発明の実施形態に係る歌唱採点システムにおける歌唱採点方法の実施例2を示す説明図。Explanatory drawing which shows Example 2 of the singing scoring method in the singing scoring system which concerns on embodiment of this invention. 「す(su)」の発音における子音の長さを示す説明図。Explanatory drawing which shows the length of the consonant in pronunciation of "su". 子音「s」のFFTを示す説明図。Explanatory drawing which shows FFT of consonant "s". 母音「u」のFFTを示す説明図。Explanatory drawing which shows FFT of vowel "u". 「き(ki)」の発音における子音の長さを示す説明図。Explanatory drawing which shows the length of the consonant in pronunciation of "ki". 子音「k」のFFTを示す説明図。Explanatory drawing which shows FFT of consonant "k". 母音「i」のFFTを示す説明図。Explanatory drawing which shows FFT of vowel "i".

図面を参照して、本発明の歌唱採点システムの実施形態について説明する。図1〜図4は本発明の実施形態に係る歌唱採点システムを示すもので、図1は歌唱採点システムを適用したカラオケシステムの構成を示すブロック図、図2は特徴的歌唱態様データテーブルの構成を示す説明図、図3及び図4は歌唱採点方法の実施例を示す説明図である。   An embodiment of a singing scoring system of the present invention will be described with reference to the drawings. 1 to 4 show a singing scoring system according to an embodiment of the present invention, FIG. 1 is a block diagram showing a configuration of a karaoke system to which the singing scoring system is applied, and FIG. 2 is a configuration of a characteristic singing mode data table. FIG. 3 and FIG. 4 are explanatory views showing examples of the singing scoring method.

<歌唱採点システムの概要>
本発明の実施形態に係る歌唱採点システムは、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出するシステムに関するものである。この歌唱採点システム10は、図1に示すようにカラオケシステム(カラオケ演奏装置20を含むシステム)に組み込まれてその機能を実現するものであり、歌唱採点機能の一部として構成される。
<Outline of singing scoring system>
The singing scoring system according to the embodiment of the present invention sets a scoring section that is a target of singing scoring so that the singing time is shorter than the singing time of each word that is the lyrics of the karaoke music, and singing scoring in each scoring section The present invention relates to a system for calculating a value. As shown in FIG. 1, this singing scoring system 10 is incorporated in a karaoke system (system including the karaoke performance device 20) to realize its function, and is configured as a part of the singing scoring function.

本実施形態の歌唱採点システム10では、図1に示すように、歌唱採点機能を実現するための機能手段として、歌唱採点手段37と、子音採点区間特定手段38と、ピッチ検出手段39と、ピッチ検出判定手段40と、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)と、歌唱態様特定手段41と、歌唱態様比較手段42とを備えている。   In the singing scoring system 10 of the present embodiment, as shown in FIG. 1, singing scoring means 37, consonant scoring section specifying means 38, pitch detecting means 39, and pitch are provided as functional means for realizing the singing scoring function. The detection determination means 40, the characteristic singing aspect memory | storage means (characteristic singing aspect data table 35c), the singing aspect specific | specification means 41, and the singing aspect comparison means 42 are provided.

なお、以下の説明において、プログラムとは、RAM等に記憶され、CPU等のハードウェアで実行されることにより、その機能を発揮するソフトウェアだけではなく、同等の機能を発揮することが可能な論理回路も含む概念である。   In the following description, a program is a logic that can be stored in a RAM or the like and executed by hardware such as a CPU, so that not only software that exhibits the function but also an equivalent function can be achieved. It is a concept that includes a circuit.

<カラオケ演奏装置>
本発明の実施形態に係る歌唱採点システム10を適用するカラオケ演奏装置20は、図1に示すように、カラオケ本体21、スピーカ22、マイクロホン23、表示装置24、ミキシングアンプ25、カラオケリモコン装置26を備えている。また、カラオケ演奏装置20は、ルータ50及びデータ通信回線60を介して、管理サーバ70とネットワーク接続されている。
<Karaoke performance device>
As shown in FIG. 1, a karaoke performance device 20 to which a singing scoring system 10 according to an embodiment of the present invention includes a karaoke main body 21, a speaker 22, a microphone 23, a display device 24, a mixing amplifier 25, and a karaoke remote control device 26. I have. The karaoke performance device 20 is connected to the management server 70 via the router 50 and the data communication line 60.

<カラオケリモコン装置>
カラオケリモコン装置26は、ユーザインタフェース機能を備えており、ルータ50を介してカラオケ本体21とデータ通信を行うようになっている。このカラオケリモコン装置26は、楽曲検索手段26aとして機能するプログラム、楽曲索引データベース26b、種々のデータを記憶するためのデータ記憶部26c、データの入出力を行うための入出力表示部26d等を備えている。このカラオケリモコン装置26に付帯するスイッチ類や、入出力表示部26dに表示される各種のアイコン等を操作することにより、選曲操作等が行われる。
<Karaoke remote control device>
The karaoke remote control device 26 has a user interface function, and performs data communication with the karaoke main body 21 via the router 50. The karaoke remote control device 26 includes a program functioning as a music search means 26a, a music index database 26b, a data storage unit 26c for storing various data, an input / output display unit 26d for inputting / outputting data, and the like. ing. A music selection operation or the like is performed by operating switches attached to the karaoke remote control device 26 or various icons displayed on the input / output display unit 26d.

なお、カラオケ本体21にローカル送受信手段(図示せず)を設け、このローカル送受信手段とカラオケリモコン装置26との間で有線方式又は無線方式(例えば、赤外線通信)によりデータの送受信を行うようにしてもよい。さらに、利用者が所持する携帯情報端末(例えば、スマートフォン)等に、選曲プログラムをインストールすることにより、携帯情報端末に選曲装置としての機能を持たせ、管理サーバ70を経由して、携帯情報端末とペアリングしたカラオケ演奏装置20に対して選曲情報を送信するようにしてもよい。   The karaoke main body 21 is provided with local transmission / reception means (not shown), and data transmission / reception is performed between the local transmission / reception means and the karaoke remote control device 26 by a wired method or a wireless method (for example, infrared communication). Also good. Furthermore, by installing a music selection program in a mobile information terminal (for example, a smartphone) possessed by the user, the mobile information terminal has a function as a music selection device, and the mobile information terminal is connected via the management server 70. The music selection information may be transmitted to the karaoke performance device 20 paired with.

<楽曲検索手段/楽曲索引データベース>
楽曲検索手段26aは、利用者の指示に基づき、楽曲索引データベース26bを参照して楽曲を検索するためのプログラムからなる。楽曲索引データベース26bは、カラオケ演奏装置20で演奏に供されるカラオケ楽曲について、その属性情報を記述したデータベースであり、例えば、楽曲番号・曲名・アーティスト名・歌い出し部分の歌詞・流行時期・音楽ジャンル区分・デュエット曲か否かなど、種々の属性情報がこれに含まれている。
<Music search means / music index database>
The music search means 26a is composed of a program for searching for music by referring to the music index database 26b based on a user instruction. The song index database 26b is a database describing attribute information of karaoke songs used for performance by the karaoke performance device 20, for example, song number, song name, artist name, lyrics of the singing part, trend time, music. This includes various attribute information such as genre classification and whether or not it is a duet song.

<マイクロホン>
マイクロホン23は、歌唱音声の入力を行うための装置である。マイクロホン23から入力された歌唱音声信号は、ミキシングアンプ25により、音楽再生制御手段43から送出される演奏音声信号とミキシングされると共に増幅され、スピーカ22へ出力される。なお、マイクロホン23からの音声入力信号は、A/Dコンバータ44によりデジタル変換され、歌唱採点手段37における歌唱採点等に使用される。
<Microphone>
The microphone 23 is a device for inputting singing voice. The singing voice signal input from the microphone 23 is mixed and amplified by the mixing amplifier 25 with the performance voice signal sent from the music reproduction control means 43 and output to the speaker 22. The audio input signal from the microphone 23 is digitally converted by the A / D converter 44 and used for singing scoring in the singing scoring means 37.

<表示装置>
表示装置24は、カラオケ楽曲に関連した背景映像や歌詞テロップ等を表示するための装置で、例えば、液晶ディスプレイ等により構成される。
<Display device>
The display device 24 is a device for displaying a background video, lyrics telop, and the like related to karaoke music, and is configured by, for example, a liquid crystal display.

<カラオケ本体>
カラオケ本体21は、図1に示すように、ネットワーク送受信手段31、中央制御手段32、ROM33、RAM34、HDD35、予約管理手段36、歌唱採点手段37、子音採点区間特定手段38、ピッチ検出手段39、ピッチ検出判定手段40、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)、歌唱態様特定手段41、歌唱態様比較手段42、音楽再生制御手段43、A/Dコンバータ44、映像再生制御手段45を備えている。
<Karaoke body>
As shown in FIG. 1, the karaoke main body 21 includes a network transmission / reception means 31, a central control means 32, a ROM 33, a RAM 34, an HDD 35, a reservation management means 36, a singing scoring means 37, a consonant scoring section specifying means 38, a pitch detecting means 39, Pitch detection determination means 40, characteristic singing mode storage means (characteristic singing mode data table 35c), singing mode specifying means 41, singing mode comparison means 42, music playback control means 43, A / D converter 44, video playback control means 45.

<ネットワーク送受信手段>
ネットワーク送受信手段31は、ルータ50及びデータ通信回線60を介して管理サーバ70、カラオケリモコン装置26、他のカラオケ演奏装置20との間でデータの送受信を行うための電子回路及びプログラムからなる。データ通信回線60は、データの送受信を行うことができればどのような回線であってもよいが、例えば、光回線、専用電話回線、一般電話回線、インターネット等を利用することができる。本実施形態では、光回線、専用電話回線、一般電話回線等の通信回線と、インターネットとを組み合わせて、データ通信回線60を構成している。
<Network transmission / reception means>
The network transmission / reception means 31 includes an electronic circuit and a program for transmitting / receiving data to / from the management server 70, the karaoke remote control device 26, and other karaoke performance devices 20 via the router 50 and the data communication line 60. The data communication line 60 may be any line as long as it can transmit and receive data. For example, an optical line, a dedicated telephone line, a general telephone line, the Internet, or the like can be used. In the present embodiment, the data communication line 60 is configured by combining a communication line such as an optical line, a dedicated telephone line, and a general telephone line, and the Internet.

<中央制御手段>
中央制御手段32は、カラオケ本体21を総合的に制御するための手段であり、例えばCPU及びその周辺機器により構成されており、CPU等がROM33等に記憶されたプログラムに従って動作することにより、制御機能を発揮することができるようになっている。
<Central control means>
The central control means 32 is a means for comprehensively controlling the karaoke main body 21 and is constituted by, for example, a CPU and its peripheral devices, and is controlled by the CPU or the like operating according to a program stored in the ROM 33 or the like. The function can be demonstrated.

<ROM/RAM>
ROM33は、カラオケ本体21を構成する各機器を制御するためのプログラムデータや数値データを記憶するための機器で、例えば半導体メモリ等で構成される。また、RAM34は、プログラムや各種データを一時的に記憶する一時記憶領域として機能するもので、例えば半導体メモリ等で構成される。
<ROM / RAM>
The ROM 33 is a device for storing program data and numerical data for controlling each device constituting the karaoke main body 21, and is constituted by a semiconductor memory, for example. The RAM 34 functions as a temporary storage area for temporarily storing programs and various data, and is composed of, for example, a semiconductor memory.

本実施形態では、RAM34に、予約待ち行列34aが記憶されるようになっている。なお、予約待ち行列34aは、選曲予約されたカラオケ楽曲について、演奏順に楽曲IDを並べて構成されたデータテーブルであり、選曲予約者の利用者ID等、他の識別データが紐付けされている場合もある。また、RAM34に、歌唱採点値を記憶するようにしてもよい。   In the present embodiment, a reservation queue 34 a is stored in the RAM 34. Note that the reservation queue 34a is a data table in which music IDs are arranged in order of performance for karaoke music reserved for music selection, and when other identification data such as a user ID of a music selection reservation person is associated. There is also. Moreover, you may make it memorize | store a singing score value in RAM34.

<HDD>
HDD35は、大容量記憶装置として機能するもので、楽曲データベース35a、映像データベース35b、特徴的歌唱態様データテーブル35cが格納されている。なお、HDD35に替えて、あるいはHDD35と共に、データを書き替え可能なDVD等の大容量記憶装置を用いてもよい。
<HDD>
The HDD 35 functions as a large-capacity storage device, and stores a music database 35a, a video database 35b, and a characteristic singing mode data table 35c. Note that a mass storage device such as a DVD capable of rewriting data may be used instead of the HDD 35 or together with the HDD 35.

<楽曲データベース/映像データベース>
楽曲データベース35aは、演奏制御データ(MIDI規格のデータ)及び歌詞テロップ情報が同期されて構成される楽曲データと、歌唱採点に用いる採点リファレンスデータとが、楽曲IDと対応付けてそれぞれ構成されたデータベースである。演奏制御データは、各楽曲の演奏を制御するためのデジタルデータであり、歌詞テロップ情報は演奏に同期した歌詞文字の表示タイミングデータ及び色変わりデータを含んでいる。採点リファレンスデータは、歌唱採点手段37における歌唱採点において、マイクロホン23から入力された歌唱音声信号と比較することにより、歌唱採点値を算出するためのデータである。また、子音採点区間特定手段38は、歌詞テロップ情報に基づいて、子音を含む歌唱区間及び子音の種類を特定する。
<Music database / video database>
The music database 35a is a database in which music data configured by synchronizing performance control data (MIDI standard data) and lyrics telop information and scoring reference data used for singing is associated with a music ID. It is. The performance control data is digital data for controlling the performance of each musical piece, and the lyrics telop information includes display timing data and color change data of lyrics characters synchronized with the performance. The scoring reference data is data for calculating the singing scoring value by comparing with the singing voice signal input from the microphone 23 in the singing scoring in the singing scoring means 37. The consonant scoring section specifying means 38 specifies the singing section including the consonant and the type of the consonant based on the lyrics telop information.

映像データベース35bは、演奏されるカラオケ楽曲に対応した背景映像を、当該カラオケ楽曲の楽曲IDに対応させた映像ファイルとして所定数格納したデータベースである。特徴的歌唱態様データテーブル35cについては、後述する。   The video database 35b is a database that stores a predetermined number of background videos corresponding to karaoke songs to be played as video files corresponding to the song IDs of the karaoke songs. The characteristic singing mode data table 35c will be described later.

<予約管理手段>
予約管理手段36は、任意の利用者が選曲予約する際に、当該選曲されたカラオケ楽曲の楽曲IDを含む予約待ち行列34aを作成して管理するためのプログラムからなる。すなわち、予約管理手段36は、利用者により楽曲検索手段26aの機能を用いて選曲された楽曲IDを演奏順に並べて予約待ち行列34aを作成し、この予約待ち行列34aをRAM34に格納して管理する。また、予約待ち行列34aに選曲者の利用者IDを含める場合には、利用者IDの取得が必要となる。
<Reservation management means>
The reservation management means 36 includes a program for creating and managing a reservation queue 34a including the song ID of the selected karaoke song when an arbitrary user makes a song selection reservation. That is, the reservation management means 36 creates a reservation queue 34a by arranging the music IDs selected by the user using the function of the music search means 26a in the order of performance, and stores and manages this reservation queue 34a in the RAM 34. . In addition, when the user ID of the music selector is included in the reservation queue 34a, it is necessary to acquire the user ID.

利用者IDは、利用者IDカードに記憶された利用者IDをカードリーダにより読み取り、あるいは、カラオケリモコン装置26の入出力表示部26dを用いて入力された利用者ID及びパスワードに基づいて取得すればよい。さらに、利用者が携帯する携帯情報端末を用いて予約を行う機能を有する場合には、当該携帯情報端末の機器IDに紐付けされた利用者IDを取得してもよい。また、カラオケ演奏装置20を使用する際に、利用者に対して一時的に利用者IDを付与してもよい。   The user ID is acquired based on the user ID and password input using the input / output display unit 26d of the karaoke remote control device 26 by reading the user ID stored in the user ID card with a card reader. That's fine. Furthermore, when it has the function to make a reservation using the portable information terminal which a user carries, you may acquire user ID linked | related with apparatus ID of the said portable information terminal. Moreover, when using the karaoke performance apparatus 20, you may provide a user ID temporarily with respect to a user.

<音楽再生制御手段>
音楽再生制御手段43は、楽曲IDに基づいて演奏データから抽出された演奏制御データに基づいて、音源データをデジタル再生すると共にアナログ変換してミキシングアンプ25に出力するための電子回路である。上述したように、ミキシングアンプ25は、マイクロホン23から入力された歌唱者の歌唱音声信号と、音楽再生制御手段43から送出される演奏音声信号とをミキシングすると共に、アンプ機能により増幅してスピーカ22より出力するための装置である。
<Music playback control means>
The music reproduction control means 43 is an electronic circuit for digitally reproducing the sound source data based on the performance control data extracted from the performance data based on the music ID and converting it to analog and outputting it to the mixing amplifier 25. As described above, the mixing amplifier 25 mixes the singer's singing voice signal input from the microphone 23 and the performance voice signal sent out from the music reproduction control means 43, and amplifies it by the amplifier function to be amplified by the speaker 22. It is a device for outputting more.

<映像再生制御手段>
映像再生制御手段45は、カラオケ楽曲の演奏中に、映像データベース35bから抽出した背景映像データと、演奏データに含まれる歌詞テロップ情報に基づいて作成される歌詞文字とを、当該カラオケ楽曲の演奏データに同期させて表示装置24に出力する。
<Video playback control means>
The video reproduction control means 45 uses the background video data extracted from the video database 35b and the lyric characters created based on the lyrics telop information included in the performance data during the performance of the karaoke music as performance data of the karaoke music. Are output to the display device 24 in synchronization with

<歌唱採点手段>
歌唱採点手段37は、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出するためのプログラムからなる。そして、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間(例えば、200msec)以上であり、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。
<Singing method>
The singing scoring means 37 is composed of a program for comparing the singing voice signal input from the microphone 23 and the scoring reference data to calculate a singing scoring value. Then, although the singing voice signal is input from the microphone 23, any time in which the pitch cannot be detected is a predetermined time (for example, 200 msec) or more, and the specified singing mode is one of the characteristic singing modes. If it matches one, a corrected singing score value is calculated without deducting points for failure to detect the pitch.

マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間(例えば、200msec)以上であるという条件は、歌唱者が歌唱している場合であっても、子音採点区間であるためピッチを検出できず、さらに、本来の歌唱方法とは異なるイレギュラーな歌唱方法で、無理矢理ピッチを検出させるような歌唱をしていないことを確認するためである。   Even if the singing voice signal is input from the microphone 23, the condition that the time when the pitch cannot be detected is a predetermined time (for example, 200 msec) or more is the case where the singer is singing, This is because the pitch cannot be detected because it is a consonant scoring section, and furthermore, it is confirmed that the singing forcibly detecting the pitch is not performed by an irregular singing method different from the original singing method.

イレギュラーな歌唱方法とは、子音の発音時間を極端に短くしたり、子音を発音せずに母音のみを発音したりすることにより、聴者の感覚とかけ離れて歌唱採点値が高くなってしまう歌唱方法のことである。このようなイレギュラーな歌唱方法を許して歌唱採点値が高くなった場合には、歌唱採点値と聴者の感覚とが乖離してしまい、聴者が違和感を覚えることになる。この場合には、イレギュラーな歌唱方法により歌唱採点値が上昇することを防止する工夫が必要となる。イレギュラーな歌唱方法に対応するには、例えば、子音採点区間であるにもかかわらずピッチを検出できた場合に、減点を行えばよい。   An irregular singing method is a singing that increases the singing score away from the listener's sense by shortening the pronunciation time of consonants extremely or by producing only vowels without producing consonants. It is a method. When such an irregular singing method is permitted and the singing score value becomes high, the singing score value and the listener's sense are different, and the listener feels uncomfortable. In this case, the device which prevents that a singing scoring value raises by an irregular singing method is needed. In order to deal with an irregular singing method, for example, when the pitch can be detected despite the consonant scoring section, deduction may be performed.

また、歌唱採点手段37は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ歌唱態様特定手段41で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出してもよい。   Further, the singing scoring means 37 determines that the time when the pitch cannot be detected by the pitch detection determining means 40 is not less than a predetermined time (for example, 200 msec) even though the singing voice signal is input from the microphone 23. When the singing mode specified by the singing mode specifying unit 41 matches any one of the characteristic singing modes, the singing voice signal input from the microphone 23 is compared with the scoring reference data to evaluate the rhythm. The corrected singing score value may be calculated by performing correction based on the singing score value based on the rhythm evaluation without adopting the singing score value based on the pitch detection.

さらに、歌唱採点手段37は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ歌唱態様特定手段41で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出してもよい。   Further, the singing scoring unit 37 determines that the time when the pitch cannot be detected by the pitch detection determining unit 40 is not less than a predetermined time (for example, 200 msec) even though the singing voice signal is input from the microphone 23. In addition, when the singing mode specified by the singing mode specifying unit 41 matches any one of the characteristic singing modes, a bonus score may be added to calculate a corrected singing score value.

<子音採点区間特定手段>
子音採点区間特定手段38は、歌詞テロップ情報に基づき、子音が発生する採点区間を特定するためのプログラムからなる。すなわち、歌詞テロップ情報には、表示装置24に表示する歌詞文字情報が含まれており、この歌詞文字情報に基づいて、子音が発生する採点区間を特定することができる。
<Consonant scoring section identification means>
The consonant scoring section specifying means 38 includes a program for specifying a scoring section where a consonant is generated based on the lyrics telop information. That is, the lyric telop information includes lyric character information to be displayed on the display device 24, and based on this lyric character information, it is possible to specify a scoring section where a consonant is generated.

<ピッチ検出手段>
ピッチ検出手段39は、特定された子音採点区間において、入力された歌唱音声信号からピッチ検出を行うためのプログラムからなる。
<Pitch detection means>
The pitch detection means 39 consists of a program for performing pitch detection from the input singing voice signal in the specified consonant scoring section.

<ピッチ検出判定手段>
ピッチ検出判定手段40は、ピッチ検出手段39がピッチを検出できなかった時間が所定時間以上であるか否かを判定するためのプログラムからなる。すなわち、子音採点区間では、子音の種類にもよるが、本来の歌唱方法で歌唱するとピッチを検出できないことが一般的である。しかし、子音採点区間においてピッチを検出できない場合であっても、歌唱者の歌唱テクニックにより、子音の発音態様を変更して歌唱する特徴的な歌唱態様で歌唱している場合には、これを評価することにより、カラオケの楽しさを高めることができる。そこで、本実施形態では、子音の発音態様を変更して歌唱する特徴的な歌唱態様で歌唱しているためピッチを検出できない場合と、本来の歌唱方法とは異なるイレギュラーな歌唱方法で、無理矢理ピッチを検出させるような歌唱をしている場合を区別するため、ピッチを検出できなかった時間が所定時間以上であるか否かを判定する。
<Pitch detection determination means>
The pitch detection determination means 40 is composed of a program for determining whether or not the time when the pitch detection means 39 cannot detect the pitch is a predetermined time or more. That is, in the consonant scoring section, although it depends on the type of consonant, it is common that the pitch cannot be detected when singing with the original singing method. However, even if the pitch cannot be detected in the consonant scoring section, this is evaluated when singing in a characteristic singing manner in which the singing method of the consonant is changed by the singer's singing technique. By doing so, you can enhance the fun of karaoke. Therefore, in the present embodiment, when the pitch cannot be detected because the singing is performed in a characteristic singing mode in which the consonant sounding mode is changed, and an irregular singing method different from the original singing method, In order to distinguish the case of singing to detect the pitch, it is determined whether or not the time when the pitch cannot be detected is a predetermined time or more.

<特徴的歌唱態様記憶手段>
特徴的歌唱態様記憶手段は、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶するための手段であり、例えば、特徴的歌唱態様データテーブル35cを作成して、HDD35等の記憶手段に記憶する。
<Characteristic singing mode storage means>
The characteristic singing mode storage means is a means for storing a plurality of characteristic singing modes for singing by changing the pronunciation mode of the consonant. For example, the characteristic singing mode data table 35c is created and the HDD 35 or the like is created. Is stored in the storage means.

子音の発音態様を変更して歌唱する特徴的な歌唱態様とは、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックのことである。具体的には、「待ってて」を「ンマッテテ」と発音するように「マ」の発音前に「ン」を発音することにより歌い始めを強調する歌唱態様、「乾いた」を「クァワイタ」と発音するように「カ」をカ行の別音及び母音で発音する歌唱態様、「眠っていた」を「ネムッテイツァ」と発音するように「タ」をタ行の別音及び母音で発音する歌唱態様、「揺られて」を「ユラレツェ」と発音するように「テ」をタ行の別音及び母音で発音する歌唱態様、「誇らしげ」を「ホコゥラシゲ」と発音するように「ラ」の発音前に「ゥ」を発音したり、「ラ」を巻き舌で発音したりする歌唱態様、「マシーン」の「シ」の発音前に歯擦音等を発音する歌唱態様等のことである。なお、特徴的な歌唱態様は上述したものに限られず、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる歌唱態様であれば、どのような態様であってもよい。   The characteristic singing mode of singing by changing the pronunciation mode of consonants is a singing technique that is different from general pronunciation but sounds to the listener as if singing well. Specifically, the singing mode that emphasizes the beginning of singing by pronouncing “n” before pronouncing “ma” so that “wait” is pronounced “nmantete”, “dry” is “quayta” A singing mode that pronounces “K” with a separate sound and vowels of the Ka line, and pronounces “Ta” with a separate sound and vowels of the Ta line, so that “sleeping” is pronounced as “Nemutica” Singing mode, “swaying” is pronounced as “Yurareze”, “te” is pronounced with separate sounds and vowels in the Ta line, and “proud” is pronounced as “Hokora Shige” Singing mode that pronounces “u” before pronunciation or “la” with lingual tongue, singing mode that produces sibilant sound before “si” in “machine”, etc. . It should be noted that the characteristic singing mode is not limited to the above-described ones, and by performing a characteristic singing method such as changing the pronunciation mode of consonants, it differs from general pronunciation, but the listener sings well. As long as it is a singing mode that sounds like it is, any mode may be used.

特徴的歌唱態様データテーブル35cは、図2に示すように、一般的発音と、特徴的な歌唱態様における特徴的発音とを紐付けしたデータテーブルであり、例えば、上述したような一般的発音に対応する特徴的な歌唱態様が述されている。   As shown in FIG. 2, the characteristic singing mode data table 35c is a data table in which general pronunciation and characteristic pronunciation in the characteristic singing mode are linked. Corresponding characteristic singing modes are described.

子音の発音態様を変更して歌唱する歌唱方法(特徴的歌唱態様)は、聴者に対してインパクトを与えたり、アタック感を弱めてメロディーを強調したりする等、聴者にとって違和感を生じさせるものではなく、歌唱者の歌唱テクニックを評価する必要がある。したがって、本発明では、このような特徴的歌唱態様に対して、たとえピッチを検出できない時間が所定時間以上であっても減点を行わず、あるいは、さらにボーナス点を与えるようにしている。   The singing method (characteristic singing mode) of singing by changing the consonant pronunciation mode does not create a sense of incongruity for the listener, such as giving impact to the listener or weakening the attack to emphasize the melody. There is no need to evaluate the singer's singing technique. Therefore, according to the present invention, for such a characteristic singing mode, even if the time during which the pitch cannot be detected is longer than a predetermined time, no deduction is performed, or further bonus points are given.

<歌唱態様特定手段>
歌唱態様特定手段41は、子音採点区間において、マイクロホン23から入力された歌唱音声信号に基づいて歌唱態様を特定するためのプログラムからなる。歌唱態様とは、歌詞文字の発音態様のことであり、歌詞文字を一般的な発音で歌唱する場合と、上述したように、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる発音で歌唱する場合と、イレギュラーな方法で歌唱することにより、歌唱採点値は高くなるが、聴者にとって違和感を覚える場合とがある。歌唱態様特定手段41は、一般的な歌唱態様、特徴的な歌唱態様、イレギュラーな歌唱態様を区別するために、マイクロホン23から入力された歌唱音声信号に基づいて歌唱態様を特定する。
<Singing mode identification means>
The singing mode specifying means 41 includes a program for specifying the singing mode based on the singing voice signal input from the microphone 23 in the consonant scoring section. The singing mode is the pronunciation mode of the lyric characters, and when singing the lyric characters with a general pronunciation, as described above, it is different from the general pronunciation, but the listener sings well. When singing with a sound that sounds like it is singing, and by singing in an irregular manner, the singing score increases, but the listener may feel uncomfortable. The singing mode specifying means 41 specifies the singing mode based on the singing voice signal input from the microphone 23 in order to distinguish a general singing mode, a characteristic singing mode, and an irregular singing mode.

歌唱態様を特定するには、例えば、子音採点区間において、ピッチが検出されていなかった時間と歌唱音量の変化を確認したり、音声認識技術を適用したりすることができる。すなわち、マイクロホン23から入力された歌唱音声信号に基づいて、ピッチが検出されていなかった時間と歌唱音量の変化を判定したり、音声認識を行ったりすることにより、歌唱態様を特定する。   In order to specify the singing mode, for example, in the consonant scoring section, it is possible to confirm the time when the pitch has not been detected and the change in the singing volume, or to apply the voice recognition technique. That is, based on the singing voice signal input from the microphone 23, the singing mode is specified by determining the change in the singing volume and the time during which the pitch has not been detected, or by performing voice recognition.

<歌唱態様比較手段>
歌唱態様比較手段42は、特定した歌唱態様と、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)に記憶された特徴的な歌唱態様とを比較するためのプログラムからなる。上述したように、歌唱態様には、一般的な歌唱態様、特徴的な歌唱態様、イレギュラーな歌唱態様とがあり、歌唱態様比較手段42は、歌唱態様特定手段41で特定した歌唱態様と、予め設定されている特徴的な歌唱態様とを比較して、比較結果を歌唱採点手段37における歌唱採点に反映させる。
<Singing mode comparison means>
The singing mode comparison means 42 includes a program for comparing the specified singing mode with the characteristic singing mode stored in the characteristic singing mode storage unit (characteristic singing mode data table 35c). As described above, the singing mode includes a general singing mode, a characteristic singing mode, and an irregular singing mode, and the singing mode comparing means 42 is a singing mode specified by the singing mode specifying means 41, and The characteristic singing aspect set in advance is compared, and the comparison result is reflected in the singing score in the singing scoring means 37.

歌唱態様比較手段42では、子音採点区間特定手段38により特定した子音の一般的発音に対応する特徴的発音と、歌唱態様特定手段41で特定した歌唱態様による発音とを比較する。すなわち、図2に示す特徴的歌唱態様データテーブル35cを参照して、子音採点区間において、歌唱態様特定手段41で特定した歌唱態様による発音が、子音採点区間特定手段38により特定した子音に対応する特徴的発音であるか否かを比較する。そして、両者が一致した場合には、歌唱採点手段37において、特徴的歌唱態様に対する優遇採点処理を行う。   The singing mode comparing unit 42 compares the characteristic pronunciation corresponding to the general pronunciation of the consonant specified by the consonant scoring section specifying unit 38 and the pronunciation by the singing mode specified by the singing mode specifying unit 41. That is, referring to the characteristic singing mode data table 35 c shown in FIG. 2, the pronunciation by the singing mode specified by the singing mode specifying means 41 in the consonant scoring section corresponds to the consonant specified by the consonant scoring section specifying means 38. Compare whether or not it is a characteristic pronunciation. And when both correspond, in the singing scoring means 37, the preferential scoring process with respect to a characteristic singing aspect is performed.

<採点方法(実施例1)>
図3を参照して、採点方法の実施例1を説明する。採点方法の実施例1は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わない採点方法である。さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的歌唱態様であるため、ボーナス点を加算する。なお、加算するボーナス点は、特徴的歌唱態様の種類に応じて増減してもよい。
<Scoring method (Example 1)>
With reference to FIG. 3, Example 1 of the scoring method will be described. In the scoring method according to the first embodiment, the pitch detection determination unit 40 determines that the time when the pitch cannot be detected is equal to or longer than a predetermined time (for example, 200 msec) despite the input of the singing voice signal from the microphone 23. In addition, when the specified singing mode matches any one of the characteristic singing modes, the scoring method does not perform any deduction for the fact that the pitch cannot be detected. Furthermore, since it is a characteristic singing mode that makes it seem that the singer is singing well by using the singing technique, the bonus point is added. In addition, you may increase / decrease the bonus point to add according to the kind of characteristic singing aspect.

すなわち、図3に示すように、子音採点区間(1)において、マイクロホン23から歌唱音声信号の入力があり、ピッチ検出判定手段40により、ピッチを検出できなかった時間が200msec以上であると判定され、かつ特徴的な歌唱態様で歌唱している場合に、ピッチを検出できなかったことに対する減点を行わない。例えば、ピッチ検出に対する採点値の満点が30点の場合に、ピッチを検出できなければ30点の減点となるが、実施例1の子音採点区間(1)では、30点の減点を行わずに、実際の歌唱採点値に対して補正値としての30点と、ボーナス点としての5点を加算した90点が修正歌唱採点値となる。   That is, as shown in FIG. 3, in the consonant scoring section (1), a singing voice signal is input from the microphone 23, and the time when the pitch cannot be detected is determined by the pitch detection determination means 40 to be 200 msec or more. And, when singing in a characteristic singing mode, no deduction is made for the fact that the pitch could not be detected. For example, when the score score for pitch detection is 30 points, if the pitch cannot be detected, 30 points will be deducted, but in the consonant scoring section (1) of Example 1, 30 points will not be deducted. 90 points obtained by adding 30 points as correction values and 5 points as bonus points to the actual singing score values are the corrected singing score values.

また、ピッチを検出した子音採点区間(2)、あるいはピッチを検出できない場合であっても、ピッチを検出できなかった時間が所定値(例えば、200msec)未満であり、または特徴的な歌唱態様を行っていない子音採点区間(3)では、実際の歌唱採点値を修正歌唱採点値とする。   Moreover, even if it is a case where the pitch is not detected even if the pitch is not detected, the time when the pitch cannot be detected is less than a predetermined value (for example, 200 msec), or a characteristic singing mode In the consonant scoring section (3) that is not performed, the actual singing scoring value is set as the corrected singing scoring value.

<採点方法(実施例2)>
図4を参照して、採点方法の実施例2を説明する。採点方法の実施例2は、子音採点区間において、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出する採点方法である。さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的な歌唱態様であるため、ボーナス点を加算する。なお、加算するボーナス点は、特徴的歌唱態様の種類に応じて増減してもよい。
<Scoring method (Example 2)>
With reference to FIG. 4, Example 2 of the scoring method is demonstrated. Example 2 of the scoring method performs rhythm evaluation by comparing the singing voice signal input from the microphone 23 and the scoring reference data in the consonant scoring section, and does not adopt the singing scoring value based on pitch detection. This is a scoring method for calculating a corrected singing scoring value by performing correction based on the singing scoring value based on evaluation. Furthermore, since it is a characteristic singing mode that makes it seem that the singer is singing well by using the singing technique, the bonus point is added. In addition, you may increase / decrease the bonus point to add according to the kind of characteristic singing aspect.

すなわち、図4に示すように、子音採点区間において、マイクロホン23から歌唱音声信号の入力があり、ピッチが検出できなかった時間が200msec以上であり、さらに、特徴的な歌唱態様である場合に、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点を行い、ピッチ検出に基づく歌唱採点値を補うために、リズム評価に基づく歌唱採点値を基準とした補正値を加算して、修正歌唱採点値を算出する。   That is, as shown in FIG. 4, in the consonant scoring section, when a singing voice signal is input from the microphone 23, the time when the pitch cannot be detected is 200 msec or more, and when the singing mode is characteristic, In order to perform singing scoring based on rhythm evaluation without using the singing scoring value based on pitch detection, and to compensate for the singing scoring value based on pitch detection, a correction value based on the singing scoring value based on rhythm evaluation is added. Then, the corrected singing score value is calculated.

ここで、例えば、歌唱採点値の総合満点が100点であり、ピッチ検出に基づく歌唱採点値の満点が30点であり、リズム評価に基づく歌唱採点値の満点が40点であり、その他の基準に基づく歌唱採点値の満点が30点であったとする。   Here, for example, the total score of the singing score value is 100 points, the singing score value based on the pitch detection is 30 points, the singing score value based on the rhythm evaluation is 40 points, and other criteria Suppose that the perfect score of the singing score based on is 30.

図4に示す例では、子音歌唱区間(1)において、ピッチが検出できなかった時間が200msec以上であり、さらに、特徴的な歌唱態様で歌唱している。そして、子音歌唱区間(1)では、ピッチを検出できないため、ピッチ検出に基づく歌唱採点値は0点であるが、リズム評価に基づく歌唱採点値が35点であり、その他の基準に基づく歌唱採点値が25点である。そこで、ピッチ検出に基づく歌唱採点値を補正するため、リズム評価を基準として算出した補正値を加算する。   In the example shown in FIG. 4, in the consonant singing section (1), the time when the pitch cannot be detected is 200 msec or more, and further singing in a characteristic singing mode. And in the consonant singing section (1), since the pitch cannot be detected, the singing score value based on the pitch detection is 0 point, but the singing score value based on the rhythm evaluation is 35 points, and the singing score based on other criteria The value is 25 points. Therefore, in order to correct the singing score value based on the pitch detection, a correction value calculated based on the rhythm evaluation is added.

すなわち、リズム評価については40点満点中35点を獲得していることになり、その得点比率は35/40である。そこで、ピッチ検出に基づく歌唱採点値の満点である30点に対して、リズム評価に基づく得点比率である35/40を乗算して、ピッチ検出に基づく歌唱採点値に対する補正値を算出し、さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的な歌唱態様であるため、ボーナス点として加点を行う。この場合、リズム評価に基づく歌唱採点値が35点であり、その他の基準に基づく歌唱採点値が25点であり、補正値が26点であり、ボーナス点が5点であるため、修正歌唱採点値は91点となる。   That is, for the rhythm evaluation, 35 points out of 40 points are obtained, and the score ratio is 35/40. Therefore, the correction value for the singing scoring value based on the pitch detection is calculated by multiplying 30 points which are the full score of the singing scoring value based on the pitch detection by 35/40 which is the scoring ratio based on the rhythm evaluation, and Since this is a characteristic singing mode that makes it seem that the singer is singing well for the listener by using the singing technique, points are added as bonus points. In this case, the singing scoring value based on the rhythm evaluation is 35 points, the singing scoring value based on other criteria is 25 points, the correction value is 26 points, and the bonus score is 5 points. The value is 91 points.

また、ピッチを検出した子音採点区間(2)、あるいはピッチを検出できない場合であっても、ピッチを検出できなかった時間が所定値(例えば、200msec)未満であり、または特徴的な歌唱態様ではない子音歌唱区間(3)では、実際の歌唱採点値を修正歌唱採点値とする。   In addition, the consonant scoring section (2) in which the pitch is detected, or even when the pitch cannot be detected, the time during which the pitch cannot be detected is less than a predetermined value (for example, 200 msec), or in a characteristic singing mode In no consonant singing section (3), the actual singing score is set as the corrected singing score.

<他の実施形態>
本発明のシステム及びその周辺装置を構成する機器や手段は上述したものに限定されず、その利用目的に応じて、必要な機器や手段のみの構成としたり、適宜他の機器や手段を付加したりすることができる。また、各手段をそれぞれ別個のものとして構成するのではなく、複数の機能を統合した手段として構成してもよい。
<Other embodiments>
The devices and means constituting the system of the present invention and its peripheral devices are not limited to those described above, and only the necessary devices and means are configured according to the purpose of use, or other devices and means are appropriately added. Can be. Further, each unit may be configured as a unit in which a plurality of functions are integrated, instead of being configured separately.

10 歌唱採点システム
20 カラオケ演奏装置
21 カラオケ本体
22 スピーカ
23 マイクロホン
24 表示装置
25 ミキシングアンプ
26 カラオケリモコン装置
26a 楽曲検索手段
26b 楽曲索引データベース
26c データ記憶部
26d 入出力表示部
31 ネットワーク送受信手段
32 中央制御手段
33 ROM
34 RAM
34a 予約待ち行列
35 HDD
35a 楽曲データベース
35b 映像データベース
35c 特徴的歌唱態様データテーブル
36 予約管理手段
37 歌唱採点手段
38 子音採点区間特定手段
39 ピッチ検出手段
40 ピッチ検出判定手段
41 歌唱態様特定手段
42 歌唱態様比較手段
43 音楽再生制御手段
44 A/Dコンバータ
45 映像再生制御手段
50 ルータ
60 データ通信回線
70 管理サーバ
DESCRIPTION OF SYMBOLS 10 Song scoring system 20 Karaoke performance apparatus 21 Karaoke main body 22 Speaker 23 Microphone 24 Display apparatus 25 Mixing amplifier 26 Karaoke remote control apparatus 26a Music search means 26b Music index database 26c Data storage part 26d Input / output display part 31 Network transmission / reception means 32 Central control means 33 ROM
34 RAM
34a Reservation queue 35 HDD
35a Music database 35b Video database 35c Characteristic singing mode data table 36 Reservation management means 37 Singing scoring means 38 Consonant scoring section specifying means 39 Pitch detecting means 40 Pitch detection determining means 41 Singing mode specifying means 42 Singing mode comparing means 43 Music reproduction control Means 44 A / D converter 45 Video reproduction control means 50 Router 60 Data communication line 70 Management server

Claims (3)

カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出する歌唱採点システムにおいて、
マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点手段と、
歌詞テロップ情報に基づき、子音が発生する採点区間を特定する子音採点区間特定手段と、
前記特定された子音採点区間において、前記入力された歌唱音声信号からピッチ検出を行うピッチ検出手段と、
前記ピッチ検出手段がピッチを検出できなかった時間が所定時間以上であるか否かを判定するピッチ検出判定手段と、
子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶する特徴的歌唱態様記憶手段と、
前記子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定する歌唱態様特定手段と、
前記特定した歌唱態様と、前記特徴的歌唱態様記憶手段に記憶された特徴的な歌唱態様とを比較する歌唱態様比較手段と、を備え、
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、前記ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する、
ことを特徴とする歌唱採点システム。
In the singing scoring system, which sets the scoring section that is the subject of singing scoring so that it is shorter than the singing time of each word that is the lyrics of the karaoke song, and calculates the singing scoring value in each scoring section,
Singing scoring means for calculating a singing scoring value by comparing the singing voice signal input from the microphone with the scoring reference data;
A consonant scoring section specifying means for specifying a scoring section where a consonant is generated based on the lyrics telop information;
In the specified consonant scoring section, pitch detection means for performing pitch detection from the input singing voice signal;
Pitch detection determination means for determining whether or not the time when the pitch detection means cannot detect the pitch is a predetermined time or more;
Characteristic singing mode storage means for storing a plurality of characteristic singing modes for singing by changing the pronunciation of consonants;
In the consonant scoring section, singing mode specifying means for specifying a singing mode based on a singing voice signal input from a microphone;
Singing mode comparing means for comparing the specified singing mode with the characteristic singing mode stored in the characteristic singing mode storage unit,
The singing scoring means determines that the time when the pitch cannot be detected by the pitch detection judging means is not less than a predetermined time despite the input of a singing voice signal from a microphone, and specifies the singing mode When the singing mode specified by the means matches with any one of the characteristic singing modes, the corrected singing score value is calculated without deducting the point that the pitch could not be detected,
A singing scoring system characterized by that.
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出する、
ことを特徴とする請求項1に記載の歌唱採点システム。
The singing scoring means determines that the time when the pitch cannot be detected by the pitch detection judging means is not less than a predetermined time despite the input of a singing voice signal from a microphone, and specifies the singing mode When the singing mode specified by the means matches any one of the characteristic singing modes, the singing voice signal input from the microphone is compared with the scoring reference data to perform rhythm evaluation, and based on pitch detection Without adopting the singing score value, a correction singing score value is calculated by performing a correction based on the singing score value based on the rhythm evaluation,
The singing scoring system according to claim 1.
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出する、
ことを特徴とする請求項1または2に記載の歌唱採点システム。
The singing scoring means determines that the time when the pitch cannot be detected by the pitch detection judging means is not less than a predetermined time despite the input of a singing voice signal from a microphone, and specifies the singing mode When the singing mode specified by the means matches any one of the characteristic singing modes, a bonus score is added to calculate a corrected singing score value.
The singing scoring system according to claim 1 or 2.
JP2013201797A 2013-09-27 2013-09-27 Singing scoring system Active JP6144593B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013201797A JP6144593B2 (en) 2013-09-27 2013-09-27 Singing scoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013201797A JP6144593B2 (en) 2013-09-27 2013-09-27 Singing scoring system

Publications (2)

Publication Number Publication Date
JP2015068932A JP2015068932A (en) 2015-04-13
JP6144593B2 true JP6144593B2 (en) 2017-06-07

Family

ID=52835662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013201797A Active JP6144593B2 (en) 2013-09-27 2013-09-27 Singing scoring system

Country Status (1)

Country Link
JP (1) JP6144593B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113744708B (en) * 2021-09-07 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 Model training method, audio evaluation method, device and readable storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3452792B2 (en) * 1998-04-23 2003-09-29 株式会社第一興商 Karaoke scoring device
JP4124247B2 (en) * 2006-07-05 2008-07-23 ヤマハ株式会社 Music practice support device, control method and program
JP4949899B2 (en) * 2007-03-13 2012-06-13 ヤマハ株式会社 Pitch display control device

Also Published As

Publication number Publication date
JP2015068932A (en) 2015-04-13

Similar Documents

Publication Publication Date Title
US9355634B2 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
JP2013134475A (en) Display control device and program
JP2009244789A (en) Karaoke system with guide vocal creation function
JP2007310204A (en) Musical piece practice support device, control method, and program
JP6144593B2 (en) Singing scoring system
JP2006251697A (en) Karaoke device
JP6219750B2 (en) Singing battle karaoke system
JP4171680B2 (en) Information setting device, information setting method, and information setting program for music playback device
JP6406273B2 (en) Karaoke device and program
JP6177027B2 (en) Singing scoring system
JP6144592B2 (en) Singing scoring system
JP5969421B2 (en) Musical instrument sound output device and musical instrument sound output program
JP5708730B2 (en) Musical performance device and musical performance processing program
JP4180548B2 (en) Karaoke device with vocal range notification function
JP5537246B2 (en) Singing position display system
JP6177091B2 (en) Singing scoring system
JP6415136B2 (en) Karaoke singing system
JP6144605B2 (en) Singing scoring system
JP2013231881A (en) Karaoke scoring system
JP6406182B2 (en) Karaoke device and karaoke system
JP6415341B2 (en) Karaoke system with pitch shift function for harmony singing
JP2009244790A (en) Karaoke system with singing teaching function
JP4033146B2 (en) Karaoke equipment
JP2007233078A (en) Evaluation device, control method, and program
JP6485955B2 (en) A karaoke system that supports delays in singing voice

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170511

R150 Certificate of patent or registration of utility model

Ref document number: 6144593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250