JP2023033877A - karaoke device - Google Patents

karaoke device Download PDF

Info

Publication number
JP2023033877A
JP2023033877A JP2021139806A JP2021139806A JP2023033877A JP 2023033877 A JP2023033877 A JP 2023033877A JP 2021139806 A JP2021139806 A JP 2021139806A JP 2021139806 A JP2021139806 A JP 2021139806A JP 2023033877 A JP2023033877 A JP 2023033877A
Authority
JP
Japan
Prior art keywords
narration
song
voice
unit
previous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021139806A
Other languages
Japanese (ja)
Inventor
光 山口
Hikari Yamaguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2021139806A priority Critical patent/JP2023033877A/en
Publication of JP2023033877A publication Critical patent/JP2023033877A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

To evaluate narration by a user by including connection of a music piece to be performed from now and a music piece performed immediately before.SOLUTION: A Karaoke device 1 includes: a detection part 20 for detecting voice as narration voice when voice is inputted from a user before a start of performance of a music piece; a specification part 21 for performing voice recognition processing on the narration voice and specifying a specific word included in the narration voice when the narration voice is detected; an evaluation part 22 for evaluating the narration voice on the basis of the specified specific word and a comparison result of a current music word related to a current music piece which is to start performing from now and a previous music word related to the previous music performed immediately before the current music piece; and a display part 23 for displaying an evaluation result of the narration voice by the evaluation part.SELECTED DRAWING: Figure 1

Description

本発明は、カラオケ装置に関する。 The present invention relates to a karaoke machine.

カラオケ装置を利用する場面において、予約された楽曲のカラオケ演奏前若しくは歌唱前に、司会者等によりナレーションを発することにより、歌謡ショーやライブのような臨場感を醸し出すことになり、歌唱者は歌唱意欲を高めることができる。 In the scene of using karaoke equipment, the narration by the moderator or the like before the karaoke performance or singing of the reserved song creates a realistic feeling like a song show or live performance, and the singer sings. It can increase motivation.

例えば、特許文献1によれば、ホストシステムは、曲データ格納装置からリクエストされた曲データを読み出し、その曲データに付加された汎用パラメータに基づいて演奏内容を分析し、その分析結果に基づいてナレーションデータ格納装置から最適なナレーションデータを選択し、ナレーション再生装置に送って再生させる。 For example, according to Patent Document 1, a host system reads requested song data from a song data storage device, analyzes performance content based on general-purpose parameters added to the song data, and based on the analysis results Optimal narration data is selected from a narration data storage device and sent to a narration reproducing device for reproduction.

特開平11-167388号公報JP-A-11-167388

ところで、カラオケ装置を利用する場面では、歌唱者又は周囲の聴衆が、楽曲のカラオケ演奏前若しくは歌唱前に、ナレーションを行うことがある。ナレーションが上手い程、歌唱者及び聴衆は歌謡ショーやライブのような臨場感を得ることができ、楽曲の曲調や歌詞の情緒等が事前に伝わるので、歌唱前から場の雰囲気を盛り上げることができる。このとき、歌唱者や聴衆の行ったナレーションが高く評価されると、場の雰囲気を更に盛り上げることができるが、従来技術では、ナレーションを評価することはできない。 By the way, when using a karaoke machine, a singer or a surrounding audience may narrate a song before karaoke performance or singing. The better the narration, the more the singer and the audience can get a sense of reality like a song show or a live performance, and the melody of the song and the emotion of the lyrics can be conveyed in advance, so the atmosphere of the place can be livened up before singing. . At this time, if the narration performed by the singer or the audience is highly evaluated, the atmosphere of the place can be further enhanced, but the conventional technology cannot evaluate the narration.

また、従来技術では、これから演奏する楽曲に関連するナレーションを録音音声や音声合成等により自動的に再生することができるが、直前に演奏された楽曲との繋がりを考慮せずにナレーションが選択されるので、場に馴染まないナレーションが再生されてしまうことがある。これに対して、歌唱者や聴衆がナレーションを発する場合、直前に演奏された楽曲とこれから演奏する楽曲との繋がりを考慮したナレーションを行うと、より一層、場の雰囲気を盛り上げることができ、このようなナレーションが評価されると、場の雰囲気を更に盛り上げることができる。 In the prior art, narration related to the song to be played can be automatically played back by recorded voice, voice synthesis, etc., but the narration is selected without considering the connection with the song played immediately before. Therefore, narration that does not fit in the scene may be played. On the other hand, when the singer or the audience gives a narration, if the narration takes into account the connection between the song that was played immediately before and the song that will be played from now on, the atmosphere of the place can be further enhanced. If such a narration is evaluated, the atmosphere of the place can be further enhanced.

本発明の目的は、利用者によるナレーションを、これから演奏する楽曲と直前に演奏された楽曲との繋がりを含めて評価することができるカラオケ装置を提供することである。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a karaoke apparatus capable of evaluating a user's narration, including the relationship between the song to be played and the song played immediately before.

上記課題を解決するために、本発明のカラオケ装置は、楽曲の演奏開始前に利用者から音声が入力された場合に、当該音声をナレーション音声として検知する検知部と、前記ナレーション音声が検知された場合に、当該ナレーション音声を音声認識処理して、当該ナレーション音声に含まれる特定ワードを特定する特定部と、特定された前記特定ワードと、これから演奏を開始する今回楽曲に関連する今回楽曲ワード及び前記今回楽曲の直前に演奏された前回楽曲に関連する前回楽曲ワードとの比較結果に基づいて、前記ナレーション音声を評価する評価部と、前記評価部による前記ナレーション音声の評価結果を表示する表示部と、を備えることを特徴とする。 In order to solve the above-mentioned problems, the karaoke apparatus of the present invention includes a detection unit that detects a voice input from a user as a narration voice when the voice is input from a user before the performance of a piece of music is started; a specifying unit that performs voice recognition processing on the narration voice to specify a specific word included in the narration voice, the specified specific word, and the current song word related to the current song that is about to start playing. and an evaluation unit that evaluates the narration sound based on the result of comparison with the previous music word related to the previous music played immediately before the current music, and a display that displays the evaluation result of the narration sound by the evaluation unit. and a part.

本発明によれば、利用者によるナレーションを、これから演奏する楽曲と直前に演奏された楽曲との繋がりを含めて評価することができる。 According to the present invention, the user's narration can be evaluated including the connection between the song to be played from now on and the song played immediately before.

本発明の第1の実施形態のカラオケ装置を示すブロック図である。1 is a block diagram showing a karaoke device according to a first embodiment of the present invention; FIG. 本発明の第1の実施形態のカラオケ装置のナレーション評価動作を示すフローチャートである。It is a flowchart which shows the narration evaluation operation|movement of the karaoke apparatus of the 1st Embodiment of this invention. 本発明の第2の実施形態のカラオケ装置を示すブロック図である。It is a block diagram which shows the karaoke apparatus of the 2nd Embodiment of this invention. 本発明の第3の実施形態のカラオケ装置を示すブロック図である。It is a block diagram which shows the karaoke apparatus of the 3rd Embodiment of this invention. 本発明の第3の実施形態のカラオケ装置において、再生ワードと効果音とを対応付けた効果音テーブルを示す表である。FIG. 11 is a table showing a sound effect table in which reproduced words and sound effects are associated with each other in the karaoke machine of the third embodiment of the present invention; FIG.

[第1の実施形態]
以下、本発明の第1の実施形態のカラオケ装置1について説明する。
[First Embodiment]
The karaoke machine 1 according to the first embodiment of the present invention will be described below.

[カラオケ装置]
図1は、第1の実施形態のカラオケ装置1の構成を示すブロック図である。図1に示すように、カラオケ装置1は、カラオケ本体2と、マイクロフォン3と、スピーカ4と、モニタ等の表示装置5と、リモコン装置6とを備えている。カラオケ装置1は、例えば、カラオケルーム等の設置場所に設置される。
[Karaoke device]
FIG. 1 is a block diagram showing the configuration of a karaoke device 1 according to the first embodiment. As shown in FIG. 1, the karaoke device 1 includes a karaoke main body 2, a microphone 3, a speaker 4, a display device 5 such as a monitor, and a remote control device 6. The karaoke device 1 is installed at an installation location such as a karaoke room, for example.

カラオケ本体2は、有線又は無線によりマイクロフォン3、スピーカ4、表示装置5及びリモコン装置6と接続されている。マイクロフォン3は、利用者の歌唱音声やナレーション音声を音声信号に変換してカラオケ本体2に入力する。スピーカ4は、カラオケ本体2からの放音信号に基づいて、利用者の音声や楽曲のカラオケ演奏を放音する。表示装置5は、カラオケ本体2からの映像信号等に基づいて様々な画面を表示し、例えば、カラオケ演奏に合わせて背景映像と共に歌詞テロップを表示する。 The karaoke main body 2 is connected to a microphone 3, a speaker 4, a display device 5 and a remote control device 6 by wire or wirelessly. A microphone 3 converts a user's singing voice or narration voice into a voice signal and inputs the voice signal to the karaoke body 2. - 特許庁A speaker 4 emits a karaoke performance of a user's voice or music based on a sound emission signal from the karaoke main body 2. - 特許庁The display device 5 displays various screens based on video signals and the like from the karaoke main body 2, and for example, displays lyrics telops along with background images in accordance with karaoke performances.

リモコン装置6は、タッチパネルを主体に構成されている。リモコン装置6は、各種画面や各種操作ボタンをタッチパネルに表示すると共に、タッチパネルによってログイン操作や選曲(予約)操作を受け付けている。リモコン装置6とカラオケ本体2は無線通信を介してペアリングされることで、リモコン装置6とカラオケ本体2の間で各種情報が相互に送受信される。 The remote control device 6 is mainly composed of a touch panel. The remote control device 6 displays various screens and various operation buttons on the touch panel, and accepts login operation and music selection (reservation) operation through the touch panel. The remote control device 6 and the karaoke main body 2 are paired via wireless communication, so that various types of information are exchanged between the remote control device 6 and the karaoke main body 2 .

リモコン装置6は、利用者のログイン操作に応じて入力された利用者識別情報(利用者ID)等をカラオケ本体2へ送信する。リモコン装置6は、楽曲の検索や選曲(予約)を受け付けて、利用者の選曲(予約)操作に応じて選曲(予約)された楽曲の楽曲識別子(楽曲ID)を予約楽曲情報としてカラオケ本体2へ送信する。 The remote control device 6 transmits the user identification information (user ID) or the like input according to the login operation of the user to the karaoke main body 2 . The remote control device 6 receives music search and music selection (reservation), and uses the music identifier (music ID) of the music selected (reserved) according to the user's music selection (reservation) operation as reserved music information. Send to

また、カラオケ本体2は、選曲(予約)された楽曲のカラオケ演奏を行う機能に加えて、歌唱者や聴衆が発したナレーションを評価する機能を有する。 Further, the karaoke main body 2 has a function of performing karaoke performance of selected (reserved) songs, and a function of evaluating narrations given by singers and audience members.

カラオケ本体2は、制御部10と、記憶部11と、音源12と、音声入出力部13とを備えている。制御部10は、CPU(Central Processing Unit)等を有して構成され、カラオケ本体2を統括制御する。記憶部11は、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等の記憶媒体を有して構成され、カラオケ装置1の各部及び各機能を制御するためのプログラムやデータを記憶する。 The karaoke main body 2 includes a control section 10 , a storage section 11 , a sound source 12 and an audio input/output section 13 . The control unit 10 includes a CPU (Central Processing Unit) and the like, and controls the karaoke main body 2 in an integrated manner. The storage unit 11 includes storage media such as ROM (Read Only Memory), RAM (Random Access Memory), HDD (Hard Disc Drive), etc., and stores programs for controlling each unit and each function of the karaoke apparatus 1. and data.

例えば、記憶部11は、カラオケ装置1の各利用者の利用者IDを記憶して各利用者を識別している。また、記憶部11は、カラオケ装置1がカラオケ演奏可能な各楽曲について、楽曲ID、曲名、歌手名、ジャンル等の基本情報を記憶している。また、記憶部11は、楽曲毎に楽曲データを記憶し、楽曲データは、伴奏データやリファレンスデータ、歌詞データを含んでいる。伴奏データは、カラオケ演奏の伴奏音の元となるMIDI形式のデータである。リファレンスデータは、歌唱者によるカラオケ歌唱を評価する際の基準として用いられるデータである。歌詞データは、表示装置5に表示される歌詞テロップの元になるデータである。 For example, the storage unit 11 stores the user ID of each user of the karaoke device 1 to identify each user. In addition, the storage unit 11 stores basic information such as a song ID, song title, singer name, and genre for each song that can be karaoke-played by the karaoke apparatus 1 . The storage unit 11 also stores music data for each music, and the music data includes accompaniment data, reference data, and lyric data. The accompaniment data is data in MIDI format that is the source of accompaniment sounds for karaoke performances. Reference data is data used as a reference for evaluating karaoke singing by singers. The lyric data is data that is the source of lyric telops displayed on the display device 5 .

更に、記憶部11は、各楽曲の楽曲データに対応付けて、その楽曲の曲調を表現した曲調ワードを記憶している。 Furthermore, the storage unit 11 stores tune words expressing the tune of each tune in association with the tune data of each tune.

例えば、楽曲の曲調として、メジャーキーのメロディやコードを多く含んだり、高音を多く含んだり、親しみやすい音階を含んだりする場合には、「明るい」、「賑やか」、「楽しい」等の曲調ワードを、その楽曲データに対応付けて記憶部11に記憶する。楽曲の曲調として、マイナーキーのメロディやコードを多く含んだり、低音を多く含んだり、怪しげな音階を含んだりする場合には、「暗い」、「寂しい」、「辛い」等の曲調ワードを、その楽曲データに対応付けて記憶部11に記憶する。 For example, if the melody of a piece of music contains many major key melodies and chords, contains many high notes, and contains familiar scales, melody words such as "bright," "lively," and "fun." is stored in the storage unit 11 in association with the music data. If the melody of the song contains many minor key melodies or chords, contains many bass sounds, or contains dubious scales, the melody words such as "dark", "lonely", "spicy", etc. It is stored in the storage unit 11 in association with the music data.

また、楽曲の曲調として、テンポが早かったり、使われている音の数が多かったりする場合には、「慌しい」、「激しい」等の曲調ワードを、その楽曲データに対応付けて記憶部11に記憶する。楽曲の曲調として、テンポが遅かったり、使われている音の数が少なかったりする場合には、「のどか」、「穏やか」等の曲調ワードを、その楽曲データに対応付けて記憶部11に記憶する。 Also, if the melody of a piece of music has a fast tempo or uses a large number of sounds, melody words such as "hurried" and "intense" are associated with the piece of music data and stored in the storage unit 11. memorize to When the melody of a piece of music has a slow tempo or the number of sounds used is small, tone words such as ``calm'' and ``calm'' are associated with the piece of music data and stored in the storage unit 11.例文帳に追加do.

音源12は、例えば、MIDI音源で構成され、楽曲データの伴奏データに基づいてカラオケ演奏の伴奏音信号を生成するカラオケ演奏手段である。 The sound source 12 is, for example, a MIDI sound source, and is karaoke performance means for generating accompaniment sound signals for karaoke performance based on accompaniment data of music data.

音声入出力部13は、ミキサ(デジタルミキサ)やアンプ等から構成され、カラオケ演奏の伴奏音信号やカラオケ歌唱の歌唱音声信号、ナレーション音声信号をミキシングし、このミキシング信号をスピーカ4から放音するために増幅する。ミキシングされる音声信号の音量レベルには、利用者によるミュージックボリュームの設定が反映される。 The audio input/output unit 13 is composed of a mixer (digital mixer), an amplifier, etc., and mixes an accompaniment sound signal of a karaoke performance, a singing voice signal of a karaoke song, and a narration voice signal, and emits this mixed signal from the speaker 4. Amplify for. The volume level of the mixed audio signal reflects the user's music volume setting.

制御部10は、記憶部11に記憶されたプログラムやデータに基づいて演算処理を実行することにより、カラオケ装置1の各部及び各機能を制御する。例えば、本実施形態の制御部10は、記憶部11に記憶されたプログラムを実行することにより、検知部20、特定部21、評価部22及び表示部23として動作する。 The control unit 10 controls each unit and each function of the karaoke apparatus 1 by executing arithmetic processing based on the programs and data stored in the storage unit 11 . For example, the control unit 10 of this embodiment operates as the detection unit 20, the identification unit 21, the evaluation unit 22, and the display unit 23 by executing the programs stored in the storage unit 11. FIG.

検知部20は、カラオケ装置1が所定の楽曲のカラオケ演奏を開始する前に、歌唱者又は聴衆からマイクロフォン3を介して音声が入力された場合に、当該音声をナレーション音声として検知するように構成される。 The detection unit 20 is configured to detect the voice as the narration voice when voice is input from the singer or the audience via the microphone 3 before the karaoke apparatus 1 starts playing karaoke of a predetermined song. be done.

このとき、検知部20は、これからカラオケ演奏する楽曲を今回楽曲とし、今回楽曲の直前にカラオケ演奏された楽曲、即ち今回楽曲の前に予約されていた楽曲を前回楽曲とした場合に、前回楽曲の演奏終了後、今回楽曲の演奏開始前に所定の検知時間を設定する。そして、検知部20は、検知時間の間に、マイクロフォン3を介して入力される音声を検知したとき、その時点からナレーション音声の検知を開始する。 At this time, the detection unit 20 determines that the song to be karaoke-performed from now on is the current song, and the song performed karaoke-performed just before the current song, that is, the song reserved before the current song is the previous song. A predetermined detection time is set before the performance of the current musical composition is started after the performance of the current musical composition is finished. Then, when the detection unit 20 detects the voice input via the microphone 3 during the detection time, it starts detecting the narration voice from that point.

また、検知部20は、所定の終了条件を満たす場合に、ナレーション音声の検知を終了する。例えば、終了条件は、カラオケ本体2やリモコン装置6に設けられた演奏ボタンが押下されたこと、ナレーション音声から「それでは聞いてください」等の予め定められた演奏開始ワードが検出されたこと、ナレーション音声の検知開始から所定の制限時間が経過したこと等がある。検知部20は、ナレーション音声の検知を終了すると、検知したナレーション音声を今回楽曲に関連付けて記憶部11に一時的に記憶する。 Moreover, the detection unit 20 ends the detection of the narration sound when a predetermined end condition is satisfied. For example, the termination condition is that a play button provided on the karaoke main body 2 or the remote control device 6 is pressed, that a predetermined performance start word such as "Now, please listen" is detected from the narration voice, that the narration For example, a predetermined time limit has passed since the start of voice detection. After completing the detection of the narration sound, the detection unit 20 temporarily stores the detected narration sound in the storage unit 11 in association with the current song.

具体的には、カラオケ装置1は、楽曲A、楽曲Bが順に予約されていた場合、前回楽曲の楽曲Aの演奏が終了した後、次に予約されている今回楽曲の楽曲Bの演奏が開始される前に、予め設定された所定の検知時間(例えば、10秒)の間、楽曲Bの演奏を待機した状態となる。検知部20は、この検知時間の間に、マイクロフォン3を介した音声がカラオケ装置1に入力されると、ナレーション音声を検知する。なお、マイクロフォン3を介した音声がカラオケ装置1に入力されずにナレーション音声が検知部20で検知されないで検知時間が経過した場合には、カラオケ装置1は、楽曲Bの演奏を開始する。 Specifically, when music A and music B are reserved in order, the karaoke apparatus 1 starts playing music B of the next reserved current music after finishing the performance of music A of the previous music. Before being played, the performance of the song B is on standby for a predetermined detection time (for example, 10 seconds) set in advance. The detector 20 detects the narration voice when the voice is input to the karaoke apparatus 1 through the microphone 3 during the detection time. If the detection time elapses without the voice through the microphone 3 being input to the karaoke device 1 and the narration voice being detected by the detection unit 20, the karaoke device 1 starts playing the song B.

なお、検知部20は、ナレーション音声の検知を開始すると、ナレーション音声を検知していることを報知する報知画面を表示装置5やリモコン装置6に表示させてもよい。また、検知部20は、マイクロフォン3を介して音声が入力されたときでも、当該音声がナレーション音声として適正な音声でない場合、例えば、非常に短い音声や非常に小さい音声等の場合には、ナレーション音声を検知しないようにしてもよい。更に、検知部20は、今回楽曲がカラオケ装置1の利用を開始して最初の予約楽曲であった場合や、今回楽曲の演奏が開始される際に、前回楽曲の演奏終了から曲間が所定時間経過していた場合には、ナレーション音声を検知しないようにしてもよい。 Note that the detection unit 20 may cause the display device 5 or the remote control device 6 to display a notification screen for notifying that the narration sound is being detected, when the detection of the narration sound is started. Further, even when a voice is input through the microphone 3, the detection unit 20 detects that the voice is not suitable as a narration voice. You may make it not detect a sound. Furthermore, when the current song is the first reserved song after starting to use the karaoke device 1, or when the performance of the current song is started, the detection unit 20 detects that the interval between songs from the end of the previous song performance is predetermined. If the time has passed, the narration sound may not be detected.

特定部21は、検知部20によってナレーション音声が検知された場合に、当該ナレーション音声を音声認識処理して、当該ナレーション音声に含まれる特定ワードを特定するように構成される。 The specifying unit 21 is configured to, when the detecting unit 20 detects the narration voice, perform voice recognition processing on the narration voice to specify a specific word included in the narration voice.

特定部21は、ナレーション音声を音声認識処理するために、既知の音声認識方式を採用してよく、音声認識結果に基づいて、ナレーション音声を構成する単語を抽出する。そして、特定部21は、ナレーション音声から抽出した単語のうち、「愛しい」や「悲しい」等の特定ワードを特定する。特定部21は、ナレーション音声から特定した特定ワードを、ナレーション音声に関連する今回楽曲に関連付けて記憶部11に一時的に記憶する。 The specifying unit 21 may employ a known voice recognition method to perform voice recognition processing on the narration voice, and extracts words that make up the narration voice based on the voice recognition result. Then, the specifying unit 21 specifies specific words such as "lovely" and "sad" among the words extracted from the narration voice. The identifying unit 21 temporarily stores the specific word identified from the narration sound in the storage unit 11 in association with the current song related to the narration sound.

評価部22は、特定部21によってナレーション音声から特定ワードが特定された場合に、ナレーション音声の前後にカラオケ演奏される前回楽曲及び今回楽曲に基づいて特定ワードを評価するように構成される。このとき、評価部22は、ナレーション音声から特定された特定ワードと、これから演奏を開始する今回楽曲に関連する今回楽曲ワード及び今回楽曲の直前に演奏された前回楽曲に関連する前回楽曲ワードとの比較結果に基づいて、ナレーション音声を評価する。 The evaluation unit 22 is configured to, when the specific word is specified from the narration voice by the specifying unit 21, evaluate the specific word based on the previous and current songs performed in karaoke before and after the narration voice. At this time, the evaluation unit 22 compares the specific word specified from the narration voice, the current song word related to the current song to be played from now on, and the previous song word related to the previous song played immediately before the current song. The narration voice is evaluated based on the comparison result.

評価部22は、ナレーション音声に含まれる各特定ワードと前回楽曲に関連する各前回楽曲ワードとが一致するか否かを比較して、その一致数(前回一致数)を計数し、また、ナレーション音声に含まれる各特定ワードと今回楽曲に関連する各今回楽曲ワードとが一致するか否かを比較して、その一致数(今回一致数)を計数する。そして、評価部22は、前回一致数及び今回一致数に基づいて、ナレーション音声を評価する。 The evaluation unit 22 compares whether or not each specific word included in the narration sound matches each previous song word related to the previous song, counts the number of matches (previous match number), and Each specific word included in the voice is compared with each current song word related to the current song to see if they match, and the number of matches (the number of matches this time) is counted. Then, the evaluation unit 22 evaluates the narration voice based on the number of previous matches and the number of matches this time.

具体的に、カラオケ装置1において、「愛しい」、「悲しい」のワードを歌詞データに含む楽曲A(前回楽曲)の演奏と、「愛しい」のワードを歌詞データに含む楽曲B(今回楽曲)の演奏との間に、「愛しい」、「悲しい」のワードを含むナレーション音声が入力された場合を説明する。この場合、特定部21によって、ナレーション音声から「愛しい」、「悲しい」の特定ワードが特定されている。評価部22は、前回楽曲である楽曲Aから「愛しい」、「悲しい」の前回楽曲ワードを抽出し、ナレーション音声の特定ワードと楽曲Aの前回楽曲ワードとを比較して、前回一致数を2と計数する。評価部22は、今回楽曲である楽曲Bから「愛しい」の今回楽曲ワードを抽出し、ナレーション音声の特定ワードと楽曲Bの今回楽曲ワードとを比較して、今回一致数を1と計数する。 Specifically, in the karaoke device 1, the performance of a song A (previous song) whose lyric data includes the words “beloved” and “sad” and the song B (current song) whose lyric data includes the word “lovely”. A case where a narration voice containing the words "lovely" and "sad" is input between the performance will be described. In this case, the specifying unit 21 specifies the specific words "lovely" and "sad" from the narration voice. The evaluation unit 22 extracts the words of the previous song, such as “lovely” and “sad”, from the song A, which is the previous song, and compares the specific words of the narration voice with the words of the previous song of the song A, and determines the number of matches from the previous song to be 2. and count. The evaluation unit 22 extracts the current song word of "beloved" from the song B, which is the current song, compares the specific word of the narration voice with the current song word of the song B, and counts the number of coincidences as 1 this time.

評価部22は、前回楽曲ワードとして、前回楽曲の歌詞データに含まれるワード及び前回楽曲の曲調を表現した曲調ワードの少なくとも一方のワードを使用してよく、今回楽曲ワードとして、今回楽曲の歌詞データに含まれるワード及び今回楽曲の曲調を表現した曲調ワードの少なくとも一方のワードを使用してよい。なお、評価部22は、前回楽曲や今回楽曲から抽出したワードが、「愛しく」、「愛しさ」や「悲しく」、「悲しさ」等のように語尾が変化した活用形である場合には、変化前のワードに変換して評価してもよい。 The evaluation unit 22 may use at least one of words included in the lyric data of the previous song and melody words expressing the melody of the previous song as the words of the previous song, and the words of the current song may be the lyric data of the current song. At least one of the words included in the . If the words extracted from the previous song or the current song are conjugations with different endings such as "beloved", "beloved", "sad", and "sadness", the evaluation unit 22 , may be converted to the word before change and evaluated.

また、評価部22は、検知部20において説明した所定の終了条件を満たす場合にナレーション音声の検知が終了すると、その終了時点までのナレーション音声から特定部21によって特定された特定ワードを用いて、特定ワードと前回楽曲ワードとの前回一致数と特定ワードと今回楽曲ワードとの今回一致数とを計数し、前回一致数及び今回一致数の割合に基づいてナレーション音声を評価する。 Further, when the detection of the narration sound ends when the predetermined end condition described in the detection unit 20 is satisfied, the evaluation unit 22 uses the specific word specified by the specifying unit 21 from the narration sound up to the end of the detection, The previous matching number between the specific word and the previous music word and the current matching number between the specific word and the current music word are counted, and the narration voice is evaluated based on the ratio of the previous matching number and the current matching number.

具体的には、評価部22は、ナレーション音声を前回楽曲及び今回楽曲に対して評価する場合に、前回一致数及び今回一致数のそれぞれに5を乗算することで、前回楽曲及び今回楽曲に対するナレーション音声の得点(ナレーション得点)をそれぞれ算出する。このとき、乗算される前回一致数及び今回一致数は、所定の上限数(例えば、10)に制限される。 Specifically, when evaluating the narration sound for the previous song and the current song, the evaluation unit 22 multiplies each of the previous match count and the current match count by 5 to obtain the narration sound for the previous song and the current song. A voice score (narration score) is calculated for each. At this time, the previous matching number and the current matching number to be multiplied are limited to a predetermined upper limit number (eg, 10).

例えば、前回楽曲である楽曲Aの前回一致数が12であり、今回楽曲である楽曲Bの今回一致数が10である場合、評価部22は、前回一致数を上限数の10に換算して5を乗算することで前回楽曲に対する得点を50点と算出し、今回一致数に5を乗算することで今回楽曲に対する得点を50点と算出して、合計してナレーション得点を100点と算出する。 For example, when the previous matching number of the previous song A is 12 and the current matching number of the current song B is 10, the evaluation unit 22 converts the previous matching number into the upper limit number of 10. By multiplying by 5, the score for the previous song is calculated as 50 points, and by multiplying the number of matches this time by 5, the score for the current song is calculated as 50 points, and the total score is calculated as 100 points for the narration. .

あるいは、前回楽曲である楽曲Aの前回一致数が8であり、今回楽曲である楽曲Bの今回一致数が7である場合、評価部22は、前回一致数に5を乗算することで前回楽曲に対する得点を40点と算出し、今回一致数に5を乗算することで今回楽曲に対する得点を35点と算出して、合計してナレーション得点を75点と算出する。 Alternatively, if the previous matching number of the song A, which is the previous song, is 8, and the current matching number of the song B, which is the current song, is 7, the evaluation unit 22 multiplies the previous matching number by 5, The score for the current song is calculated as 40 points, and the number of matches this time is multiplied by 5 to calculate the score for the current song as 35 points, and the narration score is calculated as 75 points in total.

表示部23は、評価部22によるナレーション音声の評価結果を表示装置5やリモコン装置6に表示するように構成され、例えば、評価結果を提示する評価画面を表示し、このとき、評価画面をポップアップ表示してもよい。 The display unit 23 is configured to display the evaluation result of the narration voice by the evaluation unit 22 on the display device 5 or the remote control device 6. For example, the display unit 23 displays an evaluation screen presenting the evaluation result, and at this time, pops up the evaluation screen. may be displayed.

例えば、表示部23は、ナレーション音声の評価結果を、今回楽曲のカラオケ演奏中に表示してもよく、あるいは、今回楽曲のカラオケ演奏終了後に表示してもよい。また、表示部23は、ナレーション音声の評価結果を、所定の表示時間の間、表示してもよく、あるいは、所定操作が行われるまで表示してもよい。なお、検知部20によってナレーション音声が検知されなかった場合には、表示部23は、ナレーション音声の評価結果の表示を行わない。 For example, the display unit 23 may display the evaluation result of the narration voice during the karaoke performance of the current song, or after the karaoke performance of the current song is finished. Further, the display unit 23 may display the evaluation result of the narration voice for a predetermined display time or until a predetermined operation is performed. Note that when the detection unit 20 does not detect the narration sound, the display unit 23 does not display the evaluation result of the narration sound.

表示部23は、評価部22によって算出したナレーション得点を評価結果として表示するとよい。なお、表示部23は、ナレーション音声を前回楽曲に対して評価する評価結果として、特定ワードと前回楽曲ワードとの前回一致数を表示してもよく、ナレーション音声を今回楽曲に対して評価する評価結果として、特定ワードと今回楽曲ワードとの今回一致数を表示してもよい。 The display unit 23 may display the narration score calculated by the evaluation unit 22 as the evaluation result. Note that the display unit 23 may display the number of matches between specific words and the words of the previous music as the evaluation result of evaluating the narration sound with respect to the previous music. As a result, the number of coincidences between specific words and current song words may be displayed.

具体的には、前回楽曲である楽曲Aの前回一致数が6であり、今回楽曲である楽曲Bの今回一致数が10である場合、表示部23は、評価部22によって前回一致数及び今回一致数のそれぞれに5を乗算して加算した80点をナレーション得点として表示する。 Specifically, when the previous matching number of the song A, which is the previous song, is 6, and the current matching number of the song B, which is the current song, is 10, the display unit 23 displays the previous matching number and the current matching number by the evaluation unit 22. 80 points obtained by multiplying each number of matches by 5 and adding them are displayed as a narration score.

[第1の実施形態のナレーション評価動作]
次に、第1の実施形態において、歌唱者や聴衆の利用者がナレーションを行うときのカラオケ装置1のナレーション評価動作について、図2を参照して説明する。図2は、第1の実施形態のカラオケ装置1のナレーション評価動作を示すフローチャートである。
[Narration evaluation operation of the first embodiment]
Next, in the first embodiment, the narration evaluation operation of the karaoke apparatus 1 when a singer or an audience user narrates will be described with reference to FIG. FIG. 2 is a flow chart showing the narration evaluation operation of the karaoke machine 1 of the first embodiment.

先ず、利用者がリモコン装置6を操作して楽曲A、楽曲Bを予約すると(ステップS1)、カラオケ本体2の制御部10は、リモコン装置6から受信した楽曲A、楽曲Bの予約楽曲情報を記憶部11の予約管理テーブルにこの順で登録する。制御部10は、予約管理テーブルから登録順に予約楽曲情報を読み出し、この予約楽曲情報の楽曲IDに対応する楽曲データ等を記憶部11から読み出す。 First, when the user operates the remote control device 6 to reserve music A and music B (step S1), the control section 10 of the karaoke main body 2 receives the reserved music information of the music A and music B received from the remote control device 6. They are registered in the reservation management table of the storage unit 11 in this order. The control unit 10 reads out the reserved music information from the reservation management table in the order of registration, and reads out the music data corresponding to the music ID of the reserved music information from the storage unit 11 .

カラオケ本体2は、先に予約された楽曲Aのカラオケ演奏を開始し(ステップS2)、楽曲Aの楽曲データを記憶部11から読み出して、音源12及び音声入出力部13によって楽曲Aのカラオケ演奏を行って楽曲Aの伴奏音をスピーカ4から放音する。このとき、歌唱者がカラオケ演奏に合わせて歌唱すると、スピーカ4から楽曲Aの伴奏音と共に歌唱音声が放音される。 The karaoke main body 2 starts karaoke performance of the previously reserved song A (step S2), reads the song data of the song A from the storage unit 11, and performs the karaoke performance of the song A by the sound source 12 and the voice input/output unit 13. , the accompaniment sound of the music piece A is emitted from the speaker 4. At this time, when the singer sings along with the karaoke performance, the singing voice is emitted from the speaker 4 together with the accompaniment sound of the song A.

カラオケ本体2は、楽曲Aのカラオケ演奏を終了すると(ステップS3)、次に予約された楽曲Bのカラオケ演奏を開始するまでに、所定の検知時間(例えば、10秒)の間、ナレーション音声の入力を待機する状態になる。検知部20が、マイクロフォン3を介して入力されたナレーション音声を検知することなく(ステップS4:NO)、検知時間が経過すると(ステップS5:YES)、カラオケ本体2は、次に予約された楽曲Bのカラオケ演奏を開始する(ステップS6)。 When the karaoke performance of the song A is finished (step S3), the karaoke main body 2 continues the narration voice for a predetermined detection time (for example, 10 seconds) before starting the karaoke performance of the next reserved song B. Waits for input. When the detection unit 20 does not detect the narration voice input via the microphone 3 (step S4: NO) and the detection time elapses (step S5: YES), the karaoke main body 2 detects the next reserved song. B's karaoke performance is started (step S6).

一方、検知時間の間に、マイクロフォン3を介して入力された音声を検知部20がナレーション音声として検知すると(ステップS4:Yes)、特定部21は、ナレーション音声を音声認識処理して、ナレーション音声に含まれる特定ワードを特定する(ステップS7)。 On the other hand, when the detection unit 20 detects the voice input via the microphone 3 as the narration voice during the detection time (step S4: Yes), the identification unit 21 performs voice recognition processing on the narration voice, (step S7).

次に、評価部22は、ナレーション音声から特定された特定ワードと、これから演奏を開始する今回楽曲である楽曲Bに関連する今回楽曲ワード及び楽曲Bの直前に演奏された前回楽曲である楽曲Aに関連する前回楽曲ワードとの比較結果に基づいて、ナレーション音声を評価する(ステップS8)。 Next, the evaluation unit 22 determines the specific words specified from the narration voice, the current song words related to the current song B that is about to start playing, and the previous song A that was played immediately before the song B. The narration voice is evaluated based on the result of comparison with the previous song words related to (step S8).

そして、表示部23は、評価部22によるナレーション音声の評価結果を表示装置5やリモコン装置6に表示する(ステップS9)。 Then, the display unit 23 displays the evaluation result of the narration voice by the evaluation unit 22 on the display device 5 and the remote control device 6 (step S9).

上記したように、本発明の第1の実施形態のカラオケ装置1は、楽曲の演奏開始前に利用者から音声が入力された場合に、当該音声をナレーション音声として検知する検知部20と、ナレーション音声が検知された場合に、当該ナレーション音声を音声認識処理して、当該ナレーション音声に含まれる特定ワードを特定する特定部21と、特定された特定ワードと、これから演奏を開始する今回楽曲に関連する今回楽曲ワード及び今回楽曲の直前に演奏された前回楽曲に関連する前回楽曲ワードとの比較結果に基づいて、ナレーション音声を評価する評価部22と、評価部22によるナレーション音声の評価結果を表示する表示部23と、を備える。 As described above, the karaoke apparatus 1 of the first embodiment of the present invention includes the detection unit 20 for detecting the voice as a narration voice when the voice is input from the user before the start of playing the music, and the narration voice. When a voice is detected, a specifying unit 21 performs voice recognition processing on the narration voice to specify a specific word included in the narration voice. display the evaluation unit 22 for evaluating the narration voice based on the result of comparison with the current song word and the previous song word related to the previous song played immediately before the current song, and the evaluation result of the narration voice by the evaluation unit 22. and a display unit 23 for displaying.

これにより、カラオケ装置1を利用する場面において、カラオケ演奏の間に行われる利用者によるナレーションを、これから演奏する今回楽曲と直前に演奏された前回楽曲との繋がりを含めて評価することができ、場の雰囲気を盛り上げることができる。 As a result, when the karaoke machine 1 is used, the user's narration performed during the karaoke performance can be evaluated including the connection between the current song to be played from now on and the previous song played immediately before. It can liven up the atmosphere of the place.

また、第1の実施形態のカラオケ装置1では、評価部22は、特定ワードと今回楽曲ワードとの今回一致数、及び特定ワードと前回楽曲ワードとの前回一致数に基づいて、ナレーション音声を評価する。 In addition, in the karaoke device 1 of the first embodiment, the evaluation unit 22 evaluates the narration sound based on the number of matches between the specific word and the current song word this time and the previous match number between the specific word and the previous song word. do.

これにより、直前に演奏された前回楽曲に関連する前回楽曲ワードやこれから演奏する今回楽曲に関連する今回楽曲ワードが、ナレーション音声に含まれる度合いに基づいて、ナレーション音声を評価することができ、例えば、今回一致数や前回一致数を利用することで、ナレーション音声の内容が、前回楽曲又は今回楽曲に偏っているか否かを判定することができ、前回楽曲又は今回楽曲に偏っていないナレーション音声を、楽曲の繋がりを考慮したナレーションであるとして高く評価することができる。このように、ナレーションの前後の前回楽曲と今回楽曲との繋がりを効果的に評価することができる。 As a result, the narration sound can be evaluated based on the degree to which the previous music word related to the previous music played immediately before and the current music word related to the current music to be played from now on are included in the narration sound. , By using the number of matches this time and the number of matches last time, it is possible to determine whether the content of the narration voice is biased toward the previous song or the current song, and the narration voice that is not biased to the previous song or the current song can be determined. , can be highly evaluated as a narration that considers the connection of songs. In this way, it is possible to effectively evaluate the connection between the previous song before and after the narration and the current song.

更に、第1の実施形態のカラオケ装置1では、評価部22は、今回楽曲ワードとして、今回楽曲の歌詞データに含まれるワード及び/又は今回楽曲の曲調を表現した曲調ワードを使用し、前回楽曲ワードとして、前回楽曲の歌詞データに含まれるワード及び/又は前回楽曲の曲調を表現した曲調ワードを使用する。 Furthermore, in the karaoke apparatus 1 of the first embodiment, the evaluation unit 22 uses words included in the lyric data of the current song and/or melody words expressing the melody of the current song as the current song words. As words, words included in the lyric data of the previous song and/or melody words expressing the melody of the previous song are used.

これにより、ナレーション音声の内容が、前回楽曲や今回楽曲に関連しているかを効果的に評価することができる。 This makes it possible to effectively evaluate whether the content of the narration voice is related to the previous song or the current song.

なお、上記の第1の実施形態では、記憶部11が各楽曲の楽曲データに対応付けて楽曲の曲調を表現した曲調ワードを記憶していて、評価部22は、ナレーション音声から特定された特定ワードを、記憶部11に記憶された前回楽曲の曲調ワードや今回楽曲の曲調ワードと比較する例を説明したが、本発明はこの例に限定されない。 In the above-described first embodiment, the storage unit 11 stores tune words that express the tune of each tune in association with the tune data of each tune, and the evaluation unit 22 stores the tune words specified from the narration voice. An example has been described in which words are compared with the tone words of the previous song and the tone words of the current song stored in the storage unit 11, but the present invention is not limited to this example.

例えば、他の例では、記憶部11は、各楽曲の楽曲データに対応付けた楽曲の曲調を表現した曲調ワードに代えて、楽曲の所定のテンポ範囲と曲調ワードとを対応付けたテーブルを記憶していてもよく、例えば、このテーブルには、テンポ150~180と、曲調ワード「疾走」、「スピード」とが対応付けられている。 For example, in another example, the storage unit 11 stores a table that associates a predetermined tempo range of a song with a melody word instead of the melody word that expresses the melody of the song associated with the song data of each song. For example, in this table, tempos 150 to 180 are associated with tone words "sprint" and "speed".

また、他の例では、記憶部11は、楽曲におけるマイナーコード及びメジャーコードの割合とその割合に応じた曲調ワードとを対応付けたテーブルを記憶していてもよく、例えば、このテーブルには、マイナーコード:メジャーコード=2:8と、曲調ワード「楽しい」、「爽やか」とが対応付けられている。 In another example, the storage unit 11 may store a table that associates the proportions of minor chords and major chords in a piece of music with tune words corresponding to the proportions. The minor chord:major chord=2:8 is associated with the melody words "enjoyable" and "refreshing."

そして、評価部22は、前回楽曲や今回楽曲の楽曲データからテンポやコード構成を取得し、取得したテンポやコード構成に基づいて上記したテーブルを参照して、前回楽曲や今回楽曲の曲調ワードを取得し、特定ワードと比較する。 Then, the evaluation unit 22 acquires the tempo and chord structure from the song data of the previous song and the current song, refers to the above-described table based on the acquired tempo and chord structure, and determines the tone words of the previous song and the current song. Get and compare with a specific word.

上記の第1の実施形態では、検知部20が、今回楽曲のカラオケ演奏を開始する前に、マイクロフォン3を介して入力された音声をナレーション音声として検知する例を説明したが、本発明はこの例に限定されない。例えば、他の例では、検知部20は、今回楽曲のカラオケ演奏を開始した後、前奏区間中に、マイクロフォン3を介して入力された音声をナレーション音声として検知してもよい。 In the above-described first embodiment, an example was described in which the detection unit 20 detects the voice input via the microphone 3 as the narration voice before starting the karaoke performance of the current song. Examples are not limiting. For example, in another example, the detection unit 20 may detect the voice input via the microphone 3 as the narration voice during the prelude section after starting the karaoke performance of the current song.

上記の第1の実施形態では、評価部22が、前回一致数及び今回一致数のそれぞれに一定の係数(例えば、5)を乗算することで、前回楽曲及び今回楽曲に対するナレーション得点をそれぞれ算出する例を説明したが、本発明はこの例に限定されない。例えば、上記の例に加えて、評価部22は、特定ワードが前回楽曲ワードと今回楽曲ワードとに共通して含まれる場合、このような共通ワードを高評価してナレーション音声を評価してもよく、例えば、共通ワードに対して通常の係数よりも高い計数により得点を算出して、ナレーション得点を算出してもよい。 In the above-described first embodiment, the evaluation unit 22 calculates the narration scores for the previous song and the current song by multiplying each of the previous match count and the current match count by a constant coefficient (for example, 5). Although an example has been described, the invention is not limited to this example. For example, in addition to the above example, if a specific word is commonly included in the previous song word and the current song word, the evaluation unit 22 may evaluate the narration voice by highly evaluating such a common word. Well, for example, a narration score may be calculated by calculating a score with a higher coefficient than a normal coefficient for common words.

[第2の実施形態]
以下、本発明の第2の実施形態のカラオケ装置1について説明する。図3は、第2の実施形態のカラオケ装置1の構成を示すブロック図である。第2の実施形態の説明において、第1の実施形態と同一の構成要素には第1の実施形態と同一の符号を付し、その説明を省略する。
[Second embodiment]
A karaoke apparatus 1 according to a second embodiment of the present invention will be described below. FIG. 3 is a block diagram showing the configuration of the karaoke device 1 of the second embodiment. In the description of the second embodiment, the same reference numerals as in the first embodiment are given to the same constituent elements as in the first embodiment, and the description thereof is omitted.

第2の実施形態のカラオケ装置1は、第1の実施形態の構成に加えて、カラオケ演奏を行う楽曲に対して入力されたナレーション音声を記録しておいて、当該楽曲が予約された場合にナレーションとして再生可能に利用者に提示するように構成される。 In addition to the configuration of the first embodiment, the karaoke device 1 of the second embodiment records the narration voice input for the song to be performed karaoke, and when the song is reserved, It is configured to be reproducibly presented to the user as narration.

第2の実施形態において、制御部10は、第1の実施形態と同様に、記憶部11に記憶されたプログラムを実行することにより、検知部20、特定部21、評価部22及び表示部23として動作し、更に、録音部30、判定部31、登録部32及び提示部33として動作する。 In the second embodiment, as in the first embodiment, the control unit 10 executes the program stored in the storage unit 11 to perform the detection unit 20, the identification unit 21, the evaluation unit 22, and the display unit 23. , and further operates as a recording unit 30 , a determination unit 31 , a registration unit 32 and a presentation unit 33 .

録音部30は、検知部20によってナレーション音声が検知された場合に、当該ナレーション音声をナレーションデータとして録音して記憶部11に一時的に記憶する。具体的には、カラオケ本体2は、前回楽曲である楽曲Aのカラオケ演奏を終了した後、今回楽曲である楽曲Bのカラオケ演奏を開始する前に、所定の検知時間の間、楽曲Bのカラオケ演奏を停止していて、この検知時間の間に、利用者からマイクロフォン3を介して音声が入力され、検知部20によってこの音声がナレーション音声として検知された場合、録音部30は、ナレーションデータの録音を開始する。また、録音部30は、検知部20において説明した所定の終了条件を満たす場合にナレーション音声の検知が終了すると、ナレーションデータの録音を終了する。 When the detection unit 20 detects the narration sound, the recording unit 30 records the narration sound as narration data and temporarily stores it in the storage unit 11 . Specifically, after finishing the karaoke performance of the song A which is the previous song, the karaoke main body 2 performs the karaoke of the song B for a predetermined detection time before starting the karaoke performance of the song B which is the current song. When the performance is stopped and the sound is input from the user through the microphone 3 during this detection time, and this sound is detected as the narration sound by the detection unit 20, the recording unit 30 detects the narration data. Start recording. Further, when the detection of the narration sound is completed when the predetermined end condition described in the detection section 20 is satisfied, the recording section 30 ends the recording of the narration data.

判定部31は、評価部22によるナレーション音声の評価結果に基づいて、録音部30によって録音したナレーションデータを登録するか否かを判定する。具体的には、判定部31は、評価部22がナレーション音声を評価した結果のナレーション得点が、所定の登録得点(例えば、80点)以上であった場合に、当該ナレーション音声のナレーションデータを登録すると判定する。一方、判定部31は、ナレーション得点が所定の登録得点未満であった場合、ナレーション音声のナレーションデータを登録しないと判定し、記憶部11に一時的に記憶したナレーションデータを削除する。 The determination unit 31 determines whether or not to register the narration data recorded by the recording unit 30 based on the evaluation result of the narration voice by the evaluation unit 22 . Specifically, when the narration score obtained by evaluating the narration voice by the evaluation unit 22 is equal to or higher than a predetermined registration score (for example, 80 points), the determination unit 31 registers the narration data of the narration voice. Then judge. On the other hand, when the narration score is less than the predetermined registration score, the determination unit 31 determines not to register the narration data of the narration voice, and deletes the narration data temporarily stored in the storage unit 11 .

登録部32は、判定部31によって登録すると判定されたナレーション音声のナレーションデータを、当該ナレーション音声の後にカラオケ演奏される今回楽曲を識別する楽曲識別子である今回楽曲識別子と、当該ナレーション音声の前にカラオケ演奏された前回楽曲を識別する前回楽曲識別子との組み合わせに対応付けて、記憶部11に記憶して登録する。また、カラオケ本体2は、インターネットやLAN等のネットワークを介して外部のサーバ装置と通信可能に接続されていて、登録部32は、前回楽曲識別子及び今回楽曲識別子の組み合わせとナレーションデータと対応付けてサーバ装置へ送信してサーバ装置に登録してもよい。 The registration unit 32 registers the narration data of the narration sound determined to be registered by the determination unit 31 with a current music identifier, which is a music identifier for identifying the current music to be performed in karaoke after the narration sound, It is stored and registered in the storage unit 11 in association with a combination with a previous music identifier for identifying the previous music performed by karaoke. In addition, the karaoke main unit 2 is communicably connected to an external server device via a network such as the Internet or a LAN, and the registration unit 32 associates a combination of the previous music identifier and the current music identifier with the narration data. It may be transmitted to the server device and registered in the server device.

具体的には、前回楽曲である楽曲Aの前回楽曲識別子が「ID****A1」であり、今回楽曲である楽曲Bの今回楽曲識別子が「ID****B1」である場合、登録部32は、これら2つの楽曲識別子「ID****A1」及び「ID****B1」の組み合わせと、録音部30によって録音したナレーションデータとを対応付けて、記憶部11に登録する。このとき、ナレーションデータに対応するナレーション音声について評価部22が評価したナレーション得点も、ナレーションデータに対応付けて登録してもよい。 Specifically, when the previous music identifier of music A, which is the previous music, is "ID****A1", and the current music identifier of music B, which is the current music, is "ID****B1", The registration unit 32 associates the combination of these two music identifiers "ID****A1" and "ID****B1" with the narration data recorded by the recording unit 30, and registers them in the storage unit 11. do. At this time, the narration score evaluated by the evaluation unit 22 for the narration voice corresponding to the narration data may also be registered in association with the narration data.

なお、前回楽曲識別子及び今回楽曲識別子の所定の組み合わせに対応付けた過去のナレーションデータが既に記憶部11に登録されているときに、この組み合わせに対応する前回楽曲及び今回楽曲が新たに予約されて今回楽曲のカラオケ演奏の前にナレーション音声が新たにカラオケ本体2に入力されて録音部30によってナレーション音声が録音されることがある。この場合、新たなナレーション音声のナレーションデータを登録すると判定部31によって判定された場合、新たなナレーション音声のナレーション得点が、既に登録された過去のナレーション音声のナレーション得点以上であれば、登録部32は、新たなナレーションデータを登録せずに、過去のナレーションデータの登録を維持する。 When past narration data associated with a predetermined combination of the previous music identifier and the current music identifier is already registered in the storage unit 11, the previous music and the current music corresponding to this combination are newly reserved. The narration voice may be newly input to the karaoke main body 2 and recorded by the recording unit 30 before the karaoke performance of the song this time. In this case, when the determination unit 31 determines that the narration data of the new narration voice is to be registered, if the narration score of the new narration voice is equal to or higher than the narration score of the past narration voice that has already been registered, the registration unit 32 maintains the registration of past narration data without registering new narration data.

一方、新たなナレーション音声のナレーション得点が、既に登録された過去のナレーション音声のナレーション未満であれば、登録部32は、過去のナレーションデータに代えて、新たなナレーションデータを登録する。 On the other hand, if the narration score of the new narration voice is less than the narration score of the past narration voice that has already been registered, the registration unit 32 registers new narration data instead of the past narration data.

なお、登録部32は、新たなナレーションデータを登録するか否かを利用者に選択操作させるための選択画面を表示装置5やリモコン装置6に表示してもよい。 Note that the registration unit 32 may display a selection screen on the display device 5 or the remote control device 6 for allowing the user to select whether or not to register new narration data.

提示部33は、今回楽曲のカラオケ演奏が行われる前に、今回楽曲に対応する今回楽曲識別子と前回楽曲識別子との組み合わせがナレーションデータと対応付けられて登録部32によって記憶部11に登録されていた場合、利用者に対して、当該組み合わせに対応するナレーションデータを再生可能に提示する。 In the presenting unit 33, before the karaoke performance of the current song is performed, the combination of the current song identifier and the previous song identifier corresponding to the current song is associated with the narration data and registered in the storage unit 11 by the registration unit 32. If so, the narration data corresponding to the combination is presented to the user in a reproducible manner.

具体的に、楽曲Aの楽曲識別子「ID****A1」と楽曲Bの楽曲識別子「ID****B1」との組み合わせに対応付けたナレーションデータが既に記憶部11に登録されている場合を説明する。この場合、カラオケ本体2に楽曲A、楽曲Bがこの順で予約されて記憶部11の予約管理テーブルに登録されているとき、前回楽曲である楽曲Aのカラオケ演奏が終了した後、提示部33は、楽曲A及び楽曲Bの楽曲識別子の組み合わせが記憶部11に登録されているか否かを検索する。楽曲A及び楽曲Bの組み合わせが登録されている場合、提示部33は、この組み合わせに対応するナレーションデータを再生可能に提示する。 Specifically, the narration data associated with the combination of the music identifier "ID****A1" of the music A and the music identifier "ID****B1" of the music B is already registered in the storage unit 11. Explain the case. In this case, when music A and music B are reserved in this order in the karaoke main body 2 and registered in the reservation management table of the storage unit 11, the presenting unit 33 searches whether a combination of music identifiers of music A and music B is registered in the storage unit 11 . When a combination of music A and music B is registered, the presentation unit 33 presents narration data corresponding to this combination in a reproducible manner.

このとき、提示部33は、「楽曲Aと楽曲Bに関連するナレーションデータが再生可能です。再生する場合は、カラオケ装置本体又はリモコン装置から操作してください。」等のメッセージを提示するナレーション提示画面を表示装置5又はリモコン装置6に表示することで、ナレーションデータを再生可能に提示する。また、提示部33は、ナレーション提示画面においてナレーション再生の指示を受け付けていて、例えば、ナレーション提示画面に「ナレーション再生」ボタンを操作可能に表示する。「ナレーション再生」ボタンが押下されると、提示部33は、今回楽曲である楽曲Bのカラオケ演奏を開始する前に、楽曲A及び楽曲Bの組み合わせに対応するナレーションデータを記憶部11から読み出して音声入出力部13及びスピーカ4を利用して放音することで、ナレーションデータを再生する。 At this time, the presentation unit 33 presents a narration that presents a message such as "Narration data related to music A and music B can be reproduced. To reproduce, please operate from the main body of the karaoke machine or the remote control device." By displaying the screen on the display device 5 or the remote control device 6, the narration data is reproducibly presented. In addition, the presentation unit 33 receives an instruction to reproduce the narration on the narration presentation screen, and displays, for example, an operable "play narration" button on the narration presentation screen. When the "play narration" button is pressed, the presentation unit 33 reads the narration data corresponding to the combination of the songs A and B from the storage unit 11 before starting the karaoke performance of the song B, which is the current song. The narration data is reproduced by emitting sounds using the audio input/output unit 13 and the speaker 4 .

あるいは、提示部33は、カラオケ本体2に楽曲A、楽曲Bがこの順で予約される場合に、楽曲Bの予約時に、楽曲Aと楽曲Bとの間に、既に登録されているナレーションデータを再生するか否かを利用者に選択させてもよい。 Alternatively, when music A and music B are reserved in the karaoke main body 2 in this order, the presenting unit 33 inserts the already registered narration data between music A and music B when music B is reserved. The user may be allowed to select whether or not to reproduce.

なお、カラオケ本体2は、ナレーションデータの再生後、今回楽曲である楽曲Bのカラオケ演奏を開始する。提示部33は、前回楽曲の演奏終了後、今回楽曲の演奏開始前の所定の提示時間の間、ナレーション提示画面を表示するとよく、この提示時間の間にナレーション再生の指示がない場合には、カラオケ本体2は、ナレーションデータを再生することなく、今回楽曲である楽曲Bのカラオケ演奏を開始する。 After reproducing the narration data, the karaoke main body 2 starts karaoke performance of the music piece B, which is the current music piece. The presentation unit 33 preferably displays the narration presentation screen for a predetermined presentation time after the end of the performance of the previous musical piece and before the start of the performance of the current musical piece. The karaoke main body 2 starts karaoke performance of the song B, which is the current song, without reproducing the narration data.

第2の実施形態のカラオケ装置1によれば、ナレーションが苦手な歌唱者等がナレーションの入力を行わない場合でも、これから歌唱する今回楽曲と直前に演奏された前回楽曲との繋がりを考慮した高評価な内容の録音済みのナレーション音声を再生することができ、場の雰囲気を盛り上げることができる。 According to the karaoke device 1 of the second embodiment, even if a singer who is not good at narration does not input the narration, the high-pitched song that takes into account the connection between the current song to be sung and the previous song that was played immediately before. Pre-recorded narration voices with valuable contents can be played back, and the atmosphere of the place can be livened up.

[第3の実施形態]
以下、本発明の第3の実施形態のカラオケ装置1について説明する。図4は、第3の実施形態のカラオケ装置1の構成を示すブロック図である。第3の実施形態の説明において、第1の実施形態と同一の構成要素には第1の実施形態と同一の符号を付し、その説明を省略する。
[Third embodiment]
A karaoke apparatus 1 according to a third embodiment of the present invention will be described below. FIG. 4 is a block diagram showing the configuration of the karaoke device 1 of the third embodiment. In the description of the third embodiment, the same reference numerals as in the first embodiment are given to the same constituent elements as in the first embodiment, and the description thereof will be omitted.

第3の実施形態のカラオケ装置1は、第1の実施形態の構成に加えて、ナレーション音声に再生ワードが含まれている場合に、効果音を再生するように構成される。 In addition to the configuration of the first embodiment, the karaoke machine 1 of the third embodiment is configured to reproduce sound effects when a reproduction word is included in the narration voice.

第3の実施形態において、制御部10は、第1の実施形態と同様に、記憶部11に記憶されたプログラムを実行することにより、検知部20、特定部21、評価部22及び表示部23として動作し、更に、再生部40として動作する。 In the third embodiment, as in the first embodiment, the control unit 10 executes the program stored in the storage unit 11 to perform the detection unit 20, the identification unit 21, the evaluation unit 22 and the display unit 23. , and further operates as the reproducing unit 40 .

また、第3の実施形態において、記憶部11は、再生ワードと効果音とを対応付けて予め記憶する。記憶部11は、図5に示すように、効果音テーブルに再生ワードと効果音とを対応付けて記憶するとよく、例えば、再生ワードに対応する効果音を示す効果音ファイルを記憶する。 Further, in the third embodiment, the storage unit 11 stores in advance the reproduction words and the sound effects in association with each other. As shown in FIG. 5, the storage unit 11 preferably stores reproduction words and sound effects in association with each other in a sound effect table. For example, it stores sound effect files indicating sound effects corresponding to reproduction words.

再生ワードは、カラオケ歌唱する場の雰囲気を盛り上げるワードであり、例えば、「ノッてるかい」や「いくぜ~」等の観客(聴衆)を煽るようなワード、即ち、歌唱者から観客に向けて発するワードである。効果音も、カラオケ歌唱する場の雰囲気を盛り上げるワードであり、例えば、「いぇ~い」や「お~~っ」等の再生ワードに答えるようなワード、即ち、観客から歌唱者や周囲に向けて発するワードである。換言すれば、再生ワードと効果音とは、歌唱者が発した再生ワードに対して観客が効果音で答えるような関係を有して対応付けられている。 The playback word is a word that excites the atmosphere of the karaoke singing place. It is the word that utters. Sound effects are also words that liven up the atmosphere of karaoke singing. It is a word that is directed towards. In other words, the reproduced words and the sound effects are associated with each other in such a way that the audience responds to the reproduced words uttered by the singer with the sound effects.

再生部40は、特定部21によってナレーション音声から特定された特定ワードと、記憶部11に記憶された再生ワードとが一致した場合、当該再生ワードに対応づけられた効果音を再生するように構成される。 The reproduction unit 40 is configured to reproduce the sound effect associated with the reproduction word when the specific word identified from the narration voice by the identification unit 21 matches the reproduction word stored in the storage unit 11. be done.

具体的には、特定部21によってナレーション音声から「ノッてるかい」の特定ワードが特定された場合、再生部40は、「ノッてるかい」の特定ワードが効果音テーブルに再生ワードとして記憶されているかを検索する。そして、「ノッてるかい」の再生ワードが効果音テーブルから検索された場合、再生部40は、「ノッてるかい」の再生ワードに対応する効果音ファイル「AAAA.mp3」を効果音テーブルから読み出して、音声入出力部13及びスピーカ4を利用して放音することで、効果音を再生する。 Specifically, when the specifying unit 21 specifies the specific word "not terukai" from the narration sound, the reproducing unit 40 stores the specific word "not terukai" in the sound effect table as a reproduction word. Search for dolphins. Then, when the playback word "Not Terukai" is retrieved from the sound effect table, the playback unit 40 reads the sound effect file "AAAA.mp3" corresponding to the playback word "Notterukai" from the sound effect table. Then, by emitting sound using the audio input/output unit 13 and the speaker 4, the effect sound is reproduced.

このとき、再生部40は、ナレーション音声の「ノッてるかい」の音声が放音された直後のタイミングで、効果音ファイル「AAAA.mp3」を再生するとよい。例えば、特定部21は、ナレーション音声の音声認識方式として、リアルタイム音声認識を採用し、入力したナレーション音声をリアルタイムに文字起こしして特定ワードを特定する。再生部40は、リアルタイムに特定された特定ワードと一致する再生ワードに対応する効果音ファイルを再生することで、ナレーション音声として入力されたワードに対してリアルタイムに効果音を放音することができる。なお、再生部40は、効果音をナレーション音声に重ねて放音する。 At this time, the reproducing unit 40 preferably reproduces the sound effect file "AAAA.mp3" at the timing immediately after the sound of the narration sound "Not Terukai" is emitted. For example, the identification unit 21 adopts real-time speech recognition as a speech recognition method for narration speech, transcribes the input narration speech in real time, and specifies a specific word. The reproduction unit 40 reproduces the sound effect file corresponding to the reproduction word that matches the specified specific word in real time, thereby emitting the sound effect in real time for the word input as the narration sound. . Note that the reproducing unit 40 emits sound effects superimposed on the narration sound.

第3の実施形態のカラオケ装置1によれば、これから歌唱する今回楽曲と直前に演奏された前回楽曲との繋がりを考慮した内容のナレーションを行う場合に、ナレーションに答える効果音が再生されることで、場の雰囲気を盛り上げることができる。 According to the karaoke apparatus 1 of the third embodiment, when performing a narration considering the connection between the current song to be sung from now on and the previous song played immediately before, sound effects are reproduced in response to the narration. You can liven up the atmosphere of the place.

また、本発明は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴うカラオケ装置もまた本発明の技術思想に含まれる。 In addition, the present invention can be modified as appropriate within the scope that does not contradict the gist or idea of the invention that can be read from the scope of claims and the entire specification, and karaoke machines that involve such modifications also conform to the technical concept of the present invention. included.

1 カラオケ装置
2 カラオケ本体
5 表示装置
6 リモコン装置
10 制御部
11 記憶部
20 検知部
21 特定部
22 評価部
23 表示部
30 録音部
31 判定部
32 登録部
33 提示部
40 再生部
1 karaoke device 2 karaoke main body 5 display device 6 remote control device 10 control unit 11 storage unit 20 detection unit 21 identification unit 22 evaluation unit 23 display unit 30 recording unit 31 determination unit 32 registration unit 33 presentation unit 40 reproduction unit

Claims (5)

楽曲の演奏開始前に利用者から音声が入力された場合に、当該音声をナレーション音声として検知する検知部と、
前記ナレーション音声が検知された場合に、当該ナレーション音声を音声認識処理して、当該ナレーション音声に含まれる特定ワードを特定する特定部と、
特定された前記特定ワードと、これから演奏を開始する今回楽曲に関連する今回楽曲ワード及び前記今回楽曲の直前に演奏された前回楽曲に関連する前回楽曲ワードとの比較結果に基づいて、前記ナレーション音声を評価する評価部と、
前記評価部による前記ナレーション音声の評価結果を表示する表示部と、
を備えることを特徴とするカラオケ装置。
a detection unit that detects, when a voice is input from a user before the performance of a piece of music is started, the voice as a narration voice;
a specifying unit that, when the narration voice is detected, performs voice recognition processing on the narration voice to specify a specific word included in the narration voice;
Based on the result of comparison between the specified specific word, the current song word related to the current song to be played from now on, and the previous song word related to the previous song played immediately before the current song, the narration voice is generated. an evaluation unit that evaluates
a display unit for displaying an evaluation result of the narration voice by the evaluation unit;
A karaoke device comprising:
前記評価部は、前記特定ワードと前記今回楽曲ワードとの今回一致数、及び前記特定ワードと前記前回楽曲ワードとの前回一致数に基づいて、前記ナレーション音声を評価することを特徴とする請求項1に記載のカラオケ装置。 3. The evaluation unit evaluates the narration sound based on the number of times the specific word matches the current song word and the previous time match number between the specific word and the previous song word. 1. The karaoke device according to 1. 前記評価部は、前記今回楽曲ワードとして、前記今回楽曲の歌詞データに含まれるワード及び/又は前記今回楽曲の曲調を表現したワードを使用し、前記前回楽曲ワードとして、前記前回楽曲の歌詞データに含まれるワード及び/又は前記前回楽曲の曲調を表現したワードを使用することを特徴とする請求項1又は2に記載のカラオケ装置。 The evaluation unit uses words included in the lyrics data of the current song and/or words expressing the tone of the current song as the current song words, and uses words included in the lyrics data of the current song and/or words expressing the tune of the current song as the words of the previous song, and uses lyrics data of the previous song as the previous song words. 3. The karaoke machine according to claim 1, wherein the words contained therein and/or the words expressing the melody of the previous musical piece are used. 前記ナレーション音声が検知された場合に、当該ナレーション音声をナレーションデータとして録音する録音部と、
前記評価部による前記ナレーション音声の評価結果に基づいて、録音した前記ナレーションデータを登録するか否かを判定する判定部と、
登録すると判定された前記ナレーションデータを、前記今回楽曲の今回楽曲識別子と前記前回楽曲の前回楽曲識別子との組み合わせに対応付けて登録する登録部と、
前記今回楽曲識別子と前記前回楽曲識別子との組み合わせが前記登録部に登録されていた場合、当該組み合わせに対応する前記ナレーションデータを再生可能に提示する提示部と、
を備えることを特徴とする請求項1~3の何れか1項に記載のカラオケ装置。
a recording unit that, when the narration sound is detected, records the narration sound as narration data;
a determination unit that determines whether or not to register the recorded narration data based on the evaluation result of the narration voice by the evaluation unit;
a registration unit that registers the narration data determined to be registered in association with a combination of the current music identifier of the current music and the previous music identifier of the previous music;
a presenting unit that reproducibly presents the narration data corresponding to the combination when the combination of the current music identifier and the previous music identifier is registered in the registration unit;
The karaoke machine according to any one of claims 1 to 3, characterized by comprising:
再生ワードと効果音とを対応付けて記憶する記憶部と、
前記特定ワードと前記記憶部に記憶された前記再生ワードとが一致した場合、当該再生ワードに対応づけられた効果音を再生する再生部と、
を備えることを特徴とする請求項1~4の何れか1項に記載のカラオケ装置。
a storage unit that stores playback words and sound effects in association with each other;
a reproduction unit that reproduces a sound effect associated with the reproduction word when the specific word matches the reproduction word stored in the storage unit;
The karaoke machine according to any one of claims 1 to 4, characterized by comprising:
JP2021139806A 2021-08-30 2021-08-30 karaoke device Pending JP2023033877A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021139806A JP2023033877A (en) 2021-08-30 2021-08-30 karaoke device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021139806A JP2023033877A (en) 2021-08-30 2021-08-30 karaoke device

Publications (1)

Publication Number Publication Date
JP2023033877A true JP2023033877A (en) 2023-03-13

Family

ID=85503873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021139806A Pending JP2023033877A (en) 2021-08-30 2021-08-30 karaoke device

Country Status (1)

Country Link
JP (1) JP2023033877A (en)

Similar Documents

Publication Publication Date Title
TWI497484B (en) Performance evaluation device, karaoke device, server device, performance evaluation system, performance evaluation method and program
JP6452229B2 (en) Karaoke sound effect setting system
JP2007256617A (en) Musical piece practice device and musical piece practice system
JP2008139426A (en) Data structure of data for evaluation, karaoke machine, and recording medium
JP4926756B2 (en) Karaoke sound effect output system
JP2022120188A (en) Music reproduction system, method and program for controlling the same
JP2007256618A (en) Search device
JP6288197B2 (en) Evaluation apparatus and program
JP6102076B2 (en) Evaluation device
JP4038836B2 (en) Karaoke equipment
JP2023033877A (en) karaoke device
JP2007057727A (en) Electronic percussion instrument amplifier system with musical sound reproducing function
JP4068069B2 (en) Karaoke device that automatically controls back chorus volume
KR200255782Y1 (en) Karaoke apparatus for practice on the instrumental accompaniments
JPH0417000A (en) Karaoke device
JP2007233078A (en) Evaluation device, control method, and program
JP2000137490A (en) Karaoke sing-along machine
JP5092311B2 (en) Voice evaluation device
JP2004184506A (en) Karaoke machine and program
JP2022154202A (en) karaoke system
JP2023003706A (en) karaoke system
JP5439994B2 (en) Data collection / delivery system, online karaoke system
JP2022130930A (en) karaoke device
JP2022168368A (en) karaoke system
JP5505012B2 (en) Electronic music apparatus and program