JP7240271B2 - Karaoke input device - Google Patents
Karaoke input device Download PDFInfo
- Publication number
- JP7240271B2 JP7240271B2 JP2019119502A JP2019119502A JP7240271B2 JP 7240271 B2 JP7240271 B2 JP 7240271B2 JP 2019119502 A JP2019119502 A JP 2019119502A JP 2019119502 A JP2019119502 A JP 2019119502A JP 7240271 B2 JP7240271 B2 JP 7240271B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- stored
- unit
- commands
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明はカラオケ用入力装置に関する。 The present invention relates to an input device for karaoke.
カラオケ装置に付属するリモコン装置を用いて、コマンドや検索ワードを音声入力し、カラオケ演奏のテンポやキーを変更したり、楽曲検索を行う技術が知られている。 2. Description of the Related Art Techniques for inputting commands and search words by voice using a remote controller attached to a karaoke machine to change the tempo and key of a karaoke performance and to search for music are known.
たとえば、特許文献1には、複数の検索語を含む一続きの音声データから各検索語を自動的に抽出し、高精度の楽曲検索を行うことが可能な楽曲検索システムが開示されている。 For example, Patent Literature 1 discloses a music search system capable of automatically extracting each search term from a series of audio data containing a plurality of search terms and performing a highly accurate music search.
ここで、ある利用者がカラオケ歌唱を行っている最中に、別の利用者がリモコン装置を用いて音声入力により楽曲検索を行うとする。この場合、リモコン装置は、別の利用者の音声ではなく、ある利用者のカラオケ歌唱に伴う歌唱音声から検索ワードを抽出する可能性がある。その結果、リモコン装置は、検索ワードを誤認識することになり、利用者の希望とは異なる検索結果が提示される恐れがある。 Here, assume that while one user is singing karaoke, another user uses the remote controller to search for music by voice input. In this case, the remote control device may extract the search word from the singing voice of a certain user accompanying karaoke singing, instead of the voice of another user. As a result, the remote control device may erroneously recognize the search word and present a search result different from the user's desired result.
一方、利用者がカラオケ歌唱を行う楽曲の歌詞と、音声入力により実行されるコマンドとが一致する可能性もある。たとえば利用者がある楽曲の歌詞である「中止」という単語を発したとする。この場合、リモコン装置は、歌詞である「中止」をコマンド「カラオケ演奏の中止」であると誤認識し、カラオケ演奏を中止してしまう恐れがある。 On the other hand, there is a possibility that the lyrics of the song that the user sings in karaoke and the command executed by voice input match. For example, suppose that the user utters the word "stop" which is the lyrics of a certain song. In this case, the remote controller may erroneously recognize the lyrics "stop" as the command "stop karaoke performance" and stop the karaoke performance.
本発明の目的は、カラオケ歌唱の場において音声入力を利用する際の誤認識を低減することが可能なカラオケ用入力装置を提供することにある。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a karaoke input device capable of reducing erroneous recognition when using voice input in karaoke singing.
上記目的を達成するための一の発明は、カラオケ歌唱を行う際に利用するカラオケ用入力装置であって、カラオケ歌唱の際に実行可能な処理に対応する複数のコマンド、及び前記コマンドの実行または楽曲の検索を指示するためのトリガーワードをそれぞれ異なるテキストデータと紐付けて記憶するデータ記憶部と、集音手段から出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する音声処理部と、検索ワードに基づいて楽曲の検索を行う検索部と、前記利用者に対し、検索の結果を報知する報知部と、コマンドを実行する実行部と、前記音声処理部が出力したテキストデータに基づいて前記トリガーワードを取得する制御部であって、前記トリガーワードを取得した後、第1の所定時間が経過するまでに前記音声処理部があるテキストデータを出力した場合、当該あるテキストデータを前記検索ワードとする楽曲の検索を前記検索部に指示する第1の処理、及び前記コマンドに紐付けられたテキストデータが出力された際、当該テキストデータに紐付けられたコマンドを記憶手段に記憶し、前記トリガーワードを取得し且つ前記記憶手段に前記コマンドを記憶している場合、記憶している前記コマンドの実行を前記実行部に指示した後、記憶している前記コマンドを削除する一方、最新のコマンドの記憶から第2の所定時間が経過した場合、記憶している前記コマンドを削除する第2の処理を行う制御部と、を有するカラオケ用入力装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
One invention for achieving the above object is a karaoke input device used when singing karaoke, comprising a plurality of commands corresponding to processes executable when singing karaoke, and execution or execution of the commands. A data storage unit that stores trigger words for instructing music searches in association with different text data, and a voice that performs voice recognition processing on the user's voice signal output from the sound collecting means and outputs it as text data. a processing unit, a search unit that searches for music based on a search word, a notification unit that notifies the user of search results, an execution unit that executes a command, and a text output by the voice processing unit A control unit that acquires the trigger word based on data, and when the voice processing unit outputs certain text data within a first predetermined time after acquiring the trigger word, the certain text a first process of instructing the search unit to search for a song using the data as the search word; when the trigger word is acquired and the command is stored in the storage means, the stored command is deleted after instructing the execution unit to execute the stored command. On the other hand, the karaoke input device has a control section that performs a second process of deleting the stored command when a second predetermined time has elapsed since the latest command was stored.
Other features of the present invention will be clarified by the description of the specification and drawings described later.
本発明によれば、カラオケ歌唱の場において音声入力を利用する際の誤認識を低減することができる。 According to the present invention, it is possible to reduce erroneous recognition when using voice input in karaoke singing.
図1~図4Bを参照して、実施形態に係るカラオケ用入力装置について説明する。 A karaoke input device according to an embodiment will be described with reference to FIGS. 1 to 4B.
==カラオケ装置==
カラオケ装置Kは、楽曲のカラオケ演奏、及び利用者がカラオケ歌唱を行うための装置である。図1に示すように、カラオケ装置Kは、カラオケ本体10、スピーカ20、表示装置30、マイク40、及びリモコン装置50を備える。
==Karaoke Device==
The karaoke device K is a device for performing karaoke music and for users to sing karaoke songs. As shown in FIG. 1, the karaoke machine K includes a karaoke
カラオケ本体10は、選曲された楽曲の演奏制御、歌詞や背景映像等の表示制御、マイク40を通じて入力された音声信号の処理といった、カラオケ演奏やカラオケ歌唱に関する各種の制御を行う。スピーカ20はカラオケ本体10からの放音信号に基づいて放音するための構成である。表示装置30はカラオケ本体10からの信号に基づいて映像や画像を画面に表示するための構成である。マイク40は利用者の歌唱音声をアナログの音声信号に変換してカラオケ本体10に入力するための構成である。リモコン装置50は、カラオケ歌唱を行う際、カラオケ本体10に対する各種操作をおこなうための装置である。本実施形態におけるリモコン装置50は「カラオケ用入力装置」に相当する。
The karaoke
==リモコン装置==
図2に示すように、本実施形態に係るリモコン装置50は、記憶手段50a、通信手段50b、表示手段50c、入力手段50d、集音手段50e、及び制御手段50fを備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
== remote control device ==
As shown in FIG. 2, the
[記憶手段]
記憶手段50aは、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。本実施形態において、記憶手段50aの領域の一部は、データ記憶部100として機能する。
[Storage means]
The storage unit 50a is a large-capacity storage device that stores various data, such as a hard disk drive. In this embodiment, part of the area of the storage means 50a functions as the
(データ記憶部)
データ記憶部100は、複数のコマンド、及びトリガーワードをそれぞれ異なるテキストデータと紐付けて記憶する。
(data storage unit)
The
コマンドは、カラオケ歌唱の際に実行可能な処理に対応する命令である。コマンドは、たとえば、「カラオケ演奏のテンポを上げる」、「カラオケ演奏のキーを下げる」、「カラオケ演奏を一時停止する」、「マイクの音量を上げる」、「スピーカからの音量を下げる」、「歌詞の表示を消す」等の処理を実行するための命令である。 A command is an instruction corresponding to a process that can be executed during karaoke singing. Commands are, for example, "Increase the tempo of karaoke performance", "Lower the key of karaoke performance", "Pause karaoke performance", "Increase the volume of the microphone", "Lower the volume from the speaker", " This is a command for executing a process such as “turn off display of lyrics”.
トリガーワードは、コマンドの実行または楽曲の検索を指示するための単語または短文である。トリガーワードは、楽曲の歌詞や利用者間の会話に出てこないような造語であることが好ましい。トリガーワードは、リモコン装置毎に予め一のワードが設定されている。 A trigger word is a word or short sentence for instructing execution of a command or search for music. The trigger word is preferably a coined word that does not appear in the lyrics of a song or conversation between users. One trigger word is set in advance for each remote control device.
テキストデータは、コマンドやトリガーワードを識別するためのデータである。複数のコマンド及びトリガーワードには、それぞれ異なる一のテキストデータが紐付けられている。 Text data is data for identifying commands and trigger words. A plurality of commands and trigger words are each associated with a single different piece of text data.
図3は、データ記憶部100に記憶されているテーブルの例である。たとえば、コマンドC01(カラオケ演奏のテンポを5%上げる)に対しては、「テンポアゲテ」のテキストデータが紐付けられている。また、この例では、テキストデータ「カラオーケー」がトリガーワードとして紐付けられている。なお、テーブルに記憶されていないテキストデータについては、対応するコマンドが無いものとして取り扱う。以下、データ記憶部100には図3のテーブルが記憶されているものとして説明する。
FIG. 3 is an example of a table stored in the
[通信手段・表示手段・入力手段・集音手段]
通信手段50bは、カラオケ本体10との通信を行うためのインターフェースを提供する。表示手段50cは、各種情報を表示させるための構成である。入力手段50dは、利用者が各種の指示入力を行うための構成である。入力手段50dは、リモコン装置50に設けられたボタン等である。或いは、表示手段50cがタッチパネル形式で構成されている場合、表示手段50cは入力手段50dとしても機能する。集音手段50eは、利用者が発した音声を集音し、音声信号として出力するためのマイクである。
[Communication means, display means, input means, sound collection means]
The communication means 50b provides an interface for communicating with the karaoke
[制御手段]
制御手段50fは、リモコン装置50における各種の制御を行う。制御手段50fは、CPUおよびメモリ(いずれも図示無し)を備える。CPUは、メモリに記憶されたプログラムを実行することにより各種の機能を実現する。
[Control means]
The control means 50 f performs various controls in the
ここで、カラオケ装置Kを利用する利用者がコマンドや検索ワードの入力を音声で行いたいと考えたとする。この場合、利用者は、たとえば入力手段50dを介し、表示手段50cに表示されている「音声入力」のアイコンを選択する。当該選択に基づいて、制御手段50fのCPUはメモリに記憶されるプログラムを実行し、音声入力モードに移行する。この場合、制御手段50fは、音声処理部200、検索部300、報知部400、実行部500、及び制御部600として機能する。
Here, it is assumed that the user who uses the karaoke machine K wants to input commands and search words by voice. In this case, the user selects the "voice input" icon displayed on the display unit 50c, for example, via the input unit 50d. Based on the selection, the CPU of the control means 50f executes the program stored in the memory and shifts to the voice input mode. In this case, the
(音声処理部)
音声処理部200は、集音手段50eから出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する。音声認識処理は、公知の手法を用いることができる。
(sound processing unit)
The
たとえば、利用者Uが集音手段50eに対し「カラオーケー」と発声したとする。集音手段50eは音声を集音し、音声信号として音声処理部200に出力する。音声処理部200は、音声信号を処理し、音声信号が示す「カラオーケー」をテキストデータとして出力する。
For example, assume that the user U utters "Karaoke" to the sound collecting means 50e. The sound collecting means 50e collects sound and outputs it to the
(検索部)
検索部300は、検索ワードに基づいて楽曲の検索を行う。検索ワードは、カラオケ歌唱を行う楽曲を検索する際に使用する。具体的に、検索ワードは、歌手名、楽曲名、歌詞の一部等である。検索部300は、複数の楽曲の中から検索ワードを含む楽曲を抽出する。なお、検索ワードに基づく楽曲の検索は公知の手法を用いることができる。本実施形態において検索ワードは音声入力される。検索部300は、制御部600からの指示に応じて楽曲の検索を行う(詳細は後述)。
(search part)
The
(報知部)
報知部400は、利用者に対し、検索の結果を報知する。たとえば、検索部300が検索結果として楽曲X1、X2、X3を抽出したとする。この場合、報知部400は楽曲X1、楽曲X2、楽曲X3の曲名や楽曲IDを表示手段50cに表示させることで、検索の結果を報知する。なお、検索の結果は、リモコン装置50に設けられたスピーカ(図示なし)を介し、音声で報知してもよい。
(Notification part)
The
(実行部)
実行部500は、コマンドを実行する。実行部500は、制御部600からの指示に基づいて記憶手段50aに記憶されたコマンドを実行する(詳細は後述)。
(execution part)
The
(制御部)
制御部600は、音声処理部200が出力したテキストデータに基づいてトリガーワードを取得する。
(control part)
The
たとえば、音声処理部200から「カラオーケー」というテキストデータが出力されたとする。制御部600は、出力されたテキストデータに対応するデータがデータ記憶部100に記憶されているかどうかを確認する。図3の例によれば、テキストデータ「カラオーケー」はトリガーワードと紐付けられている。この場合、制御部600は、トリガーワードを取得する。
For example, it is assumed that text data "Karaoke" is output from
なお、たとえば、音声処理部200から「ハラヘッタ」というテキストデータが出力されたとする。制御部600は、出力されたテキストデータに対応するデータがデータ記憶部100に記憶されているかどうかを確認する。図3の例によれば、テキストデータ「ハラヘッタ」に紐付けられているトリガーワードやコマンドは存在しない。この場合、制御部600は以下の処理を行わない。
For example, it is assumed that text data "Harahetta" is output from
ここで、本実施形態に係る制御部600は、第1の処理及び第2の処理を行う。以下、各処理について詳述する。
Here, the
第1の処理は、トリガーワードを取得した後、第1の所定時間が経過するまでに音声処理部200があるテキストデータを出力した場合、当該あるテキストデータを検索ワードとする楽曲の検索を検索部300に指示する処理である。第1の所定時間は、たとえば「3秒」のように予め一の値が設定されている。
In the first process, when certain text data is output from the
具体的に、制御部600は、トリガーワードを取得した場合に計時を開始する。制御部600は、トリガーワードを取得してから第1の所定時間が経過するまでに音声処理部200がテキストデータを出力するかどうかを確認する。ここで、第1の所定時間が経過するまでに利用者Uが「入間椅子」と発声し、当該発声に基づいて、音声処理部200からテキストデータ「イルマイス」の出力があったとする。この場合、制御部600は、テキストデータ「イルマイス」を検索ワードとして判定する。制御部600は、「イルマイス」を検索ワードとする楽曲の検索を行うよう、検索部300に指示する。検索部300は、当該指示に基づいて、検索ワード「イルマイス」で楽曲の検索を行う。
Specifically, the
一方、第1の所定時間が経過するまでに音声処理部200があるテキストデータを出力しなかった場合、制御部600は、検索部300に対して楽曲の検索を指示することはない。
On the other hand, if the
なお、第1の所定時間が経過するまでにテキストデータの出力があった場合または第1の所定時間が経過するまでテキストデータの出力がなかった場合、制御部600は、計時を終了し、タイマをリセットする。
If the text data is output before the first predetermined time elapses, or if the text data is not output until the first predetermined time elapses, the
第2の処理は、コマンドに紐付けられたテキストデータが出力された際、当該テキストデータに紐付けられたコマンドを記憶手段50aに記憶し、トリガーワードを取得し且つ記憶手段50aにコマンドを記憶している場合、記憶しているコマンドの実行を実行部500に指示した後、記憶しているコマンドを削除する一方、最新のコマンドの記憶から第2の所定時間が経過した場合、記憶しているコマンドを削除する処理である。第2の所定時間は、たとえば「3秒」のように予め一の値が設定されている。なお、第1の所定時間及び第2の所定時間は、同じ時間であってもよいし、異なっていてもよい。
In the second process, when the text data linked to the command is output, the command linked to the text data is stored in the storage means 50a, the trigger word is acquired, and the command is stored in the storage means 50a. If so, after instructing the
たとえば、楽曲X1の前奏部分を聴いた利用者Uが、自ら楽曲X1をカラオケ歌唱するにはキーが高く、またテンポも速いと感じたとする。この場合、利用者Uは、集音手段50eに対し「キー下げて」、「テンポ下げて」と順番に発声する。音声処理部200は、当該音声に基づく音声信号を音声認識処理し、「キーサゲテ」、「テンポサゲテ」をテキストデータとして出力する。
For example, assume that the user U who listened to the introductory part of the music piece X1 feels that the key and the tempo of the music piece X1 are too high to sing in karaoke. In this case, the user U sequentially utters "lower the key" and "lower the tempo" to the sound collecting means 50e. The
制御部600は、出力されたテキストデータに対応するデータがデータ記憶部100に記憶されているかどうかを確認する。図3の例によれば、テキストデータ「キーサゲテ」はコマンドC05(カラオケ演奏のキーを1半音下げる)が紐付けられており、テキストデータ「テンポサゲテ」はコマンドC02(カラオケ演奏のテンポを5%下げる)が紐付けられている。よって、制御部600は、テキストデータ「キーサゲテ」、「テンポサゲテ」に紐付けられているコマンドC05及びC02を発声された順番で記憶手段50aに記憶する。
制御部600は、コマンドを記憶した場合にタイマをリセットして計時を開始する。上記例のように複数のコマンドを記憶する場合、制御部600は、コマンドが記憶される都度タイマをリセットして新たに計時を開始する。
When the command is stored, the
利用者Uが「カラオーケー」と発声し、制御部600がトリガーワードを取得したとする。この場合、制御部600は、記憶手段50aが記憶しているコマンドC05及びC02を実行するよう実行部500に指示する。制御部600は、当該指示を行った後、記憶しているコマンドC05及びコマンドC02を記憶手段50aから削除する。なお、コマンドを削除した場合、制御部600は、計時を終了する。
Assume that the user U utters "Karaoke" and the
一方、コマンドC02を記憶してから第2の所定時間が経過した場合、制御部600は、記憶手段50aからコマンドC05及びコマンドC02を削除する。なお、コマンドを削除した場合、制御部600は計時を終了する。すなわち、制御部600は、最新のコマンドの記憶から第2の所定時間が経過した場合、記憶しているコマンドを削除する。
On the other hand, when the second predetermined time has passed since command C02 was stored,
ここで、複数のコマンドを記憶している場合、制御部600は、全てのコマンドを実行するよう実行部500に指示することができる。
Here, when a plurality of commands are stored, the
たとえば、制御部600は、記憶した順に全てのコマンドを実行するよう実行部500に指示することができる。上記例において、トリガーワードを取得し且つコマンドC05及びコマンドC02を記憶している場合、制御部600は、コマンドC05、コマンドC02の順で実行するよう実行部500に指示する。また、制御部600は、当該指示を行った後、記憶している全てのコマンドを記憶手段50aから削除する。
For example,
実行部500は、当該指示に基づいて、最初に楽曲X1のカラオケ演奏のキーを1半音下げる処理を実行し、次にテンポを5%下げる処理を実行する。
Based on the instruction, the
或いは、複数のコマンドを記憶している場合、制御部600は、その一部のコマンドのみを実行するよう実行部500に指示してもよい。
Alternatively, when a plurality of commands are stored, the
たとえば、制御部600は、最新のコマンドのみを実行するよう実行部500に指示した後、記憶している全てのコマンドを削除することでもよい。
For example, the
上記例の場合、記憶手段50aには、コマンドC05、コマンドC02の順で記憶されている。ここで、トリガーワードを取得した場合、制御部600は、最新のコマンドC02のみを実行するよう実行部500に指示する。このように記憶している一部のコマンドの実行を指示する場合であっても、制御部600は、指示した後、記憶している全てのコマンドを記憶手段50aから削除する。
In the case of the above example, the command C05 and the command C02 are stored in the order of the storage means 50a. Here, when the trigger word is acquired, the
実行部500は、当該指示に基づいて、楽曲X1のカラオケ演奏のテンポを5%下げる処理のみを実行する。
Based on the instruction, the
==リモコン装置における処理について==
次に、図4A及び図4Bを参照して本実施形態に係るリモコン装置50の制御部600における処理について述べる。図4Aは、音声入力に基づいて楽曲の検索を行う際の制御部600における処理(第1の処理)を示すフローチャートである。図4Bは、音声入力に基づいてコマンドを実行する際の制御部600における処理(第2の処理)を示すフローチャートである。この例では、音声入力モードが実行されているとする。また、データ記憶部100は、複数のコマンド及び一のトリガーワードをそれぞれ異なるテキストデータと紐付けて記憶しているとする。
==About the processing in the remote controller==
Next, processing in the
(第1の処理)
音声処理部200は、集音手段50eから出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する(テキストデータの出力。ステップ10)。
(First processing)
The
制御部600は、音声処理部200が出力したテキストデータに基づいてトリガーワードを取得する。また、制御部600は、トリガーワードを取得した場合に計時を開始する(トリガーワードの取得及び計時の開始。ステップ11)。
The
トリガーワードを取得してから第1の所定時間が経過するまでに音声処理部200があるテキストデータを出力した場合(ステップ12でYの場合)、制御部600は、あるテキストデータを検索ワードとする楽曲の検索を検索部300に指示する。また、制御部600は、計時を終了し、タイマをリセットする(検索の指示及び計時の終了。ステップ13)。
If the
検索部300は、ステップ13の指示に基づいて楽曲の検索を行う(楽曲の検索。ステップ14)。
The
報知部400は、利用者に対し、ステップ14で得られた検索の結果を報知する(検索結果の報知。ステップ15)。
The
一方、トリガーワードを取得した後、第1の所定時間が経過するまでに音声処理部200があるテキストデータを出力しなかった場合(ステップ12でNの場合)、制御部600は、計時を終了してタイマをリセットし、以降の処理を行わない(計時の終了。ステップ16)。
On the other hand, if the
(第2の処理)
音声処理部200は、集音手段50eから出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する(テキストデータの出力。ステップ20)。
(Second processing)
The
制御部600は、コマンドに紐付けられたテキストデータが出力された際、当該テキストデータに紐付けられたコマンドを記憶手段50aに記憶する。また、制御部600は、コマンドを記憶した場合にタイマをリセットして計時を開始する(コマンドの記憶、タイマのリセット及び計時の開始。ステップ21)。
When the text data associated with the command is output, the
トリガーワードを取得し且つコマンドを記憶している場合(ステップ22でYの場合)、制御部600は、記憶しているコマンドの実行を実行部500に指示する(コマンドの実行を指示。ステップ23)。なお、実行部500は、ステップ23の指示に基づいてコマンドを実行する。
When the trigger word is acquired and the command is stored (Y in step 22), the
その後、制御部600は、記憶しているコマンドを削除する。また、制御部600は、計時を終了する(コマンドの削除及び計時の終了。ステップ24)。一方、計時を開始してから第2の所定時間が経過した場合(ステップ25でYの場合)、制御部600は、記憶しているコマンドを削除し、計時を終了する(コマンドの削除及び計時の終了。ステップ24)。
Thereafter,
以上から明らかなように、本実施形態に係るリモコン装置50は、カラオケ歌唱を行う際に利用する。リモコン装置50は、カラオケ歌唱の際に実行可能な処理に対応する複数のコマンド、及びコマンドの実行または楽曲の検索を指示するためのトリガーワードをそれぞれ異なるテキストデータと紐付けて記憶するデータ記憶部100と、集音手段50eから出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する音声処理部200と、検索ワードに基づいて楽曲の検索を行う検索部300と、利用者に対し、検索の結果を報知する報知部400と、コマンドを実行する実行部500と、音声処理部200が出力したテキストデータに基づいてトリガーワードを取得する制御部600であって、トリガーワードを取得した後、第1の所定時間が経過するまでに音声処理部200があるテキストデータを出力した場合、当該あるテキストデータを検索ワードとする楽曲の検索を検索部300に指示する第1の処理、及びコマンドに紐付けられたテキストデータが出力された際、当該テキストデータに紐付けられたコマンドを記憶手段50aに記憶し、トリガーワードを取得し且つ記憶手段50aにコマンドを記憶している場合、記憶しているコマンドの実行を実行部500に指示した後、記憶しているコマンドを削除する一方、最新のコマンドの記憶から第2の所定時間が経過した場合、記憶しているコマンドを削除する第2の処理を行う制御部600と、を有する。
As is clear from the above, the
このようなリモコン装置50によれば、トリガーワードの取得を契機として音声入力による楽曲の検索が可能となる。よって、検索ワードを誤認識する可能性が低くなる。また、このようなリモコン装置50によれば、コマンドを音声入力した場合に、トリガーワードの取得を契機としてコマンドが実行される。よって、コマンドの誤認識による意図しないコマンドの実行がなされる可能性が低くなる。すなわち、本実施形態に係るリモコン装置によれば、カラオケ歌唱の場において音声入力を利用する際の誤認識を低減することができる。
According to the
また、制御部600は、複数のコマンドを記憶している場合、記憶した順に全てのコマンドを実行するよう実行部500に指示した後、記憶している全てのコマンドを削除する。このような構成によれば、利用者が希望する順番で全てのコマンドを実行することができる。また、コマンドの実行を指示した後、記憶している全てのコマンドが削除されるため、次の音声入力が可能となる。
Also, when a plurality of commands are stored, the
一方、制御部600は、複数のコマンドを記憶している場合、最新のコマンドのみを実行するよう実行部500に指示した後、記憶している全てのコマンドを削除してもよい。このような構成によれば、利用者が希望するコマンドの一部のみを実行することができる。また、コマンドの実行を指示した後、記憶している全てのコマンドが削除されるため、次の音声入力が可能となる。
On the other hand, when a plurality of commands are stored, the
<その他>
上記実施形態は、カラオケ用入力装置としてリモコン装置50を例に説明した。一方、カラオケ装置K自体がカラオケ用リモコン装置として機能してもよい。この場合、カラオケ本体10が少なくとも記憶手段50a(データ記憶部100)、通信手段50b、入力手段50d、制御手段50f(音声処理部200、検索部300、報知部400、実行部500、制御部600)を備える。また表示装置30が表示手段50cとして機能し、リモコン装置50が入力手段50dとして機能し、マイク40が集音手段50eとして機能する。
<Others>
In the above embodiment, the
上記実施形態の例において、データ記憶部100に記憶されている複数のコマンドに優先度が設定されていてもよい。この場合、データ記憶部100は、複数のコマンドを実行する場合の優先度を示す優先情報をコマンド毎に記憶している。また、制御部600は、複数のコマンドを記憶している場合、優先情報に基づいてコマンドの実行を実行部500に指示した後、記憶している全てのコマンドを削除する。たとえば、実施形態の例において、記憶手段50aに記憶されているコマンドC05の優先度が「高」、コマンドC02の優先度が「中」と設定されているとする。この場合、制御部600は、優先度の高いコマンドC05のみを実行するよう、或いは優先度の高いコマンドC05から先に実行するよう実行部500に指示することができる。
In the example of the embodiment described above, a plurality of commands stored in the
また、利用者によっては、一度音声入力したコマンドをキャンセルしたいと考えることもありうる。そこで、データ記憶部100は、コマンドの入力をキャンセルするキャンセルワードをテキストデータと紐付けて記憶してもよい。この場合、制御部600は、音声処理部200が出力したテキストデータに基づいてキャンセルワードを取得することができる。また、制御部600は、キャンセルワードを取得した場合、記憶しているコマンドの実行を実行部500に指示することなく、記憶している全てのコマンドを削除する。
Also, some users may wish to cancel a command that has been voice-inputted once. Therefore, the
たとえば、実施形態の例において、記憶手段50aにコマンドC05及びコマンドC02が記憶されているとする。また、テキストデータ「モトイ」がキャンセルワードと紐付けられているとする。 For example, in the example of the embodiment, it is assumed that command C05 and command C02 are stored in storage means 50a. It is also assumed that the text data "Motoi" is associated with the cancel word.
利用者は、音声入力したコマンドをキャンセルするために、キャンセルワード「もとい」を発声する。音声処理部200は、テキストデータ「モトイ」を出力する。制御部600は、出力されたテキストデータに対応するデータがデータ記憶部100に記憶されているかどうかを確認する。上述の通り、テキストデータ「モトイ」はキャンセルワードと紐付けられている。よって、制御部600はキャンセルワードを取得する。制御部600は、記憶手段50aに記憶されているコマンドC05及びコマンドC02の実行を実行部500に指示することなく、記憶手段50aから削除する。
The user utters the cancel word "motoi" in order to cancel the voice-inputted command. The
また、上記実施形態における第1の処理及び第2の処理を連続して行ってもよい。すなわち、制御部600は、記憶手段50aに記憶しているコマンドの実行を実行部500に指示した後、更に、第1の所定時間が経過するまでに音声処理部200がテキストデータを出力した場合、当該テキストデータを検索ワードとした楽曲検索を検索部300に指示してもよい。
Also, the first process and the second process in the above embodiment may be performed continuously. That is, after the
逆に、制御部600は、記憶手段50aに記憶しているコマンドの実行を実行部500に指示した後、新たなトリガーワードの音声入力がなされるまでは、仮に第1の所定時間が経過するまでに音声処理部200がテキストデータを出力した場合であっても、当該テキストデータを検索ワードとした楽曲検索を検索部300に指示しないことでもよい。
Conversely, after the
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 The above embodiments are presented as examples and are not intended to limit the scope of the invention. The above configurations can be implemented in combination as appropriate, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. The above-described embodiments and modifications thereof are included in the invention described in the claims and their equivalents, as well as being included in the scope and gist of the invention.
50 リモコン装置
100 データ記憶部
200 音声処理部
300 検索部
400 報知部
500 実行部
600 制御部
50
Claims (5)
カラオケ歌唱の際に実行可能な処理に対応する複数のコマンド、及び前記コマンドの実行または楽曲の検索を指示するためのトリガーワードをそれぞれ異なるテキストデータと紐付けて記憶するデータ記憶部と、
集音手段から出力された利用者の音声信号を音声認識処理し、テキストデータとして出力する音声処理部と、
検索ワードに基づいて楽曲の検索を行う検索部と、
前記利用者に対し、検索の結果を報知する報知部と、
コマンドを実行する実行部と、
前記音声処理部が出力したテキストデータに基づいて前記トリガーワードを取得する制御部であって、前記トリガーワードを取得した後、第1の所定時間が経過するまでに前記音声処理部があるテキストデータを出力した場合、当該あるテキストデータを前記検索ワードとする楽曲の検索を前記検索部に指示する第1の処理、及び前記コマンドに紐付けられたテキストデータが出力された際、当該テキストデータに紐付けられたコマンドを記憶手段に記憶し、前記トリガーワードを取得し且つ前記記憶手段に前記コマンドを記憶している場合、記憶している前記コマンドの実行を前記実行部に指示した後、記憶している前記コマンドを削除する一方、最新のコマンドの記憶から第2の所定時間が経過した場合、記憶している前記コマンドを削除する第2の処理を行う制御部と、
を有するカラオケ用入力装置。 A karaoke input device used when performing karaoke singing,
a data storage unit that stores a plurality of commands corresponding to processes that can be executed during karaoke singing, and trigger words for instructing the execution of the commands or the search for music, respectively, in association with different text data;
a speech processing unit that performs speech recognition processing on a user's speech signal output from the sound collecting means and outputs it as text data;
a search unit that searches for songs based on search words;
a notification unit that notifies the user of search results;
an execution unit that executes a command;
A control unit that acquires the trigger word based on the text data output by the voice processing unit, the text data having the voice processing unit before a first predetermined time elapses after acquiring the trigger word. is output, a first process of instructing the search unit to search for songs using the certain text data as the search word, and when text data linked to the command is output, the text data When the linked command is stored in the storage means, the trigger word is acquired, and the command is stored in the storage means, after instructing the execution unit to execute the stored command, a control unit that deletes the stored command and performs a second process of deleting the stored command when a second predetermined time has elapsed since the latest command was stored;
Karaoke input device having
前記制御部は、複数のコマンドを記憶している場合、前記優先情報に基づいてコマンドの実行を前記実行部に指示した後、記憶している全てのコマンドを削除することを特徴とする請求項1記載のカラオケ用入力装置。 The data storage unit stores priority information indicating a priority when executing a plurality of commands for each command,
3. The control unit, when storing a plurality of commands, deletes all the stored commands after instructing the execution unit to execute the commands based on the priority information. 1. The input device for karaoke according to 1.
前記制御部は、
前記音声処理部が出力したテキストデータに基づいてキャンセルワードを取得した場合、記憶している前記コマンドの実行を前記実行部に指示することなく、記憶している全てのコマンドを削除することを特徴とする請求項1から4のいずれか一つに記載のカラオケ用入力装置。 the data storage unit stores a cancel word for canceling the input of the command in association with text data;
The control unit
When a cancel word is acquired based on the text data output by the speech processing unit, all stored commands are deleted without instructing the execution unit to execute the stored commands. The input device for karaoke according to any one of claims 1 to 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019119502A JP7240271B2 (en) | 2019-06-27 | 2019-06-27 | Karaoke input device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019119502A JP7240271B2 (en) | 2019-06-27 | 2019-06-27 | Karaoke input device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005027A JP2021005027A (en) | 2021-01-14 |
JP7240271B2 true JP7240271B2 (en) | 2023-03-15 |
Family
ID=74099336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019119502A Active JP7240271B2 (en) | 2019-06-27 | 2019-06-27 | Karaoke input device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7240271B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015052744A (en) | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | Information processor, control method and program |
-
2019
- 2019-06-27 JP JP2019119502A patent/JP7240271B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015052744A (en) | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | Information processor, control method and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021005027A (en) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10354627B2 (en) | Singing voice edit assistant method and singing voice edit assistant device | |
JP2006195385A (en) | Device and program for music reproduction | |
JP6280312B2 (en) | Minutes recording device, minutes recording method and program | |
KR20080023199A (en) | Audio reproduction apparatus and method and storage medium | |
CN105405337B (en) | The method and system that a kind of supplementary music is played | |
JP7240271B2 (en) | Karaoke input device | |
JP7041534B2 (en) | Karaoke equipment | |
JP5819147B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP2012008375A (en) | Voice recording apparatus, data processing method thereof, and program | |
JP7335115B2 (en) | Karaoke input device | |
KR101301148B1 (en) | Song selection method using voice recognition | |
JP7312639B2 (en) | Karaoke input device | |
JP2006276560A (en) | Music playback device and music playback method | |
JP6944365B2 (en) | Karaoke equipment | |
JP7219541B2 (en) | karaoke device | |
JP6841879B2 (en) | Karaoke equipment | |
JP6859204B2 (en) | Karaoke song recommendation system | |
JP2010008821A (en) | Music piece editing assist device and program | |
JP4534926B2 (en) | Image display apparatus and program | |
JP6340303B2 (en) | Karaoke scoring system for scoring humming songs | |
JP2005077678A (en) | Text and voice synchronizing device and text and voice synchronization processing program | |
JP6864571B2 (en) | Lyrics telop color change data creation device | |
JP5439994B2 (en) | Data collection / delivery system, online karaoke system | |
JP6735190B2 (en) | Karaoke system | |
JP4544258B2 (en) | Acoustic conversion device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220401 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7240271 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |