JP7335175B2 - karaoke device - Google Patents

karaoke device Download PDF

Info

Publication number
JP7335175B2
JP7335175B2 JP2020011938A JP2020011938A JP7335175B2 JP 7335175 B2 JP7335175 B2 JP 7335175B2 JP 2020011938 A JP2020011938 A JP 2020011938A JP 2020011938 A JP2020011938 A JP 2020011938A JP 7335175 B2 JP7335175 B2 JP 7335175B2
Authority
JP
Japan
Prior art keywords
image
music
karaoke
keyword
food
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020011938A
Other languages
Japanese (ja)
Other versions
JP2021117410A (en
Inventor
政之 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2020011938A priority Critical patent/JP7335175B2/en
Publication of JP2021117410A publication Critical patent/JP2021117410A/en
Application granted granted Critical
Publication of JP7335175B2 publication Critical patent/JP7335175B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明はカラオケ装置に関する。 The present invention relates to a karaoke machine.

DVDやBDに収録されたお気に入りの映像作品(映画やドキュメンタリー等)を再生装置(たとえば、DVD/BDプレーヤ)で再生し、BGVとしてテレビ画面に表示させながら、携帯端末等で映像作品の雰囲気にあった楽曲を再生するという楽しみ方が普及している。 Play your favorite video works (movies, documentaries, etc.) recorded on DVDs and BDs with a playback device (for example, a DVD/BD player) and display them on the TV screen as BGV, while enjoying the atmosphere of the video work with a mobile terminal or the like. The way of enjoyment of playing back a certain song has become widespread.

また、近年、カラオケ装置と接続された再生装置が備えられたカラオケルームが増加している。カラオケルームの利用者は、映像作品の映像を背景映像としてカラオケ装置の表示装置に表示させつつ、映像作品の雰囲気に合いそうな楽曲を予約してカラオケ歌唱を楽しむことができる。 Also, in recent years, the number of karaoke rooms equipped with playback devices connected to karaoke machines is increasing. A user of the karaoke room can enjoy karaoke singing by reserving music that seems to match the atmosphere of the video work while displaying the video of the video work as a background video on the display device of the karaoke device.

ここで、特許文献1には、映像データから抽出したキーワードに基づいて楽曲を選択する技術が開示されている。 Here, Patent Literature 1 discloses a technique for selecting music based on keywords extracted from video data.

特開2003-302971号公報Japanese Patent Application Laid-Open No. 2003-302971

ところで、一般的な映像作品は、イントロダクションやクライマックス等、様々な場面で構成されている。そのため、特許文献1の技術を用いて映像作品全体の雰囲気に合った楽曲を選んだとしても、場面によっては適していない可能性もあり得る。 By the way, a typical video work consists of various scenes such as an introduction and a climax. Therefore, even if a piece of music suitable for the atmosphere of the entire video work is selected using the technique disclosed in Patent Document 1, it may not be suitable depending on the scene.

本発明の目的は、映像作品の各場面に適した楽曲をカラオケ演奏可能なカラオケ装置を提供することにある。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a karaoke machine capable of playing karaoke songs suitable for each scene of a video work.

上記目的を達成するための一の発明は、メディアに収録された映像作品のデータを再生して映像信号を出力し、表示手段に映像を表示させる再生部と、映像作品を構成する複数の画像のうち所定数の画像それぞれについて、画像の内容を示す画像キーワードを抽出し、当該映像作品において当該画像の再生を開始する再生時刻と紐付ける第1の抽出部と、利用者の歌唱履歴に含まれる所定数の楽曲について、楽曲毎の内容を示す楽曲キーワードを抽出し、当該楽曲を識別するための楽曲識別情報と紐付ける第2の抽出部と、抽出された画像キーワードそれぞれに対し、抽出された複数の楽曲キーワードの中から関連する楽曲キーワードを決定し、決定された前記楽曲キーワードに紐付けられている楽曲識別情報と、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける処理部と、前記映像作品の再生中において、前記所定数の画像の再生時刻が到来した場合、当該再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいて、カラオケ演奏を行う音響制御部と、を有するカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
One invention for achieving the above object is a reproduction unit that reproduces data of a video work recorded on a medium, outputs a video signal, and displays the video on display means, and a plurality of images that constitute the video work. For each of the predetermined number of images, a first extraction unit that extracts an image keyword indicating the content of the image and associates it with the playback time at which the image starts to be played in the video work, and the singing history of the user. A second extraction unit that extracts a music keyword indicating the content of each song for a predetermined number of songs that are stored, and associates the second extraction unit with song identification information for identifying the song, and for each of the extracted image keywords, the extracted image keyword A related music keyword is determined from among the plurality of music keywords obtained, music identification information linked to the determined music keyword, and image keywords corresponding to the determined music keyword. and a processing unit that associates the playback time with the music data of the song indicated by the song identification information linked to the playback time when the playback time of the predetermined number of images arrives during playback of the video work. A karaoke device having a sound control unit for performing karaoke performance based on.
Other features of the present invention will be clarified by the description of the specification and drawings described later.

本発明によれば、映像作品の各場面に適した楽曲をカラオケ演奏できる。 According to the present invention, it is possible to perform karaoke with songs suitable for each scene of a video work.

第1実施形態に係るカラオケ装置を示す図である。It is a figure which shows the karaoke apparatus which concerns on 1st Embodiment. 第1実施形態に係るカラオケ本体を示す図である。It is a figure which shows the karaoke main body which concerns on 1st Embodiment. 第1実施形態に係る画像キーワードと再生時刻とを紐付けたテーブルである。4 is a table that links image keywords and playback times according to the first embodiment. 第1実施形態に係る楽曲キーワードと楽曲識別情報とを紐付けたテーブルである。4 is a table in which music keywords and music identification information are associated with each other according to the first embodiment. 第1実施形態に係る画像キーワードに対して関連性のある音楽キーワードを示すテーブルである。4 is a table showing music keywords related to image keywords according to the first embodiment; 第1実施形態に係る楽曲識別情報と再生時刻とを紐付けたテーブルである。4 is a table in which music identification information and playback times are associated with each other according to the first embodiment. 第1実施形態に係るカラオケ装置の処理を示すフローチャートである。It is a flow chart which shows processing of a karaoke device concerning a 1st embodiment. 第2実施形態に係るカラオケ本体を示す図である。It is a figure which shows the karaoke main body which concerns on 2nd Embodiment. 第2実施形態に係るカラオケ装置の処理を示すフローチャートである。It is a flow chart which shows processing of a karaoke device concerning a 2nd embodiment. 第2実施形態に係るカラオケ装置の処理を示すフローチャートである。It is a flow chart which shows processing of a karaoke device concerning a 2nd embodiment.

<第1実施形態>
図1~図7を参照して、第1実施形態に係るカラオケ装置について説明する。
<First embodiment>
A karaoke apparatus according to the first embodiment will be described with reference to FIGS. 1 to 7. FIG.

==カラオケ装置==
カラオケ装置は、カラオケ演奏、及び利用者がカラオケ歌唱を行うための装置である。カラオケ装置は、カラオケ店舗のカラオケルームに設置されている。
==Karaoke Device==
A karaoke device is a device for performing karaoke and for users to sing karaoke. A karaoke device is installed in a karaoke room of a karaoke store.

図1に示すように、本実施形態に係るカラオケ装置Kは、カラオケ本体10、スピーカ20、表示装置30、マイク40、及びリモコン装置50を備える。 As shown in FIG. 1, the karaoke machine K according to this embodiment includes a karaoke main body 10, a speaker 20, a display device 30, a microphone 40, and a remote control device 50. As shown in FIG.

スピーカ20は各種音声を放音するための構成である。表示装置30はカラオケ本体10からの信号に基づいて映像や画像を画面に表示するための構成である。表示装置30は、「表示手段」の一例である。マイク40は利用者の歌唱音声をアナログの信号に変換してカラオケ本体10に入力するための構成である。リモコン装置50は、カラオケ本体10に対する各種操作をおこなうための装置である。利用者は、リモコン装置50を用いてカラオケ歌唱を希望する楽曲の選曲等を行うことができる。リモコン装置50の表示画面には各種操作の指示入力を行うためのアイコン等が表示される。 The speaker 20 is configured to emit various sounds. The display device 30 is configured to display video and images on the screen based on the signal from the karaoke main body 10 . The display device 30 is an example of "display means". The microphone 40 is configured to convert the user's singing voice into an analog signal and input it to the karaoke main body 10 . The remote control device 50 is a device for performing various operations on the karaoke main body 10 . The user can use the remote control device 50 to select a desired song for karaoke singing. Icons and the like for inputting instructions for various operations are displayed on the display screen of the remote control device 50 .

カラオケ本体10は、楽曲のカラオケ演奏制御、歌詞や背景映像等の表示制御、マイク40を通じて入力された信号の処理といった、カラオケ歌唱に関する各種の制御を行う。図1に示すように、カラオケ本体10は、制御部11、通信部12、記憶部13、音響処理部14、表示処理部15及び操作部16を備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。 The karaoke main body 10 performs various controls related to karaoke singing, such as karaoke performance control of music, display control of lyrics and background images, and processing of signals input through the microphone 40 . As shown in FIG. 1, the karaoke main body 10 includes a control section 11, a communication section 12, a storage section 13, a sound processing section 14, a display processing section 15 and an operation section 16. FIG. Each configuration is connected to bus B via an interface (not shown).

制御部11は、CPU11aおよびメモリ11bを備える。CPU11aは、メモリ11bに記憶された動作プログラムを実行することにより各種の制御機能を実現する。メモリ11bは、CPU11aに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶装置である。 The control unit 11 includes a CPU 11a and a memory 11b. The CPU 11a realizes various control functions by executing operation programs stored in the memory 11b. The memory 11b is a storage device that stores programs to be executed by the CPU 11a and temporarily stores various types of information during execution of the programs.

通信部12は、ルーター(図示なし)を介してカラオケ本体10を通信回線に接続するためのインターフェースを提供する。 The communication unit 12 provides an interface for connecting the karaoke main body 10 to a communication line via a router (not shown).

記憶部13は、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。 The storage unit 13 is a large-capacity storage device that stores various data, such as a hard disk drive.

記憶部13は、楽曲のカラオケ演奏を行うための楽曲データと、楽曲識別情報とを紐付けて記憶している。楽曲データは、伴奏データ、リファレンスデータ等を含む。伴奏データは、カラオケ演奏音の元となるデータである。リファレンスデータは、利用者によるカラオケ歌唱を採点するためのデータである。楽曲識別情報は、たとえば楽曲IDのような、楽曲毎に設定された固有の情報である。 The storage unit 13 associates and stores music data for karaoke performance of music and music identification information. The music data includes accompaniment data, reference data, and the like. Accompaniment data is data that is the source of karaoke performance sounds. The reference data is data for scoring karaoke singing by the user. The song identification information is unique information set for each song, such as a song ID.

また、記憶部13は、楽曲のカラオケ演奏に合わせて歌詞テロップを表示装置30等に表示させるための歌詞テロップデータ、カラオケ演奏時に表示装置30等に表示される背景画像等の背景画像データ等を楽曲毎に記憶する。 In addition, the storage unit 13 stores lyric telop data for displaying lyric telops on the display device 30 or the like in time with the karaoke performance of the music, background image data such as background images displayed on the display device 30 or the like during the karaoke performance, and the like. Store each song.

音響処理部14は、制御部11の制御に基づき、楽曲のカラオケ演奏に関する制御、及びマイク40を通じて入力された歌唱音声に基づく信号の処理を行う。表示処理部15は、制御部11の制御に基づき、表示装置30やリモコン装置50における各種表示に関する処理を行う。たとえば、表示処理部15は、楽曲のカラオケ演奏時における背景映像に歌詞テロップや各種アイコンが重ねられた映像を表示装置30に表示させる制御を行う。或いは、表示処理部15は、リモコン装置50の表示画面に操作入力用の各種アイコンを表示させる。操作部16は、パネルスイッチおよびリモコン受信回路などからなり、利用者によるカラオケ装置1のパネルスイッチあるいはリモコン装置50の操作に応じて選曲信号、演奏中止信号などの操作信号を制御部11に対して出力する。制御部11は、操作部16からの操作信号を検出し、対応する処理を実行する。 Under the control of the control unit 11 , the sound processing unit 14 performs control related to karaoke performance of music and processes signals based on singing voices input through the microphone 40 . The display processing unit 15 performs processing related to various displays on the display device 30 and the remote control device 50 under the control of the control unit 11 . For example, the display processing unit 15 controls the display device 30 to display an image in which lyric telops and various icons are superimposed on a background image during a karaoke performance of a song. Alternatively, the display processing unit 15 causes the display screen of the remote control device 50 to display various icons for operation input. The operation unit 16 includes a panel switch, a remote control receiving circuit, and the like, and transmits operation signals such as a music selection signal and a performance stop signal to the control unit 11 according to the operation of the panel switch of the karaoke apparatus 1 or the remote control device 50 by the user. Output. The control unit 11 detects an operation signal from the operation unit 16 and executes corresponding processing.

==カラオケ本体==
図2に示すように、本実施形態に係るカラオケ本体10は、再生部100、第1の抽出部200、第2の抽出部300、処理部400、及び音響制御部500を備える。再生部100、第1の抽出部200、第2の抽出部300、決定部400、及び音響制御部500は、CPU11aがメモリ11bに記憶されるプログラムを実行することにより実現される。
==Karaoke body==
As shown in FIG. 2, the karaoke main body 10 according to the present embodiment includes a reproduction section 100, a first extraction section 200, a second extraction section 300, a processing section 400, and a sound control section 500. The reproduction unit 100, the first extraction unit 200, the second extraction unit 300, the determination unit 400, and the sound control unit 500 are implemented by the CPU 11a executing a program stored in the memory 11b.

[再生部]
再生部100は、メディアに収録された映像作品のデータを再生して映像信号を出力し、表示手段に映像を表示させる。
[Playback part]
The reproduction unit 100 reproduces the data of the video work recorded on the medium, outputs a video signal, and causes the display means to display the video.

メディアは、映像作品を収録可能なDVDやBDである。映像作品のデータは、少なくとも映像データにより構成されている。 Media are DVDs and BDs on which video works can be recorded. The data of the video work is composed of at least video data.

映像データは、カラオケ装置Kの表示装置30で表示される映像に対応するデータである。映像データは、複数の静止画像データから構成される。 The video data is data corresponding to the video displayed on the display device 30 of the karaoke machine K. FIG. Video data is composed of a plurality of still image data.

たとえば、利用者Uは、カラオケルームに入室し、映像作品Mのメディアをカラオケ装置Kにセットする。その後、利用者Uは、リモコン装置50を介して映像作品Mの再生を指示する。 For example, the user U enters a karaoke room and sets the media of the video work M on the karaoke machine K. After that, the user U instructs reproduction of the video work M via the remote control device 50 .

再生部100は、当該指示に基づいて、メディアに収録された映像作品Mのデータを再生して映像信号を出力し、表示装置30に複数の画像を連続して表示させることにより映像を表示させる。複数の画像は、複数の静止画像データに基づく画像である。各画像は、映像作品において再生を開始する再生時刻(タイムコード)と対応付けられている。 Based on the instruction, the reproducing unit 100 reproduces the data of the video work M recorded on the medium, outputs the video signal, and causes the display device 30 to display the video by continuously displaying a plurality of images. . The multiple images are images based on multiple still image data. Each image is associated with a playback time (time code) at which playback is started in the video work.

なお、映像作品にはチャプターが設定されているものもある。この場合、チャプター毎のサムネイル画像が設定されている。サムネイル画像は、チャプター内で再生される映像を構成する複数の画像のうちの一つに対応する。 Some video works have chapters. In this case, a thumbnail image is set for each chapter. A thumbnail image corresponds to one of a plurality of images that constitute a video played within a chapter.

以下の説明において、映像作品Mは、10のチャプター(1つのチャプター当たりの再生時間が10分。合計60分)から構成されており、チャプター毎のサムネイル画像として、サムネイル画像TN01~サムネイル画像TN10が設定されているとする。また、各サムネイル画像は、再生時刻T01~再生時刻T10の各画像に対応しているとする。 In the following description, the video work M is composed of 10 chapters (reproduction time per chapter is 10 minutes, total 60 minutes), and thumbnail images TN01 to TN10 are thumbnail images for each chapter. Assume it is set. It is also assumed that each thumbnail image corresponds to each image at playback time T01 to playback time T10.

[第1の抽出部]
第1の抽出部200は、所定数の画像それぞれについて画像キーワードを抽出し、当該映像作品において当該画像の再生を開始する再生時刻と紐付ける。
[First extraction part]
The first extraction unit 200 extracts an image keyword for each of a predetermined number of images, and associates it with the reproduction time at which reproduction of the image is started in the video work.

所定数の画像は、映像作品を構成する複数の画像のうちの一部である。所定数の画像を特定する条件は予め設定されている。たとえば、所定数の画像は、サムネイル画像とすることができる。映像作品Mの場合、サムネイル画像TN01~サムネイル画像TN10が所定の画像に相当する。 The predetermined number of images are part of the plurality of images that make up the video work. A condition for specifying a predetermined number of images is set in advance. For example, the predetermined number of images can be thumbnail images. In the case of video work M, thumbnail images TN01 to TN10 correspond to predetermined images.

或いは、映像作品に含まれる複数の画像を所定の時間間隔でサンプリングしたものを所定数の画像としてもよい。たとえば、再生時間が60分の映像作品Mを6分間隔でサンプリングする場合、10(再生開始から2分後、8分後、14分後、20分後、26分後、32分後、38分後、44分後、50分後、56分後)の画像が、所定数の画像となる。 Alternatively, the predetermined number of images may be obtained by sampling a plurality of images included in the video work at predetermined time intervals. For example, when sampling a video work M with a playback time of 60 minutes at intervals of 6 minutes, 10 (after 2 minutes, 8 minutes, 14 minutes, 20 minutes, 26 minutes, 32 minutes, 38 minutes after the start of playback) minutes, 44 minutes, 50 minutes, and 56 minutes) are the predetermined number of images.

画像キーワードは、画像の内容(画像に含まれる物体名、画像の示す雰囲気等)を示すものである。 The image keyword indicates the content of the image (object name included in the image, atmosphere indicated by the image, etc.).

利用者Uにより映像作品Mのメディアがカラオケ装置Kにセットされた場合、第1の抽出部200は、映像作品Mに含まれる複数の画像からサムネイル画像TN01~サムネイル画像TN10を取得する。 When the media of the video work M is set in the karaoke machine K by the user U, the first extraction unit 200 acquires the thumbnail images TN01 to TN10 from the plurality of images included in the video work M.

第1の抽出部200は、取得した各画像を分析し、画像キーワードを抽出する。 The first extraction unit 200 analyzes each acquired image and extracts image keywords.

画像キーワードの抽出は公知の手法を用いることができる。たとえば、第1の抽出部200は、Google Cloud Vision APIを用いて画像データの解析を行い、画像に含まれる物体、ラベル、ランドマーク、ウェブエンティティ等に応じた少なくとも一のキーワードを抽出することができる。 A known method can be used to extract image keywords. For example, the first extraction unit 200 can analyze image data using Google Cloud Vision API and extract at least one keyword corresponding to an object, label, landmark, web entity, etc. included in the image. can.

第1の抽出部200は、抽出した画像キーワードを再生時刻と紐付ける。たとえば、第1の抽出部200は、サムネイル画像TN01~サムネイル画像TN10を分析し、それぞれのサムネイル画像について一の画像キーワードIK01~画像キーワードIK10を抽出したとする。第1の抽出部200は、画像キーワードIK01~画像キーワードIK10を、サムネイル画像TN01~サムネイル画像TN10それぞれに対応する画像の再生時刻T01~再生時刻T10と紐付ける(図3参照)。 The first extraction unit 200 associates the extracted image keyword with the playback time. For example, assume that the first extraction unit 200 analyzes the thumbnail images TN01 to TN10 and extracts one image keyword IK01 to IK10 for each thumbnail image. The first extraction unit 200 associates the image keywords IK01 to IK10 with the playback times T01 to T10 of the images corresponding to the thumbnail images TN01 to TN10 (see FIG. 3).

第1の抽出部200は、紐付けた画像キーワード及び再生時刻の情報を処理部400に出力する。 The first extraction unit 200 outputs information on the associated image keyword and reproduction time to the processing unit 400 .

[第2の抽出部]
第2の抽出部300は、利用者の歌唱履歴に含まれる所定数の楽曲について、楽曲キーワードを抽出し、当該楽曲を識別するための楽曲識別情報と紐付ける。
[Second extraction part]
The second extraction unit 300 extracts song keywords from a predetermined number of songs included in the user's singing history, and associates them with song identification information for identifying the songs.

歌唱履歴は、ある利用者が過去にカラオケ歌唱を行った楽曲の楽曲名、楽曲ID、歌唱日時、採点結果等を記録したものである。歌唱履歴は、たとえば、サーバ装置(図示なし)に記憶されている。カラオケ装置Kは、ある利用者がログインの操作を行った場合、サーバ装置から当該ある利用者の歌唱履歴を取得する。なお、カラオケ装置Kが歌唱履歴を予め記憶しておくことでもよい。 The singing history is a record of song titles, song IDs, singing dates and times, scoring results, etc. of songs sung by a certain user in the past. The singing history is stored, for example, in a server device (not shown). When a certain user performs a login operation, the karaoke apparatus K acquires the singing history of the certain user from the server device. It should be noted that the karaoke apparatus K may store the singing history in advance.

所定数の楽曲は、歌唱履歴に含まれる全ての楽曲のうちの一部である。所定数の楽曲を特定する条件は予め設定されている。たとえば、所定数の楽曲は、歌唱回数が多い順に50曲、採点結果が良い順に40曲、或いはランダムに30曲である。楽曲キーワードは、楽曲毎の内容(歌詞に含まれる名詞、歌詞全体の雰囲気等)を示すものである。 The predetermined number of songs is a part of all songs included in the singing history. A condition for specifying a predetermined number of songs is set in advance. For example, the predetermined number of songs is 50 songs in descending order of singing frequency, 40 songs in descending order of scoring results, or 30 songs at random. The song keyword indicates the content of each song (nouns included in the lyrics, atmosphere of the lyrics as a whole, etc.).

たとえば、利用者Uの歌唱履歴には楽曲が100曲含まれているとする。また歌唱回数が多い順に50曲という条件が設定されているとする。 For example, it is assumed that user U's singing history includes 100 songs. It is also assumed that a condition of 50 songs is set in descending order of the number of songs sung.

この場合、第2の抽出部300は、100曲の中から歌唱回数が多い50曲(楽曲S***01~楽曲S***50)を選択する。 In this case, the second extraction unit 300 selects 50 songs (songs S***01 to S***50) that have been sung many times from among the 100 songs.

第2の抽出部300は、選択した楽曲それぞれについて、楽曲キーワードを抽出する。 The second extraction unit 300 extracts music keywords for each of the selected music.

楽曲キーワードの抽出は公知の手法を用いることができる。たとえば、第2の抽出部300は、AI学習機能を利用し、正解データ及び不正解データに含まれる歌詞データの各々から、少なくとも一の楽曲キーワードを抽出することができる(詳細は特開2018-025949号公報を参照)。 A known technique can be used for extracting music keywords. For example, the second extraction unit 300 can use the AI learning function to extract at least one song keyword from each of the lyric data included in the correct answer data and the incorrect answer data (see Japanese Laid-Open Patent Publication No. 2018-2018 for details). 025949).

第2の抽出部300は、抽出した楽曲キーワードを楽曲IDと紐付ける。たとえば、第2の抽出部300は、楽曲S***01~楽曲S***50を分析し、それぞれの楽曲について一の楽曲キーワードSK01~楽曲キーワードSK50を抽出したとする。第2の抽出部300は、楽曲キーワードSK01~楽曲キーワードSK50を、楽曲S***01~楽曲S***50それぞれの楽曲IDと紐付ける(図4参照)。 The second extraction unit 300 associates the extracted music keyword with the music ID. For example, assume that the second extraction unit 300 analyzes songs S***01 to S***50 and extracts one song keyword SK01 to song keyword SK50 for each song. The second extraction unit 300 associates the music keywords SK01 to SK50 with the music IDs of the music S***01 to S***50 (see FIG. 4).

第2の抽出部300は、紐付けた楽曲キーワード及び楽曲IDの情報を処理部400に出力する。 The second extraction unit 300 outputs information on the associated music keyword and music ID to the processing unit 400 .

[処理部]
処理部400は、抽出された画像キーワードそれぞれに対し、抽出された複数の楽曲キーワードの中から関連する楽曲キーワードを決定し、決定された楽曲キーワードに紐付けられている楽曲識別情報と、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける。
[Processing part]
For each of the extracted image keywords, the processing unit 400 determines a related music keyword from among the plurality of extracted music keywords, and collects music identification information linked to the determined music keyword and the determined music keyword. The playback time linked to the image keyword corresponding to the music keyword thus obtained is linked.

具体的に、処理部400は、第1の抽出部200から出力された画像キーワードそれぞれと、第2の抽出部300から出力された楽曲キーワードとを比較し、各画像キーワードと、当該画像キーワードと関連する楽曲キーワードを決定する。 Specifically, the processing unit 400 compares each image keyword output from the first extraction unit 200 with the music keyword output from the second extraction unit 300, and compares each image keyword with the image keyword. Determine relevant song keywords.

関連する楽曲キーワードの決定は、公知の手法を用いることができる。たとえば、処理部400は、画像キーワードと楽曲キーワードとを対比し、一の画像キーワードと完全一致または部分一致する楽曲キーワードを「関連する楽曲キーワード」として決定する。或いは、処理部400は、一の画像キーワードを抽出された複数の楽曲キーワードそれぞれと比較し、キーワード間の関連性をスコア化する。そして、処理部400は、最もスコアの高い楽曲キーワードを、「関連する楽曲キーワード」として決定する。関連性のスコア化は、たとえば、コンテンツから抽出されたキーワードと画像に付与されたタグとの関連度を算出する技術(特開2011-164865号公報参照)等、AI学習機能を用いる公知の技術を利用することができる。 A known method can be used to determine related music keywords. For example, the processing unit 400 compares image keywords and music keywords, and determines music keywords that completely or partially match one image keyword as "related music keywords." Alternatively, the processing unit 400 compares one image keyword with each of the plurality of extracted music keywords, and scores the relevance between the keywords. Then, the processing unit 400 determines the music keyword with the highest score as the "related music keyword". Relevance scoring is, for example, a technique for calculating the degree of relevance between a keyword extracted from content and a tag attached to an image (see Japanese Patent Laid-Open No. 2011-164865), and other known techniques that use AI learning functions. can be used.

そして、処理部400は、当該決定された楽曲キーワードに紐付けられている楽曲IDと、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける。 Then, the processing unit 400 associates the music ID associated with the determined music keyword with the playback time associated with the image keyword corresponding to the determined music keyword.

たとえば、第1の抽出部200から、画像キーワードIK01~IK10及び再生時刻T10~T10の情報が出力され、第2の抽出部300から、楽曲キーワードSK01~SK50及び楽曲識別情報ID***01~ID***50の情報が出力されたとする。 For example, the first extraction unit 200 outputs image keywords IK01 to IK10 and information on reproduction times T10 to T10, and the second extraction unit 300 outputs music keywords SK01 to SK50 and music identification information ID***01 to Assume that the information of ID ***50 is output.

処理部400は、画像キーワードIK01~IK10それぞれに対し、抽出された複数の楽曲キーワードSK01~SK50の中から関連する楽曲キーワードを決定する(図5参照)。そして、処理部400は、決定された楽曲キーワードに紐付けられている楽曲IDと、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける(図6参照)。 The processing unit 400 determines related music keywords from among the plurality of extracted music keywords SK01 to SK50 for each of the image keywords IK01 to IK10 (see FIG. 5). Then, the processing unit 400 associates the music ID associated with the determined music keyword with the playback time associated with the image keyword corresponding to the determined music keyword (see FIG. 6). .

なお、一の画像キーワードに対して決定された楽曲キーワードが他の画像キーワードに対しても「関連する楽曲キーワード」として決定される可能性がある。従って、たとえば、処理部400は、既に「関連する楽曲キーワード」として決定された楽曲キーワードについては対比の対象から外したうえで、関連する楽曲キーワードを決定することができる。 Note that there is a possibility that a music keyword determined for one image keyword is also determined as a "related music keyword" for another image keyword. Therefore, for example, the processing unit 400 can determine related music keywords after excluding music keywords that have already been determined as "related music keywords" from comparison targets.

また、関連性のスコアを利用した場合、一の画像キーワードに対してスコアが同じ複数の楽曲キーワードが生じる可能性もありうる。この場合、処理部400は、たとえば利用者の歌唱履歴において歌唱回数が最も多い楽曲や、採点結果が最も高い楽曲の楽曲キーワードを当該一の画像キーワードに関連する楽曲キーワードとして決定することができる。 In addition, when the relevance score is used, there is a possibility that a plurality of music keywords having the same score will be generated for one image keyword. In this case, the processing unit 400 can determine, for example, the song keyword of the song that has been sung the most in the user's singing history or the song that has the highest scoring result as the song keyword related to the one image keyword.

一方、決定された楽曲キーワードに対応する楽曲の演奏時間と比べ、1つのチャプターの再生時間が長い場合もある。このような場合、処理部400は、一の画像キーワードに対して複数の楽曲キーワードを決定してもよい。すなわち、処理部400は、抽出された一の画像キーワードに対し、抽出された複数の楽曲キーワードの中から、関連する複数の楽曲キーワードであって、当該複数の楽曲キーワードに対応する複数の楽曲の演奏時間の合計時間が当該画像キーワードに対応するチャプターの再生時間未満になるような複数の楽曲キーワードを決定し、決定された複数の楽曲キーワードに紐付けられている複数の楽曲識別情報と、当該決定された楽曲キーワードに対応する一の画像キーワードに紐付けられている再生時刻とを紐付けてもよい。 On the other hand, the reproduction time of one chapter may be longer than the performance time of the music corresponding to the determined music keyword. In such a case, the processing unit 400 may determine multiple music keywords for one image keyword. That is, for one extracted image keyword, the processing unit 400 selects a plurality of related music keywords from among the plurality of extracted music keywords, which are a plurality of music keywords corresponding to the plurality of music keywords. A plurality of music keywords are determined such that the total playing time is less than the reproduction time of the chapter corresponding to the image keyword, a plurality of music identification information linked to the determined plurality of music keywords, The playback time associated with one image keyword corresponding to the determined music keyword may be associated.

[音響制御部]
音響制御部500は、カラオケ装置Kからの放音に関する各種制御を行う。たとえば、音響制御部500は、予約した楽曲の楽曲データに基づいてカラオケ演奏を行う。具体的には、音響制御部500は、予約待ち行列に登録されている楽曲IDが紐付けられている楽曲データを記憶部13から読み出し、音響処理部14を制御することで、スピーカ20からカラオケ演奏音を放音させる。
[Sound control part]
The sound control section 500 performs various controls related to sound emission from the karaoke machine K. FIG. For example, the sound control unit 500 performs karaoke based on the music data of the reserved music. Specifically, the sound control unit 500 reads the music data associated with the music ID registered in the reservation queue from the storage unit 13 and controls the sound processing unit 14 to perform karaoke from the speaker 20 . Emit the performance sound.

ここで、本実施形態において、音響制御部500は、映像作品の再生中において、所定数の画像の再生時刻が到来した場合、当該再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいて、カラオケ演奏を行う。 Here, in the present embodiment, when the reproduction time of a predetermined number of images arrives during reproduction of a video work, the sound control unit 500 reproduces the music indicated by the music identification information linked to the reproduction time. A karaoke performance is performed based on the data.

たとえば、再生部100が映像作品Mのデータを再生して映像信号を出力し、表示装置30に複数の画像を連続して表示させることにより映像を表示させるとする。 For example, assume that the reproducing unit 100 reproduces the data of the video work M, outputs a video signal, and causes the display device 30 to continuously display a plurality of images to display the video.

音響制御部500は、サムネイル画像TN01に対応する画像の再生時刻T01が到来した場合、再生時刻T01に紐付けられている楽曲ID***10(図6参照)が示す楽曲S***10の楽曲データを記憶部13から読み出し、音響処理部14を制御することでスピーカ20から楽曲S***10のカラオケ演奏音を放音させる。同様に、音響制御部500は、サムネイル画像TN02~TN10に対応する画像の再生時刻T02~T10が到来した場合、再生時刻T02~T10に紐付けられている楽曲ID(図6参照)が示す楽曲の楽曲データを記憶部13から読み出し、音響処理部14を制御することでスピーカ20から各楽曲のカラオケ演奏音を放音させる。 When the playback time T01 of the image corresponding to the thumbnail image TN01 arrives, the sound control unit 500 plays the song S***10 indicated by the song ID ***10 (see FIG. 6) linked to the playback time T01. is read from the storage unit 13, and the sound processing unit 14 is controlled to output the karaoke performance sound of the song S***10 from the speaker 20. Similarly, when the playback times T02 to T10 of the images corresponding to the thumbnail images TN02 to TN10 arrive, the sound control unit 500 selects the music indicated by the song ID (see FIG. 6) associated with the playback times T02 to T10. are read out from the storage unit 13, and the sound processing unit 14 is controlled so that the karaoke performance sound of each piece of music is emitted from the speaker 20. - 特許庁

なお、一の楽曲のカラオケ演奏中に次の画像の再生時刻が到来する場合もありうる。この場合、音響制御部500は、現在のカラオケ演奏をフェードアウトさせつつ、次の再生時刻に紐付けられている楽曲IDが示す楽曲のカラオケ演奏を開始することができる。 It should be noted that there is a possibility that the playback time for the next image may come during karaoke performance of one piece of music. In this case, the sound control unit 500 can fade out the current karaoke performance and start the karaoke performance of the song indicated by the song ID linked to the next reproduction time.

==カラオケ装置における処理について==
次に、図7を参照して本実施形態に係るカラオケ装置Kにおける処理の具体例について述べる。図7は、カラオケ装置Kにおける処理例を示すフローチャートである。この例では、利用者Uがカラオケ装置Kを利用して映像作品Mを鑑賞しながら、カラオケ歌唱を行うとする。
==About the processing in the karaoke machine==
Next, a specific example of processing in the karaoke machine K according to this embodiment will be described with reference to FIG. FIG. 7 is a flow chart showing an example of processing in the karaoke machine K. As shown in FIG. In this example, it is assumed that the user U uses the karaoke machine K to sing karaoke songs while watching the video work M.

カラオケ装置Kは、利用者Uからの指示入力に基づいて、利用者Uのカラオケ装置Kに対するログイン処理を行う(ログイン処理。ステップ10)。 The karaoke machine K performs login processing to the karaoke machine K of the user U based on the instruction input from the user U (login processing, step 10).

カラオケ装置Kは、サーバ装置から利用者Uの歌唱履歴を取得する(歌唱履歴の取得。ステップ11)。利用者Uは、カラオケ装置Kに映像作品Mが収録されたメディアをセットする。 The karaoke machine K acquires the singing history of the user U from the server device (acquisition of singing history, step 11). A user U sets a medium in which a video work M is recorded in a karaoke machine K. - 特許庁

第1の抽出部200は、映像作品Mを構成する複数の画像のうち所定数の画像それぞれについて、画像の内容を示す画像キーワードを抽出し、当該映像作品において当該画像の再生を開始する再生時刻と紐付ける(画像キーワードと再生時刻との紐付け。ステップ12)。 The first extraction unit 200 extracts an image keyword indicating the content of each of a predetermined number of images among a plurality of images constituting the video work M, and extracts an image keyword indicating the content of the image, and the reproduction time at which the image in the video work M is to be reproduced. (linking of image keyword and playback time; step 12).

また、第2の抽出部300は、利用者Uの歌唱履歴に含まれる所定数の楽曲について、楽曲毎の内容を示す楽曲キーワードを抽出し、当該楽曲を識別するための楽曲IDと紐付ける(楽曲キーワードと楽曲IDとの紐付け。ステップ13)。 In addition, the second extraction unit 300 extracts a music keyword indicating the contents of each music from a predetermined number of music included in the singing history of the user U, and associates it with a music ID for identifying the music ( Linking of music keywords and music IDs (step 13).

処理部400は、ステップ12で抽出された画像キーワードそれぞれに対し、抽出された複数の楽曲キーワードの中から関連する楽曲キーワードを決定する(関連する楽曲キーワードの決定。ステップ14)。 For each of the image keywords extracted in step 12, the processing unit 400 determines related music keywords from among the plurality of extracted music keywords (determination of related music keywords; step 14).

そして、処理部400は、ステップ14で決定された楽曲キーワードに紐付けられている楽曲IDと、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻を紐付ける(楽曲IDと再生時刻との紐付け。ステップ15)。 Then, the processing unit 400 associates the music ID associated with the music keyword determined in step 14 with the playback time associated with the image keyword corresponding to the determined music keyword (music ID and playback time (step 15).

その後、再生部100は、利用者Uからの指示入力に基づいて、メディアに収録された映像作品Mのデータを再生して映像信号を出力し、表示装置30に映像を表示させる(映像作品の再生開始。ステップ16) After that, based on an instruction input from the user U, the reproducing unit 100 reproduces the data of the video work M recorded on the medium, outputs a video signal, and causes the display device 30 to display the video ( Start playing, step 16)

映像作品Mの再生中において、所定数の画像の再生時刻が到来した場合(ステップ17でYの場合)、音響制御部500は、当該再生時刻に紐付けられている楽曲IDが示す楽曲の楽曲データに基づいて、カラオケ演奏を行う(楽曲のカラオケ演奏。ステップ18)。 When the reproduction time of a predetermined number of images has arrived during the reproduction of the video work M (Y in step 17), the sound control unit 500 selects the music of the music indicated by the music ID linked to the reproduction time. Based on the data, a karaoke performance is performed (karaoke performance of music, step 18).

カラオケ装置Kは、映像作品Mの再生が終了するまで(ステップ19でYの場合)、ステップ17及びステップ18の処理を繰り返し行う。 The karaoke machine K repeats the processing of steps 17 and 18 until the reproduction of the video work M is completed (in the case of Y in step 19).

以上から明らかなように、本実施形態に係るカラオケ装置Kは、メディアに収録された映像作品のデータを再生して映像信号を出力し、表示装置30に映像を表示させる再生部100と、映像作品を構成する複数の画像のうち所定数の画像それぞれについて、画像の内容を示す画像キーワードを抽出し、当該映像作品において当該画像の再生を開始する再生時刻と紐付ける第1の抽出部200と、利用者の歌唱履歴に含まれる所定数の楽曲について、楽曲毎の内容を示す楽曲キーワードを抽出し、当該楽曲を識別するための楽曲識別情報と紐付ける第2の抽出部300と、抽出された画像キーワードそれぞれに対し、抽出された複数の楽曲キーワードの中から関連する楽曲キーワードを決定し、決定された楽曲キーワードに紐付けられている楽曲識別情報と、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける処理部400と、映像作品の再生中において、所定数の画像の再生時刻が到来した場合、当該再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいて、カラオケ演奏を行う音響制御部500と、を有する。 As is clear from the above, the karaoke machine K according to the present embodiment reproduces the data of the video work recorded on the media, outputs the video signal, and displays the video on the display device 30. a first extraction unit 200 that extracts an image keyword indicating the content of each of a predetermined number of images among a plurality of images that constitute a work, and associates the image keyword with the reproduction time at which the image is started to be reproduced in the video work; A second extraction unit 300 that extracts a music keyword indicating the content of each song for a predetermined number of songs included in the user's singing history and associates it with song identification information for identifying the song, and For each of the image keywords obtained, a related music keyword is determined from among the plurality of extracted music keywords, and music identification information associated with the determined music keyword and information corresponding to the determined music keyword. A processing unit 400 that associates reproduction times associated with image keywords, and music identification information associated with the reproduction times when the reproduction times of a predetermined number of images come during reproduction of a video work. and a sound control unit 500 that performs karaoke performance based on the music data of the music indicated by .

このようなカラオケ装置Kによれば、映像作品を構成する所定数の画像が表示される毎に、当該画像に関連する楽曲のカラオケ演奏を行うことができる。よって、利用者は、映像作品を楽しみつつ、現在再生されている場面にふさわしい楽曲のカラオケ歌唱を行うことができる。すなわち、本実施形態に係るカラオケ装置Kによれば、映像作品の各場面に適した楽曲をカラオケ演奏できる。なお、カラオケ演奏される楽曲は、利用者自身の歌唱履歴に基づいて決定されるため、カラオケ歌唱できないという事態は生じえない。 According to such a karaoke machine K, each time a predetermined number of images forming a video work are displayed, a karaoke performance of music associated with the images can be performed. Therefore, the user can enjoy the video work and sing karaoke songs suitable for the scene being reproduced at present. That is, according to the karaoke apparatus K according to this embodiment, it is possible to perform karaoke with songs suitable for each scene of the video work. It should be noted that since the songs to be performed in karaoke are determined based on the singing history of the user himself/herself, it is impossible for the user to be unable to sing in karaoke.

また、所定数の画像は、映像作品のチャプター毎に設定されているサムネイル画像に対応する画像であってもよい。サムネイル画像を利用することにより、カラオケ装置Kは、チャプター毎に適当な楽曲を決定することができる。 Also, the predetermined number of images may be images corresponding to thumbnail images set for each chapter of the video work. By using the thumbnail images, the karaoke apparatus K can determine appropriate songs for each chapter.

<第2実施形態>
次に図8~図9Bを参照して、第2実施形態に係るカラオケ装置について説明する。本実施形態では、利用者に対し、映像作品を構成する画像に応じた飲食物をレコメンドする例について述べる。第1実施形態と同様の構成については説明を省略する。
<Second embodiment>
Next, a karaoke machine according to the second embodiment will be described with reference to FIGS. 8 to 9B. In the present embodiment, an example of recommending foods and drinks to a user according to images forming a video work will be described. Description of the same configuration as in the first embodiment is omitted.

==カラオケ本体==
図8に示すように、本実施形態に係るカラオケ本体10は、再生部100、第1の抽出部200、第2の抽出部300、処理部400、音響制御部500、リスト記憶部600、レコメンド部700、及び報知部800を備える。リスト記憶部600は、記憶部13の記憶領域の一部に相当する。再生部100、第1の抽出部200、第2の抽出部300、決定部400、音響制御部500、レコメンド部700、及び報知部800は、CPU11aがメモリ11bに記憶されるプログラムを実行することにより実現される。
==Karaoke body==
As shown in FIG. 8, the karaoke main body 10 according to the present embodiment includes a reproducing unit 100, a first extracting unit 200, a second extracting unit 300, a processing unit 400, a sound control unit 500, a list storage unit 600, a recommendation A unit 700 and a notification unit 800 are provided. The list storage section 600 corresponds to part of the storage area of the storage section 13 . The reproduction unit 100, the first extraction unit 200, the second extraction unit 300, the determination unit 400, the sound control unit 500, the recommendation unit 700, and the notification unit 800 are configured such that the CPU 11a executes a program stored in the memory 11b. It is realized by

[リスト記憶部]
リスト記憶部600は、カラオケ装置Kが設置された店舗において、利用者に対して提供可能な飲食物のリストを記憶する。
[List memory]
The list storage unit 600 stores a list of foods and drinks that can be provided to users at a store where the karaoke machine K is installed.

飲食物のリストは、飲食物名、飲食物を識別するための識別ID、価格、飲食物を撮影した画像、摂取カロリー等を含む。飲食物のリストはカラオケ店舗毎に異なっている。以下の説明では、飲食物のリストに飲食物FD01~飲食物FD30が含まれているとする。 The food and drink list includes food and drink names, identification IDs for identifying the food and drink, prices, images of the food and drink, calorie intake, and the like. The food and drink list varies from karaoke store to karaoke store. In the following description, it is assumed that the food list includes food FD01 to food FD30.

[レコメンド部]
レコメンド部700は、第1の抽出部200が飲食物を示す画像キーワードを抽出した場合に、当該画像キーワード及び飲食物のリストに基づいて、利用者に対して飲食物をレコメンドする。
[Recommendation Department]
When the first extraction unit 200 extracts an image keyword indicating food and drink, the recommendation unit 700 recommends food and drink to the user based on the image keyword and the food and drink list.

具体的に、第1の抽出部200が抽出した画像キーワードが飲食物を示す場合、レコメンド部700は、リスト記憶部600から飲食物のリストを読み出して、当該画像キーワードと対比を行い、関連する飲食物を特定する。関連する飲食物の特定は、処理部400における処理と同様に行うことができる。すなわち、レコメンド部700は、一の画像キーワードを飲食物のリストに含まれる飲食物それぞれと比較し、キーワードと飲食物との関連性をスコア化する。そして、処理部400は、最もスコアの高い飲食物を、画像キーワードと関連する飲食物として特定する。 Specifically, when the image keyword extracted by the first extraction unit 200 indicates food and drink, the recommendation unit 700 reads out the food and drink list from the list storage unit 600, compares it with the image keyword, Identify food and drink. Identification of related food and drink can be performed in the same manner as the processing in the processing unit 400 . That is, the recommendation unit 700 compares one image keyword with each food item included in the food item list, and scores the relevance between the keyword and the food item. Then, the processing unit 400 identifies the food with the highest score as the food related to the image keyword.

たとえば、第1実施形態におけるサムネイル画像TN05から飲食物である「ラーメン」を示す画像キーワードが抽出されたとする。この場合、レコメンド部700は、飲食物のリストに含まれる飲食物と「ラーメン」とを対比し、関連する飲食物(たとえば、チャーシュー麺)を特定する。 For example, it is assumed that an image keyword indicating food and drink "ramen" is extracted from the thumbnail image TN05 in the first embodiment. In this case, the recommendation unit 700 compares the food and drink included in the food and drink list with “ramen” and identifies the related food and drink (for example, char siu noodles).

レコメンド部700は、特定した飲食物の飲食物名や画像、或いは注文を促すメッセージをリモコン装置50の表示画面に表示させることで、利用者に対してレコメンドを行う。利用者はリモコン装置50を用いてレコメンドされた飲食物を注文することができる。なお、レコメンド部700は、関連する飲食物が複数特定された場合、スコアの高いものをレコメンドしてもよいし、特定された全ての飲食物をレコメンドしてもよい。 The recommendation unit 700 makes a recommendation to the user by displaying the name or image of the specified food or drink or a message prompting an order on the display screen of the remote control device 50 . The user can use the remote control device 50 to order the recommended food and drink. Note that when a plurality of related foods and drinks are specified, the recommendation unit 700 may recommend the one with the highest score, or may recommend all the specified food and drinks.

[報知部]
報知部800は、レコメンドした飲食物を利用者が注文した場合に、当該飲食物をレコメンドする際に利用した画像キーワードに紐付けられている再生時刻に基づいて、当該飲食物の利用者への提供タイミングを決定し、店舗における飲食物の提供者に対して決定した飲食物の提供タイミングを報知する。
[Notification part]
When the user orders the recommended food and drink, the notification unit 800 notifies the user of the food and drink based on the reproduction time associated with the image keyword used for recommending the food and drink. The provision timing is determined, and the decided provision timing of the food and drink is notified to the provider of the food and drink in the store.

提供タイミングは、映像作品の再生中において、利用者に対して飲食物を提供する時刻である。提供タイミングは、たとえば所定数の画像の再生時刻を基準として決定される。 The provision timing is the time at which food and drink are provided to the user while the video work is being reproduced. The provision timing is determined, for example, based on the playback time of a predetermined number of images.

たとえば、利用者Uは、レコメンド部700によりレコメンドされた「チャーシュー麺」を注文したとする。この場合、報知部800は、チャーシュー麺をレコメンドする際に利用した画像キーワード(ラーメン)に紐付けられている再生時刻T05に基づいて、利用者Uへチャーシュー麺を提供する提供タイミングを決定する。たとえば、報知部800は、提供タイミングとして、再生時刻T05の1分前と決定する。 For example, assume that the user U has ordered the “char siu noodles” recommended by the recommendation unit 700 . In this case, the notification unit 800 determines the timing of providing the pork noodles to the user U based on the reproduction time T05 associated with the image keyword (ramen) used when recommending the pork noodles. For example, the notification unit 800 determines the provision timing to be one minute before the reproduction time T05.

報知部800は、決定した提供タイミングを店舗における飲食物の提供者に報知する。具体的に、報知部800は、提供者が所有する携帯端末や店舗に設置されている管理サーバに対して注文する飲食物の識別IDと提供タイミングを送信する。 The notification unit 800 notifies the provider of the food and drink in the store of the determined provision timing. Specifically, the notification unit 800 transmits the identification ID of the food and drink to be ordered and the timing of provision to the mobile terminal owned by the provider or the management server installed in the store.

提供者は、飲食物の識別IDに基づいて提供する飲食物を特定し、提供タイミングに合わせて提供できるよう、飲食物の準備を行う。 The provider identifies the food and drink to be provided based on the identification ID of the food and drink, and prepares the food and drink so that the food and drink can be provided in accordance with the provision timing.

なお、報知部800は、リモコン装置50の表示画面に提供タイミングを表示させることにより、利用者に対しても提供タイミングを報知することができる。 The notification unit 800 can also notify the user of the provision timing by displaying the provision timing on the display screen of the remote control device 50 .

==カラオケ装置における処理について==
次に、図9A及び図9Bを参照して本実施形態に係るカラオケ装置Kにおける処理の具体例について述べる。図9A及び図9Bは、カラオケ装置Kにおける処理例を示すフローチャートである。この例では、利用者Uがカラオケ装置Kを利用して映像作品Mを鑑賞しながら、カラオケ歌唱を行うとする。また、リスト記憶部600は、カラオケ装置Kが設置された店舗において、利用者に対して提供可能な飲食物のリストを記憶している。
==About the processing in the karaoke machine==
Next, a specific example of processing in the karaoke machine K according to this embodiment will be described with reference to FIGS. 9A and 9B. 9A and 9B are flowcharts showing processing examples in the karaoke machine K. FIG. In this example, it is assumed that the user U uses the karaoke machine K to sing karaoke songs while watching the video work M. In addition, the list storage unit 600 stores a list of foods and drinks that can be provided to users at the store where the karaoke machine K is installed.

ステップ20からステップ22は、ステップ10からステップ12と同様である。 Steps 20-22 are similar to steps 10-12.

ここで、第1の抽出部200が飲食物を示す画像キーワードを抽出した場合(ステップ23でYの場合)、レコメンド部700は、ステップ12で抽出された画像キーワード及び飲食物のリストに基づいて、利用者に対して飲食物をレコメンドする(飲食物のレコメンド。ステップ24)。 Here, when the first extraction unit 200 extracts an image keyword indicating food and drink (Y in step 23), the recommendation unit 700 performs , to recommend food and drink to the user (recommend food and drink; step 24).

レコメンドした飲食物を利用者が注文した場合(ステップ25でYの場合)、報知部800は、飲食物をレコメンドする際に利用した画像キーワードに紐付けられている再生時刻に基づいて、当該飲食物の利用者への提供タイミングを決定し、店舗における飲食物の提供者に対して決定した飲食物の提供タイミングを報知する(提供タイミングを報知。ステップ26)。 When the user orders the recommended food and drink (Y in step 25), the notification unit 800 displays the food and drink based on the playback time associated with the image keyword used when recommending the food and drink. The timing for providing the product to the user is determined, and the determined timing for providing the food and drink is notified to the provider of the food and drink in the store (notification of the provision timing; step 26).

ステップ27からステップ30は、ステップ13からステップ16と同様である。 Steps 27-30 are similar to steps 13-16.

映像作品の再生中において、ステップ26で報知された提供タイミングが到来した場合(ステップ31でYの場合)、提供者により飲食物が提供される(飲食物の提供。ステップ32)。 When the provision timing notified in step 26 arrives during the reproduction of the video work (Y in step 31), food and drink are provided by the provider (provide food and drink; step 32).

その後、所定数の画像の再生時刻が到来した場合(ステップ33でYの場合)、音響制御部500は、当該再生時刻に紐付けられている楽曲IDが示す楽曲の楽曲データに基づいて、カラオケ演奏を行う(楽曲のカラオケ演奏。ステップ34)。 After that, when the playback time of a predetermined number of images has arrived (Y in step 33), the sound control unit 500 performs karaoke based on the song data of the song indicated by the song ID linked to the playback time. Performance is performed (karaoke performance of music, step 34).

カラオケ装置Kは、映像作品Mの再生が終了するまで(ステップ35でYの場合)、ステップ31からステップ34の処理を繰り返し行う。 The karaoke machine K repeats the processing from step 31 to step 34 until the reproduction of the video work M is completed (in the case of Y in step 35).

以上から明らかなように、本実施形態に係るカラオケ装置Kは、カラオケ装置Kが設置された店舗において、利用者に対して提供可能な飲食物のリストを記憶するリスト記憶部600と、第1の抽出部200が飲食物を示す画像キーワードを抽出した場合に、当該画像キーワード及び飲食物のリストに基づいて、利用者に対して飲食物をレコメンドするレコメンド部700と、を有する。このようなカラオケ装置Kによれば、利用者に対して映像作品の場面に適した飲食物をレコメンドすることができる。 As is clear from the above, the karaoke machine K according to the present embodiment includes the list storage unit 600 that stores a list of foods and drinks that can be provided to the user at the store where the karaoke machine K is installed, and the first and a recommendation unit 700 that, when the extraction unit 200 extracts an image keyword indicating food and drink, recommends food and drink to the user based on the image keyword and the list of food and drink. According to such a karaoke machine K, it is possible to recommend food and drink suitable for the scene of the video work to the user.

また、本実施形態に係るカラオケ装置Kは、レコメンドした飲食物を利用者が注文した場合に、当該飲食物をレコメンドする際に利用した画像キーワードに紐付けられている再生時刻に基づいて、当該飲食物の利用者への提供タイミングを決定し、店舗における飲食物の提供者に対して決定した飲食物の提供タイミングを報知する報知部800を有する。このようなカラオケ装置Kによれば、利用者は、映像作品の場面に適した飲食物の飲食が可能となる。 In addition, when the user orders the recommended food and drink, the karaoke device K according to the present embodiment performs the processing based on the reproduction time associated with the image keyword used when the food and drink is recommended. It has a notification unit 800 that determines the timing of providing food and drink to the user and notifies the determined timing of providing food and drink to the provider of food and drink in the store. According to such a karaoke machine K, the user can eat and drink food suitable for the scene of the video work.

<変形例1>
映像作品には、音声が含まれているものも多く存在する。このような映像作品のデータは、映像データ及び音声データにより構成されている。音声データは、カラオケ装置Kから放音される音声に対応するデータである。音声には、会話の音声、音楽の音声、効果音(機械音、自然音等)等が含まれる。
<Modification 1>
Many video works include audio. The data of such a video work consists of video data and audio data. The audio data is data corresponding to audio emitted from the karaoke machine K. FIG. Sounds include speech sounds, music sounds, sound effects (mechanical sounds, natural sounds, etc.), and the like.

映像作品が音声を含む場合、再生部100は、映像作品のデータを再生し、映像信号と併せて音声信号を出力する。音響制御部500は、音響処理部14を制御し、スピーカ20から映像作品の音声を放音させる。 When the video work includes sound, the reproducing unit 100 reproduces the data of the video work and outputs the audio signal together with the video signal. The sound control unit 500 controls the sound processing unit 14 to emit the sound of the video work from the speaker 20 .

ここで、音響制御部500は、カラオケ演奏を行わない場合に音声信号に基づく音声を出力することも可能である。 Here, the sound control unit 500 can also output sound based on the sound signal when the karaoke performance is not performed.

たとえば、第1実施形態の例において、音響制御部500が、サムネイル画像TN1の再生時刻T01が到来した場合、楽曲S***10のカラオケ演奏音を放音させたとする。そして、次のチャプターに移る前に楽曲S***10のカラオケ演奏が終了したとする。この場合、音響制御部500は、次の再生時刻T02が到来するまで、映像作品Mの音声データに基づいて、映像作品Mの音声を放音させる。 For example, in the example of the first embodiment, assume that the sound control unit 500 emits the karaoke performance sound of the song S***10 when the playback time T01 of the thumbnail image TN1 arrives. Suppose that the karaoke performance of song S***10 is finished before proceeding to the next chapter. In this case, the sound control section 500 emits the sound of the video work M based on the audio data of the video work M until the next reproduction time T02 arrives.

このように映像作品Mの音声を放音させることにより、映像のみが表示される状態(音声が放音されない状態)を避けることができる。 By emitting the sound of the video work M in this way, it is possible to avoid a state in which only the video is displayed (a state in which no sound is emitted).

なお、音響制御部500は、映像作品の音声とカラオケ演奏の音声とで放音するボリュームを変更してもよい。 Note that the sound control unit 500 may change the volume of sound emitted between the sound of the video work and the sound of the karaoke performance.

また、第2実施形態の例において、音響制御部500は、提供タイミングが到来した場合に(或いは提供タイミングを決定する際に用いた再生時刻が到来した場合に)、カラオケ演奏音の放音を中止し、映像作品の音声を放音させてもよい。この場合、利用者は、カラオケ歌唱を中止して飲食を行い易くなる。 In addition, in the example of the second embodiment, the sound control unit 500 emits the karaoke performance sound when the provision timing arrives (or when the reproduction time used for determining the provision timing arrives). It may be canceled and the sound of the video work may be emitted. In this case, it becomes easier for the user to stop singing karaoke and eat and drink.

<変形例2>
再生部100は、一の再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいてカラオケ演奏を行う場合、映像作品のデータの再生を中断し、当該一の再生時刻に紐付けられた画像キーワードを抽出した画像を示す画像信号を出力し、当該画像を静止画像として表示手段に表示させ、当該カラオケ演奏の終了後に映像作品のデータの再生を再開することができる。
<Modification 2>
When karaoke performance is performed based on the music data of the music indicated by the music identification information linked to one reproduction time, the reproduction unit 100 interrupts the reproduction of the data of the video work, and performs the karaoke performance. An image signal indicating an image extracted from the attached image keyword is output, the image is displayed as a still image on the display means, and reproduction of the data of the video work can be restarted after the karaoke performance is finished.

たとえば、第1実施形態の例において、サムネイル画像TN01に対応する画像の再生時刻T01が到来した場合、音響制御部500が楽曲S***10のカラオケ演奏音を放音させたとする。 For example, in the example of the first embodiment, assume that the sound control unit 500 emits the karaoke performance sound of the song S***10 when the reproduction time T01 of the image corresponding to the thumbnail image TN01 arrives.

この場合、再生部100は、映像作品Mのデータの再生を中断し、サムネイル画像TN01に対応する画像を示す画像信号を出力し、表示装置30にサムネイル画像TN01に対応する画像を表示させる。その後、楽曲S***10のカラオケ演奏が終了した場合、再生部100は、中断したところから(すなわち、サムネイル画像TN01に対応する画像の次の画像から)映像作品のデータの再生を再開する。あるチャプター内においても様々な場面が存在する。そこで、楽曲S***10を決定する際に用いたサムネイル画像TN01に対応する画像を表示させることにより、利用者はカラオケ演奏される楽曲に最も関連性が高い画像を見ながらカラオケ歌唱を行うことが可能となる。 In this case, the reproduction unit 100 interrupts the reproduction of the data of the video work M, outputs an image signal representing the image corresponding to the thumbnail image TN01, and causes the display device 30 to display the image corresponding to the thumbnail image TN01. After that, when the karaoke performance of the song S***10 ends, the reproduction unit 100 resumes the reproduction of the data of the video work from where it was interrupted (that is, from the image following the image corresponding to the thumbnail image TN01). . There are various scenes even within a certain chapter. Therefore, by displaying an image corresponding to the thumbnail image TN01 used when determining the song S***10, the user sings karaoke while looking at the image most relevant to the song to be played karaoke. becomes possible.

<その他>
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
<Others>
The above embodiments are presented as examples and are not intended to limit the scope of the invention. The above configurations can be implemented in combination as appropriate, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. The above-described embodiments and modifications thereof are included in the scope and spirit of the invention, as well as the scope of the invention described in the claims and equivalents thereof.

100 再生部
200 第1の抽出部
300 第2の抽出部
400 処理部
500 音響制御部
600 リスト記憶部
700 レコメンド部
800 報知部
K カラオケ装置
100 reproduction unit 200 first extraction unit 300 second extraction unit 400 processing unit 500 sound control unit 600 list storage unit 700 recommendation unit 800 notification unit K karaoke device

Claims (6)

メディアに収録された映像作品のデータを再生して映像信号を出力し、表示手段に映像を表示させる再生部と、
映像作品を構成する複数の画像のうち所定数の画像それぞれについて、画像の内容を示す画像キーワードを抽出し、当該映像作品において当該画像の再生を開始する再生時刻と紐付ける第1の抽出部と、
利用者の歌唱履歴に含まれる所定数の楽曲について、楽曲毎の内容を示す楽曲キーワードを抽出し、当該楽曲を識別するための楽曲識別情報と紐付ける第2の抽出部と、
抽出された画像キーワードそれぞれに対し、抽出された複数の楽曲キーワードの中から関連する楽曲キーワードを決定し、決定された前記楽曲キーワードに紐付けられている楽曲識別情報と、当該決定された楽曲キーワードに対応する画像キーワードに紐付けられている再生時刻とを紐付ける処理部と、
前記映像作品の再生中において、前記所定数の画像の再生時刻が到来した場合、当該再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいて、カラオケ演奏を行う音響制御部と、
を有するカラオケ装置。
a reproducing unit that reproduces the data of the video work recorded on the media, outputs a video signal, and displays the video on the display means;
a first extraction unit that extracts an image keyword indicating the content of each of a predetermined number of images among a plurality of images that make up a video work, and associates the image keyword with a playback time at which playback of the image is started in the video work; ,
A second extraction unit that extracts a song keyword indicating the content of each song for a predetermined number of songs included in the user's singing history and associates it with song identification information for identifying the song;
For each of the extracted image keywords, a related music keyword is determined from a plurality of extracted music keywords, music identification information linked to the determined music keyword, and the determined music keyword. a processing unit that associates the playback time associated with the image keyword corresponding to the
When the playback time of the predetermined number of images arrives during playback of the video work, the sound control unit performs karaoke performance based on the song data of the song indicated by the song identification information linked to the playback time. and,
A karaoke device having
前記所定数の画像は、映像作品のチャプター毎に設定されているサムネイル画像に対応する画像であることを特徴とする請求項1記載のカラオケ装置。 2. The karaoke machine according to claim 1, wherein said predetermined number of images are images corresponding to thumbnail images set for each chapter of a video work. カラオケ装置が設置された店舗において、利用者に対して提供可能な飲食物のリストを記憶するリスト記憶部と、
前記第1の抽出部が飲食物を示す画像キーワードを抽出した場合に、当該画像キーワード及び前記飲食物のリストに基づいて、利用者に対して飲食物をレコメンドするレコメンド部と、
を有することを特徴とする請求項1または2記載のカラオケ装置。
a list storage unit that stores a list of foods and drinks that can be provided to users in a store where a karaoke machine is installed;
a recommendation unit that, when the first extraction unit extracts an image keyword indicating food and drink, recommends food and drink to a user based on the image keyword and the food and drink list;
3. The karaoke apparatus according to claim 1, further comprising:
前記レコメンドした飲食物を利用者が注文した場合に、当該飲食物をレコメンドする際に利用した画像キーワードに紐付けられている再生時刻に基づいて、当該飲食物の利用者への提供タイミングを決定し、店舗における飲食物の提供者に対して決定した飲食物の提供タイミングを報知する報知部と、
を有することを特徴とする請求項3記載のカラオケ装置。
When the user orders the recommended food and drink, the timing of providing the food and drink to the user is determined based on the playback time associated with the image keyword used when recommending the food and drink. and a notification unit that notifies the food and drink provider in the store of the determined food and drink provision timing;
4. The karaoke apparatus according to claim 3, further comprising:
前記再生部は、メディアに収録された映像作品のデータを再生して音声信号を出力し、
前記音響制御部は、前記カラオケ演奏を行わない場合に前記音声信号に基づく音声を出力することを特徴とする請求項1から4のいずれか一つに記載のカラオケ装置。
The reproducing unit reproduces data of a video work recorded on a medium and outputs an audio signal,
5. The karaoke apparatus according to any one of claims 1 to 4, wherein the sound control unit outputs sound based on the audio signal when the karaoke performance is not performed.
前記再生部は、一の再生時刻に紐付けられている楽曲識別情報が示す楽曲の楽曲データに基づいてカラオケ演奏を行う場合、前記映像作品のデータの再生を中断し、当該一の再生時刻に紐付けられた画像キーワードを抽出した画像を示す画像信号を出力し、当該画像を静止画像として表示手段に表示させ、当該カラオケ演奏の終了後に映像作品のデータの再生を再開することを特徴とする請求項1から5のいずれか一つに記載のカラオケ装置。 When karaoke performance is performed based on the music data of the music indicated by the music identification information linked to one reproduction time, the reproduction unit interrupts the reproduction of the data of the video work, and at the one reproduction time An image signal representing an image extracted from the linked image keyword is output, the image is displayed as a still image on the display means, and reproduction of the data of the video work is resumed after the karaoke performance is finished. 6. A karaoke apparatus according to any one of claims 1 to 5.
JP2020011938A 2020-01-28 2020-01-28 karaoke device Active JP7335175B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020011938A JP7335175B2 (en) 2020-01-28 2020-01-28 karaoke device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020011938A JP7335175B2 (en) 2020-01-28 2020-01-28 karaoke device

Publications (2)

Publication Number Publication Date
JP2021117410A JP2021117410A (en) 2021-08-10
JP7335175B2 true JP7335175B2 (en) 2023-08-29

Family

ID=77175603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020011938A Active JP7335175B2 (en) 2020-01-28 2020-01-28 karaoke device

Country Status (1)

Country Link
JP (1) JP7335175B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134146A (en) 2004-11-08 2006-05-25 Fujitsu Ltd Data processor, information processing system, selection program and selection program-recorded computer-readable recording medium
JP2006309920A (en) 2005-03-30 2006-11-09 Toshiba Corp Information processing apparatus and its method
JP2009008831A (en) 2007-06-27 2009-01-15 Daiichikosho Co Ltd Music reproducing system with image display function
JP2011033649A (en) 2009-07-29 2011-02-17 Daiichikosho Co Ltd Karaoke device that selects music according to content of video work

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134146A (en) 2004-11-08 2006-05-25 Fujitsu Ltd Data processor, information processing system, selection program and selection program-recorded computer-readable recording medium
JP2006309920A (en) 2005-03-30 2006-11-09 Toshiba Corp Information processing apparatus and its method
JP2009008831A (en) 2007-06-27 2009-01-15 Daiichikosho Co Ltd Music reproducing system with image display function
JP2011033649A (en) 2009-07-29 2011-02-17 Daiichikosho Co Ltd Karaoke device that selects music according to content of video work

Also Published As

Publication number Publication date
JP2021117410A (en) 2021-08-10

Similar Documents

Publication Publication Date Title
US7227073B2 (en) Playlist managing apparatus and method
US8168876B2 (en) Method of displaying music information in multimedia playback and related electronic device
US7739584B2 (en) Electronic messaging synchronized to media presentation
US20070223871A1 (en) Method of Generating a Content Item Having a Specific Emotional Influence on a User
JP5631639B2 (en) AV equipment
JP2008061120A (en) Reproducing apparatus, retrieving method and program
JP2008165759A (en) Information processing unit, method and program
US20080096174A1 (en) Tutorial generation unit, multimedia management system, portable apparatus, method of explanation of multimedia management behavior, computer program product
US7620467B2 (en) Device and method for metadata management
JP5986395B2 (en) Program for portable terminal device, information presentation method, and portable terminal device
JP7335175B2 (en) karaoke device
JP5371609B2 (en) Karaoke device in which the flow of the content of the video work affects the selection of music
JP2005285285A (en) Content read system and musical piece reproduction apparatus
JP2006338315A (en) Data selection system
JP4721765B2 (en) Content search apparatus and content search method
JP2014123085A (en) Device, method, and program for further effectively performing and providing body motion and so on to be performed by viewer according to singing in karaoke
JP7158902B2 (en) Information processing device, information processing method, and information processing program
JP7308135B2 (en) karaoke system
JP7299810B2 (en) karaoke device
JP7295777B2 (en) karaoke device
JP4858332B2 (en) Audio device and continuous playback program
JP6121139B2 (en) Singing voice selection system for karaoke singing video
JP4263151B2 (en) Content reproduction pattern generation apparatus, content reproduction system, and content reproduction pattern generation method
JP2021085921A (en) Karaoke device
JP2017173363A (en) Karaoke system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230817

R150 Certificate of patent or registration of utility model

Ref document number: 7335175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150