JP7061679B2 - A method and system for predicting the playing length of a song based on the composition of the playlist - Google Patents
A method and system for predicting the playing length of a song based on the composition of the playlist Download PDFInfo
- Publication number
- JP7061679B2 JP7061679B2 JP2020544826A JP2020544826A JP7061679B2 JP 7061679 B2 JP7061679 B2 JP 7061679B2 JP 2020544826 A JP2020544826 A JP 2020544826A JP 2020544826 A JP2020544826 A JP 2020544826A JP 7061679 B2 JP7061679 B2 JP 7061679B2
- Authority
- JP
- Japan
- Prior art keywords
- song
- playlist
- playback
- length
- specific
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 60
- 230000015654 memory Effects 0.000 claims description 26
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 2
- 239000013598 vector Substances 0.000 description 18
- 238000004891 communication Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000011176 pooling Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000006930 Pseudomyxoma Peritonei Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229920000306 polymethylpentene Polymers 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
- G06F16/639—Presentation of query results using playlists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Transfer Between Computers (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
以下の説明は、ストリーミング(streaming)基盤の音楽サービスを提供する技術に関する。 The following description relates to a technique for providing a streaming-based music service.
デジタル技術の発達により、音源をデジタル形態で生成して保存および管理することができるようになった。これにより、音源の作成、配布、管理が容易となり、PC、ノート型PC、タブレット、スマートフォンのような多様な端末機を利用して容易に鑑賞することができるようになった。 With the development of digital technology, it has become possible to generate, store and manage sound sources in digital form. This makes it easier to create, distribute, and manage sound sources, and it has become possible to easily view them using various terminals such as PCs, notebook PCs, tablets, and smartphones.
音楽を鑑賞するための方法が多様化している中、例えば、通信網を介して音楽をダウンロードして利用したり、インターネットによるストリーミングサービスでリアルタイム受信したりすることで、音楽を鑑賞することができるようになった。 While the methods for listening to music are diversifying, for example, music can be listened to by downloading and using it via a communication network or receiving it in real time by a streaming service via the Internet. It became so.
一例として、特許文献1(公開日2014年2月14日)には、ユーザのプレイリストに基づいてユーザカスタムされた音楽放送サービスを提供する、プレイリスト基盤の音楽放送サービス方法およびこの装置が開示されている。 As an example, Patent Document 1 (publication date: February 14, 2014) discloses a playlist-based music broadcasting service method and the apparatus for providing a user-customized music broadcasting service based on a user's playlist. Has been done.
プレイリスト(playlist)の曲の構成に基づき、曲ごとに該当の曲が最後まで再生される確率である再生長さを予測することを目的とする。 The purpose is to predict the playback length, which is the probability that the corresponding song will be played to the end for each song, based on the composition of the songs in the playlist (playlist).
プレイリストに含まれる各曲の再生長さに基づいて曲ごとにプリフェッチ(pre-fetching)を効果的に実行することで、滑らかな(seamless)再生環境を提供することを他の目的とする。 Another object is to provide a smooth playback environment by effectively performing prefetching for each song based on the playback length of each song included in the playlist.
プレイリストの曲ごとの再生長さに基づくことで不必要なデータフェッチを減らすことができ、サービス全般にわたって消耗されるリソースを効率的に利用することをさらに他の目的とする。 It is possible to reduce unnecessary data fetches based on the playback length of each song in the playlist, and the other purpose is to efficiently use the resources consumed throughout the service.
コンピュータシステムが実行する方法であって、前記コンピュータシステムは、少なくとも1つのプロセッサを含み、当該方法は、前記少なくとも1つのプロセッサが、各プレイリストに対して曲構成情報と再生履歴情報を管理する段階と、前記少なくとも1つのプロセッサが、電子機器から特定のプレイリストに対する再生要求を受信すると、前記曲構成情報と前記再生履歴情報を利用して前記特定のプレイリストの曲ごとに該当の曲が再生される確率である再生長さを予測する段階とを含む方法を提供する。 A method performed by a computer system, wherein the computer system includes at least one processor, wherein the at least one processor manages song composition information and playback history information for each playlist. When the at least one processor receives a playback request for a specific playlist from an electronic device, the corresponding song is played for each song in the specific playlist using the song composition information and the playback history information. Provided is a method including a step of predicting a reproduction length which is a probability of being performed.
一側面によると、前記管理する段階は、前記プレイリストそれぞれに対し、曲の再生順序と曲ごとの全体の再生長さを含む曲構成情報、および曲ごとの前記全体の再生長さに対してユーザそれぞれが実際に再生した割合を示す実際の再生長さを含む再生履歴情報を管理する段階を含んでよい。 According to one aspect, the management step is for each of the playlists with respect to the song composition information including the playback order of the songs and the total playback length of each song, and the total playback length of each song. It may include a step of managing the playback history information including the actual playback length indicating the ratio of the actual playback by each user.
他の側面によると、前記予測する段階は、前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、前記取得したプレイリストの再生履歴情報を利用して前記特定のプレイリストの曲ごとに予想再生長さを算出する段階とを含んでよい。 According to another aspect, the predictive stage uses the song composition information to acquire a playlist corresponding to the song composition of the specific playlist, and uses the playback history information of the acquired playlist. The step of calculating the expected playback length for each song in the specific playlist may be included.
また他の側面によると、前記取得する段階は、曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得してよい。 Further, according to another aspect, the acquisition step may acquire a playlist composed of songs that are the same as or similar to the songs included in the specific playlist, based on the similarity between the songs.
また他の側面によると、前記取得する段階は、各曲に対し、該当の曲の音源データをディープラーニング学習モデルによって学習して固有の音源特徴を生成する段階、前記音源特徴を利用して曲どうしの類似度を算出する段階、および前記曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得する段階を含んでよい。 According to another aspect, the acquisition stage is a stage in which the sound source data of the corresponding song is learned by the deep learning learning model to generate a unique sound source feature for each song, and the song using the sound source feature. It may include a step of calculating the similarity between the songs and a step of acquiring a playlist composed of songs that are the same as or similar to the songs included in the specific playlist based on the similarity between the songs.
また他の側面によると、前記予測する段階は、前記曲構成情報を利用して前記特定のプレイリストの曲の構成と対応するプレイリストを取得する段階と、前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する全体ユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとに予想再生長さを算出する段階とを含んでよい。 According to another aspect, the prediction stage includes a stage of acquiring a playlist corresponding to the composition of a song in the specific playlist by using the song composition information, and the specific stage of the acquired playlist. It may include a step of calculating an expected playback length for each song in the specific playlist by a method of averaging the actual playback lengths of all users for each song in the playlist and the corresponding song.
また他の側面によると、前記予測する段階は、前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する前記電子機器のユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとに予想再生長さを算出する段階とを含んでよい。 According to another aspect, the prediction stage includes a stage of acquiring a playlist corresponding to the song composition of the specific playlist by using the song composition information, and the specific play of the acquired playlist. A step of calculating an expected playback length for each song in the specific playlist by a method of averaging the actual playback lengths of the users of the electronic device for each song in the list and the corresponding song may be included.
また他の側面によると、前記管理する段階は、前記プレイリストの各曲に対し、該当の曲が再生された時点の時間、天気、位置のうちの少なくとも1つを含む追加情報を前記再生履歴情報とともに管理する段階をさらに含み、前記予測する段階は、前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、前記取得したプレイリストのうちで前記特定のプレイリストを要求した時点の追加情報とマッチングするプレイリストの再生履歴情報を利用して、前記特定のプレイリストの曲ごとに予想再生長さを算出する段階とを含んでよい。 According to another aspect, the management stage adds additional information to each song in the playlist, including at least one of the time, weather, and position at the time the song was played. The step of further including the step of managing together with the information, the step of predicting is the step of acquiring the playlist corresponding to the song composition of the specific playlist by using the song composition information, and the stage of acquiring the playlist. It may include a step of calculating an expected playback length for each song of the specific playlist by using the playlist playback history information that matches the additional information at the time when the specific playlist is requested.
また他の側面によると、当該方法は、前記少なくとも1つのプロセッサが、前記特定のプレイリストの曲ごとの再生長さに従って曲再生に必要なリソースを分配し、前記特定のプレイリストの再生のための音源データを前記電子機器に提供する段階をさらに含んでよい。 According to another aspect, in the method, the at least one processor distributes the resources required for song playback according to the playback length of each song of the specific playlist, and the method is for playing the specific playlist. It may further include a step of providing the sound source data of the above to the electronic device.
さらに他の側面によると、前記提供する段階は、前記特定のプレイリストの曲ごとに、該当の曲の予測された再生長さに対応する単位でプリフェッチ(pre-fetching)を実行してよい。 According to yet another aspect, the provided step may perform prefetching for each song in the particular playlist in units corresponding to the predicted playback length of the song.
前記方法をコンピュータに実行させるためのプログラムが記録されていることを特徴とする、非一時的なコンピュータ読み取り可能な記録媒体を提供する。 Provided is a non-temporary computer-readable recording medium, characterized in that a program for causing a computer to execute the method is recorded.
コンピュータシステムであって、メモリ、および前記メモリに接続され、前記メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、各プレイリストに対して曲構成情報と再生履歴情報を管理する情報管理部と、電子機器から特定のプレイリストに対する再生要求が受信されれば、前記曲構成情報と前記再生履歴情報を利用して前記特定のプレイリストの曲ごとに該当の曲が再生される確率である再生長さを予測する再生長さ予測部とを含む、コンピュータシステムを提供する。 A computer system comprising a memory and at least one processor connected to the memory and configured to execute computer-readable instructions contained in the memory, wherein the at least one processor is each playlist. When a playback request for a specific playlist is received from the information management unit that manages the song composition information and the playback history information, the specific playlist is used by using the song composition information and the playback history information. Provided is a computer system including a playback length predicting unit that predicts a playback length, which is the probability that the corresponding song is played for each song in the playlist.
以下、本発明の実施形態について、添付の図面を参照しながら詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
本発明の実施形態は、ストリーミング基盤の音楽サービスを提供する技術に関する。 An embodiment of the present invention relates to a technique for providing a streaming-based music service.
本明細書において具体的に開示される事項を含む実施形態は、プレイリスト構成に基づいて曲の再生長さを予測することができ、これによって効率性、リソース節減、費用節減、サービス品質、利便性などの側面において相当な長所を達成することができる。 Embodiments, including the matters specifically disclosed herein, can predict the playing length of a song based on a playlist structure, thereby efficiency, resource savings, cost savings, quality of service, convenience. It is possible to achieve considerable advantages in terms of sex and the like.
図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されることはない。
FIG. 1 is a diagram showing an example of a network environment according to an embodiment of the present invention. The network environment of FIG. 1 shows an example including a plurality of
複数の電子機器110、120、130、140は、コンピュータシステムによって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレット、ゲームコンソール、ウェアラブルデバイス、IoT(internet of things)デバイス、VR(virtual reality)デバイス、AR(augmented reality)デバイスなどがある。一例として、図1では、電子機器110の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータシステムのうちの1つを意味してよい。
The plurality of
通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網、衛星網など)を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
The communication method is not limited, and not only a communication method using a communication network that can be included in the network 170 (for example, a mobile communication network, a wired Internet, a wireless Internet, a broadcasting network, a satellite network, etc.), but also a device. Short-range wireless communication between may be included. For example, the
サーバ150、160それぞれは、複数の電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する1つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第1サービスを提供するシステムであってよく、サーバ160も、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第2サービスを提供するシステムであってよい。より具体的な例として、サーバ150は、複数の電子機器110、120、130、140においてインストールされて実行されるコンピュータプログラムであるアプリケーションを通じ、該当のアプリケーションが目的とするサービス(一例として、音楽サービスなど)を第1サービスとして複数の電子機器110、120、130、140に提供してよい。他の例として、サーバ160は、上述したアプリケーションのインストールおよび実行のためのファイルを複数の電子機器110、120、130、140に配布するサービスを第2サービスとして提供してよい。
Each of the
図2は、本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。図2では、電子機器に対する例として電子機器110の内部構成およびサーバ150の内部構成について説明する。また、他の電子機器120、130、140やサーバ160も、上述した電子機器110またはサーバ150と同一または類似の内部構成を有してよい。
FIG. 2 is a block diagram for explaining an internal configuration of an electronic device and a server according to an embodiment of the present invention. FIG. 2 describes the internal configuration of the
電子機器110およびサーバ150は、メモリ211、221、プロセッサ212、222、通信モジュール213、223、および入力/出力インタフェース214、224を含んでよい。メモリ211、221は、非一時的なコンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)、フラッシュメモリ(flash memory)などのような永続的大容量記録装置を含んでよい。ここで、ROM、SSD、フラッシュメモリ、ディスクドライブのような永続的大容量記録装置は、メモリ211、221とは区分される別の永続的記録装置として電子機器110やサーバ150に含まれてもよい。また、メモリ211、221には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電子機器110においてインストールされて実行されるブラウザや特定のサービスの提供のために電子機器110にインストールされるアプリケーションなどのためのコード)が記録されてよい。このようなソフトウェア構成要素は、メモリ211、221とは別のコンピュータ読み取り可能な記録媒体からロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信モジュール213、223を通じてメモリ211、221にロードされてもよい。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システム(一例として、上述したサーバ160)がネットワーク170を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいてメモリ211、221にロードされてよい。
The
プロセッサ212、222は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ211、221または通信モジュール213、223によって、プロセッサ212、222に提供されてよい。例えば、プロセッサ212、222は、メモリ211、221のような記録装置に記録されたプログラムコードに従って受信される命令を実行するように構成されてよい。
通信モジュール213、223は、ネットワーク170を介して電子機器110とサーバ150とが互いに通信するための機能を提供してもよいし、電子機器110および/またはサーバ150が他の電子機器(一例として、電子機器120)または他のサーバ(一例として、サーバ160)と通信するための機能を提供してもよい。一例として、電子機器110のプロセッサ212がメモリ211のような記録装置に記録されたプログラムコードに従って生成した要求が、通信モジュール213の制御に従ってネットワーク170を介してサーバ150に伝達されてよい。これとは逆に、サーバ150のプロセッサ222の制御に従って提供される制御信号や命令、コンテンツ、ファイルなどが、通信モジュール223とネットワーク170を経て電子機器110の通信モジュール213を通じて電子機器110に受信されてよい。例えば、通信モジュール213を通じて受信されたサーバ150の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ212やメモリ211に伝達されてよく、コンテンツやファイルなどは、電子機器110がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
The
入力/出力インタフェース214は、入力/出力装置215とのインタフェースのための手段であってよい。例えば、入力装置は、キーボード、マウス、マイクロフォン、カメラなどの装置を、出力装置は、ディスプレイ、スピーカ、触覚フィードバックデバイスなどのような装置を含んでよい。他の例として、入力/出力インタフェース214は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置215は、電子機器110と1つの装置で構成されてもよい。また、サーバ150の入力/出力インタフェース224は、サーバ150に接続するかサーバ150が含むことのできる入力または出力のための装置(図示せず)とのインタフェースのための手段であってよい。より具体的な例として、電子機器110のプロセッサ212がメモリ211にロードされたコンピュータプログラムの命令を処理するにあたり、サーバ150や電子機器120が提供するデータを利用して構成されるサービス画面やコンテンツが、入力/出力インタフェース214を通じてディスプレイに表示されてよい。
The input /
また、他の実施形態において、電子機器110およびサーバ150は、図2の構成要素よりも多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、電子機器110は、上述した入力/出力装置215のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、GPS(Global Positioning System)モジュール、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器110がスマートフォンである場合、一般的にスマートフォンが含んでいる加速度センサやジャイロセンサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が、電子機器110にさらに含まれるように実現されてよい。
Also, in other embodiments, the
以下では、プレイリスト構成に基づいて曲の再生長さを予測する方法およびシステムの具体的な実施形態について説明する。 Hereinafter, a method of predicting the playback length of a song based on a playlist structure and a specific embodiment of the system will be described.
一般的なプレイリストは、単純な規則によって曲が順に再生される。ユーザが最後まで再生せずに途中でスキップ(skip)する確率が高い曲に対しても再生のためのリソースが消耗されるようになるため、このような不必要なリソースの消耗により、全体的なサービスが円滑になされないことがある。 In a typical playlist, songs are played in sequence according to simple rules. Since the resources for playback are consumed even for songs that are likely to be skipped in the middle without being played to the end by the user, such unnecessary resource consumption causes the overall consumption of resources. Service may not be smooth.
本発明は、プレイリストの再生の流れを確率的モデルによって予測し、これに合わせて曲の再生に必要なリソースを効果的に配分することを目的とする。 It is an object of the present invention to predict the flow of playlist reproduction by a probabilistic model and to effectively allocate the resources required for song reproduction according to the prediction.
図3は、本発明の一実施形態における、サーバのプロセッサが含むことのできる構成要素の例を示したブロック図であり、図4は、本発明の一実施形態における、サーバが実行することのできる方法の例を示したフローチャートである。 FIG. 3 is a block diagram showing an example of components that can be included in the processor of the server in one embodiment of the present invention, and FIG. 4 is a block diagram of what the server executes in one embodiment of the present invention. It is a flowchart which showed the example of the possible method.
本実施形態に係るサーバ150は、クライアント(client)である複数の電子機器110、120、130、140を対象にストリーミング基盤の音楽サービスを提供するプラットフォームの役割をする。サーバ150は、電子機器110、120、130、140上にインストールされるアプリケーションと連動して音楽サービスを提供してよい。
The
サーバ150のプロセッサ222は、図4に係る音楽提供方法を実行するための構成要素として、図3に示すように、情報管理部310、再生長さ予測部320、およびデータ提供部330を含んでよい。実施形態によって、プロセッサ222の構成要素は、選択的にプロセッサ222に含まれても除外されてもよい。また、実施形態によって、プロセッサ222の構成要素は、プロセッサ222の機能の表現のために分離されても併合されてもよい。
As shown in FIG. 3, the
このようなプロセッサ222およびプロセッサ222の構成要素は、図4の音楽提供方法が含む段階410~段階440を実行するようにサーバ150を制御してよい。例えば、プロセッサ222およびプロセッサ222の構成要素は、メモリ221が含むオペレーティングシステムのコードと少なくとも1つのプログラムのコードとによる命令(instruction)を実行するように実現されてよい。
Such a
ここで、プロセッサ222の構成要素は、サーバ150に記録されたプログラムコードが提供する命令に従ってプロセッサ222によって実行される、プロセッサ222の互いに異なる機能(different functions)の表現であってよい。例えば、サーバ150がプレイリストと関連する情報を管理するように上述した命令に従ってサーバ150を制御するプロセッサ222の機能的表現として、情報管理部310が利用されてよい。
Here, the components of the
段階410において、プロセッサ222は、サーバ150の制御と関連する命令がロードされたメモリ221から必要な命令を読み取ってよい。この場合、読み取られた命令は、以下で説明する段階420~段階440をプロセッサ222が実行するように制御するための命令を含んでよい。
At step 410,
段階420において、情報管理部310は、プレイリストそれぞれに対して曲構成情報と再生履歴情報を調査および集計して、記録および管理してよい。プレイリストとは、少なくとも1つの音楽コンテンツ(曲)で構成されたトラック集であって、ユーザが直接構成するか他人から共有された再生リスト、あるいはサービス上で自動推薦された再生リストなどを含んでよい。情報管理部310は、音楽サービスでユーザが消費した履歴のあるプレイリストを対象に、各プレイリストの曲構成に関する全般的な情報、またはユーザによる再生ログデータを記録および管理してよい。図5は、プレイリスト_Aの曲構成情報500を含む管理テーブルの例を示した図である。図5に示すように、song_1->song_2->song_3->song_4の順に構成されたプレイリスト_Aに対し、曲構成情報500は、曲再生順序501、曲構成のテーマやタイトルなどのような主題502、全体の再生長さ503、平均の再生長さ504、曲ごとの再生長さ505、ジャンル506、BPM(beat per minute)507などを含んでよい。図6は、プレイリスト_Aの再生履歴情報600を含む管理テーブルの例を示した図である。プレイリスト_Aに対してすべてのユーザが同じ順序で曲を再生すると仮定する。図6に示すように、song_1->song_2->song_3->song_4の順に構成されたプレイリスト_Aに対し、再生履歴情報600は、曲再生順序601と、ユーザそれぞれが曲ごとの全体の再生長さに対して実際にどのくらい再生したかを示す再生の割合である実際の再生長さ602などを含んでよい。さらに、情報管理部310は、プレイリスト_Aの各曲に対し、該当の曲が再生された時点に関する追加情報として、曲再生時点の時間帯、天気、位置、社会的イシューなどを追加で収集して各ユーザの実際の再生長さ602とともに管理してよい。このような追加情報は、音楽サービスを利用するユーザの電子機器110、120、130、140から取得した情報、または電子機器110、120、130、140から取得した情報を利用してインターネット上で取得した情報を包括したものを意味してよい。
In the stage 420, the
再び図4を参照すると、段階430において、再生長さ予測部320は、電子機器110から特定のプレイリストに対する再生要求が受信されれば、段階420で管理されているプレイリストの曲構成情報と再生履歴情報を利用して、特定のプレイリストの曲構成による曲ごとの再生長さを予測してよい。再生長さ予測部320は、電子機器110のユーザが要求した特定のプレイリストの再生の流れを確率的モデルによって予測してよい。本発明では、各プレイリストの曲構成情報と再生履歴情報とを関連付けることのできるモデルを設計し、このようなモデルを利用して予め計算されたデータを確保してよい。例えば、Track1の後にTrack2が配置される曲構成を含むプレイリストのうち、主題Aのプレイリストでは平均的にTrack2が全体再生時間120秒のうちの90秒が再生され、主題Bのプレイリストでは平均的にTrack2が全体再生時間120秒のうちの80秒が再生されることがある。再生長さ予測部320は、ユーザが特定のプレイリストの再生を要求すれば、該当のプレイリストの曲構成に対応する既存のプレイリストのログデータを取得して電子機器110と共有してよい。一例として、再生長さ予測部320は、曲どうしの類似度に基づき、ユーザによる再生履歴があるプレイリストのうちから電子機器110が要求した特定のプレイリストの曲構成と対応する既存のプレイリストを探索し、該当のプレイリストの再生履歴情報を利用して特定のプレイリストの曲ごとに予想再生長さを算出してよい。
Referring to FIG. 4 again, in the stage 430, when the playback request for the specific playlist is received from the
図7は、本発明の一実施形態における、曲どうしの類似度に基づいてプレイリストの曲ごとに予想再生長さを算出する過程の一例を示したフローチャートである。 FIG. 7 is a flowchart showing an example of a process of calculating an expected reproduction length for each song in a playlist based on the similarity between songs in one embodiment of the present invention.
段階701において、再生長さ予測部320は、各曲に対して該当の曲の音源データが入力されると、入力された音源データを学習データ形態で処理してよい。このとき、音楽コンテンツである曲は、オーディオファイルフォーマットを有するすべてのデジタルデータを意味してよく、例えば、MP3(MPEG AudioLayer-3)、WAVE(Waveform AudioFormat)、FLAC(Free Lossless AudioCodec)などを含んでよい。また、再生長さ予測部320には、曲に関するテキスト情報がともに入力されてよいが、このとき、テキスト情報は、歌詞を含むか、あるいは歌手、ジャンル、曲名、アルバム名などのようなメタ情報、さらに曲の分類や検索などと関連して入力されたハッシュタッグ(hashtag)、クエリ(query)などの情報を含んでよい。続いて、再生長さ予測部320は、前処理によって音源データを時間-周波数で表現してよい。例えば、再生長さ予測部320は、音源データをメルスペクトログラム(Mel-spectrogram)やMFCC(Mel Frequency Cepstral Coefficient)のような時間-周波数-大きさ形態のデータに変換してよい。再生長さ予測部320に各曲に対するテキスト情報がともに入力された場合には、テキスト情報を前処理してよい。一例として、再生長さ予測部320は、形態素分析器、索引語抽出器などのような言語前処理器により、入力されたテキスト情報から無意味なテキストをフィルタリングしてよい。言い換えれば、再生長さ予測部320は、テキスト情報に含まれる助詞や助動詞などのような品詞の単語、特殊記号(例えば、!、?、/など)などを除去し、体言や語根に該当する単語を抽出してよい。
In step 701, when the sound source data of the corresponding song is input to each song, the reproduction
段階702において、再生長さ予測部320は、音源データに対して前処理された学習データを学習モデルによって学習して固有の特徴を生成した後、生成された固有の特徴をデータベース(図示せず)に記録してよい。再生長さ予測部320は、ディープラーニングを利用して音源データ自体の固有の音響特徴(acoustic features)を生成してよい。一例として、再生長さ予測部320は、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)基盤の学習モデルを利用してよい。再生長さ予測部320は、CNN学習モデルを利用して音源データを多次元実数ベクトルで表現してよい。CNN学習モデルは音源データ学習層を含んでよく、以下の過程1~3は、音源データ学習層で音源データに対応する実数ベクタルを生成する過程の例であってよい。
In step 702, the reproduction
過程1において、曲の音源データ(一例として、mp3ファイル)は、前処理によってメルスペクトログラムやMFCCのような時間-周波数-大きさ形態のデータに変換されてよい。
In
過程2において、変換された音源データから1つ以上の短い時間区間(1~10秒)の複数の周波数フレームがサンプリングされて音源データの学習モデルに対する入力データとして使用されてよい。例えば、再生長さ予測部320は、複数のフレームをサンプリングし、音源データ学習層で音楽モデルの例として提示されるCNNモデルの入力として活用してよい。これにより、音源データの学習のためのCNNモデルは、サンプリングされたフレームと同じ数のチャネルを有するモデルとなる。あるいは、生成されたフレームそれぞれを単一チャンネルとして使用し、各フレームに対して固有の畳み込み/プーリング過程を経た後、生成された各フレームの特徴ベクトルを接合することで全結合層の入力として使用可能となる。
In
過程3において、音源データ学習層が含むことのできる複数の畳み込み(convolution)およびプーリング(pooling)層を繰り返し構成することにより、音楽フレームから抽象化された特徴(feature)を生成してよい。畳み込みではパッチの大きさが多様に構成されてよく、プーリングも最大値(max)を利用したプーリング技法、平均値(average)を利用したプーリング技法、および前記2つのプーリング技法を接合したハイブリッドプーリング技法などのような多様なプーリング技法のうちの少なくとも1つが使用されてよい。
In
複数の畳み込みおよびプーリング層上には音響特徴を生成するための全結合層(fully-connected layer)があり、各層別の関数は、シグモイド(sigmoid)関数、双曲線(Hyperbolic Tangent:tanh)関数、ReLU(Rectified Linear Unit)関数などのような多様な関数が使用されてよい。結局、音源データに対して1つの多次元実数ベクトルが生成されてよい。例えば、与えられた最初の音源データm0は、音楽学習モデルの出力層において、x0={0.2、-0.1、0.3、・・・}の形態のように1つの多次元実数ベクトルで表現されてよい。 On multiple convolution and pooling layers, there is a full-connected layer for generating acoustic features, and the functions for each layer are sigmoid function, hyperbolic tangent (tanh) function, and ReLU. Various functions such as the (Rectifier Unit) function may be used. After all, one multidimensional real number vector may be generated for the sound source data. For example, the given first sound source data m0 is one multidimensional real number in the output layer of the music learning model, such as the form of x0 = {0.2, -0.1, 0.3, ...}. It may be expressed as a vector.
また、再生長さ予測部320は、各曲に対してテキスト情報がともに入力された場合、テキスト情報も多次元実数ベクトルで表現してよい。一例として、再生長さ予測部320は、テキスト情報に対する前処理によってフィルタリングされたテキストを事前学習された学習モデルによってワードベクトル(word vector)として生成してよい。例えば、ワードベクトルは、数値型(numerical)多次元ベクトル形態で表現されてよい。ワードベクトル生成のために、単語出現頻度ヒストグラム、TF(term frequency)/IDF(inverse document frequency)、言語学習モデル(例えば、word2vec、phrase2vec、document2vecなど)などが使用されてよい。例えば、「イ・スンファン 良い日 バラード 1992」などのような歌手/ジャンル/曲名/年度は、1つのn次元実数ベクトルv={0.3、-1.2、1.2、・・・}のように表現可能である。このとき、言語学習モデルのためのテキスト情報フィールド(歌手、ジャンル、曲名、年度など)の順に固定する必要はなく、目的に合うように変更可能である。
Further, when the text information is input together for each song, the reproduction
上述した再生長さ予測部320は、音源データの特徴ベクトルとテキスト情報のワードベクトルを曲ごとにデータベースに記録および維持してよい。音源データの特徴ベクトルとテキスト情報のワードベクトルはそれぞれ、個別のデータベースで構築されてもよいし、あるいは1つのデータベースで構築されてもよい。このようなデータベースは、サーバ150に含まれる構成要素によって実現されてもよいし、あるいはサーバ150と連動可能な個別のシステム上に構築された外部データベースとして存在してもよい。
The reproduction
段階703において、再生長さ予測部320は、曲それぞれに対してデータベースに記録された音源データに対する固有の特徴を利用して曲どうしの類似度を算出してよく、曲どうしの類似度に基づき、ユーザによる再生履歴があるプレイリストのうちから電子機器110が要求した特定のプレイリストの曲構成と対応するプレイリストを取得してよい。他の例として、再生長さ予測部320は、音源データの特徴ベクトルとともに、テキスト情報のワードベクトルを複合的に利用して曲どうしの類似度を算出することも可能である。言い換えれば、再生長さ予測部320は、曲どうしの類似度に基づき、電子機器110が要求した特定のプレイリストの曲と同一あるいは類似の曲で構成されたプレイリストを取得してよい。
In step 703, the playlist
段階704において、再生長さ予測部320は、段階703で取得したプレイリストの再生履歴情報を利用して特定のプレイリストを構成している各曲と対応する曲の多数のユーザによる実際の再生長さを平均する方式により、特定のプレイリストの曲ごとの予想再生長さを算出してよい。
In the stage 704, the playback
図8に示すように、再生長さ予測部320は、電子機器110が要求した特定のプレイリストが、song_i->song_ii->song_iii->song_ivの順に構成されたPlaylist_I 800であるとするとき、曲の構成がsong_i、song_ii、song_iii、song_ivと同一あるいは類似の曲(song_i’、song_i’’、・・・、song_ii’、song_ii’’、・・・、song_iii’、song_iii’’、・・song_iv’、song_iv’’、・・・)を含むプレイリスト(Playlist_1~N)810を探索する。プレイリスト(Playlist_1~N)810にはPlaylist_I800の曲構成song_i->song_ii->song_iii->song_ivのうちの少なくとも2曲以上が連続する曲構成(例えば、song_i->song_ii、song_ii->song_iii、song_iii->song_iv)と対応するプレイリストが含まれてよい。
As shown in FIG. 8, when the specific playlist requested by the
図9を参照すると、再生長さ予測部320は、電子機器110が要求した特定のプレイリスト800に対応するプレイリスト810を探索し、該当のプレイリスト810の曲ごとに再生長さを平均してよい。例えば、特定のプレイリストの最初の曲であるsong_iと同一あるいは類似の曲(song_i、song_i’、song_i’’)の実際の再生長さを平均し、特定のプレイリストの再生を要求したユーザによってsong_iがどのくらい再生されるかを予測してよい。特定のプレイリスト800の曲構成と同一あるいは類似のプレイリスト810の再生履歴情報に基づくユーザによる再生長さが平均的に90%、10%、20%、75%である場合、song_i->song_ii->song_iii->song_ivの順に構成されたPlaylist_I800に対する曲ごとの再生長さを90%、10%、20%、75%と予測してよい。
Referring to FIG. 9, the reproduction
したがって、再生長さ予測部320は、ユーザが要求した特定のプレイリストに対して曲構成が同一あるいは類似のプレイリストを消費した他のユーザの再生ログを平均することにより、特定のプレイリストの曲ごとに再生長さを予測することができる。このとき、再生長さ予測部320は、プレイリストに対するユーザの再生ログが十分に蓄積されている場合には、他のユーザの再生ログではなくユーザの再生ログだけを利用して特定のプレイリストの曲ごとの再生長さを個人化して予測することも可能である。また、再生長さ予測部320は、電子機器110が特定のプレイリストを要求した時点の時間帯、天気、位置、社会的イシューなどとマッチングする追加情報を有する再生ログを利用することで、ユーザ状況による特定のプレイリストの曲ごとに再生長さを予測することも可能である。
Therefore, the playback
再び図4を参照すると、段階440において、データ提供部330は、電子機器110が要求した特定のプレイリストに対して段階430で予測した曲ごとの再生長さに対応するリソースを分配し、特定のプレイリストの再生のための音源データを電子機器110に提供してよい。データ提供部330は、特定のプレイリストに対して予測された曲ごとの再生長さに合わせて曲の再生に必要なリソースを効果的に分配してプリフェッチを実施してよい。例えば、図10に示すように、曲の構成が同一あるいは類似のプレイリストを消費した他のユーザの再生ログに基づき、song_i->song_ii->song_iii->song_ivの順に構成されたPlaylist_I800の再生長さが曲ごとに90%、10%、20%、75%と予測された場合、電子機器110ではsong_iの音源データを9.0秒単位のチャンク(chunk)で受信して再生すると同時に、song_iiは1.0秒、song_iiiは2.0秒、song_ivは7.5秒単位で該当の音源データを予めダウンロードして次の再生を準備するようにする。言い換えれば、データ提供部330は、電子機器110のユーザが要求した特定のプレイリスト800に対し、最後まで再生される確率が高い曲の場合にはより多くのデータをより早くプリフェッチし、最後まで再生される確率が低い曲の場合にはより少ないデータをよりゆっくりプリフェッチする。
Referring to FIG. 4 again, in the stage 440, the
このように、本発明の実施形態によると、プレイリストの曲構成に基づき、曲ごとに該当の曲が最後まで再生される確率である再生長さを予測することができ、これに基づいて曲ごとにプリフェッチを効率的に実行することで、滑らかな再生環境を提供することができる。さらに、本発明の実施形態によると、プレイリストに対し、曲ごとの再生長さに基づいて不必要なデータフェッチを減らすことができ、これによってサービス全般にわたって消耗されるリソースを効率的に利用することができる。 As described above, according to the embodiment of the present invention, it is possible to predict the playback length, which is the probability that the corresponding song is played to the end for each song, based on the song structure of the playlist, and the song is based on this. By efficiently executing prefetch for each, a smooth playback environment can be provided. Further, according to an embodiment of the present invention, it is possible to reduce unnecessary data fetches for playlists based on the playback length of each song, thereby efficiently utilizing the resources consumed throughout the service. be able to.
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。 The devices described above may be implemented by hardware components, software components, and / or combinations of hardware components and software components. For example, the apparatus and components described in the embodiments include a processor, a controller, an ALU (arithmetic logic unit), a digital signal processor, a microcomputer, an FPGA (field programgable gate array), a PLU (programmable log unit), a microprocessor, and the like. Alternatively, it may be implemented using one or more general purpose computers or special purpose computers, such as various devices capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the OS. The processing device may also respond to the execution of the software, access the data, and record, manipulate, process, and generate the data. For convenience of understanding, one processing device may be described as being used, but one of ordinary skill in the art may include a plurality of processing elements and / or a plurality of types of processing elements. You can understand. For example, the processing device may include multiple processors or one processor and one controller. Also, other processing configurations such as parallel processors are possible.
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。 The software may include computer programs, codes, instructions, or a combination of one or more of these, configuring the processing equipment to operate at will, or instructing the processing equipment independently or collectively. You may do it. The software and / or data is embodied in any type of machine, component, physical device, computer recording medium or device to be interpreted based on the processing device or to provide instructions or data to the processing device. good. The software is distributed on a computer system connected by a network and may be recorded or executed in a distributed state. The software and data may be recorded on one or more computer-readable recording media.
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。ここで、媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD-ROMおよびDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。 The method according to the embodiment may be realized in the form of program instructions that can be executed by various computer means and recorded on a computer-readable medium. Here, the medium may be a continuous recording of a computer-executable program or a temporary recording for execution or download. Further, the medium may be various recording means or storage means in the form of a combination of a single piece of hardware or a plurality of pieces of hardware, and is not limited to a medium directly connected to a certain computer system, but is distributed over a network. It may exist. Examples of media include hard disks, floppy (registered trademark) disks, magnetic media such as magnetic tapes, optical media such as CD-ROMs and DVDs, optical magnetic media such as floptic discs, and the like. And may include ROM, RAM, flash memory, etc., and may be configured to record program instructions. Other examples of media include recording media or storage media managed by application stores that distribute applications, sites that supply or distribute various other software, servers, and the like.
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。 As described above, the embodiments have been described based on the limited embodiments and drawings, but those skilled in the art will be able to make various modifications and modifications from the above description. For example, the techniques described may be performed in a different order than the methods described, and / or components such as the systems, structures, devices, circuits described may be in a different form than the methods described. Appropriate results can be achieved even if they are combined or combined, and confronted or replaced by other components or equivalents.
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。 Therefore, even if it is a different embodiment, if it is equivalent to the claims, it belongs to the attached claims.
Claims (20)
前記コンピュータシステムは、少なくとも1つのプロセッサを含み、
当該方法は、
前記少なくとも1つのプロセッサが、各プレイリストに対して曲構成情報と再生履歴情報を管理する段階と、
前記少なくとも1つのプロセッサが、電子機器から特定のプレイリストに対する再生要求を受信すると、前記曲構成情報と前記再生履歴情報を利用して前記特定のプレイリストの曲ごとに該当の曲が再生される確率である再生長さを予測する段階と
を含む、方法。 The way a computer system does
The computer system includes at least one processor.
The method is
A stage in which the at least one processor manages song composition information and playback history information for each playlist.
When the at least one processor receives a playback request for a specific playlist from an electronic device, the corresponding song is played for each song in the specific playlist using the song composition information and the playback history information. A method that includes a step of predicting the play length, which is a probability.
前記プレイリストそれぞれに対し、曲の再生順序と曲ごとの全体の再生長さを含む曲構成情報、および曲ごとの前記全体の再生長さに対してユーザそれぞれが実際に再生した割合を示す実際の再生長さを含む再生履歴情報を管理する段階
を含む、請求項1に記載の方法。 The management stage is
For each of the playlists, the song composition information including the playback order of the songs and the total playback length of each song, and the actual ratio of each user to the total playback length of each song. The method according to claim 1, comprising a step of managing playlist information including the playback length of the song.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、
前記取得したプレイリストの再生履歴情報を利用して前記特定のプレイリストの曲ごとに予想再生長さを算出する段階と
を含む、請求項1または2に記載の方法。 The prediction stage is
The stage of acquiring the playlist corresponding to the song composition of the specific playlist by using the song composition information, and
The method according to claim 1 or 2, comprising the step of calculating the expected playback length for each song of the specific playlist using the playback history information of the acquired playlist.
曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得すること
を特徴とする、請求項3に記載の方法。 The acquisition stage is
The method according to claim 3, wherein a playlist composed of songs that are the same as or similar to the songs included in the specific playlist is acquired based on the degree of similarity between the songs.
各曲に対し、該当の曲の音源データをディープラーニング学習モデルによって学習して固有の音源特徴を生成する段階と、
前記音源特徴を利用して曲どうしの類似度を算出する段階と、
前記曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得する段階と
を含む、請求項3に記載の方法。 The acquisition stage is
For each song, the stage of learning the sound source data of the corresponding song by the deep learning learning model to generate unique sound source features, and
At the stage of calculating the similarity between songs using the sound source characteristics,
The method according to claim 3, comprising the step of acquiring a playlist composed of songs that are the same as or similar to the songs included in the specific playlist based on the similarity between the songs.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、
前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する全体ユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとの予想再生長さを算出する段階と
を含む、請求項2に記載の方法。 The prediction stage is
The stage of acquiring the playlist corresponding to the song composition of the specific playlist by using the song composition information, and
A step of calculating an expected playback length for each song of the specific playlist by a method of averaging the actual playback lengths of all users for each song of the specific playlist in the acquired playlist. The method according to claim 2, wherein the method comprises.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、
前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する前記電子機器のユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとの予想再生長さを算出する段階と
を含む、請求項2に記載の方法。 The prediction stage is
The stage of acquiring the playlist corresponding to the song composition of the specific playlist by using the song composition information, and
The expected playback length of each song of the specific playlist is calculated by a method of averaging the actual playback lengths of the users of the electronic device for the songs corresponding to each song of the specific playlist in the acquired playlist. The method of claim 2, comprising the step of calculation.
前記プレイリストの各曲に対して該当の曲が再生された時点の時間、天気、位置のうちの少なくとも1つを含む追加情報を前記再生履歴情報とともに管理する段階
をさらに含み、
前記予測する段階は、
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得する段階と、
前記取得したプレイリストのうちで前記特定のプレイリストを要求した時点の追加情報とマッチングするプレイリストの再生履歴情報を利用して、前記特定のプレイリストの曲ごとの予想再生長さを算出する段階と
を含む、請求項2に記載の方法。 The management stage is
Further including the step of managing additional information including at least one of the time, weather, and position at the time when the corresponding song is played for each song in the playlist together with the playback history information.
The prediction stage is
The stage of acquiring the playlist corresponding to the song composition of the specific playlist by using the song composition information, and
Among the acquired playlists, the expected playback length for each song of the specific playlist is calculated by using the playlist playback history information that matches the additional information at the time when the specific playlist is requested. The method of claim 2, comprising the steps.
前記少なくとも1つのプロセッサが、前記特定のプレイリストの曲ごとの再生長さに従って曲の再生に必要なリソースを分配し、前記特定のプレイリストの再生のための音源データを前記電子機器に提供する段階
をさらに含む、請求項1乃至8のいずれか一項に記載の方法。 The method is
The at least one processor distributes resources necessary for playing a song according to the playing length of each song in the specific playlist, and provides sound source data for playing the specific playlist to the electronic device. The method of any one of claims 1-8, further comprising a step.
前記特定のプレイリストの曲ごとに、該当の曲の予測された再生長さに対応する単位でプリフェッチを実行すること
を特徴とする、請求項9に記載の方法。 The above-mentioned stage of provision is
The method of claim 9, wherein for each song in the particular playlist, prefetching is performed in units corresponding to the predicted playback length of the song.
メモリ、および
前記メモリに接続され、前記メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
各プレイリストに対して曲構成情報と再生履歴情報を管理する情報管理部と、
電子機器から特定のプレイリストに対する再生要求が受信されれば、前記曲構成情報と前記再生履歴情報を利用して前記特定のプレイリストの曲ごとに該当の曲が再生される確率である再生長さを予測する再生長さ予測部と
を含む、コンピュータシステム。 It ’s a computer system,
Includes memory and at least one processor connected to said memory and configured to execute computer-readable instructions contained in said memory.
The at least one processor
An information management unit that manages song composition information and playback history information for each playlist,
When a playback request for a specific playlist is received from an electronic device, the playback length is the probability that the song is played for each song in the specific playlist using the song composition information and the playback history information. A computer system that includes a playlist length predictor that predicts the song.
前記プレイリストそれぞれに対し、曲再生順序と曲ごとの全体の再生長さを含む曲構成情報、および曲ごとに前記全体の再生長さに対してユーザそれぞれが実際に再生した割合を示す実際の再生長さを含む再生履歴情報を管理すること
を特徴とする、請求項12に記載のコンピュータシステム。 The information management department
For each of the playlists, the song composition information including the song playback order and the total playback length of each song, and the actual ratio of each song actually played by each user to the total playback length of each song. The computer system according to claim 12, wherein the playback history information including the playback length is managed.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得し、
前記取得したプレイリストの再生履歴情報を利用して前記特定のプレイリストの曲ごとに予想再生長さを算出すること
を特徴とする、請求項12または13に記載のコンピュータシステム。 The reproduction length prediction unit is
Using the song composition information, the playlist corresponding to the song composition of the specific playlist is acquired, and the playlist is obtained.
The computer system according to claim 12 or 13, wherein the expected playback length is calculated for each song of the specific playlist by using the playback history information of the acquired playlist.
曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得すること
を特徴とする、請求項14に記載のコンピュータシステム。 The reproduction length prediction unit is
The computer system according to claim 14, wherein a playlist composed of songs that are the same as or similar to the songs included in the specific playlist is acquired based on the similarity between the songs.
各曲に対し、該当の曲の音源データをディープラーニング学習モデルによって学習して固有の音源特徴を生成し、
前記音源特徴を利用して曲どうしの類似度を算出し、
前記曲どうしの類似度に基づき、前記特定のプレイリストに含まれる曲と同一あるいは類似の曲で構成されたプレイリストを取得すること
を特徴とする、請求項14に記載のコンピュータシステム。 The reproduction length prediction unit is
For each song, the sound source data of the corresponding song is learned by a deep learning learning model to generate unique sound source features.
Using the sound source characteristics, the similarity between songs is calculated, and
The computer system according to claim 14, wherein a playlist composed of songs that are the same as or similar to the songs included in the specific playlist is acquired based on the similarity between the songs.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得し、
前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する全体ユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとに予想再生長さを算出すること
を特徴とする、請求項13に記載のコンピュータシステム。 The reproduction length prediction unit is
Using the song composition information, the playlist corresponding to the song composition of the specific playlist is acquired, and the playlist is obtained.
To calculate the expected playback length for each song in the specific playlist by a method of averaging the actual playback lengths of all users for the songs corresponding to each song in the specific playlist in the acquired playlist. 13. The computer system according to claim 13.
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得し、
前記取得したプレイリストで前記特定のプレイリストの各曲と対応する曲に対する前記電子機器のユーザの実際の再生長さを平均する方式により、前記特定のプレイリストの曲ごとに予想再生長さを算出すること
を特徴とする、請求項13に記載のコンピュータシステム。 The reproduction length prediction unit is
Using the song composition information, the playlist corresponding to the song composition of the specific playlist is acquired, and the playlist is obtained.
The expected playback length for each song in the specific playlist is calculated by a method of averaging the actual playback lengths of the users of the electronic device for the songs corresponding to each song in the specific playlist in the acquired playlist. 13. The computer system according to claim 13, wherein the calculation is performed.
前記プレイリストの各曲に対して該当の曲が再生された時点の時間、天気、位置のうちの少なくとも1つを含む追加情報を前記再生履歴情報とともに管理し、
前記再生長さ予測部は、
前記曲構成情報を利用して前記特定のプレイリストの曲構成と対応するプレイリストを取得し、
前記取得したプレイリストのうちで前記特定のプレイリストを要求した時点の追加情報とマッチングするプレイリストの再生履歴情報を利用して、前記特定のプレイリストの曲ごとに予想再生長さを算出すること
を特徴とする、請求項13に記載のコンピュータシステム。 The information management department
For each song in the playlist, additional information including at least one of the time, weather, and position at the time when the song is played is managed together with the playback history information.
The reproduction length prediction unit is
Using the song composition information, the playlist corresponding to the song composition of the specific playlist is acquired, and the playlist is obtained.
The expected playback length is calculated for each song of the specific playlist by using the playlist playback history information that matches the additional information at the time when the specific playlist is requested among the acquired playlists. 13. The computer system according to claim 13.
前記特定のプレイリストの曲ごとの再生長さにしたがって曲の再生に必要なリソースを分配し、前記特定のプレイリストの再生のための音源データを前記電子機器に提供するデータ提供部
をさらに含む、請求項12乃至19のいずれか一項に記載のコンピュータシステム。 The at least one processor
Further includes a data providing unit that distributes resources necessary for playing a song according to the playing length of each song of the specific playlist and provides sound source data for playing the specific playlist to the electronic device. , The computer system according to any one of claims 12 to 19.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2018/002318 WO2019164041A1 (en) | 2018-02-26 | 2018-02-26 | Method and system for predicting song reproduction length on basis of playlist configuration |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021519944A JP2021519944A (en) | 2021-08-12 |
JP7061679B2 true JP7061679B2 (en) | 2022-04-28 |
Family
ID=67687124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020544826A Active JP7061679B2 (en) | 2018-02-26 | 2018-02-26 | A method and system for predicting the playing length of a song based on the composition of the playlist |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7061679B2 (en) |
KR (1) | KR102496542B1 (en) |
WO (1) | WO2019164041A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000134371A (en) | 1998-08-20 | 2000-05-12 | Victor Co Of Japan Ltd | Digital audio signal transmitting system |
JP2006079198A (en) | 2004-09-07 | 2006-03-23 | Sony Corp | Content registering device and content search device |
JP2017168034A (en) | 2016-03-18 | 2017-09-21 | ヤマハ株式会社 | Update method of content list |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7345232B2 (en) * | 2003-11-06 | 2008-03-18 | Nokia Corporation | Automatic personal playlist generation with implicit user feedback |
KR100805169B1 (en) * | 2005-07-19 | 2008-02-21 | (주)엠베이스솔루션 | Method for Transmission of Real Time Music or Music File in Conversational Manner |
JP4757704B2 (en) * | 2006-05-01 | 2011-08-24 | 任天堂株式会社 | Music playback program, music playback device, music playback method, and music playback system |
KR20140092863A (en) * | 2011-10-31 | 2014-07-24 | 옴니폰 리미티드 | Methods, systems, devices and computer program products for managing playback of digital media content |
KR101415518B1 (en) * | 2012-08-06 | 2014-08-07 | 에스케이플래닛 주식회사 | Music broadcasting service method based on play list, and apparatus thereof |
KR20160028004A (en) * | 2014-09-01 | 2016-03-11 | (주)비글 | Customizing music contents providing system and the method for calory consumption |
KR101942459B1 (en) * | 2016-06-01 | 2019-01-28 | 네이버 주식회사 | Method and system for generating playlist using sound source content and meta information |
KR101927706B1 (en) * | 2016-08-03 | 2018-12-11 | 주식회사 버즈뮤직코리아 | Method for recommending music for various situations and apparatus using the same |
-
2018
- 2018-02-26 JP JP2020544826A patent/JP7061679B2/en active Active
- 2018-02-26 KR KR1020207019734A patent/KR102496542B1/en active IP Right Grant
- 2018-02-26 WO PCT/KR2018/002318 patent/WO2019164041A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000134371A (en) | 1998-08-20 | 2000-05-12 | Victor Co Of Japan Ltd | Digital audio signal transmitting system |
JP2006079198A (en) | 2004-09-07 | 2006-03-23 | Sony Corp | Content registering device and content search device |
JP2017168034A (en) | 2016-03-18 | 2017-09-21 | ヤマハ株式会社 | Update method of content list |
Also Published As
Publication number | Publication date |
---|---|
WO2019164041A1 (en) | 2019-08-29 |
KR20200121787A (en) | 2020-10-26 |
JP2021519944A (en) | 2021-08-12 |
KR102496542B1 (en) | 2023-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11921778B2 (en) | Systems, methods and apparatus for generating music recommendations based on combining song and user influencers with channel rule characterizations | |
EP3508986B1 (en) | Music cover identification for search, compliance, and licensing | |
US20190147051A1 (en) | Intelligent playing method and apparatus based on preference feedback | |
US10936653B2 (en) | Automatically predicting relevant contexts for media items | |
CN111143604B (en) | Similarity matching method and device for audio frequency and storage medium | |
US11636835B2 (en) | Spoken words analyzer | |
US8666749B1 (en) | System and method for audio snippet generation from a subset of music tracks | |
JP2011081780A (en) | Media item clustering based on similarity data | |
KR101942459B1 (en) | Method and system for generating playlist using sound source content and meta information | |
US20150334204A1 (en) | Intelligent auto-caching of media | |
EP4178206A1 (en) | System (embodiments) for harmoniously combining video files and audio files and corresponding method | |
KR102046411B1 (en) | Method and system for generating playlist using user play log of multimedia content | |
EP3985669A1 (en) | Methods and systems for automatically matching audio content with visual input | |
WO2024001548A1 (en) | Song list generation method and apparatus, and electronic device and storage medium | |
JP7061679B2 (en) | A method and system for predicting the playing length of a song based on the composition of the playlist | |
KR102031282B1 (en) | Method and system for generating playlist using sound source content and meta information | |
TWI776102B (en) | Method and system for providing sudden rising music chart | |
JP7106663B2 (en) | Growth graph-based playlist recommendation method and system | |
KR101837341B1 (en) | Method and system for dividing viedo content | |
US10368114B2 (en) | Media channel creation based on free-form media input seeds | |
US20240184515A1 (en) | Vocal Attenuation Mechanism in On-Device App | |
KR20200118826A (en) | Media content reuse method and system based on user usage patterns | |
Margounakis et al. | Music Management in the Digital Age |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7061679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |