JP6672707B2 - Playlist generation method, playlist generation device, program, and list generation method - Google Patents
Playlist generation method, playlist generation device, program, and list generation method Download PDFInfo
- Publication number
- JP6672707B2 JP6672707B2 JP2015215290A JP2015215290A JP6672707B2 JP 6672707 B2 JP6672707 B2 JP 6672707B2 JP 2015215290 A JP2015215290 A JP 2015215290A JP 2015215290 A JP2015215290 A JP 2015215290A JP 6672707 B2 JP6672707 B2 JP 6672707B2
- Authority
- JP
- Japan
- Prior art keywords
- playlist
- song
- range
- recommended
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 146
- 238000009826 distribution Methods 0.000 claims description 144
- 230000008569 process Effects 0.000 claims description 105
- 238000012545 processing Methods 0.000 claims description 56
- 230000010354 integration Effects 0.000 claims description 9
- 238000009827 uniform distribution Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 67
- 238000010586 diagram Methods 0.000 description 35
- 238000000605 extraction Methods 0.000 description 32
- 230000000875 corresponding effect Effects 0.000 description 26
- 239000000284 extract Substances 0.000 description 19
- 238000012937 correction Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 17
- 230000005236 sound signal Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000001902 propagating effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 3
- 206010039897 Sedation Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000036280 sedation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、プレイリスト生成方法、プレイリスト生成装置、及びプログラム、並びに再生リスト生成方法に関する。 The present invention relates to a playlist generation method, a playlist generation device, a program, and a playlist generation method.
近年、通信ネットワークに接続可能な電子機器の種類が増加する傾向にあり、各種電子機器に対し通信ネットワークを利用したサービスが提供されるようになってきている。特に、インターネット等の通信ネットワークを利用したサービスの1つとして、各種電子機器に対する音楽配信サービスの普及が進んでいる。 In recent years, types of electronic devices connectable to a communication network have been increasing, and services using the communication network have been provided to various electronic devices. In particular, as one of services using a communication network such as the Internet, music distribution services for various electronic devices have been widely spread.
音楽配信サービスの1つとして、電子機器の利用者(オペレータ)が聞きたい曲のイメージを表すキーワードを音声で指定することにより、配信サーバがイメージに合った曲を抽出したプレイリストを生成して電子機器に配信するサービスが知られている。プレイリストの生成方法としては、プレイリスト及び曲のそれぞれにイメージを表す特徴量を設定しておき、プレイリストの特徴量との合致度の高い特徴量を持つ曲をプレイリストに登録する方法が知られている(例えば、特許文献1を参照)。 As one of the music distribution services, a user (operator) of an electronic device specifies a keyword representing an image of a song to be heard by voice, and the distribution server generates a playlist in which songs matching the image are extracted. Services for delivering to electronic devices are known. As a method of generating a playlist, there is a method in which a feature amount representing an image is set for each of the playlist and the song, and a song having a feature amount having a high degree of matching with the feature amount of the playlist is registered in the playlist. It is known (see, for example, Patent Document 1).
イメージの特徴量に基づいて音楽データのプレイリストを作成する場合、イメージ特徴空間におけるプレイリストの特徴量を中心とした所定の範囲内の特徴量を持つ曲がプレイリストに登録される。そのため、イメージの特徴量の類似したプレイリストがある場合、ある1曲を登録対象とするプレイリストが複数存在する場合がある。 When creating a playlist of music data based on the feature amount of an image, a song having a feature amount within a predetermined range centered on the feature amount of the playlist in the image feature space is registered in the playlist. Therefore, when there are playlists having similar image feature amounts, there may be a plurality of playlists in which a certain song is to be registered.
また、プレイリストを生成する際には、曲のイメージとは別の条件(属性)を表すキーワードを音声で指定することにより、プレイリストへの登録対象となる曲を絞り込んでプレイリストを生成することも可能となっている。そのため、曲を絞り込んでプレイリストを生成した場合、プレイリストに登録される曲数が少なく、かつイメージの特徴量に偏りが生じる可能性がある。 When a playlist is generated, a keyword indicating a condition (attribute) different from the image of the song is specified by voice, thereby narrowing down the songs to be registered in the playlist and generating the playlist. It is also possible. Therefore, when the playlist is generated by narrowing down the songs, the number of songs registered in the playlist may be small and the feature amount of the image may be biased.
このように、プレイリストに登録される曲数が少なく、かつイメージの特徴量に偏りが生じた場合、プレイリストのイメージと登録された曲のみから利用者が抱くイメージとに齟齬が生じ、違和感を抱く可能性がある。また、曲(音楽)に限らず、小説等の朗読再生用の文書データや画像データ等、イメージを表す特徴量により分類可能なデータの再生リストをイメージに基づいて作成する場合にも、同様のことが言える。 As described above, when the number of songs registered in the playlist is small and the feature amount of the image is biased, a discrepancy occurs between the image of the playlist and the image held by the user only from the registered songs, and a sense of incongruity occurs. May be embraced. The same applies to a case where a reproduction list of data that can be classified based on a feature amount representing an image, such as document data for reading and reproducing a novel or the like, image data, etc., based on an image, is not limited to a song (music). I can say that.
1つの側面において、本発明は、提示したプレイリストのイメージとプレイリストに含まれる曲のイメージとの齟齬により利用者に与える違和感を低減させることを目的とする。 In one aspect, an object of the present invention is to reduce a sense of discomfort given to a user due to a discrepancy between an image of a presented playlist and an image of a song included in the playlist.
1つの態様のプレイリスト生成方法では、コンピュータが以下の処理を実行する。コンピュータは、まず、利用者からのプレイリストの生成要求に含まれる当該プレイリストへの登録対象とする曲の属性を表す属性情報に基づいて曲の絞り込みを行う。次に、コンピュータは、絞り込んだ曲についてのイメージを表す特徴量と、データベース上で各プレイリストに対応付けられている範囲であってプレイリストへの登録対象とする曲についての特徴量が分布する範囲を規定しているプレイリストの範囲とに基づいて、イメージを表す特徴量が当該範囲に含まれる曲を登録したプレイリストを、推薦プレイリスト候補として生成する。そして、生成した推薦プレイリスト候補に登録された曲についての特徴量の分布が、生成要求によって生成が要求されているプレイリストである要求プレイリストについて想定している当該範囲に対して偏っている場合に、推薦プレイリスト候補に含まれる曲についての当該分布と、推薦プレイリスト候補について想定している当該範囲と、要求プレイリストについて想定している当該範囲とに基づいて、推薦プレイリスト候補から、利用者に提示するプレイリストである推薦プレイリストを決定する。
In one embodiment, the computer executes the following processing. First, the computer narrows down songs based on attribute information indicating attributes of songs to be registered in the playlist included in the playlist generation request from the user. Then, the computer, the feature of the song for the feature value representing the image of the song narrowed, and registered in a range that has been correlated to each play list on the database to a playlist is distributed Based on the range of the play list defining the range , a play list in which the tunes whose features representing the images are included in the range is generated as a recommended play list candidate . Then, the feature quantity distribution of the songs registered in the generated recommendation playlist candidates, biased against the corresponding range is assumed about the requested playlist is a playlist generation is requested by the generation request If you are, based on the corresponding distributions for the song to be included in the recommendation playlist candidate, and the range assumed for recommended playlist candidate, and the range assumed with the requirements playlist recommendation playlist From the candidates , a recommended playlist that is a playlist to be presented to the user is determined .
上述の態様によれば、提示したプレイリストのイメージとプレイリストに含まれる曲のイメージとの齟齬により利用者に与える違和感を低減させることが可能となる。 According to the above aspect, it is possible to reduce the discomfort given to the user due to the discrepancy between the image of the presented playlist and the image of the music included in the playlist.
[第1の実施形態]
図1は、第1の実施形態に係るプレイリスト生成装置の機能的構成を示す図である。
[First Embodiment]
FIG. 1 is a diagram illustrating a functional configuration of the playlist generation device according to the first embodiment.
図1に示すように、本実施形態に係るプレイリスト生成装置1は、要求プレイリスト入力部101と、キーワード/属性抽出部102と、曲絞込部103と、を備える。また、プレイリスト生成装置1は、推薦プレイリスト候補生成部104と、優先度算出部105と、プレイリスト決定部106と、を備える。また、プレイリスト生成装置1は、ナレーション作成部107と、プレイリスト再生部108と、音声出力部109と、を備える。また、プレイリスト生成装置1は、キーワードDB 121と、絞込属性DB 122と、曲DB 123と、プレイリストDB 124と、を備える。
As shown in FIG. 1, the
要求プレイリスト入力部101は、利用者からのプレイリストの生成要求の入力を音声又はテキストにより受け付ける。生成要求の入力を音声により受け付ける場合、要求プレイリスト入力部101は、マイク等の音声入力部と、音声認識部とを含む。音声による入力を受け付ける場合、要求プレイリスト入力部101は、マイクで収音した周囲の音を音声信号にした後、音声認識によりテキストに変換して出力する。また、テキストによる入力を受け付ける場合、要求プレイリスト入力部101は、キーボード(ソフトウェアキーボードを含む)から文字入力を検知し、テキストにして出力する。
The request
キーワード/属性抽出部102は、音声認識部で得たテキストに基づいて、キーワードDB 121から検索キーワードを抽出するとともに、絞込属性DB 122から曲の絞り込み属性を抽出する。キーワードDB 121は、テキストと検索キーワードとの対応関係が複数登録されたデータベースである。検索キーワードは、プレイリストの検索に用いるキーワードである。絞込属性DB 122は、テキストと曲の絞り込み属性との対応関係が複数登録されたデータベースである。曲の絞り込み属性は、プレイリストに登録する曲の絞り込みに用いる属性情報である。
The keyword /
曲絞込部103は、抽出した絞り込み属性に基づいて、プレイリストへの登録対象の候補となる曲を、曲DB 123に登録された全ての曲から絞り込み属性に合致する属性を持つ曲に絞り込む。曲DB 123は、曲音声データと、曲属性と、曲のイメージ特徴量との対応関係が複数登録されたデータベースである。曲属性は、曲音声データの絞り込みに用いる属性情報である。曲のイメージ特徴量は、曲のイメージを数値化した情報である。
The
推薦プレイリスト候補生成部104は、プレイリストDB 124から曲絞込部103で絞り込んだ曲を含むプレイリストを抽出して推薦プレイリスト候補を作成する。推薦プレイリスト候補は、プレイリスト生成装置1の利用者(オペレータ)に推薦する(提示する)プレイリストの候補である。推薦プレイリスト候補は、プレイリストの名称と、曲IDと、想定分布とを含む。プレイリストDB 124は、プレイリスト毎にプレイリストの名称と、想定分布と、プレイリストの範囲とを対応付けて登録したデータベースである。プレイリストの想定分布は、曲のイメージ特徴量に基づいて曲の分布を表す際に用いるイメージ特徴空間におけるプレイリストの確率密度分布であり、例えば、確率密度分布を正規分布とする場合は、平均(中心)と分散で表現する。また、プレイリストの範囲は、イメージ特徴空間においてプレイリストへの登録対象とする曲の特徴量を規定する範囲である。すなわち、推薦プレイリスト候補生成部104は、プレイリストDB 124に登録されたプレイリストからプレイリストの範囲内に曲絞込部103で絞り込んだ曲が含まれるプレイリストを抽出して推薦プレイリスト候補を作成する。
The recommended playlist
優先度算出部105は、推薦プレイリスト候補生成部104が複数の推薦プレイリスト候補を作成した場合に各推薦プレイリスト候補の優先度を算出する。優先度算出部105は、推薦プレイリスト候補の想定分布及び範囲、並びに検索キーワードに基づいて、各推薦プレイリスト候補の優先度を算出する。
The
プレイリスト決定部106は、優先度算出部105が算出した優先度に基づいて、複数の推薦プレイリスト候補のなかから採用するプレイリスト、すなわち利用者に提示するプレイリストを決定する。
The
ナレーション作成部107は、プレイリスト決定部106が決定したプレイリストのイメージ等を表すナレーション音声データを作成する。
The
プレイリスト再生部108は、ナレーション作成部107が作成したナレーション音声データを再生するとともに、プレイリスト決定部106が決定したプレイリストに含まれる曲音声データを再生する。
The
音声出力部109は、例えばスピーカであり、プレイリスト再生部108が出力するナレーション音声データ及び曲音声データを曲音声としてプレイリスト生成装置1の外部の空間に向けて出力する。
The
このように、本実施形態に係るプレイリスト生成装置1は、生成したプレイリストを再生して出力するプレイリスト再生装置を兼ねている。
As described above, the
図2は、優先度算出部及びナレーション作成部の構成例を示す図である。
図2に示すように、優先度算出部105は、認識ずれ量算出部105aと、要求ずれ量算出部105bと、プレイリスト検索部105cと、ずれ量統合部105dと、を含む。
FIG. 2 is a diagram illustrating a configuration example of a priority calculation unit and a narration creation unit.
As illustrated in FIG. 2, the
認識ずれ量算出部105aは、推薦プレイリスト候補に含まれる曲IDと対応する曲のイメージ特徴量から求めたプレイリストの曲の特徴量の分布と、当該推薦プレイリスト候補の想定している曲の特徴量の分布との差異(認識ずれ量)を算出する。ここで、推薦プレイリスト候補(プレイリスト)の想定している曲の特徴量の分布とは、例えば、曲DB 123に登録された全ての曲を登録対象としてプレイリストを作成した場合に当該プレイリストに含まれる全ての曲の特徴量の分布である。以下の説明では、曲の特徴量の分布のことを「曲の分布」又は単に「分布」ともいう。
The recognition shift
要求ずれ量算出部105bは、推薦プレイリスト候補の想定している曲の分布と、キーワード/属性抽出部102が抽出した検索キーワードに対応したプレイリストの想定している曲の分布との差異(要求ずれ量)を算出する。要求ずれ量算出部105bは、検索キーワードに対応したプレイリストをプレイリスト検索部105cから取得する。以下の説明では、検索キーワードに対応したプレイリスト、すなわち利用者が要求するプレイリストのことを「要求プレイリスト」ともいう。
The request deviation
プレイリスト検索部105cは、キーワード/属性抽出部102が抽出した検索キーワードをキーとしてプレイリストDB 124を検索し、当該検索キーワードと合致するプレイリスト(要求プレイリスト)を取得する。
The
ずれ量統合部105dは、各推薦プレイリスト候補に対する認識ずれ量と要求ずれ量とに基づいて、各推薦プレイリスト候補の優先度を算出する。
The deviation
また、図2に示すように、ナレーション作成部107は、ナレーション文章作成部107aと、ナレーション音声作成部107bと、を含む。ナレーション文章作成部107aは、検索キーワードと、プレイリスト決定部106が決定したプレイリストとに基づいて、決定したプレイリストについての情報を含む文章(テキスト)を作成する。ナレーション音声作成部107bは、ナレーション文章作成部107aが作成した文章に基づいて、決定したプレイリストについての情報を含む音声データを作成する。
Further, as shown in FIG. 2, the
図3は、キーワードDBの例を示す図である。キーワードDB 121は、上記のように、テキストと検索キーワードとの対応関係テキストと検索キーワードとの対応関係が複数登録されたデータベースである。キーワードDB 121におけるテキスト及び検索キーワードは、それぞれ、図3に示すように、プレイリスト(曲)のイメージを表す文字列である。また、キーワードDB 121は、図3に示すように、1つの検索キーワードに対し複数のテキストを対応付けて登録することも可能である。
FIG. 3 is a diagram illustrating an example of the keyword DB. The
図4は、絞込属性DBの例を示す図である。絞込属性DB 122は、上記のように、テキストと曲の絞り込み属性との対応関係が複数登録されたデータベースである。曲の絞り込み属性は、イメージとは異なる曲の分類情報であり、図4に示すように、アーティスト名、性別、及び年代等を含む。例えば、テキストに「男性」を表す文字列が含まれている場合、キーワード/属性抽出部102は、絞り込み属性の1つとして「性別:男性」という属性情報を抽出して曲絞込部103に出力する。この場合、曲絞込部103は、プレイリストへの登録対象となる曲を、曲DB 123に登録された全ての曲から男性アーティストの曲に絞り込む。
FIG. 4 is a diagram illustrating an example of the narrow-down attribute DB. As described above, the narrowing down
また、テキストに、アーティスト名を表す文字列、発表された年代を表す文字列が含まれている場合、それらの文字列と対応付けされた属性情報を抽出して曲絞込部103に通知する。
If the text includes a character string representing the artist name and a character string representing the date of publication, the attribute information associated with those character strings is extracted and notified to the
図5は、曲DBの例を示す図である。曲DB 123は、上記のように、曲音声データと、曲属性と、曲のイメージ特徴量との対応関係が複数登録されたデータベースである。曲DB 123では、曲IDにより複数の曲音声データを識別する。1個の曲IDには、1曲分の曲音声データと、当該曲音声データの曲属性と、当該曲音声データのイメージ特徴量とが対応付けられる。
FIG. 5 is a diagram illustrating an example of the music DB. The
曲DB 123の曲属性は、イメージとは異なる曲の分類情報であり、絞込属性DB 122における絞り込み属性と対応する情報を含む。図5に示した曲DB 123では、曲属性にタイトル、アーティスト名、性別、及び年代が含まれている。
The song attribute of the
曲DB 123の曲のイメージ特徴量は、曲のイメージを数値化した情報である。この曲のイメージ特徴量は、例えば、ある1曲に対し1以上のイメージについてそれぞれどの程度当てはまるかを多段階評価により数値化した情報である。
The song image feature amount in the
図6は、プレイリストDBの例を示す図である。プレイリストDB 124は、図6に示すように、プレイリスト毎にプレイリストの名称と、想定分布と、プレイリストの範囲とを対応付けて登録したデータベースである。プレイリストの想定分布は、上記のように、曲のイメージ特徴量に基づいて曲の分布を表す際のイメージ特徴空間におけるプレイリストの平均(中心)及び分散である。また、プレイリストの範囲は、イメージ特徴空間においてプレイリストへの登録対象となる曲のイメージ特徴量を規定する範囲である。プレイリストの範囲が円又は球(超球)とする場合、プレイリストDB 124におけるプレイリストの範囲は、図6に示したように中心からの半径で指定する。
FIG. 6 is a diagram illustrating an example of the playlist DB. As shown in FIG. 6, the
図7は、イメージ特徴量の例を示す図である。図8は、イメージ特徴空間を説明する図である。 FIG. 7 is a diagram illustrating an example of the image feature amount. FIG. 8 is a diagram illustrating an image feature space.
曲のイメージ特徴量は、図7に示すように、1以上のイメージの度合いを数値化した値で表現される。このイメージ特徴量を用いることにより、曲DB 123に登録された各曲は、イメージ特徴空間内の1点で表される。また、各プレイリストの範囲は、例えばイメージ特徴空間内に円又は球(超球)で指定される。そして、ある1つのプレイリストを指定した場合、イメージ特徴空間内においてそのプレイリストの範囲内に含まれる曲が、そのプレイリストへの登録対象の曲となる。
As shown in FIG. 7, the image feature amount of a music piece is represented by a value obtained by digitizing the degree of one or more images. By using this image feature amount, each song registered in the
例えば、イメージ特徴量が第1のイメージ(イメージH)と、第2のイメージ(イメージK)の2個の場合、イメージ特徴空間は、図8に示したような二次元の空間(すなわち平面)で表される。 For example, when there are two image feature amounts, a first image (image H) and a second image (image K), the image feature space is a two-dimensional space (that is, a plane) as shown in FIG. It is represented by
図8に示したイメージ特徴空間は、横軸がイメージHの特徴量を表す軸であり、縦軸がイメージKの特徴量を表す軸である。また、図8に示したイメージ特徴空間では、各イメージの特徴量を−1.0から+1.0までの範囲で示している。このイメージ特徴空間は、例えば、横軸(イメージH)を「快/不快」のイメージとし、縦軸(イメージK)を「興奮/鎮静」のイメージとする。このとき、横軸は、例えば、+1.0を「快」とし、−1.0を「不快」として、快のイメージが強い曲ほどイメージ特徴空間の右方にマッピングされるようにする。また、縦軸は、例えば、+1.0を「興奮」とし、−1.0を「鎮静」として、興奮のイメージが強い曲ほどイメージ特徴空間の上方にマッピングされるようにする。なお、イメージ特徴空間は、例えば、横軸(イメージH)を「喜/哀」のイメージとし、縦軸(イメージK)を「怒/楽」のイメージとしてもよい。 In the image feature space shown in FIG. 8, the horizontal axis is the axis representing the feature amount of the image H, and the vertical axis is the axis representing the feature amount of the image K. Further, in the image feature space shown in FIG. 8, the feature amount of each image is shown in a range from -1.0 to +1.0. In this image feature space, for example, the horizontal axis (image H) is an image of "pleasant / unpleasant", and the vertical axis (image K) is an image of "excitation / sedation". At this time, the abscissa indicates, for example, +1.0 as “pleasant” and −1.0 as “displeased”, so that a song having a stronger pleasant image is mapped to the right of the image feature space. On the vertical axis, for example, +1.0 is set to "excitation" and -1.0 is set to "sedation", so that a song having a stronger excitement image is mapped to an upper portion of the image feature space. In the image feature space, for example, the horizontal axis (image H) may be an image of "joy / sorrow" and the vertical axis (image K) may be an image of "anger / ease".
曲DB 123に登録された全ての曲は、図8のイメージ特徴空間の1点(1個の黒丸)で表すことができる。例えば、イメージHの特徴量が0.2であり、イメージKの特徴量が0.7である曲は、点201で表される。また、イメージHの特徴量が−0.4であり、イメージKの特徴量が0.2である曲は、点202で表される。
All the songs registered in the
また、プレイリストの範囲は、イメージ特徴空間内の1点を中心とする円で表される。そのため、図8に示すように、あるプレイリストの範囲301が円で表され、かつ絞り込み属性に基づいて絞り込まれた曲が黒丸で表されている場合、範囲301の円周で囲まれた領域に含まれる5個の点と対応する5曲が、そのプレイリストへの登録対象となる。また、範囲302で表されるプレイリストへの登録対象となる曲は、範囲302の円周で囲まれた領域に含まれる3個の点と対応する3曲となる。なお、音声認識部で得たテキストにプレイリストのイメージとともに曲の絞り込み属性が含まれる場合、プレイリストへの登録対象は、プレイリストの範囲内に特徴量を持ち、かつ絞り込み属性と合致する曲属性を持つ曲のみが登録対象となる。例えば、テキストに特徴量の範囲が範囲301の円で表されるプレイリストのイメージとともに絞り込み属性が含まれる場合、範囲301内の5曲のうち絞り込み属性と合致する曲属性を持つ曲のみが当該プレイリストへの登録対象となる。
The range of the playlist is represented by a circle centered on one point in the image feature space. Therefore, as shown in FIG. 8, when a
図9Aは、第1の実施形態に係るプレイリスト作成処理を説明するフローチャート(その1)である。図9Bは、第1の実施形態に係るプレイリスト作成処理を説明するフローチャート(その2)である。 FIG. 9A is a flowchart (part 1) illustrating a playlist creation process according to the first embodiment. FIG. 9B is a flowchart (part 2) illustrating the playlist creation process according to the first embodiment.
本実施形態のプレイリスト作成装置1は、図9A及び図9Bに示したような、プレイリスト再生処理を含むプレイリスト作成処理を行う。なお、図9A及び図9Bには、音声によるプレイリストの生成要求の入力を受け付ける場合のプレイリスト作成処理を示している。
The
プレイリスト作成処理において、プレイリスト作成装置1は、まず、音声信号を取得しテキストに変換する処理を行う(ステップS1)。ステップS1の処理は、要求プレイリスト入力部101のマイク及び音声認識部が行う。マイクは、プレイリスト作成装置1の周囲を伝播する音を収音し、音声信号に変換して音声認識部に出力する。音声認識部は、音声信号に対し既知の音声認識処理を行う。例えば、音声認識部は、まず音声信号に有意な音声が含まれるか否かを判定する。そして、音声信号に有意な音声が含まれる場合、音声認識部は、当該有意な音声の部分をテキストに変換する。
In the playlist creation process, the
要求プレイリスト入力部101は、上記の音声認識処理の後、テキストが得られたか否かを判定する(ステップS2)。テキストが得られなかった場合(ステップS2;No)、要求プレイリスト入力部101は、テキストが得られるまでステップS1の処理を繰り返す。
After the above-described speech recognition processing, the request
一方、テキストが得られた場合(ステップS2;Yes)、要求プレイリスト入力部101は、得られたテキストを、利用者からのプレイリストの生成要求としてキーワード/属性抽出部102に出力する。要求プレイリスト入力部101からテキストを受け取ると、キーワード/属性抽出部102は、受け取ったテキストに基づいて検索キーワード及び絞り込み属性を抽出する処理を行う(ステップS3)。ステップS3において、キーワード/属性抽出部102は、まず、図3に示したキーワードDB 121を検索し、受け取ったテキストと合致するテキストの有無を調べる。そして、受け取ったテキストと合致するテキストがキーワードDB 121に登録されている場合、キーワード/属性抽出部102は、合致したテキストと対応付けられている検索キーワードをキーワードDB 121から抽出する。キーワード/属性抽出部102は、抽出した検索キーワードを優先度算出部105及びナレーション作成部107に出力する。
On the other hand, when the text is obtained (Step S2; Yes), the requested
また、ステップS3において、キーワード/属性抽出部102は、図4に示した絞込属性DB 122を検索し、受け取ったテキストと合致する絞り込み属性の有無を調べる。そして、受け取ったテキストと合致するテキストが絞込属性DB 122に登録されている場合、キーワード/属性抽出部102は、合致したテキストと対応付けられている絞り込み属性を絞込DB 122から抽出する。キーワード/属性抽出部102は、抽出した絞り込み属性を曲絞込部103に出力する。
Also, in step S3, the keyword /
ステップS3の処理を終えると、プレイリスト生成装置1は、次に、プレイリストへの登録対象となる曲の曲IDを、全ての曲IDから絞り込み属性と合致する曲属性を持つ曲IDに絞り込む処理を行う(ステップS4)。ステップS4の処理は、曲絞込部103が行う。曲絞込部103は、キーワード/属性抽出部102から絞り込み属性を受け取ると、曲DB 123を参照して絞り込み属性と合致する曲属性を持つ曲IDを抽出し、曲IDを絞り込む。曲絞込部103は、絞り込んだ曲IDと、その曲IDに対応付けられた曲のイメージ特徴量を推薦プレイリスト候補生成部104に出力する。
When the processing of step S3 is completed, the
曲絞込部103から曲ID及びイメージ特徴量を受け取ると、推薦プレイリスト候補生成部104は、当該曲ID及びイメージ特徴量、並びにプレイリストDB 124に基づいて、推薦プレイリスト候補を生成する(ステップS5)。ステップS5の処理において、推薦プレイリスト候補生成部104は、プレイリストDB 124に登録された各プレイリストの範囲と、イメージ特徴量とを比較し、範囲内にイメージ特徴量が含まれるプレイリストを抽出する。すなわち、推薦プレイリスト候補生成部104は、図8に示したようなイメージ特徴空間に各曲のイメージ特徴量を表す点とプレイリストの範囲とを表した場合に範囲内にイメージ特徴量を表す点が含まれるプレイリストを、推薦プレイリスト候補とする。推薦プレイリスト候補生成部104は、生成した推薦プレイリスト候補を優先度算出部105に出力する。
Upon receiving the song ID and the image feature amount from the
なお、図示は省略しているが、生成した推薦プレイリスト候補が1個である場合、推薦プレイリスト候補生成部104は、生成した推薦プレイリスト候補をプレイリスト決定部106に出力する。
Although not shown, when the number of generated recommended playlist candidates is one, the recommended playlist
優先度算出部105は、キーワード/属性抽出部102から検索キーワードを受け取るとともに、推薦プレイリスト候補部105から推薦プレイリスト候補を受け取ると、推薦プレイリスト候補についての推薦優先度を算出する(ステップS6)。ステップS6の処理において、優先度算出部105は、認識ずれ量算出部105aで認識ずれ量を算出するとともに、要求ずれ量算出部105bで要求ずれ量を算出する。そして、優先度算出部105は、ずれ量統合部105dで認識ずれ量と要求ずれ量とを統合して各推薦プレイリスト候補の推薦優先度を算出する。優先度算出部105は、算出した推薦優先度をプレイリスト決定部106に出力する。
Upon receiving the search keyword from the keyword /
優先度算出部105が算出した推薦優先度を受け取ると、プレイリスト決定部106は、推薦優先度に基づいて推薦するプレイリストを決定する(ステップS7)。ステップS7の処理において、プレイリスト決定部106は、推薦優先度の最も高いプレイリストを推薦するプレイリストに決定する。この際、プレイリスト決定部106は、プレイリストの名称のみを変更してもよいし、プレイリスト自体を推薦するプレイリストに変更して登録する曲を変更してもよい。プレイリスト決定部106は、決定した推薦プレイリストの名称をナレーション作成部107(ナレーション文章作成部107a)に出力するとともに、当該推薦プレイリストに含まれる曲IDをプレイリスト再生部108に出力する。なお、推薦プレイリスト候補に要求プレイリストが含まれており、かつ要求プレイリストの推薦優先度が最も高い場合、推薦するプレイリストは要求プレイリスト(すなわち利用者が要求したプレイリスト)となる。
Upon receiving the recommendation priority calculated by the
次に、プレイリスト生成装置1では、図9Bに示すように、推薦プレイリストについてのナレーション音声を作成する(ステップS8)。ステップS8の処理は、ナレーション作成部107が行う。ナレーション作成部107は、まず、ナレーション文章作成部107aにおいてナレーション文章を作成する。ナレーション文章作成部107aは、推薦プレイリストの名称が先に取得した検索キーワード(又は検索キーワードにより特定されるプレイリストの名称)と合致するか否かを判定する。その判定結果に基づいて、ナレーション文章作成部107aは、利用者に通知するナレーション文章のテキストを作成する。推薦プレイリストの名称が検索キーワードと合致する場合、ナレーション文章作成部107aは、検索キーワードのプレイリストを再生することを通知するテキストを作成する。一方、推薦プレイリストの名称が検索キーワードと合致しない場合、ナレーション文章作成部107aは、例えば、検索キーワードのプレイリストを作成することができなかったため推薦プレイリストを再生することを通知するテキストを作成する。ナレーション文章作成部107aは、作成したナレーション文章のテキストをナレーション音声作成部107bに出力する。ナレーション音声作成部107bは、既知の音声合成技術を用い、受け取ったナレーション文章のテキストからナレーション音声データを作成する。ナレーション音声作成部107bは、作成したナレーション音声データをプレイリスト再生部108に出力する。なお、ナレーション文章作成部107aで作成したナレーション文章を音声データに変換せず、液晶ディスプレイ等の表示装置に表示させてもよい。
Next, as shown in FIG. 9B, the
その後、プレイリスト生成装置1では、推薦プレイリストに含まれる曲ID及びナレーション音声を受け取ったプレイリスト再生部108が、ナレーション音声データ及び推薦プレイリストに含まれる曲IDの曲音声データを再生する(ステップS9)。ステップS9の処理において、プレイリスト再生部108は、まず、ナレーション音声データを再生する。その後、プレイリスト再生部108は、推薦プレイリストに含まれる曲IDの曲音声データを所定の順序で順次再生する。プレイリスト再生部108が再生して得られたナレーション音声の音声信号及び曲音声の音声信号は、音声出力部(スピーカ)109によりプレイリスト生成装置1の外部に向けて音声として出力される。
Thereafter, in the
図10は、プレイリストの変更方法の例を説明する図である。
ステップS7において決定した推薦プレイリストと要求プレイリストとの包含関係は、例えば、図10の(a)から(c)までに示したような関係になる。図10の(a)の例では、推薦プレイリストL2の範囲312が要求プレイリストL1の範囲311に内包されている。このような場合、黒丸で示した推薦プレイリストL2の範囲312内に含まれる曲は、全て要求プレイリストL1の範囲311内に含まれる。そのため、推薦プレイリストL2の範囲312が要求プレイリストL1の範囲311に内包されている場合、プレイリスト決定部106は、利用者に提示するプレイリストの名称のみを変更してもよいし、プレイリスト自体を推薦プレイリストL2に変更してもよい。
FIG. 10 is a diagram illustrating an example of a method of changing a playlist.
The inclusion relationship between the recommended playlist and the requested playlist determined in step S7 is, for example, the relationship shown in (a) to (c) of FIG. In the example of FIG. 10 (a), the
一方、図10の(b)に示すように、推薦プレイリストL2の範囲312の一部のみが要求プレイリストL1の範囲311と重なっている場合、黒丸で示した重なり領域内の曲のみが登録されたプレイリストを作成することも可能である。しかしながら、この場合、推薦プレイリストL2の範囲312内においてもプレイリストに登録される曲の分布に偏りがあるため、プレイリストの名称のみを変更すると、推薦プレイリストL2のイメージと再生される曲のイメージとに齟齬が生じる可能性がある。そのため、推薦プレイリストL2の範囲312の一部のみが要求プレイリストL1の範囲311と重なる場合、プレイリスト自体を、図10の(c)に示すように、推薦プレイリストL2の範囲312内に含まれる曲を全て登録したプレイリストに変更してもよい。図10の(c)に示した例では、推薦プレイリストL2の範囲312内における曲の偏りの度合いが小さい。そのため、推薦プレイリストL2のイメージと再生される曲のイメージとの齟齬が解消され、利用者に与える違和感を低減することができる。
On the other hand, as shown in (b) of FIG. 10, when only a part of the recommended playlist L 2 in the
このように、本実施形態に係るプレイリスト生成処理では、利用者(オペレータ)が要求した曲の絞り込み属性に基づいて利用者に推薦するプレイリストの候補を生成し、利用者からの要求に応じて生成される要求プレイリストと比較する。そして、推薦するプレイリストの候補のなかに要求プレイリストよりも優先度の高いプレイリストが存在する場合、優先度の高いプレイリストの名称を利用者に提示する。これにより、利用者は、プレイリストの名称を把握した上で再生される曲を聞くことができる。また、優先度の高いプレイリストがもつイメージは、利用者が要求したプレイリストがもつイメージと比べて、再生される曲のイメージにより近い。そのため、本実施形態に係るプレイリスト生成処理によれば、プレイリストがもつイメージとプレイリストに従って再生される曲のイメージとの齟齬により利用者に与える違和感を低減させることが可能となる。更に、プレイリストの名称だけでなく、プレイリスト自体も変更することで、図10に示したように、名称の変更だけではイメージの齟齬が生じるような状況でも、イメージの齟齬を解消し、利用者に与える違和感を低減させることが可能となる。また、本実施形態に係るプレイリスト生成処理では、再生される曲のイメージにより近いプレイリストの名称を利用者に提示するため、利用者がイメージと合致した曲を再生させるためのキーワードを試行錯誤する手間を省くことが可能となる。 As described above, in the playlist generation processing according to the present embodiment, a playlist candidate to be recommended to the user is generated based on the song narrowing down attribute requested by the user (operator), and the playlist is generated in response to the request from the user. And compare it with the requested playlist generated. Then, when a playlist having a higher priority than the request playlist exists among the candidates for the playlist to be recommended, the name of the playlist having a higher priority is presented to the user. As a result, the user can listen to the tune to be reproduced after grasping the name of the playlist. Also, the image of the playlist with a higher priority is closer to the image of the music to be reproduced than the image of the playlist requested by the user. Therefore, according to the playlist generation processing according to the present embodiment, it is possible to reduce a sense of discomfort given to the user due to a discrepancy between the image of the playlist and the image of the music reproduced according to the playlist. Further, by changing not only the name of the playlist but also the playlist itself, as shown in FIG. It is possible to reduce the discomfort given to the person. Also, in the playlist generation process according to the present embodiment, in order to present to the user the name of the playlist closer to the image of the song to be reproduced, the user must perform trial and error on the keyword for reproducing the song that matches the image. It is possible to save the trouble of performing.
また、本実施形態に係るプレイリスト生成処理によれば、利用者は、自身が要求したプレイリストの名称に対する、より適切な名称を知ることが可能となる。そのため、利用者は、自身の抱くイメージに合ったプレイリストを得るためのキーワードを容易に把握することが可能となる。例えば、「明るい曲」のプレイリストの要求に対しイメージの近い「涼やかな曲」のプレイリストを提示した場合、利用者は、「涼やかな曲」のプレイリストを要求した場合に再生される曲のイメージを知ることができる。そのため、利用者は、「明るい曲」及び「涼やかな曲」のいずれのプレイリストを要求すると自身の望むイメージにより近い曲が再生されるかを知ることができる。よって、次回以降、自身の望むイメージにより近いプレイリストの生成を要求することが容易となる。 Further, according to the playlist generation processing according to the present embodiment, the user can know a more appropriate name for the playlist name requested by the user. Therefore, the user can easily grasp the keyword for obtaining the playlist suitable for the image held by the user. For example, when a playlist of “cool songs” with a similar image is presented in response to a request for a playlist of “bright songs”, the user can select a song to be played when the playlist of “cool songs” is requested. You can know the image of. For this reason, the user can know which of the playlists “bright song” and “cool song” is played, and which song is closer to the image desired by the user. Therefore, it becomes easy to request generation of a playlist closer to the image desired by the user from the next time.
図11は、検索キーワード及び絞り込み属性を抽出する処理の内容を説明するフローチャートである。 FIG. 11 is a flowchart illustrating the content of the process of extracting the search keyword and the narrowing down attribute.
本実施形態に係るプレイリスト生成処理における検索キーワード及び絞り込み属性を抽出する処理(ステップS3)は、キーワード/属性抽出部102が行う。キーワード/属性抽出部102は、図11に示すように、まず、要求プレイリスト入力部101からテキストを取得する(ステップS301)。
The keyword /
キーワード/属性抽出部102は、次に、取得したテキストをキー情報としてキーワードDB 121を検索し、検索キーワードを抽出する(ステップS302)。キーワードDB 121には、図3に示したように、テキストと検索キーワードとの対応関係が複数登録されている。ステップS302の処理において、キーワード/属性抽出部102は、取得したテキストがキーワードDB 121に登録されているか否かを調べる。この際、キーワード/属性抽出部102は、例えば、キーワードDB 121に登録された各キーワードに対して取得したキーワードによる正規表現検索を行い、取得したキーワードと一致するキーワードの有無を調べる。そして、取得したテキストがキーワードDB 121に登録されている場合、当該テキストと対応付けられたキーワードを抽出して検索キーワードとする。なお、音声認識部から複数のテキストを取得した場合、キーワード/属性抽出部102は、取得した複数のテキストのそれぞれについてキーワードDB 121に登録されているか否かを調べる。
Next, the keyword /
キーワード/属性抽出部102は、次に、取得したテキストをキー情報として絞込属性DB 122を検索し、曲の絞り込み属性を抽出する(ステップS303)。絞込属性DB 122には、図4に示したように、テキストと曲の絞込属性との対応関係が複数登録されている。ステップS303の処理において、キーワード/属性抽出部102は、取得したテキストが絞込属性DB 122に登録されているか否かを調べる。この際、キーワード/属性抽出部102は、例えば、絞込属性DB 122に登録された各キーワードに対して取得したキーワードによる正規表現検索を行い、取得したキーワードと一致するキーワードの有無を調べる。そして、取得したテキストが絞込属性DB 122に登録されている場合、当該テキストと対応付けられた曲属性を抽出する。なお、音声認識部から複数のテキストを取得した場合、キーワード/属性抽出部102は、取得した複数のテキストのそれぞれについて絞込属性DB 122に登録されているか否かを調べる。
Next, the keyword /
図12は、推薦優先度を算出する処理の内容を説明するフローチャートである。
本実施形態に係るプレイリスト生成処理における推薦優先度を算出する処理(ステップS6)は、優先度算出部105が行う。優先度算出部105は、図12に示すように、まず、検索キーワード及び推薦プレイリスト候補を取得する(ステップS601)。優先度算出部105は、キーワード/属性抽出部102から検索キーワードを取得し、推薦プレイリスト候補生成部104から推薦プレイリスト候補を取得する。取得した検索キーワードはプレイリスト検索部105cに入力される。また、取得した推薦プレイリスト候補は、認識ずれ量算出部105a及び要求ずれ量算出部105bに入力される。
FIG. 12 is a flowchart illustrating the content of the process of calculating the recommendation priority.
The process of calculating the recommendation priority in the playlist generation process according to the present embodiment (step S6) is performed by the
優先度算出部105は、次に、認識ずれ量を算出する処理(ステップS602)と、要求ずれ量を算出する処理(ステップS603,S604)とを行う。
Next, the
認識ずれ量を算出する処理(ステップS602)は、認識ずれ量算出部105aが行う。認識ずれ量算出部105aは、認識ずれ量として、推薦プレイリスト候補における曲IDに対応したイメージ特徴量に基づく正規分布と、当該推薦プレイリスト候補の想定している曲の正規分布とのずれ量を算出する。例えば、認識ずれ量算出部105aは、i番目の推薦プレイリスト候補における曲IDに対応した曲のイメージ特徴量に基づく正規分布Piと、当該推薦プレイリスト候補の想定している曲の正規分布QiとのKLダイバージェンスDKL(Pi||Qi)を算出する。KLダイバージェンスは、2つの分布の差異を測る尺度であり、2つの正規分布P,QについてのKLダイバージェンスDKL(P||Q)は、下記式(1)で表される。
The process of calculating the recognition shift amount (step S602) is performed by the recognition shift
式(1)におけるμP及びΣPは、それぞれ、d次元正規分布Pの平均及び分散である。また、式(1)におけるμQ及びΣQは、それぞれ、d次元正規分布Qの平均及び分散である。 Μ P and Σ P in Equation (1) are the mean and variance of the d-dimensional normal distribution P, respectively. Further, μ Q and Σ Q in the equation (1) are the average and the variance of the d-dimensional normal distribution Q, respectively.
なお、認識ずれ量として上記のKLダイバージェンスDKL(Pi||Qi)を算出する場合、認識ずれ量算出部105aは、i番目の推薦プレイリスト候補における曲IDに基づいて、曲DB 123から各曲IDと対応付けられた曲のイメージ特徴量を取得する。
When calculating the KL divergence D KL (P i || Q i ) as the recognition shift amount, the recognition shift
認識ずれ量算出部105aは、算出した認識ずれ量をずれ量統合部105dに出力する。
The recognition shift
一方、要求ずれ量を算出する処理(ステップS603,S604)は、プレイリスト検索部105cと要求ずれ量算出部105bとが行う。
On the other hand, the process of calculating the required shift amount (steps S603 and S604) is performed by the
プレイリスト検索部105cは、プレイリストDB 124を検索し、取得した検索キーワードと対応するプレイリストを抽出する(ステップS603)。プレイリスト検索部105cは、検索キーワードと対応するプレイリストを抽出すると、要求ずれ量算出部105bは、この際、プレイリスト検索部105cは、例えば、プレイリストDB 124に登録された名称に対して取得した検索キーワードによる正規表現検索を行い、名称が検索キーワードと一致するプレイリストの想定分布及び範囲を抽出する。プレイリスト検索部105cは、抽出したプレイリストの名称(検索キーワード)、想定分布、及び範囲を要求ずれ量算出部105bに出力する。
The
要求ずれ量算出部105bは、要求ずれ量として、推薦プレイリスト候補の想定している正規分布と、プレイリスト検索部105cから受け取ったプレイリストの想定している正規分布(想定分布)とのずれ量を算出する。例えば、要求ずれ量算出部105bは、i番目の推薦プレイリスト候補の想定している曲の正規分布Piと、検索キーワードに基づくプレイリストの想定している曲の正規分布RとのKLダイバージェンスDKL(Pi||R)を算出する。正規分布Pi,RについてのKLダイバージェンスDKL(Pi||R)は、式(1)を用いて算出する。
The request deviation
要求ずれ量算出部105bは、算出した要求ずれ量をずれ量統合部105dに出力する。
The request deviation
こうして認識ずれ量及び要求ずれ量を算出した後、優先度算出部105では、ずれ量統合部105dが認識ずれ量及び要求ずれ量に基づいて推薦優先度を算出する(ステップS605)。ステップS605において、ずれ量統合部105dは、認識ずれ量と要求ずれ量とを統合し、2つの値の重み付き和で表される推薦優先度を算出する。ずれ量統合部105dは、例えば、下記式(2)によりi番目の推薦プレイリスト候補の推薦優先度PPiを算出する。
After calculating the recognition shift amount and the required shift amount in this way, in the
PPi=−w1・DKL(Pi||Qi)−w2・DKL(Pi||R) ・・・(2)
PP i = −w1 · D KL (P i || Q i )
式(2)におけるw1,w2は、それぞれのずれ量(KLダイバージェンス)に対する重み付け値である。重み付け値w1,w2の組み合わせは任意である。ただし、利用者の要求に応えないとユーザビリティが低下する可能性があるため、例えば、w1=0.4,w2=0.6等、w1を小さくしw2を大きくする。また、本実施形態のプレイリスト生成処理の適用前後における動作の大きな変化を抑制したい場合には、例えば、w1=0.1,w2=0.9等、w1の値を更に小さくしw2の値を大きくしてもよい。また、重み付け値w1,w2の組み合わせは、例えば、前回のプレイリスト生成処理からの経過時間(日数)に応じて変えるようにしてもよい。更に、重み付け値w1,w2の組み合わせは、利用者自身が適宜調整できるようにしてもよい。 W1 and w2 in Expression (2) are weighting values for the respective shift amounts (KL divergence). The combination of the weight values w1 and w2 is arbitrary. However, there is a possibility that usability will deteriorate if the user's request is not met. For example, w1 is reduced and w2 is increased, for example, w1 = 0.4, w2 = 0.6. When it is desired to suppress a large change in the operation before and after the application of the playlist generation processing of the present embodiment, for example, the value of w1 is further reduced, such as w1 = 0.1, w2 = 0.9, and the value of w2. May be increased. Further, the combination of the weight values w1 and w2 may be changed according to, for example, the elapsed time (number of days) from the previous playlist generation processing. Further, the combination of the weight values w1 and w2 may be appropriately adjusted by the user himself.
ここで、上記の要求ずれ量及び認識ずれ量について、図13A及び図13Bを参照して改めて説明する。図13Aは、要求ずれ量を説明する図である。図13Bは、認識ずれ量を説明する図である。 Here, the required shift amount and the recognition shift amount will be described again with reference to FIGS. 13A and 13B. FIG. 13A is a diagram illustrating the required shift amount. FIG. 13B is a diagram illustrating the recognition shift amount.
要求ずれ量は、上記のように、推薦プレイリスト候補の想定している曲の正規分布と、検索キーワードにより特定されるプレイリストの想定している曲の正規分布とのずれ量である。プレイリストの想定している曲の正規分布は、プレイリストDB 124における想定分布である。
As described above, the required shift amount is a shift amount between the normal distribution of the music assumed as the recommended playlist candidate and the normal distribution of the music assumed in the playlist specified by the search keyword. The normal distribution of the music assumed by the playlist is the assumed distribution in the
例えば、図13Aの(a)に示すように、推薦プレイリスト候補が5個であり、イメージ特徴空間(H−K平面)における5個のプレイリストL1,L2,L3,L4,及びL5の範囲311,312,313,314,及び315がそれぞれ円で表されるとする。また、絞り込み属性により絞り込まれた曲(211,212,213,・・・)のイメージ特徴空間における位置が、それぞれ図13Aの(a)に示した黒丸の位置で表されるとする。更に、5個のプレイリストL1,L2,L3,L4,及びL5のうちプレイリストL1が検索キーワードにより特定されたプレイリスト(要求プレイリスト)であったとする。この場合、要求ずれ量算出部105bは、プレイリストLi(i=1,2,3,4,5)のそれぞれに対し、プレイリストLiの想定している正規分布Piと、プレイリストL1の想定している正規分布RとのKLダイバージェンスDKL(Pi||R)を算出する。
For example, as shown in (a) of FIG. 13A, there are five recommended playlist candidates, and five playlists L 1 , L 2 , L 3 , L 4 , and L 4 in the image feature space (HK plane). and the L 5
図13Aの(a)に示した5個のプレイリストLi(i=1,2,3,4,5)の想定している正規分布(想定分布)Piは、例えば、図13Aの(b)のように表すことができる。 The assumed normal distribution (assumed distribution) P i of the five playlists L i ( i = 1, 2, 3, 4, 5) shown in (a) of FIG. b).
KLダイバージェンスDKL(Pi||R)は、上記のように2つの正規分布Pi,Rの差異を測る尺度であり、Pi=Rの場合にDKL(Pi||R)=0となる。また、KLダイバージェンスDKL(Pi||R)は、2つの正規分布Pi,Rの差異が大きくなるほど大きな値となる。よって、図13Aの(b)に示した例においては、要求プレイリストでもあるプレイリストL1についてのKLダイバージェンスDKL(P1||R)が0となり、プレイリストL1から最も離れた位置にあるプレイリストL5についてのKLダイバージェンスDKL(P5||R)が最も大きな値となる。 The KL divergence D KL (P i || R) is a measure for measuring the difference between the two normal distributions P i , R as described above. When P i = R, D KL (P i || R) = It becomes 0. The KL divergence D KL (P i || R) increases as the difference between the two normal distributions P i , R increases. Therefore, in the example shown in FIG. 13A (b), the KL divergence D KL (P 1 || R) for the playlist L 1 , which is also the requested playlist, becomes 0, and the position farthest from the playlist L 1 KL divergence D KL (P 5 || R) for the playlist L 5 in the first item has the largest value.
すなわち、要求ずれ量の小さいプレイリストに含まれる曲は、イメージ特徴空間において検索キーワードにより特定されるプレイリスト(要求プレイリスト)の範囲内或いはプレイリストの範囲に近い位置になる。そのため、推薦プレイリスト候補から推薦プレイリストを決定する際の推薦優先度は、要求ずれ量の小さいプレイリストほど推薦優先度が高くなるようにすることが好ましい。 In other words, a song included in a playlist with a small required deviation amount is located at a position within or close to the range of the playlist (requested playlist) specified by the search keyword in the image feature space. For this reason, it is preferable that the recommendation priority at the time of determining the recommended playlist from the recommended playlist candidates be such that the playlist with the smaller request deviation amount has the higher recommended priority.
ただし、図13Aの(a)に示した例では、プレイリストL1の範囲311に含まれる曲は、プレイリストL2の範囲312内にも含まれる曲のみであり、かつプレイリストL1の範囲311内での偏りが大きい。そのため、要求ずれ量のみに基づいて推薦優先度を算出して推薦するプレイリストを決定した場合、利用者が要求したプレイリストのイメージと、決定したプレイリストに従って再生した曲のイメージとに齟齬が生じ、利用者に対し違和感を与える可能性がある。よって、本実施形態に係るプレイリスト生成処理では、要求ずれ量とともに認識ずれ量を算出し、これらを統合した推薦優先度を算出する。認識ずれ量は、上記のように、推薦プレイリスト候補における曲IDに対応した曲のイメージ特徴量に基づく正規分布と、当該推薦プレイリスト候補の想定している正規分布とのずれ量を算出する。
However, in the example shown in (a) of FIG. 13A, the song to be included within the
推薦プレイリスト候補における曲IDに対応した曲のイメージ特徴量に基づく正規分布は、絞り込んだ曲のうちプレイリストの範囲内に含まれる曲に対するイメージ特徴量のみに基づいて算出した正規分布(平均及び分散)である。例えば、図13Aの(a)に示したプレイリストL1の範囲311内には曲211、曲212、及び曲213の3曲が含まれている。そのため、i=1のプレイリスト(推薦プレイリスト候補)L1における曲のイメージ特徴量に基づく正規分布P1は、この3曲のイメージ特徴量に基づいて算出される。一方、i=1のプレイリストL1の想定している正規分布Q1は、プレイリストDB 124に登録された想定分布である。よって、プレイリストL1についての2つの正規分布P1,Q1をイメージ特徴空間に表現すると、これら2つの正規分布P1,Q1は、図13Bの(a)に示したような関係で表される。
The normal distribution based on the image feature amount of the song corresponding to the song ID in the recommended playlist candidate is the normal distribution (average and average) calculated based only on the image feature amount of the songs included in the range of the playlist among the narrowed-down songs. (Dispersion). For example, it contains three pieces of
同様に、他の4個のプレイリストLi(i=2,3,4,5)について、2つの正規分布Pi,Qiをイメージ特徴空間に表現すると、それぞれ、図13Bの(b)から(e)までに示したような関係で表される。 Similarly, when the two normal distributions P i and Q i are expressed in the image feature space for the other four playlists L i (i = 2, 3, 4, 5), (b) in FIG. To (e).
各プレイリストLi(i=1,2,3,4,5)における2つの正規分布Pi,Qiの関係(差異)は、KLダイバージェンスDKL(Pi||Qi)により数値化することができる。2つの正規分布Pi,Qiの差異が小さい場合、KLダイバージェンスDKL(Pi||Qi)は0に近い小さな値となる。一方、2つの正規分布Pi,Qiの差異が大きい場合、KLダイバージェンスDKL(Pi||Qi)は大きい値となる。すなわち、図13の(a)に示したプレイリストL1についてのKLダイバージェンスDKL(Pi||Qi)は、他のプレイリストについてのKLダイバージェンスDKL(Pi||Qi)に比べて大きな値となる。そのため、プレイリストL1の曲としてプレイリストL1の範囲311に含まれる曲211,212,213を再生した場合、利用者は、再生された曲のイメージがプレイリストL1のイメージと合わず違和感を抱く可能性が高い。
The relationship (difference) between the two normal distributions P i and Q i in each playlist L i (i = 1, 2, 3, 4, 5) is quantified by KL divergence D KL (P i || Q i ). can do. When the difference between the two normal distributions P i and Q i is small, the KL divergence D KL (P i || Q i ) has a small value close to zero. On the other hand, when the difference between the two normal distributions P i and Q i is large, KL divergence D KL (P i || Q i ) has a large value. That, KL divergence D KL (P i || Q i ) for a playlist L 1 shown in FIG. 13 (a), the KL-divergence D KL (P i || Q i ) for other playlist This is a large value. Therefore, if you play a
図13Bの(a)に示したプレイリストL1(要求プレイリスト)に含まれる3曲は、いずれも(b)に示したプレイリストL2に含まれる。しかも、図13Bの(b)に示したプレイリストL2についてのKLダイバージェンスDKL(P2||Q2)は、(a)のプレイリストL1についてのKLダイバージェンスDKL(P1||Q1)よりも小さくなる。そのため、プレイリストL1に含まれる曲211,212,213のみを再生する場合、プレイリストL1の曲としてよりも、プレイリストL2の曲として再生したほうが、曲のイメージに対する違和感が生じにくい。
3 songs included in the playlist L 1 (request playlist) shown in (a) of FIG. 13B it is all included in the playlist L 2 shown in (b). Moreover, the KL divergence D KL (P 2 || Q 2 ) for the playlist L 2 shown in (b) of FIG. 13B is the KL divergence D KL (P 1 || for the playlist L 1 of (a). Q 1 ). Therefore, if you want to play the
よって、本実施形態に係るプレイリスト生成処理では、上記のように、要求ずれ量と認識ずれ量とを統合した推薦優先度を算出し、推薦優先度の最も高い推薦プレイリスト候補を推薦プレイリストとして利用者に提示する。また、本実施形態に係るプレイリスト生成処理では、上記のように、利用者に提示するプレイリストの名称を含むナレーション音声を作成して再生する。そのため、再生する曲のイメージをより適切に表現しており、かつ利用者の要求したイメージに近いプレイリストを利用者に提示することが可能となる。 Therefore, in the playlist generation processing according to the present embodiment, as described above, the recommendation priority obtained by integrating the request deviation amount and the recognition deviation amount is calculated, and the recommended playlist candidate having the highest recommendation priority is selected as the recommended playlist. To the user. Further, in the playlist generation processing according to the present embodiment, as described above, a narration sound including the name of the playlist to be presented to the user is created and reproduced. Therefore, it is possible to more appropriately express the image of the music to be reproduced and to present a playlist close to the image requested by the user to the user.
図13Aの(a)に示した例において利用者の要求するプレイリストL1とは異なるプレイリストL2を推薦プレイリストに決定した場合、プレイリスト生成装置1は、プレイリストL2の名称を含むナレーション音声を作成して再生する。例えば、プレイリストL1及びL2の名称がそれぞれ「明るい」及び「涼やか」であり、利用者の要求したプレイリストの名称(検索キーワード)が「明るい」であったとする。この場合、プレイリスト生成装置1は、例えば「“明るい”のプレイリストは曲数不足のため作成できませんでした。そのため、“明るい”に近い“涼やか”のプレイリストを再生します。」というナレーション音声を再生した後、プレイリストの曲を再生する。したがって、利用者は、「涼やか」な曲が再生されると把握した上でプレイリストの曲を聞くことができ、再生された曲のイメージに対する違和感を抱きにくくなる。
If you decide to recommended playlist different playlist L 2 is a playlist L 1 to request the user in the example shown in (a) of FIG. 13A, the
なお、利用者が要求したプレイリストの代わりに他のプレイリストを提示する場合、再生する曲は、提示するプレイリストの範囲内の全ての曲でもよいし、提示するプレイリストの範囲内の曲のうち利用者が要求したプレイリストに含まれる曲のみでもよい。その場合は、例えば、「“明るい”かつ“涼やか”のプレイリストを再生します。」というナレーション音声を作成して再生してもよい。また、提示するプレイリストの範囲内の曲もしくは利用者が要求したプレイリストに含まれる曲を、再生してもよい。その場合は、例えば、「“明るい”もしくは“涼やか”のプレイリストを再生します。」というナレーション音声を作成して再生してもよい。また、プレイリストの範囲は、図8に示した円に限らず、任意の空間形状でよい。 When presenting another playlist instead of the playlist requested by the user, the songs to be played may be all songs within the range of the presented playlist, or songs within the range of the presented playlist. Out of the songs included in the playlist requested by the user. In that case, for example, a narration sound “Play a playlist“ bright ”and“ cool ”” may be created and played. Also, songs within the range of the presented playlist or songs included in the playlist requested by the user may be reproduced. In this case, for example, a narration sound “Play a“ bright ”or“ cool ”playlist” may be created and played. Further, the range of the playlist is not limited to the circle shown in FIG. 8, but may be any space shape.
図14は、プレイリストの範囲の別の例を示す図である。図14には、図13Aの(a)と同様の二次元のイメージ特徴空間(H−K平面)を示している。 FIG. 14 is a diagram illustrating another example of the range of the playlist. FIG. 14 shows a two-dimensional image feature space (HK plane) similar to FIG. 13A (a).
図14に示すように、二次元イメージ特徴空間における5個のプレイリストL1,L2,L3,L4,及びL5の範囲311,312,313,314,及び315は、それぞれ長方形であってもよい。この場合、プレイリストDB 124における各プレイリストの範囲は、例えば、イメージ特徴空間において左上角部となる点の座標と、H軸方向の範囲と、K軸方向の範囲とにより指定する。図14に示した例では、プレイリストL1の範囲311は、左上角部の点の座標(h1,k1)と、H軸方向の範囲ΔH1と、K軸方向の範囲ΔK1とで指定される。
As shown in FIG. 14, the
更に、イメージ特徴空間が三次元以上の空間である場合、各プレイリストの範囲は、球又は超球に限らず、直方体又は超直方体であってもよい。 Furthermore, when the image feature space is a space of three or more dimensions, the range of each playlist is not limited to a sphere or a hypersphere, but may be a rectangular parallelepiped or a hypercube.
また、認識ずれ量及び要求ずれ量を算出する際には、プレイリストについての正規分布に限らず、一様な確率密度分布を用いてもよい。 Further, when calculating the recognition deviation amount and the required deviation amount, not only the normal distribution of the play list but also a uniform probability density distribution may be used.
図15は、プレイリストの範囲と確率密度分布との関係を説明する図である。図15の(a)には、図14と同様、二次元のイメージ特徴空間(H−K平面)におけるプレイリストの範囲が長方形である場合を示している。また図15の(b)には、図15の(a)のプレイリストL5の範囲315及びその周囲におけるH軸方向の確率密度分布p(H)を示している。
FIG. 15 is a diagram illustrating the relationship between the range of the playlist and the probability density distribution. FIG. 15A shows a case where the range of the playlist in the two-dimensional image feature space (HK plane) is rectangular, as in FIG. Also in FIG. 15 (b) shows the probability density distribution p of H-axis direction (H) in the
図15の(a)に示すように、二次元イメージ特徴空間におけるプレイリストL1及びL5の範囲311及び315は、それぞれ長方形でもよい。この場合、各プレイリストL1及びL5の想定している分布は、上記の正規分布に限らず、図15の(b)に示すようにプレイリストL5の範囲315内で一様な確率密度分布p(H)であってもよい。プレイリストL5の想定している分布を確率密度分布p(H)とする場合、h5≦H≦h5+ΔH5の場合のみp(H)=1/SA5とし、H<h5及びh5+ΔH5<Hの場合はp(H)=0とする。ここで、SA5は、イメージ特徴空間においてプレイリストL5の範囲315を表す長方形の面積である。
As shown in (a) of FIG. 15, the
また、プレイリストの想定している分布を確率密度分布p(H)とした場合、図15の(b)の下側のグラフのように曲を表す点214,215,及び216の位置の値のみが1/SA5となるグラフにより範囲内の曲の分布を表すことができる。そのため、グラフにおける1/SA5となる点の偏りの度合いに基づいて認識ずれ量を算出してもよい。
When the distribution assumed by the playlist is the probability density distribution p (H), the values of the positions of the
[第2の実施形態]
図16は、第2の実施形態に係るプレイリスト生成装置の機能的構成を示す図である。
[Second embodiment]
FIG. 16 is a diagram illustrating a functional configuration of a playlist generation device according to the second embodiment.
図16に示すように、プレイリスト生成装置1は、要求プレイリスト入力部101と、キーワード/属性抽出部102と、曲絞込部103と、推薦プレイリスト候補生成部104と、優先度算出部105と、プレイリスト決定部106と、を備える。また、プレイリスト生成装置1は、ナレーション作成部107と、プレイリスト再生部108と、音声出力部109と、を備える。また、プレイリスト生成装置1は、キーワードDB 121と、絞込属性DB 122と、曲DB 123と、プレイリストDB 124と、を備える。
As shown in FIG. 16, the
また、プレイリスト生成装置1は、スキップ操作入力部115と、適応処理部116と、を更に備える。すなわち、本実施形態のプレイリスト生成装置1は、第1の実施形態のプレイリスト生成装置1にスキップ操作入力部115と、適応処理部116とを付加した構成となっている。したがって、本実施形態のプレイリスト生成装置1は、第1の実施形態のプレイリスト生成装置1と同様、プレイリストを再生する再生装置を兼ねている。
Further, the
本実施形態のプレイリスト生成装置1におけるキーワードDB 121、絞込属性DB 122、曲DB 123、及びプレイリストDB 124は、それぞれ、第1の実施形態で述べた情報が登録されたデータベースである。また、本実施形態のプレイリスト生成装置1における要求プレイリスト入力部101、及びキーワード/属性抽出部102は、それぞれ、第1の実施形態で述べた機能を有する。また、本実施形態のプレイリスト生成装置1における曲絞込部103、推薦プレイリスト候補生成部104、優先度算出部105、及びプレイリスト決定部106は、それぞれ、第1の実施形態で述べた機能を有する。また、本実施形態のプレイリスト生成装置1におけるナレーション作成部107、プレイリスト再生部108、及び音声出力部109は、それぞれ、第1の実施形態で述べた機能を有する。なお、本実施形態のプレイリスト生成装置1におけるプレイリスト再生部108は、プレイリストの再生中にスキップ操作入力部115に対する操作がなされると、曲をスキップして(言い換えると再生中の曲に対する再生処理を終了して)次の曲の再生処理を開始する。また、プレイリスト再生部108は、曲をスキップした場合に、再生中のプレイリスト及びスキップした曲の曲IDを適応処理部116に出力する。
The
本実施形態のプレイリスト生成装置1におけるスキップ操作入力部115は、例えば押し釦スイッチである。利用者がスキップ操作入力部115を操作すると、スキップ操作入力部115は、スキップ操作を指示する信号をプレイリスト再生部108に出力する。スキップ操作を指示する信号を受け取ると、プレイリスト再生部108は、曲をスキップして次の曲の再生処理を開始する。この際、プレイリスト再生部108は、再生中のプレイリストと、スキップした曲の曲IDとを適応処理部116に出力する。
The skip
また、本実施形態のプレイリスト生成装置1における適応処理部116は、プレイリスト再生部108から取得した再生中のプレイリストと、スキップした曲の曲IDとに基づいてプレイリストの想定分布及び範囲を再学習する。
In addition, the
図17は、適応処理部の構成例を示す図である。図17に示すように、適応処理部116は、プレイリスト範囲修正部116aと、プレイリストDB再学習部116bと、を備える。また、適応処理部116は、修正データを蓄積したデータベース116cと、プレイリスト学習用データが登録されたデータベース116bと、を備える。
FIG. 17 is a diagram illustrating a configuration example of the adaptive processing unit. As shown in FIG. 17, the
プレイリスト範囲修正部116aは、再生中のプレイリストと、スキップした曲の曲IDとに基づいて、再生中のプレイリストにおける想定分布及び範囲を修正する。プレイリスト範囲修正部116aは、スキップした曲の曲IDを用いて、曲DB 123からスキップした曲のイメージ特徴量を取得する。また、プレイリスト範囲修正部116aは、曲DB 123から取得した曲のイメージ特徴量がプレイリストの範囲外となるよう、再生中のプレイリストの想定分布及び範囲を修正する。プレイリスト範囲修正部116aは、想定分布及び範囲を修正したプレイリストの修正データをデータベース116cに格納する。
The playlist
プレイリストDB再学習部116bは、データベース116cの修正データと、データベース116dのプレイリスト学習用データとに基づいて、プレイリストの想定分布及び範囲を再学習する。プレイリスト学習用データは、プレイリストの想定分布及び範囲を学習する際に使用したデータである。プレイリストの想定分布及び範囲の学習は、プレイリストDB 124を作成する際に任意の学習方法を用いて行う。例えば、まず、評価者がプレイリストの名称及び曲に対する主観的なイメージに基づいて、イメージ特徴空間におけるプレイリスト及び曲の座標(イメージ特徴量)を指定した初期データを作成する。その後、初期データを学習用データとして、単語特徴量からイメージ特徴空間への変換関数、及び楽曲特徴量からイメージ特徴量への変換関数を、例えば、カーネル回帰で学習する。単語特徴量は、プレイリストの名称(検索キーワード)、すなわち、単語を、意味特徴量に変換する既知の変換技術を用いることで得られる。また、楽曲特徴量は、例えば、音声認識等で用いられる音響特徴量(例えばメル周波数ケプストラム係数(MFCC))を利用することができる。
The playlist
プレイリストDB再学習部116bは、プレイリストの想定分布及び範囲を再学習した後、プレイリストDBにおける再生中のプレイリストの想定分布及び範囲を再学習した想定分布及び範囲に更新する。
After re-learning the assumed distribution and range of the playlist, the playlist
本実施形態のプレイリスト生成装置1が行うプレイリスト生成処理は、第1の実施形態で説明した処理と同じである。すなわち、本実施形態のプレイリスト生成装置1は、プレイリスト生成処理として、図9A、図9B、図11、及び図12に示したような処理を行う。
The playlist generation process performed by the
また、本実施形態のプレイリスト生成装置1は、プレイリスト再生中、スキップ操作入力部115において利用者によるスキップ操作を受け付けると、適応処理部116においてプレイリストDBを更新する処理を行う。
Further, when the skip
図18は、適応処理部が行う処理を説明するフローチャートである。
本実施形態のプレイリスト生成装置1におけるスキップ操作部115は、プレイリスト再生中に利用者によるスキップ操作を受け付けると、スキップ操作入力部115は、プレイリスト再生部108に対し再生中の曲をスキップさせる指示を出力する。再生中の曲をスキップさせる指示を受け取ったプレイリスト再生部108は、再生中の曲音声データの再生を終了し、次の曲音声データの再生を開始する。この際、プレイリスト再生部108は、スキップした曲の曲IDと、再生中のプレイリストとを適応処理部116に出力する。
FIG. 18 is a flowchart illustrating a process performed by the adaptive processing unit.
When the
このとき、適応処理部116では、図18に示すように、スキップした曲の曲IDと再生中のプレイリストとを受付(ステップS21)、スキップした曲の曲IDをキー情報としてスキップした曲のイメージ特徴量を取得する(ステップS22)。ステップS21及びS22の処理は、プレイリスト範囲修正部116aが行う。ステップS22の処理において、プレイリスト範囲修正部116aは、曲DB 123を検索し、スキップした曲の曲IDと対応付けられた曲のイメージ特徴量を取得する。
At this time, as shown in FIG. 18, the
スキップした曲のイメージ特徴量を取得すると、プレイリスト範囲修正部116aは、次に、取得したイメージ特徴量に基づいて再生中のプレイリストの範囲を縮小する(ステップS23)。ステップS23の処理において、プレイリスト範囲修正部116aは、スキップした曲のイメージ特徴量がプレイリストの範囲外となるよう、プレイリストの範囲を縮小する。
When the image feature amount of the skipped song is acquired, the playlist
プレイリストの範囲の縮小を終えると、プレイリスト範囲修正部116aは、次に、プレイリストの範囲を調整するか否かを判定する(ステップS24)。ステップS24の判定では、例えば、プレイリストの範囲の縮小量に基づいて、プレイリストの範囲を拡大調整するか否かを判定する。
After reducing the playlist range, the playlist
プレイリストの範囲を調整する場合(ステップS24;Yes)、プレイリスト範囲修正部116aは、スキップした曲の特徴量が含まれない方向にプレイリストの範囲を拡大する(ステップS25)。その後、プレイリスト範囲修正部116aは、範囲を変更したプレイリストの変更後の範囲を修正データのデータベース116cに登録する(ステップS26)。一方、プレイリストの範囲を調整しない場合(ステップS24;No)、プレイリスト範囲修正部116aは、ステップS25の処理を行わずに、範囲を変更したプレイリストの変更後の範囲を修正データのデータベース116cに登録する(ステップS26)。すなわち、プレイリストの範囲を調整する場合(ステップS24;Yes)、プレイリスト範囲修正部116aは、ステップS23で縮小するとともにステップS25で拡大調整したプレイリストの範囲を修正データのデータベース116cに登録する。一方、プレイリストの範囲を調整しない場合(ステップS24;No)、プレイリスト範囲修正部116aは、ステップS23で縮小したプレイリストの範囲を修正データのデータベース116cに登録する。
When adjusting the range of the playlist (Step S24; Yes), the playlist
修正したプレイリストの範囲を修正データのデータベース116cに登録した後、適応処理部116では、修正データ及びプレイリスト学習用データに基づいて、プレイリストの想定分布及び範囲を再学習する(ステップS27)。ステップS27の処理は、プレイリストDB再学習部116bが行う。プレイリストDB再学習部116bは、例えば、修正データに登録された修正後のプレイリストの範囲をプレイリスト学習用データに含め、それらのプレイリストの範囲に対するカーネル回帰でプレイリストの範囲を再学習する。また、プレイリストDB再学習部116bは、例えば、再学習後のプレイリストの範囲と各曲のイメージ特徴量とに基づいて、プレイリストの想定分布を再学習する。
After registering the corrected playlist range in the
ステップS27におけるプレイリストの想定分布及び範囲の再学習を終えると、プレイリストDB再学習部116bは、プレイリストDB 124の該当プレイリストの想定分布及び範囲を再学習により得られたプレイリストの想定分布及び範囲に更新する(ステップS28)。
After completing the re-learning of the assumed distribution and range of the playlist in step S27, the playlist
このように、本実施形態に係るプレイリスト生成装置1では、プレイリスト再生中に曲をスキップする操作が行われると、スキップした曲のイメージ特徴量がプレイリストの範囲外となるようプレイリストの範囲を修正する。そのため、次回以降、同じプレイリストを再生する際には、過去にスキップした曲がプレイリストから除外される。したがって、利用者にとってプレイリストのイメージに合わない曲をプレイリストから除外することができ、再生するプレイリストのイメージを利用者のイメージにより近づけることが可能となる。
As described above, in the
図19は、プレイリストの範囲の修正方法の例を説明する図である。図19の(a)及び(b)には、それぞれ、二次元のイメージ特徴空間(H−K平面)におけるプレイリストの範囲と曲のイメージ特徴量を表す黒丸とを示している。 FIG. 19 is a diagram illustrating an example of a method of correcting the range of a playlist. FIGS. 19A and 19B show a range of a playlist in a two-dimensional image feature space (HK plane) and a black circle representing an image feature amount of a song, respectively.
プレイリスト生成装置1において第1の実施形態で説明したプレイリスト生成処理を行う際に、例えば、図19の(a)に示すように、推薦プレイリスト候補が5個であり、イメージ特徴空間(H−K平面)における5個のプレイリストL1,L2,L3,L4,及びL5の範囲311,312,313,314,及び315がそれぞれ長方形で表されるとする。また、プレイリスト決定部106においてプレイリストL2が推薦プレイリストに決定されたとする。このとき、プレイリスト再生部108は、プレイリストL2の範囲312内に含まれる5曲の曲211,212,213,217,218を順次再生する。
When the
ここで、例えば、プレイリストL2に含まれる曲217の再生中に利用者がスキップ操作を行ったとする。この場合、適応処理部116は、図19の(b)に示すように、スキップした曲217がプレイリストL2の範囲外となるよう、プレイリストL2の範囲を縮小する。図19の(a)に示したように、プレイリストL2の範囲312内における最も右側、すなわちイメージ特徴量におけるHの値が最も大きい曲217をプレイリストL2の範囲外にする場合、曲217の右方に位置する辺を−H方向に移動させる。これにより、他の4曲211,212,213,及び218のイメージ特徴量がプレイリストL2の範囲312内に含まれた状態のまま、曲217のみをプレイリストL2の範囲外にすることができる。この際、−H方向に移動させる辺の移動量は、例えば、移動後の辺と曲217のイメージ特徴量との距離dが所定の距離になる移動量とする。
Here, for example, the user during playback of the
なお、曲をスキップする毎にプレイリストの範囲を縮小すると、やがてプレイリストの範囲が0となり無効なプレイリストになってしまう可能性がある。そのため、プレイリストの範囲を縮小する場合、ステップS25の処理のように、縮小した分、他の方向に範囲を拡大してプレイリストの範囲を調整してもよい。 Note that if the range of the playlist is reduced every time a song is skipped, the range of the playlist may eventually become 0 and become an invalid playlist. Therefore, when the range of the playlist is reduced, the range of the playlist may be adjusted by expanding the range in another direction by the reduced amount, as in the process of step S25.
図20は、プレイリストの範囲の拡大方法の例を説明する図である。図20の(a)、(b)、及び(c)には、それぞれ、二次元のイメージ特徴空間(H−K平面)におけるプレイリストL2の範囲312と曲のイメージ特徴量を表す黒丸とを示している。また、図20の(a)、(b)、及び(c)には、それぞれ、図19に示したように曲217をスキップしたことにより範囲312を縮小した場合の縮小後の範囲312の拡大方法の例を示している。
FIG. 20 is a diagram illustrating an example of a method of expanding the range of a playlist. FIGS. 20A, 20B, and 20C respectively show a
例えば、プレイリストL2の範囲312における右辺を−H方向に距離hdだけ移動させて範囲312を縮小した場合、範囲312を拡大する方法の1つとして、図20の(a)に示すように、範囲312の左辺を−H方向に距離hdだけ移動させる方法が挙げられる。すなわち、図20の(a)に示した例では、プレイリストL2の範囲312を−H方向に距離hdだけ平行移動させたことになり、イメージ特徴空間における範囲312の面積を変えずに曲217が範囲外となるようにしている。
For example, if obtained by reducing the
また、プレイリストL2の範囲312における右辺を−H方向に距離hdだけ移動させて範囲312を縮小した場合、図20の(b)に示すように、範囲312の下辺を−K方向に距離heだけ移動させて範囲312を拡大してもよい。なお、図示は省略するが、範囲312の下辺を−K方向に移動させる代わりに、上辺を+K方向に移動させて範囲312を拡大してもよい。更に、図示は省略するが、範囲312の下辺をーK方向に移動させるとともに、上辺を+K方向に移動させて範囲312を拡大させてもよい。
Also, if obtained by reducing the
また、プレイリストL2の範囲312における右辺を−H方向に距離hdだけ移動させて範囲312を縮小した場合、図20の(c)に示すように、範囲312の左辺を−H方向に移動させるとともに下辺を−K方向に移動させて範囲312を拡大してもよい。なお、図示は省略するが、範囲312の左辺、上辺、及び下辺を、それぞれ範囲312が拡大する方向に移動させてもよい。
The movement, if obtained by reducing the
図21は、プレイリストの範囲の拡大することによる効果の1つを説明する図である。図21の(a)及び(b)には、それぞれ、二次元のイメージ特徴空間(H−K平面)におけるプレイリストL2の範囲312と曲のイメージ特徴量を表す黒丸とを示している。また、図21の(a)には、図19に示したように曲217をスキップしたことにより範囲312を縮小した場合の縮小後の範囲312を示している。
FIG. 21 is a diagram illustrating one of the effects obtained by expanding the range of the playlist. In (a) and (b) in FIG. 21 respectively show a black circle representing an image feature amount in the
プレイリストL2の範囲312に含まれていた曲217を利用者がスキップする理由の1つとして、利用者にとって曲217のイメージがプレイリストL2のイメージと合致していないことが挙げられる。この場合、曲217のイメージとプレイリストL2のイメージとの差異(齟齬)の原因としては、例えば、プレイリストL2の範囲312が広すぎることや、範囲312の中心がずれていること等が挙げられる。範囲312の中心がずれている場合、例えば、範囲312外でありかつ範囲312の近傍に位置する曲219のイメージがプレイリストL2のイメージと合致することも考えられる。縮小後の範囲312を調整(拡大修正)すれば、図21の(b)に示すように、プレイリストL2の範囲外に存在するプレイリストL2のイメージに近い曲219をプレイリストL2の範囲312に含めることができる。そのため、プレイリスト生成時に当該プレイリストL2のイメージに合致した曲をより多く利用者に提示することが可能となる。
One reason to skip
また、範囲312を拡大修正することによりプレイリストL2に含まれることとなった曲219の再生中に利用者によるスキップ操作が行われれば、プレイリストL2の範囲312は曲219が含まれない範囲に再学習(再修正)される。そのため、プレイリストL2の範囲312をプレイリストL2のイメージに合ったより適切な範囲にすることが可能となる。
Further, if the skip operation by the user during reproduction of
このように、本実施形態に係るプレイリスト生成処理では、プレイリスト再生中に利用者が曲をスキップする操作を行った場合、スキップした曲の曲特徴量に基づいて再生中のプレイリストの範囲を修正し、想定分布及び範囲を再学習する。そのため、各プレイリストの想定分布及び範囲を利用者の抱くイメージに適応的に近づけることができ、プレイリストのイメージと再生された曲のイメージとの齟齬により利用者に与える違和感をより低減することが可能となる。 As described above, in the playlist generation processing according to the present embodiment, when the user performs an operation of skipping a song during the playlist playback, the range of the playlist being played based on the song feature amount of the skipped song is Is corrected, and the assumed distribution and range are re-learned. Therefore, the assumed distribution and range of each playlist can be adaptively approximated to the image held by the user, and the discomfort given to the user due to the discrepancy between the image of the playlist and the image of the reproduced music is further reduced. Becomes possible.
[第3の実施形態]
図22は、第3の実施形態に係るプレイリスト再生システムの構成を示す図である。
[Third Embodiment]
FIG. 22 is a diagram illustrating a configuration of a playlist playback system according to the third embodiment.
図22に示すように、本実施形態に係るプレイリスト再生システム4は、音楽再生装置5と、サーバ6とを備える。音楽生成装置5とサーバ6とは、インターネット等の通信ネットワーク7を介して通信可能に接続される。
As shown in FIG. 22, the
音楽再生装置5は、サーバ6から音楽データ(曲音声データ)を取得して再生する装置である。音楽再生装置5は、音声入力部(マイク)501と、音声出力部502と、信号処理部503と、通信部504と、を備える。
The
音声入力部501は、音楽再生装置5の周囲を伝播する音声を収音し音声信号として入力する。音声出力部502は、例えばスピーカであり、音楽(曲音声)を含む音声信号を音声として音楽再生装置5の外部の空間に向けて出力する。なお、音声出力部502は、スピーカに限らず、例えばイヤフォンやアンプ等の音響機器を接続する出力端子であってもよい。
The
信号処理部503は、音声入力部501から入力された音声信号の変換処理、及びサーバから取得した曲音声データの再生処理等を行う。通信部504は、サーバ6が備える図示しない通信部との間でのデータ通信等を行う。
The
図23は、第3の実施形態に係るプレイリスト再生システムにおけるサーバの機能的構成を示す図である。 FIG. 23 is a diagram illustrating a functional configuration of a server in the playlist playback system according to the third embodiment.
図23に示すように、本実施形態のプレイリスト再生システム4におけるサーバ6は、通信部601と、音声認識部602と、キーワード/属性抽出部603と、曲絞込部604と、を備える。また、サーバ6は、推薦プレイリスト候補生成部605と、優先度算出部606と、プレイリスト決定部607と、ナレーション作成部608と、プレイリスト再生部609と、を備える。また、サーバ6は、キーワードDB 621と、絞込属性DB 622と、曲DB 623と、プレイリストDB 624と、を備える。
As shown in FIG. 23, the server 6 in the
通信部601は、音楽再生装置5の通信部504との間でのデータ通信等を行う。通信部601は、音楽再生装置5の音声入力部501が収音した音声信号を受信する。また、通信部601は、プレイリスト再生部609が再生した音声データを音楽再生装置5に送信する。
The
音声認識部602は、通信部601を介して入力された音楽再生装置5からの音声信号を解析し、音声信号に含まれる有意な音声をテキストに変換する。
The
キーワード/属性抽出部603は、音声認識部602で得たテキストに基づいて、キーワードDB 621から検索キーワードを抽出するとともに、絞込属性DB 622から曲の絞り込み属性を抽出する。キーワードDB 621は、第1の実施形態で説明したキーワードDB 121と同様、テキストと検索キーワードとの対応関係が複数登録されたデータベースである。検索キーワードは、プレイリストの検索に用いるキーワードである。絞込属性DB 622は、第1の実施形態で説明した絞込属性DB 122と同様、テキストと曲の絞り込み属性との対応関係が複数登録されたデータベースである。曲の絞り込み属性は、プレイリストに登録する曲の絞り込みに用いる属性情報である。
The keyword /
曲絞込部604は、抽出した絞り込み属性に基づいて、プレイリストへの登録対象の候補となる曲を、曲DB 623に登録された全ての曲から絞り込み属性に合致する属性を持つ曲に絞り込む。曲DB 623は、第1の実施形態で説明した曲DB 123と同様、曲音声データと、曲属性と、曲のイメージ特徴量との対応関係が複数登録されたデータベースである。曲属性は、曲音声データの絞り込みに用いる属性情報である。曲のイメージ特徴量は、曲のイメージを数値化した情報である。
The
推薦プレイリスト候補作成部605は、プレイリストDB 624から曲絞込部604で絞り込んだ曲を含むプレイリストを抽出して推薦プレイリスト候補を作成する。推薦プレイリスト候補は、音楽再生装置5の利用者(オペレータ)に推薦する(提示する)プレイリストの候補である。推薦プレイリスト候補は、プレイリストの名称と、曲IDと、想定分布とを含む。プレイリストDB 624は、第1の実施形態で説明したプレイリストDB 124と同様、プレイリスト毎にプレイリストの名称と、想定分布と、プレイリストの範囲とを対応付けて登録したデータベースである。プレイリストの想定分布は、曲のイメージ特徴量に基づいて曲の分布を表す際のイメージ特徴空間におけるプレイリストの平均(中心)及び分散である。また、プレイリストの範囲は、イメージ特徴空間におけるプレイリストへの登録対象となる曲の存在する範囲である。
The recommended playlist
優先度算出部606は、推薦プレイリスト候補作成部605が複数の推薦プレイリスト候補を作成した場合の各推薦プレイリスト候補の優先度(推薦優先度)を算出する。優先度算出部606は、推薦プレイリスト候補の想定分布及び範囲、並びに検索キーワードに基づいて、各推薦プレイリスト候補の優先度を算出する。
The
プレイリスト決定部607は、優先度算出部606が算出した推薦優先度に基づいて、複数の推薦プレイリスト候補のなかから採用するプレイリストを決定する。
The
ナレーション作成部608は、プレイリスト決定部607が決定したプレイリストの名称を含むナレーション音声データを作成する。
The
プレイリスト再生部609は、ナレーション作成部608が作成したナレーション音声を再生するとともに、プレイリスト決定部607が決定したプレイリストに含まれる曲音声データを曲DB 623から読み出して再生する。
The
このように、本実施形態のプレイリスト再生システム4におけるサーバ6は、第1の実施形態に係るプレイリスト再生装置1における要求プレイリスト入力部101及び音声出力部109を通信部601及び音声認識部102に置き換えた構成となっている。すなわち、本実施形態のプレイリスト再生システム4におけるサーバ6は、プレイリスト生成装置として機能する。サーバ6は、音楽再生装置5からのプレイリストの再生を要求する音声信号を受信すると、図9A、図9B、図11、及び図12に示したようなプレイリスト生成処理を行う。その際、プレイリスト再生部609で再生したナレーション音声の音声データや曲音声データは、通信部601を介して音楽再生装置5に送信される。音楽再生装置5は、信号処理部503においてサーバ6から取得したナレーション音声の音声データ及び曲音声データに対する所定の処理を行った後、音声出力部502から音声及び曲音声を出力する。
As described above, the server 6 in the
本実施形態のプレイリスト再生システム4では、図9A、図9B、図11、及び図12に示したようなプレイリスト生成処理はサーバ6が行う。そのため、プレイリスト再生システム4においては、例えばカーナビゲーションシステム等の、通信可能であり、かつ音声信号を再生可能な情報端末を音楽再生装置5として用いることができる。また、本実施形態に係るプレイリスト再生システムのように曲DB 623をサーバ6に設ける場合、第1の実施形態に係るプレイリスト生成装1に比べ、曲DB 623により多くの曲音声データを蓄積することが可能となる。
In the
なお、プレイリスト再生システム4は、本実施形態で説明したような音声によりプレイリストの生成要求を入力する構成に限らず、プレイリストの生成要求をテキストで入力する構成であってもよい。更に、プレイリスト再生システム4は、音声による入力及びテキストによる入力が可能な構成であってもよい。
Note that the
[第4の実施形態]
図24は、第4の実施形態に係るプレイリスト再生システムの構成を示す図である。
[Fourth embodiment]
FIG. 24 is a diagram illustrating a configuration of a playlist playback system according to the fourth embodiment.
図24に示すように、本実施形態に係るプレイリスト再生システム4は、音楽再生装置5と、サーバ6とを備える。音楽生成装置5とサーバ6とは、インターネット等の通信ネットワーク7を介して通信可能に接続される。
As shown in FIG. 24, the
音楽再生装置5は、音楽データ(曲音声データ)を再生する装置である。音楽再生装置5は、音声入力部(マイク)501と、音声出力部502と、通信部504と、音声認識部505と、を備える。また、音楽再生装置5は、データ入力部506と、曲音声データ登録部507と、ナレーション音声作成部508と、プレイリスト再生部509と、を備える。また、音楽再生装置5は、曲ID及び曲音声データを格納するデータベース521を備える。
The
音声入力部501は、音楽再生装置5の周囲を伝播する音声を収音し音声信号として入力する。音声出力部502は、例えばスピーカであり、音楽(曲音声)を含む音声信号を音声として音楽再生装置5の外部の空間に向けて出力する。なお、音声出力部502は、スピーカに限らず、例えばイヤフォンやアンプ等の音響機器を接続する出力端子であってもよい。
The
通信部504は、サーバ6が備える図示しない通信部との間でのデータ通信等を行う。
音声認識部505は、音声入力部501により入力された音声信号を解析し、音声信号に含まれる有意な音声をテキストに変換する。
The
The
データ入力部506は、音楽CD等の音声データから作成した曲音声データの入力を受け付ける。
The
曲音声データ登録部507は、データ入力部506を介して入力された曲音声データや、通信ネットワーク7を介して取得した曲音声データをデータベース521に登録する。また、曲音声データ登録部507は、データ入力部506を介して入力された曲音声データについての曲IDをサーバ6の図示しない曲DB から取得する処理を行う。また、曲音声データ登録部507は、データベース521に登録した曲音声データについての曲IDをサーバ6の図示しない曲IDDBに登録する処理を行う。
The song audio
ナレーション音声作成部508は、サーバ6が作成したナレーション文章のテキストを音声データに変換する。
The narration
プレイリスト再生部509は、ナレーション音声作成部508で作成したナレーション音声の再生、及びサーバ6が作成したプレイリストの再生を行う。サーバ6は、音楽再生装置5のデータベース521に収納された曲音声データに対するプレイリストを作成する。そのため、プレイリスト再生部509は、プレイリストに従ってデータベース521から曲音声データを読み出し再生する。
The
図25は、第4の実施形態に係るプレイリスト再生システムにおけるサーバの機能的構成を示す図である。 FIG. 25 is a diagram illustrating a functional configuration of a server in the playlist playback system according to the fourth embodiment.
図25に示すように、本実施形態のプレイリスト再生システム4におけるサーバ6は、通信部601と、キーワード/属性抽出部603と、曲絞込部604と、を備える。また、サーバ6は、推薦プレイリスト候補生成部605と、優先度算出部606と、プレイリスト決定部607と、ナレーション文章作成部608aと、を備える。また、サーバ6は、キーワードDB 621と、絞込属性DB 622と、曲DB 623と、プレイリストDB 624と、曲IDDB 623と、を備える。
As shown in FIG. 25, the server 6 in the
通信部601は、音楽再生装置5の通信部504との間でのデータ通信等を行う。通信部601は、音楽再生装置5が送信したテキスト(音声認識結果)や曲音声データの曲ID等を受信する。また、通信部601は、プレイリスト決定部607が決定したプレイリスト、ナレーション文章作成部608aが作成したナレーション文章のテキスト等を音楽再生装置5に送信する。
The
キーワード/属性抽出部603は、音楽再生装置5から取得したテキスト(音声認識結果)に基づいて、キーワードDB 621から検索キーワードを抽出するとともに、絞込属性DB 622から曲の絞り込み属性を抽出する。キーワードDB 621は、第1の実施形態で説明したキーワードDB 121と同様、テキストと検索キーワードとの対応関係が複数登録されたデータベースである。検索キーワードは、プレイリストの検索に用いるキーワードである。絞込属性DB 622は、第1の実施形態で説明した絞込属性DB 122と同様、テキストと曲の絞り込み属性との対応関係が複数登録されたデータベースである。曲の絞り込み属性は、プレイリストに登録する曲の絞り込みに用いる属性情報である。
The keyword /
曲絞込部604は、抽出した絞り込み属性に基づいて、プレイリストへの登録対象の候補となる曲を、曲DB 623に登録された全ての曲のうち曲IDDB 625に曲IDが登録されている曲のなかから絞り込み属性に合致する属性を持つ曲に絞り込む。曲DB 623は、第1の実施形態で説明した曲DB 123と同様、曲音声データと、曲属性と、曲のイメージ特徴量との対応関係が複数登録されたデータベースである。曲属性は、曲音声データの絞り込みに用いる属性情報である。曲のイメージ特徴量は、曲のイメージを数値化した情報である。曲IDDB 625は、音楽再生装置5のデータベース521に収納された曲音声データについての曲IDが登録されたデータベースである。
The
推薦プレイリスト候補作成部605は、プレイリストDB 624から曲絞込部604で絞り込んだ曲を含むプレイリストを抽出して推薦プレイリスト候補を作成する。推薦プレイリスト候補は、音楽再生装置5の利用者(オペレータ)に推薦する(提示する)プレイリストの候補である。推薦プレイリスト候補は、プレイリストの名称と、曲IDと、想定分布とを含む。プレイリストDB 624は、第1の実施形態で説明したプレイリストDB 124と同様、プレイリスト毎にプレイリストの名称と、想定分布と、プレイリストの範囲とを対応付けて登録したデータベースである。プレイリストの想定分布は、曲のイメージ特徴量に基づいて曲の分布を表す際のイメージ特徴空間におけるプレイリストの平均(中心)及び分散である。また、プレイリストの範囲は、イメージ特徴空間におけるプレイリストへの登録対象となる曲の存在する範囲である。
The recommended playlist
優先度算出部606は、推薦プレイリスト候補作成部605が複数の推薦プレイリスト候補を作成した場合の各推薦プレイリスト候補の優先度(推薦優先度)を算出する。優先度算出部606は、推薦プレイリスト候補の想定分布及び範囲、並びに検索キーワードに基づいて、各推薦プレイリスト候補の優先度を算出する。
The
プレイリスト決定部607は、優先度算出部606が算出した推薦優先度に基づいて、複数の推薦プレイリスト候補のなかから採用するプレイリストを決定する。
The
ナレーション文章作成部608は、プレイリスト決定部607が決定したプレイリストの名称を含むナレーション文章のテキストを作成する。
The narration
本実施形態のプレイリスト再生システム4では、第1の実施形態に係るプレイリスト再生装置1の要求プレイリスト入力部101、ナレーション音声作成部107b、プレイリスト再生部108、及び音声出力部109が音楽再生装置5に設けられている。すなわち、本実施形態のプレイリスト再生システム4におけるサーバ6は、プレイリスト生成装置として機能する。また、プレイリスト再生システム4が行うプレイリスト生成処理では、図9A及び図9Bに示したステップS1〜S9の処理のうち、ステップS1,S2,S8の一部,及びS9の処理を音楽再生装置5が行う。すなわち、プレイリスト再生システム4が行うプレイリスト生成処理では、図9Aに示したステップS3〜S7の処理をサーバ6が行う。
In the
なお、本実施形態のプレイリスト再生システム4におけるサーバ6は、上記のように、音楽再生装置5のデータベース521に登録された曲音声データのみを対象としてプレイリストを生成する。そのため、音楽再生装置5は、データベース521に登録した曲音声データの曲IDをサーバ6の曲IDDB 625に登録する処理を行う。この登録処理は、例えば、以下のような手順で行う。
Note that, as described above, the server 6 in the
音楽再生装置5は、例えば、データ入力部506から曲音声データが入力されると、曲音声データ登録部507により入力された曲音声データに対する曲IDを取得する処理を行う。曲音声データ登録部507は、入力された曲音声データを用いてサーバ6の曲DB 623を検索し、当該曲音声データの曲IDを取得する。曲音声データ登録部507は、取得した曲IDをサーバ6の曲IDDB 625に登録するとともに、曲音声データ及び曲IDを音楽再生装置5のデータベース521に登録する。
For example, when music sound data is input from the
一方、サーバ6が行う処理のうち曲絞込部604が絞込属性に基づいて曲を絞り込む処理(ステップS4)では、曲IDDB 625に登録された曲IDの曲のみを対象として絞込属性に合致する曲属性を持つ曲に絞り込む。
On the other hand, among the processes performed by the server 6, the
このように、本実施形態に係るプレイリスト再生システム4では、音楽再生装置5に登録された曲音声データについてのプレイリストの生成処理の大部分を、音楽再生装置5とは別のサーバ6で行う。そのため、音楽再生装置5の処理負荷を軽減することが可能となる。
As described above, in the
また、本実施形態に係るプレイリスト再生システム4では、音楽再生装置5に登録された曲音声データのみをプレイリストへの登録対象としているので、通信ネットワーク7を介したサーバ6から音楽再生装置5に曲音声データの転送は行わない。そのため、移動しながら無線通信を行っている場合等、通信品質が不安定な状況下においても、曲音声データを安定して再生することができる。
Further, in the
なお、プレイリスト再生システム4は、本実施形態で説明したような音声によりプレイリストの生成要求を入力する構成に限らず、プレイリストの生成要求をテキストで入力する構成であってもよい。更に、プレイリスト再生システム4は、音声による入力及びテキストによる入力が可能な構成であってもよい。
Note that the
[第5の実施形態]
図26は、第5の実施形態に係るプレイリスト再生システムの構成を示す図である。
[Fifth Embodiment]
FIG. 26 is a diagram illustrating a configuration of a playlist playback system according to the fifth embodiment.
図26に示すように、本実施形態に係るプレイリスト再生システム4は、音楽再生装置5と、サーバ6と、複数の携帯型電子機器8(8A,8B)を備える。音楽生成装置5とサーバ6とは、インターネット等の通信ネットワーク7を介して通信可能に接続される。また、音楽再生装置5と携帯型電子機器8とは、ブルートゥース(登録商標)等の近距離無線通信により通信可能に接続される。本実施形態のプレイリスト再生システム4におけるサーバ6は、第4の実施形態のサーバ6(図25を参照)と同じ構成でよい。
As shown in FIG. 26, the
音楽再生装置5は、音楽データ(曲音声データ)を再生する装置である。音楽再生装置5は、音声入力部(マイク)501と、音声出力部502と、第1の通信部504と、第2の通信部510と、音声認識部505と、を備える。また、音楽再生装置5は、データ入力部506と、曲音声データ登録部507と、ナレーション音声作成部508と、プレイリスト再生部509と、を備える。また、音楽再生装置5は、曲ID及び曲音声データを格納するデータベース521を備える。
The
音声入力部501は、音楽再生装置5の周囲を伝播する音声を収音し音声信号として入力する。音声出力部502は、例えばスピーカであり、音楽(曲音声)を含む音声信号を音声として音楽再生装置5の外部の空間に向けて出力する。なお、音声出力部502は、スピーカに限らず、例えばイヤフォンやアンプ等の音響機器を接続する出力端子であってもよい。
The
第1の通信部504は、サーバ6が備える図示しない通信部との間でのデータ通信等を行う。第2の通信部510は、携帯型電子機器8が備える通信部801との間でデータ通信を行う。
The
音声認識部505は、音声入力部501により入力された音声信号を解析し、音声信号に含まれる有意な音声をテキストに変換する。
The
データ入力部506は、音楽CD等の音声データから作成した曲音声データの入力を受け付ける。
The
曲音声データ登録部507は、データ入力部506を介して入力された曲音声データや、通信ネットワーク7を介して取得した曲音声データをデータベース521に登録する。また、曲音声データ登録部507は、データ入力部506を介して入力された曲音声データについての曲IDをサーバ6の図示しない曲DB から取得する処理を行う。また、曲音声データ登録部507は、データベース521に登録した曲音声データについての曲IDをサーバ6の図示しない曲IDDBに登録する処理を行う。
The song audio
ナレーション音声作成部508は、サーバ6が作成したナレーション文章のテキストを音声データに変換する。
The narration
プレイリスト再生部509は、ナレーション音声作成部508で作成したナレーション音声の再生、及びサーバ6が作成したプレイリストの再生を行う。サーバ6は、音楽再生装置5のデータベース521に収納された曲音声データに対するプレイリストを作成する。そのため、プレイリスト再生部509は、プレイリストに従ってデータベース521から曲音声データを読み出し再生する。
The
携帯型電子機器8(8A,8B)は、スマートフォンやタブレット型コンピュータ等の無線通信又は有線通信が可能な電子機器である。携帯型電子機器8は、通信部801と、曲音声データを登録したデータベース821と、図示しない入力操作部と、備える。通信部801は、音楽再生装置5の第2の通信部510との間でデータ通信を行う。携帯型電子機器8の通信部801と音楽再生装置5の第2の通信部510とは、所定の無線通信規格に従った無線通信によりデータ通信を行う。
The portable electronic device 8 (8A, 8B) is an electronic device capable of wireless communication or wired communication such as a smartphone or a tablet computer. The portable
本実施形態のプレイリスト再生システム4では、第1の実施形態に係るプレイリスト再生装置1の要求プレイリスト入力部101、ナレーション音声作成部107b、プレイリスト再生部108、及び音声出力部109が音楽再生装置5に設けられている。そのため、プレイリスト再生システム4が行うプレイリスト生成処理では、図9A及び図9Bに示したステップS1〜S9の処理のうち、ステップS1,S2,S8の一部,及びS9の処理を音楽再生装置5が行う。すなわち、プレイリスト再生システム4が行うプレイリスト生成処理では、図9Aに示したステップS3〜S7の処理をサーバ6が行う。したがって、本実施形態のプレイリスト再生システム4においても、サーバ6は、プレイリスト生成装置として機能する。
In the
なお、本実施形態のプレイリスト再生システム4におけるサーバ6は、上記のように、音楽再生装置5のデータベース521に登録された曲音声データのみを対象としてプレイリストを生成する。そのため、音楽再生装置5は、データベース521に登録した曲音声データの曲IDをサーバ6の曲IDDB 625に登録する処理を行う。この登録処理は、例えば、以下のような手順で行う。
Note that, as described above, the server 6 in the
音楽再生装置5は、例えば、データ入力部506から曲音声データが入力されると、曲音声データ登録部507により入力された曲音声データに対する曲IDを取得する処理を行う。曲音声データ登録部507は、入力された曲音声データを用いてサーバ6の曲DB 623を検索し、当該曲音声データの曲IDを取得する。曲音声データ登録部507は、取得した曲IDをサーバ6の曲IDDB 625に登録するとともに、曲音声データ及び曲IDを音楽再生装置5のデータベース521に登録する。
For example, when music sound data is input from the
また、本実施形態のプレイリスト再生システム4では、携帯型電子機器8のデータベース821に登録された曲音声データを音楽再生装置5に転送することが可能である。携帯型電子機器8の曲音声データを音楽再生装置5に転送した場合も、音楽再生装置5は、同様の方法で曲IDを取得して曲IDDB 625に登録するとともに、曲音声データ及び曲IDを音楽再生装置5のデータベース521に登録する。
Further, in the
一方、サーバ6が行う処理のうち曲絞込部604が絞込属性に基づいて曲を絞り込む処理(ステップS4)では、曲IDDB 625に登録された曲IDの曲のみを対象として絞込属性に合致する曲属性を持つ曲に絞り込む。
On the other hand, among the processes performed by the server 6, the
このように、本実施形態に係るプレイリスト再生システム4では、音楽再生装置5に登録された曲音声データについてのプレイリストの生成処理の大部分を、音楽再生装置5とは別のサーバ6で行う。そのため、音楽再生装置5の処理負荷を軽減することが可能となる。
As described above, in the
また、本実施形態に係るプレイリスト再生システム4では、音楽再生装置5に登録された曲音声データのみをプレイリストへの登録対象としているので、通信ネットワーク7を介したサーバ6から音楽再生装置5に曲音声データの転送は行わない。そのため、移動しながら無線通信を行っている場合等、通信品質が不安定な状況下においても、曲音声データを安定して再生することができる。
Further, in the
また、本実施形態に係るプレイリスト再生システム4では、音楽再生装置5のデータベース521に曲音声データが登録されていない状態であっても、携帯型電子機器8から曲音声データを取得して再生することができる。そのため、音楽CD等から生成した曲音声データを予め音楽再生装置5のデータベース521に登録する作業等の手間が省ける。
Further, in the
更に、本実施形態に係るプレイリスト再生システム4では、図26に示したように、複数の携帯型電子機器8から曲音声データを収集して音楽再生装置5のデータベース521に登録させることができる。そのため、プレイリストを再生した際に、各利用者が自身の所持する携帯型電子機器8に登録されていない曲を聞くことも可能となる。
Furthermore, in the
なお、上記のプレイリスト生成装置1や音楽再生装置5は、要求プレイリスト入力部101(マイク501)を用いた音声入力によりプレイリストの生成要求及び再生要求を入力する構成になっている。このような構成は、特に、車載向けの装置に適用することが好ましい。車両のドライバーが運転中にプレイリスト生成装置1や音楽再生装置5を使用する場合、装置本体や装置に接続された表示装置を見ながらプレイリストを選択することが難しい。そのため、上記の実施形態で説明したように音声入力によりプレイリストを選択することが好ましい。ただし、本実施形態のプレイリスト再生システム4においても、プレイリストの生成要求及び再生要求は、音声入力に限らず、タッチパネルやスイッチ等の入力装置を操作してテキストで入力するようにしてもよい。
The
また、上記のプレイリスト生成装置1、音楽再生装置5、及びサーバ6は、コンピュータと、当該コンピュータに実行させるプログラムとを用いて実現することが可能である。以下、コンピュータとプログラムとを用いて実現されるプレイリスト生成装置1等について、図27を参照して説明する。
Further, the
図27は、コンピュータのハードウェア構成を示す図である。図27に示すように、プレイリスト生成装置1として動作させることが可能なコンピュータ10は、Central Processing Unit(CPU)1001と、主記憶装置1002と、補助記憶装置1003と、入力装置1004と、表示装置1005と、を備える。また、コンピュータ10は、インタフェース装置1006と、記憶媒体駆動装置1007と、通信装置1008と、を更に備える。コンピュータ10におけるこれらの要素1001から1008までは、バス1010により相互に接続されており、要素間でのデータの受け渡しが可能になっている。
FIG. 27 is a diagram illustrating a hardware configuration of a computer. As shown in FIG. 27, a
CPU 1001は、オペレーティングシステムを含む各種のプログラムを実行することによりコンピュータ10の全体の動作を制御する演算処理装置である。
The
主記憶装置1002は、図示しないRead Only Memory(ROM)及びRandom Access Memory(RAM)を含む。ROMには、例えばコンピュータ10の起動時にCPU 1001が読み出す所定の基本制御プログラム等が予め記録されている。また、RAM は、CPU 1001が各種のプログラムを実行する際に、必要に応じて作業用記憶領域として使用する。主記憶装置1002のRAMは、例えば、抽出した検索キーワードや絞り込み属性、推薦プレイリスト候補等の一時的な保持に利用可能である。
The
補助記憶装置1003は、Hard Disk Drive(HDD)やSolid State Drive(SSD)等の主記憶装置1002に比べて容量の大きい記憶装置である。補助記憶装置1003には、CPU 1001によって実行される各種のプログラムや各種のデータ等を記憶させることができる。補助記憶装置1003には、例えば、記憶させるプログラムとしては、例えば、上記のプレイリスト生成処理を含む曲音声データの再生プログラム等が挙げられる。また、補助記憶装置1003に記憶させるデータとしては、例えば、キーワードDB 121、絞込属性DB 122、曲DB 123、及びプレイリストDB 124等が挙げられる。
The
入力装置1004は、例えば押し釦スイッチ、キーボード装置、マウス装置等であり、利用者(オペレータ)が所定の操作を行うことにより当該操作に応じた情報がCPU 1001等に入力される。また、入力装置1004には、例えば、表示装置1005の表示面に重ねて配置したタッチパネル装置も利用可能である。
The
表示装置1005は、例えば液晶ディスプレイ等の表示装置である。表示装置1005は、CPU 1001等から送信される表示データに従って各種のテキスト、画像等を表示する。
The
インタフェース装置1006は、コンピュータ10と他の電子機器とを接続し、コンピュータ10と他の電子機器との間でのデータの送受信を可能にする入出力装置である。インタフェース装置1006は、例えば、Universal Serial Bus(USB)規格のコネクタを備えたケーブルを接続可能な端子等を備える。インタフェース装置1006によりコンピュータ10と接続可能な電子機器としては、マイク11やスピーカ12等が挙げられる。
The
記憶媒体駆動装置1007は、図示しない可搬型記憶媒体に記録されているプログラムやデータの読み出し、補助記憶装置1003に記憶されたデータ等の可搬型記憶媒体への書き込みを行う。可搬型記憶媒体としては、例えば、USB規格のコネクタが備えられているフラッシュメモリが利用可能である。また、可搬型記憶媒体としては、Compact Disk(CD)、Digital Versatile Disc(DVD)、Blu-ray Disc(Blu-rayは登録商標)等の光ディスクも利用可能である。
The storage
通信装置1008は、コンピュータ10とインターネット或いはLocal Area Network(LAN)等の通信ネットワークとを通信可能に接続し、通信ネットワークを介した他の通信端末(コンピュータ)との通信を制御する装置である。
The
このコンピュータ10をプレイリスト生成装置1として動作させる場合、CPU 1001は、補助記憶装置1003等から図9A及び図9Bに示したようなプレイリスト生成処理を含むプログラムを読み出して実行する。この際、CPU 1001は、補助記憶装置1003等に記憶させたキーワードDB 121等の各データベースを検索して推薦プレイリスト候補を生成し、各候補の優先度を算出する。そして、算出した優先度に基づいて利用者(オペレータ)に推薦するプレイリストを決定する。また、CPU 1001は、決定したプレイリストの名称を含むナレーション音声を生成して再生するとともに、決定したプレイリストに含まれる曲の曲音声データを再生する。
When operating the
また、コンピュータ10を音楽再生装置5として動作させる場合、CPU 1001は、補助記憶装置1003等から第4の実施形態で説明した曲音声データの登録処理やプレイリストの再生処理を含むプログラムを読み出して実行する。この際、コンピュータ10は、例えば、記憶媒体駆動装置1007を用いて音楽CD等から曲音声データを取得する。その後、コンピュータ10では、CPU 1001が通信装置1008を介してサーバ6から曲IDを取得し、曲音声データ及び曲IDを補助記憶装置1003に記憶させる。また、CPU 1001は、マイク11から入力された音声信号に対して音声認識処理を行い音声信号に含まれる有意な音声をテキストに変換する。更に、CPU 1001は、再生するプレイリストの名称を含むナレーション音声を作成して再生する処理、プレイリストに含まれる曲音声データを補助記憶装置1003から読み出して再生する処理等を行う。
When the
なお、コンピュータ10は、図27に示した全ての構成要素を含む必要はなく、用途や条件に応じて一部の構成要素を省略することも可能である。例えば、車両に搭載して使用することを想定したコンピュータ10の場合、記憶媒体駆動装置1007を省略してもよい。
Note that the
また、コンピュータ10は、種々のプログラムを実行することにより複数の機能を実現する汎用型のものに限らず、例えば、プレイリスト生成装置1として動作させるための処理に特化した専用の情報処理装置でもよい。
The
上記のように、本明細書では、曲音声データ(音楽データ)のイメージを表す特徴量に基づいてプレイリストを生成するプレイリスト生成装置1及びプレイリスト再生システム4について説明した。しかしながら、プレイリストに登録するデータは、曲音声データに限らず、イメージを表す特徴量により分類可能なデータであればよい。例えば、プレイリストに登録するデータは、小説等の朗読再生用の文書であってもよい。更に、プレイリストに登録するデータは、画像データや動画像データ等であってもよい。画像データをプレイリストに登録する場合、プレイリストに基づいて画像データをスライドショーで再生することにより、プレイリストのイメージと再生される画像のイメージとの齟齬を解消することが可能となる。
As described above, in the present specification, the
以上記載した各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータが、
利用者からのプレイリストの生成要求に含まれる当該プレイリストへの登録対象とする曲の属性を表す属性情報に基づいて曲の絞込を行い、
絞り込んだ前記曲のイメージを表す特徴量、及び前記生成要求に含まれる前記プレイリストのイメージと対応した前記特徴量の範囲に基づいて要求プレイリストを生成し、
生成した前記要求プレイリストの前記特徴量の範囲内において当該要求プレイリストに登録された前記曲の特徴量に偏りがある場合に、当該要求プレイリストに登録された前記曲の特徴量に基づいて前記利用者に提示するプレイリストの名称を変更する、
処理を実行することを特徴とするプレイリスト生成方法。
(付記2)
前記要求プレイリストの前記特徴量の範囲内において当該要求プレイリストに登録された前記曲の特徴量に偏りがある場合に、前記コンピュータは、前記要求プレイリストに登録された前記曲の特徴量に基づいて前記利用者に提示する前記プレイリストの名称を変更するとともに、変更後の前記イメージに基づいて前記利用者に推薦する推薦プレイリストを作成する、処理を実行する、
ことを特徴とする付記1に記載のプレイリスト生成方法。
(付記3)
前記推薦プレイリストを作成する処理では、前記コンピュータは、絞り込まれた前記曲のうち、変更後の前記プレイリストのイメージと対応した前記特徴量の範囲内となり、かつ前記要求プレイリストの前記特徴量の範囲内となる特徴量を持つ曲のみを登録した前記推薦プレイリストを作成する、
ことを特徴とする付記2に記載のプレイリスト生成方法。
(付記4)
前記推薦プレイリストを作成する処理では、前記コンピュータは、絞り込まれた前記曲のうち、変更後の前記プレイリストのイメージと対応した前記特徴量の範囲内となる特徴量を持つ曲を全て登録した前記推薦プレイリストを作成する、
ことを特徴とする付記2に記載のプレイリスト生成方法。
(付記5)
前記コンピュータが、絞り込んだ前記曲の特徴量に基づいて前記利用者に推薦するプレイリストの候補を生成する処理を更に実行し、
前記利用者に提示する前記プレイリストの名称を変更する処理では、前記コンピュータは、前記推薦するプレイリストの候補に登録された前記曲の特徴量の分布と、前記要求プレイリストに登録された前記曲の特徴量の分布に基づいて前記利用者に推薦するプレイリストを決定する、
ことを特徴とする付記1に記載のプレイリスト生成方法。
(付記6)
前記推薦するプレイリストの候補に登録された前記曲の特徴量の分布と、前記要求プレイリストに登録された前記曲の特徴量の分布に基づいて前記利用者に推薦するプレイリストを決定する処理では、前記コンピュータは、
前記推薦するプレイリストの候補に含まれる前記曲の特徴量の分布と当該推薦するプレイリストの候補の想定している前記曲の特徴量の分布とを用いて認識ずれ量を算出するとともに、前記推薦するプレイリストの候補の想定している前記曲の特徴量の分布と前記要求プレイリストの想定している前記曲の特徴量の分布とを用いて要求ずれ量を算出し、
前記認識ずれ量及び前記要求ずれ量に基づいて前記推薦するプレイリストの候補に対する推薦優先度を算出し、
前記推薦優先度の最も高い前記候補を前記利用者に推薦するプレイリストに決定する、
ことを特徴とする付記5に記載のプレイリスト生成方法。
(付記7)
前記コンピュータは、前記曲の特徴量の分布を正規分布として前記認識ずれ量及び前記要求ずれ量を算出する、
ことを特徴とする付記6に記載のプレイリスト生成方法。
(付記8)
前記コンピュータは、前記曲の特徴量の分布を一様分布として前記認識ずれ量及び前記要求ずれ量を算出する、
ことを特徴とする付記6に記載のプレイリスト生成方法。
(付記9)
前記コンピュータが、
前記利用者に提示したプレイリストに含まれる曲を再生し、
前記曲の再生中に再生をスキップする操作情報が入力された場合に、スキップした前記曲の特徴量が前記プレイリストへの登録対象となる曲の特徴量の範囲外となるよう、前記プレイリストの前記特徴量の範囲を修正する、処理を更に実行する、
ことを特徴とする付記1に記載のプレイリスト生成方法。
(付記10)
前記プレイリストの前記特徴量の範囲を修正する処理では、前記コンピュータは、前記プレイリストの前記特徴量の範囲を縮小する、
ことを特徴とする付記9に記載のプレイリスト生成方法。
(付記11)
前記プレイリストの前記特徴量の範囲を修正する処理では、前記コンピュータは、
前記プレイリストの前記特徴量の範囲を縮小した後、
スキップした前記曲の特徴量が含まれない態様で前記プレイリストの前記特徴量の範囲を拡大する、
ことを特徴とする付記9に記載のプレイリスト生成方法。
(付記12)
前記コンピュータが、
前記利用者に提示する前記プレイリストの名称を含む音声データを生成し、当該音声データを再生して前記プレイリストの名称を前記利用者に提示する、処理を更に実行する、
ことを特徴とする付記1に記載のプレイリスト生成方法。
(付記13)
利用者からのプレイリストの生成要求に基づいて、予め用意されたデータベースから、前記プレイリストのイメージを表すキーワード、及び前記プレイリストへの登録対象とする曲の属性を表す属性情報を抽出する抽出部と、
前記属性情報に基づいて前記プレイリストへの登録対象とする前記曲の絞り込みを行う曲絞込部と、
絞り込んだ前記曲のイメージを表す特徴量に基づいて前記利用者に推薦するプレイリストの候補を生成する推薦プレイリスト候補生成部と、
前記キーワードと対応する要求プレイリストを生成し、当該要求プレイリスト及び前記利用者に推薦するプレイリストの候補に基づいて前記推薦するプレイリストの候補についての優先度を算出する優先度算出部と、
算出した前記優先度に基づいて前記利用者に提示するプレイリストを決定するプレイリスト決定部と、
決定した前記プレイリストの名称を利用者に提示する情報を生成する情報生成部と、を備える、
ことを特徴とするプレイリスト生成装置。
(付記14)
前記プレイリスト決定部は、決定した前記プレイリストのイメージと対応した前記特徴量の範囲内となり、かつ前記要求プレイリストのイメージと対応した前記特徴量の範囲内となる特徴量を持つ曲のみを登録した前記プレイリストを作成する、
ことを特徴とする付記13に記載のプレイリスト生成装置。
(付記15)
前記優先度算出部は、
前記推薦するプレイリストの候補に登録された前記曲の特徴量の分布と当該推薦するプレイリストの候補の想定している前記曲の特徴量の分布とを用いて認識ずれ量を算出する認識ずれ量算出部と、
前記推薦するプレイリストの候補の想定している前記曲の特徴量の分布と前記要求プレイリストの想定している前記曲の特徴量の分布とを用いて要求ずれ量を算出する要求ずれ量算出部と、
前記認識ずれ量及び前記要求ずれ量を統合して前記推薦するプレイリストの候補に対する推薦優先度を算出するずれ量統合部と、を含む、
ことを特徴とする付記13に記載のプレイリスト生成装置。
(付記16)
当該プレイリスト生成装置は、外部装置が記憶している前記曲の識別情報を登録する識別情報データベースを更に備え、
前記曲絞込部は、前記識別情報データベースに登録された前記曲から前記属性情報を満たす曲のみに絞り込む、
ことを特徴とする付記13に記載のプレイリスト生成装置。
(付記17)
当該プレイリスト生成装置は、前記利用者に提示したプレイリストの再生中に前記利用者により再生している曲をスキップする操作が行われた場合に、スキップした前記曲が前記プレイリストの前記特徴量の範囲外となるよう前記プレイリストを修正する適応処理部、を更に備える、
ことを特徴とする付記13に記載のプレイリスト生成装置。
(付記18)
利用者からのプレイリストの生成要求に含まれる当該プレイリストへの登録対象とする曲の属性を表す属性情報に基づいて曲の絞込を行い、
絞り込んだ前記曲のイメージを表す特徴量、及び前記生成要求に含まれる前記プレイリストのイメージと対応した前記特徴量の範囲に基づいて要求プレイリストを生成し、
生成した前記要求プレイリストの前記特徴量の範囲内において当該要求プレイリストに登録された前記曲の特徴量に偏りがある場合に、当該要求プレイリストに登録された前記曲の特徴量に基づいて前記利用者に提示するプレイリストの名称を変更する、
処理をコンピュータに実行させるためのプログラム。
(付記19)
前記要求プレイリストの前記特徴量の範囲内において当該要求プレイリストに登録された前記曲の特徴量に偏りがある場合に、前記コンピュータに、前記要求プレイリストに登録された前記曲の特徴量に基づいて前記利用者に提示する前記プレイリストの名称を変更するとともに、変更後の前記イメージに基づいて前記利用者に推薦する推薦プレイリストを作成する、処理を実行させる、
ことを特徴とする付記18に記載のプログラム。
(付記20)
前記推薦プレイリストを作成する処理は、絞り込まれた前記曲のうち、変更後の前記プレイリストのイメージと対応した前記特徴量の範囲内となり、かつ前記要求プレイリストの前記特徴量の範囲内となる特徴量を持つ曲のみを登録した前記推薦プレイリストを作成する処理を含む、
ことを特徴とする付記19に記載のプログラム。
(付記21)
前記推薦プレイリストを作成する処理は、絞り込まれた前記曲のうち、変更後の前記プレイリストのイメージと対応した前記特徴量の範囲内となる特徴量を持つ曲を全て登録した前記推薦プレイリストを作成する処理を含む、
ことを特徴とする付記19に記載のプログラム。
(付記22)
前記コンピュータに、絞り込んだ前記曲の特徴量に基づいて前記利用者に推薦するプレイリストの候補を生成する処理を更に実行させ、
前記利用者に提示する前記プレイリストの名称を変更する処理は、前記コンピュータに、前記推薦するプレイリストの候補に登録された前記曲の特徴量の分布と、前記要求プレイリストに登録された前記曲の特徴量の分布との差異に基づいて前記利用者に推薦するプレイリストを決定し、当該推薦するプレイリストの名称に前記プレイリストの名称を変更する処理を含む、
ことを特徴とする付記18に記載のプログラム。
(付記23)
前記推薦するプレイリストの候補に登録された前記曲の特徴量の分布と、前記要求プレイリストに登録された前記曲の特徴量の分布との差異に基づいて前記利用者に推薦するプレイリストを決定する処理は、
前記推薦するプレイリストの候補に含まれる前記曲の特徴量の分布と当該推薦するプレイリストの候補の想定している前記曲の特徴量の分布とを用いて認識ずれ量を算出するとともに、前記推薦するプレイリストの候補の想定している前記曲の特徴量の分布と前記要求プレイリストの想定している前記曲の特徴量の分布とを用いて要求ずれ量を算出し、
前記認識ずれ量及び前記要求ずれ量に基づいて前記推薦するプレイリストの候補に対する推薦優先度を算出し、
前記推薦優先度の最も高い前記候補を前記利用者に推薦するプレイリストに決定する、処理を含む、
ことを特徴とする付記22に記載のプログラム。
(付記24)
前記コンピュータに、
前記利用者に提示したプレイリストに含まれる曲を再生し、
前記曲の再生中に再生をスキップする操作情報が入力された場合に、スキップした前記曲の特徴量が前記プレイリストへの登録対象となる曲の特徴量の範囲外となるよう、前記プレイリストの前記特徴量の範囲を修正する、処理を更に実行させる、
ことを特徴とする付記18に記載のプログラム。
(付記25)
前記プレイリストの前記特徴量の範囲を修正する処理は、前記プレイリストの前記特徴量の範囲を縮小する処理を含む、
ことを特徴とする付記24に記載のプログラム。
(付記26)
前記プレイリストの前記特徴量の範囲を修正する処理は、
前記プレイリストの前記特徴量の範囲を縮小した後、スキップした前記曲の特徴量が含まれない態様で前記プレイリストの前記特徴量の範囲を拡大する処理を含む、
ことを特徴とする付記24に記載のプログラム。
(付記27)
前記コンピュータに、
前記利用者に提示する前記プレイリストの名称を含む音声データを生成し、当該音声データを再生して前記プレイリストの名称を前記利用者に提示する、処理を更に実行させる、
ことを特徴とする付記18に記載のプログラム。
(付記28)
コンピュータが、
利用者からの再生リストの生成要求に含まれる当該再生リストへの登録対象とするデータの属性を表す属性情報に基づいてデータの絞込を行い、
絞り込んだ前記データのイメージを表す特徴量、及び前記生成要求に含まれる前記再生リストのイメージと対応した前記特徴量の範囲に基づいて要求再生リストを生成し、
生成した前記要求再生リストの前記特徴量の範囲内において当該要求再生リストに登録された前記データの特徴量に偏りがある場合に、当該要求再生リストに登録された前記データの特徴量に基づいて前記利用者に提示する再生リストの名称を生成する、
処理を実行することを特徴とする再生リスト生成方法。
Regarding the embodiment including each of the examples described above, the following supplementary notes are further disclosed.
(Appendix 1)
Computer
The music is narrowed down based on the attribute information indicating the attribute of the music to be registered in the playlist included in the playlist generation request from the user,
Generating a requested playlist based on the feature amount representing the image of the narrowed down song and the range of the feature amount corresponding to the image of the playlist included in the generation request;
When there is a bias in the feature amount of the song registered in the request playlist within the range of the feature amount of the generated request playlist, based on the feature amount of the song registered in the request playlist. Changing the name of the playlist presented to the user,
A playlist generation method, characterized by performing a process.
(Appendix 2)
When there is a bias in the feature amount of the song registered in the request playlist within the range of the feature amount of the request playlist, the computer determines the feature amount of the song registered in the request playlist. Executing a process of changing a name of the playlist to be presented to the user based on the changed image and creating a recommended playlist recommended to the user based on the changed image.
3. The playlist generation method according to
(Appendix 3)
In the process of creating the recommended playlist, the computer includes, within the narrowed-down songs, a range of the feature amount corresponding to the image of the playlist after the change, and the feature amount of the requested playlist. Creating the recommended playlist in which only songs having feature amounts within the range are registered;
3. The playlist generation method according to
(Appendix 4)
In the process of creating the recommended playlist, the computer has registered all songs having feature amounts within the feature amount range corresponding to the image of the playlist after the change among the narrowed songs. Creating the recommended playlist,
3. The playlist generation method according to
(Appendix 5)
The computer further executes a process of generating a playlist candidate recommended to the user based on the narrowed down feature amount of the song,
In the process of changing the name of the playlist to be presented to the user, the computer includes a distribution of a feature amount of the song registered as the recommended playlist candidate and the distribution of the feature amount registered in the request playlist. Determining a playlist to be recommended to the user based on a distribution of a feature amount of a song;
3. The playlist generation method according to
(Appendix 6)
A process of determining a playlist to be recommended to the user based on the distribution of the feature amounts of the songs registered in the recommended playlist candidates and the distribution of the feature amounts of the songs registered in the request playlist; Then, the computer is
Using the distribution of the feature amounts of the songs included in the recommended playlist candidates and the distribution of the feature amounts of the songs assumed to be the recommended playlist candidates, the recognition misregistration amount is calculated. Calculating the required deviation amount using the distribution of the feature amount of the music assumed as the candidate of the playlist to be recommended and the distribution of the feature amount of the music assumed in the requested playlist,
Calculating a recommendation priority for the recommended playlist candidate based on the recognition shift amount and the request shift amount;
Determine the candidate with the highest recommendation priority as a playlist to recommend to the user,
A playlist generation method according to
(Appendix 7)
The computer calculates the recognition deviation amount and the required deviation amount with the distribution of the feature amount of the music as a normal distribution,
6. The playlist generation method according to claim 6, wherein
(Appendix 8)
The computer calculates the recognition shift amount and the required shift amount as a uniform distribution of the feature amount of the music,
6. The playlist generation method according to claim 6, wherein
(Appendix 9)
Said computer,
Play songs included in the playlist presented to the user,
When the operation information for skipping the reproduction is input during the reproduction of the song, the playlist is set such that the feature amount of the skipped song is out of the range of the feature amount of the song to be registered in the playlist. Correcting the range of the feature amount, and further executing a process,
3. The playlist generation method according to
(Appendix 10)
In the process of correcting the range of the feature amount of the playlist, the computer reduces the range of the feature amount of the playlist,
A playlist generation method according to
(Appendix 11)
In the process of correcting the range of the feature amount of the playlist, the computer includes:
After reducing the range of the feature amount of the playlist,
Expanding the range of the feature amount of the playlist in a manner that does not include the feature amount of the skipped song;
A playlist generation method according to
(Appendix 12)
Said computer,
Generating audio data including the name of the playlist to be presented to the user, reproducing the audio data and presenting the name of the playlist to the user, further executing a process;
3. The playlist generation method according to
(Appendix 13)
Extraction for extracting a keyword representing an image of the playlist and attribute information representing an attribute of a song to be registered in the playlist from a database prepared in advance based on a playlist generation request from a user. Department and
A song narrowing-down unit that narrows down the songs to be registered in the playlist based on the attribute information;
A recommended playlist candidate generation unit that generates a playlist candidate to be recommended to the user based on the feature amount representing the image of the tuned song;
A priority calculation unit that generates a requested playlist corresponding to the keyword, and calculates a priority for the recommended playlist candidate based on the requested playlist and a candidate playlist recommended to the user;
A playlist determination unit that determines a playlist to be presented to the user based on the calculated priority,
An information generation unit that generates information that presents the determined name of the playlist to the user.
A playlist generation device, characterized in that:
(Appendix 14)
The playlist determining unit determines only songs having feature amounts that fall within the range of the feature amount corresponding to the determined image of the playlist and fall within the range of the feature amount corresponding to the image of the requested playlist. Create the registered playlist,
14. The playlist generation device according to
(Appendix 15)
The priority calculation unit,
Recognition misregistration that calculates a recognition misregistration amount using the distribution of the feature amount of the song registered in the recommended playlist candidate and the distribution of the feature amount of the song assumed as the recommended playlist candidate. An amount calculator,
Request deviation amount calculation using the distribution of the feature amount of the music assumed as the candidate of the recommended playlist and the distribution of the characteristic amount of the music assumed in the required playlist. Department and
A shift amount integration unit that integrates the recognition shift amount and the request shift amount and calculates a recommendation priority for the recommended playlist candidate.
14. The playlist generation device according to
(Appendix 16)
The playlist generation device further includes an identification information database for registering identification information of the music stored in the external device,
The song narrowing unit narrows only songs that satisfy the attribute information from the songs registered in the identification information database,
14. The playlist generation device according to
(Appendix 17)
The playlist generation device may be configured such that, when an operation of skipping a song being played by the user is performed during playback of the playlist presented to the user, the skipped song is the feature of the playlist. An adaptive processing unit that corrects the playlist so as to be out of the range of the amount.
14. The playlist generation device according to
(Appendix 18)
The music is narrowed down based on the attribute information indicating the attribute of the music to be registered in the playlist included in the playlist generation request from the user,
Generating a requested playlist based on the feature amount representing the image of the narrowed down song and the range of the feature amount corresponding to the image of the playlist included in the generation request;
When there is a bias in the feature amount of the song registered in the request playlist within the range of the feature amount of the generated request playlist, based on the feature amount of the song registered in the request playlist. Changing the name of the playlist presented to the user,
A program that causes a computer to execute processing.
(Appendix 19)
When there is a bias in the feature amount of the song registered in the request playlist within the range of the feature amount of the request playlist, the computer sends the feature amount of the song registered in the request playlist to the computer. Changing the name of the playlist to be presented to the user based on the changed image, creating a recommended playlist recommended to the user based on the changed image, and executing a process.
18. The program according to supplementary note 18, wherein:
(Appendix 20)
The process of creating the recommended playlist includes, within the narrowed-down songs, the range of the feature amount corresponding to the image of the playlist after the change, and the range of the feature amount of the requested playlist. Including a process of creating the recommended playlist in which only songs having the following feature amounts are registered:
20. The program according to claim 19, wherein:
(Appendix 21)
The process of creating the recommended playlist includes, among the narrowed-down songs, the recommended playlist in which all songs having feature amounts within a range of the feature amount corresponding to the image of the playlist after the change are registered. Including the process of creating
20. The program according to claim 19, wherein:
(Appendix 22)
The computer further executes a process of generating a playlist candidate recommended to the user based on the narrowed down feature amount of the music,
The process of changing the name of the playlist to be presented to the user includes, in the computer, a distribution of the feature amounts of the songs registered in the recommended playlist candidates and the Determining a playlist to be recommended to the user based on the difference from the distribution of the feature amount of the song, and changing the name of the playlist to the name of the recommended playlist;
18. The program according to supplementary note 18, wherein:
(Appendix 23)
A playlist recommended to the user based on a difference between the distribution of the feature amounts of the songs registered in the recommended playlist candidates and the distribution of the feature amounts of the songs registered in the requested playlist. The process to determine is
Using the distribution of the feature amounts of the songs included in the recommended playlist candidates and the distribution of the feature amounts of the songs assumed to be the recommended playlist candidates, the recognition misregistration amount is calculated. Calculating the required deviation amount using the distribution of the feature amount of the music assumed as the candidate of the playlist to be recommended and the distribution of the feature amount of the music assumed in the requested playlist,
Calculating a recommendation priority for the recommended playlist candidate based on the recognition shift amount and the request shift amount;
Determining the candidate with the highest recommendation priority as a playlist recommended to the user, including:
23. The program according to supplementary note 22, wherein:
(Appendix 24)
On the computer,
Play songs included in the playlist presented to the user,
When the operation information for skipping the reproduction is input during the reproduction of the song, the playlist is set such that the feature amount of the skipped song is out of the range of the feature amount of the song to be registered in the playlist. Correcting the range of the feature amount, causing the process to be further executed,
18. The program according to supplementary note 18, wherein:
(Appendix 25)
The process of modifying the range of the feature amount of the playlist includes a process of reducing the range of the feature amount of the playlist.
25. The program according to
(Supplementary Note 26)
The process of modifying the range of the feature amount of the playlist includes:
After reducing the range of the feature amount of the playlist, expanding the range of the feature amount of the playlist in a manner that does not include the feature amount of the skipped song.
25. The program according to
(Appendix 27)
On the computer,
Generating audio data including the name of the playlist to be presented to the user, reproducing the audio data and presenting the name of the playlist to the user, and further executing a process.
18. The program according to supplementary note 18, wherein:
(Appendix 28)
Computer
Data narrowing down is performed based on attribute information indicating attributes of data to be registered in the playlist included in the playlist generation request from the user,
Generating a requested playlist based on a feature amount representing an image of the narrowed-down data, and a range of the feature amount corresponding to the image of the playlist included in the generation request;
When the feature amount of the data registered in the requested playlist is biased within the range of the feature amount of the generated requested playlist, based on the feature amount of the data registered in the requested playlist. Generating a playlist name to be presented to the user;
A play list generation method, characterized by performing a process.
1 プレイリスト生成装置
4 プレイリスト再生システム
5 音楽再生装置
6 サーバ
7 通信ネットワーク
8,8A,8B 携帯型電子機器
10 コンピュータ
11 マイク
12 スピーカ
101 要求プレイリスト入力部
102,603 キーワード/属性抽出部
103,604 曲絞込部
104,605 推薦プレイリスト候補生成部
105,606 優先度算出部
105a 認識ずれ量算出部
105b 要求ずれ量算出部
105c プレイリスト検索部
105d ずれ量統合部
106,607 プレイリスト決定部
107,608 ナレーション作成部
107a,608a ナレーション文章作成部
107b,508 ナレーション音声作成部
108,509,609 プレイリスト再生部
109,502 音声出力部
115 スキップ操作入力部
116 適応処理部
116a プレイリスト範囲修正部
116b プレイリストDB再学習部
116c (修正データの)データベース
116d (プレイリスト学習用データの)データベース
121,621 キーワードDB
122,622 絞込属性DB
123,623 曲DB
124,624 プレイリストDB
501 音声入力部
503 信号処理部
504,510,601,801 通信部
506 データ入力部
507 曲音声データ登録部
602 音声認識部
521 (曲ID及び曲音声データの)データベース
821 (曲音声データの)データベース
1001 CPU
1002 主記憶装置
1003 補助記憶装置
1004 入力装置
1005 表示装置
1006 インタフェース装置
1007 記憶媒体駆動装置
1008 通信装置
122,622 Refinement attribute DB
123,623 Song DB
124,624 Playlist DB
501
1002
Claims (12)
利用者からのプレイリストの生成要求に含まれる当該プレイリストへの登録対象とする曲の属性を表す属性情報に基づいて曲の絞り込みを行い、
絞り込んだ前記曲についてのイメージを表す特徴量と、データベース上で各プレイリストに対応付けられている範囲であってプレイリストへの登録対象とする曲についての前記特徴量が分布する範囲を規定しているプレイリストの範囲とに基づいて、前記イメージを表す特徴量が前記範囲に含まれる曲を登録したプレイリストを、推薦プレイリスト候補として生成し、
生成した前記推薦プレイリスト候補に登録された前記曲についての前記特徴量の分布が、前記生成要求によって生成が要求されているプレイリストである要求プレイリストについて想定している前記範囲に対して偏っている場合に、前記推薦プレイリスト候補に含まれる前記曲についての前記分布と、前記推薦プレイリスト候補について想定している前記範囲と、前記要求プレイリストについて想定している前記範囲とに基づいて、前記推薦プレイリスト候補から、前記利用者に提示するプレイリストである推薦プレイリストを決定する、
処理を実行することを特徴とするプレイリスト生成方法。 Computer
The music is narrowed down based on the attribute information indicating the attribute of the music to be registered in the playlist included in the playlist generation request from the user,
A feature amount representing an image of the narrowed down song and a range in which the feature amount of the song to be registered in the playlist, which is a range associated with each playlist on the database, are defined. Based on the range of the playlist that is, a playlist in which the feature amount representing the image is registered as a song included in the range is generated as a recommended playlist candidate,
The distribution of the feature amount of the song registered in the generated recommended playlist candidate is biased with respect to the range assumed for a requested playlist that is a playlist requested to be generated by the generation request. The distribution of the songs included in the recommended playlist candidate, the range assumed for the recommended playlist candidate, and the range assumed for the requested playlist. Determining a recommended playlist that is a playlist to be presented to the user from the recommended playlist candidates;
A playlist generation method, characterized by performing a process.
前記推薦プレイリスト候補に含まれる前記曲についての前記分布と当該推薦プレイリスト候補について想定している前記分布との差異を、認識ずれ量として算出するとともに、前記推薦プレイリスト候補について想定している前記分布と前記要求プレイリストについて想定している前記分布との差異を、要求ずれ量として算出し、
前記推薦プレイリスト候補の各々についての前記認識ずれ量及び前記要求ずれ量の重み付き和を、前記推薦プレイリスト候補の各々に対する推薦優先度として算出し、
前記推薦優先度の最も高い前記推薦プレイリスト候補を前記推薦プレイリストに決定する、
ことを特徴とする請求項1に記載のプレイリスト生成方法。 In the process of determining the recommended playlist, the computer,
A difference between the distribution of the music included in the recommended playlist candidate and the distribution assumed for the recommended playlist candidate is calculated as a recognition error amount, and the difference is assumed for the recommended playlist candidate. the difference between the distributions assumed for the request playlist and the distribution is calculated as the required shift amount,
A weighted sum of the recognition shift amount and the request shift amount for each of the recommended playlist candidates is calculated as a recommendation priority for each of the recommended playlist candidates,
The recommended playlist candidate having the highest recommendation priority is determined as the recommended playlist.
The playlist generation method according to claim 1, wherein:
ことを特徴とする請求項2に記載のプレイリスト生成方法。 The computer calculates the recognition shift amount and the required shift amount with the distribution of the feature amount of the song as a normal distribution,
3. The playlist generation method according to claim 2, wherein:
ことを特徴とする請求項2に記載のプレイリスト生成方法。 The computer calculates the recognition shift amount and the required shift amount as a uniform distribution of the feature amount of the music,
3. The playlist generation method according to claim 2, wherein:
前記推薦プレイリストに含まれる曲を再生し、
前記曲の再生中に再生をスキップする操作情報が入力された場合に、スキップした前記曲についての前記特徴量が前記推薦プレイリストへの登録対象となる曲の特徴量の範囲外となるよう、前記推薦プレイリストについて想定している前記範囲を修正する、処理を更に実行する、
ことを特徴とする請求項1に記載のプレイリスト生成方法。 Said computer,
Play songs included in the recommended playlist,
When operation information for skipping playback is input during the playback of the song, the feature amount of the skipped song is outside the range of the feature amount of the song to be registered in the recommended playlist. Modifying the range assumed for the recommended playlist, further executing a process,
The playlist generation method according to claim 1, wherein:
ことを特徴とする請求項5に記載のプレイリスト生成方法。 In the process of modifying the range of the recommended playlist, the computer reduces the range of the recommended playlist,
The playlist generation method according to claim 5, wherein:
前記推薦プレイリストについての前記範囲を縮小した後、
スキップした前記曲についての前記特徴量が含まれない態様で前記推薦プレイリストについての前記範囲を拡大する、
ことを特徴とする請求項5に記載のプレイリスト生成方法。 In the process of correcting the range for the recommended playlist, the computer may include:
After reducing the range for the recommended playlist,
Expanding the range of the recommended playlist in a manner that does not include the feature amount of the skipped song;
The playlist generation method according to claim 5, wherein:
前記推薦プレイリストの名称を含む音声データを生成し、当該音声データを再生して前記推薦プレイリストの名称を前記利用者に提示する、処理を更に実行する、
ことを特徴とする請求項1に記載のプレイリスト生成方法。 Said computer,
Generating audio data including the name of the recommended playlist, reproducing the audio data and presenting the name of the recommended playlist to the user, further executing a process;
The playlist generation method according to claim 1, wherein:
絞り込んだ前記曲についてのイメージを表す特徴量と、データベース上で各プレイリストに対応付けられている範囲であってプレイリストへの登録対象とする曲についての前記特徴量が分布する範囲を規定しているプレイリストの範囲とに基づいて、前記イメージを表す特徴量が前記範囲に含まれる曲を登録したプレイリストを、推薦プレイリスト候補として生成する推薦プレイリスト候補生成部と、
生成した前記推薦プレイリスト候補に登録された前記曲についての前記特徴量の分布が、前記生成要求によって生成が要求されているプレイリストである要求プレイリストについて想定している前記範囲に対して偏っている場合に、前記推薦プレイリスト候補に含まれる前記曲についての前記分布と、前記推薦プレイリスト候補について想定している前記範囲と、前記要求プレイリストについて想定している前記範囲とに基づいて、前記推薦プレイリスト候補から、前記利用者に提示するプレイリストである推薦プレイリストを決定する推薦プレイリスト決定部と、を備える、
ことを特徴とするプレイリスト生成装置。 A song narrowing unit that narrows down songs based on attributes of songs to be registered in the playlist included in the playlist generation request from the user;
A feature amount representing an image of the narrowed down song and a range in which the feature amount of the song to be registered in the playlist, which is a range associated with each playlist on the database, are defined. A recommended playlist candidate generating unit that generates a playlist in which the feature amount representing the image is registered as a recommended playlist candidate based on the range of the playlist that is included,
The distribution of the feature amount of the song registered in the generated recommended playlist candidate is biased with respect to the range assumed for a requested playlist that is a playlist requested to be generated by the generation request. The distribution of the songs included in the recommended playlist candidate, the range assumed for the recommended playlist candidate, and the range assumed for the requested playlist. A recommended playlist determining unit that determines a recommended playlist that is a playlist to be presented to the user from the recommended playlist candidates.
A playlist generation device, characterized in that:
前記推薦プレイリスト候補に含まれる前記曲についての前記分布と当該推薦プレイリスト候補について想定している前記分布との差異を、認識ずれ量として算出する認識ずれ量算出部と、
前記推薦プレイリスト候補について想定している前記分布と前記要求プレイリストについて想定している前記分布との差異を、要求ずれ量として算出する要求ずれ量算出部と、
前記推薦プレイリスト候補の各々についての前記認識ずれ量及び前記要求ずれ量の重み付き和を、前記推薦プレイリストの候補の各々に対する推薦優先度として算出するずれ量統合部と、を含み、
前記推薦優先度の最も高い前記推薦プレイリスト候補を、前記推薦プレイリストに決定する、
ことを特徴とする請求項9に記載のプレイリスト生成装置。 The recommended playlist determination unit,
A difference between the distribution of the song included in the recommended playlist candidate and the distribution assumed for the recommended playlist candidate, a recognition shift amount calculation unit that calculates the recognition shift amount,
A difference between the distribution assumed for the recommended playlist candidate and the distribution assumed for the requested playlist, a request shift amount calculation unit that calculates the request shift amount,
A shift amount integration unit that calculates a weighted sum of the recognition shift amount and the request shift amount for each of the recommended playlist candidates, as a recommendation priority for each of the recommended playlist candidates,
The recommended playlist candidate having the highest recommendation priority is determined as the recommended playlist.
The playlist generation device according to claim 9, wherein
絞り込んだ前記曲についてのイメージを表す特徴量と、データベース上で各プレイリストに対応付けられている範囲であってプレイリストへの登録対象とする曲についての前記特徴量が分布する範囲を規定しているプレイリストの範囲とに基づいて、前記イメージを表す特徴量が前記範囲に含まれる曲を登録したプレイリストを、推薦プレイリスト候補として生成し、
生成した前記推薦プレイリスト候補に登録された前記曲についての前記特徴量の分布が、前記生成要求によって生成が要求されているプレイリストである要求プレイリストについて想定している前記範囲に対して偏っている場合に、前記推薦プレイリスト候補に含まれる前記曲についての前記分布と、前記推薦プレイリスト候補について想定している前記範囲と、前記要求プレイリストについて想定している前記範囲とに基づいて、前記推薦プレイリスト候補から、前記利用者に提示するプレイリストである推薦プレイリストを決定する、
処理をコンピュータに実行させるためのプログラム。 The music is narrowed down based on the attribute information indicating the attribute of the music to be registered in the playlist included in the playlist generation request from the user,
A feature amount representing an image of the narrowed down song and a range in which the feature amount of the song to be registered in the playlist, which is a range associated with each playlist on the database, are defined. Based on the range of the playlist that is, a playlist in which the feature amount representing the image is registered as a song included in the range is generated as a recommended playlist candidate,
The distribution of the feature amount of the song registered in the generated recommended playlist candidate is biased with respect to the range assumed for a requested playlist that is a playlist requested to be generated by the generation request. The distribution of the songs included in the recommended playlist candidate, the range assumed for the recommended playlist candidate, and the range assumed for the requested playlist. Determining a recommended playlist that is a playlist to be presented to the user from the recommended playlist candidates;
A program that causes a computer to execute processing.
利用者からのリストの生成要求に含まれる当該リストへの登録対象とするデータの属性を表す属性情報に基づいてデータの絞り込みを行い、
絞り込んだ前記データについてのイメージを表す特徴量と、データベース上で各リストに対応付けられている範囲であってリストへの登録対象とするデータについての前記特徴量が分布する範囲を規定しているリストの範囲とに基づいて、前記イメージを表す特徴量が前記範囲に含まれるデータを登録したリストを、推薦リスト候補として生成し、
生成した前記推薦リスト候補に登録された前記データについての前記特徴量の分布が、前記生成要求によって生成が要求されているリストである要求リストについて想定している前記範囲に対して偏っている場合に、前記推薦リスト候補に含まれる前記データについての前記分布と、前記推薦リスト候補について想定している前記範囲と、前記要求リストについて想定している前記範囲とに基づいて、前記推薦リスト候補から、前記利用者に提示するリストである推薦リストを決定する、
処理を実行することを特徴とするリスト生成方法。 Computer
The data is narrowed down based on the attribute information indicating the attribute of the data to be registered in the list included in the list generation request from the user,
It defines a feature amount representing an image of the narrowed-down data and a range that is associated with each list on the database and in which the feature amount of data to be registered in the list is distributed. Based on the range of the list, a list in which the feature amount representing the image is registered with data included in the range is generated as a recommendation list candidate,
When the distribution of the feature amount of the data registered in the generated recommendation list candidate is biased with respect to the range assumed for a request list that is a list requested to be generated by the generation request. On the basis of the distribution of the data included in the recommendation list candidate, the range assumed for the recommendation list candidate, and the range assumed for the request list, Determining a recommendation list that is a list to be presented to the user;
A list generation method, characterized by performing a process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015215290A JP6672707B2 (en) | 2015-10-30 | 2015-10-30 | Playlist generation method, playlist generation device, program, and list generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015215290A JP6672707B2 (en) | 2015-10-30 | 2015-10-30 | Playlist generation method, playlist generation device, program, and list generation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017084313A JP2017084313A (en) | 2017-05-18 |
JP6672707B2 true JP6672707B2 (en) | 2020-03-25 |
Family
ID=58711899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015215290A Expired - Fee Related JP6672707B2 (en) | 2015-10-30 | 2015-10-30 | Playlist generation method, playlist generation device, program, and list generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6672707B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110109645A (en) * | 2019-04-30 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | A kind of interactive music audition method, device and terminal |
-
2015
- 2015-10-30 JP JP2015215290A patent/JP6672707B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017084313A (en) | 2017-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7095000B2 (en) | A method for adaptive conversation state management with a filtering operator that is dynamically applied as part of a conversational interface. | |
US20160267177A1 (en) | Music steering with automatically detected musical attributes | |
US20060224260A1 (en) | Scan shuffle for building playlists | |
JP2007122442A (en) | Musical piece classification apparatus and musical piece classification program | |
TWI396105B (en) | Digital data processing method for personalized information retrieval and computer readable storage medium and information retrieval system thereof | |
JP5359534B2 (en) | Information processing apparatus and method, and program | |
JP7100737B1 (en) | Learning equipment, learning methods and learning programs | |
JP4508917B2 (en) | Information presenting apparatus, information presenting method, and information presenting program | |
JP4659755B2 (en) | Content data search device | |
JPWO2006137271A1 (en) | Music search device, music search method, and music search program | |
TWI480742B (en) | Recommendation method and recommender system using dynamic language model | |
EP2035967A2 (en) | System and method for associating a category label of one user with a category label defined by another user | |
JP6672707B2 (en) | Playlist generation method, playlist generation device, program, and list generation method | |
JP6366403B2 (en) | Karaoke equipment | |
US10978076B2 (en) | Speaker retrieval device, speaker retrieval method, and computer program product | |
JP2021179987A (en) | Shopping search result extension method and system | |
WO2020241293A1 (en) | Information processing device | |
JP2005346347A (en) | Information retrieval apparatus, information retrieval method, information retrieval program and recording medium | |
JP2023027697A (en) | Terminal device, transmission method, transmission program and information processing system | |
JP4279274B2 (en) | Mobile terminal device and music information display method | |
WO2006030712A1 (en) | Musical composition recommendation device and method | |
TWI808038B (en) | Media file selection method and service system and computer program product | |
JP7230085B2 (en) | Method and device, electronic device, storage medium and computer program for processing sound | |
KR102479023B1 (en) | Apparatus, method and program for providing foreign language learning service | |
JP2006195619A (en) | Information retrieval device, and information retrieval method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190829 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190829 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6672707 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |