JP5469884B2 - 画像音楽再生装置 - Google Patents

画像音楽再生装置 Download PDF

Info

Publication number
JP5469884B2
JP5469884B2 JP2009054614A JP2009054614A JP5469884B2 JP 5469884 B2 JP5469884 B2 JP 5469884B2 JP 2009054614 A JP2009054614 A JP 2009054614A JP 2009054614 A JP2009054614 A JP 2009054614A JP 5469884 B2 JP5469884 B2 JP 5469884B2
Authority
JP
Japan
Prior art keywords
impression
image
determination
music
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009054614A
Other languages
English (en)
Other versions
JP2010210746A (ja
Inventor
弘二 西垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Systems Inc
Original Assignee
Nikon Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Systems Inc filed Critical Nikon Systems Inc
Priority to JP2009054614A priority Critical patent/JP5469884B2/ja
Publication of JP2010210746A publication Critical patent/JP2010210746A/ja
Application granted granted Critical
Publication of JP5469884B2 publication Critical patent/JP5469884B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像音楽再生装置に関する。
従来から、音楽鑑賞の環境を向上させるための様々な試みが行われている。例えば、デジタル音楽再生装置は、再生中に視覚エフェクトを表示する方法や、画像データを割り当てる方法や、複数の音楽データから構成されるアルバムにおいては、音楽データの曲調を解析して自動分類し、気分や雰囲気、時間帯にあった楽曲を自動的に選択する方法等を提供している(例えば、特許文献1参照)。また、従来、画像の印象を判定する方法としては、例えば、画像の印象に影響を与えている部分領域及び複数の特徴量の部分ベクトルを特定して画像の印象を判定する方法が知られている(例えば、非特許文献1参照)。
特許第3327898号公報
電子情報通信学会技術研究報告 信学技報 Vol.108 No.93 第157−162ページ
しかしながら、聴覚及び視覚の両面から体感される場合では、従来の音楽データ再生中に視覚エフェクトを表示する方法は、設定されたエフェクトが繰り返し表示されるものであった。また、画像データを割り当てる方法では、音楽再生中に付加・再生される画像は、コンテンツ作成者が選択したものであった。そして、自動で画像の印象判定する方法では、その画像の印象は、ユーザーの好みがフィードバックされるものとはなっていないので、自動で選択された画像を音楽再生中に表示すると、その画像が、ユーザーの好みや感覚と合っていない場合があるが、このような場合でも、自動で選択される画像の条件を修正してユーザーに提供できないという課題があった。
本発明はこのような課題に鑑みてなされたものであり、音楽の印象と画像の印象を自動で判定し、この判定に従って、音楽を再生する際の画像を自動で選択し、音楽再生時にその画像を表示することができると共に、その画像がユーザーの好みや感覚に合致していない場合に、ユーザーの操作を反映して、画像データの選択条件をユーザーの好みに合わせて調整できる画像音楽再生装置を提供することを目的とする。
前記課題を解決するために、本発明に係る画像音楽再生装置は、音楽を記憶する音楽データ記憶部と、画像を記憶する画像データ記憶部と、音楽の印象を記憶する音楽印象記憶部と、予め学習画像により学習した結果である印象判定用学習結果を記憶する印象判定用学習結果記憶部と、画像データ記憶部に記憶されている画像の印象を、印象判定用学習結果記憶部に記憶されている印象判定用学習結果を用いて判定する画像印象判定部と、画像印象判定部の判定結果を記憶する画像印象記憶部と、音楽を再生する音楽再生部と、画像を表示する画像表示部と、音楽再生部で音楽を再生する際に、音楽印象記憶部に記憶されている音楽の印象を取得して、当該音楽の印象に対応する印象を有する画像を画像印象記憶部の判定結果を参照して選択し、選択された画像を画像表示部に表示するイメージ選択部と、イメージ選択部により選択され、画像表示部に表示している画像に対する使用者の操作情報を画像印象記憶部に記憶する画像印象更新部と、を有する。
そして、画像印象更新部は、画像印象記憶部に記憶された操作情報を、イメージ選択部により画像を選択する際に、印象判定用学習結果記憶部の印象判定用学習結果に反映する構成を有する。
また、このような画像音楽再生装置において、印象判定用学習結果記憶部の印象判定用学習結果は、複数の印象語に対する学習結果を記憶しており、画像印象判定部は、画像の特徴量を算出する特徴量演算部と、画像に対して複数の印象語毎に印象判定を行う印象判定部と、印象語毎の印象判定部の印象判定の結果から、画像に対する印象語の優先度を決定する印象決定部と、を有し、画像印象更新部は、操作情報を印象判定用学習結果及び画像印象記憶部に印象語毎に記憶するように構成されていることが好ましい。
このとき、画像印象更新部は、複数の印象語の内で任意の印象語に対する、操作情報が閾値回数以上になった際に、印象判定部に対して補正を加えるように構成されていることが好ましい。
本発明に係る画像音楽再生装置を以上のように構成すると、音楽の再生中に表示される画像を自動的に選択でき、さらにその画像の選択に際し、ユーザーの好みに合わせたものに調整できる。
画像音楽再生装置の一例を示しており、(a)は画像表示部に画像が表示されている状態の概略図であり、(b)は別の画像音楽再生装置の例を示す概略図である。 画像音楽再生装置の構成を示すブロック図である。 上記画像音楽再生装置の画像印象判定部の構成を示すブロック図である。 音楽の印象語に対応する画像の印象語を記憶している印象語定義データテーブルのデータ構造を示すデータ構造図である。 画像の印象語において矛盾する印象語を記憶している印象語関係定義データテーブルのデータ構造を示すデータ構造図である。 画像印象記憶部内の画像印象データテーブルのデータ構造を示すデータ構造図である。 音楽印象記憶部内の音楽印象データテーブルのデータ構造を示すデータ構造図である。 印象判定用学習結果記憶部内の前処理データテーブルのデータ構造を示すデータ構造図である。 印象判定用学習結果記憶部内の特徴量データテーブルのデータ構造を示すデータ構造図である。 音楽印象判定部における処理を示すフローチャートである。 画像印象判定部における処理を示すフローチャートである。 イメージ選択部における処理を示すフローチャートである。 外部印象判定学習部における処理を示すフローチャートである。 上記外部印象判定学習部における処理において、印象に影響を与える部分領域が特定される課程を示す説明図である。 上記外部印象判定学習部における処理において、弱識別器を構築する処理の詳細を示すフローチャートである。 画像印象更新部における処理を示すフローチャートである。
以下、本発明の好ましい実施形態について図面を参照して説明する。図1(a)に示すように、この画像音楽再生装置100は、例えばAV装置であり、画像を表示する画像表示部101と、音楽を再生する音楽再生部102と、を有している。この画像表示部101及び音楽再生部102は、図1(b)のように映像信号出力部101′と音声信号出力部102′であっても良い。また、画像音楽再生装置100は、図2に示すように、音楽データが記憶されている内部音楽ストレージ302と、画像データが記憶されている内部画像ストレージ202と、音楽データの印象を判定する音楽印象判定部304と、画像データの印象を判定する画像印象判定部204と、画像データの印象を記憶する画像印象記憶部206と、音楽データの印象を記憶する音楽印象記憶部306と、選択された音楽データに対してふさわしい印象を有する画像データを内部画像ストレージ202又は外部画像ストレージ201から選択・取得するイメージ選択部210と、イメージ選択部210で選択・取得された音楽データを再生する音楽再生部102と、画像データを表示する画像表示部101と、を有する。また、画像印象判定部204の結果をカスタマイズする(ユーザーの嗜好に調整する)画像印象更新部205と、音楽の印象語と画像の印象語とを対応させるための定義ファイル等を記憶する定義情報記憶部211とを有する。ここで、音楽データ及び画像データは、それぞれ外部音楽ストレージ301及び外部画像ストレージ201に記憶することもできる。つまり、内部音楽ストレージ302及び外部音楽ストレージ301は、音楽のデータを記憶する記憶部であり、内部画像ストレージ202及び外部画像ストレージ201は、画像のデータを記憶する記憶部である。
ここで、本実施形態における音楽は、リズム(律動)、メロディー(旋律)、ハーモニー(和音)をもつもの、すなわち、人の声、あるいはピアノやバイオリンなどの楽器の音などのように、規則正しい振動により起こる音であって、毎秒規則的に一定した振動数を繰り返すことにより一定の音の高さが生じる音(楽音)や、風や波の音、あるいは太鼓やシンバルなどの打楽器等の音であり一定の高音を持たない音(噪音)も含む。つまり、ここでの音楽は、物の響きや鳥獣の声などの物体の振動が音波(空気の振動)として伝わるもの、すなわち、音の媒質(気体・液体・固体など)が、発音体の振動を受けることにより弾性波動を生じ、その弾性波動が、聴覚器官の聴覚細胞を刺激することにより感知されるものであり、聴覚を通じ知覚されるもの(音)である。従って、ここでの音楽は、例えば、クラシックのような楽器による演奏の音や、音楽と歌詞からなる唄や、和歌や短歌等の詩や、落語のように音声のみのものや、風や波の音、鳥獣の声などの音も含むものである。
イメージ選択部210は、音楽データを内部音楽ストレージ302又は外部音楽ストレージ301から選択し、その選択された音楽データに対してふさわしい印象を有する画像データを内部画像ストレージ202又は外部画像ストレージ201から選択・取得する。そしてイメージ選択部210は、音楽再生部102で音楽データを再生中にその画像データを画像表示部101に表示する。例えば、音楽印象判定部304が再生される音楽データの印象を“アクティブ”と判定すると、イメージ選択部210は、画像印象記憶部206と定義情報記憶部211の定義ファイル等を参照して、“アクティブ”の印象語と対応する印象語を有する画像データを選択し、その画像データのファイルを内部画像ストレージ202又は外部画像ストレージ201から取得し、画像表示部101に表示する。
ここで、定義情報記憶部211に記憶されている定義ファイル等は、得られた音楽の印象から画像を選択するための定義である印象語定義データテーブル400と(図4参照)、複数の画像の印象語においてそれぞれ矛盾する関係にある印象語を定義している印象語関係定義データテーブル500(図5参照)である。図4に示すように、印象語定義データテーブル400のデータ構造は、音楽の印象語を記憶する音楽の印象語カラム400aと、音楽の印象語に対応する画像の印象語候補を記憶する画像印象語候補カラム400bと、を有している。また、図5に示すように、印象語関係定義データテーブル500は、予め設定された印象語A、印象語B、・・・、印象語XXを記憶する画像印象語カラム500aと、画像印象語カラム500aに設定された印象語と矛盾する印象語の候補を記憶する矛盾印象語カラム500bと、を有している。
また、画像印象記憶部206は、画像の印象の判定結果である画像印象データテーブル600を記憶している。図6に示すように、この画像印象データテーブル600のデータ構造は、ファイル名が記憶されるファイル名カラム600aと、パス名が記憶されるパス名カラム600bと、印象語優先順位カラム600cと、を有している。印象語優先順位カラム600cは、その画像の印象判定の結果を優先度の高い順番(スコアの高い順)に記憶している。そして、この印象語優先順位カラム600cには、その画像の印象語を記憶する印象語カラム601cと、ユーザーの操作情報の1つであるOK判断のカウント数を記憶する正判定カラム602cと、操作情報の1つであるNG判断のカウント数が記憶される誤判定カラム603cと、が優先度順に記憶されている。例えば、画像印象データテーブル600の正判定カラム602cの欄の”o1a”は、ファイル1の”印象語A”を有する画像が画像表示部101に表示されている際に、ユーザーによる操作情報の1つであるOK判定をした回数である。また、同様に、画像印象データテーブル600の誤判定カラム603cの欄の”n1a”は、ファイル1の”印象語A”有する画像が画像表示部101に表示されている際に、ユーザーによる操作情報の1つであるNG判定をした回数である。ここで、ユーザーによる操作情報は、画像表示部101自体が、タッチパネル操作部として機能するので、ユーザーは画像表示部101を介して、操作情報を画像音楽再生装置100に入力できる。
そして、音楽印象記憶部306は、音楽の印象の判定結果である音楽印象データテーブル700を記憶している。この音楽印象データテーブル700のデータ構造は、図7に示すように、音楽のファイル名が記憶されるファイル名カラム700aと、音楽のファイルのパス名が記憶されるパス名カラム700bと、ファイルの印象語カラム700cと、を有している。
本実施形態の画像音楽再生装置100は、表示中の画像が再生中の音楽データのイメージに相応しくないとユーザーが判断した場合に、ユーザーは画像表示部101を介してその画像をスキップ(操作情報の1つとしてNG判定となる情報である)させることができる。また、逆に、ユーザーがこの画像(画像データ)が音楽データのイメージに合致していると判断した場合には、その画像の更新を止めて画像表示部101に表示し続けることができる(操作情報の1つとしてOK判定となる情報である)。そして、このようなユーザーの操作情報が画像音楽再生装置100に入力されると、画像印象更新部205は、画像印象記憶部206の画像印象データテーブル600の正判定カラム602c又は誤判定カラム603cの値を更新し、これをイメージ選択部210の画像の選択に際し、反映させることができる。これにより、再生された音楽データに対し表示する画像データは、ユーザー毎にカスタマイズできる。また、この時、ある設定回数、ユーザーが上述のような操作を行うと、印象判定用学習結果記憶部217(図3参照)に記憶されている印象判定用学習結果が更新される。具体的には、後述する画像の印象判定に用いられる識別器の重みの値が更新され、その結果が、印象判定用学習結果記憶部217と画像印象記憶部206に反映され、各記憶部内のデータが更新されることで、更に、ユーザーの好みとなるように調整できる。
また、本実施形態の画像音楽再生装置100に備わる画像印象判定部204は、図3に示すように、画像の印象判定を行う前に画像に対し前処理を行う画像前処理部214と、前処理した画像の特徴量を抽出する特徴量演算部215と、特徴量に基づいて画像の印象語に対する印象判定を行う印象判定部216と、印象語関係定義データテーブル500に基づいて画像の印象を決定する印象決定部219と、特徴量演算部215及び印象判定部216が、画像の印象判定を行う際に参照する印象判定用学習結果記憶部217の印象判定用学習結果と、を有する。印象判定部216は、印象語毎の判定部216aを有しており、印象語毎の判定部216aは、それぞれが後述する弱識別器を1つ持っている。
そして、印象判定用学習結果記憶部217は、外部印象判定学習部218によって学習された結果が記憶されている。具体的には、印象判定用学習結果記憶部217は、印象判定用学習結果である前処理データテーブル900(図8(a)参照)、特徴量データテーブル901(図8(b)参照)及び、印象語毎の学習結果テーブル902(図9参照)と、を記憶している。前処理条件データテーブル900は、後述するように画像の印象判定を行う際に、画像に対し行う前処理に関するデータが記憶されている。前処理条件データテーブル900のデータ構造は、図8(a)に示すように、画像データに対する前処理の条件としていくつかの属性(例えば、「リサイズ」、「EXIFサムネイル画像使用」、「平滑化」など)を記憶する属性カラム900aとその属性に対する条件値が記憶されている条件値カラム900bと、を有している。また、特徴量データテーブル901は、画像の印象判定を行う際に参照されるデータである。この特徴量データテーブル901のデータ構造は、図8(b)に示すように、任意の印象語が記憶されている印象語カラム901aと、その印象語に対する1番目特徴量〜N番目特徴量を記憶する特徴量カラム901bと、を有する。尚、この1番目特徴量〜N番目特徴量は、MPEG7で規格化されている、スケーラブルカラー(Scalable Color)やエッジヒストグラム(Edge Histogram)を用いたn次元のベクトルとして定義されており、本実施形態においては、学習画像毎に予め決められた方法により計算されて設定された値を使用する。また、印象語毎の学習結果テーブル902も画像の印象判定の際に参照されるデータであり、そのデータ構造は、図9に示すように、印象語IDカラム902aと、学習回数カラム902bと、識別器の重み(α)カラム902cと、陽性平均ベクトルカラム902dと、陰性平均ベクトルカラム902eと、誤判定ファイル数カラム902fと、正判定ファイル数カラム902gと、を有する。
本実施形態の画像音楽再生装置100は、音楽の印象と、画像の印象を予め別々に判定し、音楽の印象に合致した画像を、定義情報記憶部211に記憶されている上述した定義フィル等(印象語定義データテーブル400、印象語関係定義データテーブル500)を参照して、イメージ選択部210が選択するようになっている。そこで、まず、音楽の印象判定及び画像の印象判定を行う工程について説明し、その後、音楽の印象に対応する画像の選択工程及び、音楽の印象に対し選択された画像が、ユーザーの好みに合致していない場合に、画像の選択をカスタマイズする為の工程(印象判定用学習結果記憶部217の印象判定用学習結果の更新)について説明する。
[音楽の印象判定]
本実施形態の画像音楽再生装置100の音楽の印象判定の工程は、図10に示すように、画像音楽再生装置100に外部音楽ストレージ301が接続されると、音楽の印象判定を行う音楽印象判定部304は、音楽データを取得し(ステップS101)、取得した音楽データの印象判定を行う(ステップS102)。そして、その印象判定の結果が、ファイル名及びパス名と共に音楽印象記憶部306の音楽印象データテーブル700のファイルの印象語カラム700cに記憶される(ステップS102)。この時、外部音楽ストレージ301の音楽データが内部音楽ストレージ302にコピーされた場合は、パス名のみが内部音楽ストレージ302に変更されたデータベースレコードが音楽印象記憶部306の音楽印象データテーブル700のパス名カラム700bに記憶される。このようにして、音楽データを画像音楽再生装置100に取り込む際に、音楽印象判定部304は、その音楽データに対する印象判定を予め行い、その情報を音楽印象記憶部306の音楽印象データテーブル700にファイル名及びパス名と関連させて記憶しておくので、ユーザーが音楽を再生する場合に、その音楽データのファイル名又はパス名で、印象を特定することができる。
[画像の印象判定]
次に、画像音楽再生装置100に備わる画像印象判定部204が行う画像の印象判定について説明する。画像印象判定部204が行う画像の印象判定は、図11に示す工程の順で行われる。まず、画像音楽再生装置100に外部画像ストレージ201が接続されると、画像印象判定部204が画像データを取得する(ステップS111)。ここで、外部画像ストレージ201の画像データが内部画像ストレージ202にコピーされた場合は、内部画像ストレージ202から画像データを取得するようにしてもよい。画像データはファイル名及びパス名で管理され、内部画像ストレージ202又は外部画像ストレージ201のいずれかに記憶されている画像データであるか特定できる。
次に、画像印象判定部204の画像前処理部214が、取得した画像データに対し、印象判定に必要な前処理を行う(ステップS112)。前処理を行う為の条件は、印象判定用学習結果記憶部217の前処理条件データテーブル900(図8(a)参照)に、画像データに対する前処理条件として、リサイズの有無(ON/OFF)や平滑化の有無(ON/OFF)等のデータが設定され、記憶されているので、画像前処理部214は、このデータを参照して、画像データに対して印象判定に必要な前処理(リサイズや平滑化など)を行う。そして、特徴量演算部215は、印象語の印象判定に必要な特徴量を前処理終了後の画像データから算出する(ステップS113)。印象語の印象判定に必要な特徴量の情報は、印象判定用学習結果記憶部217の特徴量データテーブル901(図8(b)参照)から抽出できるので、次に、特徴量演算部215は、印象判定用学習結果記憶部217を参照して抽出する。次に、印象判定部219は、特徴量演算部215の算出した特徴量と、印象判定用学習結果記憶部217に記憶されている印象語毎の学習結果テーブル902(図9参照)を用いて、印象判定を行う(ステップS114)。そして、印象決定部216は、定義情報記憶部211に記憶されている印象語関係定義データテーブル500(図5)参照)を参照して、複数の印象語の印象判定の結果のうちスコアが最も高い印象語と矛盾する印象語を除外し、最終的な画像データの印象を決定し、優先順位の高い順(スコアの高い順)に画像印象データテーブル600の印象語優先順位カラム600cに記憶する(ステップST115)。このようにして、画像データ毎に印象語を割り当て、予め記憶しておく。そして、この画像データの印象判定の結果と、上述した音楽の印象判定の結果とを用いて、本実施形態の画像音楽再生装置100のイメージ選択部210が、後述するように音楽を鑑賞する際の画像データを選択して抽出し、音楽を再生する際に、その画像データを画像表示部101に表示する。つまり、画像音楽再生装置100は、音楽データの印象語と合致するような画像データを画像表示部101に表示するようになっている。
[音楽に対する画像の選択]
それでは、次に、上述の音楽データの印象判定の結果及び画像の印象判定の結果を用いて、イメージ選択部210が音楽の印象と対応する印象語を有する画像を選択する工程について、図12を参照しつつ説明する。ユーザーが、音楽を鑑賞するために、画像音楽再生装置100の電源をONにして、音楽鑑賞モードに移行させると、イメージ選択部210は、画像表示部101に内部音楽ストレージ302又は外部音楽ストレージ301に保存されている音楽データ一覧を表示する。ユーザーは、鑑賞したい音楽をその一覧から選択し、音楽再生部102を介して決定する(ステップS200)。イメージ選択部210は、その決定された音楽を内部音楽ストレージ302又は外部音楽ストレージ301に記憶されている音楽データのファイル名又はパス名で特定し、取得する(ステップS201)。次に、イメージ選択部210は、印象語を音楽印象記憶部306に記憶されている音楽印象データテーブル700を参照し(ステップS202)、取得した音楽データのファイル名(又は、パス名)と対応して記憶されている音楽に対する印象語を取得する(ステップS203)。次に、イメージ選択部210は、印象語定義記憶部211に記憶されている印象語定義データテーブル400を参照して、その音楽の印象語に対応する画像の印象語(画像印象語)を抽出して取得する(ステップS204)。そして、イメージ選択部210は、画像印象記憶部206に記憶されている画像印象データテーブル600を参照し、取得した印象語(画像印象語)を有する画像があるか否かを判断して(ステップS205)、相応しい印象語(画像印象語)を有する画像がある場合にはその画像を抽出する(ステップS206)。
このとき、ステップS205で、イメージ選択部210が、該当する印象語(画像印象語)を有する画像が無いと判断した場合には、イメージ選択部210は、印象語定義データテーブル400を参照して、音楽の印象語に対して次の画像の印象語の候補を抽出し、取得する(ステップS207)。そして、イメージ選択部210は、ステップS205に戻り、画像印象記憶部206の画像印象データテーブル600を参照して、その印象語を有する画像を抽出する。この時、イメージ選択部210は、ステップS207で次に対応する画像の印象語を抽出せずに、音楽の次の印象を取得し、ステップS204〜ステップS207を繰り返してもよい。
次に、イメージ選択部210は、選択された音楽データを音楽再生部102で再生し、再生と共にその抽出した画像データを画像表示部101に表示する(ステップS208)。この時、画像印象更新部205は、表示した画像データに対し、ユーザーが所定時間(例えば3秒)内にスキップの指示をしたか否かを判断する(ステップS209)。ここで、音楽データ及び画像データは、ファイル名又はパス名で特定できるようになっている。従って、表示された画像データがスキップされない場合は、画像印象更新部205は、画像印象記憶部206の画像印象データテーブル600のその画像データのファイル名カラム600a又はパス名カラム600b、及び印象語優先順位カラム600cの印象語カラム601cを参照し、対応する正判定カラム602cに”1”をインクリメントする(ステップS210)。この時、画像印象更新部205は、印象語優先順位カラム600cの印象語カラム602cの正判定の数が、「1」以下であるか否かを判定する(ステップS211)。画像印象更新部205は、「1」以下であると判断すると、印象判定用学習結果記憶部217に格納されている印象語毎の学習結果テーブル902の印象語判定カラム902a(例えば、”印象語A判定”)の正判定ファイル数カラム902hの値をインクリメントし(ステップS212)、「1」より大きい時はインクリメントせずにステップS213に進む。そして、イメージ選択部210は、選択した音楽データの再生が終了したか否かを判断し(ステップS213)、音楽データが終了するまで再生を繰り返し、音楽データの再生が終了すると、この工程を終了する。なお、再生を繰り返す際に再度画像抽出(ステップS206に戻る)を行っても良い。
一方、上述のステップS209で、画像印象更新部205は、表示されている画像がユーザーによってスキップされたと判断すると(ユーザーによる操作情報の1つであるNG判定の情報が出力されると)、画像印象記憶部206に格納されている画像印象データテーブル600のその画像データのファイル名カラム600a又はパス名カラム600b、及び印象語優先順位カラム600cの印象語カラム601cを参照し(例えば、”印象語XX”)、対応する誤判定カラム603cに”1”をインクリメントする(ステップS214)。この時、画像印象更新部205は、画像印象データテーブル600の印象語カラム601cの、例えば、”印象語XX”の誤判定カラム603cの数が「1」以下であるか否かを判断する(ステップS215)。
そして、画像印象更新部205は、”印象語XX”の誤判定カラム603cの数が「1」以下である場合は、図9に示すように印象判定用学習結果記憶部217に格納されている印象語毎の学習結果テーブル902の印象語判定カラム902a(例えば、”印象語XX判定”)の誤判定ファイル数カラム902gの値をインクリメントする(ステップS216)。一方、ステップST215で、画像印象更新部205は、画像印象データテーブル600の印象語カラム601cの、例えば、”印象語XX”の誤判定カラム603cの数が「1」より大きいと判断すると、印象語毎の学習結果テーブル902の印象語判定カラム902a(例えば、”印象語XX判定”)の誤判定ファイル数カラム902gの値をインクリメントせずに、ステップS217に進む。これにより、ある印象語(ここでは、”印象語XX”)を重複してカウントすることがないので、印象判定用学習結果記憶部217の誤判定のファイル数が正確にカウントされる。
そして、画像印象更新部205は、イメージ選択部210に次の画像候補を読み出し(ステップS217)、画像表示部101にその画像を表示し、音楽データの再生が終了するまで(ステップS218)、ステップS209〜ステップS217を繰り返す。
本実施形態の画像音楽再生装置100は、音楽の再生と共に表示する画像を上述のように自動で選択することができる。そして、その画像がユーザーの好みや感性に合致していない場合に、ユーザーがその画像をスキップ等すると、その情報が画像印象データテーブル600や印象判定用学習結果記憶部217に反映される。そして、後述するように、印象判定用学習結果記憶部217が更新され、ユーザーの好みや感性を反映させた画像を選択することができる。
[印象判定用学習結果記憶部の構築]
本実施形態の画像音楽再生装置100は、予め外部印象判定学習部218が、AdaBoostの手法により、複数の学習サンプル(学習画像)を用いて、各学習回で印象に影響を与えている部分領域と特徴量の部分ベクトルを学習により特定し、それらを用いて、AdaBoostで用いる弱識別器を構成し、画像データの印象を判定するための1つの強識別器H(X)を構築し、その結果である印象判定用学習結果記憶部217を使用して画像データの印象判定を実行するものである。したがって、ここでは、図13を用いて、外部印象判定部218の学習画像による学習の工程について説明する。この外部印象判定学習部218は、学習を開始すると、複数の学習画像を読み込む(ステップS300)
そして、外部印象判定学習部218は、学習の繰り返し回数tに初期値として”1”を設定し(ステップS310)、繰り返し回数tが、予め決められた回数(Tmax)を超えたか否かを判断し、Tmaxを超えるまで、ステップS330からステップS350を繰り返す(ステップS320)。この繰り返し処理において、ステップS330では、ステップS300で読み込んだ学習画像を用いて、繰り返し処理毎の(t回目の)学習における弱識別器h(x,t)が構築される。本実施の形態では、学習画像を予め決められた部分領域に分割し、この部分領域毎に学習を行い、当該部分領域毎の弱識別器hi(x,t)を構築し(iは部分領域の番号)、これらの部分領域に対応する弱識別器の中から最も印象が強い部分領域を選択し、この部分領域の弱識別器をこの学習処理(t回目の学習処理)における弱識別器h(x,t)として選択するように構成されている。そのため、xは、t回目の学習において入力される学習画像の特徴量(ベクトル量)Xのうち、各弱識別器h(x,t)が対応する部分領域における部分ベクトルを表している。
また、ステップS340では、ステップS330で構築された弱識別器h(x,t)から、線形結合のためのt回目の学習における係数αtを算出し、さらに、次の学習ステップ(t+1回目)で用いる各学習画像の重みDt+1(j)を更新する。そして、ステップS350でステップ数tに1を加算する。
以上のようにして、Tmax回の学習をすることにより、Tmax個の部分領域と弱識別器h(x,t)との組が決定され、ステップS360においてこれらの弱識別器h(x,t)を線形結合することにより1つの強識別器H(X)が構築される。このステップS360において弱識別器h(x,t)を線形結合するための係数αtは、上述のようにステップS340で算出されるが、後述するように、ステップS330で選択された部分領域(部分ベクトル)に対応する弱識別器h(x,t)とその誤り率εtとを用いて、次式(1)として決定される。ここで、1枚の学習画像をm個の部分領域に分割したとすると、部分領域の組み合わせの集合はG={g1,g2,...,gm}と表され、j枚目の学習画像の部分領域iに対応する部分ベクトルをxi,jとすると、特徴量のベクトルXは部分ベクトルの集合(X(j)={x1,j,x2,j,...,xm,j})として表される。
Figure 0005469884
この式(1)は、弱識別器h(x,t)の信頼性を表しており、誤り率εtが低いほど係数αtが大きくなり、対応する弱識別器h(x,t)のステップS360での判断の影響が大きくなる。但し、誤り率εtが0.5を超えるときは、弱識別器h(x,t)の判定を逆にすれば誤り率εtを小さくすることができるので、この場合は1から誤り率εtを引いた値を新たな誤り率εtとする。従って、誤り率εtの最悪値は0.5となる。
また、t+1回目の学習における学習画像の重みDt+1(j)は、全ての学習画像に対する重みを加算したときに1になる必要があるため、次式(2)に示す条件値Ztを満たすように、t回目の学習における重みDt(j)から次式(3)により求められる。なお、この式(2)及び(3)において、Jmaxは学習画像の枚数を示し、xi,jは、弱識別器が選択された部分領域iに対応するj番目の学習画像の部分ベクトルを示し、yjは、この弱識別器による判定結果を示す。
Figure 0005469884
以上より、ステップS360で構築される1つの強識別器H(X)は、次式(4)で表される。なお、この式(4)において、Xは強識別器Hで評価される学習画像の特徴量(ベクトル量)であり、xは、特徴量Xのうち、t回目の学習において弱識別器h(x,t)が選択された部分領域に対応する部分ベクトルである。
Figure 0005469884
図14では、学習全体を通じて、一番選択された頻度の多かった部分領域が学習画像の印象に影響を与えている領域として特定される様子が示されており、Tmax回行った学習の結果は、丸印が付けられた領域となる。
それでは、図15を用いて、弱識別器h(x,t)を構築するための処理(ステップS330)の具体的構成について説明する。まず、学習画像を予め決められた複数の部分領域に分割する(ステップS3301)例えば、学習画像を図14で示すように、矩形領域に分割し、学習画像の部分領域を生成する。具体的には、例えば、横6×縦4の24の矩形領域に分割する(この場合は、m=24となる)。この時、説明を簡単にするために、縦、横を均等分に分割した場合について示しているが、矩形領域の大きさは任意に設定することができる。また、これらの分割された矩形領域を組合わせたものを新たな部分領域とすることもできる。そして、部分領域のカウンタiに初期値として”1”を設定し(ステップS3302)、部分領域g1から順に、部分領域gmまで以下の処理を繰り返す(ステップS3303)。図14に於ける各番号が、各学習回で部分領域として選択された矩形領域の組み合わせを例示したものである。このようにして抜き出した学習画像の部分領域の組み合わせ集合をGとする。また、図14には、学習全体を通じて、一番選択される頻度の多い部分領域が、その学習画像の印象に影響を与えている領域として特定される様子が示されている。
まず、上述のステップS300ですべての学習画像の、部分領域giにおける特徴量の部分ベクトルを抽出する(ステップS3304)。例えば、7枚の学習画像がある場合は、i番目の部分領域の処理において抽出された部分ベクトルの集合は、{xi,1,xi,2,...,xi,7}(j=1,2,...,7)となる。そして、t回目の学習において、学習画像の陽性サンプルの特徴量の部分ベクトルの重み付き平均値を次式(5)により算出し、学習画像の陰性サンプルの特徴量の部分ベクトルの重み付き平均値を次式(6)により算出する(ステップS3305)。ここで、陽性サンプルとは、外部印象判定学習部218に設定された印象語に割り当てられている学習画像のことを言い、反対に陰性サンプルとは、当該印象語に割り当てられていない学習画像のことを言う。例えば、印象語”A”を判定する装置では、”A”というラベルのある学習画像を陽性サンプルといい、”A”というラベルのない学習画像を陰性サンプルという。なお、式(5),(6)において、〜付きのxは、部分ベクトルの重み付きの平均値であり、添え字の最初の数字は、”1”が陽性サンプルに対するものであることを示し、”2”が陰性サンプルに対するものであることを示す。また、m<nである。
Figure 0005469884
これらの式(5),(6)において、n1は陽性サンプルの枚数を示し、n2は陰性サンプルの枚数を示している。また、λjはj番目の学習画像に付加されている印象語数の逆数である。例えば、学習画像に付加されている印象語の数が1個であれば、λj=1.0、印象語の数が2個であればλj=0.5となる。つまり、このλjは、j番目の学習画像の印象に対する影響力を表しており、多くの印象語が付加されている学習画像ほど、その学習画像の印象に与える影響力は小さくなる。また、D1,t(j)は、t回目の学習における、j番目の陽性サンプルの重みであり、D2,t(j)は、t回目の学習における、j番目の陰性サンプルの重みである。ここで言う重みとは、各学習画像が平均的な特徴量の部分ベクトルである式(1)及び(2)に影響を与える割合のことであり、常に以下の式(7)の関係を満足するものとする。
Figure 0005469884
なお、この陽性及び陰性サンプルの重みD1,t(j),D2,t(j)は、学習回数とともに変化するが、初期値(t=1)のときの値は、それぞれ、次式(8),(9)により定義され、各学習サンプルの重みを同じとする。
Figure 0005469884
次に、上述のステップS3305で算出された特徴量の部分ベクトルの平均値と、各学習画像の特徴量の部分ベクトルとのユークリッド距離を次式(10),(11)により算出する(ステップS3306)。式(10)において、f1は、第i番目の領域の部分ベクトルxと陽性サンプルの特徴量の部分ベクトルの平均値(〜付きのx1,j,t)とのユークリッド距離を示し、式(11)において、f2は、第i番目の領域の部分ベクトルxと陰性サンプルの特徴量の部分ベクトルの平均値(〜付きのx2,j,t)とのユークリッド距離を示している。また、特徴量の部分ベクトルの平均値の添え字のうち、最後のtは、t回目の学習であることを示す。
Figure 0005469884
そして、ステップS3306で算出された距離f1,f2を用いて、第i番目の部分領域において印象が陽性か陰性かを判定する弱識別器hi(x,t)を次式(12)により構築する(ステップS3307)。ここで、”1”が陽性で、”−1”が陰性を表す。すなわち、この式(12)で表される弱識別器h(x,t)は、評価画像の特徴量の部分ベクトルと学習画像より得られた部分ベクトルの重み付き平均値との距離が、陽性サンプルと近いときに陽性(1)と判断され、陽性及び陰性サンプルとの距離が等しいか若しくは陰性サンプルと近いときに陰性(−1)と判断するものである。
Figure 0005469884
最後に、上述のステップS3307で構築された弱識別器hi(x,t)を用いて、すべての学習画像の第i番目の部分領域に対する部分ベクトルの判定を行い、その判定結果と、予めつけた答え(陽性サンプルか、陰性サンプルか)と一致するかを検査する(ステップS3308)。ステップS3309で、判定結果が、答えと一致しないと判断される場合は、判定を間違えた(答えが一致しなかった)学習画像の重みα t を誤り率εiとして加算する(ステップS3310)。一方、ステップS3309で、判定結果が一致している場合は、ステップS3303に戻る。
ここで、該当する弱識別器hi(x,t)(言い換えると、該当する部分領域i)に対応する誤り率εiは、次式(13)により算出される。
Figure 0005469884
このようなステップS3304からS3308までの一連の処理を部分領域の組み合わせの集合Gの要素数だけ繰り返す。最終的に、i個の部分領域において、最も誤り率εiが低かった弱識別器hi(x,t)を、t回目の学習における弱識別器h(x,t)として選択し、学習回数tと、この弱識別器h(x,t)に関する部分領域の番号i(i番目特徴量であり、例えば、i=1〜N)、係数(重み)αt及び選択された部分領域における特徴量の部分ベクトルの重み付き平均値(〜付きのx1,j,t、x2,j,t)とが記憶され、弱識別器のDBとして印象判定用学習結果記憶部217に記憶されている印象判定用学習結果である各データテーブル900,901,902が構成される(ステップS3311)。なお、弱識別器hi(x,t)が選択された部分領域iの誤り率εiが、t回目の学習における誤り率εtとして選択される。
以上のように本実施形態の画像音楽再生装置100は、外部印象判定部218が、予め学習画像を用いて学習した結果(印象判定用学習結果)である各データテーブル900,901,902を構成して、これを予め記憶した印象判定用学習結果記憶部217を有するものとして構成されている。そして、この印象判定用学習結果記憶部217の各データテーブル900,901,902に基づいて、自動的に画像の印象判定を行い、画像印象記憶部600を構成する。更に、イメージ選択210は、印象語定義データテーブル400を参照して、音楽印象記憶部700と画像印象記憶部600とを用いて、音楽に対応する画像を自動的に選択・決定し、共に再生する。
画像は、このように機械的(自動的に)に決定されたものであり、ユーザーの好みを反映するものとなっていない。特に、音楽鑑賞と同時に画像データを再生して鑑賞する場合、ユーザーは、音楽データと共に流れる画像データに対して、好みや感性の反映された画像を求める傾向にある。そこで、本実施形態の画像音楽再生装置100は、音楽と共に流れる画像を予め自動的に決定しつつも、ユーザーの好みや感性が反映された画像を流すことができるよう構成されている。つまり、画像音楽再生装置100は、音楽に対応する画像を自動的に選択する際に、カスタマイズした条件を用いて画像を選択する構成を有する。この画像選択の条件をカスタマイズする構成は、印象判定用学習結果記憶部217の印象判定用学習結果(各データ)を更新する構成を有することで実現できる。そこで、次に、この画像選択の条件をカスタマイズする構成について図16を示して詳細に説明する。
[印象判定用学習結果の更新]
上述したように、音楽と共に流れる画像は、画像音楽再生装置100に備わるイメージ選択部210が、音楽印象記憶部306や画像印象記憶部206の各データテーブル、及定義情報記憶部211の印象語定義データテーブル400等の各データを参照して自動的に選択したものである。そして、本実形態の画像音楽再生装置100では、この時、表示されている画像に対し、ユーザーが音楽の印象に相応しくないと判断し、その画像をスキップする等の操作(ユーザーによる操作情報)を行われた場合、上述したように、画像印象更新部205は、その画像に対応する印象語、例えば、印象語”XX”の誤判定ファイル数をカウントし、印象判定用学習結果記憶部217の学習結果テーブル902の印象語”XX”に対応する誤判定ファイル数カラム902gの値がインクリメントされる。そして同時に、画像印象記憶部206の画像印象データテーブル600の誤判定された画像(例えば、ファイルn)の印象語”XX”の誤判定カラム603cのNGの値がインクリメントされる。ただし、同じ画像であるファイルnが再度、誤判定とみなされても、学習結果テーブル902の誤判定ファイル数カラム902gの値(ファイル数)はインクリメントしない。これにより、同一の印象を有する音楽において、同じ画像が誤判定された場合でも、重複して誤判定の画像としてカウントされることを防ぐことができる。
そして、画像印象更新部205は、図16に示す工程により、印象判定用学習結果記憶部217の更新を行う。具体的には、画像印象更新部205は、印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902の例えば、印象語”XX”の誤判定ファイル数カラム902gの値(誤判定ファイル数の値)が、予め規定された個数(例えば、Nmax=10〜100)に達するまでカウントを行い(ステップS400)、その個数になったと判断すると、N個のファイルに対して印象語”XX”の判定を行う(ステップS410)。そして、画像印象更新部205は、誤判定をした弱識別器hi(x,t)の識別器の重みの値αを減じる補正を行う為に、次式(14)により減じるΔα算出し、重みの値αを減ずる(ステップS420)。
Figure 0005469884
ここで、τNGは、誤判定率であり次式(15)として定義されている。
Figure 0005469884
NGnXXはファイルnの印象語XXのNGの値であり、ファイル数である。また、h(n)は弱識別器が誤判定した場合は、1、そうでなければ0とする。次に、画像印象更新部205は、印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902の(ここでは、印象語”XX”)誤判定ファイル数カラム902gの値(誤判定ファイル数の値)をリセットして、”0”に戻し(ステップS430)、印象判定用学習結果記憶部217の印象語毎の学習結果データテーブル902を更新する(ステップS440)。更新後、画像印象更新部205は、画像印象判定部204が誤判定されたN個のファイルに対し、印象判定を行うように指示し、画像印象判定部204は、印象判定を行う(ステップS450)。そして画像印象更新部205は、その結果に基づき、画像印象記憶部206の画像印象データテーブル600を更新し(ステップS460)、終了する。
一方、ステップS400で、誤判定ファイル数が、予め決められた個数に達していないと判断されると、画像印象更新部205は、印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902の例えば、印象語”XX”の正判定ファイル数カラム902hの値(正判定ファイル数の値)が、予め規定された回数(例えば、Nmax=10〜100)に達するまでカウントを行う(ステップS470)。つまり、画像印象更新部205は、印象語毎の学習結果テーブル902の誤判定ファイル数カラム902g又は正判定ファイル数カラム902hの値が予め規定された個数に達するまでカウントする(ステップS400、ステップS470)。
そして、画像印象更新部205は、画像印象更新部205は、印象語毎の学習結果テーブル902の正判定ファイル数カラム902hの値が規定個数になったと判断すると、N個のファイルに対して印象語”XX”の判定を行う(ステップS480)。次に、画像印象更新部205は、正判定をした弱識別器hi(x,t)の識別器の重みの値αを増やす補正を行う為に、次式(16)により増加するΔα算出し、重みの値αを増やす(ステップS490)。
Figure 0005469884
ここで、τOKは、誤判定率であり次式(17)として定義されている。
Figure 0005469884
OKnXXはファイルnの印象語”XX”のOKの値であり、ファイル数である。また、h(n)は弱識別器が正判定した場合は、1、そうでなければ0とする。次に、画像印象更新部205は、印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902の(ここでは、印象語”XX”)正判定ファイル数カラム902hの値(正判定ファイル数の値)をリセットして、”0”に戻し(ステップS500)、印象判定用学習結果記憶部217を更新する(ステップS510)。更新後、画像印象更新部205は、画像印象判定部204が正判定されたN個のファイルに対し、印象判定を行うように指示し、画像印象判定部204は、印象判定を行う(ステップS520)。そして画像印象更新部205は、その結果に基づき、画像印象記憶部206の画像印象データテーブル600を更新し(ステップS460)、終了する。
以上のように、本実施形態の画像音楽再生装置100は、予め印象判定用学習結果を記憶した印象判定用学習結果記憶部217を有しているが、ユーザーが音楽とともに再生されている画像に対し、例えばスキップや、表示中の画像をポーズした場合など、ユーザーの操作情報を画像印象データテーブル600や印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902に反映する構成を有している。つまり、ユーザーによるこのような操作情報を画像印象データテーブル600や学習結果テーブル902に記憶しておき、ある指定回数値となった際に、印象判定用学習結果記憶部217の印象語毎の学習結果テーブル902に記憶されている弱識別器hi(x,t)の識別器の重みを更新する構成を有している。これにより、印象語の判定器が、カスタマイズされるようになる。そのため、この画像音楽再生装置100は、画像が自動で選択されても、ユーザーの好みを反映して選択することができる。特に、音楽鑑賞と同時に画像を再生して鑑賞する場合、音楽と共に流れる画像に対しては、ユーザーの好みや感性が反映された画像を再生することができる画像音楽再生装置100となる。ここで、本実施の形態では、誤判定ファイル数または正判定ファイル数は、予め画像音楽再生装置100に決められた値としており、任意に決定することが可能であるが、ここでは、10〜100回程度の数としている。そして、同じ印象を有する音楽を対照とした場合に、音楽の印象に相応しい画像の印象語に対して正判定または誤判定のファイル数が10〜100個程度蓄積する毎に、弱識別器hi(x,t)の識別器の重みを更新し、印象判定用学習結果記憶部217を更新することにより、イメージ選択部210はユーザーの好みに調整された画像を選択するようになる。
100 画像音楽再生装置 101 画像表示部 102 音楽再生部
204 画像印象判定部 206 画像印象記憶部 210 イメージ選択部
205 画像印象更新部 217 印象判定用学習結果記憶部
306 音楽印象記憶部

Claims (3)

  1. 音楽を記憶する音楽データ記憶部と、
    画像を記憶する画像データ記憶部と、
    前記音楽の印象を記憶する音楽印象記憶部と、
    予め学習画像により学習した結果である印象判定用学習結果を記憶する印象判定用学習結果記憶部と、
    前記画像データ記憶部に記憶されている前記画像の印象を、前記印象判定用学習結果記憶部に記憶されている前記印象判定用学習結果を用いて判定する画像印象判定部と、
    前記画像印象判定部の判定結果を記憶する画像印象記憶部と、
    前記音楽を再生する音楽再生部と、
    前記画像を表示する画像表示部と、
    前記音楽再生部で前記音楽を再生する際に、前記音楽印象記憶部に記憶されている前記音楽の印象を取得して、当該音楽の印象に対応する印象を有する前記画像を前記画像印象記憶部の前記判定結果を参照して選択し、選択された前記画像を前記画像表示部に表示するイメージ選択部と、
    前記イメージ選択部により選択され、前記画像表示部に表示している前記画像に対する使用者の操作情報を前記画像印象記憶部に記憶する画像印象更新部と、を有し、
    前記画像印象更新部は、前記画像印象記憶部に記憶された前記操作情報を、前記イメージ選択部により前記画像を選択する際に、前記印象判定用学習結果記憶部の前記印象判定用学習結果に反映する構成を有する画像音楽再生装置。
  2. 前記印象判定用学習結果記憶部の前記印象判定用学習結果は、複数の印象語に対する学習結果を記憶しており、
    前記画像印象判定部は、前記画像の特徴量を算出する特徴量演算部と、前記画像に対して複数の印象語毎に印象判定を行う印象判定部と、前記印象語毎の前記印象判定部の印象判定の結果から、前記画像に対する印象語の優先度を決定する印象決定部と、を有し、
    前記画像印象更新部は、前記操作情報を前記印象判定用学習結果及び前記画像印象記憶部に前記印象語毎に記憶するように構成されている請求項に記載の画像音楽再生装置。
  3. 前記画像印象更新部は、複数の前記印象語の任意の印象語に対し、前記操作情報が閾値回数以上になった際に、前記印象判定部に対して補正を加えるように構成されている請求項に記載の画像音楽再生装置。
JP2009054614A 2009-03-09 2009-03-09 画像音楽再生装置 Active JP5469884B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009054614A JP5469884B2 (ja) 2009-03-09 2009-03-09 画像音楽再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009054614A JP5469884B2 (ja) 2009-03-09 2009-03-09 画像音楽再生装置

Publications (2)

Publication Number Publication Date
JP2010210746A JP2010210746A (ja) 2010-09-24
JP5469884B2 true JP5469884B2 (ja) 2014-04-16

Family

ID=42971005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009054614A Active JP5469884B2 (ja) 2009-03-09 2009-03-09 画像音楽再生装置

Country Status (1)

Country Link
JP (1) JP5469884B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014175733A (ja) * 2013-03-06 2014-09-22 Nikon Corp 画像再生装置および画像再生プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3840321B2 (ja) * 1997-08-18 2006-11-01 松下電器産業株式会社 異種メディア対の予測方法及びその装置
JP2004294888A (ja) * 2003-03-27 2004-10-21 Brother Ind Ltd 音楽再生装置及びプログラム
JP4221308B2 (ja) * 2004-01-15 2009-02-12 パナソニック株式会社 静止画再生装置、静止画再生方法及びプログラム
KR20070114918A (ko) * 2006-05-30 2007-12-05 주식회사 엔터기술 배경영상을 지정하는 기능을 구비한 마이크형 노래반주기시스템
JP2008065674A (ja) * 2006-09-08 2008-03-21 Sharp Corp 携帯電話機

Also Published As

Publication number Publication date
JP2010210746A (ja) 2010-09-24

Similar Documents

Publication Publication Date Title
US8321414B2 (en) Hybrid audio-visual categorization system and method
JP5464412B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20180137425A1 (en) Real-time analysis of a musical performance using analytics
JP2007122442A (ja) 楽曲分類装置及び楽曲分類プログラム
KR101942459B1 (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
CN109545185A (zh) 交互系统评价方法、评价系统、服务器及计算机可读介质
JP2005173938A (ja) 曲検索装置、曲検索方法及び曲検索用プログラム並びに情報記録媒体
CN112819099A (zh) 网络模型的训练方法、数据处理方法、装置、介质及设备
US20150189166A1 (en) Method, device and system for improving the quality of photographs
CN104700831B (zh) 分析音频文件的语音特征的方法和装置
JP6539887B2 (ja) 楽音評価装置及びプログラム
JP5469884B2 (ja) 画像音楽再生装置
JP2006065675A (ja) データ検索方法および装置
JP2005346347A (ja) 情報検索装置、情報検索方法、情報検索プログラムおよび記録媒体
JP4607660B2 (ja) 楽曲検索装置および楽曲検索方法
JP4115923B2 (ja) 楽曲検索システムおよび楽曲検索方法
KR102623459B1 (ko) 사용자의 보컬 평가에 기반한 오디션 이벤트 서비스 제공 방법, 장치 및 시스템
JP4607659B2 (ja) 楽曲検索装置および楽曲検索方法
JP4459269B2 (ja) 曲検索装置、曲検索方法及び曲検索用プログラム並びに情報記録媒体
KR102623449B1 (ko) 사용자 보컬 평가 결과 맞춤형 보컬 트레이닝 서비스 제공 방법, 장치 및 시스템
KR102623462B1 (ko) 사용자 보컬 평가 정보 기반 보컬 학원 정보 제공 방법, 장치 및 시스템
KR20190009821A (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
TWI808038B (zh) 媒體檔案選擇方法及服務系統與電腦程式產品
KR102623467B1 (ko) 사용자 보컬 평가 정보에 기반한 기획사 추천 서비스 제공 방법, 장치 및 시스템
JP7243447B2 (ja) 声優評価プログラム、声優評価方法及び声優評価システム

Legal Events

Date Code Title Description
A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20120305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140203

R150 Certificate of patent or registration of utility model

Ref document number: 5469884

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250