JP2009516951A - デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法 - Google Patents

デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法 Download PDF

Info

Publication number
JP2009516951A
JP2009516951A JP2008540766A JP2008540766A JP2009516951A JP 2009516951 A JP2009516951 A JP 2009516951A JP 2008540766 A JP2008540766 A JP 2008540766A JP 2008540766 A JP2008540766 A JP 2008540766A JP 2009516951 A JP2009516951 A JP 2009516951A
Authority
JP
Japan
Prior art keywords
image
metadata
sequence
audio
companion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008540766A
Other languages
English (en)
Other versions
JP5457676B2 (ja
Inventor
エム スライス,バルテル
フェルベルクト,マルク
ハー イェー フリーリンク,クーン
レイクカールト,アルベルト
エフ イェー フォンテイン,ウィルヘルミュス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2009516951A publication Critical patent/JP2009516951A/ja
Application granted granted Critical
Publication of JP5457676B2 publication Critical patent/JP5457676B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]

Abstract

少なくとも一つのデジタル画像を含むシーケンスが表示されている間に、その特定の画像シーケンスの内容にマッチし、提供されたおよび/または生成された任意の画像メタデータにマッチするような少なくとも一つのオーディオ随伴物を自動的に再生/提案するシステム(300)、装置(200)および方法(100)が提供される。当該画像自身から、またユーザーによって提供される任意のメタデータから検索語が導出され、これらの検索語を使って、(1)画像または関連付けられたテキスト(たとえば歌詞)中のこれらの検索語またはその同義語を含むか、(2)小川の速い流れの画像についての流水の音のような、前記画像に通常関連付けられる音を表すかする、オーディオ随伴物が見出される。本発明はユーザー入力を受け容れ、検索結果として適切なオーディオ随伴物を位置特定し、これらの結果を、画像を表示している間にオーディオ随伴物を再生することによって、あるいはこれらの結果からコンパイルされたプレイリストをユーザーに提案することによって、ユーザーに呈示する。

Description

本発明は、デジタル画像のシーケンスのメタデータを使って、その画像メタデータと類似するテキストおよびメタデータをもつ音楽および音を含むオーディオ随伴物を同定し、関連付け、提案されるプレイリストまたは視覚と音のショーとしてユーザーに呈示するために前記同定されたオーディオと組み合わされたシーケンスを作成することに関する。
ますます多くの消費者システムがさまざまなタイプのコンテンツの保存および再生を組み合わせている。結果として、人がデジタル写真を再生するために使うシステムはしばしばそれらの写真を表示しながら音楽の伴奏も再生できる。問題は、この可能性が、写真スライドショー(デジタル画像のシーケンス)に随伴する適切な音楽をみつけ、選択するという、ユーザーにとっての追加的なタスクを導入するということである。
したがって、特定のデジタル画像シーケンスの内容にマッチするオーディオ随伴物を自動的に再生する(または提案する)方法が必要とされている。
ある実施形態では、本発明のシステム、装置および方法は、(写真、写真アルバム、家庭用ビデオのような)デジタル画像のメタデータを用いて、それらの写真に関係した歌テキストを含む音楽を検索する方法を提供する。
これを達成するために:
(1)画像(単数または複数)(のセット/シーケンス)から、あるいは画像メタデータからテキスト・ラベルが導出され、
(2)これらのテキスト・ラベルまたはキーフレーズは少なくとも一つのキーワードを含んでおり、音楽タイトルまたは該音楽に関連付けられた歌テキストの(顕著な)部分またはオーディオのメタデータにこれらのキーフレーズを含むオーディオ随伴物をみつけるために使われる。
多くの古典的な曲はその音楽に歌詞がつけられてきた。たとえば、「I'm Always Chasing Rainbows」はショパンの幻想即興曲に歌詞をつけた歌である。さらに、歌詞のない多くの楽曲はスライドショーのためのバックグラウンドミュージックとして適切である。たとえば海辺のスライドショーがオーシャン・ミュージック(ocean music)と関連付けられるなどである。音楽に加え、サウンドトラックがオーディオ随伴物として提供される。この後者のオーディオ随伴物は、その内容を記述する関連付けられたメタデータを有する必要がある。
以下の記述は限定ではなく例示の目的で与えられていることが当業者には理解されるものとする。当業者は本発明の精神および付属の請求項の範囲内にはいる多くの変形があることを理解する。既知の機能および動作の無用な詳細は、本発明を埋没させることのないよう、本記載からは省略されることがある。
ある好ましい実施形態では、ユーザーによって提供されるデジタル画像の内容および特性が、キーフレーズとなりうるテキスト・ラベル(画像メタデータ)を導出するために使われる。キーフレーズは、ユーザーが指定した画像名/ラベルから導出される少なくとも一つのキーワードを含む。あるいはキーフレーズは画像のテキスト注釈から導出される。ある好ましい実施形態では、画像のシーケンスの内容は、テキスト内容については光学式文字認識(OCR)を使って、場面については画像場面認識を使って、オブジェクト(人および動物を含む)については画像オブジェクト認識を使って認識される。ユーザーによって供給される画像特性は画像メタデータとして扱われ、当該画像(単数または複数)のユーザー固有データ(たとえば民族、性、年齢、職業)、作成時および作成場所情報のような項目を含むことができる。これが意味のある名前に、あるいは標準化されたキーワードを含み、最もありそうな起こっているイベントおよび位置を記述するキーフレーズ(たとえば誕生日、クリスマス、ニューヨーク、パリ、夏休み)に変換される。
ある実施形態では、画像内容解析アルゴリズムを使って、画像の風景が分類され、画像を記述するメタデータが提供され、このメタデータが、キーフレーズでインデックスされたオーディオ随伴物のデータベースを検索する検索語として使用できる。そのようなクラスに関連付けられた単語またはラベルも、その後関係するオーディオ・コンテンツをみつけるために使われるテキスト・ラベル(画像メタデータ)を導出するために使われる。たとえば、全体的な白さから冬の場面を検出することが可能である。そのような特性の識別情報は、冬、雪、白といったある種のテキスト・メタデータ(ラベル)に変換される。これらのメタデータは次いで、冬、雪などについての歌テキストおよびオーディオ・メタデータを有するオーディオをみつけるために使用できる。
ある好ましい実施形態では、画像のメタデータが組み合わされる。たとえば、場面解析情報が(他の単語のうち)「白」を与える一方、時間情報は「クリスマス」に変換されることができる。本発明は、この例では曲「ホワイト・クリスマス」および雪が降る音を見出す。
ある好ましい実施形態では、選択されたオーディオ随伴物は、画像のシーケンスをカバーするために時間的に引き延ばされる。というのも、一般的に、そのようなシーケンスにとって、構成する画像のそれぞれについて別のオーディオ随伴物にスキップするのは望ましくないからである。したがって、画像のシーケンスについて入手可能なメタデータをシーケンス全体のための記述に統合することが有利である。次いで、統合メタデータを使って、画像のシーケンス全体について好適な少なくとも一つのオーディオ随伴物が選ばれることができる。
あるさらなる代替的な実施形態では、メタデータの有意なテキスト・ラベルへの変換が、ユーザーについての情報(たとえば、適切なレベルの位置の粒度を与えるための地理的な自宅位置、正しいイベントを導出するための地域的/文化的背景、休日を決定するための個人/家族情報など)を入手可能にすることによって改善される。
ある好ましい実施形態では、効果音が、画像(単数または複数)のメタデータに関係するオーディオ随伴物として提供される。たとえば、パーティーのスライドショーにグラスの音を加えてもよい。群衆の映像がざわめき音をトリガーしてもよい。
ここで図1を参照すると、本発明に基づく方法のある好ましい実施形態の流れ図の一例が示されている。ステップ102では、画像または画像のシーケンス101が、関連付けられたメタデータ101とともに入力される。該メタデータは、少なくとも一つの画像について、受領されるか作成されるうち少なくとも一方をされている。画像およびメタデータは次いで短期持続性メモリ103に保持される。画像メタデータはユーザーが入力することができ、あるいは本発明によって導出されることができるもので、日付、時刻、イベント、位置、イベントのユーザーとの関係または他の記述子を含むことができる。本発明のシステム、装置および方法は、用語およびその同義語のシソーラス104.1を含むことができ、これが、ユーザーによって入力されたメタデータを標準的なセットに規格化するために使われる。たとえば、マム、母、お母さん、ママ、マードレなどはみな、画像の同じ「母」属性を指す。同様に、本発明の方法100は、白い冬の場面などの画像メタデータの生成のための画像解析機能を含むことができる。ユーザー入力メタデータおよびシステム生成メタデータを含む両タイプのメタデータが、画像シーケンスとともに持続性メモリ103に保存される。入力画像シーケンスのための対応するオーディオ随伴物を位置特定するために、少なくとも一方のタイプが、本発明のシステム300、装置200および方法100のために保存されねばならない。
前もって標準化されたオーディオ随伴物メタデータで注釈付け(インデックス付け)されたオーディオ随伴物データベース104が設けられる。短期持続性メモリ103に保持されている標準化された取り込まれた/生成された画像メタデータを使って、ステップ105で、マッチする音楽メタデータを求めて設けられている音楽データベース104が検索される。ステップ106では、すべてのマッチするメタデータがプレイリストにコンパイルされ、当該画像(単数または複数)に関連付けられ、持続性メモリ103に保持される。ある好ましい実施形態では、マッチの度合いも導出される。たとえば、冬および白の画像とユーザー提供された日付12/25は「ホワイト・クリスマス」とは100%のマッチに、「ウォーキング・イン・ア・ウィンター・ワンダーランド」とはより低いマッチにつながるであろう。ステップ107では、検索結果が持続性メモリ103から取得され、最良マッチが再生されるか、画像が表示されている間の音楽随伴物提案のランク付きリストに呈示されるかする。ある好ましい実施形態では、画像およびオーディオ注釈の両方がのちの取得、表示および再生のためにデータベース108に保存される。
ここで図2を参照すると、画像が表示されている間にオーディオ随伴物を画像と関連付けるため、あるいはオーディオ随伴物のプレイリストをユーザーに対して呈示するための装置200が示されている。本装置は、画像、画像シーケンスならびに該画像および画像シーケンスを記述するメタデータを受領する、画像メタデータ取り込み/生成モジュール201を有する。メタデータは日付、時刻、季節、イベント、ユーザーとの関係、個人(単数または複数)/ペット(単数または複数)の名前(単数または複数)、画像および画像シーケンスの位置を含む。ユーザーによって入力されたメタデータは、モジュール201によって取り込まれ、またモジュール201によって画像解析を通じて生成され、たとえば海または湖、島などである。ひとたび画像およびそのメタデータが取り込まれ、入力画像シーケンスについてのメタデータがモジュール201によって生成されたら、短期持続性メモリ103に保持される。次いで、検索/関連付けモジュール203が、そのメタデータに基づいて、好適なオーディオ随伴物を求めてデータベース102を検索する。提案/再生モジュール204が、プレイリストを提案するか、検索から帰結する最も関連性のあるオーディオ随伴物を再生するかの少なくとも一つをする。ある好ましい実施形態では、結果は、将来の取得および再生のために、注釈付けされた画像のデータベース108に保存される。持続性メモリ103は、装置200を組み込んでいる表示装置が画像シーケンスを表示することをユーザーが望むだけしか続かない比較的短期のメモリである。
ここで図3を参照すると、図2の装置200を組み込んでいるシステム300が示されている。システム300はデジタル画像コンテンツおよびユーザーによってそのために入力されたメタデータ101を受け容れ、図2の装置200を使って、必要なら、シソーラス104.1を援用して、追加的な画像メタデータを生成する。適切なオーディオ随伴物をそのデータベース104中で位置特定し、入力シーケンスに関連する結果として得られるオーディオ随伴物を短期持続性メモリ103に保存するためである。システムは次いで、画像/シーケンスを表示302している間そのオーディオ随伴物を再生301するか、あるいは結果のプレイリストをユーザーに提案302するかする。結果および画像(単数または複数)は将来の取得および閲覧のために注釈付けされた画像データベース108に保存されることもできる。
本発明の好ましい実施形態が例示および記載されてきたが、当業者は、本発明の真の範囲から外れることなく、ここに記載されるシステム、装置および方法が例示的であり、さまざまな変形および修正がなしえ、その要素について等価物が代用されうることを理解するであろう。さらに、その中心的な範囲から外れることなく、本発明の教示を、音/効果音セットアップをもつ特定の画像再生に適応させるために多くの修正がなされうる。したがって、本発明は、本発明を実施するために考えられている最良の形態として開示されている個別的な実施形態に限定されるものではなく、本発明は、付属の請求項の範囲にはいるあらゆる実施形態を含むものであることが意図されている。
本発明に基づく方法の機能的な流れ図である。 音楽を歌詞と関連付ける本発明に基づく装置を示す図である。 本発明に基づくシステムを示す図である。

Claims (17)

  1. 少なくとも一つの画像のシーケンスに関連付けられた内容メタデータを使って前記シーケンスのためのオーディオ随伴物を提供する方法であって:
    前記シーケンスに関連付けられた前記内容メタデータを使ってデータベース中でマッチするオーディオ随伴物を位置特定し;
    前記位置特定されたオーディオ随伴物を、前記シーケンスのための随伴物として提供する、
    ステップを有する方法。
  2. 内容メタデータが、日付、時刻、イベント、位置、画像のユーザーとの関係、ユーザー特性および記述子キーフレーズを含む、請求項1記載の方法。
  3. 標準的な内容メタデータおよびその同義語のシソーラスを設け;
    前記シソーラスを使って、前記シーケンスに関連付けられた内容メタデータを規格化して標準的な内容メタデータにする、
    ステップをさらに有する、請求項1記載の方法。
  4. 内容メタデータが、日付、時刻、イベント、位置、画像のユーザーとの関係および記述子キーフレーズを含む、請求項3記載の方法。
  5. メタデータ記述子の付与と、前記少なくとも一つの画像の内容解析によるメタデータ記述子の導出と、よりなる群から選択される技法によって、前記内容メタデータを前記シーケンスに関連付けるステップをさらに有する、請求項1記載の方法。
  6. 内容解析が、テキストの光学式文字認識、画像場面認識および画像オブジェクト認識よりなる群から選択される、請求項5記載の方法。
  7. 前記提供するステップがさらに、まず:
    前記位置特定されたオーディオ随伴物を前記シーケンスに関連付けられたプレイリストにコンパイルし;
    前記コンパイルされたプレイリストからなされる任意の選択を、前記位置特定されたオーディオ随伴物に含めるステップを含む、
    請求項5記載の方法。
  8. 前記シーケンスおよび該シーケンスのための位置特定されたオーディオ随伴物を短期持続性メモリ内に保持し;
    前記提供するステップに先立ち、前記保持されたシーケンスおよび該シーケンスのための位置特定されたオーディオ随伴物を取得する、
    ステップをさらに有する、請求項7記載の方法。
  9. 内容メタデータが、ユーザー・データ、日付、時刻、イベント、位置、画像のユーザーとの関係、画像中の個人の名前、画像中のペットの名前、画像タイトル、季節、温度、緯度、経度、サイズ、身体部分、色および記述子キーフレーズを含む、請求項8記載の方法。
  10. 標準的な内容メタデータおよびその同義語のシソーラスを設け;
    前記シソーラスを使って、前記シーケンスに関連付けられた内容メタデータを規格化して標準的な内容メタデータにする、
    ステップをさらに有する、請求項9記載の方法。
  11. 位置特定する前記のステップがさらに、マッチの度合いを導出するステップを有しており;
    前記提供するステップがさらに、まず提供されたオーディオ随伴物をマッチの度合いによって低い順に順序付けるステップを有する、
    請求項10記載の方法。
  12. 前記提供するステップがさらに:
    前記シーケンスを、前記位置特定されたオーディオ随伴物に関連付けてデータベースに保存し;
    保存されたシーケンスおよび関連付けられたオーディオ随伴物を前記データベースから取得する、
    ステップをさらに有する、請求項10記載の方法。
  13. コンテンツを有する少なくとも一つの画像のシーケンスに、それとともに同時呈示するためのオーディオ随伴物を関連付ける装置であって:
    シーケンスを取り込み、前記少なくとも一つの画像の内容を記述するメタデータを取り込み、生成する、画像/メタデータ・取り込み/生成モジュールと;
    前記の関連付けられたメタデータを使ってオーディオ随伴物を求めてオーディオ随伴物データベースを検索する、オーディオ随伴物メタデータ検索/関連付けモジュールと;
    前記検索から帰結するオーディオ随伴物のプレイリストを提案する、オーディオ随伴物提案/再生モジュールと;
    前記オーディオ随伴物提案/再生モジュールが前記検索から帰結するオーディオ随伴物を再生しているときに前記シーケンスを同時表示する、画像シーケンス表示モジュールとを有する、
    装置。
  14. データベースをさらに有する請求項13記載の装置であって、
    前記画像/メタデータ・取り込み/生成モジュールおよび前記オーディオ随伴物メタデータ検索/関連付けモジュールがそれぞれさらに、前記シーケンス、メタデータおよび位置特定されたオーディオ随伴物を前記データベース中に保存するよう構成されており;
    前記オーディオ随伴物提案/再生モジュールおよび前記画像シーケンス表示モジュールがそれぞれさらに、シーケンスおよび関連付けられたメタデータを、その同時的な表示および再生のために前記データベースから取得するよう構成されている、
    装置。
  15. 前記画像/メタデータ・取り込み/生成モジュールがさらに、画像内容解析技法を使ってメタデータを生成するよう構成されている、請求項13記載の装置。
  16. 前記画像内容解析技法が、テキストの光学式文字認識、画像場面認識、画像オブジェクト認識よりなる群から選択される、請求項15記載の装置。
  17. 少なくとも一つのデジタル画像のシーケンスのオーディオ随伴のためのシステムであって:
    表示装置と;
    オーディオ随伴物再生装置と;
    前記表示装置および前記オーディオ再生装置に動作可能に接続された請求項16記載の装置(200)とを有しており、
    前記装置(200)が少なくとも一つの画像のシーケンスおよび第一の画像メタデータを受け容れ、内容解析技法を使って第二の画像メタデータを導出し、前記第一および第二のメタデータを使って適切なオーディオ随伴物を位置特定し、次いで前記シーケンスを表示している間に前記オーディオ随伴物を再生するか、結果のプレイリストをユーザーに提案するかの一つをする、
    システム。
JP2008540766A 2005-11-21 2006-11-15 デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法 Expired - Fee Related JP5457676B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US73849705P 2005-11-21 2005-11-21
US60/738,497 2005-11-21
PCT/IB2006/054281 WO2007057850A2 (en) 2005-11-21 2006-11-15 System and method for using content features and metadata of digital images to find related audio accompaniiment

Publications (2)

Publication Number Publication Date
JP2009516951A true JP2009516951A (ja) 2009-04-23
JP5457676B2 JP5457676B2 (ja) 2014-04-02

Family

ID=38049048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008540766A Expired - Fee Related JP5457676B2 (ja) 2005-11-21 2006-11-15 デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法

Country Status (7)

Country Link
US (1) US8171016B2 (ja)
EP (1) EP1958203A2 (ja)
JP (1) JP5457676B2 (ja)
KR (1) KR101329266B1 (ja)
CN (1) CN101313364B (ja)
RU (1) RU2444072C2 (ja)
WO (1) WO2007057850A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126042A1 (ja) * 2009-04-27 2010-11-04 シャープ株式会社 コンテンツ出力システム
JP2014500669A (ja) * 2010-11-25 2014-01-09 インスティテュート フューア ランドファンクテクニック ゲーエムベーハー 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ
JP2021516398A (ja) * 2018-08-14 2021-07-01 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音楽推薦方法、装置、コンピューティング機器及び媒体

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2235650A1 (en) * 2008-01-22 2010-10-06 Koninklijke Philips Electronics N.V. Method of suggesting accompaniment tracks for synchronised rendering with a content data item
US8261178B2 (en) * 2008-09-12 2012-09-04 Sony Corporation Audio data distribution system and method for generating a photo slideshow which automatically selects music
JP5316022B2 (ja) * 2009-01-26 2013-10-16 オンキヨー株式会社 画像ファイル及びオーディオファイルを同期再生するコンテンツ再生システム
JP4930564B2 (ja) * 2009-09-24 2012-05-16 カシオ計算機株式会社 画像表示装置及び方法並びにプログラム
CN101727943B (zh) * 2009-12-03 2012-10-17 无锡中星微电子有限公司 一种图像配乐的方法、图像配乐装置及图像播放装置
US8542982B2 (en) * 2009-12-22 2013-09-24 Sony Corporation Image/video data editing apparatus and method for generating image or video soundtracks
CN102256030A (zh) * 2010-05-20 2011-11-23 Tcl集团股份有限公司 可匹配背景音乐的相册演示系统及其背景音乐匹配方法
CN101859562B (zh) * 2010-07-01 2013-03-06 无锡骏聿科技有限公司 一种现有图像与卡拉ok旋律实时匹配的方法
CN102547298B (zh) * 2010-12-17 2014-09-10 中国移动通信集团公司 图像信息输出方法、装置及终端
US8856212B1 (en) 2011-02-08 2014-10-07 Google Inc. Web-based configurable pipeline for media processing
US8935259B2 (en) 2011-06-20 2015-01-13 Google Inc Text suggestions for images
CN102622386A (zh) * 2011-08-05 2012-08-01 北京小米科技有限责任公司 一种播放网页音乐的方法和系统
US20130086143A1 (en) * 2011-09-30 2013-04-04 Google Inc. Music On Video Site
US20140013193A1 (en) * 2012-06-29 2014-01-09 Joseph John Selinger Methods and systems for capturing information-enhanced images
KR20140038577A (ko) * 2012-09-11 2014-03-31 한국과학기술연구원 메타데이터를 이용한 콘텐츠 추천
US9171015B2 (en) 2012-09-14 2015-10-27 At&T Intellectual Property I, L.P. Sharing asserted media
KR20140037440A (ko) * 2012-09-18 2014-03-27 주식회사 엘지유플러스 영상의 피쳐 정보를 이용한 음악 재생 방법 및 장치
CA2895516A1 (en) * 2012-12-18 2014-06-26 Vadio, Inc. System and method for providing matched multimedia video content
US10353942B2 (en) * 2012-12-19 2019-07-16 Oath Inc. Method and system for storytelling on a computing device via user editing
JP2014135599A (ja) * 2013-01-09 2014-07-24 Sony Corp 情報処理装置、情報処理方法、並びに記録媒体
US9172740B1 (en) 2013-01-15 2015-10-27 Google Inc. Adjustable buffer remote access
US9311692B1 (en) 2013-01-25 2016-04-12 Google Inc. Scalable buffer remote access
US9225979B1 (en) 2013-01-30 2015-12-29 Google Inc. Remote access encoding
US9208382B2 (en) * 2013-03-08 2015-12-08 Trimble Navigation Limited Methods and systems for associating a keyphrase with an image
CN103475789B (zh) * 2013-08-26 2016-05-04 宇龙计算机通信科技(深圳)有限公司 一种移动终端及其控制方法
EP2879047A3 (en) * 2013-11-28 2015-12-16 LG Electronics Inc. Mobile terminal and controlling method thereof
US20150185599A1 (en) * 2013-12-31 2015-07-02 Brian Mullins Audio based on captured image data of visual content
CN103795897A (zh) * 2014-01-21 2014-05-14 深圳市中兴移动通信有限公司 自动生成背景音乐的方法和装置
RU2608873C2 (ru) * 2014-02-14 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Способ связывания метаданных цифрового контента с цифровым контентом (варианты), электронное устройство (варианты), машиночитаемый носитель (варианты)
US10049477B1 (en) 2014-06-27 2018-08-14 Google Llc Computer-assisted text and visual styling for images
CN104199876B (zh) * 2014-08-20 2018-03-02 广州三星通信技术研究有限公司 关联乐曲与图片的方法和装置
CN104615645A (zh) * 2014-12-18 2015-05-13 百度在线网络技术(北京)有限公司 搜索实现方法、装置、系统以及计算机设备
CN104615689A (zh) * 2015-01-22 2015-05-13 百度在线网络技术(北京)有限公司 一种搜索方法及装置
CN104573132B (zh) * 2015-02-13 2017-10-31 广东欧珀移动通信有限公司 歌曲查找方法及装置
US9875245B2 (en) * 2015-04-10 2018-01-23 Apple Inc. Content item recommendations based on content attribute sequence
CN105335455A (zh) * 2015-08-28 2016-02-17 广东小天才科技有限公司 一种阅读文字的方法及装置
CN105159988B (zh) * 2015-08-28 2018-08-21 广东小天才科技有限公司 一种浏览照片的方法及装置
KR102545768B1 (ko) 2015-11-11 2023-06-21 삼성전자주식회사 메타 데이터를 처리하기 위한 장치 및 방법
CN105912722B (zh) * 2016-05-04 2018-11-09 广州酷狗计算机科技有限公司 歌曲发送方法及装置
CN106055671B (zh) * 2016-06-03 2022-06-14 腾讯科技(深圳)有限公司 一种多媒体数据处理方法及其设备
US10140515B1 (en) * 2016-06-24 2018-11-27 A9.Com, Inc. Image recognition and classification techniques for selecting image and audio data
CN107038233A (zh) * 2017-04-14 2017-08-11 维沃移动通信有限公司 一种照片电影制作方法及移动终端
CN107025295A (zh) * 2017-04-14 2017-08-08 维沃移动通信有限公司 一种照片电影制作方法及移动终端
US11182424B2 (en) * 2018-05-08 2021-11-23 Spotify Ab Image based content search and recommendations
KR102579452B1 (ko) * 2018-09-05 2023-09-15 삼성전자주식회사 영상 표시 장치 및 그 동작방법
US11263493B2 (en) 2019-06-25 2022-03-01 Spotify Ab Automatic metadata detector based on images
US11544314B2 (en) 2019-06-27 2023-01-03 Spotify Ab Providing media based on image analysis
KR20230037329A (ko) 2021-09-09 2023-03-16 네이버 주식회사 이벤트 맞춤형 오디오 콘텐츠를 렌더링하기 위한 컴퓨터 시스템 및 그의 방법

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166028A (ja) * 1997-08-18 1999-03-09 Matsushita Electric Ind Co Ltd 異種メディア対の予測方法及びその装置
JP2000250944A (ja) * 1998-12-28 2000-09-14 Toshiba Corp 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法
JP2001184357A (ja) * 1999-12-24 2001-07-06 Victor Co Of Japan Ltd マルチメディア素材検索装置
JP2001202082A (ja) * 2000-01-17 2001-07-27 Matsushita Electric Ind Co Ltd 映像信号編集装置および方法
JP2002057975A (ja) * 2000-08-11 2002-02-22 Noritsu Koki Co Ltd 撮影画像記録装置
JP2003259303A (ja) * 2002-02-27 2003-09-12 Konica Corp 動画データ生成システム、動画データ生成方法及び動画データ生成プログラム並びに情報記録媒体
JP2004297424A (ja) * 2003-03-27 2004-10-21 Fuji Photo Film Co Ltd デジタルカメラ
WO2004114657A1 (ja) * 2003-06-17 2004-12-29 Pioneer Corporation 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、情報記録プログラム、情報再生プログラム、情報記録再生プログラム、並びに制御信号を含むデータ構造
US20050158037A1 (en) * 2004-01-15 2005-07-21 Ichiro Okabayashi Still image producing apparatus
US20050160067A1 (en) * 2003-12-25 2005-07-21 Canon Kabushiki Kaisha Information input apparatus, information input method, control program, and storage medium
JP2006065002A (ja) * 2004-08-26 2006-03-09 Kenwood Corp コンテンツ再生装置及び方法
JP2007005985A (ja) * 2005-06-22 2007-01-11 Casio Comput Co Ltd 撮像装置、プログラム、情報端末及び情報通信システム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6404925B1 (en) * 1999-03-11 2002-06-11 Fuji Xerox Co., Ltd. Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition
US6629104B1 (en) * 2000-11-22 2003-09-30 Eastman Kodak Company Method for adding personalized metadata to a collection of digital images
US6993532B1 (en) * 2001-05-30 2006-01-31 Microsoft Corporation Auto playlist generator
US20030065503A1 (en) * 2001-09-28 2003-04-03 Philips Electronics North America Corp. Multi-lingual transcription system
FR2830714B1 (fr) 2001-10-04 2004-01-16 Eastman Kodak Co Procede automatique d'enrichissement d'image numerique
US8285111B2 (en) 2002-04-19 2012-10-09 Tivo Inc. Method and apparatus for creating an enhanced photo digital video disc
EP1568219A2 (en) * 2002-11-08 2005-08-31 Koninklijke Philips Electronics N.V. Recommender and method of providing a recommendation of content therefor
US20040095379A1 (en) 2002-11-15 2004-05-20 Chirico Chang Method of creating background music for slideshow-type presentation
EP1422668B1 (en) * 2002-11-25 2017-07-26 Panasonic Intellectual Property Management Co., Ltd. Short film generation/reproduction apparatus and method thereof
US20040122539A1 (en) * 2002-12-20 2004-06-24 Ainsworth Heather C. Synchronization of music and images in a digital multimedia device system
KR20040080736A (ko) * 2003-03-13 2004-09-20 삼성전자주식회사 인터랙티브 컨텐츠 동기화 장치 및 방법
JP2007502035A (ja) 2003-07-29 2007-02-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ デジタル写真のエンリッチフォトのビューイングエクスペリエンス
US7546288B2 (en) * 2003-09-04 2009-06-09 Microsoft Corporation Matching media file metadata to standardized metadata
US20050057578A1 (en) 2003-09-16 2005-03-17 Shan-Jang Chen Digital photo frame
GB2412804A (en) * 2004-03-30 2005-10-05 Nokia Corp Recording images with associated context information
KR100601677B1 (ko) * 2004-05-17 2006-07-14 삼성전자주식회사 저장 매체에 기록된 데이터와 다운로드된 데이터를 함께재생하는 재생 방법 및 그 재생 장치
WO2007004139A2 (en) 2005-06-30 2007-01-11 Koninklijke Philips Electronics N.V. Method of associating an audio file with an electronic image file, system for associating an audio file with an electronic image file, and camera for making an electronic image file

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166028A (ja) * 1997-08-18 1999-03-09 Matsushita Electric Ind Co Ltd 異種メディア対の予測方法及びその装置
JP2000250944A (ja) * 1998-12-28 2000-09-14 Toshiba Corp 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法
JP2001184357A (ja) * 1999-12-24 2001-07-06 Victor Co Of Japan Ltd マルチメディア素材検索装置
JP2001202082A (ja) * 2000-01-17 2001-07-27 Matsushita Electric Ind Co Ltd 映像信号編集装置および方法
JP2002057975A (ja) * 2000-08-11 2002-02-22 Noritsu Koki Co Ltd 撮影画像記録装置
JP2003259303A (ja) * 2002-02-27 2003-09-12 Konica Corp 動画データ生成システム、動画データ生成方法及び動画データ生成プログラム並びに情報記録媒体
JP2004297424A (ja) * 2003-03-27 2004-10-21 Fuji Photo Film Co Ltd デジタルカメラ
WO2004114657A1 (ja) * 2003-06-17 2004-12-29 Pioneer Corporation 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、情報記録プログラム、情報再生プログラム、情報記録再生プログラム、並びに制御信号を含むデータ構造
US20050160067A1 (en) * 2003-12-25 2005-07-21 Canon Kabushiki Kaisha Information input apparatus, information input method, control program, and storage medium
US20050158037A1 (en) * 2004-01-15 2005-07-21 Ichiro Okabayashi Still image producing apparatus
JP2006065002A (ja) * 2004-08-26 2006-03-09 Kenwood Corp コンテンツ再生装置及び方法
JP2007005985A (ja) * 2005-06-22 2007-01-11 Casio Comput Co Ltd 撮像装置、プログラム、情報端末及び情報通信システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126042A1 (ja) * 2009-04-27 2010-11-04 シャープ株式会社 コンテンツ出力システム
JP2010257266A (ja) * 2009-04-27 2010-11-11 Sharp Corp コンテンツ出力システム、サーバー装置、コンテンツ出力装置、コンテンツ出力方法、コンテンツ出力プログラム、及びコンテンツ出力プログラムを記憶した記録媒体
JP2014500669A (ja) * 2010-11-25 2014-01-09 インスティテュート フューア ランドファンクテクニック ゲーエムベーハー 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ
JP2021516398A (ja) * 2018-08-14 2021-07-01 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音楽推薦方法、装置、コンピューティング機器及び媒体
US11314806B2 (en) 2018-08-14 2022-04-26 Tencent Technology (Shenzhen) Company Limited Method for making music recommendations and related computing device, and medium thereof
JP7206288B2 (ja) 2018-08-14 2023-01-17 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音楽推薦方法、装置、コンピューティング機器及び媒体

Also Published As

Publication number Publication date
WO2007057850A2 (en) 2007-05-24
US8171016B2 (en) 2012-05-01
JP5457676B2 (ja) 2014-04-02
RU2444072C2 (ru) 2012-02-27
KR20080085848A (ko) 2008-09-24
WO2007057850A3 (en) 2007-11-01
CN101313364A (zh) 2008-11-26
KR101329266B1 (ko) 2013-11-14
EP1958203A2 (en) 2008-08-20
CN101313364B (zh) 2011-12-21
US20080256100A1 (en) 2008-10-16
RU2008125058A (ru) 2009-12-27

Similar Documents

Publication Publication Date Title
JP5457676B2 (ja) デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法
CN110249387B (zh) 用于创建伴随视觉影像的音频轨的方法
JP5998807B2 (ja) 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム
US9524349B2 (en) Identifying particular images from a collection
US10089392B2 (en) Automatically selecting thematically representative music
JP5520585B2 (ja) 情報処理装置
US8868585B2 (en) Contents replay apparatus and contents replay method
US20020184196A1 (en) System and method for combining voice annotation and recognition search criteria with traditional search criteria into metadata
US20090307207A1 (en) Creation of a multi-media presentation
US8145034B2 (en) Contents replay apparatus and contents replay method
KR20080043129A (ko) 음악의 무드를 이용한 사진 추천 방법 및 그 시스템
US20090287649A1 (en) Method and apparatus for providing content playlist
US10122983B1 (en) Creating a video for an audio file
JP4064902B2 (ja) メタ情報生成方法、メタ情報生成装置、検索方法および検索装置
Cai et al. Automated music video generation using web image resource
JP6206534B2 (ja) 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム
US20180267971A1 (en) Multimedia playing method and system for moving vehicle
JP2007079867A (ja) 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム
Browne Video retrieval using objects and ostensive relevance feedback

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130523

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140110

R150 Certificate of patent or registration of utility model

Ref document number: 5457676

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees