JP2011164865A - 画像選定装置、画像選定方法および画像選定プログラム - Google Patents

画像選定装置、画像選定方法および画像選定プログラム Download PDF

Info

Publication number
JP2011164865A
JP2011164865A JP2010025933A JP2010025933A JP2011164865A JP 2011164865 A JP2011164865 A JP 2011164865A JP 2010025933 A JP2010025933 A JP 2010025933A JP 2010025933 A JP2010025933 A JP 2010025933A JP 2011164865 A JP2011164865 A JP 2011164865A
Authority
JP
Japan
Prior art keywords
image
content
phrase
selecting
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010025933A
Other languages
English (en)
Other versions
JP5474591B2 (ja
Inventor
Hiromi Ishisaki
広海 石先
Keiichiro Hoashi
啓一郎 帆足
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010025933A priority Critical patent/JP5474591B2/ja
Publication of JP2011164865A publication Critical patent/JP2011164865A/ja
Application granted granted Critical
Publication of JP5474591B2 publication Critical patent/JP5474591B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる画像選定装置、画像選定方法および画像選定プログラムを提供する。
【解決手段】コンテンツに関連する画像を選定する画像選定装置であって、特定のコンテンツから1または複数のキーワードを抽出するキーワード抽出部132と、ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出するタグ抽出部133と、抽出されたキーワードと取得されたタグとの語句の関連度を算出する語句関連度算出部134と、算出された語句の関連度を用いてコンテンツと関連の高い画像を選定する選定部143とを備える。
【選択図】図2

Description

本発明は、コンテンツに関連する画像を選定する画像選定装置、画像選定方法および画像選定プログラムに関する。
従来、画像表示に合せてBGM等の楽曲を再生する装置が知られている。たとえば特許文献1記載の情報再生装置は、デジタルカメラで撮影した画像のスライドショー再生時に、その再生する画像の撮影時期に見合うBGMを再生することで映像鑑賞効果を高めている。画像を主体として、音楽を検索して自動でBGMを付与させる方法を採用し、曲の発売日、または、曲の人気ランキングの最高となった期間などの日付と、撮影時期をマッチングさせて音楽を検索している。
特許文献2記載の音楽配信サーバは、楽曲を再生させる際に、データベースに記憶されている楽曲を選択し、該当楽曲に同期させて表示させるべき歌詞・解説・画像などの項目を指定する。そして、該当楽曲と、該当楽曲のヘッダに同期再生のための時間間隔を書き込んで端末に送信し、楽曲とその他情報を同期させて再生させている。
特許文献3記載の携帯情報端末は、楽曲再生時に、音声認識によって歌詞を抽出し、その抽出された歌詞から所定のルールに基づいてキーワードを抽出し、キーワードに基づいて、ローカルストレージやインターネット上のWebページから画像を検索し、楽曲再生時に画像を表示させている。
所定のルールとは、たとえば、ある設定期間内の歌詞単語の中で最も多く使用された単語を抽出キーワードとするようなルールや、ある設定期間内の歌詞単語の中で最も大きく発声された単語を抽出キーワードとするようなルール、ある設定期間内の複数の単語の中からランダムに選択した単語をキーワードとするようなルールである。
インターネット上のウェブページを検索先として画像検索を行う場合、キーワードを用いてインターネット上の検索エンジンなどを用いて画像を検索する。また、上記インターネット上のウェブページを検索先とする場合、好ましくない画像が検索されるのを防ぐためのフィルタリング処理、あるいは、たとえば所望のジャンル等の画像のみが検索されるようなフィルタリング処理を行うことも可能にしている。
なお、フィルタリング処理は、上記インターネットを経由して画像検索を行う際だけでなく、たとえば、上記キーワード抽出部にてキーワードを抽出する際に行っても良いとしている。その結果、上記キーワード抽出部では、好ましくない画像が検索されてしまう可能性が高いキーワードを抽出しないようなフィルタリング処理や、逆に、たとえば所望のジャンル等の画像が検索される可能性が高いキーワードのみを抽出するようなフィルタリング処理も可能にしている。
特許文献4記載の画像提示装置は、楽曲から歌詞を抽出し、抽出された歌詞の出現時間を特定し、あらかじめ複数の視覚効果と視覚効果の表示に要する時間情報を対応させておき、抽出された歌詞に基づいて視覚効果を決定し、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付与している。
視覚効果データベースは、単語と視覚効果とを対応づけて保持している。視覚効果は、抽出された歌詞中の単語が視覚効果データベースに存在するか探索し、もし単語が存在した場合には、その単語に対応する視覚効果とその視覚効果の所要時間とを視覚効果データベースから取得している。
また、楽曲の再生に同期させてWeb画像を表示させるシステムや歌詞の印象に基づく楽曲検索のための楽曲自動分類技術について研究開発がなされている(たとえば非特許文献1〜5)。
特開2006−164229号公報 特開2002−73049号公報 特開2008−8954号公報 特開2006−154626号公報
舟澤慎太郎、石先広海、帆足啓一郎、滝嶋康弘、甲藤二郎、「歌詞特徴を考慮したWeb画像と楽曲同期再生システムの提案」、第8回情報科学技術フォーラム、2009、E-034 D. A. Shamma, B. Pardo, and K. J. Hammond, "Music Story: a Personalized Music Video Creator, Proceedings of the 13th Annual ACM International Conference on Multimedia", 2005, pp.563-566 R. Cai, L. Zhang, F. Jing, W. Lai, and W. -Y. Ma, "Automated Music Video Generation Using Web" "Image Resource, Proceedings of IEEE International Conference on Acoustic, Speech, and Signal Processing", 2007, 2, pp.737-740. 舟澤慎太郎、石先広海、帆足啓一郎、滝嶋康弘、甲藤二郎、歌詞の印象に基づく楽曲検索のための楽曲自動分類に関する検討、第71回情報処理学会全国大会、2009、5R-2.
上記のように、楽曲等に合せてWeb上の画像を利用する技術は存在するが、基本的に利用する画像はユーザが選択しなければならない。そして、ユーザ自身がWeb画像から画像を選び、コンテンツに付与しようとすれば、その作業に膨大な労力を要し、たとえばスライドショーなどを生成する際の画像選択の労力には膨大な作業が必要となる。また、従来技術を利用した場合には共有サイトのランキングに基づいて画像を選定する場合には、必ずしもコンテンツに適した画像を選定できていない。
本発明は、このような事情に鑑みてなされたものであり、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる画像選定装置、画像選定方法および画像選定プログラムを提供することを目的とする。
(1)上記の目的を達成するため、本発明の画像選定装置は、コンテンツに関連する画像を選定する画像選定装置であって、特定のコンテンツから1または複数のキーワードを抽出するキーワード抽出部と、ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出するタグ抽出部と、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する語句関連度算出部と、前記算出された語句の関連度を用いて前記コンテンツと適合度の高い画像を選定する選定部とを備えることを特徴としている。
このように、コンテンツに関するキーワードと画像に付与されたタグとの語句の関連度を用いて、画像を選定するため、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。
(2)また、本発明の画像選定装置は、前記キーワード抽出部は、特定の楽曲から1または複数のキーワードを抽出することを特徴としている。これにより、楽曲に適した画像を選定することができ、楽曲再生時の画像表示に利用することができる。
(3)また、本発明の画像選定装置は、前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と前記取得されたタグのうちの1語句との共起確率を用いて前記語句の関連度を算出することを特徴としている。このように共起確率を利用することで、画像選定に適した語句の関連度を算出できる。
(4)また、本発明の画像選定装置は、前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記語句の関連度を算出することを特徴徴としている。このように同じカテゴリの別の語句の寄与を差し引くことで、キーワードとタグの関連度を正確に評価することができ、画像選定に適した語句の関連度を算出できる。
(5)また、本発明の画像選定方法は、コンテンツに関連する画像を選定する画像選定方法であって、特定のコンテンツから1または複数のキーワードを抽出するステップと、ネットワーク上で取得可能な画像に付与された1または複数のタグを取得するステップと、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出するステップと、前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定するステップとを含むことを特徴としている。これにより、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。
(6)また、本発明の画像選定プログラムは、コンテンツに関連する画像を選定させる画像選定プログラムであって、特定のコンテンツから1または複数のキーワードを抽出する処理と、ネットワーク上で取得可能な画像に付与された1または複数のタグを取得する処理と、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する処理と、前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定する処理とをコンピュータに実行させることを特徴としている。これにより、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。
本発明によれば、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる。
第1の実施形態に係る画像選定装置の構成を示すブロック図である。 モジュールの構成を示すブロック図である。 第1の実施形態に係る画像選定装置の動作の一例を示すフローチャートである。 語句関連度算出の動作を示すフローチャートである。 画像選定の動作を示すフローチャートである。 語句関連度辞書の一例を示すテーブルである。 関連タグと語句関連度の抽出結果の一例を示すテーブルである。 第2の実施形態に係る画像選定装置の構成を示すブロック図である。 モジュールの構成を示すブロック図である。
以下に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。
[第1の実施形態]
(画像選定装置の構成)
図1は、画像選定装置の構成を示すブロック図である。画像選定装置100は、ユーザUが指定する楽曲等のコンテンツに関連する画像を選定する。コンテンツには、楽曲以外にもブログや、映像が含まれる。画像選定装置100には、たとえばPCまたは携帯電話機が用いられる。図1に示すように、画像選定装置100は、リクエスト受付部111、データベース112、画像検索モジュール120、語句関連度辞書生成モジュール130、画像選定モジュール140、画像管理部151、表示時間管理モジュール160、再生制御部171、再生部172、歌詞表示部173および画像表示部174を備えている。
リクエスト受付部111は、ユーザUによる楽曲や画像のリクエストの入力を受け付ける。データベース112は、コンテンツ及び、コンテンツに対するキーワードを格納する。たとえば、コンテンツを楽曲とすると、楽曲の音源、歌詞情報、楽曲と歌詞の同期情報などを格納する。また、該当コンテンツに対するキーワードを格納し、たとえば、コンテンツを表現するキーワードを印象情報として格納する。
たとえば、「季節」のカテゴリに、「春」、「夏」、「秋」、「冬」の印象情報を格納する。「時間帯」のカテゴリに、「朝」、「昼」、「夕方」、「夜」の印象情報を格納してもよい。また、「天候」のカテゴリに、「晴れ」、「曇り」、「雨」、「雪」、「虹」の印象情報を格納してもよい。
画像検索モジュール120は、たとえばコンテンツを楽曲とすると、ユーザにより入力された楽曲の歌詞情報をもとに、スライドショーを構成する候補となる画像(以下、候補画像)をWebから検索する。具体的には、歌詞に出現する名詞と、キーワードとして歌詞全体の印象を表現する単語を用いて最適なクエリを選定する。そして、そのクエリでWeb画像検索を行い、歌詞の各行に対して最大1500枚程度の候補画像を取得する。なお、Web上で公開されている日本語形態素解析エンジンを用いて歌詞情報から名詞抽出を行うことができる。また、検索対象となる画像データベースとして、Flickr(登録商標)等の画像共有サイト400を用い、画像データに付与されているソーシャルタグをもとに画像検索を行うことができる。
語句関連度辞書生成モジュール130は、コンテンツに付与されたキーワードに基づいて、キーワードと候補画像のタグとの語句の関連度を計算する。また、計算された語句の関連度を辞書として保管する。
画像選定モジュール140は、画像検索モジュール120によって得られた画像群から、コンテンツに付与されたキーワードに適した画像を選定する。各候補画像に対して、コンテンツの全体印象語との適合度を表現するscoreを算出し、その値が最も高い画像を選定することで、候補画像の中から最終的に用いる画像を選択する。
たとえば、適合度のscoreは、画像に付与されているすべてのソーシャルタグと全体印象語との関連強さをもとに算出する。これにより、全体印象語が直接タグとして付与されていない画像でも、”全体印象語らしさ”を表現することができる。そして、それをもとに画像を選定することで、スライドショー全体の統一感を生み出すことができる。また、楽曲に付与されている全体印象語の組み合わせによりscore算出の指標が変化するため、別々の楽曲に同じ画像が選定されるケースが少なくなり、より多様性のあるスライドショーを作成できる。
語句関連度辞書生成モジュール130および画像選定モジュール140の詳細は、後述する。画像管理部151は、楽曲の各管理区分と選定された画像とを対応付けて管理する。画像管理部151は、再生時に楽曲の各区分と画像との対応により、各区分の歌詞表示に対応させて画像を表示することができる。
表示時間管理モジュール160は、スライドショーにおいて、各画像を表示する時間を適切にするために、画像切り替えタイミングの再構成を行う。その際には、ネットワーク上の楽曲データベース500や歌詞データベース600を利用する。
単純に歌詞の行単位で歌詞とともに表示する画像を切り替えると、その歌詞の行の長さに画像の表示時間が依存し、適切な表示時間とならない事態が生じる。これを防止するため、画像の内容を十分に把握できるように表示時間を十分にとり、退屈感を生じさせない程度に表示時間を短くする。すなわち、表示時間の短い行は周辺の行と結合し、結合した区間では1枚の画像を表示し続け、一方表示時間の長い行は分割を行い、1行の中でも複数の画像を表示する。さらに、楽曲の画像表示時間の最頻値を基準に、間奏区間における画像切り替えタイミングも設定する。
再生制御部171は、歌詞データベース600と通信し、楽曲の再生とそれに同期させた歌詞表示および画像表示を制御する。再生部172は、スピーカやヘッドホン等の出力装置を介して楽曲の音声を再生する。歌詞表示部173は、楽曲の再生に合せて画面上に歌詞を表示する。画像表示部174は、楽曲の再生に合せて、算出された画像表示時間にわたり選定された画像を表示する。画像表示部174は、連続する行に対応する歌詞表示時間同士の間隔が所定時間を超える場合には、間隔に対応する画像を表示してもよい。
図2は、モジュールの構成を示すブロック図である。図2に示すように、語句関連度辞書生成モジュール130は、カテゴリ抽出部131、キーワード抽出部132、タグ抽出部133、語句関連度算出部134を備えている。
カテゴリ抽出部131は、ユーザUにより指定されたコンテンツ(特定のコンテンツ)から関連するカテゴリを抽出する。キーワード抽出部132は、カテゴリから1または複数のキーワードを抽出する。すなわち、コンテンツが楽曲である場合には、その楽曲の歌詞や全体の印象語から1または複数のキーワードを抽出する。このようにして、楽曲のキーワードを画像のタグとの語句関連度の算出に利用し、画像選定に利用する。なお、カテゴリはユーザにより手動で付与してもよいし、上記のように何らかのプログラムによりコンテンツから抽出してもよい。
タグ抽出部133は、ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出する。画像共有サイト400を利用することで、多数の画像および画像に付与されたタグを抽出できる。
語句関連度算出部134は、コンテンツから抽出されたキーワードと画像から抽出されたタグとの語句の関連度を算出する。このように、コンテンツに付与されたカテゴリ情報を利用し、コンテンツに関するキーワードと画像に付与されたタグとの語句の関連度を用いて、コンテンツに適合した画像を選定する。その結果、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる。なお、スライドショーや、ブログ、などマルチメディアコンテンツに対して画像を付与する場合にも利用できる。
語句関連度算出部134は、抽出されたキーワードのうちの1語句と取得されたタグのうちの1語句との共起確率を用いて語句の関連度を算出する。このように共起確率を利用することで、画像選定に適した語句の関連度を適正かつ容易に算出できる。
その際には、抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、取得されたタグのうちの語句との共起確率分の寄与を差し引いて語句の関連度を算出してもよい。このように同じカテゴリの別の語句の寄与を差し引くことで、キーワードとタグの語句関連度を正確に評価することができ、画像選定に適した語句の関連度を算出できる。
また、画像選定モジュール140は、タグ取得部141、画像適合度算出部142および選定部143を備えている。タグ取得部141は、候補として抽出された画像から画像に付与されたタグを取得する。
画像適合度算出部142は、ユーザUにより指定されたコンテンツ(特定のコンテンツ)と候補画像との適合度を算出する。このとき、画像に付与されたタグとコンテンツに関連するキーワードとの関連度を累積的に加算することが好ましく、これにより妥当な関連度を算出することができる。具体例は後述する。
選定部143は、算出された語句の適合度の高い画像を選定する。コンテンツのキーワードと画像のタグとの語句の適合度を用いて画像を選定する。これにより、楽曲に適した画像を選定することができ、楽曲再生時の画像表示に利用することができる。
(画像選定装置の動作)
次に、画像選定装置100の動作を説明する。図3は、画像選定装置の動作の一例を示すフローチャートである。まず、ユーザUによるコンテンツの指定を受け付け(ステップS1)、キーワードの指定を受け付ける(ステップS2)。
次に、ネットワーク上で画像検索を行う(ステップS3)。検索結果に応じてキーワードとタグとの語句関連度を算出し(ステップS4)、算出された語句の関連度に応じて画像を選定する(ステップS5)。そして、選定された画像や歌詞の表示時間を決定し(ステップS6)、楽曲を再生し、再生に伴い歌詞および画像を表示して(ステップS7)終了する。以下に、各処理の詳細を説明する。
(語句関連度算出)
語句関連度算出の動作を説明する。図4は、語句関連度算出の動作を示すフローチャートである。図4に示すように、まず、指定した楽曲からカテゴリ情報を抽出する(ステップT1)。楽曲から得られたカテゴリに関連するキーワードを抽出する(ステップT2)。
次に、Web上で検索された候補画像に付与されているタグ群を抽出し(ステップT3)、抽出されたタグ群からタグを抽出する(ステップT4)。そして、抽出された各タグについてユーザ数が閾値以上か否かを判定する(ステップT5)。ユーザ数が閾値未満である場合には、ステップT4に戻る。ユーザ数が閾値以上である場合には、そのタグと楽曲のキーワードとの語句の関連度を算出する(ステップT6)。
関連度の算出後、すべてのタグについて判定が終了したか否かを判定する(ステップT7)。すべてのタグについて判定が終了していない場合には、ステップT4に戻る。すべてのタグについて判定が終了した場合には、すべてのキーワードについて処理が終了したか否かを判定する(ステップT8)。すべてのキーワードについて処理が終了していない場合にはステップT2に戻る。
すべてのキーワードについて処理が終了した場合には、すべてのカテゴリについて処理が終了したか否かを判定する(ステップT9)。すべてのカテゴリについて処理が終了していない場合にはステップT1に戻る。すべてのカテゴリについて処理が終了した場合には、カテゴリ毎の語句関連度辞書を作成する(ステップT10)。カテゴリ毎の語句関連度辞書の例については後述する。
(画像選定の動作)
次に、画像選定の動作を説明する。図5は、画像選定の動作を示すフローチャートである。まず、ユーザによる入力画像を取得する(ステップP1)。そして、画像におけるタグ集合を取得する(ステップP2)。
次に、入力画像について画像の適合度としてscoreを算出する(ステップP3)。そして、すべての画像について処理が終了したか否かを判定する(ステップP4)。すべての画像について処理が終了していないときにはステップP1に戻る。すべての画像について処理が終了したときには、画像の適合度のランキングを算出する(ステップP5)。そして、ランキングに基づいて画像を選定する(ステップP6)。
(画像選定の具体例)
以下に、画像選定処理の具体例を説明する。まず、カテゴリやキーワード等の数式による定義について説明する。コンテンツに付与されるキーワードのカテゴリCxの集合Wは次の数式で表すことができる。Ncはカテゴリの数である。
Figure 2011164865
また、カテゴリCxは次の数式で表すことができる。Nxはカテゴリに属するキーワードの数である。
Figure 2011164865
一方、画像に付与されるタグ集合は、次の数式で表すことができる。NTwyはキーワードwyによって検索されたタグの数であり、NTiはコンテンツiに付与されているタグの総数である。
Figure 2011164865
また、ユーザ集合は、以下の数式で表すことができる。NUwyはキーワードwyによって検索された画像の投稿ユーザ数である。
Figure 2011164865
このような定義のもとで画像選定の処理を行う。まず、あるキーワードwyを抽出し、キーワードに基づいて、Web検索などの結果からタグ集合Twy及び、ユーザ集合Uwyを計算する。次に、タグ群Twyに存在する全てのタグに足して、該当タグを付与したユーザ数UFを計算する。UFに対しては、たとえば閾値THを設定することでノイズを削減することもできる。たとえばTH=5とすることができる。
その後、タグ集合Twyの各要素に対してwyとの語句の関連度Rを計算する。語句の関連度Rは以下のような式で計算することができる。Pは共起確率である。共起確率とは、キーワードとタグが一つの同じ画像に付与されている確率であり、キーワードとタグの関連の強さを表す指標として利用することができる。UF(t|wy)は、wyによって検索された画像のうちtというタグを持つ画像を投稿したユーザ数である。また、UF(wy)は、wyによって検索された画像を投稿したユーザ数である。Weightは、重み係数であり、任意に設定することができる。
Figure 2011164865

Figure 2011164865
式(6)はキーワードとタグとの関連の強さを示す語句の関連度Rを表現しており、式(5)などの共起確率をもとに算出することができる。最終的にキーワード毎に語句の関連度Rの高いタグを関連タグ集合と定義し、それをもとに各キーワードに対する語句の関連度Rおよび重要語を辞書として保持することができる。たとえば、キーワードが“春”の場合、“春”は“季節”という概念の印象語であるため、Cx={“春”、“夏”、“秋”、“冬”}を保持できる。
図6は、語句関連度辞書の一例を示すテーブルである。図6では、各カテゴリCx={w1、w2、w3、w4}の語句と、各カテゴリに関連する各画像のタグとの語句の関連度Rが対応している。t_w1_1は、画像1に付与され、w1のカテゴリに属するタグである。R(t_w1_1|w1)は、キーワードw1と画像1に付与され、w1のカテゴリに属するタグt_w1_1との語句の関連度Rである。
このように定義した語句の関連度Rを、それぞれの全体印象語と共起するUF(t)≧THを満たすタグtを対象に算出し、たとえば語句の関連度Rが0.024以上のタグを関連タグとして判定することができる。
図7は、関連タグと語句の関連度の抽出結果の一例を示すテーブルである。図7では、“春”、“夏”、“朝”、“雨”に対しての関連語(tag)と語句関連度(value)を示しており、語句関連度の高い順にソートしてある。
共起確率はFlickr(登録商標)におけるUF(User Frequency)をもとに算出することができ、UF(W)とは、単語集合Wの要素全てをクエリとしてAND検索した際の、検索結果におけるユニークな画像投稿者数を示す。単純に画像ヒット数ではなくUFを用いるのは、Flickr(登録商標)では一定のユーザが同一のタグを付与した画像を大量にアップロードすることで、画像ヒット数が不当に高い値になることがあるため、その影響を緩和するためである。
そして、キーワードwyに対するタグtの語句の関連度Rは、それらの共起確率Pから、wyと同じカテゴリに属する他のキーワードにおけるタグtとの共起確率Pの差分により算出することができる。キーワードとタグ間の共起確率だけでなく、同じカテゴリに属する他のキーワードPにおける共起確率Pも考慮することで、1つのキーワードに対してのみ共起確率の高いタグを重要視することができる。
次に、画像検索モジュール120によって得られた画像群の中から画像Iiを抽出する。次に、Iiにおけるタグ集合Tiを取得し、式(7)などにより、コンテンツに付与されたキーワードと、画像のタグ情報からスコアを計算することができる。式(7)において関連辞書生成モジュールによって得られた関連辞書を利用することや、利用しなくとも画像の適合度としてscoreを計算することができる。
Figure 2011164865
たとえば、画像の適合度のscoreとして、式(7)を利用することで、キーワードとの語句関連度が高く、かつ、ノイズタグが少ない画像を選定することができる。たとえば、コンテンツを楽曲とした場合、楽曲におけるキーワードとの関連の強いタグが多く付与されている画像ほど、大きい値をとるように設定することができる。このscoreに基づいて画像をランキング表示することや、ランキング上位Nまでの画像を自動で選定することができる。
[第2の実施形態]
上記の実施形態では、語句関連度辞書を画像選定が必要なときに動的に作成するが、事前に作成しておき、画像選定時に利用してもよい。図8は、語句関連度辞書を事前に作成する画像選定装置200の構成を示すブロック図である。図9は、モジュールの構成を示すブロック図である。画像選定装置200では、語句関連度辞書生成モジュール130を事前に機能させ、その後、画像選定モジュール140により、画像選定を行う。ただし、各部の機能は、実施形態1と同様なので省略する。
100 画像選定装置
111 リクエスト受付部
112 データベース
120 画像検索モジュール
130 語句関連度辞書生成モジュール
131 カテゴリ抽出部
132 キーワード抽出部
133 タグ抽出部
134 語句関連度算出部
140 画像選定モジュール
141 タグ取得部
142 画像適合度算出部
143 選定部
151 画像管理部
160 表示時間管理モジュール
171 再生制御部
172 再生部
173 歌詞表示部
174 画像表示部
200 画像選定装置
400 画像共有サイト
500 楽曲データベース
600 歌詞データベース
U ユーザ

Claims (6)

  1. コンテンツに関連する画像を選定する画像選定装置であって、
    特定のコンテンツから1または複数のキーワードを抽出するキーワード抽出部と、
    ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出するタグ抽出部と、
    前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する語句関連度算出部と、
    前記算出された語句の関連度を用いて前記コンテンツと適合度の高い画像を選定する選定部とを備えることを特徴とする画像選定装置。
  2. 前記キーワード抽出部は、特定の楽曲から1または複数のキーワードを抽出することを特徴とする請求項1記載の画像選定装置。
  3. 前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と前記取得されたタグのうちの1語句との共起確率を用いて前記語句の関連度を算出することを特徴とする請求項1または請求項2記載の画像選定装置。
  4. 前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記語句の関連度を算出することを特徴とする請求項1から請求項3のいずれかに記載の画像選定装置。
  5. コンテンツに関連する画像を選定する画像選定方法であって、
    特定のコンテンツから1または複数のキーワードを抽出するステップと、
    ネットワーク上で取得可能な画像に付与された1または複数のタグを取得するステップと、
    前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出するステップと、
    前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定するステップとを含むことを特徴とする画像選定方法。
  6. コンテンツに関連する画像を選定させる画像選定プログラムであって、
    特定のコンテンツから1または複数のキーワードを抽出する処理と、
    ネットワーク上で取得可能な画像に付与された1または複数のタグを取得する処理と、
    前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する処理と、
    前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定する処理とをコンピュータに実行させることを特徴とする画像選定プログラム。
JP2010025933A 2010-02-08 2010-02-08 画像選定装置、画像選定方法および画像選定プログラム Expired - Fee Related JP5474591B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010025933A JP5474591B2 (ja) 2010-02-08 2010-02-08 画像選定装置、画像選定方法および画像選定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010025933A JP5474591B2 (ja) 2010-02-08 2010-02-08 画像選定装置、画像選定方法および画像選定プログラム

Publications (2)

Publication Number Publication Date
JP2011164865A true JP2011164865A (ja) 2011-08-25
JP5474591B2 JP5474591B2 (ja) 2014-04-16

Family

ID=44595484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010025933A Expired - Fee Related JP5474591B2 (ja) 2010-02-08 2010-02-08 画像選定装置、画像選定方法および画像選定プログラム

Country Status (1)

Country Link
JP (1) JP5474591B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015197553A (ja) * 2014-03-31 2015-11-09 株式会社エクシング 通信端末装置、サーバ装置、プログラム、データ提供方法及びカラオケシステム
JP2017157192A (ja) * 2016-03-01 2017-09-07 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
CN115983199A (zh) * 2023-03-16 2023-04-18 山东天成书业有限公司 一种移动数字出版系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728823A (ja) * 1993-07-09 1995-01-31 Matsushita Electric Ind Co Ltd 共起語抽出方法およびその装置
JPH09288681A (ja) * 1996-04-23 1997-11-04 Toshiba Corp 背景映像検索表示装置および背景映像検索方法
JP2006228059A (ja) * 2005-02-18 2006-08-31 Tokyo Institute Of Technology ポインタの位置情報を利用するプレゼンテーションコンテンツ検索システムおよびその方法、ならびにコンピュータ読み取り可能な記録媒体
JP2006244002A (ja) * 2005-03-02 2006-09-14 Sony Corp コンテンツ再生装置およびコンテンツ再生方法
JP2007172173A (ja) * 2005-12-20 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728823A (ja) * 1993-07-09 1995-01-31 Matsushita Electric Ind Co Ltd 共起語抽出方法およびその装置
JPH09288681A (ja) * 1996-04-23 1997-11-04 Toshiba Corp 背景映像検索表示装置および背景映像検索方法
JP2006228059A (ja) * 2005-02-18 2006-08-31 Tokyo Institute Of Technology ポインタの位置情報を利用するプレゼンテーションコンテンツ検索システムおよびその方法、ならびにコンピュータ読み取り可能な記録媒体
JP2006244002A (ja) * 2005-03-02 2006-09-14 Sony Corp コンテンツ再生装置およびコンテンツ再生方法
JP2007172173A (ja) * 2005-12-20 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015197553A (ja) * 2014-03-31 2015-11-09 株式会社エクシング 通信端末装置、サーバ装置、プログラム、データ提供方法及びカラオケシステム
JP2017157192A (ja) * 2016-03-01 2017-09-07 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
CN115983199A (zh) * 2023-03-16 2023-04-18 山东天成书业有限公司 一种移动数字出版系统及方法

Also Published As

Publication number Publication date
JP5474591B2 (ja) 2014-04-16

Similar Documents

Publication Publication Date Title
US11055342B2 (en) System and method for rich media annotation
CN105120304B (zh) 信息显示方法、装置及系统
US7818329B2 (en) Method and apparatus for automatic multimedia narrative enrichment
US8156114B2 (en) System and method for searching and analyzing media content
JP5306114B2 (ja) クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム
US9472209B2 (en) Deep tagging background noises
CN105224581B (zh) 在播放音乐时呈现图片的方法和装置
JP6337183B1 (ja) テキスト抽出装置、コメント投稿装置、コメント投稿支援装置、再生端末および文脈ベクトル計算装置
US10104356B2 (en) Scenario generation system, scenario generation method and scenario generation program
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
KR102340963B1 (ko) Ai 기반의 영상 제작 방법 및 장치
US10114891B2 (en) Method and system of audio retrieval and source separation
JP5474591B2 (ja) 画像選定装置、画像選定方法および画像選定プログラム
KR102252522B1 (ko) 내용 기반 동영상 목차 자동생성 방법 및 시스템
CN113407775B (zh) 视频搜索方法、装置及电子设备
JP2019008779A (ja) テキスト抽出装置、コメント投稿装置、コメント投稿支援装置、再生端末および文脈ベクトル計算装置
WO2007029207A2 (en) Method, device and system for providing search results
US20210225408A1 (en) Content Pushing Method for Display Device, Pushing Device and Display Device
CN111767259A (zh) 内容分享的方法、装置、可读介质和电子设备
KR20210136609A (ko) 영상 뉴스 콘텐츠 생성 장치 및 방법
JP2007293602A (ja) 映像検索システム、映像検索方法およびプログラム
TWI780333B (zh) 動態處理並播放多媒體內容的方法及多媒體播放裝置
KR101575819B1 (ko) 동영상 검색 및 제공 방법
JP2009048334A (ja) 映像識別処理装置、画像識別処理装置、およびコンピュータプログラム
JP6621437B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120828

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140205

R150 Certificate of patent or registration of utility model

Ref document number: 5474591

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees