JP2011076366A - コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム - Google Patents

コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム Download PDF

Info

Publication number
JP2011076366A
JP2011076366A JP2009227121A JP2009227121A JP2011076366A JP 2011076366 A JP2011076366 A JP 2011076366A JP 2009227121 A JP2009227121 A JP 2009227121A JP 2009227121 A JP2009227121 A JP 2009227121A JP 2011076366 A JP2011076366 A JP 2011076366A
Authority
JP
Japan
Prior art keywords
content
tag
tag information
image
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009227121A
Other languages
English (en)
Other versions
JP5292247B2 (ja
Inventor
Keiichiro Hoashi
啓一郎 帆足
Toshihiro Ono
智弘 小野
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009227121A priority Critical patent/JP5292247B2/ja
Publication of JP2011076366A publication Critical patent/JP2011076366A/ja
Application granted granted Critical
Publication of JP5292247B2 publication Critical patent/JP5292247B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】画像や音楽などの情報(コンテンツ)にタグ情報を付与する場合に、効率的にタグを収集するとともに、収集されるタグも多岐にわたることが可能なコンテンツタグ収集方法を得る。
【解決手段】検索対象コンテンツに対するタグ情報を複数のユーザから収集するタグ情報収集方法において、共通するタグが付与されたコンテンツを複数個選択し、前記複数のコンテンツを前記共通するタグとともに各ユーザに示し、一方のユーザに前記検索対象コンテンツを明示的に示した上で、該検索対象コンテンツに関連するタグ情報を入力させるとともに、他方のユーザに入力された前記タグ情報を提示し、検索対象コンテンツを選択させる処理を行うことで前記タグ情報を前記検索対象コンテンツのタグ情報とする。
【選択図】図1

Description

本発明は、商品・広告等の画像や音楽などの情報(コンテンツ)を直観的なキーワードで検索する場合に、所望のコンテンツの検索を実現するため画像や音楽などのコンテンツに付与されるタグを収集するコンテンツタグ収集方法、コンテンツタグ収集用プログラム及びコンテンツタグ収集システム、並びに、この技術を用いて収集されたタグ情報を基に画像や音楽などのコンテンツを検索するコンテンツ検索システムに関する。
ユーザがWeb上で商品・広告等の画像や音楽などの情報(コンテンツ)を検索する場合、キーワードを入力することで各コンテンツ内容との照合により検索が行われる。コンテンツが画像である場合、画像解析技術により画像の特徴(色、テクスチャなど)を解析し、画像を検索するためのキーワード情報を各コンテンツ内容として抽出することが行われている。
このような画像解析技術は数多く開発され、例えば、非特許文献1には、画像の特徴を利用した画像の検索技術が多数紹介されている。
こうした既存研究の多くでは、学習データ(カテゴリ名称が付与された画像データ)に基づき、各画像の分類対象となるカテゴリごとに、分類器を構築する手法が主流となっている。
画像検索に際して、画像に既に付与されている関連情報(メタ情報)を活用する技術も存在する。特許文献1の「画像データに応じた情報検索」によれば、画像に付与されている位置情報に基づいて地図検索を行い、その結果(当該位置近傍の建物などの名称)を当該画像のメタ情報として付与する手法(メタ情報活用方式)が提案されている。この手法により、例えば「建物の名称」を検索クエリとして、画像検索を行うことができる。
また、特許文献2の「画像検索システム、画像検索プログラムおよびサーバ装置」によれば、インターネット上で公開されている位置情報付画像を解析した結果を利用し、ユーザが撮影した画像の対象物を推測し、その推測結果に基づく画像検索・整理技術が提案されている。この手法においても、画像に付与されている位置情報が利用されている。
上述した画像解析技術を実現するためには、大量の学習データが必要となるが、人手で良質な学習データを集めることは困難である。そこで、Web上で公開されている画像に付与されているタグ情報を利用して、画像検索システムや画像分類器を構築する手法(ソーシャルタグ方式)が近年増加している。
具体的には、非特許文献2に示されるFlickrなど、Web上の画像共有サイトにおいて、公開されている画像ならびにタグ情報を利用し、たとえば「リンゴ」「風景」などといったタグが付与されている画像を収集することができる。更に、これらのキーワードに基づいて得られた画像群を、学習データとして活用する例が数多く見られる。
また、画像に対し効率的に精度の高いタグ情報を収集するための仕組みとして、非特許文献3及び非特許文献4に示される"Games with a Purpose"(以下、「GWAPアプリ」と称する)という手法が提案されている。
このGWAPアプリは、ランダムに選ばれた2人1組のユーザ(プレイヤー)に対し、共通の画像を提示し、提示された画像から想起されるキーワードを各プレイヤーが入力し、両プレイヤーが入力したキーワードが1つでも一致すれば、当該画像を「クリア」として次の画像を表示するゲーム形式のアプリケーションである。
特開2006−285526 特願2009−153452
A. W. M. Smeulders, et al.: Content-based image retrieval at the end of the early years, IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp. 1349-1380, 2000. http://flickr.com/ L. von Ahn,: "Games with a purpose", IEEE Computer, 39(6), 92-94, 2006. L. von Ahn, L. Dabbish: "Labeling images with a computer game", Proc. of the SIGCHI conference on human factors in computing systems, pp. 319-326, 2004.
メタ情報を使用してWeb上で商品・広告等の画像や音楽などの情報(コンテンツ)を検索する場合、入力されたキーワードと各コンテンツに付与されているタグ情報とを比較することで検索が行われる。この場合、的確な検索が行われるためには、ユーザが入力する可能性が高いタグ情報がコンテンツ側に付与されていることが必要となる。
上述した画像解析技術では、画像の特徴から推測できる対象物は限られ、また、推測対象物ごとに大量の学習データを収集する必要があるため、広範な検索を実現することが難しい。
メタ情報活用方式の場合、画像に付与されているメタ情報が上記の例で示した位置情報や撮影時刻の情報が限られているため、検索のキーワードと成り得る情報の抽出についても、例えば場所に対応づけられるランドマーク名称などに限定されてしまう。そのため、これらの方式では、汎用的な検索キーワードを利用した画像検索を実現することは困難である。
ソーシャルタグ方式の場合、画像コンテンツを公開したユーザ、もしくはその画像を閲覧したユーザが自由にタグを付与するため、同じ情報を表わすタグであっても、表記ゆれなどにより、その画像を検索したいと考えているユーザが入力した検索キーワードとの間で齟齬が発生し、所望の画像が検索されにくいという問題点がある。また、そもそも付与されるタグ情報が誤っている場合、当該画像コンテンツが検索できないという問題点を有している。
上述したGWAPアプリでは、個々のユーザが画像に対してタグ情報を付与する前述のソーシャルタグ形式と異なり、組まされたパートナーとの合意が必要となるため、誤ったタグ情報が付与されにくいという利点がある。すなわち、タグを付与する際に、アプリケーションにおけるパートナーとの合意を必要とするため、上記のソーシャルタグ方式と比べると、タグの正確性は高い。
その一方、合意を必要とするゆえ、画像に対して付与されるタグ情報が極端に偏るという傾向がある。例えば、示された画像の色を表わすキーワードは、容易に合意が得られやすいため、GWAPアプリのプレイヤーが頻繁に入力しがちなキーワードであるが、同アプリに習熟していくにつれ、色情報のみをキーワードとして入力して、パートナーがそのキーワードを入力するまで待機するプレイヤーが増える傾向がみられる。
その結果、検索対象画像コンテンツに、実質、色情報を表わすタグのみが付与される傾向に陥ってしまい、そのタグ情報を利用した検索システムの利便性が下がるという問題点がある。
これらの問題を解決するための手段として、頻繁に入力されるキーワードを自動的に抽出し、NGワード(当該画像に対し、入力が禁じられるキーワード)として指定する手法が提案されている。しかしながら、この手法を単純に適用しただけでは、次の偏重キーワードが導出されるだけの効果しか得られない。したがって、発散したタグ情報の収集という目的を果たすには非効率的である。
本発明は上記事情に鑑みて提案されたもので、画像や音楽などの情報(コンテンツ)にタグ情報を付与する場合に、効率的にタグを収集するとともに、収集されるタグも多岐にわたることが可能なコンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム、及び、この技術を用いて収集されたタグ情報を基に直観的な検索キーワードに基づく画像検索等のコンテンツ検索の実現を可能とするコンテンツ検索システムを提供することを目的とする。
上記目的を達成するため本発明のコンテンツタグ収集方法(請求項1)は、検索対象コンテンツに対するタグ情報を複数のユーザから収集するタグ情報収集方法において、共通するタグが付与されたコンテンツを複数個選択し、前記複数のコンテンツを前記共通するタグとともに各ユーザに示し、
一方のユーザに前記検索対象コンテンツを明示的に示した上で、該検索対象コンテンツに関連するタグ情報を入力させるとともに、
他方のユーザに入力された前記タグ情報を提示し、検索対象コンテンツを選択させる処理を行うことで前記タグ情報を前記検索対象コンテンツのタグ情報とする
ことを特徴としている。
請求項2は、請求項1のコンテンツタグ収集方法において、前記コンテンツは画像であることを特徴としている。
請求項3は、請求項1のコンテンツタグ収集方法において、タグ情報の収集処理はネットワーク経由で行うことを特徴としている。
請求項4は、請求項1乃至請求項3のいずれか1項に記載のコンテンツタグ収集方法をコンピュータに実行させるためのコンテンツタグ収集用プログラムであることを特徴としている。
本発明のコンテンツタグ収集システム(請求項5)は、検索対象コンテンツに対するタグ情報を複数のユーザから収集するコンテンツタグ収集システムにおいて、
タグを付与するための複数のコンテンツが格納されたコンテンツデータベースと、
前記各コンテンツにタグを付与する初期タグ情報収集手段と、
前記各コンテンツに付与されたタグを格納するタグデータベースと、
前記初期タグ情報収集手段により付与されたタグ情報を分析し共通するタグが付与されているコンテンツ群を前記コンテンツデータベースから抽出する共通タグ情報抽出手段と、
前記共通タグ情報抽出手段により抽出された前記共通するタグが付与されたコンテンツ群を対象に、一方のユーザには前記コンテンツ群を示した上で、前記コンテンツ群の中の1つのタグ付与対象コンテンツに関連するタグ情報を入力させ、他方のユーザには入力されたタグ情報を前記コンテンツ群及び共通するタグ情報とともに提示し、前記タグ付与対象コンテンツを選択させることで新たなタグ情報を得る拡張タグ情報収集手段と
を具備することを特徴としている。
請求項6は、請求項5のコンテンツタグ収集システムにおいて、前記コンテンツは画像であることを特徴としている。
本発明のコンテンツ検索システム(請求項7)は、検索対象コンテンツに対するタグ情報を複数のユーザから収集し、前記タグ情報を基にコンテンツを検索するコンテンツ検索システムにおいて、
タグを付与するための複数のコンテンツが格納されたコンテンツデータベースと、
前記各コンテンツにタグを付与する初期タグ情報収集手段と、
前記各コンテンツに付与されたタグを格納するタグデータベースと、
前記初期タグ情報収集手段により付与されたタグ情報を分析し共通するタグが付与されているコンテンツ群を前記コンテンツデータベースから抽出する共通タグ付与コンテンツ抽出手段と、
前記共通タグ付与コンテンツ抽出手段により抽出された前記共通するタグが付与されたコンテンツ群を対象に、一方のユーザには前記コンテンツ群を示した上で、前記コンテンツ群の中の1つのタグ付与対象コンテンツに関連するタグ情報を入力させ、他方のユーザには入力されたタグ情報を前記コンテンツ群及び共通するタグ情報とともに提示し、前記タグ付与対象コンテンツを選択させることで新たなタグ情報を得る拡張タグ情報収集手段と、
前記初期タグ情報収集手段及び拡張タグ情報収集手段により収集された各コンテンツのタグ情報を検索キーとしてユーザが入力するキーワードとの照合によりコンテンツを検索するコンテンツ検索手段と
を具備することを特徴としている。
請求項8は、請求項7のコンテンツ検索システムにおいて、前記コンテンツ検索手段は、前記初期タグ情報収集手段によりタグ情報が付与されていないコンテンツが存在する場合に、タグが付与されていないコンテンツに対して、タグが付与されているコンテンツとの類似性を判断し、タグを類推して検索のためのキーワードを自動的に付与して検索対象コンテンツに含める機能を有することを特徴としている。
請求項9は、請求項7又は請求項8のコンテンツ検索システムにおいて、前記コンテンツは画像であることを特徴としている。
本発明によれば、一方のユーザに検索対象コンテンツを明示的に示した上で、該検索対象コンテンツに関連するタグ情報を入力させるとともに、他方のユーザに入力された前記タグ情報を提示し、検索対象コンテンツを選択させる処理を行うことでタグ情報を収集するので、従来型のGWAPアプリと同様に、Web上に公開されたアプリケーションにより多数のユーザからコンテンツのタグ情報を効率的に収集することができる。
また、共通するタグが付与されたコンテンツを複数個選択した上で、新たなタグ情報を拡張して収集するので、多岐にわたるタグを収集することができる。
また、拡張して収集されたタグ情報を基にコンテンツを検索することで、直観的な検索キーワードに基づくコンテンツ検索の実現を可能とすることができる。
本発明の画像タグ収集システム(コンテンツタグ収集システム)の実施の一例を示すブロック図である。 本発明の画像タグ収集システムにおける初期タグ情報収集モジュールで行われるGWAP形式により各ユーザに表示される画面を示す説明図である 本発明の画像タグ収集システムにおける共通タグ付与画像抽出モジュールで行われる画像抽出処理を示すフローチャート図である。 (a)及び(b)は、本発明の画像タグ収集システムにおける拡張タグ情報収集モジュールで行われる画像タグ収集処理で各ユーザに表示される各画面の説明図である。 本発明の画像検索システム(コンテンツ検索システム)の実施の一例を示すブロック図である。
本発明のコンテンツタグ収集システムの実施の形態の一例について、図面を参照しながら説明する。
図1に示したコンテンツタグ収集システムは、複数のユーザ端末1からの操作によりネットワーク2を介して接続された画像タグ収集装置8により、画像に対してタグ情報を収集し、画像に対して付与するものである。
各ユーザ端末1は、入力部、表示部、記憶部、中央演算処理部等を備えた一般的なPCにより構成されている。
画像タグ収集装置8は、例えばネットワーク2に接続されたサーバ内に構築されている。サーバは、基本プログラムや各種の基本デバイスが記憶されたROMと、各種のプログラムションやデータが記憶されるハードディスクドライブ装置(HDD)と、CR-ROMやDVD等の記憶媒体からプログラムやデータを読み出すメディアドライブ装置と、プログラムを実行するCPUと、このCPUにワークエリアを提供するRAMなどを備えて構成され、画像タグ収集用プログラム(コンテンツタグ収集用プログラム)がメディアドライブ装置で読み取られてHDDに予め記憶されることで、画像タグ収集のための各種処理が実行される。
すなわち、画像タグ収集装置8は、タグ付与の対象となる画像データに初期タグを付与する初期タグ情報収集モジュール11と、共通の初期タグが付与された複数画像の抽出を行う共通タグ付与画像抽出モジュール12と、初期タグが付与された画像にさらに別のタグ(拡張タグ)を付与する拡張タグ情報収集モジュール13と、タグ付与の対象となる画像データを格納した画像データベース14と、画像データベース14内の画像に対して付与されるタグ情報を格納したタグデータベース15を有して構成されている。
初期タグ情報収集モジュール11は、画像データベース14からタグを付与する対象となる画像を順次取り込み、インターネット上の各ユーザ端末1に提示し、GWAPアプリ形式で当該画像に対するタグ情報を収集するモジュールである。
共通タグ付与画像抽出モジュール12は、初期タグ情報収集モジュール11によって得られた個々の画像に対して付与されているタグ情報を分析し、偏って付与されているタグ、ならびに、共通のタグが付与されている画像群を、画像データベース14から抽出する処理を行うモジュールである。
拡張タグ情報収集モジュール13は、共通タグ付与画像抽出モジュール12によって抽出された、共通のタグ情報が付与された画像群を対象に、後述の方法により、拡張タグ情報を収集する処理を行うモジュールである。
次に、画像タグ収集装置8により画像に対するタグ情報を収集する手順について、図2〜図4を参照しながら説明する。
初期タグ情報収集モジュール11において適用するGWAPアプリの画面構成例を図2に示す。図2は、GWAPアプリのプレイヤーとなる2人1組のユーザのうちの一方のユーザに示される画面20の例を示している。中央の画像21は、双方のユーザの画面に表示されており、各ユーザは、この画像21から想起されるキーワードを、画像21の下のフォーム23から入力する。画像右側(「入力済ワード」)には、本画面を見ているユーザが入力したキーワードの一覧表22が示されている。
一方のユーザの一覧表22に表示されたキーワードのいずれかが、他方のユーザ(パートナー)が入力したキーワードと一致した場合、この画像は「クリア」となり、次の画像が示される…という流れのゲームである。そして、各画像に対し、両ユーザが入力したキーワードは、当該画像21に対するタグ情報として、全てタグデータベース15に格納される。
この基本的なGWAPアプリを用いることにより、画像データベース14内の格納された各画像に対する「初期タグ」は収集できる。しかしながら、初期タグ情報収集モジュール11だけでキーワードを収集した場合、入力されるタグ情報に偏りが生じる場合が多い(図2のスニーカ―の画像が黄色である場合、色に関連するキーワード(この例の場合、「黄色」)が入力されることが多い)。
本発明の画像タグ収集装置8では、初期タグ情報収集モジュール11に加えて、共通タグ付与画像抽出モジュール12及び拡張タグ情報収集モジュール13を設けることで、画像データベース14内の各画像に対してさらに別のタグ(拡張タグ)を付与することが行われる。
すなわち、共通タグ付与画像抽出モジュール12では、初期タグ情報収集モジュール11により各画像について一定数以上のタグ情報が付与された画像の中から、特に付与されているタグ情報が偏っている複数画像を抽出する処理を行う。共通タグ付与画像抽出モジュール12における処理について、図3を参照しながら説明する。
先ず、画像データベース14に格納されている全ての画像を対象に、画像に付与されているタグの集合を数1で表し(ステップ31)、タグtiが画像iに付与されている件数を|ti,j|と表す。
次に、画像iに付与されているタグの中で、|ti, j|が最大のタグの出現確率を、スコア値として数2により算出する(ステップ32)。
全タグについてスコア値を算出し(ステップ33)、スコア値が最大となるタグを抽出する(ステップ34)。
数2で算出された出現確率が、予め定められた閾値(tmax)以上であるかどうかを判断し(ステップ35)、閾値以上である画像とタグの組合せを共通タグ付与対象画像候補として抽出する(ステップ36)。
全画像について上述の処理が行われた場合に(ステップ37)、処理を終了する。
拡張タグ情報収集モジュール13では、上記の処理の結果、抽出された画像群の中から、共通のタグが付与されている画像を複数個選択する。そして、2人1組のユーザに、選択された複数画像を提示して、一方のユーザ(以下、「タグ付与ユーザ」)にはタグ付与対象の画像を1つ示した上で、その画像を表すタグを入力してもらう。他方のユーザ(以下、「画像選択ユーザ」)には、選択された複数の画像と、タグ付与ユーザが入力したキーワードを提示した上で、タグ付与ユーザがタグを付与している画像を選択させる形式で、拡張タグ情報を収集する。
図4(a)(b)に、拡張タグ情報収集モジュール13のアプリケーションでのタグ付与ユーザ向け及び画像選択ユーザ向けの具体的な画面構成の例を示す。
図4(a)はタグ付与ユーザ(プレーヤーA)に示される画面40であり、中央に示される4つの複数画像41は、例えば「シューズ」「黄色」という共通タグが高い確率で付与されている画像群の中から選択されている状況を示している。
そして、タグ付与ユーザは、システムによって矢印42で指示された画像(この例では左から2番目)に対して想起されるキーワードをキーワード入力窓45に入力する。ここで、共通のタグが付与されている複数の画像が示されていることにより、タグ付与ユーザは、共通のキーワードである「シューズ」「黄色」以外のキーワードで、かつ矢印42で指示された画像を特徴的に表すキーワードを入力する必要があることがわかる。この効果により、タグ付与対象画像に対する特徴的かつ拡張的なキーワードを収集することができる。
共通のキーワードである「シューズ」「黄色」は、入力できないNGワード43として表示されている。また、既にタグ付与ユーザにより入力されたキーワードは、入力済ワード44として表示される。
図4(b)に、画像選択ユーザ(プレーヤーB)に示される具体的な画面構成例を示す。
画面50では、図4(a)の画面40でタグ付与ユーザに提示されている複数画像41と同じ4つの画像を含む複数画像51が表示されている。ただし、例えばタグ付与ユーザが「一番右」といった画像自体とは無関係なキーワードを入力することを防ぐために、複数画像41に対して複数画像51の表示順は変更することが望ましい。そして、タグ付与ユーザが入力したキーワードが入力済ワード52(入力済ワード44と同じワード)として随時表示される。
画像選択ユーザは、ここで表示されるキーワードをヒントとして、タグ付与ユーザが着目している画像(タグの付与を行っている画像)について、画像下の各選択窓53をクリックすることで選択する。タグ付与ユーザが着目している画像が表示された入力済ワード52で解らない場合は、「パスする」と表示されたパス窓54をクリックすることで、タグ付与ユーザに対してキーワード入力窓45への新たなキーワードの入力を促す。
この際、でたらめに選択ボタンを押すなどの行為を防止するため、選択できる回数は1回とし、選択した画像が不正解の場合は、減点するなどのペナルティを与えた上で、次の画像群に移るなどのルールを採用する。
上記の各アプリケーションをWeb上に公開し、多数のユーザから画像のタグ情報を収集することにより、画像データベース14に格納されている各画像に対する多種多様なタグ情報を、効率的に収集することが可能になる。
次に上述の画像タグ収集装置を利用した画像検索装置9について、図5を参照しながら説明する。図中、図1と同じ構成をとる部分については同一符号を付して説明を省略する。
画像検索装置9では、画像タグ収集装置の構成に加えて、タグデータベース15とユーザ端末3との間に画像検索モジュール19を介在させている。
ユーザ端末3は、入力部、表示部、記憶部、中央演算処理部等を備えた一般的なPCにより構成されている。画像検索モジュール19に画像検索のアクセスするユーザ(ユーザ端末3)は、タグ情報収集モジュールを利用するユーザ(GWAPアプリにおける「プレイヤー」)とは異なるユーザであってもよい。
画像検索モジュール19は、初期タグ情報収集モジュール11及び拡張タグ情報収集モジュール13によって収集された、画像へのタグ情報を検索キーとして、ユーザ端末3から画像を検索するモジュールである。
画像検索モジュール19の画像検索処理では、上記の各処理によって集められたタグ情報を検索キーワードとして、画像データベース14内の各画像を検索する処理を行い、検索結果をユーザ端末3側に表示する。
具体的には、画像検索モジュール19にアクセスするユーザ端末3によって入力された任意のキーワードと、タグデータベース15内のキーワードとの照合による検索のほか、タグデータベース15に含まれるタグ情報のうち、入力数が上位のキーワードをメニュー形式でユーザ端末3に示すなどといった形態が望ましい。
画像検索モジュール19は、初期タグ情報収集モジュール11によりタグ情報が付与されていない画像が存在する場合に、タグが付与されていない画像に対して、タグが付与されている画像(タグ付与済画像)との類似性を判断し、タグを類推して検索のためのキーワードを自動的に付与して検索対象画像に含める機能を有するようにしてもよい。
検索のためのキーワードを自動的に付与するやり方としては、例えば、ある特定のキーワードが付与されやすい画像のジャンルが存在する場合、同ジャンルに属する他の画像にも同じキーワードを付与することで行う。また、特定のキーワードが付与されている画像に共通した視覚的特徴量(色情報など)が見られる場合、同様の特徴を有する画像に対し、同じキーワードを付与することで行う。
タグが付与されていない画像について、他の画像との比較において「同ジャンルに属するか否か」及び「共通した視覚的特徴量が存在するかどうか」は、各画像特徴量を算出して比較して類似性を判断する既存技術を適用することで実現することができる。
上述した画像タグ収集装置8及び画像検索装置9においては、説明を簡易化するため、タグ収集対象や検索対象コンテンツを画像に限定したが、画像以外のコンテンツ(例えば、動画や音楽など)へ適用することも可能である。
例えば、タグ収集装置を動画コンテンツに適用する場合、画面20の画像21、画面40の複数画像41及び画面50の複数画像51にそれぞれ動画が表示されるようにする。
また、タグ収集装置を音楽コンテンツに適用する場合は、画面20の画像21部分、画面40の複数画像41の各画像部分、画面50の複数画像51の各画像部分をクリックすることでユーザ端末1のスピーカ部より音源が再生されるようにする。
上述した画像タグ収集装置8によれば、従来型のGWAPアプリと同様に、Web上に公開されたアプリケーションにより多数のユーザから画像のタグ情報を収集するができるので、効率的にタグが収集できる。また、拡張タグ情報収集モジュール13によりタグの収集を拡張するため、収集されるタグも多岐にわたる効果が見込まれる。
その結果、この技術を用いて収集されたタグ情報を基に画像を検索する画像検索装置9を構成した場合に、従来技術では実現が困難な直観的な検索キーワードに基づく画像検索の実現が可能になる。
1…ユーザ端末、 2…ネットワーク、 3…ユーザ端末、 8…画像タグ収集装置(コンテンツタグ収集システム)、 9…画像検索装置(コンテンツ検索システム)、 11…初期タグ情報収集モジュール(初期タグ情報収集手段)、 12…共通タグ付与画像抽出モジュール(共通タグ付与コンテンツ抽出手段)、 13…拡散タグ情報収集モジュール(拡散タグ情報収集手段)、 14…画像データベース(コンテンツデータベース)、 15…タグデータベース、 19…画像検索モジュール。

Claims (9)

  1. 検索対象コンテンツに対するタグ情報を複数のユーザから収集するタグ情報収集方法において、
    共通するタグが付与されたコンテンツを複数個選択し、前記複数のコンテンツを前記共通するタグとともに各ユーザに示し、
    一方のユーザに前記検索対象コンテンツを明示的に示した上で、該検索対象コンテンツに関連するタグ情報を入力させるとともに、
    他方のユーザに入力された前記タグ情報を提示し、検索対象コンテンツを選択させる処理を行うことで前記タグ情報を前記検索対象コンテンツのタグ情報とする
    ことを特徴としたコンテンツタグ収集方法。
  2. 前記コンテンツは画像である請求項1に記載のコンテンツタグ収集方法。
  3. タグ情報の収集処理はネットワーク経由で行う請求項1に記載のコンテンツタグ収集方法。
  4. 請求項1乃至請求項3のいずれか1項に記載のコンテンツタグ収集方法をコンピュータに実行させるためのコンテンツタグ収集用プログラム。
  5. 検索対象コンテンツに対するタグ情報を複数のユーザから収集するコンテンツタグ収集システムにおいて、
    タグを付与するための複数のコンテンツが格納されたコンテンツデータベースと、
    前記各コンテンツにタグを付与する初期タグ情報収集手段と、
    前記各コンテンツに付与されたタグを格納するタグデータベースと、
    前記初期タグ情報収集手段により付与されたタグ情報を分析し共通するタグが付与されているコンテンツ群を前記コンテンツデータベースから抽出する共通タグ情報抽出手段と、
    前記共通タグ情報抽出手段により抽出された前記共通するタグが付与されたコンテンツ群を対象に、一方のユーザには前記コンテンツ群を示した上で、前記コンテンツ群の中の1つのタグ付与対象コンテンツに関連するタグ情報を入力させ、他方のユーザには入力されたタグ情報を前記コンテンツ群及び共通するタグ情報とともに提示し、前記タグ付与対象コンテンツを選択させることで新たなタグ情報を得る拡張タグ情報収集手段と
    を具備することを特徴とするコンテンツタグ収集システム。
  6. 前記コンテンツは画像である請求項5に記載のコンテンツタグ収集システム。
  7. 検索対象コンテンツに対するタグ情報を複数のユーザから収集し、前記タグ情報を基にコンテンツを検索するコンテンツ検索システムにおいて、
    タグを付与するための複数のコンテンツが格納されたコンテンツデータベースと、
    前記各コンテンツにタグを付与する初期タグ情報収集手段と、
    前記各コンテンツに付与されたタグを格納するタグデータベースと、
    前記初期タグ情報収集手段により付与されたタグ情報を分析し共通するタグが付与されているコンテンツ群を前記コンテンツデータベースから抽出する共通タグ付与コンテンツ抽出手段と、
    前記共通タグ付与コンテンツ抽出手段により抽出された前記共通するタグが付与されたコンテンツ群を対象に、一方のユーザには前記コンテンツ群を示した上で、前記コンテンツ群の中の1つのタグ付与対象コンテンツに関連するタグ情報を入力させ、他方のユーザには入力されたタグ情報を前記コンテンツ群及び共通するタグ情報とともに提示し、前記タグ付与対象コンテンツを選択させることで新たなタグ情報を得る拡張タグ情報収集手段と、
    前記初期タグ情報収集手段及び拡張タグ情報収集手段により収集された各コンテンツのタグ情報を検索キーとしてユーザが入力するキーワードとの照合によりコンテンツを検索するコンテンツ検索手段と
    を具備することを特徴とするコンテンツ検索システム。
  8. 前記コンテンツ検索手段は、前記初期タグ情報収集手段によりタグ情報が付与されていないコンテンツが存在する場合に、タグが付与されていないコンテンツに対して、タグが付与されているコンテンツとの類似性を判断し、タグを類推して検索のためのキーワードを自動的に付与して検索対象コンテンツに含める機能を有する請求項7に記載のコンテンツ検索システム。
  9. 前記コンテンツは画像である請求項7又は請求項8に記載のコンテンツ検索システム。
JP2009227121A 2009-09-30 2009-09-30 コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム Expired - Fee Related JP5292247B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009227121A JP5292247B2 (ja) 2009-09-30 2009-09-30 コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009227121A JP5292247B2 (ja) 2009-09-30 2009-09-30 コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム

Publications (2)

Publication Number Publication Date
JP2011076366A true JP2011076366A (ja) 2011-04-14
JP5292247B2 JP5292247B2 (ja) 2013-09-18

Family

ID=44020284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009227121A Expired - Fee Related JP5292247B2 (ja) 2009-09-30 2009-09-30 コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム

Country Status (1)

Country Link
JP (1) JP5292247B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226698A (ja) * 2011-04-22 2012-11-15 Canon Inc キーワード付与装置およびキーワード付与方法
JP2016062338A (ja) * 2014-09-18 2016-04-25 株式会社東芝 タグ付与装置、方法、及びプログラム
WO2016170627A1 (ja) * 2015-04-22 2016-10-27 日本電気株式会社 データ収集装置、ゲーム装置、データ収集システム、データ収集方法、及びコンピュータ読み取り可能な記録媒体
JP2020119472A (ja) * 2019-01-28 2020-08-06 ヤフー株式会社 付与装置、付与方法及び付与プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286768A (ja) * 2006-04-13 2007-11-01 Shigetoshi Fumiki 情報提供システム及び情報提供プログラム、並びにサーバ装置
JP2008171419A (ja) * 2007-01-10 2008-07-24 Fuji Xerox Co Ltd ディジタル画像にタグ付けするためのタグ付与装置、システム及びプログラム
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286768A (ja) * 2006-04-13 2007-11-01 Shigetoshi Fumiki 情報提供システム及び情報提供プログラム、並びにサーバ装置
JP2008171419A (ja) * 2007-01-10 2008-07-24 Fuji Xerox Co Ltd ディジタル画像にタグ付けするためのタグ付与装置、システム及びプログラム
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200800002002; 佐々木祥、外4名: 'Social Bookmarkにおけるコンテンツクラスタ間の類似度を用いたwebコンテンツ推薦システ' 情報処理学会論文誌 第48巻,第SIG20(TOD36)号, 20071215, p.14-27, 社団法人情報処理学会 *
CSNJ201010027229; 大向一輝、外3名: 'Community Webプラットフォームの実現に向けて' 2006年度人工知能学会全国大会(第20回)論文集[CD-ROM] , 20060609, p.1-3(3D4-06), 社団法人人工知能学会 *
JPN6013024872; 佐々木祥、外4名: 'Social Bookmarkにおけるコンテンツクラスタ間の類似度を用いたwebコンテンツ推薦システ' 情報処理学会論文誌 第48巻,第SIG20(TOD36)号, 20071215, p.14-27, 社団法人情報処理学会 *
JPN6013024873; 大向一輝、外3名: 'Community Webプラットフォームの実現に向けて' 2006年度人工知能学会全国大会(第20回)論文集[CD-ROM] , 20060609, p.1-3(3D4-06), 社団法人人工知能学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226698A (ja) * 2011-04-22 2012-11-15 Canon Inc キーワード付与装置およびキーワード付与方法
JP2016062338A (ja) * 2014-09-18 2016-04-25 株式会社東芝 タグ付与装置、方法、及びプログラム
WO2016170627A1 (ja) * 2015-04-22 2016-10-27 日本電気株式会社 データ収集装置、ゲーム装置、データ収集システム、データ収集方法、及びコンピュータ読み取り可能な記録媒体
US10537810B2 (en) 2015-04-22 2020-01-21 Nec Corporation Data collection device, game device, data collection system, data collection method, and computer-readable recording medium
JP2020119472A (ja) * 2019-01-28 2020-08-06 ヤフー株式会社 付与装置、付与方法及び付与プログラム
JP7018905B2 (ja) 2019-01-28 2022-02-14 ヤフー株式会社 付与装置、付与方法及び付与プログラム

Also Published As

Publication number Publication date
JP5292247B2 (ja) 2013-09-18

Similar Documents

Publication Publication Date Title
US10642892B2 (en) Video search method and apparatus
US9262527B2 (en) Optimized ontology based internet search systems and methods
JP5212610B2 (ja) 代表画像又は代表画像群の表示システム、その方法、およびそのプログラム並びに、代表画像又は代表画像群の選択システム、その方法およびそのプログラム
Lokoč et al. Is the reign of interactive search eternal? findings from the video browser showdown 2020
CN106951571B (zh) 一种给应用标注标签的方法和装置
Rudinac et al. Learning crowdsourced user preferences for visual summarization of image collections
CN111259173B (zh) 一种搜索信息推荐方法及装置
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
CN108959586A (zh) 响应于可视化查询标识文本词汇
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
CN111125314B (zh) 书籍查询页面的展示方法、电子设备及计算机存储介质
WO2010026900A1 (ja) 関係性発見装置、関係性発見方法および記録媒体
CN111435369B (zh) 音乐推荐方法、装置、终端及存储介质
JP5292247B2 (ja) コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム
Rosani et al. Eventmask: A game-based framework for event-saliency identification in images
JP6972935B2 (ja) 関連スコア算出システム、方法およびプログラム
JP2009500764A (ja) 情報価値を反映した情報検索方法及びその装置
CN113688260A (zh) 视频推荐方法和装置
JP2006004098A (ja) 評価情報生成装置、評価情報生成方法、及びプログラム
CN116777692A (zh) 基于数据分析的在线学习方法、装置、设备及存储介质
Qiu et al. Visual semantic complex network for web images
JP2014102625A (ja) 情報検索システム、プログラム、および方法
CN106776862B (zh) 一种游戏视频搜索方法及装置
CN115544369A (zh) 数据搜索方法、装置、计算机设备以及存储介质
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R150 Certificate of patent or registration of utility model

Ref document number: 5292247

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees