JP2009146261A - コンテンツ検索装置及び方法 - Google Patents

コンテンツ検索装置及び方法 Download PDF

Info

Publication number
JP2009146261A
JP2009146261A JP2007324499A JP2007324499A JP2009146261A JP 2009146261 A JP2009146261 A JP 2009146261A JP 2007324499 A JP2007324499 A JP 2007324499A JP 2007324499 A JP2007324499 A JP 2007324499A JP 2009146261 A JP2009146261 A JP 2009146261A
Authority
JP
Japan
Prior art keywords
search
content
relevance
keyword
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2007324499A
Other languages
English (en)
Inventor
Kentaro Miyamoto
健太郎 宮本
Yuko Matsui
優子 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2007324499A priority Critical patent/JP2009146261A/ja
Priority to US12/336,042 priority patent/US20090157670A1/en
Priority to CNA2008101861074A priority patent/CN101464883A/zh
Publication of JP2009146261A publication Critical patent/JP2009146261A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Abstract

【課題】時勢による影響を切り分け、時勢の影響を考慮した適切なコンテンツ検索を行うことを可能とする。
【解決手段】画像データベース(DB)36には、キーワードが付された画像(コンテンツ)が複数蓄積されている。キーワード間関連度算出部32は、画像DB36内の画像に付された各キーワード間の関連度を一定時間ごとに算出して時系列データを作成する。基本関連度算出部33は、クライアント端末から入力された検索キーワードと各画像に付されたキーワードとの間の各関連度の時系列データをそれぞれ平滑化し、各画像について基本関連度を算出する。CPU26は、算出された基本関連度に基づいて画像の検索結果を判定し出力する。総合関連度算出部34は、1つの画像に複数のキーワードが付されている場合に、検索キーワードと各キーワードとの間で算出される前記基本関連度を平均化し、各画像について総合関連度を算出する。
【選択図】図3

Description

本発明は、多数のコンテンツが蓄積されたデータベースから、入力されたキーワードに基づき、所望されるコンテンツを検索して出力するコンテンツ検索装置及び方法に関する。
近年、文章データ、画像データ、音楽データ等の様々なコンテンツを蓄積したデータベースがインターネットなどの通信ネットワークを介して公開されており、利用者は、通信ネットワークに接続されたパソコンや携帯端末を操作し、コンテンツをデータベースに登録したり、データベースから所望のコンテンツを検索して見つけ出したりすることが可能となっている。
データベースから所望のコンテンツを検索する手法としては、「キーワード検索」が一般的である。これは、所望するコンテンツに関連するキーワードを入力し、そのキーワードを含む(あるいは関連する)コンテンツを見つけ出すといった手法であり、データベース内のコンテンツをカテゴリーごとに分類するなどの管理が不要であるため、膨大な数のコンテンツを容易に管理し、利用することができる。
データベースに膨大な数のコンテンツが蓄積されている場合は、キーワードによっては検索によりヒットするコンテンツの数が多すぎ、利用者が所望するコンテンツを容易に見つけ出すことができないことがあるため、検索によりヒットしたコンテンツをさらに絞り込むことができるように、次々に段階的にキーワードを入力して絞り込みを行う、いわゆる絞り込み検索といった手法も知られている。
この絞り込み検索では、絞り込みを行うためのキーワードを利用者自らが考えて入力する必要があり、キーワードが適切でないと、絞り込みが不十分であったり、検索漏れが生じたりすることがある。そこで、過去のキーワードによる絞り込み履歴を記憶しておき、利用者が入力したキーワードに関連するキーワードを検索し、これを提示することで、利用者の検索を支援する技術が提案されている(例えば、特許文献1参照)。
特開2003−108594号公報
上記のような従来の検索技術では、検索結果は、他の利用者を含めた過去の検索履歴によって変化するため、時勢(検索時期)の影響を受けることになり、時勢の影響が強く反映されたコンテンツが数多くヒットする。例えば、夏に「富士山」というキーワードで検索を行うと「登山」に関連するコンテンツが数多くヒットするが、冬には「登山」に関連するコンテンツは殆どヒットしないということが考えられる。
このような検索技術は、時勢に沿ったコンテンツを得たい場合には特に問題はないが、しかしながら、時勢に依らないコンテンツ(上記の例では「富士山」の基本情報に関連するコンテンツ)を得たい場合には、時勢が反映された検索結果の影響により所望のコンテンツが得られないといった問題がある。
本発明は、上記の問題を鑑みてなされたものであり、時勢による影響を切り分け、時勢の影響を考慮した適切なコンテンツ検索を行うことを可能とするコンテンツ検索装置及び方法を提供することを目的とする。
上記目的を達成するために、本発明のコンテンツ検索装置は、キーワードが付されたコンテンツが複数蓄積されたデータベースから、検索キーワードに基づき検索を行うコンテンツ検索装置において、前記データベース内のコンテンツに付された各キーワード間の関連度を一定時間ごとに算出して時系列データを作成するキーワード間関連度算出手段と、前記検索キーワードと各コンテンツに付されたキーワードとの間の各関連度の時系列データをそれぞれ平滑化し、各コンテンツについて基本関連度を算出する基本関連度算出手段と、前記基本関連度に基づいてコンテンツの検索結果を判定する結果判定手段と、を備えたことを特徴とする。
なお、前記キーワード間関連度算出手段は、同一のコンテンツに付されたキーワード同士は関連性があるという観点から各キーワード間について前記関連度を算出することが好ましい。
また、前記基本関連度算出手段は、移動平均による平滑化処理を行うことが好ましい。
また、前記結果判定手段は、前記基本関連度が所定値より大きいコンテンツを検索結果として特定することが好ましい。
また、1つのコンテンツに複数のキーワードが付されている場合に、前記検索キーワードと各キーワードとの間で算出される前記基本関連度を平均化し、各コンテンツについて総合関連度を算出する総合関連度算出手段を備え、前記出力手段は、前記総合関連度に基づいてコンテンツの検索結果を出力することが好ましい。
また、前記検索キーワードが付されたコンテンツを前記データベースから抽出するコンテンツ抽出手段を備え、前記基本関連度算出手段は、前記コンテンツ抽出手段により抽出されたコンテンツを対象として前記基本関連度を算出することが好ましい。
また、コンテンツの指定により、そのコンテンツに付されたキーワードを検索キーワードとして入力する検索指示入力手段を備えたことが好ましい。
また、前記コンテンツは、画像であることが好ましい。
また、本発明のコンテンツ検索方法は、キーワードが付されたコンテンツが複数蓄積されたデータベースから、検索キーワードに基づき検索を行うコンテンツ検索方法において、前記データベース内のコンテンツに付された各キーワード間の関連度を一定時間ごとに算出して時系列データを作成するキーワード間関連度算出ステップと、前記検索キーワードと各コンテンツに付されたキーワードとの間の各関連度の時系列データをそれぞれ平滑化し、各コンテンツについて基本関連度を算出する基本関連度算出ステップと、前記基本関連度に基づいてコンテンツの検索結果を判定する結果判定ステップと、を備えたことが好ましい。
本発明のコンテンツ検索装置及び方法によれば、検索結果から時勢による影響を切り分けることが可能となり、利用者は、時勢の影響を考慮した適切なコンテンツ検索を行うことができる。
図1において、本発明の一実施形態に係わるコンテンツ検索装置は、CD−ROMなどの記録媒体に記録されたプログラムがインストールされることで、サーバ11内に構成されている。以下、コンテンツとして画像データ(以下、単に画像と称する)を用いる場合について説明する。
サーバ11は、通信ネットワーク12を介して接続されたクライアント端末13とともに、ネットワークシステム14を構成している。クライアント端末13は、周知のパソコン(パーソナルコンピュータ)からなり、各種操作画面を表示するモニタ15と、マウス16やキーボード17などからなる操作部18とを備えている。画像検索時のキーワード(検索キーワード)の入力は、キーボード17の操作により行われる。
クライアント端末13には、デジタルカメラ19で撮影して得られた画像や、メモリカードやCD−Rなどの記録媒体20に記録された画像が取り込まれる。これらの画像には、キーワードがタグとして付されている。画像へのキーワードの付与は、画像をクライアント端末13に取り込んだ後、操作部18の操作によりなされる。
デジタルカメラ19は、USB(Universal Serial Bus)などに準拠した通信ケーブルや、無線LANなどの無線回線によりクライアント端末13に接続され、クライアント端末13との間で相互にデータ通信を行うことが可能となっている。
クライアント端末13の機能ブロックを示す図2において、CPU21は、操作部18から入力される操作信号などに従ってクライアント端末13の全体を統括的に制御する。CPU21には、操作部18の他に、データバス22を介して、RAM23、ハードディスクドライブ(HDD)24、通信I/F25、モニタ15が接続されている。
RAM23は、CPU21が各種処理を実行するための作業用メモリである。HDD24は、クライアント端末13を動作させるための各種プログラムやデータの他に、デジタルカメラ19や記録媒体20から取り込まれた画像データを記憶する。CPU21は、HDD24からプログラムを読み出してRAM23に展開し、そのプログラムに基づいて処理を実行する。
通信I/F25は、通信ネットワーク12に適合した通信プロトコルの制御を行い、通信ネットワーク12を経由したデータの遣り取りを媒介する。また、通信I/F25は、デジタルカメラ19や記録媒体20などの外部機器とのデータ通信も媒介する。
サーバ11の機能ブロックを示す図3において、CPU26は、通信ネットワーク12を経由してクライアント端末13から入力される操作信号に従ってサーバ11の全体を統括的に制御する。CPU26には、データバス27を介して、RAM28、ハードディスクドライブ(HDD)29、通信I/F30、タイマー31、及び、キーワード間関連度算出部32、基本関連度算出部33、総合関連度算出部34からなる関連度算出部35が接続されている。
RAM28は、CPU26が処理を実行するための作業用メモリである。HDD29には、サーバ11を動作させるための各種プログラムやデータが記憶されている。CPU26は、HDD29からプログラムを読み出してRAM28に展開し、読み出したプログラムに基づいて処理を実行する。なお、関連度算出部35は、RAM28に格納されたプログラムにより構成された機能ブロックである。
通信I/F30は、通信ネットワーク12に適合した通信プロトコルの制御を行い、通信ネットワーク12を経由したデータの遣り取りを媒介する。通信I/F30を媒介して取得されたデータは、RAM28に一時的に記憶される。画像が取得された場合には、その画像は、HDD29内に格納される。
HDD29には、画像データベース(画像DB)36、及びキーワード情報管理部37が構成されている。画像DB36には、通信ネットワーク12を経由して得られた画像と、これに付されたキーワードとが関連付けされて蓄積されている。図4に示すように、画像とキーワードとは、データテーブルにより関連付けられている。なお、画像DB36内に蓄積された画像は、クライアント端末13からの要求により、キーワードの追加や削除が可能となっている。
図5は、画像DB36に蓄積された画像及びそれに付されたキーワードの一例である。画像P1は、富士山の撮影画像であり、「富士山」、「登山」、「火山」、「山中湖」の4個のキーワードKA1〜KA4が関連付けされている。
キーワード情報管理部37には、画像DB36に登録された各画像に付されたキーワード間の関連度合いを表す情報(キーワード間関連度)の時系列データが蓄積されている。このキーワード間関連度は、キーワード間関連度算出部32によって取得される。このキーワード間関連度算出部32は、各画像に付されたキーワードを参照し、同一の画像に付されているキーワード同士は関連性があるという観点から、各キーワード間について関連度を算出し、キーワード間の関連度を体系的にまとめた、いわゆるシソーラス(類語辞典)をキーワード情報管理部37内に構築する。
CPU26は、計時を行うタイマー31に基づき、定期的(例えば、1日ごと)にキーワード間関連度算出部32を動作させることにより上記シソーラスを定期的に更新(再構築)し、各キーワード間について、図6に示すような、関連度の時系列データD1を取得する(ここで、CPU26、タイマー31、及びキーワード間関連度算出部32は、特許請求の範囲に記載のキーワード間関連度算出手段として機能している)。時系列データD1は、時間tにおいて取得されたキーワード間関連度Rtを取得時間順に表したものである。キーワード間関連度Rtは、各キーワード間(例えば、「富士山」と「登山」)の関連度を表しており、関連度Rtが大きいということは、そのキーワードのペアが付された画像が画像DB36中に多く存在することを意味する。
また、CPU26は、クライアント端末13から画像検索の指示情報を受けたとき、画像DB36に蓄積された画像のうち、クライアント端末13から入力された検索キーワードが付された画像を検索し、抽出された各画像(抽出画像)を対象として、基本関連度算出部33及び総合関連度算出部34を動作させ、絞り込み検索を実行する(ここで、CPU26は、特許請求の範囲に記載のコンテンツ抽出手段として機能している)。基本関連度算出部33は、検索キーワードと抽出画像に付された他のキーワードとの間の各関連度Rtについて、その時系列データD1をフィルタリング処理(平滑化処理)し、図6に示すように、平滑化された時系列データD2として表される基本関連度Mtを算出する(基本関連度算出部33は、特許請求の範囲に記載の本関連度算出手段に対応する)。この基本関連度Mtとは、時勢による影響が減じられた基本的な関連度合いを表す。
具体的には、時間tにおける基本関連度Mtは、移動平均と呼ばれる手法を用い、時間tの直前の所定期間(例えば、30日)のキーワード間関連度Rtの平均値を算出することで得られる。時間t直前の所定期間Tの間に含まれるキーワード間関連度Rtの数及びその総和をそれぞれ“N”,“ΣRt”とすると、基本関連度Mt=ΣRt/Nと表される。以下、フィルタリング処理前の関連度Rtについては、その時点の時勢を反映したものであり、時勢による変化が大きいため、基本関連度に対比して「瞬間関連度」と称する。
総合関連度算出部34は、各抽出画像について、検索キーワードとその他の各キーワードとの間の基本関連度Mtまたは瞬間関連度Rtから、総合関連度Stを算出する(総合関連度算出部34は、特許請求の範囲に記載の総合関連度算出手段に対応する)。総合関連度Stを算出する際、基本関連度Mtと瞬間関連度Rtとの何れを用いるかは、検索実行時にクライアント端末13から指定可能となっている。各キーワードについての基本関連度Mt及び瞬間関連度Rtの平均値をそれぞれ“AMt”,“ARt”とすると、基本関連度Mtを用いる場合には総合関連度St=AMt、瞬間関連度Rtを用いる場合には総合関連度St=ARtとなる。
図7は、検索キーワードとして「富士山」が入力され、「富士山」をキーワードKA1として含む前述の画像P1が抽出された場合の各キーワードKA2〜KA4(「登山」、「火山」、「山中湖」)に対する基本関連度Mt及び瞬間関連度Rtの一例を示している。この例では、AMt=(15+5+10)/3=10、ARt=(80+5+5)/3=30と算出され、総合関連度Stは、主に、「富士山」との関連度が時勢の影響を受けて変動しやすい「登山」というキーワードの影響を受け、瞬間関連度Rtを用いる場合が基本関連度Mtを用いる場合に比して大きくなっている。
CPU26は、総合関連度算出部34により算出された各抽出画像の総合関連度Stを所定値と比較し、総合関連度Stが所定値より大きい画像の情報(画像データやそのファイル名)を、通信ネットワーク12を介してクライアント端末13に送信する(ここで、CPU26は、特許請求の範囲に記載の結果判定手段として機能している)。クライアント端末13は、受信した画像の情報を検索結果としてモニタ15に表示する。
次に、以上のように構成されたネットワークシステム14の作用について説明する。図8は、クライアント端末13側の処理手順を示す。まず、ステップS10では、画像が格納されたデジタルカメラ19または記録媒体20が接続され、画像が取り込まれたか否かが判定される。画像が取り込まれた場合には、ステップS11に移行し、ステップS11では、操作部18の操作により画像に複数のキーワードが付されたか否かが判定される。画像にキーワードが付された場合、または予め画像にキーワードが付されている場合には、ステップS12に以降し、ステップS12では、その画像が通信ネットワーク12を介してサーバ11へ送信される。なお、このとき、利用者からの送信指示を待ち受け、送信指示に基づいて画像を送信するようにしても良い。サーバ11へ送信された画像は、HDD29内の画像DB36に蓄積される。
ステップS12が終了すると、ステップS10へ戻る。ステップS10にて、画像が取り込まれていないと判定された場合には、サーバ11内の画像DB36から所望する画像を検索するための検索操作がなされたか否かが判定される。この検索操作は、例えば、図10に示すようにモニタ15に表示される検索指示画面40を見ながら操作部18を操作することにより行うことができる。検索指示画面40には、検索キーワードを入力するボックス41、基本関連検索(時勢の影響が減じられた基本関連度Mtに基づく検索)と瞬間関連検索(時勢の影響が反映された瞬間関連度Rtに基づく検索)との何れを実施するかを指定するラジオボタン(択一的な選択を行うボタン)42、検索の実行を指示する検索実行ボタン43が表示されている。
ステップS13にて検索指示がなされると、ステップS14に移行し、ステップS14では、サーバ11へ検索指示情報(検索キーワード、基本関連検索と瞬間関連検索との選択情報)が送信される。サーバ11では、この検索指示情報を受け、後述する画像検索処理が実行される。次いで、ステップS15では、サーバ11から検索結果としての画像情報(画像データやそのファイル名)を受信した否かが判定される。画像情報が受信された場合には、ステップS16に以降し、ステップS16では、受信した画像情報に基づきモニタ15へ検索結果の表示が行われる。ステップS16が終了すると、ステップS10へ戻る。
図9は、サーバ11側の処理手順を示す。まず、ステップS20では、キーワード間関連度算出部32によって画像DB36に蓄積されている各画像に付されているキーワードを参照し、同一の画像に付されているキーワード同士は関連性があるとして、各画像内の各キーワード間について関連度Rtが算出される。例えば、図5に示す画像P1の場合には、「富士山」と「登山」、「登山」と「火山」等、各組み合わせについてそれぞれ“1”とカウントされる。別の画像に、「富士山」と「登山」とがキーワードとして付されている場合には、さらに“1”がカウントされ、「富士山」と「登山」とのキーワード間関連度が“2”とカウントアップされる。同様にして、時間tの時点における画像DB36の各画像内の全てのキーワード間について、関連度Rtを算出する。
ステップS20が終了すると、ステップS21に移行し、ステップS21では、サーバ11から検索指示情報(ステップS14で送信された検索指示情報)を受信したか否かが判定される。このステップS21は、続くステップS22で所定時間が経過したと判定されるまでの間、繰り返し実行される。ステップS22で所定時間(例えば、1日)が経過したと判定されると、ステップS20に戻り、キーワード間関連度の算出が行われる。このように、ステップS20は、所定時間ごとに繰り返し実行され、図6に示すような、キーワード間関連度を時系列的に表した時系列データD1が取得される。
ステップS21にて、サーバ11から検索指示情報を受信したと判定されると、ステップS23に移行する。ステップS23では、CPU26により、画像DB36に蓄積された画像のうち、検索指示情報として受信した検索キーワードが付された画像が抽出される。例えば、検索キーワードが「富士山」である場合には、図6に示すような画像が抽出される。
ステップS23が終了すると、ステップS24に移行し、ステップS24では、検索指示情報に基づき、基本関連検索と瞬間関連検索との何れが選択されているかが判定される。基本関連検索が選択されている場合には、ステップS25に移行し、ステップS25では、基本関連度算出部33により、検索キーワードと、ステップS23で抽出された各画像(抽出画像)に付された他のキーワードとの間の各関連度Rtについて、その時系列データD1がフィルタリング処理(例えば、移動平均による平滑化処理)され、平滑化された時系列データD2(図6参照)として表される基本関連度Mtが算出される。図5に示す画像P1の場合には、例えば、図7に示すように、検索時点の基本関連度Mtが算出される。なお、瞬間関連検索が選択されている場合には、ステップS25がスキップされ、ステップS26に移行する。この場合、キーワード間関連度算出部32によって算出されたキーワード間関連度Rtがそのまま瞬間関連度Rtとして用いられる。
ステップS26では、総合関連度算出部34により、各抽出画像について、検索キーワードとその他の各キーワードとの間の基本関連度Mtまたは瞬間関連度Rtから、総合関連度Stが算出される。基本関連検索が選択されている場合には、総合関連度Stは、基本関連度Mtの平均値AMtとして算出される(図7の例では、St=10)。一方、瞬間関連検索が選択されている場合には、総合関連度Stは、瞬間関連度Rtの平均値ARtとして算出される(図7の例では、St=30)。
続くステップS27では、CPU26により、ステップS26で算出された総合関連度Stが所定値(閾値)と比較され、所定値より大きい画像の情報(画像データやそのファイル名)がクライアント端末13へ送信される。クライアント端末13では、受信した画像の情報が検索結果としてモニタ15に表示される(ステップS16)。
図6に示す画像P1は、夏場には、検索キーワード「富士山」との関連度合いが(「登山」というキーワードのために)時勢の影響を受けて高く、瞬間関連検索ではヒットしやすいが、基本関連検索ではヒットし難いといった結果になる。つまり、利用者は、時勢の影響を減じたい場合には、基本関連検索を選択して検索を実行することで、画像P1のように時勢の影響が大きい画像を検索結果から排除し、所望の画像を得ることが可能となる。
なお、上記実施形態では、検索キーワードの指定をキーボード17からのテキスト入力により行っているが、これに代えて、複数のキーワードを一覧表示し、この中から1つのキーワードを選択することで検索キーワードの指定を行っても良い。
また、上記実施形態では、キーワード間関連度算出部32によって算出された関連度Rtを所定期間について移動平均により平滑化することで、基本関連度Mtを算出しているが、この所定期間(移動平均の平均期間)をクライアント端末13から入力可能としても良い。これにより、利用者は、平均期間の指定により平滑化の程度(時勢の影響の減算量)を調整することができる。
基本関連度Mtは、移動平均以外の平滑化処理により算出しても良い。例えば、フーリエ変換等の周波数解析を用いることも可能である。また、ローパスフィルタにより、関連度の最頻値を基本関連度Mt(一定値)としても良い。勿論、これらの手法に係わる演算対象期間をクライアント端末13から入力可能としても良い。
また、上記実施形態では、キーワード間関連度算出部32によって算出された関連度を、瞬間関連度Rtとして用いているが、瞬間関連度Rtは、基本関連度Mtより短い期間について平滑化処理することにより算出しても良いし、また、キーワード間関連度算出部32によって算出された関連度から基本関連度Mtを減算することにより算出しても良い。
また、上記実施形態では、基本関連度Mtまたは瞬間関連度Rtのいずれかを択一的に用いて総合関連度Stを算出しているが、選択係数α(0≦α≦1)を用い、St=αMt+(1−α)Rtの関係により基本関連度Mtと瞬間関連度Rtと合成して総合関連度Stを算出しても良い。例えば、基本関連検索の場合はα=0.9、瞬間関連検索の場合はα=0.1とする。この選択係数αは、クライアント端末13から入力可能としても良い。
また、上記実施形態では、総合関連度Stが所定値より大きい画像の情報を検索結果としてクライアント端末13へ送信しているが、総合関連度Stが最大の画像から上位所定数までの画像の情報を検索結果としてクライアント端末13へ送信しても良い。この検索結果として判定するための判定条件(上記の所定値または所定数)をクライアント端末13から利用者により入力可能としても良い。
また、上記実施形態では、基本関連検索と瞬間関連検索とを択一的に選択して検索を行っているが、この選択操作を排し、基本関連検索と瞬間関連検索とを同時に行うように構成しても良い。この場合、基本関連検索と瞬間関連検索とのそれぞれの検索結果がクライアント端末13に返されるため、各検索結果を区別して表示する必要がある。例えば、図11に示すように、検索結果表示画面50に、基本関連検索により検索された画像51の表示領域52と、瞬間関連検索により検索された画像53の表示領域54とを区分して設ける。各表示領域内の画像は、総合関連度Stが大きいものから順に並べることが好ましいが、両方の表示領域に重複して表示される画像については、総合関連度Stの大きさから判断し、一方の表示領域にのみ表示しても良い。
また、上記実施形態では、入力された検索キーワードが付された画像を画像DB36から抽出し、その検索キーワードと抽出した画像内の他のキーワードとの関連度からさらに絞り込み検索を行うように構成しているが、これに代えて、キーワード情報管理部37に構成されたシソーラスに基づき、入力された検索キーワードと画像DB36内の各画像に付された各キーワード(または代表キーワード)との関連度を算出することにより関連度(総合関連度St)の高い画像を検索するように構成しても良い。このシソーラスを用いた検索方法では、検索キーワードが付されていない画像も検索対象となり、いわゆる曖昧検索が可能となる。
また、上記実施形態では、検索キーを1つのキーワードとしているが、複数のキーワードを検索キーとして用いても良い。上記実施形態の絞り込み検索の場合には、複数の検索キーワードが付された画像を画像DB36から抽出し、その複数の検索キーワードと抽出した画像内の他のキーワードとの関連度から絞り込み検索を行えば良い。また、上記のシソーラスを用いた曖昧検索の場合には、複数の検索キーワードと画像DB36内の各画像に付された各キーワード(または代表キーワード)との関連度から検索を行えば良い。このように、複数の検索キーワードを用いる場合には、画像のキーワードとの全ての組み合わせに対する関連度(基本関連度Mt及び瞬間関連度Rt)の平均値を算出し、総合関連度Stを求めれば良い。
このような検索キーワードの指定は、テキスト入力に限られず、キーワードが付された画像の指定により行っても良い。例えば、図12に示すような検索指示画面60により画像の指定を行い得るように構成する。検索指示画面60には、複数の画像61が表示される画像表示領域62と、検索実行ボタン63とが設けられている(基本関連検索と瞬間関連検索とを選択するラジオボタンは設けていない)。マウスポインタ64により1つの画像61を選択し、検索実行ボタン63をクリックすることで、検索指示がなされる。この場合には、画像DB36からの画像検索は、選択された画像61に付された1つまたは複数のキーワードが検索キーワードとして画像検索が行われる。ここで、検索指示画面60及び操作部18が、特許請求の範囲に記載の検索指示入力手段として機能している。
図13は、画像を検索キーとした場合の検索結果表示画面の一例である。検索結果表示画面70には、画像表示領域71が設けられており、画像表示領域71の中央には、検索指示画面60で指定された検索キーとしての画像61が表示されており、画像61の周囲に、検索結果としての画像72〜75が表示されている。画像72,73は、画像61に対して基本関連度Mtが高い画像であり、画像74,75は、画像61に対して瞬間関連度Rtが高い画像である。これらを区別するために、画像74,75の枠を太く強調している。なお、このような結果画像の区別には、前述の領域の区分や、枠の色や大きさの変更、分類マークの付与等、種々の手法を用いることが可能である。
また、上記実施形態では、画像に付された各キーワードの検索キーワードとの基本関連度Mt及び瞬間関連度Rtをそれぞれ平均することにより、該画像に対する基本関連度(AMt)及び瞬間関連度(ARt)を求めているが、各キーワードに重み付けがなされている場合には、その重み付けにより加重平均をとることにより“AMt”,“ARt”を算出しても良い。例えば、図7に示した各キーワードに、図14に示すように重み付け係数Wが付与されている場合には、AMt=(15×70+5×20+10×10)/100=12.5、ARt=(80×70+5×20+5×10)/100=57.5と算出される。
また、上記各実施形態では、コンテンツとして画像を例に挙げて説明したが、これに代えて、動画データ、音楽データ、文章データ、コンピュータソフト、Webページや、それらの複合物をコンテンツとしても良い。なお、各コンテンツに付されるキーワードは、文字に限られず、記号や数字を用いて表しても良い。
また、上記各実施形態では、同一のコンテンツに付されたキーワード同士は関連性があるという観点からキーワード間関連度を算出しているが、検索キーとして複数のキーワードが入力される場合には、並列して入力されるキーワード同士は関連性があるという観点からキーワード間関連度を算出しても良い。
ネットワークシステムの構成を示す概略図である。 クライアント端末の内部構成を示す機能ブロック図である。 サーバの内部構成を示す機能ブロック図である。 画像とキーワードと対応関係を示すデータテーブルである。 キーワードが付された画像の一例を示す図である。 キーワード間関連度の時系列データの一例を示すグラフである。 検索キーワードと画像に付されたキーワードとの基本関連度及び瞬間関連度の一例を示すテーブルである。 クライアント端末側の処理手順を示すフローチャートである。 サーバ側の処理手順を示すフローチャートである。 検索指示画面の一例を示す図である。 検索結果表示画面の一例を示す図である。 検索指示画面の変形例を示す図である。 検索結果表示画面の変形例を示す図である。 画像とキーワードに加えて重み付け係数を対応付けて保存したデータテーブルである。
符号の説明
11 サーバ
12 通信ネットワーク
13 クライアント端末
26 CPU
32 キーワード間関連度算出部
33 基本関連度算出部
34 総合関連度算出部
35 関連度算出部
36 画像データベース
37 キーワード情報管理部
40,60 検索指示画面
50,70 検索結果表示画面

Claims (9)

  1. キーワードが付されたコンテンツが複数蓄積されたデータベースから、検索キーワードに基づき検索を行うコンテンツ検索装置において、
    前記データベース内のコンテンツに付された各キーワード間の関連度を一定時間ごとに算出して時系列データを作成するキーワード間関連度算出手段と、
    前記検索キーワードと各コンテンツに付されたキーワードとの間の各関連度の時系列データをそれぞれ平滑化し、各コンテンツについて基本関連度を算出する基本関連度算出手段と、
    前記基本関連度に基づいてコンテンツの検索結果を判定する結果判定手段と、
    を備えたことを特徴とするコンテンツ検索装置。
  2. 前記キーワード間関連度算出手段は、同一のコンテンツに付されたキーワード同士は関連性があるという観点から各キーワード間について前記関連度を算出することを特徴とする請求項1に記載のコンテンツ検索装置。
  3. 前記基本関連度算出手段は、移動平均による平滑化処理を行うことを特徴とする請求項1または2に記載のコンテンツ検索装置。
  4. 前記結果判定手段は、前記基本関連度が所定値より大きいコンテンツを検索結果として特定することを特徴とする請求項1から3いずれか1項に記載のコンテンツ検索装置。
  5. 1つのコンテンツに複数のキーワードが付されている場合に、前記検索キーワードと各キーワードとの間で算出される前記基本関連度を平均化し、各コンテンツについて総合関連度を算出する総合関連度算出手段を備え、前記出力手段は、前記総合関連度に基づいてコンテンツの検索結果を出力することを特徴とする請求項1から4いずれか1項に記載のコンテンツ検索装置。
  6. 前記検索キーワードが付されたコンテンツを前記データベースから抽出するコンテンツ抽出手段を備え、前記基本関連度算出手段は、前記コンテンツ抽出手段により抽出されたコンテンツを対象として前記基本関連度を算出することを特徴とする請求項1から5いずれか1項に記載のコンテンツ検索装置。
  7. コンテンツの指定により、そのコンテンツに付されたキーワードを検索キーワードとして入力する検索指示入力手段を備えたことを特徴とする請求項1から6いずれか1項に記載のコンテンツ検索装置。
  8. 前記コンテンツは、画像であることを特徴とする請求項1から7いずれか1項に記載のコンテンツ検索装置。
  9. キーワードが付されたコンテンツが複数蓄積されたデータベースから、検索キーワードに基づき検索を行うコンテンツ検索方法において、
    前記データベース内のコンテンツに付された各キーワード間の関連度を一定時間ごとに算出して時系列データを作成するキーワード間関連度算出ステップと、
    前記検索キーワードと各コンテンツに付されたキーワードとの間の各関連度の時系列データをそれぞれ平滑化し、各コンテンツについて基本関連度を算出する基本関連度算出ステップと、
    前記基本関連度に基づいてコンテンツの検索結果を判定する結果判定ステップと、
    を備えたことを特徴とするコンテンツ検索方法。
JP2007324499A 2007-12-17 2007-12-17 コンテンツ検索装置及び方法 Abandoned JP2009146261A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007324499A JP2009146261A (ja) 2007-12-17 2007-12-17 コンテンツ検索装置及び方法
US12/336,042 US20090157670A1 (en) 2007-12-17 2008-12-16 Contents-retrieving apparatus and method
CNA2008101861074A CN101464883A (zh) 2007-12-17 2008-12-17 内容检索设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007324499A JP2009146261A (ja) 2007-12-17 2007-12-17 コンテンツ検索装置及び方法

Publications (1)

Publication Number Publication Date
JP2009146261A true JP2009146261A (ja) 2009-07-02

Family

ID=40754592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007324499A Abandoned JP2009146261A (ja) 2007-12-17 2007-12-17 コンテンツ検索装置及び方法

Country Status (3)

Country Link
US (1) US20090157670A1 (ja)
JP (1) JP2009146261A (ja)
CN (1) CN101464883A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011093358A1 (ja) * 2010-01-27 2011-08-04 楽天株式会社 情報検索装置、情報検索方法、情報検索プログラム及び記録媒体
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法
US9934465B2 (en) 2005-03-30 2018-04-03 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US10248669B2 (en) 2010-06-22 2019-04-02 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101042901B1 (ko) * 2008-10-09 2011-06-21 엔에이치엔비즈니스플랫폼 주식회사 광고 구매 히스토리에 기초하여 검색 광고용 키워드 페어를생성하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
CN102194006B (zh) * 2011-05-30 2013-07-31 李郁文 一种集合团队个性化特征的搜索系统和方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819261A (en) * 1995-03-28 1998-10-06 Canon Kabushiki Kaisha Method and apparatus for extracting a keyword from scheduling data using the keyword for searching the schedule data file
US6493705B1 (en) * 1998-09-30 2002-12-10 Canon Kabushiki Kaisha Information search apparatus and method, and computer readable memory
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US20080065685A1 (en) * 2006-08-04 2008-03-13 Metacarta, Inc. Systems and methods for presenting results of geographic text searches
US8037051B2 (en) * 2006-11-08 2011-10-11 Intertrust Technologies Corporation Matching and recommending relevant videos and media to individual search engine results
JP5044236B2 (ja) * 2007-01-12 2012-10-10 富士フイルム株式会社 コンテンツ検索装置、およびコンテンツ検索方法
KR20090000691A (ko) * 2007-03-21 2009-01-08 엔에이치엔(주) 컨텍스트 광고 정보를 노출하는 광고 방법 및 시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9934465B2 (en) 2005-03-30 2018-04-03 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
WO2011093358A1 (ja) * 2010-01-27 2011-08-04 楽天株式会社 情報検索装置、情報検索方法、情報検索プログラム及び記録媒体
US10248669B2 (en) 2010-06-22 2019-04-02 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法

Also Published As

Publication number Publication date
CN101464883A (zh) 2009-06-24
US20090157670A1 (en) 2009-06-18

Similar Documents

Publication Publication Date Title
JP2009146261A (ja) コンテンツ検索装置及び方法
KR100522029B1 (ko) 실시간 급상승 검색어 검출 방법 및 실시간 급상승 검색어검출 시스템
JP5693369B2 (ja) 情報処理装置、その制御方法及びコンピュータプログラム
JP2006259811A (ja) ログ作成装置及びプログラム
JP5226241B2 (ja) タグを付与する方法
JP2009025968A (ja) 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置
JP2009145953A (ja) データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP2006285299A (ja) 能力フィルタ型コンテンツ推薦装置および方法ならびにプログラム
EP3722974B1 (en) Collecting apparatus, collection method, and collection program
JP2010108363A (ja) クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム
JP5794001B2 (ja) 情報検索方法、情報検索装置および情報検索プログラム
JP6088781B2 (ja) サーバ装置、プログラム及び制御方法
JP2006092023A (ja) 文書管理用コンピュータプログラムならびに文書管理装置および方法
JP2009163474A (ja) 時系列データ検索プログラム,時系列データ検索装置および時系列データ検索方法
CN111291259B (zh) 一种数据筛选方法、装置、电子设备和存储介质
JP2008242777A (ja) 画像検索システム及び画像検索方法
CN111191126A (zh) 一种基于关键词的科技成果精准推送方法及装置
JP2007058801A (ja) 更新通知装置及び更新通知方法
JP5663742B2 (ja) 画像検索サーバ及び画像検索サーバの画像情報管理方法
JP2019021228A (ja) 検索装置、検索システム及びプログラム
JP2012027803A (ja) ネットワーク通信装置
JP2004088454A (ja) 画像情報表示システム
JP7004477B2 (ja) インシデントレスポンス補助システム、インシデントレスポンス補助方法およびインシデントレスポンス補助プログラム
JP2007323434A (ja) 話題度算出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120620

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20120809