JP6219967B2 - ラベル付非テキスト系アイテムを検索するためのシステム及び方法 - Google Patents

ラベル付非テキスト系アイテムを検索するためのシステム及び方法 Download PDF

Info

Publication number
JP6219967B2
JP6219967B2 JP2015548797A JP2015548797A JP6219967B2 JP 6219967 B2 JP6219967 B2 JP 6219967B2 JP 2015548797 A JP2015548797 A JP 2015548797A JP 2015548797 A JP2015548797 A JP 2015548797A JP 6219967 B2 JP6219967 B2 JP 6219967B2
Authority
JP
Japan
Prior art keywords
lpnt
item
metadata
class
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015548797A
Other languages
English (en)
Other versions
JP2016509703A (ja
Inventor
バルビエリ マウロ
マウロ バルビエリ
ヨハネス ヘンリクス マリア コルスト
ヨハネス ヘンリクス マリア コルスト
セルベリウス ペトルス パウルス プロンク
セルベリウス ペトルス パウルス プロンク
ラモン アントワーヌ ウィロ クルート
ラモン アントワーヌ ウィロ クルート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2016509703A publication Critical patent/JP2016509703A/ja
Application granted granted Critical
Publication of JP6219967B2 publication Critical patent/JP6219967B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Description

本発明は、ラベル付非テキストアイテムのコレクションの範囲内で、ラベル付非テキストアイテムを検索するためのシステムに関する。
本発明は、更に、ラベル付非テキストアイテムのコレクションの範囲内で、ラベル付非テキストアイテムを検索するための方法に関する。
テキストアイテム(predominantly non-textual items)は、テキストが情報コンテンツに軽微な寄与しか形成しないアイテムと見なされる。その特定の例は、映画及び曲のような、デジタルメディア再生デバイスによる再生のための再生アイテムである。再生アイテムは話された又は歌われたテキストを含んでいるが、その中にあるテキストの用語は、極めて小さな量のデータコンテンツにしか寄与しない。テキストアイテムは、簡単な説明、例えば表題及び場合によりそのコンテンツの概要を有し得る。(更にlpnt(labeled predominantly non-textual)アイテムとして示される)ラベル付非テキストアイテムは、分類を有するテキストアイテムである。
再生アイテムは、メディアプレーヤ上で再生され得る、映画のようなアイテムである。探索エンジンは、ユーザが再生アイテムのコレクションの範囲内で特定の再生アイテムを見つけるのを促進するために提供される。典型的には、これらのアイテムは、例えば、アクション、アドベンチャー、アニメーション、バイオグラフィー、コメディ、クライム、ドキュメンタリー、ドラマ、ファミリー、ファンタジー、フィルムノアール、ゲームショー、ヒストリー、ホラー、ミュージック、ミュージカル、ミステリー、ニュース、リアリティTV、ロマンス、Sci−Fi、スポーツ、トークショー、スリラー、戦争及び西部劇というジャンルを有するIMDBジャンル指標を用いて、ラベル付けされる。再生アイテムは例えば会話又は歌詞の形式でテキストコンテンツを含み得るが、テキストコンテンツは、通常、検索目的で利用可能ではない。制限された範囲において、再生アイテムのメタデータは、テキストコンテンツ、例えば、表題、アーティスト及び時には簡単な説明を有してもよい。
その関係において、US2005160460は、ユーザが放送コンテンツを検索するのを可能にするための情報処理装置及び情報処理方法を開示している。この装置は、ユーザ端末から来る検索情報に基づいて検索キーワードを取得し、検索キーワードに関連した検索関連キーワードのための検索キーワード辞書データベースを検索する検索空間処理部を有する。検索キーワード及び検索関連キーワードデータに基づいて、検索空間処理部は、検索キーワード空間を生成し、生成された空間を修正プロセスに提出する。検索処理部は、マッチングのために、修正検索キーワード空間、EPGデータ及びEPGキーワード空間を比較する。検索表示処理部は、マッチングの結果から表示準備情報のリストを準備し、そのリストをユーザ端末に送る。
しかしながら、既知の検索エンジンは、依然として、以下の例により示されるような欠点を有する。ユーザが大きなビデオオンデマンド貯蔵所においてイタリアのマフィア映画を捜したい、及び、前記貯蔵所がマフィア映画のための特定のジャンルラベルを有しないが、その代わりに、これらの映画は、典型的には、"アクション"、"ギャング"及び"イタリアン"というジャンルによってラベル付けされていると仮定する。ユーザは、フルテキスト検索におけるクエリとして"マフィア"という用語を単純に用いることができた。潜在的に、映画"ゴッドファーザー"の説明は、"マフィア"という用語を実際に含まないかもしれず、結果として、この映画は、としてフルテキスト検索における結果として返されないだろう。
一般に、ユーザは、再生アイテムの説明に対してフルテキスト検索を適用することによりユーザの現在の興味にマッチする興味深い再生アイテムを逃し得る。単純に、ユーザが所与の再生アイテムと典型的に関連付けるキーワード、又は、辞書から取り出された検索関連キーワードが、再生アイテムの説明において明示的に与えられていないためである。
本発明の目的は、前述の欠点を少なくとも部分的に軽減するシステムを提供することにある。本発明の目的は、前述の欠点を少なくとも部分的に軽減する方法を提供することにある。
本発明の第1の態様によれば、請求項1に記載のシステムが提供される。本発明の第2の態様によれば、請求項11に記載の方法が提供される。
本発明の第1の態様によるシステム及び本発明の第2の態様による方法において、ユーザにより提供されるキーワードのセットは、ジャンル仕様から取得される更なるキーワードにより強化される。
この寄与のための手段は、lpntアイテムをエンコードするために使用されるデータの全体の量により除算される、asciiコードにおけるlpntアイテムにおいて生じるテキストをエンコードするのに必要なデータの量の間の割合である。
これらの及び他の態様は、図面を参照してより詳細に述べられる。
第1の本発明の態様によるデータベースシステムの一実施形態を図式的に示す。 クラスをlpntアイテムに割り当てるための第1のアプローチを図式的に示す。 クラスをlpntアイテムに割り当てるための第2のアプローチを図式的に示す。 図1のデータベースシステムの実施形態の一部分を示す。 前記部分をより詳細に示す。 図1のデータベースシステムの実施形態の他の部分を示す。 図1のデータベースシステムの他の実施形態における部分を示す。 本発明の第1の態様によるデータベースシステムの更なる実施形態を図式的に示す。 本発明の第1の態様によるデータベースシステムの更なる実施形態を図式的に示す。 本発明の第1の態様によるデータベースシステムの更なる実施形態を図式的に示す。 本発明の第2の態様による方法の一実施形態を図式的に示す。 本発明の第2の態様による更なる方法の態様をより詳細に示す。
種々の図面における同様の参照シンボルは、特に明記しない限り同様の要素を示す。
図1は、ラベル付非テキストアイテム(lpntアイテム)のコレクションにおけるラベル付非テキストアイテムについてのメタデータを格納するための本発明の第1の態様によるデータベースシステムを図式的に示している。上記のように、lpntアイテムにおいて、テキストは、情報コンテンツに対して軽微な寄与しか有さない。この寄与のための手段は、lpntアイテムをエンコードするために使用されるデータの全体の量により除算される、asciiコードにおけるlpntアイテムにおいて生じるテキストをエンコードするのに必要なデータの量の間の割合である。
例えば、mp3アイテムとしてエンコードされる3分の曲は、約1〜10メガバイトの格納空間を用いる。大雑把な推定によれば、曲のテキストは、2キロバイトにより表され得る最大2000文字を有してもよい。従って、テキストは、曲の情報コンテンツ全体に対してせいぜい約0.2%しか寄与しない。
別の例として、2時間の長さを有する映画は、約1GBでエンコードされ得る。話される又はクローズドキャプションとして映画に含まれるテキストは、80kBでエンコードされ得る。従って、テキストは、映画の情報コンテンツ全体に対してせいぜい約0.00008%しか寄与しない。
一般に、asciiコードにおけるlpntアイテムにおいて生じるテキストをエンコードするのに必要なデータの量は、lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である。
lpntアイテムにおける情報コンテンツに対するテキストの軽微な寄与は、文書検索システムにおけるアイテムとはかなり異なることに留意されたい。
典型的には、lpntアイテムは、簡単な説明、即ちせいぜい数百ワードしか有さない(例えば100ワードに満たない)。一部の状況において、アイテムの表題のみが説明として利用可能で有り得る。これは、通常10未満のワードしか含まない。
コレクションにおける各lpntアイテムは、関連付けられた1又はそれ以上のラベルを有する。全てのラベルG={g1,g2,...,gn}のセットが与えられると仮定すると、或るlpntアイテムiに関して、これらのラベルを、
Figure 0006219967
により与えられるiに関連付ける。更に、I(c)を、クラスcに属しているlpntアイテムのセットにする。異なるアプローチは、クラスを規定する、及び、各クラスに属しているlpntアイテムを決定するために考えられる。図1Aに示される1つの極端な場合において、各クラスは、単一のラベルにより規定される。その場合、lpntアイテムが1又はそれ以上のラベルに割り当てられ得る場合、クラスは重複している。例えば、第1のクラスc1は、ラベルg1を有する全てのlpntアイテムにより規定され、第2のクラスc2は、ラベルg2を有する全てのlpntアイテムにより規定され、同様に、ラベルgnにより規定されるn番目のクラスcnまで行われる。この場合、ラベルg1,g2を有するlpntアイテムは、例えば、クラスc1,c2の各々に属している。
他の極端な場合において、lpntアイテムiのクラスcは、ラベルGiのセットにより決定される。その場合、各lpntアイテムは、正確に1つのクラスに属しており、複数のクラスは、相互に非重複である。これは、図1Bに示されている。ここにおいて、7つのクラスを規定する3つのラベルg1,g2,g3が与えられる。最初の3つのクラスは、ラベルg1,g2,g3のみをそれぞれ有するlpntアイテムを含むc1,c2,c3である。4つの残りのクラスは、ラベルg1及びg2を有する全てのlpntアイテムのc4、ラベルg1及びg3を有する全てのlpntアイテムのクラスc5、ラベルg2及びg3を有する全てのlpntアイテムのクラスc6、並びに、ラベルg1,g2及びg3を有する全てのlpntアイテムのクラスc7である。この手法において、ラベルの同じセットにより、より細分化された分類が得られる。例えば各クラスがlpntアイテムの同じ数を大雑把に含むことを実現するために、ハイブリッドなアプローチが考えられる。例えば、図1Bに示される状況において、クラスc7が1つ又は2つのlpntアイテムしか含まないことが見つけられた場合、クラスc7は削除されてもよく、その代わりに、これらのlpntアイテムがクラスc4,c5,c6の各々に割り当てられてもよい。
図1のデータベースシステムは、表1に概略的に示されるような、前記コレクションの範囲内のlpntアイテムiのためのメタデータGi,Tiを格納している格納機能10を有する。メタデータは、少なくとも1つのlpntアイテムラベル、即ち1又はそれ以上のラベルのサブセットGiとしてのlpntアイテムラベルと、lpntアイテムiに割り当てられるlpntアイテムの説明Tiとを有する。格納機能10は、lpntアイテムのコンテンツの位置までのポインタを更に有してもよい。幾つかの場合において、コンテンツは、前記格納機能10の範囲内に格納されてもよい。
Figure 0006219967
図1のデータベースシステムは、それぞれのクラスcのためのキーワードデータを生成するためのキーワード生成機能20を更に含む。図2において更に詳細に示されるように、キーワード生成機能20は、前記クラスに関連付けられるlpntアイテムのlpntアイテム−説明から用語を検索するための検索モジュール22を有する。従って、各クラスに対して、検索モジュール22は、どのlpntアイテムがそのクラスに属しているかを決定し、これらのlpntアイテムの説明に含まれる用語を決定する。キーワード生成機能20は、前記クラスに対する前記用語の関連性R(t,c)を割り当てるための用語関連性決定モジュール24を更に有する。割り当てられた関連性R(t,c)に基づいて、用語は、これらの割り当てられた関連性R(t,c)に基づく取り出された用語T(c)から選択され、選択された用語がキーワードK(c)として供給される。従って、クラスcのために供給されたキーワードK(c)は、関連した文書の説明から前記クラスcのために取り出された用語T(c)のサブセットである。典型的には、用語T(c)のほんの一部(例えば10%未満)だけが、キーワードK(c)として選択される。
多くの場合、lpntアイテムの分類のために使用されるラベルは予め規定されている。例えば、映画のデータベースにおいて、映画は、上で規定されたIMDBジャンルラベルを割り当ててもよい。しかしながら、上記のように、クラスは、ジャンル−ラベルの組み合わせに基づいて規定されてもよく、例えば、分離したクラスは、ラベル"ドラマ"及び"ロマンス"の双方を有する映画のために規定されてもよい。これは、lpntアイテムのより制限されたサブセットのみが解析されなければならない、及び、見つけられた用語は、用語が1つのラベルにのみ基づくクラスからの用語リストからの用語を組み合わせることにより得られる場合よりも、これらのlpntアイテムのコンテンツをより適切に反映してもよいという利点を有する。それにも関わらず、ジャンル−ラベルの組み合わせに基づくクラスが極めて制限された数のlpntアイテムのみを有する場合に、このクラスを除去する、及び、その代わりに、lpntアイテムを、個々のラベルにより又はこれらのラベルの下位の組み合わせにより規定されるクラスに割り当てるとみなされてもよい。
種々のオプションは、クラスのための用語T(c)の関連性を決定するために考えられる。例えば、関連性決定モジュール24は、これらの説明に用語を含むクラスにおけるlpntアイテムの数を計数し、この数を、通常の使用における用語の既知の頻度に基づく用語を含むのを期待されるlpntアイテムの数と比較してもよい。その目的のために、関連性決定モジュール24は、後者の情報を含むルックアップテーブルを有してもよい。
図2Aは、データベースシステムの一実施形態における関連性決定モジュール24の特定の装置を示している。それに関して、関連性決定モジュール24は、前記分類に応じてそれぞれのクラスcを有するlpntアイテムのための用語T(c)の頻度を示す頻度指標Ftcを与えるための用語頻度分析ユニット241を有する。キーワード生成デバイス24は、全体としてのlpntアイテムのコレクションにおける用語T(c)の頻度を示す基準指標Frefを供給するための基準ユニット242を更に有する。キーワード生成デバイス24は、前記頻度指標Ftcに応じたクラスcのための用語と前記基準指標Frefとの関連性を決定するための正規化ユニット243を更に有する。関連性決定モジュール24により割り当てられた関連性に基づいて、クラスcのためのキーワードK(c)のセットは、クラスcのlpntアイテムiの説明の範囲内で見つけられる用語T(c)から選択される。選択されたキーワードKwは、例えば、予め決められた値より高い関連性を有する全ての用語T(c)であってもよい。代わりに、関連性の減少に従ってランク付けされる用語T(c)のリストから上位Nt個の用語が選択されてもよい。ここで、Ntは予め決められた数である。他の実施形態において、選択は、基準の組み合わせに従って行われてもよく、例えば、リストの上位Ntにあるか又は或る閾値より高い関連性を有する全ての用語が選択される。前と同じように他の実施形態において、キーワードK(c)は、リストの上位Ntにおいて現れ、加えて、閾値より高い関連性を有する用語T(c)から選択される。
種々のオプションは、頻度指標Ftcを決定するために考えられることに留意されたい。
第1のアプローチによれば、頻度指標Ftcは、元の頻度(即ち、用語T(c)がクラスcのlpntアイテムの説明において発生する回数)である。
第2のアプローチによれば、頻度指標Ftcは、"ブール頻度"に基づく。ブール頻度では、用語がlpntアイテムの説明中に現れる場合にはlpntアイテムに関する用語が1に設定され、現れない場合には用語頻度が0に設定される。従って、頻度指標Ftcは、少なくとも1回は用語T(c)を含む説明を有するlpntアイテムの数である。一実施形態において、1とは異なる他の閾値は、この手段のために用いられてもよい。
第3のアプローチによれば、頻度指標は、対数的にスケールされた頻度(即ち、Ftc=1+log f(t,c)(及び、f(t,c)=0のときに0))である。それに関して、f(t,c)は、クラスcにおける用語の元の頻度である。
頻度指標Ftcは、クラスにおけるlpntアイテムの数及び/又は説明の長さの差を構成するようスケールされてもよい。その目的のために、元の頻度f(t,c)は、そのクラスにおける任意の用語の最大の元の頻度により、又は、クラスにおける用語の全体数によりスケールされてもよい。lpntアイテムが実質的に同等にサイズ設定されたクラス及び実質的に同等の長さの説明に従って分類された場合、これは必要ではない。更に、説明の長さは、頻度指標Ftcが"ブール頻度"に基づくかどうかについて考慮される必要はない。選択されたキーワードが、関連性の減少に従ってランク付けされた用語T(c)のリストから上位Nt個の用語である場合には、説明のサイズ及びクラスサイズを考慮するためのスケーリングは必要でない。
また、特定のクラスに対して関連性を有しない一般に頻繁に出現する用語を除外するために、基準指標Frefが、用語T(c)のために決定される。指標Frefは、頻度指標FTcのための重み付け因子として用いられる。基準指標は、用語がlpntアイテムのコレクション全体に渡って一般的か又は珍しいかを示す手段である。用語は、典型的には、用語を含むlpntアイテムの数により除算されるlpntアイテムの全体数の商の対数を決定することにより取得される。この手段は、代わりに、コレクション全体の代表的なサブセットから推定されてもよいことに留意されたい。前と同じように他の実施形態において、重み付け因子として用いられるべき基準指標Frefは、コレクション全体における用語の全体のカウントの逆数値であってもよい。代わりに、重み付け因子として使用される基準指標Frefは、用語の通常の使用における用語の逆頻度であってもよい。このデータは、ルックアップテーブルとして利用可能であってもよい。
データベースシステムは、キーワードとしてクラスcのために見つけられた与えられた候補キーワードK(c)のそれぞれのサブセットをクラスのlpntアイテムiのメタデータに追加するためのメタデータ強化機能30を更に有する。1つだけのクラスに割り当てられるlpntアイテムに関して、これらのlpntアイテムのメタデータにそのクラスのために見つけられた候補キーワードK(c)を追加することが十分である。与えられた候補キーワードK(c)のサブセットは、全ての候補キーワードを有してもよい。しかしながら、典型的には、サブセットは、与えられた候補キーワードの選択を与える。例えば、lpntアイテムのlpntアイテム説明においてすでに存在する候補キーワードは、そのlpntアイテムのために除外されてもよい。また、他の候補キーワードは、その後において更に詳細に述べられるようなクラスの特定のlpntアイテムのための生ずるサブセットにおいて除外されてもよい。
上記のように、異なるアプローチは、クラスを規定し、各クラスに属しているlpntアイテムを決定することを可能にする。或る場合において、lpntアイテムiは、1つを超えるクラスcに割り当てられてもよい。これは、lpntアイテムが1つを超えるラベルを有し、各ラベルが別個のクラスを規定する場合に当てはまり得る。例えば、映画は、ラベル'ロマンス'及び'ドラマ'を有してもよく、双方ラベルの組み合わせは、別個のクラスとしてはみなされない。その場合において、1つを超えるクラスからのキーワードK(c)は、斯様なlpntアイテムに対して利用可能である。異なるアプローチが考えられる。第1のアプローチによれば、lpntアイテムが属しているクラスの各々のための用語T(c)から選択される全てのキーワードKwは、lpntアイテムのメタデータに追加される。他のアプローチによれば、更なる選択がキーワードから行われる。例えば、メタデータ強化機能30は、lpntアイテムのための関連したクラスの各々から取得されるキーワードの組み合わせられたリストを構成し、これらの関連性に従って全体のランキングを与えてもよい。そして、最も高いランキングを有するキーワードのサブセットが、組み合わせられたリスト中のキーワードから選択されてもよい。この場合、キーワード生成機能20がキーワードに割り当てられた関連性指標をメタデータ強化機能30に供給することが必要である。代わりに、キーワード生成機能20は、(これらの関連性を特定することなく)これらの関連性ランキングに対応する予め決められた順序についての各クラスのためのキーワードのリストをメタデータ強化機能30に供給し、メタデータ強化機能30は、予め決められたサイズのサブセットをリストの各々から選択する。
再び他のアプローチにおいて、メタデータ強化機能30は、各クラスに割り当てられたキーワードのセットの横断部分を選択する。即ち、メタデータ強化機能30は、lpntアイテムiが属しているクラスcの各々に共通しているキーワードを選択する。
(lpntアイテムが属しているクラスのためのキーワードK(c)のセットと同じであってもよい)lpntアイテムのために選択されるキーワードKiのセットは、説明に追加されてもよい。この手法において、キーワードは、既存の検索エンジンにより見つけられ得る。代わりに、キーワードKiは、以下の表2に示されるように別々のフィールドに含まれてもよい。
Figure 0006219967
検索エンジンが、lpntアイテムの元の説明において実際に生じるキーワードと追加されたキーワードとの間を識別するのを可能にするので、lpntアイテムiのためのメタデータの別個のフィールドにおけるlpntアイテム特有のキーワードKiを供給することが有利である。例えば、lpntアイテムがクッキングレシピの準備を示すビデオであり、検索が"パルメザン"ではなく"イタリアン"を特定すると仮定する。イタリアンクッキングレシピが原料として頻繁にパルメザンチーズを含むという事実からみて、これが追加のキーワードとして生じる可能性が非常に高い。その場合、検索はヒットを明らかにしないだろう。しかしながら、追加のキーワードがメタデータの別個の入力において追加された場合において、検索エンジンは、元の説明がキーワード'パルメザン'を含まないときに、レシピがクエリに適合することを決定する。
図3Aは、データベースシステムの一実施形態におけるメタデータ強化機能30を示している。示された実施形態において、メタデータ強化機能30は、第1のクエリq1及び第2のクエリq2を汎用検索エンジンGSE(general search engine)に発行するためのクエリ発行機能31を有する。第1のクエリq1は、lpntアイテムの表題Ti及びキーワード生成機能20により供給される候補キーワードK(c)に基づいて実行される。従って、このクエリは、表題Ti及び候補キーワードK(c)を双方含むターゲットを検索するように向けられる。与えられた候補キーワードK(c)を特定することなく、第2のクエリq2は、lpntアイテムの表題Tiに基づいて実行される。いずれの場合においても、クエリは、(例えば引用符の間の表題を特定することにより)ここに現れている個々のワードではなく、全体としての表題に向けられるべきであることに留意されたい。クエリq1,q2は、検索を特定の領域に限定するために共通の1又はそれ以上の更なる用語を含んでもよい。例えば、コレクションにおけるlpntアイテムが映画である場合、クエリq1,q2はキーワード"映画"を更に含んでもよい。メタデータ強化機能30は、第1のクエリq1のための推定されたヒットの数N(q1)と第2のクエリq2のための推定されたヒットの数N(q2)とを用いて候補キーワードK(c)のlpntアイテム特有の関連性を決定するための追加の関連性指示機能32を更に有する。"推定される"という用語は、全ての検索結果が、関連するlpntアイテムに実際に本当に関連している必要があるとは限らないことを示すためにここで用いられる。例えば、クエリが映画に明示的に限定されない場合、検索用語"ゴッドファーザー"を有するクエリは、本及びゲームを明らかにしてもよいが、"洗礼の子供の命名者"としての名づけ親の元の意味に結果であってもよい。それにもかかわらず、クエリ1及び2のクエリ結果を比較するために、一般的な検索エンジンにより見つけられた結果の数は、多くの場合、適切な基準である。候補キーワードのlpntアイテム特有の関連性は、割合N(q1)/N(q2)に基づいてもよく、これは、
Figure 0006219967
という条件で、0〜1の範囲にある数である。ここでは、割合が1に等しい場合、候補キーワードは、とりわけ関連しているとみなされ、割合が0に等しい場合、無関係であるとみなされる。
メタデータ強化機能30は、候補キーワードのlpntアイテム特有の関連性が予め決められた値をより小さい場合に、与えられた候補キーワードがlpntアイテムのメタデータに割り当てられるのを阻止するためのブロッキング機能33を更に有する。この手法において、追加の選択が、候補キーワード(即ち、クラスのメンバである特定のlpntアイテムに特に関連しているキーワードのサブセットを実現するためのクラスに関連したキーワード)から行われる。
図3Bは、本発明の第1の態様によるデータベースシステムの他の実施形態のメタデータ強化機能30を示している。ここでは、クエリ発行機能31は、第3のクエリq3を汎用検索エンジンに発行するように更に構成される。この第3のクエリは、生成機能20により供給された候補キーワードに基づいて実行される。lpntアイテムの表題Tiは、このクエリには含まれない。この実施形態において、候補キーワードのために決定されたlpntアイテム特有の関連性は、前記第3のクエリq3のための推定されたヒットの数N(q3)に更に依存する。この場合、割合N(q1)/N(q3)は、表題Tiを有するlpntアイテムのための候補キーワードの関連性の更なる指標を供給する。図3Bに示された実施例では、割合N(q1)/N(q2)は、追加の関連性指標部分32aにより計算され、割合N(q1)/N(q3)は、追加の関連性指標部分32bにより計算され、追加の関連性指標部分32cは、ブール関連性インジケータRを決定する。ブロッキング機能33は、Rがtrueである場合、lpntアイテムiのための特定のキーワードKiとしてキーワードK(c)のみを供給する。一実施形態において、追加の関連指標部分32cは、N(q1)/N(q2)>Thr12及びN(q1)/N(q3)>Thr13の場合にR=trueであることを決定する。ここで、Thr12およびThr13は、予め決められた閾値である。
図4に示されたような第1の態様によるデータベースシステムの一実施形態は、1又はそれ以上のキーワードのセットKuを含む、検索されたlpntアイテムのためのユーザ検索要求USRを受信するための通信機能40を更に有する。示された実施形態では、データベースシステムは、検索要求に含まれる1又はそれ以上のキーワードのセットに基づいて、前記強化されたメタデータにおいてクエリを実行するための検索機能50を更に有する。
また、図5に示されたデータベースシステムの更なる実施形態は、新たなlpntアイテムiについてのメタデータを受信するための入力機能60を有する。その実施形態のデータベースシステムは、前記メタデータを格納機能10に格納し、コレクションにおけるlpntアイテムのメタデータを更新するための更新機能70を追加的に有する。メタデータを更新するプロセスは、バッチ式で生じ得る、即ち、例えば予め決められた数のlpntアイテム(例えば、100のlpntアイテム)がコレクションに追加された後に毎回、キーワードの割り当てが新たに生じ得る。
しかしながら、好ましくは、メタデータは、繰り返して更新される。これを可能にするために、クラス−用語−頻度テーブル(表3参照)が以下に示すように維持される。クラス−用語−頻度テーブルは、各クラス(C1,C2,・・・,Cn)に対して、用語{T11,・・・,T1n1},{T21,・・・,T2n2},・・・,{Tm1,・・・,Tm,nm}等のリスト(Term)を有する。用語のリストの各々は、用語頻度{F11,・・・F1n1}の対応するリスト、及び、基準頻度{FR11,・・・FR1n1}のリストを有する。加えて、正規化された頻度{FN11,・・・FN1n1}のリストが維持されてもよい。しかしながら、これは、後者のリストがテーブルにおいて既に利用可能な割合FTc/Frefから計算されるので、必要ではない。
それぞれの追加されたlpntアイテムinewに関して、これは、以下のものを必要とする。
− 用語リストは、lpntアイテムの説明(例えば、表題)において生じる用語を有するlpntアイテムinewに対して決定される。
− 用語頻度リストは、前記用語リストの用語が発生する頻度のための指標を有するlpntアイテムに対して決定される。
− 用語頻度リストに基づいて、関連したクラス/複数のクラスのための用語頻度Ftcが更新される。即ち、新たなlpntアイテムinewが属している各クラスに関して、用語頻度Ftcは、用語頻度リストにおいて示された頻度によりカウントをインクリメントすることにより更新される。
− また、この情報に基づいて、用語のための基準頻度FRijが更新されてもよい。代わりに、各用語のためのそれぞれの固定された基準頻度が推定されてもよい。しかしながら、新たな用語が経時的に取り込まれるので、基準頻度は、新たな用語のために経時的に追加されるべきである。加えて、幾つかの用語に関して頻度が経時的に増大し、他のものに関しては頻度が経時的に減少するので、基準頻度を経時的に更新することは、1年につき数回行われるのが恐らく好ましいだろう。
− その後、正規化された周波数は、用語統計が新たなlpntアイテムの加算により変更されるクラス(即ち、新たなlpntアイテムが属しているクラス)に対して更新される。基準頻度がまた更新された場合、新たなlpntアイテムから取り出された用語リストにおいて1又はそれ以上の用語を含む他のクラスも更新される。
− lpntアイテムのメタデータは、新たなlpntアイテムが属しているクラスのための手順において以前に選択したキーワードのセットKwに基づいて強化される。
− 他のキーワードが1又はそれ以上のクラスに関連しているように見える正規化された頻度を更新するステップから続く場合、その後、全てのlpntアイテムのメタデータが適宜更新され得る。
Figure 0006219967
同様に、本発明の第1の態様によるデータベースシステムの他の実施形態は図6に示される。ここに示されたデータベースシステムは、ユーザプロファイルを格納するためのユーザプロファイル格納機能80を更に有する。ユーザプロファイルは、少なくとも、ユーザ指定されたキーワードを有する。ユーザ指定されたキーワードは、ユーザにより明示的に特定されてもよい(Kexp)。代わりに、システムは、どのキーワードがユーザにより頻繁に用いられるかを検出し、黙示的なキーワード(Kimp)としてこれらをユーザプロファイルに追加してもよい。図6に示されたデータベースシステムの実施形態は、推薦機能90を更に有する。新たなlpntアイテムについてのメタデータを受信すると、及び、新たなlpntアイテムのメタデータを更新した後に、推薦機能90は、新たなlpntアイテムの更新されたメタデータを、各ユーザのためのそれぞれのユーザ指定されたキーワードと比較する。そして、推薦機能90は、プロファイルが新たなlpntアイテムの更新されたメタデータにマッチするそれらのユーザに対して新たなlpntアイテムを推薦する。
図7は、本発明の第2の態様による方法を図式的に示している。ラベル付けされたlpntアイテムのコレクションにおけるlpntアイテムについてのメタデータを格納するための発明の方法は、第1のステップS1を有し、それぞれのメタデータが、コレクションの範囲内でlpntアイテムのために格納される。メタデータは、少なくとも1つのlpntアイテム分類及びlpntアイテム説明を有する。上で述べられるように、lpntアイテムは、1つを超えるlpntアイテム分類に割り当てられてもよい。lpntアイテム分類はクラスを規定する。種々の代替手段は、lpntアイテム分類とクラス定義との間の関係のために考えられる。1つの定義によれば、各分類は、クラスと関連付けられ、従って、1つを超える分類を有するlpntアイテムが異なるクラスに属している。他の定義によれば、分類のそれぞれの組み合わせはクラスを規定する。その場合、各lpntアイテムは、1つのクラスにのみ属している。代わりに、ハイブリッドな定義が考えられる。例えば、クラスは、充分なlpntアイテムが分類のこの組み合わせを有するのであれば、第2の定義におけるような分類の組み合わせにより規定されてもよい。この組み合わせを伴うlpntアイテムの数が閾値より小さい場合(例えば10未満)、その後、lpntアイテムは、個々の分類により又はこれらの分類のそれぞれのサブセットにより形成されるクラスに割り当てられる。本発明による方法は、lpntアイテムのために動作する。即ち、asciiコードにおけるlpntアイテムにおいて生じるテキストをエンコードするのに必要なデータの量は、lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である。典型的には、コレクションにおけるlpntアイテムの説明におけるワードの平均数も低い(例えば数百ワード、例えば多くても100、又はせいぜい10ワード)。
方法は、前記クラスと関連付けられたlpntアイテムのlpntアイテム説明からそれぞれのクラスのための用語を取り出す第2のステップS2を有する。従って、各クラスに関して、どのlpntアイテムがそれに属しているかが決定され、どの用語がこれらのlpntアイテムの説明において現れるかが決定される。事前選択ステップは、"the"や"a"のような、極めて一般的なワードをフィルタリングするために適用されてもよい。
次のステップS3において、関連性は、クラスのための取り出された用語に割り当てられる。
ステップS4において、用語は、これらの割り当てられた関連性に基づいて取り出された用語から選択され、候補キーワードとして供給される。典型的には、trueのサブセットのみが選択されるだろう。しかしながら、少数の用語だけが利用可能な場合、これらの全てが候補キーワードとして供給されてもよい。
ステップS5において、供給された候補キーワードのサブセットは、クラスのlpntアイテムのメタデータに追加される。クラスの全ての候補キーワードをそのクラスのlpntアイテムの全てに追加することが考えられ得るが、これは、実際には有益ではないかもしれない。例えば、lpntアイテムに追加される供給された候補キーワードのサブセットは、lpntアイテム説明において既に生じたものではない候補キーワードを有してもよい。
更に、供給された候補キーワードのサブセットは、図8を参照して述べられるような追加の選択手順により追加的に制限されてもよい。この追加の選択手順において、第1及び第2のクエリq1,q2は、ステップS51,S52のそれぞれにおいて汎用検索エンジンに発行される。クエリは、任意の順序で又は同時に発行され得る。ステップS51における第1のクエリq1は、lpntアイテムの表題及び候補キーワード(即ち、lpntアイテムが属しているクラスのために生成されたキーワード)に基づいて実行される。ステップS52における第2のクエリq2は、その候補キーワードを特定することなくlpntアイテムの表題に基づいて実行される。そして、ステップS54において、候補キーワードのlpntアイテム特有の関連性は、第1のクエリ(q1)から生ずる推定されたヒットの数と第2のクエリ(q2)から生ずる推定されたヒットの数とを用いて決定される。ステップS55において、キーワードのlpntアイテム特有の関連性が予め決められた値をより小さいことがステップS54において決定された場合、供給された候補キーワードは、lpntアイテムのメタデータに割り当てられるべきキーワードのサブセットから除外される。
方法の一実施形態において、第3のクエリ(q3)は、ステップS53における汎用検索エンジンに発行される。第3のクエリq3は、lpntアイテムの表題を特定することなく候補キーワードに基づいて実行される。クエリq1,q2,q3は、任意の順序で又は同時に発行され得る。後続のステップS54において、lpntアイテム特有の関連性は、前記第3のクエリ(q3)のための推定されたヒットの数に更に依存する候補キーワードに対して決定される。

Claims (17)

  1. ラベル付非テキストアイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションにおけるラベル付非テキストアイテムについてのメタデータを格納するためのデータベースシステムであって、
    前記コレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納している格納部であって、前記メタデータは、lpntアイテム説明及びラベルのセットから選択される少なくとも1つのlpntアイテムラベルを有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、格納部と、
    それぞれのクラスに対するキーワードデータを生成するためのキーワード生成部であって、前記キーワード生成部は、前記クラスと関連付けられるlpntアイテムのlpntアイテム説明から用語を取り出すための検索モジュールと、前記クラスに対する前記用語の関連性を割り当て、これらの割り当てられた関連性に基づいて前記の取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するための用語関連性決定モジュールとを有する、キーワード生成部と、
    クラスに対して生成された候補キーワードのそれぞれのサブセットを選択されたキーワードとしてクラスのlpntアイテムのメタデータに追加するためのメタデータ強化部とを有する、データベースシステム。
  2. 前記lpntアイテムは、メディア再生デバイスによる再生のための再生アイテムである、請求項1に記載のデータベースシステム。
  3. 前記用語関連性決定モジュールは、前記クラスを規定する分類に応じてそれぞれのクラスを有するlpntアイテムに対する用語の頻度を示す頻度指標を供給するための用語頻度解析ユニットを有し、
    前記キーワード生成部は、lpntアイテムのコレクションにおける前記用語の頻度を示す基準指標を供給するための基準ユニットと、前記頻度指標及び前記基準指標に従って前記用語の関連性を決定するための正規化ユニットとを更に有する、請求項1に記載のデータベースシステム。
  4. 前記メタデータ強化部は、第1のクエリ及び第2のクエリを汎用検索エンジンに発行するためのクエリ発行部を有し、前記第1のクエリは、lpntアイテムの表題及び前記キーワード生成部により供給された候補キーワードに基づいて実行され、前記第2のクエリは、供給された候補キーワードを特定することなく、前記lpntアイテムの表題に基づいて実行され、
    前記メタデータ強化部は、前記第1のクエリに対して推定されたヒットの数と前記第2のクエリに対して推定されたヒットの数とを用いて前記候補キーワードのlpntアイテム特有の関連性を決定するための追加の関連性指示部を更に有し、
    前記メタデータ強化部は、lpntアイテムに対する前記候補キーワードの前記lpntアイテム特有の関連性が予め決められた値より小さい場合に、供給された候補キーワードが前記lpntアイテムの前記メタデータに割り当てられるのを阻止するためのブロッキング部を更に有する、請求項1〜3のうちいずれか一項に記載のデータベースシステム。
  5. 前記クエリ発行部は、第3のクエリを前記汎用検索エンジンに発行するように更に構成され、前記第3のクエリは、前記lpntアイテムの表題を特定することなく前記候補キーワードに基づいて実行され、
    前記候補キーワードに対して決定された前記lpntアイテム特有の関連性は、前記第3のクエリに対して推定されたヒットの数に更に依存する、請求項4に記載のデータベースシステム。
  6. 前記メタデータ強化部は、選択されたキーワードを、前記説明を格納するための入力とは別個の入力における前記メタデータに追加するように構成される、請求項1〜5のうちいずれか一項に記載のデータベースシステム。
  7. 1又はそれ以上のユーザ指定されたキーワードのセットを含むユーザ検索要求を受信するための通信部と、
    前記1又はそれ以上のユーザ指定されたキーワードのセットに基づいて、強化されたメタデータにおけるクエリを実行するための検索部とを更に有する、請求項1〜6のうちいずれか一項に記載のデータベースシステム。
  8. 新たなlpntアイテムについてのメタデータを受信するための入力部と、
    受信される当該メタデータを前記格納部に格納し、前記コレクションにおける前記lpntアイテムの前記メタデータを更新するための更新部とを更に有する、請求項7に記載のデータベースシステム。
  9. ユーザプロファイルを格納するためのユーザプロファイル格納部であって、ユーザプロファイルは、少なくともユーザ指定されたキーワードを有する、ユーザプロファイル格納部と、
    新たなlpntアイテムについてのメタデータを受信すると、及び、前記新たなlpntアイテムの前記メタデータを更新した後に、前記新たなlpntアイテムの更新されたメタデータを、各ユーザに対するそれぞれのユーザ指定されたキーワードと比較し、前記ユーザ指定されたキーワードが前記新たなlpntアイテムの前記更新されたメタデータにマッチするユーザに前記新たなlpntアイテムを推薦するための推薦部とを更に有する、請求項8に記載のデータベースシステム。
  10. ラベル付非テキストアイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションにおけるラベル付非テキストアイテムについてのメタデータを格納するためのデータベースシステムの作動方法であって、
    前記データベースシステムの格納部が、前記コレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納するステップであって、前記メタデータは、lpntアイテム説明及びラベルのセットから選択される少なくとも1つのlpntアイテムラベルを有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、ステップと、
    前記データベースシステムのキーワード生成部が、前記クラスと関連付けられるlpntアイテムのlpntアイテム説明からそれぞれのクラスに対する用語を取り出すステップと、
    前記キーワード生成部が、前記それぞれのクラスに対する前記用語の関連性を割り当てるステップと、
    前記キーワード生成部が、これらの割り当てられた関連性に基づいて前記の取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するステップと、
    前記データベースシステムのメタデータ強化部が、供給された候補キーワードのサブセットをキーワードとしてクラスのlpntアイテムのメタデータに追加するステップとを有する、方法。
  11. 前記lpntアイテムは、メディア再生デバイスによる再生のための再生アイテムである、請求項10に記載の方法。
  12. 前記用語の関連性を割り当てるステップは、前記クラスを規定する分類に応じてそれぞれのクラスを有するlpntアイテムに対する用語の頻度を示す頻度指標を供給し、lpntアイテムのコレクションにおける前記用語の頻度を示す基準指標を供給し、前記頻度指標及び前記基準指標に従って前記用語の関連性を決定する、請求項11に記載の方法。
  13. 前記メタデータ強化部が、
    第1のクエリ及び第2のクエリを汎用検索エンジンに発行するステップであって、前記第1のクエリは、lpntアイテムの表題及び供給された候補キーワードに基づいて実行され、前記第2のクエリは、供給された候補キーワードを特定することなく、前記lpntアイテムの表題に基づいて実行される、ステップと、
    前記第1のクエリに対して推定されたヒットの数と前記第2のクエリに対して推定されたヒットの数とを用いて前記候補キーワードのlpntアイテム特有の関連性を決定するステップと、
    前記候補キーワードの前記lpntアイテム特有の関連性が予め決められた値より小さい場合に、供給された候補キーワードが前記lpntアイテムの前記メタデータにキーワードとして割り当てられるのを阻止するステップとを更に有する、請求項11又は請求項12に記載の方法。
  14. 前記メタデータ強化部が、第3のクエリを前記汎用検索エンジンに発行するステップであって、前記第3のクエリは、前記lpntアイテムの表題を特定することなく前記候補キーワードに基づいて実行され、前記候補キーワードに対して決定された前記lpntアイテム特有の関連性は、前記第3のクエリに対して推定されたヒットの数に更に依存する、ステップを更に有する、請求項13に記載の方法。
  15. 前記候補キーワードから選択されるサブセットは、前記説明を格納するための入力とは別個の入力における前記メタデータに追加される、請求項11に記載の方法。
  16. 前記データベースシステムの通信部が、1又はそれ以上のユーザ指定されたキーワードのセットを含むユーザ検索要求を受信するステップと、
    前記データベースシステムの検索部が、前記1又はそれ以上のユーザ指定されたキーワードのセットに基づいて、強化されたメタデータにおけるクエリを実行するステップとを更に有する、請求項11に記載の方法。
  17. ラベル付非テキストアイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納するステップであって、前記メタデータは、少なくとも1つのlpntアイテムラベル及びlpntアイテム説明を有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、ステップと、
    前記クラスと関連付けられるlpntアイテムのlpntアイテム説明からそれぞれのクラスに対する用語を取り出すステップと、
    前記それぞれのクラスに対する取り出された用語の関連性を割り当てるステップと、
    これらの割り当てられた関連性に基づいて前記取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するステップと、
    供給された候補キーワードのサブセットをキーワードとしてクラスのlpntアイテムのメタデータに追加するステップとを、
    データ処理デバイスに実行させるための命令を有する、コンピュータプログラム。
JP2015548797A 2012-12-20 2013-09-29 ラベル付非テキスト系アイテムを検索するためのシステム及び方法 Expired - Fee Related JP6219967B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261739819P 2012-12-20 2012-12-20
US61/739,819 2012-12-20
PCT/IB2013/058974 WO2014097000A1 (en) 2012-12-20 2013-09-29 System and method for searching a labeled predominantly non-textual item

Publications (2)

Publication Number Publication Date
JP2016509703A JP2016509703A (ja) 2016-03-31
JP6219967B2 true JP6219967B2 (ja) 2017-10-25

Family

ID=49920363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015548797A Expired - Fee Related JP6219967B2 (ja) 2012-12-20 2013-09-29 ラベル付非テキスト系アイテムを検索するためのシステム及び方法

Country Status (7)

Country Link
US (1) US9940382B2 (ja)
EP (1) EP2936348A1 (ja)
JP (1) JP6219967B2 (ja)
CN (1) CN104854588B (ja)
BR (1) BR112015014319A2 (ja)
RU (1) RU2015129559A (ja)
WO (1) WO2014097000A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150317572A1 (en) * 2014-05-05 2015-11-05 Sap Ag On-Demand Enrichment of Business Data
US10489410B2 (en) 2016-04-18 2019-11-26 Google Llc Mapping images to search queries
CN109635277B (zh) * 2018-11-13 2023-05-26 北京合享智慧科技有限公司 一种获取实体信息的方法及相关装置
CN111709229A (zh) * 2020-06-16 2020-09-25 平安科技(深圳)有限公司 基于人工智能的文本生成方法、装置、计算机设备和介质
CN114697748A (zh) * 2020-12-25 2022-07-01 深圳Tcl新技术有限公司 一种基于语音识别的视频推荐方法和计算机设备
CN114328389B (zh) * 2021-12-31 2022-06-17 浙江汇鼎华链科技有限公司 一种云计算环境下的大数据文件分析处理系统及方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850971B1 (en) * 1997-02-18 2005-02-01 Pioneer Electronic Corporation System for processing information which reads address information
JP4953496B2 (ja) * 2000-05-15 2012-06-13 ソニー株式会社 コンテンツ検索・提示システム及び方法、並びに、ソフトウェア記憶媒体
JP3627715B2 (ja) 2002-03-27 2005-03-09 ソニー株式会社 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム
JP4299683B2 (ja) 2004-01-08 2009-07-22 日本電信電話株式会社 メタデータ管理方法、メタデータ管理装置、メタデータ管理プログラム及びメタデータ管理プログラムを記録した記録媒体
US8098976B1 (en) 2011-09-26 2012-01-17 Limelight Networks, Inc. Methods and systems for performing top concepts extraction
JP2008139942A (ja) 2006-11-30 2008-06-19 Seiko Epson Corp 情報処理装置、情報処理方法、および、プログラム
US8108417B2 (en) * 2007-04-04 2012-01-31 Intertrust Technologies Corporation Discovering and scoring relationships extracted from human generated lists
JP2009163600A (ja) 2008-01-09 2009-07-23 Hitachi Ltd メタデータ共有システム、サーバ装置、クライアント装置及びメタデータ共有方法
US8407216B2 (en) * 2008-09-25 2013-03-26 Yahoo! Inc. Automated tagging of objects in databases
NO329897B1 (no) * 2008-12-19 2011-01-24 Tandberg Telecom As Fremgangsmate for raskere ansiktsdeteksjon
US20100226582A1 (en) * 2009-03-03 2010-09-09 Jiebo Luo Assigning labels to images in a collection
ITTO20090704A1 (it) 2009-09-16 2011-03-17 Intellisemantic Srl Sistema e metodo per la classificazione di contenuti
WO2012010510A1 (en) * 2010-07-21 2012-01-26 Spectralmind Gmbh Method and system to organize and visualize media items
US8577938B2 (en) * 2011-08-23 2013-11-05 Accenture Global Services Limited Data mapping acceleration

Also Published As

Publication number Publication date
WO2014097000A1 (en) 2014-06-26
EP2936348A1 (en) 2015-10-28
US9940382B2 (en) 2018-04-10
JP2016509703A (ja) 2016-03-31
BR112015014319A2 (pt) 2017-07-11
CN104854588A (zh) 2015-08-19
CN104854588B (zh) 2019-06-04
RU2015129559A (ru) 2017-01-26
US20150324446A1 (en) 2015-11-12

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US7725486B2 (en) Information retrieval apparatus
JP4436894B2 (ja) コンテンツ検索装置
JP6219967B2 (ja) ラベル付非テキスト系アイテムを検索するためのシステム及び方法
Skoutas et al. Ranking and clustering web services using multicriteria dominance relationships
KR101994987B1 (ko) 관련 엔티티들
US9846744B2 (en) Media discovery and playlist generation
US8613021B2 (en) Providing suggestions of related videos
US7801887B2 (en) Method for re-ranking documents retrieved from a document database
US20110270818A1 (en) Domain expert search
US20100131563A1 (en) System and methods for automatic clustering of ranked and categorized search objects
JP4331257B2 (ja) 情報検索装置
JP2010067175A (ja) ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
US20100217755A1 (en) Classifying a set of content items
CN101847158A (zh) 基于上下文的视频查找器
JP2011175362A (ja) 情報処理装置、重要度算出方法及びプログラム
JP2003132085A5 (ja)
WO2008056570A1 (fr) Dispositif de recherche de contenu
JP2004145879A (ja) 所望の特性の組合せに最も適合する材料を選択するためのシステム及び方法
Garcia et al. Access-ordered indexes
US8005827B2 (en) System and method for accessing preferred provider of audio content
CN106294784B (zh) 资源搜索方法及装置
JP2002032394A (ja) 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体
JPH09319752A (ja) 検索支援装置
Iijima et al. Implementing an image search system with integrating social tags and DBpedia

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160916

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170928

R150 Certificate of patent or registration of utility model

Ref document number: 6219967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees