JP5894149B2 - Top−k処理を活用した意味の充実 - Google Patents
Top−k処理を活用した意味の充実 Download PDFInfo
- Publication number
- JP5894149B2 JP5894149B2 JP2013513358A JP2013513358A JP5894149B2 JP 5894149 B2 JP5894149 B2 JP 5894149B2 JP 2013513358 A JP2013513358 A JP 2013513358A JP 2013513358 A JP2013513358 A JP 2013513358A JP 5894149 B2 JP5894149 B2 JP 5894149B2
- Authority
- JP
- Japan
- Prior art keywords
- concept
- concepts
- keywords
- score
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
- G06F16/444—Spatial browsing, e.g. 2D maps, 3D or virtual spaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/487—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この出願は、2010年6月3日に出願された米国仮出願番号61/351252、2010年6月15日に出願された米国仮出願番号61/397780、および、2010年11月12日に出願された米国仮出願番号61/456774の利益を主張し、当該出願の内容は引用することによりここに組み込まれているものとする。
記憶装置212は、入力で受信した音声コンテンツ、映像コンテンツを記憶する。記憶装置212によって、制御装置214の制御の下で、ユーザインタフェース216および/または制御インタフェース222から受信した命令、例えば、早送り(FF)や巻き戻し(Rew)などの操作指示に基づいて、記憶したコンテンツを後に検索したり、再生したりすることが可能になる。記憶装置212は、ハードディスクドライブや、スタティックRAM(SRAM)またはダイナミックRAM(DRAM)などの1つまたは複数の大容量の集積電子メモリであってよく、コンパクトディスク(CD)ドライブまたはデジタル多用途ディスク(DVD)ドライブなどの交換可能な光ディスク記憶装置であってよい。
このセクションでは、問題を正式に定義し、アルゴリズムの開発、記述に使用する表記法を紹介する。
Uをu個の異なるワードを有する辞書とする。ウィキペディアの概念は、例えばu×mのc概念行列C(530)の形で表される。ここで、mは、ウィキペディアの項目に該当する概念の数で、uは、辞書中の異なるキーワードの数である。Ci,rは、r番目の概念cr中のi番目のキーワードtiの重みを表す。C-,r = [w1,r,w2,r .… wu,r]Tをr番目の概念ベクトルとする。一般性をなくさないように、各概念ベクトルC-,rは単位長さに正規化すると仮定する。
導入部で述べたように、
所与のドキュメントに関連する最適のk個の概念を正確に計算するためには、キーワード・概念行列の全てをスキャンすることが必要となることが多く、非常に費用がかかる。従って、さらに効率を向上させるために、Skを次のように緩和する。すなわち、ドキュメント
このセクションにおいて、所与のドキュメントの上位k個の概念Skを正確に計算するための単純なスキーム(すなわち、非実用的な解決法)を最初に記載する。
全てのデータをスキャン
この問題の明らかな解決法は、u×m個のキーワード・概念行列C530の全てをスキャンし、ドキュメントベクトル
順位付けまたはtop−k処理に関しては多くの提案がされてきた。上述のように、閾値アルゴリズム(TA)、Faginのアルゴリズム(FA)、非反復アルゴリズム(NRA)などの閾値ベースのアルゴリズムが、最もよく知られている方法である。これらのアルゴリズムは、所与のソートリストにおいて、各オブジェクトが各リスト内に1つだけスコアを有し、各リスト内の個々のオブジェクトのスコアを合算する集合関数(aggregation function)が、最低(min)、最大(max)、重みの合計((weight) sum)および積(product)のように単調であると、仮定する。これらの単調なスコア関数によって、サブスコア内で他の候補に優越する候補は、当該他の候補よりも合算したスコアが良くなることが確実になり、top−k計算の途中で、早めに計算を停止して、全てのリストをスキャンすることを避けることができる。一般的に、TA(およびFA)アルゴリズムは、ランダムアクセスとソートアクセスという2つのアクセス方法を必要とする。しかしながら、ドキュメント用語行列などの高次元データへのランダムアクセスを支援すると、膨大な費用がかかることになる。従って、NRAは、ソートアクセス方法しか必要とせず、概念行列Cなどの高次元データに適しているので、基本の枠組みとしてNRAを採用する。
u×m個のキーワード・概念行列C530へのソートアクセスを支援するために、u個のリストを含む逆索引610を作成する(図6)。各キーワードtiに関して、該当するリストLiは、<cr, Ci,r>のセットを含む。ここで、Ci,rは、ウィキペディアの概念cr中のキーワードtiの重みである。図6に示すように、各逆リストは、重みが0を超える概念のみを保持している。この逆リストは、ソートアクセスを支持するように、重みの降順に作成されている。
上記w’rの定義から、スコア関数は重みの合計として定義されるので、u個の独立したリスト内では単調であることが明らかである。ドキュメント
このセクションにおいては、ウィキペディアを用いた効率的な意味解釈部のためのアルゴリズムについて述べる。提案のアルゴリズムは2段階からなる。すなわち、(1)所与のドキュメントの上位k個の近似的概念Sk、αを計算する段階と、(2)Sk、αを用いて元のドキュメントを概念空間にマッピングする段階である。
上述のように、閾値ベースのアルゴリズムは、所与のソートされたリストにおいて、各オブジェクトは、各リスト内に1つだけスコアを有するという仮定に基づいている。NRAアルゴリズムにおける見えないオブジェクトの取り得るスコアは、この仮定に基づいて計算される。しかしながら、この仮定は、エントリのほとんどが0である疎らなキーワード・概念行列には適用できない。従って、このサブセクションにおいては、最初に、疎らなキーワード・概念行列を用いて見えないオブジェクトのスコアを推定する方法を記載し、次に、推定したスコアを活用して、所与のドキュメントの上位k個の近似的概念を取得する方法を示す。
各オブジェクトは各入力リスト内に1つだけスコアを有するという仮定は、疎らなキーワード・概念行列に関しては有効でないので、このサブセクションにおいては、目的は、各オブジェクトが計算中に発見されると予測される入力リストの数の限界を正確に推測することである。ヒストグラムは、通常、データ分布(すなわち、確率密度関数)を近似するために用いられる。多くの既存の近似的top−k処理アルゴリズムは、入力リストのヒストグラムを保持し、ヒストグラムを用いることで、未知のオブジェクトのスコアを推定する。一般的に、近似法は、完全一致のスキームよりも効率がよい。しかし、キーワード・概念行列の膨大な数のリストがあることを考えると、このようなヒストグラムを保持し、取り得る合計スコアを計算するためにランタイム中にそのヒストグラムを活用することは、実行可能な解決法ではない。従って、さらに効率よくするためには、各逆リストのデータ分布を、逆リストが所与の概念を含む場合、または、含まない場合という、二項分布によって単純化する。このように単純化されたデータ分布でも、概念行列が極度に疎らなので、上位k個の結果の質が大きく減じられることはない。
全く見えないオブジェクトを発見するであろうリストの数を推定すると、全く(または部分的に)見えないオブジェクトの予測スコアを計算することができる。
図7は、所与のドキュメントの上位k個の近似的概念Sk,αのセットを効率的に計算するために提案されたアルゴリズム用の疑似コードを記載している。最初に、アルゴリズムは、上位k個の近似的概念Sk,αのセット、カットオフスコアmink、および候補セットCndを初期値にする。閾値ベクトルthは、最初は[1,1,・・・1]にセットする。まず、上述のように、任意の完全に見えない概念の予測スコアを計算する(1〜5行目)。
所与のドキュメントの上位k個の近似的概念を識別すると、次のステップは、元のドキュメントをキーワード空間から概念空間にマッピングすることである。図8は、Sk,αを用いて、元のドキュメントをキーワード空間から概念空間にマッピングするための疑似コードを記載している。
(付記1)
意味解釈のために1つまたは複数のキーワードを取得するステップと、
知識データベース内にある、前記1つまたは複数のキーワードに関する上位k個の概念を計算するステップと、
前記上位k個の概念を用いて、前記1つまたは複数のキーワードを概念空間にマッピングするステップと、
を含むキーワードの意味解釈を行う方法。
(付記2)
上位k個の概念を計算する前記ステップは、
入力行の数の限界を推定することと、
完全に見えないオブジェクトまたは部分的に見えないオブジェクトの予測スコアを計算することを含む付記1に記載の方法。
(付記3)
意味解釈のために1つまたは複数のキーワードを取得する前記ステップは、コンテンツと共に含まれたクローズドキャプションデータからキーワードを抽出することを含む付記1に記載の方法。
(付記4)
前記1つまたは複数のキーワードを概念空間にマッピングするステップによって得られる概念をさらに処理することを含む付記1に記載の方法。
(付記5)
前記処理は、概念の順位付けを含む付記4に記載の方法。
(付記6)
前記処理は、前記得られる概念に基づいてユーザプロファイルを作成することを含む付記4に記載の方法。
(付記7)
前記処理は、前記得られる概念に基づいて分割されたコンテンツを作成することを含む付記4に記載の方法。
(付記8)
前記処理は、前記得られる概念に基づいてフィルタリングすることを含む付記4に記載の方法。
(付記9)
前記処理は、前記得られる概念に基づいて検索することを含む付記4に記載の方法。
(付記10)
キーワード収集と、
概念収集と、
概念処理と、
を含むキーワードの意味解釈を行うシステム。
(付記11)
キーワード収集は、
クローズドキャプション抽出部と、
文分割部と
を含む付記10に記載のシステム。
(付記12)
概念収集は、
意味解釈部と、
概念蓄積部と、
を含む付記10に記載のシステム。
(付記13)
概念処理は、
順位付けと、
ユーザプロファイルと、
を含む付記10に記載のシステム。
(付記14)
コンピュータ可読プログラムを有するコンピュータが使える媒体を含むコンピュータプログラム製品であって、前記コンピュータ可読プログラムは、コンピュータで実行されて、前記コンピュータに、
意味解釈のための1つまたは複数のキーワードを取得するステップと、
知識データベース内にある、前記1つまたは複数のキーワードに関する上位k個の概念を計算するステップと、
前記上位k個の概念を用いて、前記1つまたは複数のキーワードを概念空間にマッピングするステップと、
を含む方法を行わせるコンピュータプログラム製品。
Claims (14)
- コンピュータによって実行される、キーワードの意味解釈を行う方法であって、
意味解釈のために1つまたは複数のキーワードを取得するステップと、
知識データベース内にある、前記1つまたは複数のキーワードに関する上位k個の概念を計算するステップと、
前記上位k個の概念を用いて、前記1つまたは複数のキーワードを概念空間にマッピングするステップと、
を含み、
前記上位k個の概念を計算するステップは、候補となる概念について前記1つまたは複数のキーワードの重みの合計を示す予測スコアを計算するサブステップであって、該予測スコアはワーストスコアとベストスコアとを含む、前記計算するサブステップと、前記候補となる概念の各概念について計算されたワーストスコアのうちのk番目に高い値をカットオフスコアとするサブステップと、前記計算された予測スコアが前記カットオフスコアより小さい概念を前記候補となる概念から削除することにより前記上位k個の概念を計算するサブステップと、を含む、前記方法。 - 上位k個の概念を計算する前記ステップは、
入力行の数の限界を推定するサブステップと、
完全に見えないオブジェクトまたは部分的に見えないオブジェクトの予測スコアを計算するサブステップとを含む、請求項1に記載の方法。 - 意味解釈のために1つまたは複数のキーワードを取得する前記ステップは、コンテンツと共に含まれたクローズドキャプションデータからキーワードを抽出するサブステップを含む、請求項1に記載の方法。
- 前記1つまたは複数のキーワードを概念空間にマッピングするステップによって得られる概念を処理するステップをさらに含む、請求項1に記載の方法。
- 前記処理するステップは、前記概念を順位付けするサブステップを含む、請求項4に記載の方法。
- 前記処理するステップは、前記得られる概念に基づいてユーザプロファイルを作成するサブステップを含む、請求項4に記載の方法。
- 前記処理するステップは、前記得られる概念に基づいて分割されたコンテンツを作成するサブステップを含む、請求項4に記載の方法。
- 前記処理するステップは、前記得られる概念に基づいてフィルタリングするサブステップを含む、請求項4に記載の方法。
- 前記処理するステップは、前記得られる概念に基づいて検索するサブステップを含む、請求項4に記載の方法。
- 意味解釈のために1つまたは複数のキーワードを取得するキーワード収集手段と、
知識データベース内にある、前記1つまたは複数のキーワードに関する上位k個の概念を計算する概念収集手段と、
前記上位k個の概念を用いて、前記1つまたは複数のキーワードを概念空間にマッピングする概念処理手段と、
備え、
前記概念収集手段は、候補となる概念について前記1つまたは複数のキーワードの重みの合計を示す予測スコアを計算する手段であって、該予測スコアはワーストスコアとベストスコアとを含む、前記計算する手段と、前記候補となる概念の各概念について計算されたワーストスコアのうちのk番目に高い値をカットオフスコアとする手段と、前記計算された予測スコアが前記カットオフスコアより小さい概念を前記候補となる概念から削除することにより前記上位k個の概念を計算する手段と、を有する、キーワードの意味解釈を行うコンピュータシステム。 - キーワード収集手段は、
クローズドキャプション抽出部と、
文分割部と、
を含む、請求項10に記載のコンピュータシステム。 - 概念収集手段は、
意味解釈部と、
概念蓄積部と、
を含む、請求項10に記載のコンピュータシステム。 - 概念処理手段は、
順位付けと、
ユーザプロファイルと、
を含む、請求項10に記載のコンピュータシステム。 - コンピュータ可読プログラムであって、前記コンピュータ可読プログラムは、コンピュータで実行されると、前記コンピュータに、
意味解釈のために1つまたは複数のキーワードを取得するステップと、
知識データベース内にある、前記1つまたは複数のキーワードに関する上位k個の概念を計算するステップと、
前記上位k個の概念を用いて、前記1つまたは複数のキーワードを概念空間にマッピングするステップと、
を含む方法のステップを実行させ、
前記上位k個の概念を計算するステップは、候補となる概念について前記1つまたは複数のキーワードの重みの合計を示す予測スコアを計算するサブステップであって、該予測スコアはワーストスコアとベストスコアとを含む、前記計算するサブステップと、前記候補となる概念の各概念について計算されたワーストスコアのうちのk番目に高い値をカットオフスコアとするサブステップと、前記計算された予測スコアが前記カットオフスコアより小さい概念を前記候補となる概念から削除することにより前記上位k個の概念を計算するサブステップと、を含む、前記コンピュータ可読プログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US35125210P | 2010-06-03 | 2010-06-03 | |
US61/351,252 | 2010-06-03 | ||
US39778010P | 2010-06-17 | 2010-06-17 | |
US61/397,780 | 2010-06-17 | ||
US45677410P | 2010-11-13 | 2010-11-13 | |
US61/456,774 | 2010-11-13 | ||
PCT/US2011/038991 WO2011153392A2 (en) | 2010-06-03 | 2011-06-03 | Semantic enrichment by exploiting top-k processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014500528A JP2014500528A (ja) | 2014-01-09 |
JP5894149B2 true JP5894149B2 (ja) | 2016-03-23 |
Family
ID=45067306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013513358A Expired - Fee Related JP5894149B2 (ja) | 2010-06-03 | 2011-06-03 | Top−k処理を活用した意味の充実 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130268261A1 (ja) |
EP (1) | EP2691845A4 (ja) |
JP (1) | JP5894149B2 (ja) |
KR (1) | KR101811468B1 (ja) |
CN (1) | CN103384883B (ja) |
WO (1) | WO2011153392A2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8903712B1 (en) * | 2011-09-27 | 2014-12-02 | Nuance Communications, Inc. | Call steering data tagging interface with automatic semantic clustering |
CN102609449B (zh) * | 2012-01-06 | 2014-05-07 | 华中科技大学 | 一种基于维基百科构建概念型知识地图的方法 |
WO2014033799A1 (ja) * | 2012-08-27 | 2014-03-06 | 株式会社日立製作所 | 単語意味関係抽出装置 |
CN103631823B (zh) | 2012-08-28 | 2017-01-18 | 腾讯科技(深圳)有限公司 | 一种媒体内容推荐方法及设备 |
US20140152891A1 (en) * | 2012-12-05 | 2014-06-05 | Silicon Image, Inc. | Method and Apparatus for Reducing Digital Video Image Data |
KR101616031B1 (ko) * | 2014-07-17 | 2016-04-28 | 동아대학교 산학협력단 | 위키피디아의 언어자원과 병렬 코퍼스를 이용한 교차언어 검색기의 질의어 번역 시스템 및 방법 |
WO2016170561A1 (en) * | 2015-04-24 | 2016-10-27 | Nec Corporation | An information processing system and an information processing method for semantic enrichment of text |
US10423891B2 (en) * | 2015-10-19 | 2019-09-24 | International Business Machines Corporation | System, method, and recording medium for vector representation of words in a language |
CN105279264B (zh) * | 2015-10-26 | 2018-07-03 | 深圳市智搜信息技术有限公司 | 一种文档的语义相关度计算方法 |
KR102036314B1 (ko) * | 2017-12-29 | 2019-10-25 | (주)터보소프트 | 분산 처리 기반 공간 웹 객체 검색 시스템 및 이를 이용한 분산 처리 기반 공간 웹 객체 검색 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6978274B1 (en) * | 2001-08-31 | 2005-12-20 | Attenex Corporation | System and method for dynamically evaluating latent concepts in unstructured documents |
US6847966B1 (en) * | 2002-04-24 | 2005-01-25 | Engenium Corporation | Method and system for optimally searching a document database using a representative semantic space |
US7085771B2 (en) * | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
US7610313B2 (en) * | 2003-07-25 | 2009-10-27 | Attenex Corporation | System and method for performing efficient document scoring and clustering |
US8612208B2 (en) * | 2004-04-07 | 2013-12-17 | Oracle Otc Subsidiary Llc | Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query |
US8898134B2 (en) * | 2005-06-27 | 2014-11-25 | Make Sence, Inc. | Method for ranking resources using node pool |
US8140559B2 (en) * | 2005-06-27 | 2012-03-20 | Make Sence, Inc. | Knowledge correlation search engine |
US20070106499A1 (en) * | 2005-08-09 | 2007-05-10 | Kathleen Dahlgren | Natural language search system |
US20080086490A1 (en) * | 2006-10-04 | 2008-04-10 | Sap Ag | Discovery of services matching a service request |
US7734623B2 (en) * | 2006-11-07 | 2010-06-08 | Cycorp, Inc. | Semantics-based method and apparatus for document analysis |
CN101251841B (zh) * | 2007-05-17 | 2011-06-29 | 华东师范大学 | 基于语义的Web文档的特征矩阵的建立和检索方法 |
US9396262B2 (en) * | 2007-10-12 | 2016-07-19 | Lexxe Pty Ltd | System and method for enhancing search relevancy using semantic keys |
WO2009155281A1 (en) * | 2008-06-17 | 2009-12-23 | The Trustees Of Columbia University In The City Of New York | System and method for dynamically and interactively searching media data |
US20120001919A1 (en) * | 2008-10-20 | 2012-01-05 | Erik Lumer | Social Graph Based Recommender |
US8751218B2 (en) * | 2010-02-09 | 2014-06-10 | Siemens Aktiengesellschaft | Indexing content at semantic level |
US8924391B2 (en) * | 2010-09-28 | 2014-12-30 | Microsoft Corporation | Text classification using concept kernel |
-
2011
- 2011-06-03 WO PCT/US2011/038991 patent/WO2011153392A2/en active Application Filing
- 2011-06-03 US US13/701,347 patent/US20130268261A1/en not_active Abandoned
- 2011-06-03 EP EP11790440.9A patent/EP2691845A4/en not_active Withdrawn
- 2011-06-03 KR KR1020127034385A patent/KR101811468B1/ko active IP Right Grant
- 2011-06-03 CN CN201180038012.8A patent/CN103384883B/zh not_active Expired - Fee Related
- 2011-06-03 JP JP2013513358A patent/JP5894149B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2691845A2 (en) | 2014-02-05 |
JP2014500528A (ja) | 2014-01-09 |
WO2011153392A2 (en) | 2011-12-08 |
CN103384883A (zh) | 2013-11-06 |
WO2011153392A3 (en) | 2013-12-27 |
KR20130120381A (ko) | 2013-11-04 |
US20130268261A1 (en) | 2013-10-10 |
KR101811468B1 (ko) | 2017-12-21 |
EP2691845A4 (en) | 2018-01-10 |
CN103384883B (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5894149B2 (ja) | Top−k処理を活用した意味の充実 | |
US11978439B2 (en) | Generating topic-specific language models | |
US11197036B2 (en) | Multimedia stream analysis and retrieval | |
US8145648B2 (en) | Semantic metadata creation for videos | |
US9122754B2 (en) | Intelligent video summaries in information access | |
CN110430476B (zh) | 直播间搜索方法、系统、计算机设备和存储介质 | |
KR101777981B1 (ko) | 데이터 스트림들의 실시간 자연어 처리 | |
US8750681B2 (en) | Electronic apparatus, content recommendation method, and program therefor | |
JP2021535458A (ja) | 機械学習抽出物とセマンティックグラフとを使用して構造化データを作成し、検索、推奨および発見を促進するための方法およびシステム | |
CN108924658B (zh) | 弹幕联想输入方法、装置及计算机可读存储介质 | |
KR20010086393A (ko) | 비디오 세그먼트를 다른 비디오 세그먼트 또는 정보원에링크시키는 방법 및 장치 | |
JP2013529331A (ja) | 表示中のテレビジョン・コンテンツのための自動画像発見および推薦 | |
US20230086735A1 (en) | Systems and methods for retrieving videos using natural language description | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
WO2011106087A1 (en) | Method for processing auxilary information for topic generation | |
Lian | Innovative Internet video consuming based on media analysis techniques | |
CN109800326B (zh) | 一种视频处理方法、装置、设备和存储介质 | |
EP3905060A1 (en) | Artificial intelligence for content discovery | |
CN114662002A (zh) | 对象推荐方法、介质、装置和计算设备 | |
Bursuc et al. | OVIDIUS: An on-line video retrieval platform for multi-terminal access |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140603 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150602 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5894149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
LAPS | Cancellation because of no payment of annual fees | ||
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |