JP2011517822A - 重複を最低限に抑えるWebフィードを集約するための方法 - Google Patents

重複を最低限に抑えるWebフィードを集約するための方法 Download PDF

Info

Publication number
JP2011517822A
JP2011517822A JP2011504433A JP2011504433A JP2011517822A JP 2011517822 A JP2011517822 A JP 2011517822A JP 2011504433 A JP2011504433 A JP 2011504433A JP 2011504433 A JP2011504433 A JP 2011504433A JP 2011517822 A JP2011517822 A JP 2011517822A
Authority
JP
Japan
Prior art keywords
content
feed
stored
updated
updated content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011504433A
Other languages
English (en)
Other versions
JP5535193B2 (ja
Inventor
ジャボー,フィリップ
バーンサイド,ジェラルド
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2011517822A publication Critical patent/JP2011517822A/ja
Application granted granted Critical
Publication of JP5535193B2 publication Critical patent/JP5535193B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

シンジケートされたWebコンテンツを集約するための方法であって、予め定められたWebフィードから更新されたコンテンツを取り出すステップ(100)と、前記更新されたコンテンツを、以前取り出された格納済みコンテンツと比較するステップ(120)と、格納済みコンテンツとは異なると考えられる場合、更新されたコンテンツを格納するステップ(160)と、格納済みコンテンツと同じと考えられる場合、更新されたコンテンツを削除するステップ(170)とを含む方法。

Description

本発明は、Webフィード(Web Feed)の集約に関する。
1990年代初期以降、ワールド・ワイド・ウェブは、非常に一般的になり、現在では、テキスト、画像、映像、および他のWebページへのリンク(ハイパーリンクとも呼ばれる)など様々なコンテンツを含む数十億ものWebページを含む。ワールド・ワイド・ウェブは、何十億ものWebサーファによって日々使用されている。
現在ではオンラインになることはかなり簡単であり、特定のスキルも、国内または国際事務所での特定の手続きも必要なく、実際にそのような事務所は存在していない。驚いたことに、Webサイトを(予め定められた基準に基づいて)いくつかの系統にグループ化するためにWebを分類しようとする試行は、誰でもこうした分類の恩恵は受けるであろうが、なされていない。したがって、Webサーファが実質的で信頼できる更新情報を取り出すことがますます難しくなっている。Webブラウザは当然助けにはなるが、Webページの数が増えるにつれて、数多くのセマンティック検索要求は、ほとんど未分類の、しばしば重複した、明確でない、そしてとどのつまり、まったく使用できない生のコンテンツをもたらす。
しかし、2000年代初期に、サーファが適当な時に適切な情報を取得するのを助けるシンジケーション(syndication)と呼ばれる解決策が提供された。シンジケーションでは、あるWebサイトのある部分が他のWebサイトに使用できるようになる。より詳細には、Webシンジケーションにおいて、コンテンツ(一般にWebフィードと呼ばれる)は、RSS(Real Simple Syndication)やAtomなど、しばしばXMLベース(XMLとは拡張可能マークアップ言語を表す)などの特定の形でWebサイトに載せられ、フィード・リーダまたはニュース・リーダとも呼ばれ、クライアントの端末またはサーバでローカルに稼働するフィード・アグリゲータと呼ばれる特定のアプリケーションによって対応するコンテンツを取り出すために、別のユーザ(クライアント)が加入することができるフィード・リンクに関連付けられる。
フィードに加入すると、フィード・アグリゲータは、予め定められた間隔(ユーザによって定義することができる)で、更新されたコンテンツをチェックし、取り出すように構成することができる。現在のWebブラウザは、しばしば、iGoogle(商標)およびMy Yahoo(商標)など、内蔵アグリゲータを含む。米国特許出願第2008/0034058号(Marchex,Incに譲渡)および米国特許出願第2008/0046543号(RealNetworksに譲渡)はいずれも、Webフィードを取得するための方法を示す。
フィード・アグリゲータは、ワールド・ワイド・ウェブから更新情報を取り出し、エンド・ユーザがユーザフレンドリなグラフィカル・インターフェイス(GUI)を介してそれを使用できるようにするための強力なリソースであるが、特にユーザが多くのWebフィードに加入しているとき、時として記事の量が半端でない場合がある。この問題に対処するために、フィード・アグリゲータの中には、使用可能な記事を容易にナビゲート可能なカテゴリにソートし、フィルタするために、ユーザがキーワードでフィードにタグ付けできるようにするための機能を含むものもある。しかし、ユーザは、更新されたコンテンツを取得することを望むフィードの事前の分類を行う必要があるため、この解決策は時間がかかる。さらに、(例えば新聞のWebサイトにおいて)取り出すべきコンテンツが更新ごとに題材を変えるとき、Webフィードにタグ付けすることは、まったく無駄である。
米国特許出願第2008/0034058号 米国特許出願第2008/0046543号
十分に使用可能な方法でWebフィードから取り出された情報をWebサーファが自動的に取得できるようにする解決策が明らかに必要である。
本発明の目的は、こうした解決策を提供することである。
したがって、1つの態様によれば、本発明は、シンジケートされたWebコンテンツを集約するための方法を提供し、
・予め定められたWebフィードから更新されたコンテンツを取り出すステップと、
・前記更新されたコンテンツを、以前取り出された(および例えばフィード履歴データベース内に入力として格納されている)格納済みコンテンツと比較するステップと、
・格納済みコンテンツとは異なると考えられる場合、更新されたコンテンツを格納するステップと、
・格納済みコンテンツと同じと考えられる場合、更新されたコンテンツを削除するステップと
を含む。
さらに、
・格納済みコンテンツを補うと考えられる場合、更新されたコンテンツを格納済みコンテンツに追加するステップと、
・更新されたコンテンツと格納済みコンテンツとの間の類似度を示すための類似度指数s を計算するステップと、
・前記類似度指数s を1つまたは複数の閾値と比較するステップとが提供され得る。より詳細には、類似度指数s が2つの閾値SminおよびSmaxと比較され、それによって
・類似度指数s がSmin未満である場合、更新されたコンテンツが格納済みコンテンツとは異なると考えられ、
・類似度指数s がSmaxを上回る場合、更新されたコンテンツが格納済みコンテンツと同じであると考えられ、したがってそれに追加され、
・類似度指数s がSminとSmaxとの間に含まれる場合、更新されたコンテンツが格納済みコンテンツを補うと考えられる。
別の態様によれば、本発明は、
・予め定められたWebフィードから、更新されたコンテンツをチェックし、取り出すように構成されたフィード・リーダと、
・前記更新されたコンテンツと以前取り出された格納済みコンテンツとの比較を管理するように構成されたフィルタ・モジュールと、
・コンテンツを格納するためのフィード履歴データベースと
を含むフィード・アグリゲータを提供する。
フィード・アグリゲータは、前記更新されたコンテンツを格納済みコンテンツと比較するように構成された、フィルタ・モジュールにリンクされた1つまたは複数の入力アナライザも含み得る。より詳細には、1つまたは複数の入力アナライザは、
・更新されたコンテンツと格納済みコンテンツとの間の類似度を示す類似度指数s を計算し、
・前記類似度指数を1つまたは複数の閾値と比較して、更新されたコンテンツがフィード履歴データベースから削除されるべきか、それに追加されるべきかを判定する
ように構成され得る。
本発明の上記および他の目的および利点は、好ましい実施形態の詳細な説明を添付の図面と併せ読めば明らかになる。
本発明によるフィード・アグリゲータの構造を示す略図である。 本発明によるシンジケートされたWebコンテンツを集約するための方法を示すフロー図である。
次に図面を参照すると、図1に、パーソナル・コンピュータ(PC)、サーバ、通信式個人用デジタル補助装置(PDA)、スマートフォンなど、コンピュータ装置の処理ユニットにコンピュータ・プログラムとして実装されるフィード・アグリゲータ1が示されている。
フィード・アグリゲータ1は、離れたWebサイトに設けられたWebフィード3から、更新されたシンジケートされたWebコンテンツをチェックし、取り出すように構成されているフィード・リーダ・モジュール2を含む。フィード・アグリゲータ1は、RSSフィーダを扱うように構成されていることが好ましいが、任意の他の形(Atomなど)を使用することもできる。アグリゲータ1は、ユーザが構成し得るだけの数のWebフィードにリンクすることができるため、図1には3つのWebフィード3が示されているが、これは例示の目的にすぎない。
フィード・アグリゲータ1は、フィード・リーダ2にリンクされたフィルタ・モジュール4も含んでおり、フィード・リーダ2は、以下に開示されるように、重複をなくすためにさらに処理されるように、取り出された更新されたコンテンツをフィルタ・モジュール4に転送する。
フィード・アグリゲータ1は、フィード履歴データベース5をさらに含み、以前取り出されたフィード・コンテンツがここに入力として格納される。
フィード・アグリゲータ1は、フィルタ・モジュール4にリンクされている少なくとも1つの入力アナライザ6をさらに含み、入力アナライザ6は、更新されたコンテンツを、以前取り出され、フィード履歴データベース5に入力として格納されているコンテンツと比較して、更新されたコンテンツを
・フィード・アグリゲータ1から削除すべきであるか
・新しい入力としてデータベース5内に格納すべきであるか
・またはデータベース5内の既存の入力に追加すべきであるか
を決定するように構成されている。
フィード・アグリゲータ1は、フィルタ・モジュール4とフィード履歴データベース5との間に配置され、新しい入力として格納される、または既存の入力に追加されるのに適したものとフィルタ・モジュール4によって決定された更新されたコンテンツを格納するために、フィード履歴データベース5にアクセスし、管理するように構成された履歴アクセス・モジュール7も含む。
次に、フィード・アグリゲータ1の正確な動作について説明する。
ユーザ定義されるたびに、フィード・リーダ2は、ユーザによって加入された予め定められたWebフィード3から、更新されたコンテンツをチェックし、取り出す(100)。以下の説明において、Pが1以上の整数である(P≧1)場合、フィード・リーダ2がP個の加入で構成されると仮定する。jがP以下の整数である(1≦j≦P)場合、Fは、j番目のWebフィード3から取り出された更新されたコンテンツを示す。Fは、Webページ全体またはその一部、テキスト、画像、映像、ハイパーリンクなどを含み得る。Nが1以上の整数である(N≧1)場合、フィード履歴データベース5がN個の入力を含むとさらに仮定する。kがN以下の整数である(1≦k≦N)場合、Eは、フィード履歴データベース5に格納されたk番目の入力を示す。
更新されたコンテンツFは、フィード・リーダ2によってフィルタ・モジュール4に転送され、ここで一時的に格納される。フィルタ・モジュール4は、履歴アクセス・モジュール7を介して、更新されたコンテンツFを比較すべき格納済み入力Eのリストを取り出す。より正確には、フィルタ・モジュール4は、更新されたコンテンツFを、以下のカテゴリ、すなわち削除(消去)する、格納済み入力Eに追加する、新しい入力EN+1として格納する、に分類するために比較すべき格納済み入力Eのリストにおいて反復する。
より正確には、kが最初に1に設定された状態で(110)、少なくとも1つの入力アナライザ6によって、更新されたコンテンツFが格納済み入力Eと比較される(120)。比較は、様々な方法、
・タイトルの基本的な文字列比較
・比較されたコンテンツ間の共通のキーワードを決定するための構文解析
・比較されたコンテンツで使用される共通のオントロジ概念を決定するためのセマンティックベースの分析
を介して実現することができる。比較の分野を限定するために、オントロジ領域は、入力Eに関連付けられた予め定められたタグによって制限することができる。
これらの比較方法は、単独で使用したり、比較プロセス全体の異なるステップとして結合したりすることができる。比較方法の結合された使用は、階層型とすることができる。言い換えれば、構文解析ステップは、タイトルが同じである旨の主張をタイトルの基本的な文字列比較ステップがもたらした場合のみ、同じタイトルを有するが、コンテンツが異なる可能性があるかどうかを判定するために開始することができる。次に、セマンティックベースの分析ステップは、構文が類似していると構文解析ステップが判定したときのみ、比較の精度をさらに高めるために、開始することができる。比較の各ステップは、異なる入力アナライザ6上で稼働することができる。
更新されたコンテンツFと格納済み入力Eとの間の比較を実現すると、入力アナライザ6は、FとEとの間の類似度を示す類似度指数s を計算する(130)。類似度指数s は、フィルタ・モジュール4に提供され、これはまず、s の値に基づいて、FおよびEが同じであると考えられるか異なると考えられるかについて判定し、第2に、その結果として、Fに関する対応する決定を行う。基本的に、s =0%は、FおよびEが異なると考えられることを意味し、s =100%は、それらが同じであると考えられることを意味する。s は、0および100の両方と異なり得るため、これは、FおよびEが同じであると考えることはできないが、異なると考えることもできないことを意味する。更新されたコンテンツFに関して適切な決定を行うために、フィルタ・モジュール4は、少なくとも1つの閾値Sで実施することができ、したがって
・s <Sの場合、FはEとは異なると考えられ、
・s ≧の場合、FはEと同じであると考えられる。
好ましい実施形態において、フィルタ・モジュール4は、2つの閾値、SminおよびSmax、Smin<Smaxで実施され、それによって、
・s ≦Sminの場合、FはEとは異なると考えられ、
・s ≧Smaxの場合、FはEと同じであると考えられ、
・Smin<s <Smaxの場合、FはEを補うと考えられる。
閾値SminおよびSmaxは、ユーザ間で異なり得る必要な精度にしたがって設定することができる。デフォルト値は、Smin=20%、およびSmax=80%に設定することができる。
フィルタ・モジュールは、類似度指数s を閾値SminおよびSmaxと比較し(140)、以下のオプション間でFに関する決定を計算する。
・FがEとは異なると考えられる(s ≦Smin)場合、Fは、次の入力と比較されるものとする。より詳細には、kは1ずつ増分され(150)、比較プロセスはFおよびEk+1を使用して反復される。入力Eが最後のもの(k=N)である場合、Fは、すべての入力E(1≦k≦N)とは異なると考えられるので、フィルタ・モジュール4によって履歴アクセス・モジュール7に提供されて、新しい入力EN+1としてフィード履歴データベース5内に格納される(160)。
・FがEと同じであると考えられる(s ≧Smax)場合、これは、FがEと重複している(したがって役に立たない)ことを意味し、Fがフィルタ・モジュール4によって削除される(すなわちフィード・アグリゲータ1から消去される)(170)。
・FがEを補うと考えられる(Smin<s <Smax)場合、フィルタ・モジュール4によってEに追加されるか、それと結合され、これは、既存の入力Eを修正し、履歴アクセス・モジュール7に修正された入力Eを提供して、フィード履歴データベース5内で以前格納された入力Eと置き換えるようにする。
この比較プロセスは、1≦j≦Pのとき、すべての更新されたコンテンツFについて繰り返される。
上記で開示された方法は、格納済みコンテンツとは異なると考えられるコンテンツのみが新しい入力として格納されるため、重複を回避する。開示されたアグリゲータ1は、真のフィード集約を実現し、それによって類似のコンテンツは、単に並置されるのではなく、マージされる。

Claims (10)

  1. シンジケートされたWebコンテンツを集約する方法であって、
    予め定められたWebフィードから更新されたコンテンツを取り出すステップ(100)と、
    前記更新されたコンテンツを、以前取り出された格納済みコンテンツと比較するステップ(120)と、
    前記格納済みコンテンツとは異なると考えられる場合、前記更新されたコンテンツを格納するステップ(160)と、
    前記格納済みコンテンツと同じと考えられる場合、前記更新されたコンテンツを削除するステップ(170)とを含む、方法。
  2. 格納済みコンテンツを補うと考えられる場合、前記更新されたコンテンツを格納済みコンテンツに追加するステップ(180)をさらに含む、請求項1に記載の方法。
  3. 前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示すための類似度指数s を計算するステップ(130)を含む、請求項1または2のいずれか1項に記載の方法。
  4. 前記類似度指数s を1つまたは複数の閾値と比較するステップを含む、請求項3に記載の方法。
  5. 前記類似度指数s が2つの閾値SminおよびSmaxと比較され、それによって
    前記類似度指数s がSmin未満である場合、前記更新されたコンテンツが前記格納済みコンテンツとは異なると考えられ、
    前記類似度指数s がSmaxを上回る場合、前記更新されたコンテンツが前記格納済みコンテンツと同じであると考えられ、
    前記類似度指数s がSminとSmaxとの間に含まれる場合、前記更新されたコンテンツが前記格納済みコンテンツを補うと考えられる、請求項4に記載の方法。
  6. 格納済みコンテンツと同じであると考えられる更新されたコンテンツが前記格納済みコンテンツに追加される、請求項1乃至5のいずれか1項に記載の方法。
  7. 以前取り出されたコンテンツがフィード履歴データベース内の入力として格納される、請求項1乃至6のいずれか1項に記載の方法。
  8. 予め定められたWebフィード(3)から、更新されたコンテンツをチェックし、取り出すように構成されたフィード・リーダ(2)と、
    前記更新されたコンテンツと以前取り出された格納済みコンテンツとの比較を管理するように構成されたフィルタ・モジュール(4)と、
    コンテンツを格納するためのフィード履歴データベース(5)とを含む、フィード・アグリゲータ(1)。
  9. 前記更新されたコンテンツを格納済みコンテンツと比較するように構成された、前記フィルタ・モジュール(4)にリンクされた1つまたは複数の入力アナライザ(6)をさらに含む、請求項8に記載のフィード・アグリゲータ(1)。
  10. 前記1つまたは複数の入力アナライザ(6)が前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示す類似度指数s を計算するように構成され、前記フィルタ・モジュール(6)が、前記類似度指数を1つまたは複数の閾値と比較して、前記更新されたコンテンツが前記フィード履歴データベース(5)から削除されるべきか、それに追加されるべきかを判定するように構成される、請求項8または9のいずれか1項に記載のフィード・アグリゲータ(1)。
JP2011504433A 2008-04-14 2009-04-09 重複を最低限に抑えるWebフィードを集約するための方法 Expired - Fee Related JP5535193B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08290366A EP2110760A1 (en) 2008-04-14 2008-04-14 Method for aggregating web feed minimizing redudancies
EP08290366.7 2008-04-14
PCT/EP2009/054324 WO2009144078A1 (en) 2008-04-14 2009-04-09 Method for aggregating web feed minimizing redundancies

Publications (2)

Publication Number Publication Date
JP2011517822A true JP2011517822A (ja) 2011-06-16
JP5535193B2 JP5535193B2 (ja) 2014-07-02

Family

ID=39720679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011504433A Expired - Fee Related JP5535193B2 (ja) 2008-04-14 2009-04-09 重複を最低限に抑えるWebフィードを集約するための方法

Country Status (6)

Country Link
US (1) US8521702B2 (ja)
EP (1) EP2110760A1 (ja)
JP (1) JP5535193B2 (ja)
KR (1) KR101595748B1 (ja)
CN (1) CN102037465B (ja)
WO (1) WO2009144078A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015501469A (ja) * 2011-11-11 2015-01-15 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品情報検索結果に対する重複排除の実施

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2952203B1 (fr) 2009-11-05 2012-08-17 Canon Kk Procede de generation d'un flux web et un systeme associe
US9098311B2 (en) 2010-07-01 2015-08-04 Sap Se User interface element for data rating and validation
US9208252B1 (en) * 2011-01-31 2015-12-08 Symantec Corporation Reducing multi-source feed reader content redundancy
US20120284290A1 (en) * 2011-04-11 2012-11-08 Jonathan Keebler System and Method for Syndicating Dynamic Content for Online Publication
US9288165B1 (en) 2011-07-21 2016-03-15 Parlant Technology, Inc. System and method for personalized communication network
US8832301B2 (en) * 2011-07-21 2014-09-09 Parlant Technology System and method for enhanced event participation
US9195771B2 (en) * 2011-08-09 2015-11-24 Christian George STRIKE System for creating and method for providing a news feed website and application
US8443003B2 (en) * 2011-08-10 2013-05-14 Business Objects Software Limited Content-based information aggregation
US9953079B2 (en) 2013-09-17 2018-04-24 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation
CN106339374A (zh) * 2015-07-06 2017-01-18 天津九洲云物联科技有限公司 用于嵌入式系统中的文件型实时历史数据库算法
CN105912615A (zh) * 2016-04-05 2016-08-31 重庆大学 一种基于人类语音内容索引的音频和视频文件管理方法
CN111787390B (zh) * 2020-09-07 2020-11-24 武汉工程大学 基于信息分发系统的内容分发装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH1185779A (ja) * 1997-09-03 1999-03-30 Matsushita Electric Ind Co Ltd 電子ファイル管理装置、電子ファイル管理方法及びその方法を記録した記録媒体
JP2002215676A (ja) * 2001-01-12 2002-08-02 Hitachi Tohoku Software Ltd 関連情報検索方法、関連情報蓄積方法、関連情報検索装置および関連情報検索のための記録媒体
JP2003242166A (ja) * 2002-02-20 2003-08-29 Victor Co Of Japan Ltd 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム
US20080034058A1 (en) * 2006-08-01 2008-02-07 Marchex, Inc. Method and system for populating resources using web feeds
JP2008071296A (ja) * 2006-09-15 2008-03-27 Ricoh Co Ltd データ管理装置、データ管理方法およびデータ管理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080046543A1 (en) 2006-08-18 2008-02-21 Realnetworks System and method for automatically obtaining web feed content
US20100063962A1 (en) * 2006-11-27 2010-03-11 Gautam Dharamdas Goradia Interactive System that, Inter Alia, Does Away with the Need for a User, to Create, Store, Organize and/or Share Files and/or Uniform Resource Locators in Folders and Sub Folders, on a Computer System, Mobile Device, or on a Networks, Blogs, Forums, Intranets, Wireless Application Protocol Portals and the Like
US20090089380A1 (en) * 2007-09-28 2009-04-02 Microsoft Corporation Aggregating and Delivering Information

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH1185779A (ja) * 1997-09-03 1999-03-30 Matsushita Electric Ind Co Ltd 電子ファイル管理装置、電子ファイル管理方法及びその方法を記録した記録媒体
JP2002215676A (ja) * 2001-01-12 2002-08-02 Hitachi Tohoku Software Ltd 関連情報検索方法、関連情報蓄積方法、関連情報検索装置および関連情報検索のための記録媒体
JP2003242166A (ja) * 2002-02-20 2003-08-29 Victor Co Of Japan Ltd 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム
US20080034058A1 (en) * 2006-08-01 2008-02-07 Marchex, Inc. Method and system for populating resources using web feeds
JP2008071296A (ja) * 2006-09-15 2008-03-27 Ricoh Co Ltd データ管理装置、データ管理方法およびデータ管理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6013031050; Ian Garcia、外1名: 'Eliminating Redundant and Less-Informative RSS News Articles Based on Word Similarity and a Fuzzy Eq' Tools with Artificial Intelligence, 2006. ICTAI '06. 18th IEEE International Conference on [ONLINE] , 200611, p.465-473 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015501469A (ja) * 2011-11-11 2015-01-15 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品情報検索結果に対する重複排除の実施

Also Published As

Publication number Publication date
EP2110760A1 (en) 2009-10-21
CN102037465A (zh) 2011-04-27
CN102037465B (zh) 2015-03-04
JP5535193B2 (ja) 2014-07-02
WO2009144078A1 (en) 2009-12-03
KR101595748B1 (ko) 2016-02-29
KR20110009142A (ko) 2011-01-27
US8521702B2 (en) 2013-08-27
US20110119239A1 (en) 2011-05-19

Similar Documents

Publication Publication Date Title
JP5535193B2 (ja) 重複を最低限に抑えるWebフィードを集約するための方法
CN103339623B (zh) 涉及因特网搜索的方法和设备
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US9594826B2 (en) Co-selected image classification
US9015156B2 (en) Interactive computing recommendation facility with learning based on user feedback and interaction
TWI292539B (ja)
US8832058B1 (en) Systems and methods for syndicating and hosting customized news content
CN102368262B (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
US20080082486A1 (en) Platform for user discovery experience
US20080005091A1 (en) Visual and multi-dimensional search
US20080005105A1 (en) Visual and multi-dimensional search
Shi et al. Learning-to-rank for real-time high-precision hashtag recommendation for streaming news
US20100100607A1 (en) Adjusting Content To User Profiles
US20080077494A1 (en) Advertisement Selection For Peer-To-Peer Collaboration
WO2009108576A2 (en) Prioritizing media assets for publication
US20140201203A1 (en) System, method and device for providing an automated electronic researcher
US20100125781A1 (en) Page generation by keyword
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
US20100094826A1 (en) System for resolving entities in text into real world objects using context
JP2009169924A (ja) 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体
US20080077580A1 (en) Content Searching For Peer-To-Peer Collaboration
US20160299972A1 (en) Providing app store search results
US20080140607A1 (en) Pre-cognitive delivery of in-context related information
CN107025261B (zh) 主题网络语料库
CN106462588B (zh) 来自所提取的内容的内容创建

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120406

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120713

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140422

R150 Certificate of patent or registration of utility model

Ref document number: 5535193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees