JP2009211697A - 情報配信システムおよび情報配信方法 - Google Patents

情報配信システムおよび情報配信方法 Download PDF

Info

Publication number
JP2009211697A
JP2009211697A JP2009044720A JP2009044720A JP2009211697A JP 2009211697 A JP2009211697 A JP 2009211697A JP 2009044720 A JP2009044720 A JP 2009044720A JP 2009044720 A JP2009044720 A JP 2009044720A JP 2009211697 A JP2009211697 A JP 2009211697A
Authority
JP
Japan
Prior art keywords
user
information
model
inquiry
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009044720A
Other languages
English (en)
Inventor
Yingju Xia
迎炬 夏
Hao Yu
浩 于
Gang Zou
ゾウ ガン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2009211697A publication Critical patent/JP2009211697A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ネットワークユーザが情報を創造および編集し、情報をWEBサイトに配信する個人用情報配信のためのシステムおよび方法を提供する。
【解決手段】本システムおよび方法では、ユーザ入力と、ユーザの特徴を決定するのに適したユーザモデルと、に基づき問い合わせ条件を構築し、問い合わせ条件に基づき問い合わせを行い、得られた問い合わせ結果を処理して、処理された情報をユーザに提供し、ユーザが編集した配信される情報を配信する。
【選択図】図1

Description

本願は、主に個人用情報サービスの分野に関し、特にユーザに対して個人用情報配信を提供するシステムおよび方法に関するものである。
ネットワークアプリケーションが日々発展するなか、ネットユーザが要求するものは絶えず新しくなっている。ユーザ自身を軸として、コンテンツ、エンターテイメント、ビジネス、コミュニケーション、および、他の様々な個人用アプリケーションを再統合することで、個人用のニーズを最大限に満たすことが求められている。WEB2.0時代の到来によって、個々のユーザの価値観は今まで以上に反映されるようになった。つまり、大多数のネットユーザは情報のクリエーターであり伝達チャンネルであると同時に、情報の受け手でもある。ネットユーザは能動的に情報を選択し、他方で、情報は能動的に適切なユーザを探し出す。昔はオンラインへアクセスすると情報を単方向的に取得するようになっていたかもしれないが、次のWEB2.0の時代ではオンラインのネットユーザを通した双方向的である相互通信をする機会が飛躍的に増える。しかし、現在利用可能である個人用サービスとしてユーザに提供されているものは、たいてい以下のものに留まる。Google(登録商標)が提供する個人用WEBページランキング技術などの個人用情報検索サービス、YahooWEB2.0、Rollyo、MSN(登録商標)が提供するコミュニティ検索サービス、YahooAnswers、iAsk、BaiduKnowsが提供するコミュニティQ&Aサービス、vivisimo、looksmart、kooxooが提供する情報のクラスタリングおよび分類技術サービスである。
個人用情報検索に関しては多くの文献があり、例えば特許文献1〜18がある。また、他に、個人用サービスに関する文献として、例えば特許文献19〜26がある。これらの文献は、ここで参照することにより援用される。
米国特許第5761662号明細書 米国特許第6199067号明細書 米国特許第6381594号明細書 米国特許第5694459号明細書 米国特許第6539377号明細書 米国特許第915755号明細書 中国特許出願公開第1664819号明細書 中国特許出願公開第1667607号明細書 中国特許出願公開第1647527号明細書 中国特許出願公開第1503163号明細書 中国特許出願公開第1319817号明細書 中国特許出願公開第1811780号明細書 中国特許出願公開第1529863号明細書 中国特許出願公開第1710560号明細書 中国特許出願公開第1499401号明細書 中国特許出願公開第1870026号明細書 中国特許出願公開第1932871号明細書 中国特許出願公開第1602029号明細書 米国特許第6044395号明細書 米国特許第7110994号明細書 米国特許第6671715号明細書 米国特許第7159029号明細書 中国特許出願公開第1302503号明細書 中国特許出願公開第1630859号明細書 中国特許出願公開第1656482号明細書 中国特許出願公開第1537282号明細書
しかしながら、これまでに、個人用情報配信をユーザに提供するアプリケーションはなかった。
ネットワークユーザからの情報配信への急増する要求を満たすために、開示の技術は、ネットワークユーザが情報を創造および編集し、情報をWEBサイトに配信する個人用情報配信のためのシステムおよび方法を提供する。
前述の目的を満たすために、本願は以下の技術を提供する。
本願が開示する情報配信システムは、ユーザ入力と、ユーザの特徴を決定するのに適したユーザモデルと、に基づき問い合わせ条件を構築する問い合わせ条件決定部と、問い合わせ条件に基づき問い合わせを行う検索部と、検索部によって得られた問い合わせ結果を処理して、処理された情報をユーザに提供する問い合わせ結果処理部と、ユーザが編集した配信される情報を配信する情報配信部と、を備える。
また、本願が開示する情報配信方法は、ユーザ入力と、ユーザの特徴を決定するのに適したユーザモデルと、に基づき問い合わせ条件を構築する問い合わせ条件決定ステップと、問い合わせ条件に基づき問い合わせを行う検索ステップと、検索部によって得られた問い合わせ結果を処理して、処理された情報をユーザに提供する問い合わせ結果処理ステップと、ユーザが編集した配信される情報を配信する情報配信ステップと、を含む。
本願を適用することで、ユーザが情報を構築し、情報を編集し、情報を検索するのに要する時間を大幅に短縮するという利点が得られる。また、ユーザは迅速かつ時間効率良くフィードバック情報を得ることができ、ユーザは情報を配信後の各WEBサイトの返信を閲覧するのに時間を費やす必要は無くなるため、ユーザがフィードバックを待つ時間を節約することができる。
本願の実施例に係る情報配信システムの概要を示すブロック図である。 本願の実施例に係るユーザモデルの処理を示すフローチャートである。 本願の実施例に係るサンプルとテンプレート検索の処理を示すフローチャートである。 本願の実施例に係るWEBサイト問い合わせの処理を示すフローチャートである。 本願の実施例に係る情報配信の処理を示すフローチャートである。 本願の実施例に係る情報追跡の処理を示すフローチャートである。
以下、図面を参照して、本願の具体的な実施例を詳細に説明する。これらの実施例は最良の形態にすぎず、本願を限定するものと解釈されるべきではない。
図1は、本願の実施例に係る情報配信システムを示す構成図である。図1に示すように、本願に係る情報配信システム120は、ユーザモデル部122、問い合わせ部121、情報配信部123、情報追跡部124から構成される。
ユーザモデル部122は、ユーザの個人情報に基づいてユーザモデルを生成する。上手く生成されたユーザモデルは、ユーザの特徴と関心を反映し、かつ、ユーザの興味の変化に応じて変化することができるモデルである。図2は、本願の実施例に係るユーザモデル部122がユーザモデルを生成する際の処理を示すフローチャートである。以下、図2を参照して、ユーザモデル部122を更に詳細に説明する。
問い合わせ部121は、ユーザから入力された問い合わせ条件とユーザモデル部122が生成したユーザモデルとに基づいて、最終的な問い合わせ条件を決定し、検索を行い、ユーザが編集および変更を行うために、ユーザに情報配信のできるWEBサイト、または、配信可能なサンプルおよびテンプレートの少なくとも1つを提供する。問い合わせ部121は、問い合わせ条件決定部125、検索部126、問い合わせ結果処理部127を含んで構成されてもよい。
問い合わせ条件決定部125は、ユーザ110によって入力された問い合わせ条件を受け取り、ユーザモデルに基づいて当該問い合わせ条件を拡張または変更し、最終的な問い合わせ条件を決定する。
検索部126は、例えば、単数または複数の検索エンジンによって実現される。さらに、検索部はGoogle(登録商標)やYahoo!(登録商標)が提供しているものなどの外部検索ツールを利用することが出来るので、検索部はこれらの外部検索ツールを起動し利用してホスト機またはネットワーク130から問い合わせ結果を得るものであってもよい。問い合わせ部121は、サンプル(情報)とWEBサイトの問い合わせを行う。サンプルの問い合わせとは、既に配信されているサンプルの問い合わせを行うことを意味する。例えば、アパート賃貸に関する情報を配信しようとするとき、サンプルは既に他者によって配信されているアパート賃貸情報を意味する。WEBサイトの問い合わせとは、情報配信が可能なWEBサイトの問い合わせを行うことを意味する。
問い合わせ結果処理部127は、検索部126によって問い合わせのあった結果を処理して、ユーザに情報を提供する。当該処理とは、ランク付け(図3のステップ350および図4のステップ470参照)、WEBページ種類識別(図4のステップ450参照)、クラスタリング(図3のステップ370参照)などである。図3は、本願の実施例に係るサンプル問い合わせ部の処理、テンプレート生成の処理を示すフローチャートである。図4は、本願の実施例に係るWEBサイト問い合わせ処理を示す図である。以下、図3および図4を参照して、問い合わせ部121および問い合わせ結果処理部127を詳細に説明する。
情報は複数のWEBサイトに配信されることが多く、情報が配信された後に応答情報を得るため、ユーザは情報または文書を送信したWEBサイトに絶えずアクセスして最新の応答情報を得るのが一般的である。これにより、多大な時間と労力がユーザにかかってしまう。この問題を解決するため、本願は情報追跡部124を提供する。情報追跡部124は自動的にユーザへの応答を追跡する。図6は本願の実施例に係る情報追跡部124の処理を示すフローチャートである。以下、図6を参照して、情報追跡部124を更に詳細に説明する。
ここで図2を参照して、本願に係るユーザモデル部122によって実行される処理を詳細に説明する。
図2に示すように、ユーザモデル部はまずステップ210でユーザアカウントを作成して、各ユーザを区別する。ユーザアカウントはユーザのテンプレートの識別子であり、各ユーザアカウントは登録されたアカウントに関してある一人のユーザに対応する。ユーザアカウントと対応するユーザモデルはユーザに個人用情報サービスを提供する。匿名ユーザの場合は、ユーザアカウントはある1つの種類のユーザに対応する。例えば、ユーザの地域に基づいて異なるユーザアカウントを作成してもよい。ユーザの性別や年齢がすべてある1つのユーザアカウントに対応してもよい。ユーザアカウントは様々な方法で作成してよい。例えば、ユーザアカウントについて単にデータベースを構成してもよい。
続いてステップ220で、ユーザモデルを作成するための情報である、ユーザのユーザ情報260を収集する。ユーザモデル部122は、識別モード(明示モード)および非識別モード(非明示モード)の少なくとも1つで、ユーザモデルを作成するための情報を得ることができる。識別モードで取得する情報はユーザの登録情報およびシステムの処理中にユーザが入力するよう求められた情報である。他方、非識別モードで取得する情報は、ノン・インタラクティブモードで収集される、ユーザが頻繁に利用する問い合わせ語、ユーザが頻繁に閲覧するWEBページ、接続時間、接続場所、およびユーザの閲覧傾向などの情報である。限定するものではないが、ユーザ情報260は以下を含む。
個人情報261:住所、電話番号、年齢、性別、職業、学歴、収入、および趣味など。
ユーザ記述262:問い合わせ結果の最適化と、検索対象の表示とを容易にするための、ユーザによって提供される更に詳細な情報。ユーザ記述には、ユーザが一般的な関心を詳細に記述することができるように、多くの形式を取ることができる。また、ユーザ記述には、ユーザの関心に沿ったWEBページやWEBサイトを提供することもできる。ユーザによるある検索処理を通して、キーワードよりも詳細な記述を提供することもできるので、これもユーザ記述の一形式である。例えば、ユーザが「apple」というキーワードを入力した後に、「ApplePCコンピュータの、モデル、価格、スペック、評価、最新製品の写真に関する情報、また、ApplePCコンピュータのニュース、市場、評価、販売業者に関する情報について知りたい。」という文章を付け足すことができる。あるいは、ユーザは例えば「http://www.apple.com.cn/getamac/whichmac/html」のように、WEBサイトまたはWEBサイトに関したサンプル文書を入力することで、衣類ブランドや果物ではなく「Appleコンピュータ」にユーザが関心を持っていることを示すことができる。
ユーザ検索履歴ログ263:使用キーワード、問い合わせ結果のアクセス記録等を含む。
ユーザ相互情報264:ユーザの直接的なフィードバックと、ユーザによる情報配信処理の詳細な記述などを含む。ユーザ相互情報264は、ユーザモデルを修正するための、および、より適切な個人用サービスを提供するための主要情報である。ユーザ相互情報は識別モードと非識別モードに分けることができる。識別モードのユーザ相互作用は、ある情報サービス処理における検索または配信の結果に対するユーザからの直接的なフィードバックである。どの結果がユーザの需要により適合するのかをシステムに教えることになる。このようなフィードバックは、ユーザモデルの最適化システムを修正するのに直接的に利用することができる。非識別モードのユーザ相互作用は、例えば、サンプルやテンプレートをユーザが選択する処理において、サンプルのクリックや読み込み時間である。
ユーザグループ情報265:ユーザグループとは、所定の分類システム上で類似したユーザから構成される集まりのことである。ユーザグループ情報は、ユーザグループの情報を合成して得られる情報であり、ユーザグループ内のユーザによって共有されている共通情報を反映する。ユーザグループ情報265はユーザモデルを補足し変更するのに用いることができる。
類似したユーザは、ユーザグループを作成することができる。ここで明確にすべき概念として、「ユーザの関心」という概念はトピックのことである。他の言葉でいうと、所定の時間またはフェーズを通してユーザが興味を持っているトピックのことであり、関心と趣味のような意味で捉えられる「関心」を意味しない。例えば、ユーザが「2008年度オリンピック」に注目している場合、ユーザがシステムを利用して問い合わせ処理をする間に、システムは「2008年度オリンピック」に関するトピックを構築し、そのトピックによってユーザが現在注目している関心の的が示される。オリンピックの終了後、ユーザは「2008年度オリンピック」に関するコンテンツの問い合わせを二度としないかもしれないが、この時には既に「関心」または「トピック」は消滅しているためである。ユーザが「2008年度オリンピック」について「関心」または「トピック」の問い合わせをした場合、システムは現在有効なユーザを検索して、このトピックに関する問い合わせをした人がいるかどうかを調べて、このトピックに関する問い合わせをした現在有効なユーザのデータに基づいて、現在のユーザの問い合わせを最適化することができる。ここで、ユーザグループの情報、および、ユーザ個別の情報を活用することができる。すなわち、この関心に注目しているユーザ数が十分にある場合、この関心に係るユーザグループを形成することができる。
なお、上述のユーザ情報は実際の適例に過ぎない。当業者は特定の適用法での必要に応じて、特定の情報を集めることができる。
次に、ステップ230で、収集したユーザ情報260に基づいてユーザモデルが構築される。上手に構築されたユーザモデルは、ユーザの特徴と関心を反映し、ユーザの関心についての変更の記録をつけるものである。
ユーザモデルを構築するためには、推論エンジンの方法、空間ベクトルモデルの方法、言語モデル化の方法、オントロジーの技術、直接抽出の方法などを利用することができる。推論エンジンの方法については、次の文献を参照するとよい。「Data & Knowledge Engineering, Studer R Fensel D Fensel D 1998 / 25 / 1-2」、「RACER System Description, University of Hamburg, Computer Science Department, Volker Haarslev」、「Jena2.2 (beta).released, http://jena.sourceforge.net/」。空間ベクトルモデルの方法については、次の文献を参照するとよい。「Salton, G, the SMART Retrieval System - Experiments in Automatic Document Processing. Prentice-Hall, Englewood. Cliffs, New Jersey, 1971」、「Salton, G., Dynamic Information and Library processing. Prentice-Hall, Englewood Cliffs, New Jersey, 1983」。言語モデル化の方法については、次の文献を参照するとよい。「Jay M. Ponte and W. Bruce Croft. A language modeling approach to information retrieval. In Proceedings of SIGIR, pages 275-281, 1998」、「Hugo Zaragoza, Djoerd Hiemstra, and Michael Tipping, Bayesian extension to the language model for ad hoc information retrieval. In Proceedings of SIGIR, pages 4-9, 2003」。
本願の実施例では、ユーザモデルは2段階に分割される。まずはユーザ一般モデルUMgであり、このUMgに基づいて、ユーザ関心モデルUMsがユーザの異なる関心に応じて構築される。言い換えると、一般モデル型と関心モデル型という、二種類のモデルが構築される
ユーザ一般モデルは、ユーザの一般的な情報を含むモデルである。例えばユーザ個人情報261(住所、電話番号、年齢、性別、職業、学歴、収入、趣味など)からの情報を抽出することによって、または、推論エンジン分析またはベクトル分析をユーザ記述に対して実行することによって得ることができる。
ユーザ一般モデルは通常RDF三元式(リソース、属性、宣言または属性値)で実現される。例えば、住所、電話番号、年齢、性別、職業、学歴、収入、趣味などの属性それぞれに、属性値が与えられる。次の具体例は簡易化したユーザモデル記述である。ユーザ一般モデルは属性リストで記述することができる。属性リストはユーザモデルの形式的記述であり、属性と属性値は個人用検索における推論の基礎として用いられる。
<UMg ID= “000001”>
<USER_NAME>user1</USER_NAME>
<USER_AGE>26</USER_AGE>
<USER_SEX>female</USER_SEX>
<USER_OCCUPATION>Business manager</USER_OCCUPATION>
<USER_EMAIL>user1@gmail.com</USER_EMAIL>
<USER_CATEGORY>individual</USER_CATEGORY>
<USER_QUERY_WORDS>toyota;car</USER_QUERY_WORDS>
<USER_HOBBY>sport</USER_HOBBY>
... ...
</UMg>
上述のユーザモデルはユーザ1を表している。上述の内容から分かるように、ユーザ1は営業管理職をしている26歳の女性であり、スポーツが好きでよくトヨタ製の自動車について検索する。
このような一般モデルでは、趣味は特定のトピックに向けられるものではなくユーザの一般的な趣味のことでる。例えば、「スポーツ」への好みと「2008年度オリンピック」への注目は2種類の異なる関心である。
ユーザ関心モデルUMsはユーザが要求する特定の情報に関して構築されるものである。要求とは、例えば、家を借りたり、車を購入したりするための要求である。情報への要求は比較的大きく異なるものなので、これらを表すのに統合モデルを用いることは出来ない。さらに、ある情報への要求に関して、ユーザの関心の的は通常時間が経つにつれて変わる。したがって、情報への要求それぞれに対して特定のユーザ関心モデルを構築し、ユーザの関心の変化に応じてモデルを絶えず修正し続けることが望まれている。ユーザが情報への要求を送信した場合(問い合わせ要求のこと。例えば、ユーザが「apple」について要求を送信した場合)、システムは特定の情報への要求に基づいて関心モデルを構築する(ここでは、「apple」に対するユーザの問い合わせ要求に基づいてユーザ関心モデルを構築する)。既にこのような関心モデルが存在する場合、ユーザからの情報に対する要求の送信に基づいて関心モデルを修正することができる。ユーザ関心モデルUMsの構築は、ユーザ一般モデルUMg、ユーザの検索語および記述、また、ユーザに提供されたサンプル文書に基づいて行われる。つまり、関心モデルの構築に利用するものは、個人情報261、ユーザ記述262、ユーザ検索履歴ログ263、ユーザ相互情報264、ユーザグループ情報265だけでなく、ユーザ一般モデルも利用する。ユーザ関心モデルの構築処理中に、ユーザの一般モデルに基づいて調整が行われる。例えば、「apple」のユーザ関心モデルに関して、ユーザ一般モデルにあるコンピュータへのユーザの関心と、問い合わせ履歴にあるApple製コンピュータの問い合わせ結果とに基いて、ユーザ関心モデルに「ノートパソコン」および「コンピュータ」に関する情報が追加される。
あるユーザ関心モデルは例として次のように表される(それぞれの語の後に記される数値は、関心モデルにおけるその語の重みを表す)。
apple 0.92
ノートパソコン 0.9
コンピュータ 0.9
情報/メッセージ 0.89
マーケット 0.88
評価 0.88
販売業者 0.86
デスクトップ 0.78
設定 0.76
メモリ 0.75
ハードディスク 0.75
基本周波数 0.73
グラフィックカード 0.72
価格 0.68
新製品 0.66
モデル 0.65
マウス 0.56
ディスプレイ 0.55
ソフトウェア 0.52
オペレーションシステム 0.52
情報 0.5
上述のモデルは表の形式で保存することができるし、または次の形式で保存することもできる。
<USER_QUERY_WORDS>apple</USER_QUERY_WORDS>
<WEIGHT>0.92</ WEIGHT >
・・・ ・・・
<USER_QUERY_WORDS>information</USER_QUERY_WORDS>
<WEIGHT>0.5</ WEIGHT >
モデル構築の特定処理中に、モデル構築のための情報は、例えば、キーワード抽出法を用いて個人情報261から抽出することができる。例えば、「性別」というキーワードに基づいて上述のモデル中の女性という情報が得られる。
ユーザ記述262も、ユーザモデルを構築するために重要な情報である。例えば、ユーザに提供されたサンプル文書(上述したように、ユーザに提供されたサンプル文書はユーザ記述の一種である。ユーザは文章入力の形式、または、サンプルの文書またはWEBサイトの形式で当該ユーザの記述を送信することができる)を用いて、ユーザの関心(ベクトル空間モデルでの各用語の重み)を示すキーワードを抽出することができる(例えば、ベクトル空間モデルを用いて抽出を行うことができる)。
ベクトル空間モデルは、ユーザ関心モデルUMsの一種の記述モードである。ベクトル空間モデルは、文書のベクトルから得られる。例えば、ベクトル空間モデルにおいて、文書のベクトルW(ti)は次のように定義される。
W(ti)=log(TF(ti,d)+1)×log((N/DF(ti,d))+1)
式中で、用語頻度TF(ti,d)は文書d内での用語tiの出現頻度を表し、文書頻度DF(ti,d)は文書中でtiが少なくとも1回は出てくる文書の数を表し、Nは文書の総数を表し、logはブリッグスの対数やネイピアの対数などにおける対数演算子を表す。
検索履歴ログ263の利用に関しては、特定の例中において、検索履歴中のキーワードを用語頻度に基づいてランク付けして、特定の検索処理における推論エンジンの始動条件として機能させることができる。例えば、ユーザの検索履歴中にコンピュータやパソコンの分野に関する情報が大量にある場合、ユーザの関心がコンピュータの分野にあると決定することができる。そのため、あいまいなクエリ用語がユーザから入力された場合、システムは前述の情報に基づいて調整を行うことができる。例えば、ユーザが「apple」というキーワードを入力した場合、システムは推論によってユーザの検索傾向はコンピュータ分野のブランド名である「Apple」に向けられているのだと知ることになる。
検索履歴中のキーワードを分類して、クラスごとにベクトルを構築することも可能である。ベクトルにおける各用語の重みは、用語頻度を用いて算出できるようにする。特定の実施例では、次の計算式を用いる。
Ti=log(1+tfi)
式中で、Tiは用語の重み、つまり、ベクトル空間モデルの重みを表し、tfiは用語の出現頻度を表す。
ユーザ相互情報264を用いてユーザモデルの構築と修正を行うことで、より適切な個人用サービスを提供することができる。ユーザのフィードバックから得られた評価的文書と否定的文書を用いて、ユーザのベクトル空間モデルの構築と修正を行うことができる。また、ユーザのフィードバックから得られるキーワードを当該ユーザのユーザモデルに追加することができる(例えば、情報リストの形式)。
ユーザグループ情報265を用いてユーザモデルの捕捉と訂正を行うことができる。ユーザグループは所定の分類システム上において類似ユーザから構成される集団である。ユーザグループ情報を用いることで、現在のユーザモデルを訂正することができる。ユーザモデルの構築処理中に、協調フィルタリング法を使ってユーザグループの中から、指定ユーザの関心と同一または類似の関心を持つユーザを見つけることができる。これらの同一または類似のユーザによる情報に対する評価を統合して、特定の情報に対する当該指定ユーザの好感度の予測をシステム上で行うことができる。
モデル構築の前後で、オントロジー技術を用いて、手動、または、機械学習法によって自動で、各属性の各属性値向けに分類用語リストを構築することができる。職業属性について分類用語リスト構築する例をあげると、特定の職業に関連してよく出てくる用語が用語リストに組み込まれる。実用上、IT分野でよく使われる用語と、金融分野でよく使われる用語とは非常に異なる。このような用語リストは、問い合わせの拡張に用いたり、ベクトルの形式で問い合わせ結果の再ランク付けやフィルタリングに用いたりすることができる。例えば、「コンピュータ」を、「電子計算機」、「ノートパソコン」、「デスクトップ」、「サーバ」等へと拡張することができる。
概念の説明をすると、工学技術分野で、「オントロジー」は客観的に存在する概念と関係の記述のことである。一般的な意味では、「概念の明示的集合」のことであり、「クラスと種類」や「関係」に関連する語彙リストである。
システムは、現在のオントロジー、または、多数のユーザの統計から得られるオントロジーを通して、年齢、性別、職業、学歴などのユーザから提供される情報を拡張することができる。例えば、異なる職業を持つユーザの共通用語、関心の的などの情報についてオントロジーを構築することができ、また、このオントロジーはオントロジーに基づいて特定のユーザに関して拡張することができる。
さらに、記述されるべき内容として、上述のステップ220は繰り返し実行される。言い換えると、システムの処理実行中にユーザ情報260が絶えず収集されて、ユーザモデルを更新するために(ステップ240)、学習処理が実行される(ステップ250)。
以下、図3を参照して、本願の実施例に係る問い合わせ部121のサンプル問い合わせ処理を説明する。問い合わせ部121は、ユーザの問い合わせ用語とユーザモデル部が構築するユーザモデルとに基づいて、個人用情報検索を提供する。問い合わせには、サンプルの問い合わせと、WEBサイトの問い合わせが含まれる。本願に係る問い合わせ部はさらにテンプレート生成機能を持つ。
図3に示すように、まずステップ320で、ユーザは問い合わせ語(問い合わせ条件)を入力する。続いて、システムは問い合わせ条件を修正する(ステップ330)。システムは、まずユーザモデル310に基づいて問い合わせ条件を拡張する。例えば、ユーザが「apple」という問い合わせ語を入力する場合、システムはユーザテンプレートに基づいて問い合わせ語を拡張する。テンプレート中で<USER_QUERY_WORDS>欄はユーザが以前に用いた問い合わせ語を表す。システムはこの欄にある用語を用いて拡張を行う。ユーザモデルの<USER_QUERY_WORDS>欄に「コンピュータ」という問い合わせ語がある場合(例えば、<USER_QUERY_WORDS>computer</USER_QUERY_WORDS>)、ユーザによって頻繁に用いられる問い合わせ語はコンピュータ分野のものだと分かるので、この問い合わせ語に「電子計算機」、「ノートパソコン」などの拡張語が追加される。なお、問い合わせの拡張処理は増減可能であり、システムは問い合わせ結果の数を調べて、十分な数の文書が検索されるように自動的に問い合わせ語を増減することができる。
続いて、修正された問い合わせ条件に基づいて検索が行われる(ステップ340)。修正後の問い合わせ条件に基づいて、システムは、ローカルデータベース391とネットワーク392上に、予備的な検索結果を取得する。
上述のステップ320、330、340は、問い合わせ部(サンプル問い合わせ部)によって実現することができる。
検索結果(問い合わせ結果)に基づいて、システムはユーザモデルに従って検索結果のフィルタリングと再ランク付けを行う(ステップ350)。この処理は、様々な方法で行うことができる。例えば、特定の実施例では、ユーザモデルをベクトル空間モデルの形式に変換し、検索結果とユーザモデル(ベクトル空間モデルの形式)との間の文書類似度を用いて、問い合わせ結果の文書をランク付けすることができる。具体的には、2つの文書の類似度はベクトル空間モデル間の角度によって表される。
Figure 2009211697
式中で、Sim(D,D)は2つの文書間の類似度を表し、w1kは文書1中の各用語の重みを表し、w2kは文書2中の各用語の重みを表し、Nは文書1および文書2の用語の総数を表す。
上記に基づいて、WEBページの信頼度、規模と影響度とともに、WEBページのレビュー数、WEBページへの返信数、返信中における不要な情報の割合、参照数などの要素によって、WEBページのランク付けを行う。ユーザの検索要求に最も適したWEBページが一番にランク付けされる。フィルタリングと再ランク付けとが行われた問い合わせ結果をサンプルとして用いて、ユーザはこのサンプルの中から選択することができる。ユーザは問い合わせ結果を閲覧して、その中から1つを選択することによって編集することができる。
簡潔にいうと、文書類似度は上述の方法で用いられ、重みが閾値よりも低いものはフィルタリングにより除外されて、重みが閾値よりも高いものは類似度の大きさに基づいて再ランク付けされる。
システムは同時に別のサービスを提供する。例えば、検索によって得られたサンプルに基づいて、いくつかのサンプルをクラスタリングと要約化によって文書テンプレートへと統合する(ステップ370)。ユーザはこのテンプレートに基づいて編集するよう選択することができる。テンプレートは多数のサンプルを統合して形成されるため、ここでのフォーマットと用語は、多数のサンプルの中でも最も使用頻度が高く、最もユーザの好みにあったものである。ユーザがテンプレートに基づいて修正を行うことで、時間の大幅な節約になり、オンラインに置かれる文書の品質が保証されることになる。
ユーザが編集を行うのと同時に、システムはユーザが選択することのできる頻出語と頻出文を提供することができる。この頻出語と頻出文もまたクラスタリング技術を用いて実現される。
上述のステップ350とステップ370は、問い合わせ結果処理部127によって実現することができる。本願に係る実施例では、問い合わせ結果処理部127は、例えば、問い合わせ部によって得られた問い合わせ結果をフィルタリングするフィルタリング部、フィルタリングした問い合わせ結果をランク付けするランク付け部、ランク付けされた問い合わせ結果360をクラスタリングして、テンプレートリスト382、頻出候補語383、頻出候補文381を生成するクラスタリング部を含む。
さらに、検索処理中に、システムは明示モードあるいは非明示モードで、ユーザからのフィードバックを得て、このフィードバックを用いてユーザモデルを修正することができる。特定の実施例では、擬似相関フィードバックアルゴリズムを用いて、モデルを訂正する。擬似相関フィードバックアルゴリズムは、1971年にRocchioによって提案されたフィードバック法に基づいた次の機械学習アルゴリズムである。
Figure 2009211697
多くの結果が戻ってくるかもしれないので、実際の応用では、ユーザが結果に対して1つずつフィードバックを行うことは不可能である。そのような状況では、結果の評価的なサンプルをユーザから実際に得ることは偶発的になる。この問題を解決するため、ユーザからフィードバックが得られなかった文書に対してモデル上での類似度は相対的に低く、この結果は無関係なものだと想定する。このような「無関係」は、ユーザから「無関係」と実際に記された結果と同一に扱うことはできないことがある。このため、Rocchioの公式を次のように調整する。
Figure 2009211697
式中で、Trel、Tpart_rel、Tirrel、Tpart_irrel、Tundetは、それぞれ、関係文書の集合、部分的関係文書の集合、無関係文書の集合、部分的無関係文書の集合、未決定文書の集合を表す。また、α、α’、β、β’、β”はそれぞれの重みを表し、Poは調整前の係数を表し、P’は調整後の係数を表す。関係文書の集合はユーザの問い合わせに関係した文書の集合を表す。ユーザとのインタラクティブ処理中に、問い合わせ結果をリスト化して、ユーザに「関係」、「部分的関係」、「無関係」、「部分的無関係」についての決定を行わせる。「関係」とはその問い合わせ要求に合っている文書だとユーザが見なしていることを意味し、「部分的関係」はその問い合わせ要求に完全に合っている訳ではないがある程度は関係している文書だとユーザが見なしていることを意味する。言い換えると、「関係」、「部分的無関係」、「無関係」、「部分的無関係」は文書の関連性の程度に関してのユーザの判断である。ユーザからフィードバックを得たり、フィードバックのあった文書を得たりする可能性は非常に低いので、ほとんどの文書はユーザからのフィードバックがなく、「未決定」に分類される。Rocchioの式と比較して、部分的関係文書の集合、部分的無関係文書の集合、未決定文書の集合を式に組み込み、α’、β’、β”をそれぞれの重みを表す係数として用いる。式中のパラメータは、例えば、α=1.0、α’=0.5、β=1.8、β’=0.5、β”=1.8のように設定することができる。
個人用検索処理には、さらにWEBサイトの検索も含まれる。図4は、実施例に係るWEBサイト検索処理を示す図である。この処理はテンプレート検索と類似している。この処理では、ユーザモデルは問い合わせ拡張に適用されて、問い合わせを決定するのに利用される。上述の例のように、ユーザが「apple」などの問い合わせを入力した場合、ユーザモデルに基づいて「apple、コンピュータ、ノートパソコン」へと拡張される。したがって、WEBサイト検索処理において、コンピュータに関係したWEBページだけを検索することが可能になる。WEBサイト検索において異なる点は、WEBページ種類識別(ステップ450)を実行する必要性にある。WEBページ種類識別により、あるWEBページがWEBサイトのホームページか索引WEBページかを区別する。WEB種類識別によって、ホームページ、索引WEBページ、副索引WEBページが保持されて、WEBサイト中の他のWEBページは除外される。
必要なWEBページの取得後、システムはWEBサイトの評価ランク付けを行う必要がある(ステップ470)。例えば、評価処理では、信頼度、規模、影響力、ユーザ数、アクセス数、ユーザの参照数など、最初にWEBサイトの様々な情報を収集する。次に、各情報の重み平均を式「w=Σw」の通りに算出する。式中で、pはWEBサイトへの評価する際のそれぞれの基準を表し、wは対応する重みを表す。最終的に得られるwはWEBサイトの評価結果である。ランク付け後のwは、情報配信の優先度として用いられ、推奨WEBサイトのリストとしてユーザに勧められる(ステップ480)。なお、WEBサイトの評価処理を予め行うこともできるし、時間に合わせて更新することもできる。したがって、本願の実施例では、ステップ470においては、単に関係WEBサイトのランク付けを行うようにすることができる。
上述のステップ450およびステップ470は、問い合わせ結果処理部127によって実現することができる。本願の実施例では、問い合わせ結果処理部127は、例えば、問い合わせ部121によって得られた問い合わせ結果にWEBページ種類識別を行い、WEBサイトを代表するWEBページだけを保持するWEBページ種類識別部、識別されたWEBサイトを評価するWEBサイト評価部、校訂結果に基づいてWEBサイトのランク付けを行うWEBサイトランク付け部を含む。上述のように、WEBサイト評価部を省略することもできる。評価結果は予め記憶部に保存することができ、WEBサイトランク付け部はWEBサイトのランク付けを行う際に記憶部に保存された評価結果を参照することができる。
以下、図5を参照して、本願に係る情報配信部123を説明する。情報配信部123は、検索に基づいてユーザが情報配信できるように支援する。図5は、特定の実施例におけるシステムの処理を示すフローチャートである。この処理中に、システムは複数のモードでユーザが情報配信処理を行うことができるように支援する。図5に示すように、特定の実施例において、ランク付けされた問い合わせ結果(すなわち、サンプルリスト)(ステップ561)をユーザに提供することで、ユーザは問い合わせ結果に基づいてリスト化されたサンプルに判断を加えることができ、この中からモデルの文書としてテンプレート化して(ステップ510)、このモデル文書に基づいて修正を行うことができる(ステップ520)。ユーザが修正処理を終えた後、システムはWEBサイトを推奨する(ステップ550)。情報配信に利用可能なWEBサイトであり、ユーザの検索に基づいて、ユーザはこの中から選択することができる。ユーザが情報配信のためのWEBサイトを選択した後(ステップ530)、システムはユーザに指定されたWEBサイトに自動的に情報を配信することで(ステップ540)、情報配信処理が完了する。配信処理は多くの方法で実現することができる。例えば、配信処理は掲示板の表と欄を分析して、プログラムのシミュレーションを通して情報を提供することで実現することができる。
他の特定の実施例では、問い合わせ結果に基づいたクラスタリングと自動要約化技術によりシステムは異なる文書を統合することで、異なるスタイルの複数の文書テンプレート(テンプレートリスト)を作成する。
なお、本願の上述の記述は例示的なものであって、限定的なものではない。例えば、ユーザは必ずしも情報が配信されるWEBサイトを選択する必要は無く、配信部は情報配信可能な全てのWEBサイトに情報を配信することができる。この場合、ユーザに配信状況を知らせるようにすることができる(配信するWEBサイト、配信結果など)。他方、いくつかの最上位のWEBサイトだけに配信することも可能であり、例えば、最上位の10個のWEBサイトだけに配信することができる。
以下、BBSの投稿を例として、クラスタリング法の特定の例を説明する。都合上、次のような名詞を定義する。
メッセージ:特定の主題に関して、著者が公開した特定の文書を表す。文書、メッセージ、投稿はすべてこの同義語である。メッセージは開始メッセージと返信メッセージとの二種類に分けられる。前者はクルー(下記参照)内の最初のメッセージであり、後者はクルー内の特定のメッセージに対する返信である。
クルー:1つの開始メッセージと、複数の返信メッセージから構成される議論の集合。トピック、議論、主題などはすべてこの同意語である。
ライター:メッセージの配信をする人を表す著者、投稿者はこの同意語である。
レビュアー:メッセージを見直す人。読み手、閲覧者はこの同意語である。
クラスタリングの最初に、まずメッセージ中の特徴語の選択が行われて、高頻度の特徴語(すなわち、実際の処理で2回以上の頻度を持つもの)をベクトル空間モデル(VSM)の用語とする。開始メッセージの題と、開始メッセージの内容とに現れる特徴語にはより高い重みをつける。重み付けアルゴリズムはtf×idf式を用い、用語tの重みはtf×idfである。式中で、tfは特定のメッセージ集合中での用語tの頻度数を表し、idfは用語tの文書頻度数の逆数を表す。すなわち、idf=log(N/n)であり、式中で、Nは特定の種類のメッセージの総数を表し、nは用語tが現われるメッセージ数を表す。
特徴語が選択された後、ベクトル行列を構築する。ここで、行はi番目のツリー(Treei)を表し、列はj番目の用語(Termj)を表す。行列の要素はvalue(i,j)であり、次の式で算出される。
Figure 2009211697
式中でfijは、TermjがTreei中に現われる頻度数を表す。開始メッセージ中に現われる用語により大きい重みが付けられるのは、これらの用語がより重要性があると見なされるためである。
nはベクトルの次元を表し、mはクルーツリーの数を表し、kはクラスタ数を表し、X={x、i=1、2、・・・m}はクルーツリーの集合を表し、Nは繰り返しの最大数を表すとすると、K−means法によるクラスタリングアルゴリズムは次の通りである。
出力:
・Y,j=1,2,...,k − ベクトルによって表される、最後のクラスタリング中心。
・K、j=1,2,...,k − 最後のクラスタリング集合(複数のクルーツリーから構成される密な集合)
ステップ:
・ステップ1:K個のクラスタリング中心をランダムに選択する。Y,...,Y...,Y; K=φ,j=1,2,...,k
・ステップ2:x(i=1,2,...,m)と各クラスタリング中心との間の類似度を算出し、最も類似したクラスKにxを代入する。すなわち、
Figure 2009211697
であり、類似度は次の余弦公式で算出される。
Figure 2009211697
・ステップ3:クラスタリング中心を再び算出する。
Figure 2009211697
(mはクラスタのサイズ)
・ステップ4:クラスタに変更がない、微妙に変更されている、または、繰り返し回数がすでにNになっている場合は、中断する。それ以外の場合は、ステップ2に戻る。
K−Means法アルゴリズムの重要な問題は、クラスタリングされた候補トピックの数に直接的に関係するKの選択である。ThreadNumはクルーの数を表し、次式を用いてkの数を決定する。
Figure 2009211697
このようなクラスタリングの結果、システムはk個のクラスタリング集合を得る。クラスタリング集合のそれぞれは、類似した内容の文書を表している。次の操作は、それぞれのクラスタに基づいて、自動抽出化法を用いての文書テンプレートの取得である。この実施例では、それぞれの文書は、クラスタリングに基づいて、複数文書要約化法を用いることでパラグラフに分けられている。クラスタリングはパラグラフ化の結果に基づいて行われる。クラスタリングの中心に最も近いパラグラフを、それぞれのクラスタのカーネルパラグラフとして選択して、全てのカーネルパラグラフを統合して最終的なテンプレートとする。
ユーザはテンプレートに基づいて編集を行うことができる。大多数のサンプルに基づいた統合によってテンプレートが形成されているため、多数のサンプルの中でも、その形式と語彙は最も頻度が高く、最もユーザの好みに合ったものである。ユーザはテンプレートに基づいて修正を行うことで、多大な時間を節約し、オンラインに表示される文書の品質を保証することができる。編集処理の間、システムはユーザ選択可能な頻出の語彙(564)と文(563)を提供する。
情報追跡部124は、情報が配信された後の追跡サービスを提供する。情報は通常いくつかのWEBサイトに配信されるので、情報に対応して見直しを加えるためには、ユーザは最新の返信情報を得るために、情報が配信されたWEBサイトに絶えずアクセスしなくてはならない。結果、ユーザに多大な時間と負担を強いることになる。特定の状況下、例えば、ユーザがアパート賃貸を取り扱う住宅賃貸サイトに住宅賃貸情報を配信する場合、ユーザに返信された情報を見落としてしまい重要な情報を逃してしまうことがある。ユーザの時間を節約するために、システムは自動的にユーザへの返信を追跡する機能を提供する。詳細については、図6の処理を示すフローチャートを参照するとよい。ユーザの文書と文書が送信されたWEBサイトの状況などの重要な情報を知ることで、システムは時間に応じてこれらのWEBサイトを確認し(ステップ610)、ユーザの文書に対する返信を追跡し、時間に応じて新しい返信を収集し(ステップ620)、ユーザに選択されたモードで収集した返信をユーザへと送る(これに限定するわけではないが、送信モードにはシステムから提供されるEメール、RSS、短文メッセージ、WEBサイトなどを含む)。
ユーザへの返信の問題として、通常、返信には無意味な返信やスパムなどの多くの不要情報が含まれる。このような情報をユーザに送信すると、ユーザに多大な時間を使わせてしまうことになる。この問題を解決するために、システムは内容フィルタリング機能を提供することで(ステップ630)、返信から不要情報を取り除き、有用な情報だけをユーザに送信する。不要情報をフィルタリングするには多くの方法があり、現在利用可能な分類法はいずれも不要情報をフィルタリングするのに用いることができる。特定の実施例では、この処理を実行するのに単純ベイズ分類法を用いる。次の具体的なステップで、説明する。
・学習段階
まず学習段階でクラス数を決めることが必要であり、例えば、有用な情報、普通の情報、不要な情報という3つのクラスに分けることができる。もちろん、特殊化がどれほど必要かに応じて、より多くのクラスに分類することもできるし、2つのクラス(不要情報と、不要でない情報)に分類することもできる。
i.メッセージを事前処理する。禁止語を削除する、語幹を抽出する、文章を分割する等を含む。
ii.全ての用語を集中的に処理して、訂正、学習することで、語彙リストを得る。
iii.各クラスvの演繹的確率を算出する。
Figure 2009211697
iv.条件確率を算出する。
Figure 2009211697
注意:wは語彙リストのi番目の単語を表し、vは分類上のクラスを表し、nはクラスv中にwが出現する回数を表し、nはクラスv中にある全ての単語数を表し、Nは語彙リスト中の語彙数を表す。発生しない事例の確率の推測には、Plus−Oneアプローチを用いる。
・分類段階
i.メッセージを事前処理する。このような事前処理を通して、禁止語を取り除いたり、語幹を抽出したりする。
ii.次式を用いてメッセージの目標値を算出して、各メッセージのクラスを得る。
Figure 2009211697
本願に開示の技術は、ユーザモデルを利用して、対応するユーザの特徴に関連のある情報に基づいた個人用情報配信サービスを提供するシステムとその方法に関するものである。
なお、上記の記述はもちろん例示的なものに過ぎない。例えば、上記ではサンプル問い合わせ部がサンプルテンプレート、頻出候補文、および頻出候補語を生成するように実現されたが、情報配信モジュールが生成するように実現することも可能である。
本願に開示の技術に適用する場合、「部」、「サービス」、「モデル」、および「システム」はコンピュータに関連した実体、すなわち、ハードウェア、ソフトウェアとハードウェアの組み合わせ、実行ソフトウェアなどを意味する。限定するものではないが、例えば、「部」は、プロセッサ上で実行するプロセス、プロセッサ、オブジェクト、実行可能部、実行スレッド、プログラム、およびコンピュータの少なくとも1つとして実現することができる。例示目的のため、サーバ上で実行されるアプリケーションおよびサーバはすべて「部」である。実行処理またはスレッド、または両方に一以上の「部」が存在することができる。これらの(一以上の)「部」は、単数のコンピュータ上に、あるいは二以上のコンピュータ間に配置することができる。
本願に開示の技術は、コンピュータまたは論理部により実行されることで、コンピュータまたは論理部に前述の方法を実行させることができる、または、コンピュータまたは論理部が前述の部として使用されるようにすることができるコンピュータプログラムを含む。
本願に開示の技術は、コンピュータプログラムを記憶するための、コンピュータによって読み取り可能な記憶媒体を更に含む。コンピュータによって読み取り可能な記憶媒体は、例えば、DVD、フレキシブルディスク、CD、磁気テープ、フラッシュメモリ、ハードディスク等でもよい。
110 ユーザ
121 問い合わせ部
122 ユーザモデル部
123 情報配信部
124 情報追跡部
125 問い合わせ条件決定部
126 検索部
127 問い合わせ結果処理部
130 ネットワーク
210 ユーザアカウントの構築
220 ユーザ情報の収集
230 ユーザモデルの構築
240 ユーザモデルの更新
261 個人情報
262 ユーザ記述
263 ユーザ検索履歴ログ
264 ユーザ相互情報
265 ユーザグループ情報
250 機械学習、相関フィードバック
310 ユーザモデル
381 頻出候補文
320 ユーザ問い合わせ入力
330 問い合わせ修正
340 検索
350 フィルタリング、再ランク付け
360 サンプル検索結果
370 クラスタリング、要約生成
382 テンプレートリスト
391 ローカルデータベース
392 ネットワーク
383 頻出候補語
410 ユーザモデル
420 ユーザ問い合わせ入力
430 問い合わせ修正
440 検索
450 WEBページ種類識別
460 WEBサイト検索結果
470 WEBサイト評価
480 推奨WEBサイトリスト
491 ローカルデータベース
492 ネットワーク
561 サンプルリスト
562 テンプレートリスト
563 頻出候補文
564 頻出候補語
510 ユーザによるテンプレートまたはサンプルの選択
520 テンプレートまたはサンプルの編集
530 ユーザによるWEBサイトの選択
540 情報配信
550 推奨WEBサイトリスト
610 定期的に確認
620 返信を収集
630 内容をフィルタリング
640 情報を送信
650 ユーザ
661 文書が送信されるWEBサイト
662 文書情報

Claims (10)

  1. ユーザ入力と、ユーザの特徴を決定するのに適したユーザモデルと、に基づき問い合わせ条件を構築する問い合わせ条件決定部と、
    前記問い合わせ条件に基づき問い合わせを行う検索部と、
    前記検索部によって得られた問い合わせ結果を処理して、処理された情報をユーザに提供する問い合わせ結果処理部と、
    前記ユーザが編集した配信される情報を配信する情報配信部と、
    を備えたことを特徴とする情報配信システム。
  2. 前記ユーザモデルを構築するのに使用される情報を識別モードおよび非識別モードで取得し、当該取得した情報に基づき前記ユーザモデルを構築または更新するユーザモデル部を更に備え、
    前記識別モードで取得する情報は前記ユーザの登録情報、または、システムの処理実行中に前記ユーザが入力するよう要求された情報であり、前記非識別モードで取得する情報は、ノン・インタラクティブモードで収集した、前記ユーザが頻繁に使用する問い合わせ語、前記ユーザが頻繁に閲覧するWEBページ、接続時間、接続場所、および、前記ユーザの閲覧傾向の少なくとも1つを表すことを特徴とする請求項1に記載の情報配信システム。
  3. 前記ユーザモデル部は、ユーザフィードバック、前記問い合わせ結果、前記ユーザの編集結果、配信のために選択されたWEBサイト、および情報配信追跡結果の少なくとも1つに基づき前記ユーザモデルを調整および更新することを特徴とする請求項2に記載の情報配信システム。
  4. 前記検索部はサンプルの問い合わせを行い、前記問い合わせ結果処理部は問い合わせによって得られた前記サンプルを、ユーザが選択的に編集を行うために、関連度または時間に基づいて、または、返信文書数、問い合わせした前記サンプルの参照数、および前記文書のあるWEBサイトの信頼度に基づいて、または、前記ユーザモデルに基づいてランク付けし、ランク付けされたサンプルの検索結果を前記ユーザに提供することを特徴とする請求項1に記載の情報配信システム。
  5. 前記検索部は前記サンプルの問い合わせを行い、前記問い合わせ結果処理部は前記サンプルの問い合わせ結果をクラスタリングし、クラスタリングに基づき配信テンプレート、候補文、および候補語を生成し、前記ユーザが選択的に編集を行えるように当該配信テンプレート、当該候補文、および当該候補語を前記ユーザに提供することを特徴とする請求項1から4のいずれか1つに記載の情報配信システム。
  6. 前記検索部は情報配信を行うことができるWEBサイトの問い合わせを行い、前記問い合わせ結果処理部は前記ユーザモデルまたは信頼度、需要度、ユーザ数、および前記WEBサイトの地理特性の少なくとも1つに基づき、問い合わせした前記WEBサイトをランク付けすることを特徴とする請求項1に記載の情報配信システム。
  7. 前記問い合わせ結果処理部は、ランク付けの前に前記WEBページの種類を識別し、前記WEBサイトの代表的なWEBページのみを保持することを特徴とする請求項6に記載の情報配信システム。
  8. 前記ユーザによって各WEBサイトに配信された情報に対する応答とコメントを前記ユーザにフィードバックを行うことで前記ユーザが情報を配信した後の効果を追跡する情報追跡部を更に備え、当該情報追跡部は、RSS、Eメール、およびオンライン表示の少なくとも1つのモードを通して追跡情報をユーザに送信することを特徴とする請求項6に記載の情報配信システム。
  9. 前記ユーザモデルは、ユーザ一般モデルとユーザ関心モデルとを備えることを特徴とする請求項8に記載の情報配信システム。
  10. ユーザ入力と、ユーザの特徴を決定するのに適したユーザモデルと、に基づき問い合わせ条件を構築する問い合わせ条件決定ステップと、
    前記問い合わせ条件に基づき問い合わせを行う検索ステップと、
    前記検索部によって得られた問い合わせ結果を処理して、処理された情報を前記ユーザに提供する問い合わせ結果処理ステップと、
    前記ユーザが編集した配信される情報を配信する情報配信ステップと、
    を含んだことを特徴とする情報配信方法。
JP2009044720A 2008-02-29 2009-02-26 情報配信システムおよび情報配信方法 Withdrawn JP2009211697A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100809542A CN101520784B (zh) 2008-02-29 2008-02-29 信息发布系统和信息发布方法

Publications (1)

Publication Number Publication Date
JP2009211697A true JP2009211697A (ja) 2009-09-17

Family

ID=41064125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009044720A Withdrawn JP2009211697A (ja) 2008-02-29 2009-02-26 情報配信システムおよび情報配信方法

Country Status (3)

Country Link
US (1) US20090234825A1 (ja)
JP (1) JP2009211697A (ja)
CN (1) CN101520784B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096255A (ja) * 2009-10-30 2011-05-12 Nec (China) Co Ltd ランキング指向の協調フィルタリング推薦方法および装置

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396331B2 (en) * 2007-02-26 2013-03-12 Microsoft Corporation Generating a multi-use vocabulary based on image data
WO2011016327A1 (ja) * 2009-08-07 2011-02-10 株式会社日立製作所 計算機システム、プログラム及びシミュレーションに使用する計算資源を割り当てる方法
WO2011095667A1 (es) * 2010-02-04 2011-08-11 Ebay, Inc. Visualización de listas basada en la actividad de lista solicitudes relacionadas
CN101873274B (zh) * 2010-06-12 2013-06-05 中山大学 与机顶盒关联的多种邮件分类功能系统及方法
CN102339417A (zh) * 2010-07-20 2012-02-01 百度在线网络技术(北京)有限公司 账户结构自动优化的设备、方法和系统
CN102456018B (zh) * 2010-10-18 2016-03-02 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US9098589B1 (en) 2010-11-23 2015-08-04 Google Inc. Geographic annotation of electronic resources
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及系统
CN102110170B (zh) * 2011-03-18 2013-07-31 北京百度网讯科技有限公司 一种具有信息发布和搜索功能的系统及信息发布方法
US8538944B1 (en) * 2011-05-10 2013-09-17 Google Inc. Resource catchment areas
CN102799589B (zh) * 2011-05-25 2016-05-11 阿里巴巴集团控股有限公司 一种信息推送方法和装置
CN102819529B (zh) * 2011-06-10 2015-08-19 阿里巴巴集团控股有限公司 社交网站信息发布方法及系统
CN102880622A (zh) * 2011-07-15 2013-01-16 祁勇 一种在互联网上确定用户特征的方法和系统
CN102279889B (zh) * 2011-08-29 2017-06-30 百度在线网络技术(北京)有限公司 一种基于地理信息的问题推送方法及系统
CN102984119A (zh) * 2011-09-07 2013-03-20 百度在线网络技术(北京)有限公司 一种用于检测互动平台中的垃圾版块的方法与设备
US9195758B2 (en) * 2011-10-21 2015-11-24 Ebay, Inc. System and method for multi-dimensional personalization of search results
CN102447737A (zh) * 2011-11-18 2012-05-09 浪潮电子信息产业股份有限公司 一种基于云平台的服务推送方法
CN103309864B (zh) * 2012-03-07 2018-10-19 深圳市世纪光速信息技术有限公司 一种搜索结果显示方法、装置及系统
US9836545B2 (en) 2012-04-27 2017-12-05 Yahoo Holdings, Inc. Systems and methods for personalized generalized content recommendations
US9785883B2 (en) 2012-04-27 2017-10-10 Excalibur Ip, Llc Avatars for use with personalized generalized content recommendations
US8996530B2 (en) * 2012-04-27 2015-03-31 Yahoo! Inc. User modeling for personalized generalized content recommendations
CN103455485A (zh) * 2012-05-28 2013-12-18 中兴通讯股份有限公司 自动更新用户兴趣模型方法及装置
CN109447708A (zh) 2012-06-29 2019-03-08 北京点网聚科技有限公司 用于在线广告的方法、系统及介质
CN103631576A (zh) * 2012-08-24 2014-03-12 瑞昱半导体股份有限公司 多媒体评注编辑系统与相关的多媒体评注编辑方法和装置
CN103870517A (zh) * 2012-12-09 2014-06-18 祁勇 一种获取用户个性化特征的方法和系统
CN103870000B (zh) * 2012-12-11 2018-12-14 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
US20140207563A1 (en) * 2013-01-18 2014-07-24 Ford Global Technologies, Llc Method and Apparatus for Advertisement Screening
CN104123320B (zh) * 2013-04-28 2019-06-28 百度在线网络技术(北京)有限公司 一种获取与输入问题相对应的相关问题的方法与设备
JP2015032254A (ja) * 2013-08-06 2015-02-16 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム
CN103399940B (zh) * 2013-08-12 2016-08-10 北京理工大学 基于行为的领域信息检索方法
CN106462614B (zh) * 2014-05-29 2020-08-18 日本电信电话株式会社 信息分析系统、信息分析方法以及信息分析程序
CN105225178A (zh) * 2014-06-25 2016-01-06 鸿合科技有限公司 一种多用户教学资源读取方法和装置
CN105589872B (zh) * 2014-10-23 2019-01-22 阿里巴巴集团控股有限公司 图搜索结果获取方法及装置
CN104462357B (zh) * 2014-12-08 2017-11-17 百度在线网络技术(北京)有限公司 实现个性化搜索的方法和装置
CN104572918B (zh) * 2014-12-26 2017-10-03 清华大学 一种在线课程的搜索方法
CN104598549B (zh) * 2014-12-31 2019-03-05 北京畅游天下网络技术有限公司 数据分析方法和系统
CN104615690A (zh) * 2015-01-22 2015-05-13 华为技术有限公司 信息处理方法和装置
CN106156023B (zh) * 2015-03-23 2020-02-21 华为技术有限公司 语义匹配的方法、装置和系统
CN105045872A (zh) * 2015-07-16 2015-11-11 北京京东尚科信息技术有限公司 信息的筛选方法及装置
CN105468694B (zh) * 2015-11-17 2019-10-15 小米科技有限责任公司 挖掘信息模板的方法及装置
US10210201B2 (en) * 2016-05-13 2019-02-19 TCL Research America Inc. Method and system for App page recommendation via inference of implicit intent in a user query
CN106294661B (zh) * 2016-08-04 2019-09-20 百度在线网络技术(北京)有限公司 一种扩展搜索方法与装置
CN106549965A (zh) * 2016-11-07 2017-03-29 安徽味唯网络科技有限公司 一种智能过滤信息的方法
CN106897407B (zh) * 2017-02-15 2020-06-12 阿里巴巴(中国)有限公司 信息识别方法及装置
CN106919695B (zh) * 2017-03-07 2018-11-30 维沃移动通信有限公司 一种信息推荐方法及终端
CN107256222B (zh) * 2017-04-27 2020-12-01 广州慧扬健康科技有限公司 基于自由词检索的电子病历快速检索系统
WO2019000304A1 (zh) * 2017-06-29 2019-01-03 麦格创科技(深圳)有限公司 舆情监控方法及系统
CN109308151B (zh) * 2017-07-28 2024-02-02 北京搜狗科技发展有限公司 一种信息处理方法、装置、设备及存储介质
CN109829098A (zh) * 2017-08-28 2019-05-31 广东神马搜索科技有限公司 搜索结果优化方法、装置及服务器
CN109144953B (zh) * 2018-07-27 2022-02-01 腾讯科技(深圳)有限公司 搜索文件的排序方法、装置、设备、存储介质及搜索系统
CN110929028A (zh) * 2019-11-01 2020-03-27 深圳前海微众银行股份有限公司 一种日志分类方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2128306C (en) * 1993-09-14 1998-12-15 Marjorie Susan Backaus Personalized information service system
JPH0926970A (ja) * 1994-12-20 1997-01-28 Sun Microsyst Inc 情報を検索するコンピュータによる実行方法及び装置
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6044395A (en) * 1997-09-03 2000-03-28 Exactis.Com, Inc. Method and apparatus for distributing personalized e-mail
JP3915267B2 (ja) * 1998-09-07 2007-05-16 富士ゼロックス株式会社 文書検索装置および文書検索方法
US6199067B1 (en) * 1999-01-20 2001-03-06 Mightiest Logicon Unisearch, Inc. System and method for generating personalized user profiles and for utilizing the generated user profiles to perform adaptive internet searches
US6381594B1 (en) * 1999-07-12 2002-04-30 Yahoo! Inc. System and method for personalized information filtering and alert generation
US6671715B1 (en) * 2000-01-21 2003-12-30 Microstrategy, Inc. System and method for automatic, real-time delivery of personalized informational and transactional data to users via high throughput content delivery device
US20020002554A1 (en) * 2000-03-09 2002-01-03 Herdman Rachelle B. Systems and methods for distributing personalized information over a communications system
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6778997B2 (en) * 2001-01-05 2004-08-17 International Business Machines Corporation XML: finding authoritative pages for mining communities based on page structure criteria
EP1246394A1 (en) * 2001-03-26 2002-10-02 Koninklijke KPN N.V. System for personalised information distribution
CN1389811A (zh) * 2002-02-06 2003-01-08 北京造极人工智能技术有限公司 搜索引擎的智能化搜索方法
US20060074883A1 (en) * 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
CN101000627B (zh) * 2007-01-15 2010-05-19 北京搜狗科技发展有限公司 一种相关信息的发布方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096255A (ja) * 2009-10-30 2011-05-12 Nec (China) Co Ltd ランキング指向の協調フィルタリング推薦方法および装置

Also Published As

Publication number Publication date
CN101520784A (zh) 2009-09-02
CN101520784B (zh) 2011-09-28
US20090234825A1 (en) 2009-09-17

Similar Documents

Publication Publication Date Title
JP2009211697A (ja) 情報配信システムおよび情報配信方法
US20220020056A1 (en) Systems and methods for targeted advertising
US10728203B2 (en) Method and system for classifying a question
US7949643B2 (en) Method and apparatus for rating user generated content in search results
Shen et al. Implicit user modeling for personalized search
US8626491B2 (en) Selecting terms in a document
EP2438539B1 (en) Co-selected image classification
JP4837040B2 (ja) ブログ文書のランク付け
JP5281405B2 (ja) 表示のための高品質レビューの選択
US8255786B1 (en) Including hyperlinks in a document
US8954440B1 (en) Selectively delivering an article
US20100306249A1 (en) Social network systems and methods
Livne et al. CiteSight: supporting contextual citation recommendation using differential search
US10585927B1 (en) Determining a set of steps responsive to a how-to query
US20110295612A1 (en) Method and apparatus for user modelization
US20080222105A1 (en) Entity recommendation system using restricted information tagged to selected entities
US20110004609A1 (en) Generating search results based on user feedback
US20090043749A1 (en) Extracting query intent from query logs
US20110125791A1 (en) Query classification using search result tag ratios
JP2014501422A (ja) ユーザ意図の有無に基づく検索キーワードの推薦
KR20120022893A (ko) 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성
US20100010982A1 (en) Web content characterization based on semantic folksonomies associated with user generated content
CN109952571B (zh) 基于上下文的图像搜索结果
US20040139105A1 (en) Information storage and retrieval
US8990201B1 (en) Image search results provisoning

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120501