JP5027838B2

JP5027838B2 - 情報評価システム及び情報評価方法

Info

Publication number: JP5027838B2
Application number: JP2009062368A
Authority: JP
Inventors: 雄旗建山; 達雄山下
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2009-03-16
Filing date: 2009-03-16
Publication date: 2012-09-19
Anticipated expiration: 2029-03-16
Also published as: JP2010218075A

Description

本発明は、情報評価システム及び情報評価方法に関する。

従来、多くの人材が有する知識や情報を有機的に結合し、効率的に利用するために、人物同士の関係を電子データから自動収集し、人物同士の関係を示した人脈マップを作成することが検討されている（例えば特許文献１参照）。特許文献１に開示された人脈マップは、例えば電子メールやスケジュールなどの電子データに出現する人名の関連付けが行われることによって作成される。

さらに、近年では、インターネット上に多くのウェブ情報が公開されているため、ウェブ情報から人間関係を抽出することが検討されている（例えば非特許文献１参照）。上述した特許文献１では、電子メールやスケジュールなどの電子データから人間関係が抽出されるため、通常、比較的狭い閉じた組織内での人脈マップが作成される。これに対し、非特許文献１では、一般に広く公開されたウェブ情報から人間関係が抽出されるため、大規模でオープンなコミュニティにおける人間関係のネットワークを可視化することが可能となる。

特開２００５−１０８１２３号公報

松尾豊他、「Ｗｅｂ上の情報からの人間関係ネットワークの抽出」、人工知能学会論文誌２０巻１号４６〜５６ページ、２００５年

しかしながら、インターネット上には、誰もが自由に情報を公開することができるため、ウェブ情報の中には虚偽の情報なども混在しており、ウェブ情報から人間関係を抽出する場合には、必ずしも正確な人間関係の情報が得られるとは限らない。すなわち、ウェブ情報の信頼度を考慮せずに情報を抽出しても、正確な人間関係のネットワークを構築することはできず、真に有用な情報の取得及び提供ができないという問題がある。

また、人間関係だけに拘わらず、例えばある製品とその製品の性能を表す用語との組み合わせなど、様々なアイテムについて関連情報をウェブ情報から自動収集する場合には、常にウェブ情報の信頼性が問題となる。つまり、ウェブ情報中でアイテムとアイテムの誤った関連情報とが関連付けられている場合には、ウェブ情報から正確な情報収集をすることができない。このため、ウェブ情報から収集された情報の信頼度を正確に評価し、信頼度に応じて情報の取捨選択をすることが非常に重要となっている。

本発明は、かかる点に鑑みてなされたものであって、ネットワークからアイテムに関する関連情報を収集する場合、収集された情報の信頼度を評価することができる情報評価システム及び情報評価方法を提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明に係る情報評価装置は、ネットワーク上に公開されているウェブ情報から正規情報を抽出し、当該正規情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる正規タグを取得する正規タグ取得装置と、ネットワーク上に公開されているウェブ情報からＵＧＣ（User Generated Contents）情報を抽出し、当該ＵＧＣ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなるＵＧＣタグを取得するＵＧＣタグ取得装置と、ネットワーク上に公開されているウェブ情報から一般ウェブ情報を抽出し、当該一般ウェブ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる一般タグを取得する一般タグ取得装置と、前記ＵＧＣタグ及び前記一般タグの評価値を算出する評価装置とを有し、前記評価装置は、前記正規タグ取得装置から送信される正規タグ、前記ＵＧＣタグ取得装置から送信されるＵＧＣタグ、及び、前記一般タグ取得装置から送信される一般タグをそれぞれ受信する受信手段と、前記受信手段によって受信されたＵＧＣタグと、前記受信手段によって受信された正規タグ及び一般タグとの比較により、ＵＧＣタグの評価値を算出するＵＧＣタグ評価手段と、前記受信手段によって受信された一般タグと、前記受信手段によって受信された正規タグ及びＵＧＣタグとの比較により、一般タグの評価値を算出する一般タグ評価手段とを有することを特徴とする。

また、本発明に係る情報評価方法は、正規タグ取得装置が、ネットワーク上に公開されているウェブ情報から正規情報を抽出し、当該正規情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる正規タグを取得し、ＵＧＣタグ取得装置が、ネットワーク上に公開されているウェブ情報からＵＧＣ（User Generated Contents）情報を抽出し、当該ＵＧＣ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなるＵＧＣタグを取得し、一般タグ取得装置が、ネットワーク上に公開されているウェブ情報から一般ウェブ情報を抽出し、当該一般ウェブ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる一般タグを取得し、評価装置が、前記正規タグ取得装置から送信される正規タグ、前記ＵＧＣタグ取得装置から送信されるＵＧＣタグおよび前記一般タグ取得装置から送信される一般タグを受信し、前記評価装置が、前記受信されたＵＧＣタグと、前記受信された正規タグ及び前記受信された一般タグとの比較により、ＵＧＣタグの評価値を算出し、前記評価装置が、前記受信された一般タグと、前記受信された正規タグ及び前記受信されたＵＧＣタグとの比較により、一般タグの評価値を算出することを特徴とする。

本発明に係る情報評価システム及び情報評価方法によれば、ネットワークからアイテムに関する関連情報を収集する場合、収集された情報の信頼度を評価することができる。

図１は、一実施の形態に係るネットワーク構成の一例を示す図である。図２は、一実施の形態に係る抽出サーバの構成を示すブロック図である。図３は、一実施の形態に係るリソースＤＢの具体例を示す図である。図４は、一実施の形態に係るタグＤＢの具体例を示す図である。図５は、一実施の形態に係る評価装置の構成を示すブロック図である。図６は、一実施の形態に係るタグ評価値ＤＢの具体例を示す図である。図７は、一実施の形態に係る情報評価方法の全体概要を示すフロー図である。図８は、一実施の形態に係る抽出サーバの動作を示すフロー図である。図９は、一実施の形態に係るＵＧＣタグ評価処理を示すフロー図である。図１０は、一実施の形態に係る一般タグ評価処理を示すフロー図である。図１１は、一実施の形態に係る関連情報の表示の一例を示す図である。

以下、本発明の一実施の形態について、図面を参照して詳細に説明する。以下においては、人物に関する関連情報を収集する場合の情報の信頼度評価について説明するが、この実施の形態により本発明が限定されるものではない。

図１は、本実施の形態に係るネットワーク構成の一例を示す図である。同図に示すネットワーク構成では、ユーザ端末１０とウェブサーバ２０とがネットワークＮを介して接続されている。そして、ネットワークＮには、正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃの３つの抽出サーバが接続されている。また、評価装置２００は、上記の抽出サーバ１００ａ〜１００ｃ及びウェブサーバ２０に接続されている。

ユーザ端末１０は、ユーザが操作する例えばパーソナルコンピュータなどの端末装置であり、ウェブ情報を表示可能な例えばディスプレイなどの表示部を備えている。そして、ユーザ端末１０は、ユーザの操作を受け付け、ウェブサーバ２０に対してウェブ情報を要求し、要求に応じてウェブサーバ２０から送信されたウェブ情報を受信して表示部に表示する。

また、ユーザ端末１０は、例えばブログや質疑応答サイトなどの記事をユーザが作成すると、作成された記事をウェブサーバ２０へ送信し、ネットワークＮ上に公開させる。同様に、ユーザ端末１０は、例えば映画などに対するレビューを掲載するレビューページを閲覧したユーザが新たなレビューコメントなどを投稿する場合に、このレビューコメントをウェブサーバ２０へ送信する。このように、ユーザ端末１０は、ユーザが作成してネットワークＮ上に公開する情報をウェブサーバ２０へ送信する。以下の説明においては、例えばブログの記事、質疑応答サイトの質問・回答事項、又はレビューサイトでのコメントなどのように、一般のユーザが投稿してネットワークＮ上に公開される情報を「ＵＧＣ（User Generated Contents）情報」という。

なお、ＵＧＣ情報の中でも、任意のタレントについてユーザが把握している情報を投稿するサイト（例えばユーザが作り上げていく人物名鑑サイト）や、任意の電化製品に関する評価情報をユーザが投稿するサイト（例えば電化製品機能評価サイト）等の特定のアイテムに特化してユーザが情報を投稿するサイトは、正規情報ほどではないものの、信頼度がある程度高い情報を含んでいる。さらに、このようなＵＧＣ情報は、他のＵＧＣ情報と比べて、アイテムのマイナス面の情報も含み、世論や流行も反映するという特徴を強く持っているものと考えられるため、特にＵＧＣ情報として好適である。

ウェブサーバ２０は、様々なウェブ情報を保持するとともに、ユーザ端末１０から要求されたウェブ情報を送信する。ウェブサーバ２０が保持するウェブ情報としては、上述したＵＧＣ情報のほかに、正規情報及び一般情報がある。正規情報とは、人物や製品などのアイテムに関して正規な権利を持つもの、又はそれに準ずるものが作成している情報から得られる情報である。すなわち、例えば所属タレントに関して正規な権利を持つ事務所が作成する所属タレントの公式ページや電化製品に関して正規な権利を持つメーカーが作成するこの電化製品の公式ページなどから得られる情報が正規情報に相当する。正規情報には、アイテムに関連する正確な情報が含まれており、アイテムに関する情報の信頼度は高い。ただし、一般的に正規情報は頻繁に更新されるものではなく、世論や流行を反映した情報が必ずしも正規情報に含まれているとはいえない。また、アイテムの欠点や欠陥などのマイナス面の情報に関しても必ずしも正規情報に含まれているとはいえない。

また、一般情報とは、正規情報及びＵＧＣ情報以外の一般的な情報を含むウェブ情報である。すなわち、特定のアイテムに特化したり、ユーザの投稿に依存したりすることがない、例えばニュースサイトなどのウェブページが一般情報に相当する。一般情報には、アイテムに関連する正確な情報が含まれているとは限らないが、正規情報に比べて情報量が多く、アイテムのマイナス面の情報や世論や流行などを反映した情報も多く含まれている。情報量については、一般情報が最も多く、ＵＧＣ情報、正規情報の順に多いと考えられる。

正規情報抽出サーバ１００ａは、ネットワークＮ上に公開されているウェブ情報から正規情報を抽出する。そして、正規情報抽出サーバ１００ａは、抽出された正規情報を解析し、アイテムとアイテムの関連情報との組み合わせを取得し、それぞれの組み合わせをアイテムのタグ（以下「正規タグ」という）として保持する。このとき、正規情報抽出サーバ１００ａは、それぞれの正規タグに信頼度を示すウェイトを対応付けて保持するが、正規タグは信頼度が高い正規情報から取得されたものであるため、各正規タグの信頼度は、例えば最大値の１．００となっている。

ＵＧＣ情報抽出サーバ１００ｂは、ネットワークＮ上に公開されているウェブ情報からＵＧＣ情報を抽出する。そして、ＵＧＣ情報抽出サーバ１００ｂは、抽出されたＵＧＣ情報を解析し、アイテムに関するタグ（以下「ＵＧＣタグ」という）を取得して保持する。このとき、ＵＧＣ情報抽出サーバ１００ｂは、それぞれのＵＧＣタグにウェイトを対応付けて保持し、評価装置２００における信頼度の評価に応じて各ＵＧＣタグのウェイトを更新する。

一般情報抽出サーバ１００ｃは、ネットワークＮ上に公開されているウェブ情報から一般情報を抽出する。そして、一般情報抽出サーバ１００ｃは、抽出された一般情報を解析し、アイテムに関するタグ（以下「一般タグ」という）を取得して保持する。このとき、一般情報抽出サーバ１００ｃは、それぞれのタグにウェイトを対応付けて保持し、評価装置２００における信頼度の評価に応じて各タグのウェイトを更新する。

以上の正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃは、抽出するウェブ情報が異なっているものの、内部の構成及び動作はほぼ共通しているため、これらの３つの抽出サーバの構成及び動作を抽出サーバ１００の構成及び動作として後にまとめて詳述する。

評価装置２００は、正規情報から取得された正規タグ、ＵＧＣ情報から取得されたＵＧＣタグ及び一般情報から取得された一般タグを互いに比較することにより、ＵＧＣタグ及び一般タグの信頼度を評価する。すなわち、評価装置２００は、例えばＵＧＣタグに一致する正規タグがある場合、ＵＧＣタグが示す情報の信頼度が高いと評価し、このＵＧＣタグに対応するウェイトを大きくする。同様に、評価装置２００は、例えば一般タグに一致する正規タグがある場合、一般タグが示す情報の信頼度が高いと評価し、この一般タグに対応するウェイトを大きくする。

また、評価装置２００は、正規タグ、ＵＧＣタグ及び一般タグに関する信頼度をマージして保持し、アイテムの関連情報を信頼度が高い順に並べたランク情報をウェブサーバ２０へ送信する。具体的には、評価装置２００は、例えばある人物に関して、この人物に関連する人物及び２人の関係を信頼度が高い順に並べてウェブサーバ２０へ送信する。評価装置２００の構成及び動作については、後に詳述する。

図２は、本実施の形態に係る抽出サーバ１００の構成を示すブロック図である。上述したように、正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃは、いずれも抽出サーバ１００とほぼ同一の構成を有している。図２に示す抽出サーバ１００は、情報抽出部１０１、情報解析部１０２、初期ウェイト設定部１０３、リソースデータベース（以下「リソースＤＢ」と略記する）１０４、タグデータベース（以下「タグＤＢ」と略記する）１０５、評価装置インタフェース部（以下「評価装置Ｉ／Ｆ部」と略記する）１０６及びウェイト更新部１０７を有している。

情報抽出部１０１は、ネットワークＮ上に公開されているウェブ情報から正規情報、ＵＧＣ情報又は一般情報を抽出する。すなわち、正規情報抽出サーバ１００ａの情報抽出部１０１は、正規情報を抽出し、ＵＧＣ情報抽出サーバ１００ｂの情報抽出部１０１は、ＵＧＣ情報を抽出し、一般情報抽出サーバ１００ｃの情報抽出部１０１は、一般情報を抽出する。

情報解析部１０２は、情報抽出部１０１によって抽出されたウェブ情報を形態素解析などの手法によって解析し、アイテムとアイテムの関連情報とを含むタグを取得する。すなわち、正規情報抽出サーバ１００ａの情報解析部１０２は、正規情報から正規タグを取得し、ＵＧＣ情報抽出サーバ１００ｂの情報解析部１０２は、ＵＧＣ情報からＵＧＣタグを取得し、一般情報抽出サーバ１００ｃの情報解析部１０２は、一般情報から一般タグを取得する。情報解析部１０２が取得するタグとしては、例えばある人物とこの人物に関連する人物及び２人の関係との組み合わせや、ある人物とこの人物の属性との組み合わせなどがある。

初期ウェイト設定部１０３は、情報解析部１０２によって取得されたタグそれぞれに初期ウェイトを設定し、タグと初期ウェイトとを対応付けてタグＤＢ１０５に登録する。このとき、初期ウェイト設定部１０３は、正規タグについては、初期ウェイトを最大値の１．００に設定する。

また、初期ウェイト設定部１０３は、ＵＧＣタグ及び一般タグについては、リソースＤＢ１０４を参照し、タグの提供元となったリソースに対応付けて記憶された初期ウェイトを読み出し、タグの初期ウェイトに設定する。すなわち、初期ウェイト設定部１０３は、例えばＵＧＣタグがあるユーザのブログ記事から取得された場合、タグのリソースとしてのユーザに対応する初期ウェイトをリソースＤＢ１０４から読み出して、ＵＧＣタグの初期ウェイトに設定する。同様に、初期ウェイト設定部１０３は、例えば一般タグがあるニュースサイトの記事から取得された場合、タグのリソースとしてのサイトに対応する初期ウェイトをリソースＤＢ１０４から読み出して、一般タグの初期ウェイトに設定する。

なお、初期ウェイト設定部１０３は、ＵＧＣタグ又は一般タグが新規のリソースから取得され、リソースがリソースＤＢ１０４に登録されていない場合は、このリソースをリソースＤＢ１０４に登録する。この場合、初期ウェイト設定部１０３は、登録したリソースの初期ウェイトを例えば最大値の半分の０．５０などとしておく。また、リソースＤＢ１０４に登録されていない新規リソースの初期ウェイトは、リソースごとのタグの量に応じて決定されるようにしても良い。すなわち、初期ウェイト設定部１０３は、多くのタグを提供する新規リソースについては、初期ウェイトを例えば０．５０より大きくし、少量のタグしか提供しない新規リソースについては、初期ウェイトを例えば０．５０より小さくしても良い。他にも、例えば抽出されたタグの量も考慮してタグの初期ウェイトを決定しても良い。すなわち、いろいろなリソースから同じタグが抽出された場合は、抽出された同一タグの量に応じてリソースの初期ウェイトを増加させるなどとしても良い。

さらに、初期ウェイト設定部１０３は、評価装置２００によってタグの信頼度が評価され、タグに関する更新されたウェイトが評価装置２００から通知されると、リソースＤＢ１０４に保持されたリソースごとの初期ウェイトを更新する。すなわち、初期ウェイト設定部１０３は、信頼度が上昇したタグのリソースについては初期ウェイトを大きくし、信頼度が下降したタグのリソースについては初期ウェイトを小さくする。これは、初期ウェイト設定部１０３が信頼できるリソースの初期ウェイトを大きくし、あまり信頼できないリソースの初期ウェイトを小さくしていることに他ならない。このとき、初期ウェイト設定部１０３は、リソースＤＢ１０４に保持された初期ウェイトを所定値だけ増減させても良いし、更新によって変化したタグのウェイトの変化量に応じて増減させても良い。

リソースＤＢ１０４は、タグの提供元となるリソースごとの初期ウェイトを保持している。すなわち、正規情報抽出サーバ１００ａのリソースＤＢ１０４は、正規情報を掲載する公式ページの初期ウェイトを保持しており、ＵＧＣ情報抽出サーバ１００ｂのリソースＤＢ１０４は、ＵＧＣ情報を投稿するユーザごとの初期ウェイトを保持しており、一般情報抽出サーバ１００ｃのリソースＤＢ１０４は、一般情報を掲載するサイトごとの初期ウェイトを保持している。ただし、正規情報から取得されるタグの初期ウェイトは、上述したように最大値の１．００であるため、正規情報抽出サーバ１００ａには、リソースＤＢ１０４が設けられていなくても良い。これに対して、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃのリソースＤＢ１０４は、例えば図３に示すように、ユーザやサイトの識別情報に対応付けて初期ウェイトを記憶している。

図３において、ＵＧＣリソースＤＢは、ＵＧＣ情報抽出サーバ１００ｂのリソースＤＢ１０４の具体例であり、各ユーザのユーザＩＤに初期ウェイトが対応付けられている。初期ウェイトが高いユーザが投稿したＵＧＣ情報からは信頼度が高いＵＧＣタグが取得されており、反対に初期ウェイトが低いユーザが投稿したＵＧＣ情報からは信頼度が低いＵＧＣタグが取得されていることになる。

また、一般リソースＤＢは、一般情報抽出サーバ１００ｃのリソースＤＢ１０４の具体例であり、各サイトのサイトＩＤ（例えばＵＲＬの一部）に初期ウェイトが対応付けられている。初期ウェイトが高いサイトの一般情報からは信頼度が高い一般タグが取得されており、反対に初期ウェイトが低いサイトの一般情報からは信頼度が低い一般タグが取得されていることになる。

このように、リソースＤＢ１０４は、リソースごとの信頼度に応じて異なる初期ウェイトを保持しているため、新たなタグが取得された場合、取得されたタグのリソースによって初期ウェイトが異なる。つまり、信頼できるリソースの情報から取得されたタグには、初めから高いウェイトが対応付けられることになる。

タグＤＢ１０５は、情報解析部１０２によって取得されたタグと各タグのウェイトとを対応付けて保持している。すなわち、正規情報抽出サーバ１００ａのタグＤＢ１０５は、正規タグとウェイトを対応付けて保持しており、ＵＧＣ情報抽出サーバ１００ｂのタグＤＢ１０５は、ＵＧＣタグとウェイトを対応付けて保持しており、一般情報抽出サーバ１００ｃのタグＤＢ１０５は、一般情報とウェイトを対応付けて保持している。具体的には、タグＤＢ１０５は、それぞれ正規タグ、ＵＧＣタグ及び一般タグとして、例えば図４に示すように、関連人物タグ及び属性タグの２種類のタグを保持している。

図４において、関連人物タグは、対象アイテムと対象アイテムに関連する人物及び２人の関係との組み合わせを含んでおり、この組み合わせにウェイトが対応付けられている。すなわち、例えば対象アイテム「ＰＰＰ」と人物「ＡＡＡ」とが関係「コンビ」を有するという関連人物タグのウェイトは０．８０である。同様に、対象アイテム「ＰＰＰ」と人物「ＢＢＢ」とが関係「共演」を有するという関連人物タグのウェイトは０．５７である。

また、属性タグは、対象アイテムと対象アイテムの属性との組み合わせを含んでおり、この組み合わせにウェイトが対応付けられている。すなわち、例えば対象アイテム「ＰＰＰ」の属性「お笑い」という属性タグのウェイトは０．９０である。同様に、対象アイテム「ＰＰＰ」の属性「映画監督」という属性タグのウェイトは０．８０である。

これらのタグは、いずれも情報解析部１０２における形態素解析などによって取得されており、元となるウェブ情報が正規情報、ＵＧＣ情報及び一般情報のいずれであるかによって、同一の情報を含むタグであっても信頼度を示すウェイトが異なることがある。すなわち、例えば、正規タグの１つである対象アイテム「ＰＰＰ」の属性「お笑い」という属性タグのウェイトが１．００であっても、ＵＧＣタグの１つである同様の属性タグのウェイトは１．００未満となっている。

評価装置Ｉ／Ｆ部１０６は、評価装置２００に接続されるインタフェースであり、タグＤＢ１０５に保持されたタグ及びウェイトを含むタグ情報を評価装置２００へ送信し、評価装置２００によってタグが評価された結果更新されたタグの更新ウェイトを受信する。そして、評価装置Ｉ／Ｆ部１０６は、受信された更新ウェイトを初期ウェイト設定部１０３及びウェイト更新部１０７へ出力する。

ウェイト更新部１０７は、評価装置Ｉ／Ｆ部１０６から更新ウェイトが入力されると、タグＤＢ１０５によって保持されたタグに対応するウェイトを更新する。すなわち、ウェイト更新部１０７は、評価装置２００によって信頼度が高いと評価されウェイトが大きくなったタグについては、更新ウェイトに従ってタグＤＢ１０５に保持されたタグのウェイトを大きくする。反対に、ウェイト更新部１０７は、評価装置２００によって信頼度が低いと評価されウェイトが小さくなったタグについては、更新ウェイトに従ってタグＤＢ１０５に保持されたタグのウェイトを小さくする。

図５は、本実施の形態に係る評価装置２００の構成を示すブロック図である。同図に示す評価装置２００は、抽出サーバインタフェース部（以下「抽出サーバＩ／Ｆ部」と略記する）２０１、正規／ＵＧＣ比較部２０２、ＵＧＣ／一般比較部２０３、正規／一般比較部２０４、ＵＧＣタグ評価部２０５、一般タグ評価部２０６、評価値マージ部２０７、タグ評価値データベース（以下「タグ評価値ＤＢ」と略記する）２０８及びウェブサーバインタフェース部（以下「ウェブサーバＩ／Ｆ部」と略記する）２０９を有している。

抽出サーバＩ／Ｆ部２０１は、正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃに接続されるインタフェースであり、それぞれの抽出サーバからタグ及びウェイトを含むタグ情報を受信し、タグ情報の送信元の抽出サーバへ各タグの更新ウェイトを送信する。

正規／ＵＧＣ比較部２０２は、抽出サーバＩ／Ｆ部２０１によって受信された正規タグとＵＧＣタグを比較する。具体的には、正規／ＵＧＣ比較部２０２は、各ＵＧＣタグに一致する正規タグがあるか否かを判定する。一致する正規タグがあるＵＧＣタグは、信頼度が高い正規タグと同一の情報を含んでいることから、このＵＧＣタグに対応するウェイトを大きくしても良いと考えられる。

ＵＧＣ／一般比較部２０３は、抽出サーバＩ／Ｆ部２０１によって受信されたＵＧＣタグと一般タグを比較する。具体的には、ＵＧＣ／一般比較部２０３は、ＵＧＣタグの信頼度を評価する場合には、各ＵＧＣタグに一致する一般タグがあるか否かを判定する。一致する一般タグがあるＵＧＣタグは、一致する一般タグがないＵＧＣタグよりも信頼度が高いと考えられることから、このＵＧＣタグに対応するウェイトを大きくしても良いと考えられる。ただし、一般タグのみに一致するＵＧＣタグは、正規タグに一致するＵＧＣタグに比べると信頼度は低いと考えられる。

また、ＵＧＣ／一般比較部２０３は、一般タグの信頼度を評価する場合には、各一般タグに一致するＵＧＣタグがあるか否かを判定する。一致するＵＧＣタグがある一般タグは、一致するＵＧＣタグがない一般タグよりも信頼度が高いと考えられることから、この一般タグに対応するウェイトを大きくしても良いと考えられる。ただし、ＵＧＣタグのみに一致する一般タグは、正規タグに一致する一般タグに比べると信頼度は低いと考えられる。

正規／一般比較部２０４は、抽出サーバＩ／Ｆ部２０１によって受信された正規タグと一般タグを比較する。具体的には、正規／一般比較部２０４は、各一般タグに一致する正規タグがあるか否かを判定する。一致する正規タグがある一般タグは、信頼度が高い正規タグと同一の情報を含んでいることから、この一般タグに対応するウェイトを大きくしても良いと考えられる。

ＵＧＣタグ評価部２０５は、正規／ＵＧＣ比較部２０２及びＵＧＣ／一般比較部２０３における比較の結果に基づいて、ＵＧＣタグの信頼度を評価し、ＵＧＣタグの評価値を算出する。すなわち、ＵＧＣタグ評価部２０５は、正規／ＵＧＣ比較部２０２における比較の結果、一致する正規タグがある場合は、ＵＧＣタグのウェイトを所定値だけ大きくして評価値とする。また、ＵＧＣタグ評価部２０５は、正規／ＵＧＣ比較部２０２における比較の結果、一致する正規タグがない場合は、ＵＧＣ／一般比較部２０３における比較の結果を参照する。

そして、ＵＧＣタグ評価部２０５は、ＵＧＣ／一般比較部２０３における比較の結果、一致する一般タグがある場合は、ＵＧＣタグのウェイトを大きくして評価値とする。このとき、ＵＧＣタグ評価部２０５は、一致する正規タグがある場合よりもウェイトの上げ幅を小さくする。これは、上述したように、一般タグのみに一致するＵＧＣタグは、正規タグに一致するＵＧＣタグに比べると信頼度が低いと考えられるためである。また、ＵＧＣタグ評価部２０５は、一致する一般タグのウェイトに応じてＵＧＣタグのウェイトの上げ幅を決定しても良い。こうすることにより、一致する一般タグの信頼度に応じて、ＵＧＣタグの評価値を算出することができる。

ＵＧＣタグ評価部２０５は、ＵＧＣ／一般比較部２０３における比較の結果、一致する一般タグがない場合は、ＵＧＣタグと比較された一般タグの量に応じてＵＧＣタグのウェイトを小さくして評価値とする。すなわち、ＵＧＣタグと比較された一般タグの数が所定数以上であるにも拘らず、ＵＧＣタグがいずれの一般タグとも一致しなければ、ＵＧＣタグ評価部２０５は、ＵＧＣタグのウェイトを下げる。ただし、ＵＧＣタグが、まだ広く報じられていない新情報を含んでいる可能性があるため、このＵＧＣタグを管理者に提示し、管理者にウェイトの増減の判断を要求しても良い。なお、ＵＧＣタグと比較された一般タグの数が所定数未満である場合は、ＵＧＣタグ評価部２０５は、ＵＧＣタグのウェイトを変更しない。ＵＧＣタグ評価部２０５は、算出された評価値を評価値マージ部２０７へ出力するとともに、ＵＧＣタグの更新ウェイトとして抽出サーバＩ／Ｆ部２０１へ出力する。抽出サーバＩ／Ｆ部２０１へ出力された更新ウェイトは、ＵＧＣ情報抽出サーバ１００ｂへ送信され、ＵＧＣタグのウェイトが更新されるとともに、ＵＧＣタグの提供元となったリソース（例えばユーザなど）の初期ウェイトが更新される。

なお、ＵＧＣ／一般比較部２０３において比較されるＵＧＣタグ及び一般タグが、対象アイテムと人物及び関係との組み合わせを含む関連人物タグである場合には、ＵＧＣタグと一般タグの人物のみが一致して関係が一致しない場合や、関係のみが一致して人物が一致しない場合などが想定される。このような場合、ＵＧＣタグ評価部２０５は、ＵＧＣタグと一般タグが一致しないものとしてＵＧＣタグを評価するが、人物のみ又は関係のみの一致が発生したことを管理者などへ通知し、ＵＧＣタグ及び一般タグのどちらの信頼度を高くするか選択させるようにしても良い。また、ＵＧＣタグ評価部２０５は、人物のみ又は関係のみが一致する場合には、例えば後述する図１１に示すような人物名鑑サイトにおいて、ＵＧＣタグ及び一般タグの双方の情報をユーザに明示するようにしても良い。

一般タグ評価部２０６は、ＵＧＣ／一般比較部２０３及び正規／一般比較部２０４における比較の結果に基づいて、一般タグの信頼度を評価し、一般タグの評価値を算出する。すなわち、一般タグ評価部２０６は、正規／一般比較部２０４における比較の結果、一致する正規タグがある場合は、一般タグのウェイトを所定値だけ大きくして評価値とする。また、一般タグ評価部２０６は、正規／一般比較部２０４における比較の結果、一致する正規タグがない場合は、ＵＧＣ／一般比較部２０３における比較の結果を参照する。

そして、一般タグ評価部２０６は、ＵＧＣ／一般比較部２０３における比較の結果、一致するＵＧＣタグがある場合は、一般タグのウェイトを大きくして評価値とする。このとき、一般タグ評価部２０６は、一致する正規タグがある場合よりもウェイトの上げ幅を小さくする。これは、上述したように、ＵＧＣタグのみに一致する一般タグは、正規タグに一致する一般タグに比べると信頼度が低いと考えられるためである。また、一般タグ評価部２０６は、一致するＵＧＣタグのウェイトに応じて一般タグのウェイトの上げ幅を決定しても良い。こうすることにより、一致するＵＧＣタグの信頼度に応じて、一般タグの評価値を算出することができる。

一般タグ評価部２０６は、ＵＧＣ／一般比較部２０３における比較の結果、一致するＵＧＣタグがない場合は、一般タグと比較されたＵＧＣタグの量に応じて一般タグのウェイトを小さくして評価値とする。すなわち、一般タグと比較されたＵＧＣタグの数が所定数以上であるにも拘らず、一般タグがいずれのＵＧＣタグとも一致しなければ、一般タグ評価部２０６は、一般タグのウェイトを下げる。ただし、一般タグが、まだ広く報じられていない新情報を含んでいる可能性があるため、この一般タグを管理者に提示し、管理者にウェイトの増減の判断を要求しても良い。なお、一般タグと比較されたＵＧＣタグの数が所定数未満である場合は、一般タグ評価部２０６は、一般タグのウェイトを変更しない。一般タグ評価部２０６は、算出された評価値を評価値マージ部２０７へ出力するとともに、一般タグの更新ウェイトとして抽出サーバＩ／Ｆ部２０１へ出力する。抽出サーバＩ／Ｆ部２０１へ出力された更新ウェイトは、一般情報抽出サーバ１００ｃへ送信され、一般タグのウェイトが更新されるとともに、一般タグの提供元となったリソース（例えばサイトなど）の初期ウェイトが更新される。

評価値マージ部２０７は、ＵＧＣタグ評価部２０５によって算出された評価値及び一般タグ評価部２０６によって算出された評価値を正規タグの評価値とマージし、タグ評価値ＤＢ２０８に登録する。具体的には、評価値マージ部２０７は、正規タグ、ＵＧＣタグ及び一般タグを対象アイテム別に分類し、対象アイテムごとのタグの一覧を作成する。そして、各タグに評価値を対応付けて、タグ評価値ＤＢ２０８に記憶させる。このとき、評価値マージ部２０７は、正規タグの評価値をすべて最大値の１．００とする。

タグ評価値ＤＢ２０８は、評価値マージ部２０７によって対象アイテムごとに分類されたタグと評価値を対応付けて記憶する。具体的には、タグ評価値ＤＢ２０８は、例えば図６に示すように、対象アイテムごとの関連人物タグ及び属性タグの一覧を保持しており、それぞれのタグには評価値が対応付けられている。

図６は、タグ評価値ＤＢ２０８に保持されたタグのうち、対象アイテム「ＰＰＰ」に関する関連人物タグ及び属性タグの一覧を示している。これらの関連人物タグ及び属性タグは、いずれも正規タグ、ＵＧＣタグ及び一般タグを含んでおり、それぞれのタグに評価値が対応付けられている。これらの評価値のうち、正規タグに対応付けられた評価値はいずれも最大値の１．００であるが、ＵＧＣタグ及び一般タグに対応付けられた評価値は、それぞれＵＧＣタグ評価部２０５及び一般タグ評価部２０６によって算出された評価値である。タグの評価値が高ければ高いほど、そのタグの信頼度は高いことになり、対象アイテムに関連する正確な情報である可能性が高くなる。

なお、ここでは、評価値マージ部２０７が対象アイテムごとのタグの分類を行い、それぞれ正規タグ、ＵＧＣタグ及び一般タグの一覧に評価値を対応付けてタグ評価値ＤＢ２０８に保持させるものとしたが、正規タグ、ＵＧＣタグ及び一般タグの中に同一の情報を含むタグがある場合には、この情報に対して評価値を対応付けるようにしても良い。すなわち、例えば図６において、対象アイテム「ＰＰＰ」の関連人物タグには、人物「ＡＡＡ」との関係「コンビ」という同一の情報を含む正規タグ、ＵＧＣタグ及び一般タグの３つのタグがあるため、これらのタグの評価値の合計値又は平均値をこの情報の評価値としてタグ評価値ＤＢ２０８に保持するようにしても良い。同様に、人物「ＢＢＢ」との関係「共演」という同一の情報を含む正規タグ及びＵＧＣタグの２つのタグがあるため、これらのタグの評価値の合計値又は平均値をこの情報の評価値としてタグ評価値ＤＢ２０８に保持するようにしても良い。この場合には、タグ評価値ＤＢ２０８は、情報ごとに評価値を対応付けて記憶するため、図６における「タグ種別」の項目を含まないことになる。

さらに、タグ評価値ＤＢ２０８は、正規タグの評価値を保持せずに、ＵＧＣタグ及び一般タグの評価値のみを保持するようにしても良い。すなわち、正規タグの評価値はすべて最大値の１．００である一方、ＵＧＣタグ及び一般タグの評価値は変動するため、ＵＧＣタグ及び一般タグの評価値のみを保持しておくことにより、各タグに含まれる情報の信頼度に差をつけることができる。そして、正規タグの評価値のみでは情報の信頼度を評価できない場合でも、ＵＧＣタグ又は一般タグに正規タグと同一の情報が含まれていれば、該当するＵＧＣタグ又は一般タグの評価値によって、正規タグの情報の信頼度を評価することができる。

ウェブサーバＩ／Ｆ部２０９は、ウェブサーバ２０に接続されるインタフェースであり、ウェブサーバ２０がある対象アイテムに関する情報をユーザへ提供する際に、この対象アイテムの関連情報をタグ評価値ＤＢ２０８から読み出す。そして、ウェブサーバＩ／Ｆ部２０９は、読み出した関連情報を評価値が高い順に並べてランク情報を作成し、ウェブサーバ２０へ送信する。

具体的には、ウェブサーバＩ／Ｆ部２０９は、対象アイテムに対応する正規タグ、ＵＧＣタグ及び一般タグをタグ評価値ＤＢ２０８から読み出し、それぞれのタグの評価値によって関連情報の信頼度をランク付けし、関連情報を信頼度の高い順に並べたランク情報を作成する。すなわち、ウェブサーバＩ／Ｆ部２０９は、例えば正規タグに含まれる関連情報について、同一の情報を含むＵＧＣタグ又は一般タグの評価値から信頼度を決定し、関連情報のランク付けをする。例えば図６に示した例では、対象アイテム「ＰＰＰ」に関する人物「ＡＡＡ」との関係「コンビ」という関連情報と、人物「ＢＢＢ」との関係「共演」という関連情報とでは、ＵＧＣタグの評価値が０．７５と０．８２であり、後者の関連情報の方が信頼度が高い。そこで、ウェブサーバＩ／Ｆ部２０９は、対象アイテム「ＰＰＰ」に関する関連情報のうち、人物「ＢＢＢ」との関係「共演」という関連情報を人物「ＡＡＡ」との関係「コンビ」よりも上位にランク付けする。

なお、ウェブサーバＩ／Ｆ部２０９におけるランク情報の作成方法は、上記のものに限定されず、各タグの評価値を用いた任意の方法で良い。例えば、上記の例では、ＵＧＣタグのみを参照したため人物「ＢＢＢ」との関係「共演」という関連情報が人物「ＡＡＡ」との関係「コンビ」よりも上位にランク付けされたが、一般タグを参照すると、人物「ＡＡＡ」との関係「コンビ」という関連情報のみが存在し、人物「ＢＢＢ」との関係「共演」という関連情報は存在していない。そこで、ウェブサーバＩ／Ｆ部２０９は、正規タグ、ＵＧＣタグ及び一般タグのすべてに共通する人物「ＡＡＡ」との関係「コンビ」という関連情報の方が信頼度が高いと判断し、この関連情報を上位にランク付けするようにしても良い。

また、タグ評価値ＤＢ２０８において、情報ごとに評価値が対応付けられている場合には、ウェブサーバＩ／Ｆ部２０９は、情報ごとの評価値の大小を比較することにより、関連情報のランク付けを行うことができる。

次いで、上記のように構成された正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ、一般情報抽出サーバ１００ｃ及び評価装置２００を用いた情報評価方法について、図７から図１０に示すフロー図を参照して説明する。図７は、本実施の形態に係る情報評価方法の全体概要を示すフロー図である。

本実施の形態においては、正規情報抽出サーバ１００ａによって、ネットワークＮ上に公開された公式ページなどから様々な対象アイテムの正規情報が随時抽出されている（ステップＳ１０１）。同様に、ＵＧＣ情報抽出サーバ１００ｂによって、ネットワークＮ上に公開されたブログやレビューページなどから様々な対象アイテムのＵＧＣ情報が随時抽出され（ステップＳ１０２）、一般情報抽出サーバ１００ｃによって、ネットワークＮ上に公開されたニュースサイトなどから様々な対象アイテムの一般情報が随時抽出されている（ステップＳ１０３）。

そして、これらの正規情報、ＵＧＣ情報及び一般情報から、対象アイテムごとの正規タグ、ＵＧＣタグ及び一般タグが取得され、取得されたタグと初期ウェイトが対応付けられた各抽出サーバに登録される。また、タグとウェイトを含むタグ情報が評価装置２００へ送信され、評価装置２００によって、ＵＧＣタグの信頼度が他のタグとの比較により評価されるとともに（ステップＳ１０４）、一般タグの信頼度も他のタグとの比較により評価される（ステップＳ１０５）。

ＵＧＣタグ及び一般タグの信頼度が評価された結果、これらの評価結果を示す評価値がマージされ、評価装置２００にタグごとの評価値が保存される（ステップＳ１０６）。また、ＵＧＣタグ及び一般タグの評価値は、各タグの更新ウェイトとしてＵＧＣ情報抽出サーバ１００ｂ又は一般情報抽出サーバ１００ｃへ送信され、それぞれの抽出サーバにおいて、リソースＤＢ１０４における初期ウェイト及びタグＤＢ１０５におけるウェイトが更新される（ステップＳ１０７）。

このように、各抽出サーバ１００によってネットワークＮから情報が収集され、収集された情報から取得されるタグの信頼度が種別の異なるタグとの比較により評価されるとともに、評価結果がリソースごとの初期ウェイトやタグのウェイトに反映される。このため、対象アイテムの関連情報の信頼度を的確に評価することが可能になるとともに、情報の収集と初期ウェイト及びウェイトの更新を繰り返すことにより、常に関連情報の信頼度を最新の状態に保つことができる。

図８は、上述した情報評価方法の全体概要のうち、図２に示した抽出サーバ１００の処理を示すフロー図である。同図は、主にＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃにおける処理を示しているが、正規情報抽出サーバ１００ａも図８とほぼ同様の処理を行う。

ネットワークＮ上に公開されているウェブ情報が情報抽出部１０１によって抽出されると（ステップＳ２０１）、情報解析部１０２によって、ウェブ情報に含まれるテキストの形態素解析が行われる（ステップＳ２０２）。すなわち、正規情報抽出サーバ１００ａにおいては、対象アイテムの公式ページなどのテキストが形態素解析され、ＵＧＣ情報抽出サーバ１００ｂにおいては、ブログやレビューページなどのテキストが形態素解析され、一般情報抽出サーバ１００ｃにおいては、ニュースサイトなどのテキストが形態素解析される。

情報解析部１０２における形態素解析の結果、対象アイテムの関連情報を含むタグが取得され、取得されたタグは、初期ウェイト設定部１０３へ出力される。具体的には、それぞれの抽出サーバ１００において、それぞれ関連人物タグ及び属性タグの２つからなる正規タグ、ＵＧＣタグ又は一般タグが初期ウェイト設定部１０３へ出力される。そして、初期ウェイト設定部１０３によって、各タグの提供元となったリソースが過去にもタグの提供元となったリソースであるか、新規のリソースであるかが判定される（ステップＳ２０３）。すなわち、ＵＧＣ情報抽出サーバ１００ｂの初期ウェイト設定部１０３においては、タグの提供元となったユーザがリソースＤＢ１０４に既に登録済みであるか否かが判定される。同様に、一般情報抽出サーバ１００ｃの初期ウェイト設定部１０３においては、タグの提供元となったサイトがリソースＤＢ１０４に既に登録済みであるか否かが判定される。

この判定の結果、タグの提供元となったリソースが新規リソースである場合には（ステップＳ２０３Ｙｅｓ）、初期ウェイト設定部１０３によって、新規リソースと初期ウェイトがリソースＤＢ１０４に登録される（ステップＳ２０４）。このとき、新規リソースの初期ウェイトは、例えば最大値の半分の０．５０などとされる。一方、タグの提供元となったリソースが既にリソースＤＢ１０４に登録済みである場合には（ステップＳ２０３Ｎｏ）、初期ウェイト設定部１０３によって、リソースＤＢ１０４からリソースに対応する初期ウェイトが読み出される（ステップＳ２０５）。

そして、初期ウェイト設定部１０３によって、各タグとタグのウェイトとが対応付けられてタグＤＢ１０５に登録される（ステップＳ２０６）。すなわち、新規リソースから得られたタグには、ウェイトとして初期ウェイト０．５０が対応付けられてタグＤＢ１０５に登録され、登録済みのリソースから得られたタグには、ウェイトとしてリソースＤＢ１０４から読み出された初期ウェイトが対応付けられてタグＤＢ１０５に登録される。なお、正規タグについては、信頼度が高いため、正規タグのウェイトは、初期ウェイトを含めてすべて最大値の１．００に固定されている。したがって、ここでは、主にＵＧＣタグ及び一般タグの初期ウェイトが初期ウェイト設定部１０３によって設定され、各タグのウェイトとしてタグＤＢ１０５に登録される。

それぞれの抽出サーバ１００において、タグＤＢ１０５にタグとウェイトが登録されると、評価装置Ｉ／Ｆ部１０６によって、すべてのタグ及びウェイトを含むタグ情報が評価装置２００へ送信される（ステップＳ２０７）。評価装置２００においては、ＵＧＣタグ及び一般タグの信頼度が評価されるが、評価装置Ｉ／Ｆ部１０６からは、正規タグに関するタグ情報も送信される。

そして、評価装置２００においてＵＧＣタグ及び一般タグの信頼度が評価された結果、これらのタグに対応付けられたウェイトの更新ウェイトが評価装置Ｉ／Ｆ部１０６によって受信される（ステップＳ２０８）。受信された更新ウェイトは、初期ウェイト設定部１０３及びウェイト更新部１０７へ出力される。この更新ウェイトには、タグＤＢ１０５に登録されたすべてのタグごとの更新ウェイトが含まれている。そして、ウェイト更新部１０７によって、タグＤＢ１０５に保持されたタグごとのウェイトが、対応する更新ウェイトに更新される（ステップＳ２０９）。

また、初期ウェイト設定部１０３によって、リソース別にタグの更新ウェイトが参照され、更新によるウェイトの増減に応じて、リソースＤＢ１０４に記憶されたリソースの初期ウェイトが更新される（ステップＳ２１０）。具体的には、更新によりウェイトが大きくなったタグに対応するリソースについては、初期ウェイト設定部１０３によって、信頼度が高いリソースであると判断され、リソースＤＢ１０４に登録された初期ウェイトに所定値が加算される。また、更新によりウェイトが小さくなったタグに対応するリソースについては、初期ウェイト設定部１０３によって、信頼度が低いリソースであると判断され、リソースＤＢ１０４に登録された初期ウェイトから所定値が減算される。なお、初期ウェイトが更新される際、各タグのウェイトが更新ウェイトによってどれだけ増減したかに応じて初期ウェイトを増減させても良い。すなわち、例えば更新によってウェイトが大幅に増加したタグに対応するリソースについては、初期ウェイトも大幅に増加させるなどとしても良い。

このように、抽出サーバ１００においては、評価装置２００におけるタグの信頼度の評価の結果、各タグのウェイトが更新されるとともに、タグの提供元となるリソースごとの初期ウェイトが更新される。このため、抽出サーバ１００には、タグごとの信頼度がウェイトとして保持されるとともに、リソースごとの信頼度が初期ウェイトとして保持される。結果として、リソースＤＢ１０４に登録済みのリソースから新たにタグが取得された場合、この新規のタグについてもリソースによって異なる初期ウェイトが設定され、信頼度に応じた差別化をすることができる。

図９は、上述した情報評価方法の全体概要のうち、評価装置２００におけるＵＧＣタグ評価処理を示すフロー図である。

評価装置２００の抽出サーバＩ／Ｆ部２０１には、正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ及び一般情報抽出サーバ１００ｃから、それぞれ正規タグのタグ情報、ＵＧＣタグのタグ情報及び一般タグのタグ情報が随時受信される（ステップＳ３０１）。このうち、正規タグのタグ情報は、正規／ＵＧＣ比較部２０２及び正規／一般比較部２０４へ出力され、ＵＧＣタグのタグ情報は、正規／ＵＧＣ比較部２０２及びＵＧＣ／一般比較部２０３へ出力され、一般タグのタグ情報は、ＵＧＣ／一般比較部２０３及び正規／一般比較部２０４へ出力される。

そして、ＵＧＣタグの信頼度が評価される場合には、まず、正規／ＵＧＣ比較部２０２によって、対象アイテムごとにすべてのＵＧＣタグと正規タグが比較される。比較の結果、ＵＧＣタグが正規タグに一致していれば、このＵＧＣタグの信頼度は高いと考えられる。正規／ＵＧＣ比較部２０２におけるＵＧＣタグと正規タグの比較結果は、ＵＧＣタグ評価部２０５へ出力される。

また、ＵＧＣ／一般比較部２０３によって、対象アイテムごとにすべてのＵＧＣタグと一般タグが比較される。比較の結果、ＵＧＣタグが一般タグに一致していれば、このＵＧＣタグの信頼度は、一致する一般タグがないＵＧＣタグよりも高いと考えられる。ＵＧＣ／一般比較部２０３におけるＵＧＣタグと一般タグの比較結果は、ＵＧＣタグ評価部２０５へ出力される。

そして、ＵＧＣタグ評価部２０５によって、正規／ＵＧＣ比較部２０２における比較結果から、各ＵＧＣタグに一致する正規タグがあるか否かが判定される（ステップＳ３０２）。この判定の結果、正規タグに一致するＵＧＣタグについては（ステップＳ３０２Ｙｅｓ）、信頼度が高いと考えられるため、このＵＧＣタグのウェイトに所定値が加算されてＵＧＣタグの評価値が得られる（ステップＳ３０３）。

一方、正規タグに一致しないＵＧＣタグについては（ステップＳ３０２Ｎｏ）、引き続きＵＧＣタグ評価部２０５によって、ＵＧＣ／一般比較部２０３における比較結果から、各ＵＧＣタグに一致する一般タグがあるか否かが判定される（ステップＳ３０４）。この判定の結果、一般タグに一致するＵＧＣタグについては（ステップＳ３０４Ｙｅｓ）、一致するタグがまったくないＵＧＣタグよりも信頼度が高いと考えられるため、このＵＧＣタグのウェイトに所定値が加算されてＵＧＣタグの評価値が得られる（ステップＳ３０５）。ただし、正規タグには一致せず一般タグにのみ一致するＵＧＣタグは、正規タグに一致するＵＧＣタグよりも信頼度が低いと考えられるため、ウェイトに加算される値は、正規タグに一致するＵＧＣタグのウェイトに加算される値よりも小さい。また、一般タグに一致するＵＧＣタグのウェイトに加算される値は、一致した一般タグのウェイトに応じて決定されるようにしても良い。

これに対して、一般タグに一致しないＵＧＣタグについては（ステップＳ３０４Ｎｏ）、対象アイテムについて誤った関連情報を含んでいる可能性がある。すなわち、対象アイテムについて多くの一般タグが取得されているにも拘らず、これらの一般タグの中に一致するものがまったくない場合には、ＵＧＣタグの信頼度が低いと考えられる。そこで、ＵＧＣタグと比較された一般タグのデータ量が所定量以上であるにも拘らず一致する一般タグがないＵＧＣタグについては、ＵＧＣタグ評価部２０５によって、ＵＧＣタグのウェイトから所定値が減算されて評価値が得られる（ステップＳ３０６）。また、ＵＧＣタグと比較された一般タグの数が所定数未満である場合には、ＵＧＣタグの現時点でのウェイトがそのまま評価値となる。

このようにして、ＵＧＣタグの評価値が算出されると、これらのＵＧＣタグの評価値は、ＵＧＣタグの更新ウェイトとして抽出サーバＩ／Ｆ部２０１からＵＧＣ情報抽出サーバ１００ｂへ送信される（ステップＳ３０７）。また、ＵＧＣタグの評価値は、ＵＧＣタグ評価部２０５から評価値マージ部２０７へ出力され、評価値マージ部２０７によって、正規タグの評価値及び一般タグの評価値とマージされる（ステップＳ３０８）。

図１０は、上述した情報評価方法の全体概要のうち、評価装置２００における一般タグ評価処理を示すフロー図である。同図において、図９と同じ部分には同じ符号を付している。

そして、一般タグの信頼度が評価される場合には、まず、正規／一般比較部２０４によって、対象アイテムごとにすべての一般タグと正規タグが比較される。比較の結果、一般タグが正規タグに一致していれば、この一般タグの信頼度は高いと考えられる。正規／一般比較部２０４における一般タグと正規タグの比較結果は、一般タグ評価部２０６へ出力される。

また、ＵＧＣ／一般比較部２０３によって、対象アイテムごとにすべての一般タグとＵＧＣタグが比較される。比較の結果、一般タグがＵＧＣタグに一致していれば、この一般タグの信頼度は、一致するＵＧＣタグがない一般タグよりも高いと考えられる。ＵＧＣ／一般比較部２０３における一般タグとＵＧＣタグの比較結果は、一般タグ評価部２０６へ出力される。

そして、一般タグ評価部２０６によって、正規／一般比較部２０４における比較結果から、各一般タグに一致する正規タグがあるか否かが判定される（ステップＳ４０１）。この判定の結果、正規タグに一致する一般タグについては（ステップＳ４０１Ｙｅｓ）、信頼度が高いと考えられるため、この一般タグのウェイトに所定値が加算されて一般タグの評価値が得られる（ステップＳ４０２）。

一方、正規タグに一致しない一般タグについては（ステップＳ４０１Ｎｏ）、引き続き一般タグ評価部２０６によって、ＵＧＣ／一般比較部２０３における比較結果から、各一般タグに一致するＵＧＣタグがあるか否かが判定される（ステップＳ４０３）。この判定の結果、ＵＧＣタグに一致する一般タグについては（ステップＳ４０３Ｙｅｓ）、一致するタグがまったくない一般タグよりも信頼度が高いと考えられるため、この一般タグのウェイトに所定値が加算されて一般タグの評価値が得られる（ステップＳ４０４）。ただし、正規タグには一致せずＵＧＣタグにのみ一致する一般タグは、正規タグに一致する一般タグよりも信頼度が低いと考えられるため、ウェイトに加算される値は、正規タグに一致する一般タグのウェイトに加算される値よりも小さい。また、ＵＧＣタグに一致する一般タグのウェイトに加算される値は、一致したＵＧＣタグのウェイトに応じて決定されるようにしても良い。

これに対して、ＵＧＣタグに一致しない一般タグについては（ステップＳ４０３Ｎｏ）、対象アイテムについて誤った関連情報を含んでいる可能性がある。すなわち、対象アイテムについて多くのＵＧＣタグが取得されているにも拘らず、これらのＵＧＣタグの中に一致するものがまったくない場合には、一般タグの信頼度が低いと考えられる。そこで、一般タグと比較されたＵＧＣタグのデータ量が所定量以上であるにも拘らず一致するＵＧＣタグがない一般タグについては、一般タグ評価部２０６によって、一般タグのウェイトから所定値が減算されて評価値が得られる（ステップＳ４０５）。また、一般タグと比較されたＵＧＣタグの数が所定数未満である場合には、一般タグの現時点でのウェイトがそのまま評価値となる。

このようにして、一般タグの評価値が算出されると、これらの一般タグの評価値は、一般タグの更新ウェイトとして抽出サーバＩ／Ｆ部２０１から一般情報抽出サーバ１００ｃへ送信される（ステップＳ３０７）。また、一般タグの評価値は、一般タグ評価部２０６から評価値マージ部２０７へ出力され、評価値マージ部２０７によって、正規タグの評価値及びＵＧＣタグの評価値とマージされる（ステップＳ３０８）。

以上のように、評価装置２００においてＵＧＣタグ及び一般タグの信頼度が評価され、各タグの評価値がタグ評価値ＤＢ２０８に記憶される。この結果、ウェブサーバ２０が様々な対象アイテムに関する関連情報を信頼度が高い順にユーザへ提供することが可能となる。具体的に、ユーザがユーザ端末１０を操作することによって、例えば対象アイテム「ＰＰＰ」についての関連情報をウェブサーバ２０に要求した場合を考える。この場合、ウェブサーバ２０は、評価装置２００に対して対象アイテム「ＰＰＰ」の関連情報を要求し、評価装置２００のウェブサーバＩ／Ｆ部２０９によって、対象アイテム「ＰＰＰ」の関連情報がタグ評価値ＤＢ２０８から取得される。そして、ウェブサーバＩ／Ｆ部２０９によって、対象アイテム「ＰＰＰ」の関連情報が信頼度の高い順に並べられ、得られたランク情報がウェブサーバ２０へ提供される。

これにより、ウェブサーバ２０はユーザ端末１０に対して、例えば図１１に示すような人物名鑑サイトにおいて対象アイテム「ＰＰＰ」の関連情報を提供する。図１１において、情報３０１は、対象アイテム「ＰＰＰ」の関連人物タグから得られた情報であり、タグ評価値ＤＢ２０８において評価値が高いタグにおける人物と関係の情報が並べて表示されている。また、情報３０２は、対象アイテム「ＰＰＰ」の属性タグから得られた情報であり、タグ評価値ＤＢ２０８において評価値が高いタグにおける属性の情報が並べて表示されている。

以上のように、本実施の形態によれば、ウェブ情報を正規情報、ＵＧＣ情報及び一般情報に分類した上で、それぞれのウェブ情報から取得される正規タグ、ＵＧＣタグ及び一般タグを互いに比較して、ＵＧＣタグ及び一般タグの信頼度を評価する。このため、ネットワークからアイテムに関する関連情報を収集する場合、収集された情報の信頼度を評価することができる。また、このように情報の信頼度を評価することで、単純にＵＧＣ情報や一般情報から抽出したタグの情報を取得するのではなく、ある程度信頼度の高いＵＧＣタグや一般タグを選定した上で情報を取得し、正規タグから得られる情報を補うことが可能となる。

なお、上記一実施の形態においては、正規タグのウェイト及び評価値が常に最大値の１．００に固定されるものとしたが、正規タグについても、ＵＧＣタグ又は一般タグと一致する場合は評価を上昇させ、一致しない場合は評価を下降させるようにしても良い。このようにすることにより、情報の信頼度には差がない正規タグについて、一般に広く知られている情報や流行している情報を含む場合には、一致するＵＧＣタグや一般タグが多いことから、評価が上昇することになる。

また、上記一実施の形態においては、対象アイテムが人物である場合を例に挙げて説明した。しかし、本発明は、対象アイテムが例えば電化製品のような物などである場合にも適用可能である。そして、上記一実施の形態においては、対象アイテムを人物としたため、関連人物タグ及び属性タグの２種類のタグを例示したが、対象アイテムに関するタグは、これらの２種類に限定されない。すなわち、タグが対象アイテムと対象アイテムの関連情報とを組み合わせた情報を含んでいれば、上記一実施の形態と同様に本発明を適用することができる。

また、上記一実施の形態においては、正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ、一般情報抽出サーバ１００ｃ及び評価装置２００を別体として設けるものとしたが、これらの全部又は一部を一体的に設けることも可能である。

なお、上記一実施の形態においては、正規情報及びＵＧＣ情報以外の一般的な情報を含むウェブ情報を一般情報としたが、正規情報及びＵＧＣ情報を含む全般のウェブ情報を一般情報としても良い。この場合、正規タグ及びＵＧＣタグを含むすべてのタグが一般タグに含まれると考えられるが、例えば一般タグの相対的な量などに基づいてウェイトを決定したり、量が少ない場合はタグに含めなかったりする処理を行えば良い。

さらに、上記一実施の形態において説明した情報評価方法をコンピュータが実行可能な形式で記述した情報評価プログラムを生成し、この情報評価プログラムをコンピュータに実行させることにより、上記一実施の形態における正規情報抽出サーバ１００ａ、ＵＧＣ情報抽出サーバ１００ｂ、一般情報抽出サーバ１００ｃ及び評価装置２００と同等の効果を得ることも可能である。このとき、情報評価プログラムをコンピュータが読み取り可能な記録媒体に記憶させ、記録媒体を用いてコンピュータに情報評価プログラムを導入することも可能である。

本発明に係る情報評価装置及び情報評価方法は、例えばネットワークからアイテムに関する関連情報を収集する場合、収集された情報の信頼度を評価する場合に有用である。

１００抽出サーバ
１００ａ正規情報抽出サーバ
１００ｂ情報抽出サーバ
１００ｃ一般情報抽出サーバ
１０１情報抽出部
１０２情報解析部
１０３初期ウェイト設定部
１０４リソースＤＢ
１０５タグＤＢ
１０６評価装置Ｉ／Ｆ部
１０７ウェイト更新部
２００評価装置
２０１抽出サーバＩ／Ｆ部
２０２正規／ＵＧＣ比較部
２０３ＵＧＣ／一般比較部
２０４正規／一般比較部
２０５ＵＧＣタグ評価部
２０６一般タグ評価部
２０７評価値マージ部
２０８タグ評価値ＤＢ
２０９ウェブサーバＩ／Ｆ部

Claims

ネットワーク上に公開されているウェブ情報から正規情報を抽出し、当該正規情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる正規タグを取得する正規タグ取得装置と、
ネットワーク上に公開されているウェブ情報からＵＧＣ（User Generated Contents）情報を抽出し、当該ＵＧＣ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなるＵＧＣタグを取得するＵＧＣタグ取得装置と、
ネットワーク上に公開されているウェブ情報から一般ウェブ情報を抽出し、当該一般ウェブ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる一般タグを取得する一般タグ取得装置と、
前記ＵＧＣタグ及び前記一般タグの評価値を算出する評価装置と
を有し、
前記評価装置は、
前記正規タグ取得装置から送信される正規タグ、前記ＵＧＣタグ取得装置から送信されるＵＧＣタグ、及び、前記一般タグ取得装置から送信される一般タグをそれぞれ受信する受信手段と、
前記受信手段によって受信されたＵＧＣタグと、前記受信手段によって受信された正規タグ及び一般タグとの比較により、ＵＧＣタグの評価値を算出するＵＧＣタグ評価手段と、
前記受信手段によって受信された一般タグと、前記受信手段によって受信された正規タグ及びＵＧＣタグとの比較により、一般タグの評価値を算出する一般タグ評価手段と
を有することを特徴とする情報評価システム。
前記評価装置は、
前記ＵＧＣタグ評価手段によって算出されたＵＧＣタグの評価値及び前記一般タグ評価手段によって算出された一般タグの評価値を前記アイテム及び前記関連情報に関連付けて記憶するタグ評価値データベースと、
ウェブサーバからの要求に応じたアイテムの関連情報を前記タグ評価値データベースから読み出し、当該読み出した関連情報を前記評価値に基づいて並べたランク情報を前記ウェブサーバへ送信するランク情報送信手段と
を有することを特徴とする請求項１に記載の情報評価システム。
前記ＵＧＣタグ取得装置は、
前記ＵＧＣタグの提供元の信頼度を示すウェイトを記憶するＵＧＣタグリソースデータベースと、
前記取得したＵＧＣタグの提供元のウェイトを前記ＵＧＣタグリソースデータベースから読み出して前記取得したＵＧＣタグのウェイトとして設定するＵＧＣタグウェイト設定手段と、
前記ＵＧＣタグウェイト設定手段によって設定された前記ＵＧＣタグのウェイトを前記取得したＵＧＣタグと共に前記評価装置へ送信する送信手段と、
を有し、
前記一般タグ取得装置は、
前記一般タグの提供元の信頼度を示すウェイトを記憶する一般タグリソースデータベースと、
前記取得した一般タグの提供元のウェイトを前記一般タグリソースデータベースから読み出して前記取得した一般タグのウェイトとして設定する一般タグウェイト設定手段と、
前記一般タグウェイト設定手段によって設定された前記一般タグのウェイトを前記取得した一般タグと共に前記評価装置へ送信する送信手段と、を有し、
前記受信手段は、
前記ＵＧＣタグのウェイトを前記ＵＧＣタグ取得装置から受信し、また、前記一般タグのウェイトを前記一般タグ取得装置から受信し、
前記ＵＧＣタグ評価手段は、
前記ＵＧＣタグと前記正規タグ及び前記一般タグとの比較結果に基づいて、前記ＵＧＣタグのウェイトを増減させて前記ＵＧＣタグの評価値とし、
前記一般タグ評価手段は、
前記一般タグと前記正規タグ及び前記ＵＧＣタグとの比較結果に基づいて、前記一般タグのウェイトを増減させて前記一般タグの評価値とする
ことを特徴とする請求項１または２に記載の情報評価システム。
前記評価装置は、
前記ＵＧＣタグ評価手段によって算出された前記ＵＧＣタグの評価値を、前記ＵＧＣタグの更新ウェイトとして前記ＵＧＣタグ取得装置へ送信し、また、前記一般タグ評価手段によって算出された前記一般タグの評価値を、前記一般タグの更新ウェイトとして前記一般タグ取得装置へ送信する更新ウェイト送信手段を有し、
前記ＵＧＣタグ取得装置は、
前記評価装置から前記ＵＧＣタグの更新ウェイトを取得するＵＧＣタグ更新ウェイト取得手段と、
前記ＵＧＣタグ更新ウェイト取得手段によって取得された前記ＵＧＣタグの更新ウェイトに基づき、前記ＵＧＣタグリソースデータベースに記憶された前記ＵＧＣタグの提供元のウェイトを更新するＵＧＣタグウェイト更新手段と、を有し、
前記一般タグ取得装置は、
前記評価装置から前記一般タグの更新ウェイトを取得する一般タグ更新ウェイト取得手段と、
前記一般タグ更新ウェイト取得手段によって取得された前記一般タグの更新ウェイトに基づき、前記一般タグリソースデータベースに記憶された前記一般タグの提供元のウェイトを更新する一般タグウェイト更新手段と
を有することを特徴とする請求項３に記載の情報評価システム。
前記ＵＧＣタグ評価手段は、
ＵＧＣタグがいずれかの正規タグまたは一般タグに一致する場合に、当該ＵＧＣタグの評価値を現在の評価値より高くすることを特徴とする請求項１〜３のいずれか１つに記載の情報評価システム。
前記ＵＧＣタグ評価手段は、
ＵＧＣタグがいずれかの一般タグに一致する場合に、当該ＵＧＣタグがいずれかの正規タグに一致する場合よりも評価値の増分を小さくすることを特徴とする請求項５に記載の情報評価システム。
前記ＵＧＣタグ評価手段は、
ＵＧＣタグがいずれの正規タグ及び一般タグにも一致せず、かつＵＧＣタグと比較され
た一般タグが所定数以上ある場合に、当該ＵＧＣタグの評価値を現在の評価値よりも低くすることを特徴とする請求項１〜３のいずれか１つに記載の情報評価システム。
前記一般タグ評価手段は、
一般タグがいずれかの正規タグまたはＵＧＣタグに一致する場合に、当該一般タグの評価値を現在の評価値より高くすることを特徴とする請求項１〜３のいずれか１つに記載の情報評価システム。
前記一般タグ評価手段は、
一般タグがいずれかのＵＧＣタグに一致する場合に、当該一般タグがいずれかの正規タグに一致する場合よりも評価値の増分を小さくすることを特徴とする請求項８に記載の情報評価システム。
前記一般タグ評価手段は、
一般タグがいずれの正規タグ及びＵＧＣタグにも一致せず、かつ一般タグと比較された
ＵＧＣタグが所定数以上ある場合に、当該一般タグの評価値を現在の評価値よりも低くすることを特徴とする請求項１〜３のいずれか１つに記載の情報評価システム。
前記ＵＧＣタグ評価手段又は前記一般タグ評価手段における比較の結果、ＵＧＣタグと
一般タグの一部分が一致する場合に、一致しない部分のすべての情報をユーザへ提供する
提供手段をさらに有することを特徴とする請求項１〜３のいずれか１つに記載の情報評価システム。
正規タグ取得装置が、ネットワーク上に公開されているウェブ情報から正規情報を抽出し、当該正規情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる正規タグを取得し、
ＵＧＣタグ取得装置が、ネットワーク上に公開されているウェブ情報からＵＧＣ（User Generated Contents）情報を抽出し、当該ＵＧＣ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなるＵＧＣタグを取得し、
一般タグ取得装置が、ネットワーク上に公開されているウェブ情報から一般ウェブ情報を抽出し、当該一般ウェブ情報内から形態素解析によって取得されたタグであって、アイテムと当該アイテムの関連情報との組み合わせからなる一般タグを取得し、
評価装置が、前記正規タグ取得装置から送信される正規タグ、前記ＵＧＣタグ取得装置から送信されるＵＧＣタグおよび前記一般タグ取得装置から送信される一般タグを受信し、
前記評価装置が、前記受信されたＵＧＣタグと、前記受信された正規タグ及び前記受信された一般タグとの比較により、ＵＧＣタグの評価値を算出し、
前記評価装置が、前記受信された一般タグと、前記受信された正規タグ及び前記受信されたＵＧＣタグとの比較により、一般タグの評価値を算出する
ことを特徴とする情報評価方法。