JP4344339B2 - Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium - Google Patents

Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium Download PDF

Info

Publication number
JP4344339B2
JP4344339B2 JP2005128413A JP2005128413A JP4344339B2 JP 4344339 B2 JP4344339 B2 JP 4344339B2 JP 2005128413 A JP2005128413 A JP 2005128413A JP 2005128413 A JP2005128413 A JP 2005128413A JP 4344339 B2 JP4344339 B2 JP 4344339B2
Authority
JP
Japan
Prior art keywords
information
content
link
evaluation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005128413A
Other languages
Japanese (ja)
Other versions
JP2006202253A (en
Inventor
考 藤村
直人 谷本
孝史 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005128413A priority Critical patent/JP4344339B2/en
Publication of JP2006202253A publication Critical patent/JP2006202253A/en
Application granted granted Critical
Publication of JP4344339B2 publication Critical patent/JP4344339B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワーク上のコミュニティにおいて提供される情報の評判を評価する技術に関する。   The present invention relates to a technique for evaluating the reputation of information provided in a community on a network.

近年、お互いに同じ関心を持つユーザ同士で情報を共有する多くのコミュニティがインターネット上に形成されている。このようなコミュニティの一例としては、以下で述べる、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等がある。
問題解決型コミュニティは、あるトピックにおける問題(例えば商品利用におけるトラブル)について、ユーザ主導で相互的なサポートを行うコミュニティであり、一例としては、株式会社オーケイウェブの「OKWeb」 や、Sun Microsystems, Inc.の「Sun Support Forums」などのユーザフォーラム型カスタマサポートサイト等がある。
In recent years, many communities that share information among users who share the same interest have been formed on the Internet. Examples of such communities include 1) a problem solving community, 2) a product / service evaluation community, 3) a user creation community, and 4) a topic-based community.
A problem-solving community is a community that provides user-supported mutual support for problems in a topic (for example, troubles in product use). There are user forum type customer support sites such as "Sun Support Forums".

商品・サービス評価コミュニティは、商品やサービスに対するユーザレビューを共有するためのコミュニティであり、一例としては、アイスタイル株式会社の「cosme.net」や株式会社カカクコムの提供する「kakaku.com」等がある。
ユーザ創造型コミュニティは、ユーザ主導による新サービス創造などを目的としたコミュニティであり、一例としては、株式会社エンジンの「たのみこむ」やエレファントデザイン株式会社の「空想生活」等がある。
トピックベースコミュニティは、あるトピックについて、ユーザ間でのディスカッションや情報共有が行われるコミュニティであり、取り扱われるトピックはコミュニティによって多種多様である。一例としては、「Slashdot.jp」や株式会社ベネッセウィコーポレーションの「ベネッセウイメンズパーク」等がある。
The product / service evaluation community is a community for sharing user reviews on products and services. For example, “cosme.net” from iStyle Inc. and “kakaku.com” provided by Kakaku.com Inc. is there.
The user-creative community is a community for the purpose of creating a new service driven by the user, and examples thereof include “Tanokomu” of Engine Co., Ltd. and “Fancy Life” of Elephant Design Co., Ltd.
The topic-based community is a community where discussions and information sharing are performed between users on a certain topic, and the topics handled vary widely depending on the community. Examples include “Slashdot.jp” and “Benesseui Men's Park” of Benessewi Corporation.

本発明はこれらの特定のコミュニティのみに適用されるわけではなく、これらを含む多様な情報共有型のコミュニティに適用できる。これらの情報共有型コミュニティでは、コミュニティの参加者から広く記事やコンテンツを集めるという特徴を有しており、コミュニティには様々な参加者が含まれるため、これらの参加者によって提供される情報やコンテンツの品質は千差万別である。多くの人が関心を持つ有益かつ信頼度の高い情報を提供する人がいる一方で、誰も関心を持たない情報を大量に投入する参加者や、意図的ないし無意識のうちに正しくない情報を投入する参加者も存在する。また、コミュニティに対して投入された情報に対する評価の入力についても、意図的ないし無意識のうちに真実ではない評価を投入する参加者も存在する。そこで、コミュニティに提供する情報の中から、有益な情報を抽出するためには、コミュニティ参加者の情報提供能力、及び情報評価能力を考慮に入れた情報評価装置或いは情報評価方法が重要となる。   The present invention is not applied only to these specific communities, but can be applied to various information sharing communities including them. These information-sharing communities have the characteristic of gathering articles and content widely from community participants, and since the community includes various participants, information and content provided by these participants The quality of each is incredible. While there are people who provide useful and reliable information that many people are interested in, participants who input a large amount of information that no one is interested in, or information that is intentionally or unconsciously incorrect There are also participants who participate. In addition, there are also participants who intentionally or unconsciously input an evaluation that is not true with respect to the input of evaluation for information input to the community. Therefore, in order to extract useful information from information provided to the community, an information evaluation device or an information evaluation method that takes into account the information providing ability and information evaluation ability of the community participants is important.

このような参加者の能力を考慮に入れ、コミュニティに投稿される情報の重要性をスコアリングするシステムの一例が、特許文献1に記載されている。この文献では、コミュニティに投稿された情報の有益度を数値化した情報評判スコアと、参加者の情報提供能力を数値化した情報提供スコア(該文献では情報発言スコアと記載)と、参加者の情報評価能力を数値化した情報評価スコアの3つのスコアを導入し、これらのスコアの相互依存関係に基づき計算する算出アルゴリズムを提案している。
しかしながら、該文献に記載された方法では、情報提供能力及び情報評価能力に対応する情報提供スコア及び情報評価スコアが該文献段落〔0060〕に記載されている[式(2)]及び、段落〔0063〕に記載されている[式(3)]のように、情報評判スコアの変動に比例して単純に情報評価スコア及び情報提供スコアを変動させるのみである。このため、このアルゴリズムに基づき、実際に大量のデータを読み込ませてみると、初期の段階で高いスコアを得た人の情報提供スコアや情報評価スコアが時間の経過に伴い、ますます増大し発散する傾向があり、そのままでは有用な値が得られないという問題がある。これは、特許文献1に記載された方法ではスコアに対する意味論が厳密に定義されておらず、算出されたスコアも全体として整合がとれたものになっていないことに起因するものである。
An example of a system for scoring the importance of information posted to the community in consideration of the ability of such participants is described in Patent Document 1. In this document, the information reputation score that quantifies the usefulness of information posted to the community, the information provision score that quantifies the information provision ability of the participant (described as the information utterance score in the document), the participant's We have proposed a calculation algorithm that introduces three information evaluation scores that quantify information evaluation ability and calculates based on the interdependence of these scores.
However, in the method described in the document, the information provision score and the information evaluation score corresponding to the information provision ability and the information evaluation ability are expressed in the [Formula (2)] and the paragraph [ [Formula (3)] described in [0063], the information evaluation score and the information provision score are simply changed in proportion to the change in the information reputation score. For this reason, when a large amount of data is actually read based on this algorithm, the information provision score and information evaluation score of a person who obtained a high score in the initial stage will increase and diverge over time. There is a problem that a useful value cannot be obtained as it is. This is due to the fact that the method described in Patent Document 1 does not strictly define the semantics for the score, and the calculated score is not consistent as a whole.

すなわち、情報評判スコア、情報提供スコア、情報評価スコアの3つのスコアを安定させ、しかもコミュニティの参加者の活動の実態に合うスコアとするためには、スコアの意味論を厳密に定義することが必要である。例えば、非特許文献1では、Webページの重要度を表すPageRankと呼ぶ指標を、ランダムサーファーモデルと呼ぶ意味論に基づき計算している。ランダムサーファーモデルは、Webページに存在するハイパーリンクをランダムにクリックした場合の各ページへの到着確率をPageRankとして定義している。このモデルに基づく具体的なスコアの計算方法は、おおよそ次のようなものである。   That is, in order to stabilize the three scores of the information reputation score, the information provision score, and the information evaluation score, and to obtain a score that matches the actual situation of the activities of the community participants, it is necessary to define the semantics of the score strictly. is necessary. For example, in Non-Patent Document 1, an index called PageRank representing the importance of a Web page is calculated based on a semantic called a random surfer model. In the random surfer model, the probability of arrival at each page when a hyperlink existing on a Web page is randomly clicked is defined as PageRank. A specific score calculation method based on this model is roughly as follows.

各Webページをグラフ理論におけるノード、リンクをエッジとみなしたときに、Webページ数をNとすると、N×Nの隣接行列Lで表現できる。この隣接行列を転置し、さらにそれぞれの列ベクトルの総和が1となるようにそれぞれのリンク数で割った行列を作成する。これは推移確率行列となる。推移確率行列の場合、線形代数学の基礎理論により、推移確率行列の最大固有値に属する固有ベクトルを求めることが、最終的な到着確率ベクトルを計算することとなることが知られている。したがって、ランダムサーファーモデルによる各ページの到着確率は、前記の推移確率行列の固有ベクトルを算出することで、実現できる。固有ベクトルの算出アルゴリズムについては、多くの方法が提案されているため、詳しくは省略するが、最も単純な方法としては、前記確率推移行列の掛け算を反復して行うことで、最大固有値に属する固有ベクトルを計算する方法等がある。   When each web page is regarded as a node in graph theory and a link is an edge, if the number of web pages is N, it can be represented by an adjacency matrix L of N × N. This adjacency matrix is transposed, and a matrix divided by the number of links so that the sum of the column vectors is 1 is created. This is a transition probability matrix. In the case of a transition probability matrix, it is known that the final arrival probability vector is calculated by obtaining the eigenvector belonging to the maximum eigenvalue of the transition probability matrix according to the basic theory of linear algebra. Therefore, the arrival probability of each page by the random surfer model can be realized by calculating the eigenvector of the transition probability matrix. A number of methods for calculating the eigenvector have been proposed, and will not be described in detail. However, as the simplest method, the eigenvector belonging to the maximum eigenvalue can be obtained by repeating the multiplication of the probability transition matrix. There are methods to calculate.

同様に、非特許文献2には、HITSと呼ぶ、Webページのスコアリングのアルゴリズムが提案されている。このアルゴリズムでは、各ページの情報提供能力を表すAuthorityベクトルaと、各ページの情報評価能力を表すhubベクトルhという指標を導入し、Webページの隣接行列Lとその転置行列LTとするとき、aが行列LTLの固有ベクトル、hが 行列LLTの固有ベクトルとして算出することを提案している。
特開2003−316915号公報 S. Brin and L. Page, “The anatomy of a large-scale hyper-textual web search engine.” Proceedings of 7th WWW Conference, (1998). J. M. Kleinberg, “Authoritative sources in hyperlinked environment”, Journal of ACM, Vol. 48, pp. 604-632 (1999).
Similarly, Non-Patent Document 2 proposes a web page scoring algorithm called HITS. In this algorithm, the Authority vector a representing the information providing capability of each page, by introducing an indication that hub vector h representative of the information evaluation capacity of each page, when the adjacency matrix L of the Web page and its transposed matrix L T, a is the eigenvector matrix L T L, h is proposed to calculate the eigenvectors of the matrix LL T.
JP 2003-316915 A S. Brin and L. Page, “The anatomy of a large-scale hyper-textual web search engine.” Proceedings of 7th WWW Conference, (1998). JM Kleinberg, “Authoritative sources in hyperlinked environment”, Journal of ACM, Vol. 48, pp. 604-632 (1999).

しかしながら、上記のように行列によるモデル化と行列の固有ベクトルを用いて計算する方法は、Webページのスコアリングの方法としては広く利用されているが、本発明が対象とする上記のコミュニティ分析に適用する方法は十分に検討されていない。Webページの場合には、ハイパーテキストのリンクと呼ぶ1種類のリンクに基づいて、隣接行列や推移確率行列等を生成するのに対し、本発明が対象とするコミュニティ分析においては、参加者が情報に対して行った情報提供に対応する情報提供リンクと、同じく参加者が情報に対して行った情報評価アクションに対応する情報評価リンクの2種類のリンクが存在する。また、これらのリンクは、コミュニティの参加者がM人、提供或いは評価された情報がN個とするとき、情報提供リンク及び情報評価リンクはそれぞれM×Nの隣接行列を構成する等、多くの点でWebページのスコアリングと異なっており、上記で述べたPageRankやHITSといったアルゴリズムをそのまま適用することは困難である。   However, as described above, the matrix modeling and the calculation method using the eigenvectors of the matrix are widely used as scoring methods for web pages. However, the method is applied to the above-described community analysis targeted by the present invention. How to do is not fully studied. In the case of a web page, an adjacency matrix, a transition probability matrix, etc. are generated based on one type of link called a hypertext link, whereas in the community analysis targeted by the present invention, participants are given information. There are two types of links: an information provision link corresponding to the information provision performed on the information and an information evaluation link corresponding to an information evaluation action performed on the information by the participant. In addition, there are many links, such as when the number of community participants is M and the number of information provided or evaluated is N, the information provision link and the information evaluation link each constitute an M × N adjacency matrix. It differs from Web page scoring in that point, and it is difficult to apply the algorithms such as PageRank and HITS described above as they are.

本発明は上記のような問題点を鑑みてなされたものであり、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等の様々なコミュニティの中から、参加者から情報への情報提供リンクと情報評価リンクを抽出し、この2種類のリンクを分析することで、全体として整合がとれたスコアを算出できる技術を提供することを目的とする。すなわち、本発明の目的は、2種類のリンクを分析し、評価値として意味のある安定した値のスコアを算出する技術を提供することである。   The present invention has been made in view of the above-described problems, and includes 1) problem solving community, 2) product / service evaluation community, 3) user creation community, 4) topic-based community, and the like. To provide a technology that can calculate a consistent score as a whole by extracting information provision links and information evaluation links from participants to information and analyzing these two types of links Objective. That is, an object of the present invention is to provide a technique for analyzing two types of links and calculating a score of a stable value that is meaningful as an evaluation value.

以上の課題を解決するために、本発明では、以下のように情報評判スコア、情報提供スコア及び情報評価スコアの少なくとも一つを算出する。尚、情報評判スコアは、利用者から提供された電子情報であるコンテンツの評判を数値化したものを意味する。また、情報提供スコアは、コンテンツを提供した利用者の情報提供能力を数値化したものを意味する。さらに、情報評価スコアは、コンテンツを評価した利用者の情報評価能力を数値化したものを意味する。
まず、情報提供リンク格納手段に、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納する。また、情報評価リンク格納手段に、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納する。
In order to solve the above problems, in the present invention, at least one of an information reputation score, an information provision score, and an information evaluation score is calculated as follows. The information reputation score means a value obtained by quantifying the reputation of content, which is electronic information provided by a user. The information provision score means a value obtained by quantifying the information provision ability of the user who provided the content. Furthermore, the information evaluation score means a value obtained by quantifying the information evaluation ability of the user who has evaluated the content.
First, the information provision link information in which the user ID of the user who provided the content and the content ID that is the identifier of the content provided by the user are associated is stored in the information provision link storage means. Further, the information evaluation link storage means stores the user ID of the user who evaluated the content, the content ID which is the identifier of the content evaluated by the user, and the numerical value of the evaluation performed on the content by the content evaluator. Information evaluation link information in which evaluation information that is information is associated is stored.

次に、スコア計算手段において、上述の情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコア(情報評価スコア、情報評判スコア又は情報提供スコアの何れか)との間の定義された関係を示す行列)の固有ベクトルを算出する。そして、スコア計算手段は、この固有ベクトルの要素を何れかのスコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させる。
ここで、スコア計算手段が生成するスコア推移行列は、情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義(スコアに対する意味論の定義)された関係を示す行列である。そして、本発明では、このスコア推移行列の固有値を求め、上述のスコアを求める。そのため、本発明によって求められたスコアは、導入された意味論の定義を厳格に保守したものとなる。その結果、求められたスコアは、導入された意味論のもと数学的に意味のある安定した値となる。
Next, in the score calculation means, the above-described information provision link information and information evaluation link information are used, and a score transition matrix (information provision link information and information evaluation link information and any score (information evaluation score, information reputation score or Eigenvector of a matrix) indicating a defined relationship with any of the information providing scores). Then, the score calculation means stores the element of this eigenvector as any score in the information reputation score storage means, the information provision score storage means, or the information evaluation score storage means.
Here, the score transition matrix generated by the score calculation means is a matrix indicating a defined relationship between the information providing link information, the information evaluation link information, and any score (definition of semantics for the score). In the present invention, the eigenvalue of this score transition matrix is obtained, and the above-mentioned score is obtained. Therefore, the score obtained by the present invention is a strictly maintained definition of the introduced semantics. As a result, the obtained score becomes a mathematically meaningful and stable value under the introduced semantics.

また、本発明において好ましくは、スコア計算手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出する。これにより、数学的に意味のある安定した2種類以上のスコアを算出することができる。
また、本発明において好ましくは、スコア計算手段は以下のようにしてスコアを算出する。まず、第1隣接行列生成手段において、情報提供リンク格納手段に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数え、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)を生成して出力する。また、第2隣接行列生成手段において、情報評価リンク格納手段に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算し、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)を生成して出力する。そして、固有ベクトル算出手段において、情報提供リンク隣接行列と情報評価リンク隣接行列とから、スコア推移行列(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。その後、算出されたスコアを、書き込み手段において、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段の何れかに格納させる。
Preferably, in the present invention, the score calculation means uses the information providing link information or the information evaluation link information and the eigenvector, and any score according to a relational expression indicating a defined relationship between these and any score. Is calculated. This makes it possible to calculate two or more stable scores that are mathematically meaningful.
In the present invention, preferably, the score calculation means calculates the score as follows. First, in the first adjacency matrix generation means, information provision link information stored in the information provision link storage means is searched, and for each combination of user ID and content ID, the number of information provision link information having the combination is calculated. Count and generate an adjacency matrix (information provision link adjacency matrix) with the number as an element of the matrix component corresponding to the combination. Further, in the second adjacency matrix generation means, the information evaluation link information stored in the information evaluation link storage means is searched, and for each combination of user ID and content ID, evaluation information of information evaluation link information having the combination And an adjacency matrix (information evaluation link adjacency matrix) having the added value as an element of a matrix component corresponding to the combination is generated and output. Then, in the eigenvector calculation means, the eigenvector of the score transition matrix (matrix indicating the relationship between the information provision link adjacency matrix, the information evaluation link adjacency matrix, and any score) from the information provision link adjacency matrix and the information evaluation link adjacency matrix And the element of this eigenvector is output as any score. Thereafter, the calculated score is stored in the information reputation score storage means, the information provision score storage means, or the information evaluation score storage means in the writing means.

さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク隣接行列又は情報評価リンク隣接行列と固有ベクトルとを、これらと何れかのスコアとの定義された関係を示す関係式に代入し、当該スコアを算出して出力する。
またさらに、本発明において好ましくは、固有ベクトル算出手段は、以下のように固有ベクトルを算出する。まず、第1正規化手段において、情報提供リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報提供リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報提供リンク隣接行列を出力する。また、第2正規化手段において、情報評価リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報評価リンク隣接行列を出力する。さらに演算手段において、正規化された情報提供リンク隣接行列と正規化された情報評価リンク隣接行列とを用いてスコア推移行列の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。これにより、同一の利用者が多数のコンテンツを提供したり、多数のコンテンツの評価を行ったりすることによって、その利用者の情報提供スコアや情報評価スコアが高められてしまうことを防止できる。
Furthermore, preferably in the present invention, in the score calculation means, the information providing link adjacency matrix or the information evaluation link adjacency matrix and the eigenvector are substituted into a relational expression indicating a defined relationship between these and any score, Calculate and output the score.
Still further preferably in the present invention, the eigenvector calculation means calculates the eigenvector as follows. First, in the first normalization means, each element of the information provision link adjacency matrix is set to “content associated with the user ID in the information provision link storage means” for each set of elements corresponding to each user ID. Normalization is performed by a function depending on the number of IDs, and the normalized information provision link adjacency matrix is output. Further, in the second normalization means, each element of the information evaluation link adjacency matrix is set to “content associated with the user ID in the information evaluation link storage means for each set of elements corresponding to each user ID. Normalization is performed using a function depending on the number of IDs, and the normalized information evaluation link adjacency matrix is output. Further, the calculation means calculates an eigenvector of the score transition matrix using the normalized information providing link adjacency matrix and the normalized information evaluation link adjacency matrix, and outputs an element of the eigenvector as any score. Thereby, it is possible to prevent the information provision score and the information evaluation score of the user from being increased by providing a large number of contents or evaluating a large number of contents by the same user.

また、本発明において好ましくは、スコア推移行列Sは、S=αCC+(1−α)EE、S=CEEC、或いはS=ECCEの何れかである。尚、Cは情報提供リンク隣接行列であり、Eは情報評価リンク隣接行列であり、αは0以上1以下の実数であり、βはβの転置行列を意味している。
また、本発明をネットワークに接続されたコンテンツサーバ装置が格納するコンテンツの情報の提供に適用することもできる。この場合、まずコンテンツ情報受信手段においてコンテンツが有する情報であるコンテンツ情報を受信し、コンテンツ情報格納手段に格納する。その後、情報提供リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成し、情報提供リンク格納手段に格納する。また、情報評価リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成し、情報評価リンク格納手段に格納する。次に、固有ベクトル算出手段において、情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する情報評判スコア又は情報提供スコアとして出力する。そして、書き込み手段において、情報評判スコア又は情報提供スコアを、対応するコンテンツ情報に関連付けて、コンテンツ情報格納手段に格納させる。その後、検索条件受信手段において、利用者端末装置から送信された検索条件を受信し、検索手段において、この検索条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段から抽出して出力する。
According to another embodiment of the present invention, the score transition matrix S is either S = αC T C + (1 -α) E T E, S = CE T EC T, or S = EC T CE T. Note that C is an information provision link adjacency matrix, E is an information evaluation link adjacency matrix, α is a real number between 0 and 1, and β T means a transpose matrix of β.
Further, the present invention can also be applied to provision of content information stored in a content server device connected to a network. In this case, first, content information, which is content information, is received by the content information receiving means and stored in the content information storage means. Thereafter, the information providing link generating means uses the content information stored in the content information storing means, and the user ID of the user who provided the content and the content ID which is the identifier of the content provided by the user are: The associated information provision link information is generated and stored in the information provision link storage means. Further, in the information evaluation link generation means, using the content information stored in the content information storage means, the user ID of the user who evaluated the content, the content ID which is the identifier of the content evaluated by the user, and the content Information evaluation link information in which evaluation information which is numerical information of evaluation performed on the content by the evaluator is associated with each other is generated and stored in the information evaluation link storage means. Next, in the eigenvector calculation means, the information provision link information and the information evaluation link information are used, and the score transition matrix (the defined relationship between the information provision link information, the information evaluation link information and the information reputation score or the information provision score) Eigenvector of the matrix) is calculated, and the elements of the eigenvector are output as an information reputation score or an information provision score corresponding to each content information. Then, the writing means stores the information reputation score or the information provision score in the content information storage means in association with the corresponding content information. Thereafter, the search condition receiving unit receives the search condition transmitted from the user terminal device, and the search unit receives the content information satisfying the search condition as at least an information reputation score and an information provision score associated therewith. Together with one, it is extracted from the content information storage means and output.

このような構成の装置は、算出されたスコアに従い、検索条件に合致した各コンテンツ情報を加工(例えば並び替えなど)することができる。そして、当該装置は、この加工された情報を用いることにより、コンテンツの重要度が適切に示唆された検索結果を利用者に提供することができる。
さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと情報評判スコア又は情報提供スコアとの定義された関係を示す関係式に従い、各コンテンツ情報に対応する情報評判スコア又は情報提供スコアを算出し、当該スコアを出力する。また、より好ましくは、情報提供リンク生成手段は、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成する。そして、情報評判スコア推定手段において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとして出力する。この場合、スコアの妥当性をさほど落すことなく、スコアの算出速度を向上させることができる。
The apparatus having such a configuration can process (for example, rearrange) each piece of content information that matches the search condition according to the calculated score. The apparatus can provide the user with a search result that appropriately suggests the importance of the content by using the processed information.
Further, preferably in the present invention, the score calculation means uses the information provision link information or the information evaluation link information and the eigenvector, and according to a relational expression indicating a defined relationship between these and the information reputation score or the information provision score, An information reputation score or an information provision score corresponding to the content information is calculated, and the score is output. More preferably, the information provision link generation means generates only the information provision link information corresponding to the content for which the evaluation exists. Then, in the information reputation score estimation means, information on the calculation result of the function depending on the information provision score of the user and the number of contents provided by the user is the content provided by the user and having no evaluation. Output as a reputation score. In this case, the score calculation speed can be improved without significantly reducing the validity of the score.

また、本発明において好ましくは、コンテンツ情報が、コンテンツ提供者情報(コンテンツを提供した利用者に対応する情報)を含み、検索手段が、検索条件を充足するコンテンツ情報を、当該コンテンツ情報に関連付けられた情報評判スコアとともに、コンテンツ情報格納手段から抽出する手段である。そして、情報評判スコア集計手段において、検索手段において抽出された情報評判スコアを、コンテンツ情報が有するコンテンツ提供者情報毎に加算し、各加算値を当該コンテンツ提供者情報ともに出力する。このような加算値は、検索条件に合致するコンテンツのみに関し、コンテンツに対する評価値をコンテンツ提供者毎に合算したものである。すなわち、当該加算値とコンテンツ提供者情報とを用いることにより、検索条件に合致するコンテンツのオピニオンリーダを正確に特定することができる(詳細は後述)。   Preferably, in the present invention, the content information includes content provider information (information corresponding to the user who provided the content), and the search means associates the content information satisfying the search condition with the content information. The information reputation score is extracted from the content information storage means together with the information reputation score. Then, the information reputation score totaling unit adds the information reputation score extracted by the search unit for each content provider information included in the content information, and outputs each added value together with the content provider information. Such an added value is a sum of evaluation values for content for each content provider only for content that matches the search condition. That is, by using the added value and the content provider information, it is possible to accurately identify an opinion reader of content that matches the search condition (details will be described later).

さらに、本発明において好ましくは、コンテンツ情報は、コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報と、当該コンテンツのアドレスを示すコンテンツアドレス情報と、他のコンテンツのアドレスを示すポインタ情報とを含む情報である。そして、情報提供リンク生成手段は、コンテンツ提供者情報を利用者IDとし、コンテンツアドレス情報をコンテンツIDとして、情報提供リンク情報を生成する。また、情報評価リンク生成手段は、コンテンツ提供者情報を利用者IDとし、ポインタ情報をコンテンツIDとし、コンテンツ情報がポインタ情報を含むか否かによって定まる値を評価情報として、情報評価リンク情報を生成する。   In the present invention, preferably, the content information includes content provider information that is information corresponding to a user who provided the content, content address information indicating the address of the content, and pointer information indicating the address of other content. It is information including. Then, the information provision link generation unit generates the information provision link information by using the content provider information as the user ID and the content address information as the content ID. The information evaluation link generation means generates information evaluation link information using the content provider information as the user ID, the pointer information as the content ID, and a value determined by whether or not the content information includes pointer information as evaluation information. To do.

また、本発明において好ましくは、情報評価リンク生成手段は、トラックバック以外のポインタ情報を用いて情報評価リンク情報を生成する。これにより、誤った情報評価リンク情報が生成されることを防止できる(詳細は後述)。   In the present invention, it is preferable that the information evaluation link generation unit generates information evaluation link information using pointer information other than trackback. Thereby, it is possible to prevent erroneous information evaluation link information from being generated (details will be described later).

以上のように本発明によれば、情報提供リンク情報と情報評価リンク情報という2種類のリンク情報から、評価値として意味のある全体として整合がとれたスコアを算出することができる。   As described above, according to the present invention, it is possible to calculate a score that is consistent and meaningful as an evaluation value from two types of link information, that is, information provision link information and information evaluation link information.

以下、本発明の実施の形態を図面を参照して説明する。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
<構成>
図1は、本形態における情報評価システム1の構成を示す図である。
図1に例示するように、本形態の情報評価システム1は、情報評価装置100及びこれとネットワーク300を通じて接続され、利用者i (i=1…m)がそれぞれ使用する利用者端末装置200−1〜mを有している。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
First, a first embodiment of the present invention will be described.
<Configuration>
FIG. 1 is a diagram showing a configuration of an information evaluation system 1 in the present embodiment.
As illustrated in FIG. 1, the information evaluation system 1 of the present embodiment is connected to the information evaluation device 100 and the network 300 through a user terminal device 200-connected to the user i (i = 1... M). 1 to m.

情報評価装置100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、バス、補助記憶装置、通信装置等からなる周知のコンピュータ装置において、そのCPUに所定のプログラムを実行させることにより構成されるものである。図1に例示するように、この例の情報評価装置100は、情報取得手段101と、情報提供リンク格納手段102と、情報評価リンク格納手段103と、スコア計算手段104と、情報評判スコア格納手段105と、情報提供スコア格納手段106と、情報評価スコア格納手段107と、スコア出力手段108と、一時メモリ111と、制御手段110とを有している。尚、図1において各手段をつなぐ線は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は省略してある。   The information evaluation apparatus 100 is a known computer device including a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), a bus, an auxiliary storage device, a communication device, and the like. It is comprised by performing. As illustrated in FIG. 1, the information evaluation apparatus 100 of this example includes an information acquisition unit 101, an information provision link storage unit 102, an information evaluation link storage unit 103, a score calculation unit 104, and an information reputation score storage unit. 105, an information provision score storage unit 106, an information evaluation score storage unit 107, a score output unit 108, a temporary memory 111, and a control unit 110. In FIG. 1, lines connecting the respective units indicate the flow of information, but the description of the flow of information input to and output from the control unit 110 and the temporary memory 111 is omitted.

図2は、図1における情報取得手段101の詳細構成を例示した図である。
図2に例示するように、この例の情報取得手段101は、通信手段101aと、メッセージ認証手段101bと、情報検証手段101cと、コンテンツID生成手段101dと、情報提供リンク生成手段101eと、情報評価リンク生成手段101fと、書き込み手段101gとを有している。尚、図2における矢印は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は一部省略してある。
図3は、図1におけるスコア計算手段104の詳細構成を例示した図である。
FIG. 2 is a diagram illustrating a detailed configuration of the information acquisition unit 101 in FIG.
As illustrated in FIG. 2, the information acquisition unit 101 in this example includes a communication unit 101a, a message authentication unit 101b, an information verification unit 101c, a content ID generation unit 101d, an information provision link generation unit 101e, Evaluation link generation means 101f and writing means 101g are provided. The arrows in FIG. 2 indicate the flow of information, but some descriptions of the flow of information input to and output from the control unit 110 and the temporary memory 111 are omitted.
FIG. 3 is a diagram illustrating a detailed configuration of the score calculation unit 104 in FIG.

図3に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104aと、第2隣接行列生成手段104bと、固有ベクトル算出手段104cと、スコア算出手段104dと、書き込み手段104eとを有している。また、固有ベクトル算出手段104cは、第1正規化手段104caと、第2正規化手段104cbと、演算手段104ccとを有している。尚、図3における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は省略してある。
図4は、図1におけるスコア出力手段108の詳細構成を例示した図である。
As illustrated in FIG. 3, the score calculation unit 104 in this example includes a first adjacency matrix generation unit 104a, a second adjacency matrix generation unit 104b, an eigenvector calculation unit 104c, a score calculation unit 104d, and a writing unit 104e. And have. The eigenvector calculation means 104c includes a first normalization means 104ca, a second normalization means 104cb, and a calculation means 104cc. Note that the arrows in FIG. 3 indicate the flow of information, but the description of the flow of information input to and output from the control unit 110 is omitted.
FIG. 4 is a diagram illustrating a detailed configuration of the score output unit 108 in FIG.

図4に例示するように、この例のスコア出力手段108は、受信手段108aと、メッセージ判定手段108bと、スコア検索手段108cと、メッセージ生成手段108dと、送信手段108eとを有している。尚、図4における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は一部省略してある。
尚、上述した各手段は、同一の筺体内に存在するものに限定されず、複数の筺体に分散配置されてもよい。また、上述した通信手段101a、受信手段108a及び送信手段108eは、例えば、LAN(Local Area Network)カード、モデム、ルータ、ハブ等の通信装置によって構成されるものである。また、情報提供リンク格納手段102、情報評価リンク格納手段103、情報評判スコア格納手段105、情報提供スコア格納手段106、情報評価スコア格納手段107及び一時メモリ111は、例えば、ハードディスク装置、フレキシブルディスク、MO(Magneto-Optical disc)等の補助記憶装置や、RAM、CPU内のレジスタやキャッシュメモリ等によって構成されるものである。また、制御手段110、メッセージ認証手段101b、情報検証手段101c、コンテンツID生成手段101d、情報提供リンク生成手段101e、情報評価リンク生成手段101f、書き込み手段101g、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d、書き込み手段104e、メッセージ判定手段108b、スコア検索手段108c及びメッセージ生成手段108dは、例えば、CPUに所定のプログラムが読み込まれ、CPUがこれらのプログラムを実行することにより構成されるものである。
As illustrated in FIG. 4, the score output unit 108 in this example includes a reception unit 108a, a message determination unit 108b, a score search unit 108c, a message generation unit 108d, and a transmission unit 108e. The arrows in FIG. 4 indicate the flow of information, but a part of the description of the flow of information input / output to / from the control unit 110 is omitted.
In addition, each means mentioned above is not limited to what exists in the same housing | casing, You may distributely arrange in several housings. The communication unit 101a, the reception unit 108a, and the transmission unit 108e described above are configured by communication devices such as a LAN (Local Area Network) card, a modem, a router, and a hub. The information provision link storage unit 102, the information evaluation link storage unit 103, the information reputation score storage unit 105, the information provision score storage unit 106, the information evaluation score storage unit 107, and the temporary memory 111 are, for example, a hard disk device, a flexible disk, An auxiliary storage device such as an MO (Magneto-Optical disc), a RAM, a register in the CPU, a cache memory, and the like are included. The control unit 110, the message authentication unit 101b, the information verification unit 101c, the content ID generation unit 101d, the information provision link generation unit 101e, the information evaluation link generation unit 101f, the writing unit 101g, the first adjacency matrix generation unit 104a, the second For example, the adjacency matrix generation unit 104b, the eigenvector calculation unit 104c, the score calculation unit 104d, the writing unit 104e, the message determination unit 108b, the score search unit 108c, and the message generation unit 108d read a predetermined program into the CPU, for example. This is configured by executing the program.

また、利用者端末装置200−1〜m(図1)も所定のプログラムに基づいて動作する周知のコンピュータ装置からなる。
<動作>
次に、本形態の情報評価装置100の動作について説明する。
[概要]
本形態の情報評価装置100は、利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアを算出する装置である。まず、この情報評価装置100の処理の概要を説明する。尚、情報評価装置100の各処理は、制御手段110の制御のもと実行される。
Further, the user terminal devices 200-1 to 200-m (FIG. 1) are also known computer devices that operate based on a predetermined program.
<Operation>
Next, the operation of the information evaluation apparatus 100 of this embodiment will be described.
[Overview]
The information evaluation apparatus 100 according to this embodiment includes an information reputation score obtained by quantifying the reputation of content, which is electronic information provided by a user, an information provision score obtained by quantifying information provision ability of a user who provided the content, and content Is an apparatus for calculating an information evaluation score obtained by quantifying the information evaluation ability of the user who has evaluated the information. First, an outline of processing of the information evaluation apparatus 100 will be described. Each process of the information evaluation apparatus 100 is executed under the control of the control unit 110.

まず、複数の利用者端末装置200−1〜mは、ネットワーク300を通じ、<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージを情報評価装置100に送信する。
情報評価装置100は、情報取得手段101においてこれらを受信する。ここで、受信されたメッセージがコンテンツ提供メッセージであった場合、情報取得手段101は、コンテンツを提供した利用者の利用者IDと、当該利用者によって提供されたコンテンツの識別子であるコンテンツIDとが関連付けられた情報提供リンク情報を情報提供リンク格納手段102に格納する。一方、受信されたメッセージがコンテンツ評価メッセージであった場合、情報取得手段101は、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を情報評価リンク格納手段103に格納する。
First, a plurality of user terminal devices 200-1 to 200-m receive a content providing message including two sets of <user ID, content> or <user ID, content ID, evaluation information> via the network 300. A content evaluation message including the triplet is transmitted to the information evaluation apparatus 100.
The information evaluation apparatus 100 receives these at the information acquisition unit 101. Here, when the received message is a content providing message, the information acquisition unit 101 obtains the user ID of the user who provided the content and the content ID that is the identifier of the content provided by the user. The associated information provision link information is stored in the information provision link storage means 102. On the other hand, when the received message is a content evaluation message, the information acquisition unit 101 includes the user ID of the user who evaluated the content, the content ID that is the identifier of the content evaluated by the user, Information evaluation link information associated with evaluation information, which is numerical information of evaluation performed by the evaluator on the content, is stored in the information evaluation link storage means 103.

その後、スコア計算手段104において、情報提供リンク格納手段102と情報評価リンク格納手段103とに格納された情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコアとの間の定義された関係を示す行列。詳細は後述。)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。また、スコア計算手段104は、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出して出力する。そして、スコア計算手段104は、算出された各スコアを情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107に格納させる。   After that, the score calculation means 104 uses the information provision link information and the information evaluation link information stored in the information provision link storage means 102 and the information evaluation link storage means 103 to obtain a score transition matrix (information provision link information and information evaluation). The eigenvector of the matrix indicating the defined relationship between the link information and any score (details will be described later) is calculated, and the elements of this eigenvector are output as any score. The score calculation means 104 uses the information provision link information or the information evaluation link information and the eigenvector, and calculates and outputs any score according to a relational expression indicating a defined relationship between these and any score. To do. Then, the score calculation unit 104 stores the calculated scores in the information reputation score storage unit 105, the information provision score storage unit 106, or the information evaluation score storage unit 107.

その後、スコア出力手段108は、利用者端末装置200−1〜mからの要求に対し、情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107を検索し、要求されたスコアに関する情報を利用者端末装置200−1〜mに送信する。
[情報取得手段101の処理の詳細]
次に、情報取得手段101の処理の詳細について説明する。
図5は、情報取得手段101の処理の詳細を説明するためのフローを示す図である。以下、この図に沿って情報取得手段101の処理の詳細を説明する。
After that, the score output means 108 searches the information reputation score storage means 105, the information provision score storage means 106, or the information evaluation score storage means 107 in response to the request from the user terminal devices 200-1 to 200-m. Information about the score is transmitted to the user terminal devices 200-1 to 200-m.
[Details of Processing of Information Acquisition Unit 101]
Next, details of the processing of the information acquisition unit 101 will be described.
FIG. 5 is a diagram illustrating a flow for explaining details of processing of the information acquisition unit 101. The details of the processing of the information acquisition unit 101 will be described below with reference to FIG.

まず、情報取得手段101の通信手段101a(図2)は、複数の利用者端末装置200−1〜mから送信された<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージをネットワーク300経由で受信する(ステップS1)。
図6(a)は、このように受信されるコンテンツ提供メッセージ121のデータ構成の例示であり、図6(b)はコンテンツ評価メッセージ122の例である。この例のコンテンツ提供メッセージ121は、その属性やビット構成等を示すヘッダ情報121aと、コンテンツ121cを提供した利用者の利用者ID121bと、提供されたコンテンツ121cとを有する。ここで、コンテンツ121cは利用者により投入される電子情報である。コンテンツ121cの一例としては、「〇〇レストランの〇〇セットはおいしい」等の文字情報や、利用者が作成した音楽情報、画像情報、動画像などである。利用者ID121bは、そのコンテンツ121cを提供した利用者のIDであり、会員制のコミュニティの場合には、コンテンツ121cを書込む際にシステムにログインするときに利用するID等を用いる。また、コンテンツID121cは、コンテンツに対してユニークに付与される識別子である。
First, the communication means 101a (FIG. 2) of the information acquisition means 101 is a content providing message including two sets of <user ID, content> transmitted from a plurality of user terminal devices 200-1 to 200-m, or A content evaluation message including a triplet of <user ID, content ID, and evaluation information> is received via the network 300 (step S1).
FIG. 6A shows an example of the data structure of the content providing message 121 received in this way, and FIG. The content providing message 121 in this example includes header information 121a indicating its attributes, bit configuration, and the like, a user ID 121b of the user who provided the content 121c, and the provided content 121c. Here, the content 121c is electronic information input by the user. Examples of the content 121c include text information such as “00 restaurants are delicious”, music information created by the user, image information, moving images, and the like. The user ID 121b is the ID of the user who provided the content 121c. In the case of a membership-based community, the ID used when logging in to the system when writing the content 121c is used. The content ID 121c is an identifier uniquely assigned to the content.

また、この例のコンテンツ評価メッセージ122は、その属性やビット構成等を示すヘッダ情報122aと、コンテンツを評価した利用者の利用者ID122bと、利用者によって評価されたコンテンツの識別子であるコンテンツID122cと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報122dとを有する。ここで、利用者ID122cは、コンテンツを評価した利用者のIDであり、会員制のコミュニティの場合には、コンテンツの評価を書込む際にシステムにログインするときに利用するID等を用いる。また、評価情報122dはコンテンツ122dに対する評価を表す情報であり、本形態では、利用者が利用者端末装置200−1〜mを用いて明示的に入力した情報とする。評価情報の一例としては、「+1」、「+2」、「+3」などの予め決められた範囲の値をとる数値情報などがある。   Further, the content evaluation message 122 of this example includes header information 122a indicating its attributes, bit configuration, etc., a user ID 122b of the user who evaluated the content, and a content ID 122c which is an identifier of the content evaluated by the user. And evaluation information 122d which is numerical information of evaluation performed on the content by the content evaluator. Here, the user ID 122c is the ID of the user who has evaluated the content. In the case of a membership-based community, the user ID 122c is an ID used when logging into the system when writing the content evaluation. In addition, the evaluation information 122d is information representing evaluation for the content 122d. In this embodiment, the evaluation information 122d is information that is explicitly input by the user using the user terminal devices 200-1 to 200-m. As an example of the evaluation information, there is numerical information that takes a value in a predetermined range such as “+1”, “+2”, “+3”, and the like.

通信手段101aは、受信したコンテンツ提供メッセージやコンテンツ評価メッセージを一時メモリ111に格納し、次に、メッセージ認証手段101bが、利用者端末装置200−1〜mの認証処理を行う(ステップS2)。この認証処理は、一人の利用者が同一コンテンツの評価を複数回行うことを禁止したい場合や、別の利用者と偽ってコンテンツを提供することを禁止したい場合に行うものである。この認証処理は、通信手段101a及びネットワーク300を介し、メッセージ認証手段101bと利用者端末装置200−1〜mとの間で、既存のパスワード等を用いた認証プロトコルに従い実行される。尚、このステップS2の処理は応用分野によっては省略できる。   The communication unit 101a stores the received content provision message and content evaluation message in the temporary memory 111, and then the message authentication unit 101b performs authentication processing of the user terminal devices 200-1 to 200-m (step S2). This authentication process is performed when it is desired to prohibit one user from evaluating the same content a plurality of times, or when it is desired to prohibit providing a content falsely with another user. This authentication process is executed between the message authentication unit 101b and the user terminal devices 200-1 to 200-m via the communication unit 101a and the network 300 according to an authentication protocol using an existing password or the like. Note that the process of step S2 can be omitted depending on the application field.

ステップS2の認証処理の結果は制御手段110に伝えられる。そして、制御手段110は、認証処理がNGの場合はその利用者端末装置200−1〜mとのセッションを終了させる。一方、認証処理がOKであった場合、制御手段110は、情報検証手段101cに、受信されたメッセージが、コンテンツ提供メッセージかコンテンツ評価メッセージかを判定させる(ステップS3)。具体的には、この例の情報検証手段101cは、ステップS1で通信手段101aが受信したメッセージを一時メモリ111から読み込み、そのヘッダ情報121a又は122aを参照することにより、そのメッセージがコンテンツ提供メッセージ121かコンテンツ評価メッセージ122(図6)かを判断する。情報検証手段101cによる判断結果は制御手段110に送られる。   The result of the authentication process in step S2 is transmitted to the control means 110. When the authentication process is NG, the control unit 110 ends the session with the user terminal device 200-1 to 200-m. On the other hand, if the authentication process is OK, the control unit 110 causes the information verification unit 101c to determine whether the received message is a content providing message or a content evaluation message (step S3). Specifically, the information verification unit 101c in this example reads the message received by the communication unit 101a in step S1 from the temporary memory 111, and refers to the header information 121a or 122a so that the message is the content provision message 121. Or content evaluation message 122 (FIG. 6). The determination result by the information verification unit 101 c is sent to the control unit 110.

ここで、制御手段110が受け取った判断結果が「メッセージがコンテンツ提供メッセージである」旨の判断結果であった場合、制御手段110はコンテンツID生成手段101dにコンテンツIDを生成する旨の指示を与える。この指示を受けたコンテンツID生成手段101dは、一時メモリ111からステップS1で通信手段101aが受信したコンテンツ提供メッセージを読み込む。そして、コンテンツID生成手段101dは、読み込みたコンテンツ提供メッセージが具備するコンテンツに対するユニークなコンテンツIDを生成し、一時メモリ111に格納する(ステップS4)。コンテンツIDの生成方法としては、例えばコンテンツ全体の一方向性ハッシュ値を利用する方法や、逐次連番を割り振るなどの方法がある。コンテンツIDが生成されると次に、情報提供リンク生成手段101eは、一時メモリ111からステップS1で受信されたコンテンツ提供メッセージと、ステップS4で生成されたコンテンツIDとを読み込む。そして情報提供リンク生成手段101eは、これらを用いて<利用者ID、コンテンツID、コンテンツ>の3つ組み(情報提供リンク情報)を生成し、一時メモリ111に格納する(ステップS5)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報提供リンク格納手段102に格納させる(ステップS6)。   Here, when the determination result received by the control unit 110 is a determination result indicating that “the message is a content providing message”, the control unit 110 gives an instruction to the content ID generation unit 101d to generate a content ID. . Upon receiving this instruction, the content ID generation unit 101d reads the content provision message received by the communication unit 101a in step S1 from the temporary memory 111. Then, the content ID generating unit 101d generates a unique content ID for the content included in the read content providing message and stores it in the temporary memory 111 (step S4). As a method for generating the content ID, for example, there are a method of using a one-way hash value of the entire content and a method of sequentially assigning serial numbers. When the content ID is generated, the information providing link generating unit 101e reads the content providing message received from the temporary memory 111 at step S1 and the content ID generated at step S4. And the information provision link production | generation means 101e produces | generates the triple (information provision link information) of <user ID, content ID, content> using these, and stores it in the temporary memory 111 (step S5). Thereafter, the information providing link information is read from the temporary memory 111 by the writing means 101g and stored in the information providing link storage means 102 (step S6).

一方、制御手段110が受け取ったステップS3の判断結果が「メッセージがコンテンツ評価メッセージである」旨の判断結果であった場合、制御手段110は情報評価リンク生成手段101fに対し、情報評価リンク情報を生成する旨の指示を与える。この指示を受けた情報評価リンク生成手段101fは、ステップS1で受信されたコンテンツ評価メッセージを一時メモリ111から読み込み、これに含まれる<利用者ID、コンテンツID、評価情報>の3つ組みを情報評価リンク情報として生成し、一時メモリ111に格納する(ステップS7)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報評価リンク格納手段103に格納させる(ステップS8)。   On the other hand, when the determination result of step S3 received by the control unit 110 is a determination result that “the message is a content evaluation message”, the control unit 110 sends information evaluation link information to the information evaluation link generation unit 101f. Give instructions to generate. Upon receiving this instruction, the information evaluation link generation unit 101f reads the content evaluation message received in step S1 from the temporary memory 111, and includes information on the triplet of <user ID, content ID, evaluation information> contained therein. It produces | generates as evaluation link information and stores it in the temporary memory 111 (step S7). Thereafter, the information providing link information is read from the temporary memory 111 by the writing means 101g and stored in the information evaluation link storage means 103 (step S8).

図7(a)は、上述のように情報提供リンク格納手段102に格納される情報提供リンク情報131a〜131eのデータ構成を例示する図である。図7(a)に示すように、情報提供リンク格納手段102は、利用者ID、コンテンツID、コンテンツをそれぞれ関連付けした情報提供リンク情報131a〜131eを格納・管理している。
図7(b)は、情報評価リンク格納手段103に格納・管理される情報評価リンク情報132a〜132fのデータ構成を示す図である。図7(b)に示すように、評価リンク格納手段103は、利用者ID、コンテンツID、評価情報をそれぞれ関連付けした情報評価リンク情報132a〜132fを格納・管理している。尚、コンテンツIDと情報コンテンツとの対応関係は、上記の図7(a)で示した情報提供リンク格納手段102に格納・管理されている。
FIG. 7A is a diagram illustrating a data configuration of the information provision link information 131a to 131e stored in the information provision link storage unit 102 as described above. As shown in FIG. 7A, the information provision link storage unit 102 stores and manages information provision link information 131a to 131e in which a user ID, a content ID, and a content are associated with each other.
FIG. 7B is a diagram illustrating a data configuration of the information evaluation link information 132 a to 132 f stored and managed in the information evaluation link storage unit 103. As shown in FIG. 7B, the evaluation link storage means 103 stores and manages information evaluation link information 132a to 132f in which a user ID, a content ID, and evaluation information are associated with each other. The correspondence relationship between the content ID and the information content is stored and managed in the information provision link storage unit 102 shown in FIG.

尚、本形態では、情報取得手段101が直接、利用者端末装置200−1〜mからコンテンツや評価情報を受取り、情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fをそれぞれ情報提供リンク格納手段102及び情報評価リンク格納手段103に格納することとした。しかし、情報取得手段101が、既存の電子掲示板システムやWebサーバ装置から情報提供リンク情報131a〜131eと情報評価リンク情報132a〜132fとを抽出する構成としてもよい。例えば、問題解決型コミュニティにおいて、「質問」や「回答」というアクションを「コンテンツの提供」として本発明を適用してもよい。すなわち、電子掲示板上へ書込まれる「質問」や「回答」を「コンテンツ」とし、その書き込みを行った利用者を「コンテンツを提供した利用者」として本発明を適用してもよい。また、「質問」の参照や回答を行った利用者を「コンテンツを評価した利用者」とし、「質問」への参照回数や質問への回答の数等を、「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。また、質問者が「回答」の中から最も有用だった回答を選択する行為等を「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。同様に、商品・サービス評価型コミュニティにおいても、レビュー記事の投稿を「コンテンツ」の「提供」とし、これに対する他の参加者の支持を「コンテンツに対する評価」として本発明を適用してもよい。その他具体例は挙げないが、トピックベースコミュニティやユーザ創造型コミュニティにおいても同様である。尚、これを実現するには、このような既存のコミュニティを構成するWebサーバ装置から情報を収集するロボットを作成する必要があるが、Weサーバ装置から情報を収集する一般的なロボットの作成方法は、文献:Kevin Hemenway, Tara Calishain, “Spidering hacks”、O’Reilly (2003)、に記載されている方法等が利用できる。また、このような実施の形態を取った場合、図7(a)に示す情報提供リンク情報131a〜131eのコンテンツIDとして、そのコンテンツが存在するリソースのURL(Uniform Resource Identifier)を用いてもよい。そして、この場合、情報提供リンク情報131a〜131eにコンテンツの列は不要となる。   In this embodiment, the information acquisition unit 101 directly receives content and evaluation information from the user terminal devices 200-1 to 200-m, and provides information provision link information 131a to 131e and information evaluation link information 132a to 132f as information provision links, respectively. The data is stored in the storage unit 102 and the information evaluation link storage unit 103. However, the information acquisition unit 101 may extract the information providing link information 131a to 131e and the information evaluation link information 132a to 132f from an existing electronic bulletin board system or Web server device. For example, in a problem-solving community, the present invention may be applied with the action “question” or “answer” as “providing content”. That is, the “question” or “answer” written on the electronic bulletin board may be “content”, and the user who performed the writing may be “user who provided the content”. In addition, the user who referred to or answered the “question” is defined as the “user who evaluated the content”, and the number of times the reference to the “question” or the number of answers to the question is evaluated. That is, the present invention may be applied as “evaluation for content”. Further, the present invention may be applied to an act of selecting a most useful answer from among “answers” by the questioner as an evaluation of the goodness of the “question”, that is, “evaluation of content”. Similarly, even in a product / service evaluation type community, the present invention may be applied with the posting of a review article as “provision” of “content” and the support of other participants for this as “evaluation of content”. Other specific examples will not be given, but the same applies to topic-based communities and user-creative communities. In order to realize this, it is necessary to create a robot that collects information from the Web server device that constitutes such an existing community, but a general robot creation method that collects information from the We server device The method described in the literature: Kevin Hemenway, Tara Calishain, “Spidering hacks”, O'Reilly (2003), etc. can be used. When such an embodiment is taken, the URL (Uniform Resource Identifier) of the resource in which the content exists may be used as the content ID of the information providing link information 131a to 131e shown in FIG. . In this case, no content column is required for the information providing link information 131a to 131e.

[スコア計算手段104の処理の詳細]
次に、スコア計算手段104(図1,図3)の処理の詳細について説明する。
まず、スコア計算手段104が各スコアを算出するための原理について説明する。
上記のように情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fは、論理的には、例えば、図8に示すような利用者からコンテンツに対する2種類のリンクを示すものと考えることができる。図8において、紙面に向かって左側の丸は利用者、右側の四角はコンテンツを示す。また、この図の破線は、情報提供リンク情報131a〜131eにおける利用者IDに対応する利用者とコンテンツとの関連付け(情報提供リンク)を表している。また、この図の実線は、情報評価リンク情報132a〜132fにおける利用者IDに対応する利用者と、コンテンツIDに対応するコンテンツとの関連付け(情報評価リンク)を表している。また、情報評価リンクに付与されている数値は、情報評価リンク情報132a〜132fにおける評価情報を表すものとする。
[Details of processing of score calculation means 104]
Next, details of the processing of the score calculation means 104 (FIGS. 1 and 3) will be described.
First, the principle for the score calculation means 104 to calculate each score will be described.
As described above, the information provision link information 131a to 131e and the information evaluation link information 132a to 132f stored in the information provision link storage means 102 and the information evaluation link storage means 103 are logically as shown in FIG. It can be thought of as showing two types of links from content users to content. In FIG. 8, the circle on the left indicates the user and the square on the right indicates the content. Moreover, the broken line of this figure represents the association (information provision link) of the user and content corresponding to the user ID in the information provision link information 131a to 131e. Further, the solid line in this figure represents the association (information evaluation link) between the user corresponding to the user ID in the information evaluation link information 132a to 132f and the content corresponding to the content ID. Moreover, the numerical value given to the information evaluation link represents the evaluation information in the information evaluation link information 132a to 132f.

これらのリンクは、

Figure 0004344339
のような利用者i (i=1…m)を行とし、コンテンツj (j=1…n)を列とする隣接行列で表現することができる。すなわち、情報提供リンクは行列C=[cij] (i=1…m, j=1…n)で表現できる。ただし、cijは行列Cのi行j列目の要素を示し、iからjにリンクがあればcij=1、なければcij =0となる。また情報評価リンクは行列E=[eij] (i=1…m, j=1…n)で表現できる。ただし、eijは行列Eのi行j列目の要素を示す。またeij は、報評価リンク情報132a〜132fにおいて、利用者iに対応する利用者IDと、コンテンツjに対応するコンテンツIDとに対応付けられている評価情報の値である。そして、eijの値が大きい程、コンテンツjが利用者iから強い支持を受けていることになる。尚、以下では特に断りがない限り、行列C及び行列Eは、一般化された行列C=[cij] (i=1…m, j=1…n)及びE=[eij] (i=1…m, j=1…n)を意味する。 These links
Figure 0004344339
User i (i = 1... M) as a row and content j (j = 1... N) as a column. That is, the information providing link can be expressed by a matrix C = [c ij ] (i = 1... M, j = 1... N). Here, c ij indicates the element in the i-th row and j-th column of the matrix C, and c ij = 1 if there is a link from i to j, and c ij = 0 if there is no link. The information evaluation link can be expressed by a matrix E = [e ij ] (i = 1... M, j = 1... N). Here, e ij indicates the element in the i-th row and j-th column of the matrix E. E ij is a value of evaluation information associated with the user ID corresponding to the user i and the content ID corresponding to the content j in the report evaluation link information 132a to 132f. The larger the value of e ij, the stronger the content j receives from the user i. In the following, unless otherwise specified, the matrix C and the matrix E are generalized matrices C = [c ij ] (i = 1... M, j = 1... N) and E = [e ij ] (i = 1 ... m, j = 1 ... n).

本形態では、2種類のリンクをそれぞれ示す行列C及び行列Eから、情報提供スコアai、情報評価スコアhi及び情報評判スコアrjの3つのスコアを算出する。以下にこれらのスコアの意味と表記方法を述べる。
情報提供スコアai は、利用者i (i=1…m)が、過去、どの程度コミュニティから支持を受けたコンテンツを提供してきたかを示す指標である。このスコアが高ければ高いほど、この利用者は情報の提供の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報提供スコアaiを、a=[a1…am]Tと表記し、これを以後、情報提供ベクトルと呼ぶ。ここでMTは行列Mの転置行列である。
In this embodiment, two types of links from matrix C and matrix E respectively, to calculate the three scores information providing scores a i, information evaluation score h i and information reputation score r j. The meaning and notation of these scores are described below.
The information provision score a i is an index indicating how much the user i (i = 1... M) has provided content supported by the community in the past. The higher this score, the more likely this user is to be able to contribute to the community in terms of providing information. Here, the information provision score a i of all users is expressed as a = [a 1 ... A m ] T, and this is hereinafter referred to as an information provision vector. Here, M T is a transposed matrix of the matrix M.

情報評価スコアhiは、利用者i (i=1…m)が、過去、コミュニティに提供されるコンテンツに対してどの程度コミュニティの方向性に沿った評価情報を投入してきたを示す指標である。このスコアが高ければ高いほど、この利用者は情報評価の投入の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報評価スコアhiを、h=[h1…hm]Tと表記し、これを以後、情報評価ベクトルと呼ぶ。
情報評判スコアrjは、コンテンツ j (j=1…n)が、どの程度利用者からの支持を受けているか(i.e. コミュニティの方向性に沿っているか)を示す指標である。このスコアが高ければ高いほど、その情報はコミュニティから支持を受けているものであるとみなす。ここで全コンテンツの情報評判スコアrjを、r=[r1…rn]Tと表記し、これを以後、情報評判ベクトルと呼ぶ。
The information evaluation score h i is an index showing how much user i (i = 1 ... m) has input evaluation information according to the direction of the community in the past for the content provided to the community. . The higher this score, the more likely this user is to contribute to the community in terms of information input. Here, the information evaluation score h i of all users is expressed as h = [h 1 ... H m ] T, and this is hereinafter referred to as an information evaluation vector.
The information reputation score r j is an index indicating how much the content j (j = 1... N) is supported by the user (ie, in line with the direction of the community). The higher this score, the more the information is considered to be supported by the community. Here, the information reputation score r j of all contents is expressed as r = [r 1 ... R n ] T, and this is hereinafter referred to as an information reputation vector.

利用者の情報提供スコアと、情報評価スコアと、コンテンツの情報評判スコアとは、以下のルールにより相互に影響を及ぼしあう。
(1)情報提供スコアの高い利用者が提供するコンテンツは高い情報評判スコアを持つコンテンツである。
(2)情報評価スコアの高い利用者が評価したコンテンツは高い情報評判スコアを持つコンテンツである。
(3)情報評判スコアが高いコンテンツを提供した利用者は高い情報提供スコアを持つ利用者である。
The user's information provision score, the information evaluation score, and the content information reputation score affect each other according to the following rules.
(1) Content provided by a user with a high information provision score is content having a high information reputation score.
(2) Content evaluated by a user having a high information evaluation score is content having a high information reputation score.
(3) A user who provides content with a high information reputation score is a user with a high information provision score.

(4)情報評判スコアが高いコンテンツを評価した利用者は高い情報評価スコアを持つ利用者である。
本形態では、これら4つのルールに対応して、
r=CTa …(1)
r=ETh …(2)
a=Cr …(3)
h=Er …(4)
の4つの数学的な関係を定義する。ただし、式(1)と式(2)を両立させるため、式(1)と式(2)を凸結合(convex combination)により統合して、
r=αCTa+(1‐α)ETh …(5)
を利用する。ここで、αは[0,1]を定義域とする実数であり、コミュニティの特性に応じて調整されるものとする。つまり、αが1に近い程、情報提供リンクを重視し、0に近い程、情報評価リンクを重視して情報評判スコアが算出されることとなる。
(4) A user who evaluates content having a high information reputation score is a user having a high information evaluation score.
In this form, corresponding to these four rules,
r = C T a… (1)
r = E T h… (2)
a = Cr… (3)
h = Er (4)
The four mathematical relationships are defined. However, in order to make both the formula (1) and the formula (2) compatible, the formula (1) and the formula (2) are integrated by a convex combination,
r = αC T a + (1-α) E T h (5)
Is used. Here, α is a real number whose domain is [0, 1], and is adjusted according to the characteristics of the community. That is, the closer the α is to 1, the more importance is placed on the information providing link, and the closer it is to 0, the more important is the information reputation link that the information reputation score is calculated.

上記、式(5)に、式(3)と式(4)を代入すると、
r=αCTCr +(1‐α)ET Er
= (αCT C +(1‐α)ET E) r …(6)
を得る。(αCTC +(1‐α)ET E)は、n×nの正方行列であり、これをスコア推移行列S(「情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義された関係を示すスコア推移行列」に相当)と呼ぶことにすると、
r=Sr …(7)
となる。上記式(7)を満たすrは一般的には存在しないが、線形代数学の基礎理論によると、Sの要素が非負の実数の場合には、
λr=Sr …(8)
を満たす実数ベクトルrは存在する。ただし、λは定数であってSの固有値と呼ばれ、rはSの固有ベクトルと呼ばれる。これらの固有値と固有ベクトルを算出する具体的な方法の一例は後で述べるが、こうしてr(情報評判ベクトル)が算出できれば、式(3)及び式(4)により(「各スコア間の定義された関係」に相当)、a(情報提供ベクトル), h(情報評価ベクトル)がそれぞれ算出できる。
Substituting Equation (3) and Equation (4) into Equation (5) above,
r = αC T Cr + (1-α) E T Er
= (ΑC T C + (1-α) E T E) r… (6)
Get. (αC T C + (1-α) E T E) is an n × n square matrix, which is defined as a score transition matrix S (“definition of information providing link information, information evaluation link information, and any score) Equivalent to the score transition matrix indicating
r = Sr (7)
It becomes. Generally, r that satisfies the above equation (7) does not exist, but according to the basic theory of linear algebra, when the element of S is a non-negative real number,
λr = Sr (8)
There exists a real vector r that satisfies. However, λ is a constant and is called an eigenvalue of S, and r is called an eigenvector of S. An example of a specific method for calculating these eigenvalues and eigenvectors will be described later. If r (information reputation vector) can be calculated in this way, the expression (3) and the expression (4) (" A) (information provision vector) and h (information evaluation vector) can be calculated respectively.

尚、行列Eの要素eijは正規化していないため、ある特定の人が多くの情報に評価を入力すると、非常に高い情報評価スコアとなるという問題がある。このような行為を防止するためには、PageRankと同様に、利用者一人が提供する評価情報の値の総和が1になるように、行列Eを正規化することとしてもよい。つまり、行列Eの行ベクトルの要素の総和が1となるように行列Eを正規化し、正規化した行列を用いてスコアの算出を行うこととしてもよい。具体的には、次のような行列E'を生成、用いればよい。
E’=[e’ij](i=1…m, j=1...n)
e’ij= eijj=1..n (eij)
同様に、行列Cの行ベクトルの要素の総和が1となるような正規化を行い、この正規化後の行列Cを用いて各スコアを算出することとしてもよい。尚、行列CやEの行ベクトルの要素の総和が1以外の値となるように正規化してもよい。また、これらの正規化は必須ではなく、用途によってはこのような正規化を行わずにスコアを算出することとしてもよい。
In addition, since the element e ij of the matrix E is not normalized, there is a problem that if a specific person inputs evaluations for a lot of information, a very high information evaluation score is obtained. In order to prevent such an action, the matrix E may be normalized so that the sum of the values of evaluation information provided by one user becomes 1, like PageRank. In other words, the matrix E may be normalized so that the sum of the elements of the row vectors of the matrix E becomes 1, and the score may be calculated using the normalized matrix. Specifically, the following matrix E ′ may be generated and used.
E '= [e' ij ] (i = 1… m, j = 1 ... n)
e ' ij = e ij / Σ j = 1..n (e ij )
Similarly, normalization may be performed so that the sum of the elements of the row vectors of the matrix C becomes 1, and each score may be calculated using the matrix C after normalization. In addition, you may normalize so that the sum total of the element of the row vector of the matrix C or E may become a value other than one. Also, these normalizations are not essential, and the score may be calculated without performing such normalization depending on the application.

スコア計算手段104は、上記のような考え方に基づき、行列CとEとからr(情報評判ベクトル)、a(情報提供ベクトル), h(情報評価ベクトル)を算出し、安定した値の情報提供スコアai、情報評価スコアhi及び情報評判スコアrjを算出する。
図9は、スコア計算手段104の処理を説明するためのフローを例示した図である。以下、この図に沿ってスコア計算手段104の処理を説明する。尚、以下では、行列CやEの行ベクトルの要素の総和が1になるように行列C,Eを正規化してスコアを求めることとする。
Based on the above concept, the score calculation means 104 calculates r (information reputation vector), a (information provision vector), and h (information evaluation vector) from the matrices C and E, and provides stable information. Score a i , information evaluation score h i and information reputation score r j are calculated.
FIG. 9 is a diagram illustrating a flow for explaining the processing of the score calculation unit 104. Hereinafter, the processing of the score calculation means 104 will be described with reference to this figure. Hereinafter, the scores are obtained by normalizing the matrices C and E so that the sum of the elements of the row vectors of the matrices C and E becomes 1.

まず、スコア計算手段104の第1隣接行列生成手段104aが行列Cを生成し、第2隣接行列生成手段104bが行列Eを生成する(ステップS11)。
この例の場合、まず、第1隣接行列生成手段104aが、情報提供リンク格納手段102に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数える。そして、第1隣接行列生成手段104aは、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)である行列Cを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(a)の例の場合、(利用者ID,コンテンツID)が(A0001,C0001),(A0001,C0002),(A0002,C0003),(A0002,C0004),(A0003,C0005)である情報提供リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,1),(1,2),(2,3),(2,4),(3,5)とすると、第1隣接行列生成手段104aは、

Figure 0004344339
を生成することになる。 First, the first adjacency matrix generation unit 104a of the score calculation unit 104 generates a matrix C, and the second adjacency matrix generation unit 104b generates a matrix E (step S11).
In the case of this example, first, the first adjacency matrix generation unit 104a searches the information provision link information stored in the information provision link storage unit 102 and has the combination for each combination of the user ID and the content ID. Count the number of information link information. Then, the first adjacency matrix generation unit 104a generates a matrix C, which is an adjacency matrix (information providing link adjacency matrix) with the number as an element of the matrix component corresponding to the combination, and outputs the matrix C to the temporary memory 111. To store. For example, in the case of the example of FIG. 7A, (user ID, content ID) is (A0001, C0001), (A0001, C0002), (A0002, C0003), (A0002, C0004), (A0003, C0005). There is one piece of information providing link information. Further, matrix components (rows, columns) corresponding to combinations of these user IDs and content IDs are respectively (1, 1), (1, 2), (2, 3), (2, 4), ( 3, 5), the first adjacency matrix generation means 104a
Figure 0004344339
Will be generated.

次に、第2隣接行列生成手段104bが、情報評価リンク格納手段103に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算する。そして、情報評価リンク格納手段103は、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)である行列Eを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(b)の例の場合、(利用者ID,コンテンツID,評価情報)が(A0001,C0003,+2),(A0001,C0004,+3),(A0002,C0001,+2),(A0002,C0002,+1),(A0002,C0005,+1),(A0003,C0004,+3)である情報評価リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,3),(1,4),(2,1),(2,2),(2,5),(3,4)とすると、第2隣接行列生成手段104bは、

Figure 0004344339
を生成する。
尚、行列C,E生成の際、第1隣接行列生成手段104a或いは第2隣接行列生成手段104bは、各利用者ID及びコンテンツIDの情報も一時メモリ111に格納しておく。 Next, the second adjacency matrix generation unit 104b searches the information evaluation link information stored in the information evaluation link storage unit 103, and information evaluation link information having the combination for each combination of the user ID and the content ID. Add the value of the evaluation information. Then, the information evaluation link storage means 103 generates a matrix E that is an adjacency matrix (information evaluation link adjacency matrix) using the added value as an element of a matrix component corresponding to the combination, and outputs the matrix E to the temporary memory 111. To store. For example, in the example of FIG. 7B, (user ID, content ID, evaluation information) are (A0001, C0003, +2), (A0001, C0004, +3), (A0002, C0001, +2), (A0002). , C0002, +1), (A0002, C0005, +1), and (A0003, C0004, +3), one piece of information evaluation link information exists. Further, matrix components (rows, columns) corresponding to combinations of these user IDs and content IDs are respectively (1,3), (1,4), (2,1), (2,2), ( 2, 5), (3, 4), the second adjacency matrix generation means 104b
Figure 0004344339
Is generated.
When generating the matrices C and E, the first adjacency matrix generation unit 104a or the second adjacency matrix generation unit 104b also stores information on each user ID and content ID in the temporary memory 111.

行列C,Eが生成されると、次に固有ベクトル算出手段は、これらからスコア推移行列S(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrjとして出力する。この例の場合、まず、固有ベクトル算出手段104cは、一時メモリ111から行列C,Eを読み込む。そして、第1正規化手段104ca及び第2正規化手段104cbにおいて、同一利用者による多数の提供(多数の記事の投稿等)や、同一利用者による多数の評価(多数の記事のコメント等)によって、その利用者の情報提供スコアや情報評価スコアを高められないようにするため、行列C,Eを正規化し、正規化後の行列C,Eを一時メモリ111に格納する(ステップS12)。この例の場合、第1正規化手段104caにおいて、行列C(情報提供リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に(すなわち行毎に)、「情報提供リンク格納手段102において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数1)」によって正規化し、当該正規化された行列Cを出力する。また、この例の第2正規化手段104cbにおいて、行列E(情報評価リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段103において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数2)」によって正規化し、当該正規化された行列Eを出力する。尚、例えば、上述の正規化関数1をcijj=1..n (cij)とし、正規化関数1をeijj=1..n (eij)とした場合、式(9)(10)の行列C,Eはそれぞれ、

Figure 0004344339
のように正規化される。尚、これは一例であり、行列CとEの正規化は必須でなく、あえてこのような正規化を省略してもよいし、別の正規化方法を利用してもよい(他の正規化方法の例については後述する)。 After the matrices C and E are generated, the eigenvector calculation means next uses the eigenvector r of the score transition matrix S (matrix indicating the relationship between the information providing link adjacency matrix, the information evaluation link adjacency matrix, and any score). And the element of this eigenvector r is output as the information reputation score r j . In this example, first, the eigenvector calculation unit 104 c reads the matrices C and E from the temporary memory 111. Then, in the first normalization means 104ca and the second normalization means 104cb, by a large number of provisions by the same user (such as posting a large number of articles) and a large number of evaluations by the same user (such as comments on a large number of articles). In order not to increase the information provision score or information evaluation score of the user, the matrices C and E are normalized, and the normalized matrices C and E are stored in the temporary memory 111 (step S12). In the case of this example, in the first normalizing means 104ca, each element of the matrix C (information providing link adjacency matrix) is changed to “information providing” for each set of elements corresponding to each user ID (that is, for each row). The link storage unit 102 normalizes by the function (normalization function 1) depending on the number of content IDs associated with the user ID, and outputs the normalized matrix C. Further, in the second normalization means 104cb of this example, each element of the matrix E (information evaluation link adjacency matrix) is set to “in the information evaluation link storage means 103 for each set of elements corresponding to each user ID. Normalization is performed using a function (normalization function 2) depending on the number of content IDs associated with the user ID, and the normalized matrix E is output. For example, when the normalization function 1 is c ij / Σ j = 1..n (c ij ) and the normalization function 1 is e ij / Σ j = 1..n (e ij ), The matrices C and E in equations (9) and (10) are respectively
Figure 0004344339
Normalized as follows. Note that this is an example, and normalization of the matrices C and E is not essential, and such normalization may be omitted or another normalization method may be used (other normalizations). An example of the method will be described later).

次に固有ベクトル算出手段104cの演算手段104ccにおいて、一時メモリ111に格納された正規化後の行列C,Eを読み込み、読み込みた行列CとEから行列S=(αCT C +(1‐α)ET E)を計算し、これを一時メモリ111に格納する。尚、この行列Sをスコア推移行列と呼ぶ(ステップS13)。式(11)に示す行列CとEからα=0.3として生成したスコア推移行列Sの例を以下に示す。

Figure 0004344339
Next, in the calculation means 104cc of the eigenvector calculation means 104c, the normalized matrices C and E stored in the temporary memory 111 are read, and the matrix S = (αC T C + (1−α) is read from the read matrices C and E. E T E) is calculated and stored in the temporary memory 111. This matrix S is called a score transition matrix (step S13). An example of the score transition matrix S generated as α = 0.3 from the matrices C and E shown in Expression (11) is shown below.
Figure 0004344339

次に演算手段104ccは、一時メモリ111からスコア推移行列Sを読み込み、その固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrとして一時メモリ111に格納する(ステップS14)。固有ベクトルの算出方法については、ベキ乗法による反復計算法、QR分解法、直接法など多くの手法が適用可能である。以下に、ベキ乗法による反復計算法を用いて算出した式(12)のスコア推移行列Sに対する固有ベクトルを示す。

Figure 0004344339
この例では、情報評判スコアr=0.25926,r=0.96581となる。尚、固有ベクトルは固有値の数だけ存在するが、本形態では、例えば、固有値最大の固有ベクトル(principal eigenvector)を用いる。 Next, the computing means 104cc reads the score transition matrix S from the temporary memory 111, calculates its eigenvector r, and stores the element of this eigenvector r as the information reputation score r j in the temporary memory 111 (step S14). As a method for calculating the eigenvector, many methods such as an iterative calculation method using a power method, a QR decomposition method, and a direct method can be applied. The eigenvectors for the score transition matrix S of Equation (12) calculated using the iterative calculation method based on the power method are shown below.
Figure 0004344339
In this example, the information reputation score r 3 = 0.25926, r 4 = 0.96581. Although there are as many eigenvectors as the number of eigenvalues, in this embodiment, for example, the eigenvector having the maximum eigenvalue (principal eigenvector) is used.

次に、スコア算出手段104dにおいて、行列C又は行列Eと固有ベクトルrとを、これらと何れかのスコアa,hとの定義された関係を示す関係式に代入し、当該スコアa,hを算出して一時メモリ111に出力し、そこに格納する(ステップS15)。具体的には、例えば、スコア算出手段104dは、一時メモリ111から、行列Cと行列Eと固有ベクトルrとを読み込み、これらに式(3)及び式(4)を適用することで、スコアa、hを算出し、これらの要素を情報提供スコアa及び情報評価スコアhとして一時メモリ111に格納する。以下に、式(11)の行列C及び行列Eと式(13)の固有ベクトルrとを用い、式(3)及び式(4)によって算出した情報提供スコアベクトルaと情報評価スコアベクトルhを示す。

Figure 0004344339
この例では、情報提供スコアa=0.61253、情報評価スコアh=0.68319,h=0.96581となる。
次に、書き込み手段104eにおいて、上述の情報評判スコアr、情報提供スコアa及び情報評価スコアhと、各利用者ID及びコンテンツIDとを、一時メモリ111から読み込む。そして、書き込み手段104eは、情報評判スコアr(141b)を対応するコンテンツID(141a)に関連付けて(図10(a))情報評判スコア格納手段105に格納する。また、書き込み手段104eは、情報提供スコアa(142b)及び情報評価スコアh(142c)を対応する利用者ID(142a)に関連付けて(図10(b))、情報提供スコア格納手段106及び情報評価スコア格納手段107にそれぞれ格納する(ステップS16)。 Next, in the score calculation means 104d, the matrix C or matrix E and the eigenvector r are substituted into a relational expression indicating the defined relationship between these and any of the scores a and h, and the scores a and h are calculated. Then, the data is output to the temporary memory 111 and stored therein (step S15). Specifically, for example, the score calculation unit 104d reads the matrix C, the matrix E, and the eigenvector r from the temporary memory 111, and applies the equations (3) and (4) to them to obtain the scores a, h is calculated, and these elements are stored in the temporary memory 111 as the information provision score a i and the information evaluation score h i . The information provision score vector a and the information evaluation score vector h calculated by the equations (3) and (4) are shown below using the matrix C and the matrix E of the equation (11) and the eigenvector r of the equation (13). .
Figure 0004344339
In this example, the information provision score a 2 = 0.61253, the information evaluation score h 1 = 0.68319, and h 3 = 0.96581.
Next, the information reputation score r j , the information provision score a i, the information evaluation score h i , each user ID, and the content ID are read from the temporary memory 111 by the writing unit 104 e. Then, the writing means 104e associates the information reputation score r j (141b) with the corresponding content ID (141a) (FIG. 10 (a)) and stores it in the information reputation score storage means 105. Further, the writing means 104e associates the information provision score a i (142b) and the information evaluation score h i (142c) with the corresponding user ID (142a) (FIG. 10 (b)), and provides the information provision score storage means 106. And stored in the information evaluation score storage means 107 (step S16).

[スコア出力手段108の処理の詳細]
次に、スコア出力手段108(図1,図4)の処理の詳細について説明する。
図11は、スコア出力手段108の処理の詳細を説明するためのフローを示す図である。以下、この図に従ってスコア出力手段108の処理の詳細を説明する。
スコア出力手段108は、上記のステップにより算出格納された情報評判スコア、情報提供スコア、情報評価スコアを利用者端末からの要求に応じて検索して返す手段である。この処理を行う場合、まず、スコア出力手段108の受信手段108aは、利用者端末装置200−1〜mから送信された、コンテンツIDを含む情報評判スコア取得メッセージ或いは利用者IDを含む情報提供スコア・情報評価スコア取得メッセージを、ネットワーク300を通じて受信する(ステップS21)。受信されたメッセージは、一時メモリ111に格納される。
[Details of processing of score output means 108]
Next, details of the processing of the score output means 108 (FIGS. 1 and 4) will be described.
FIG. 11 is a diagram showing a flow for explaining details of the processing of the score output means 108. Details of the processing of the score output means 108 will be described below with reference to this figure.
The score output means 108 is a means for searching and returning the information reputation score, information provision score, and information evaluation score calculated and stored in the above steps in response to a request from the user terminal. When this processing is performed, first, the reception unit 108a of the score output unit 108 transmits the information reputation score acquisition message including the content ID or the information provision score including the user ID transmitted from the user terminal devices 200-1 to 200-m. An information evaluation score acquisition message is received through the network 300 (step S21). The received message is stored in the temporary memory 111.

次にメッセージ判定手段108bは、一時メモリ111からステップS21で受信されたメッセージを読み込み、そのヘッダ情報等により、このメッセージが、情報評判スコア取得メッセージか情報提供スコア・情報評価スコア取得メッセージかを判定する(ステップS22)。その判定結果は制御手段110に送られる。
ここでステップS21で情報評判スコア取得メッセージが受信されたと判断された場合には、制御手段110は、スコア検索手段108cに情報評判スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報評判スコア取得メッセージのコンテンツIDをキーとして、情報評判スコア格納手段105を検索し、このコンテンツIDに対応する情報評判スコア(図10(a))を抽出する(ステップS23)。尚、抽出された情報評判スコアは一時メモリ111に格納される。
Next, the message determination unit 108b reads the message received in step S21 from the temporary memory 111, and determines whether the message is an information reputation score acquisition message or an information provision score / information evaluation score acquisition message based on header information thereof. (Step S22). The determination result is sent to the control means 110.
If it is determined in step S21 that the information reputation score acquisition message has been received, the control unit 110 gives a search instruction for the information reputation score to the score search unit 108c. Receiving this, the score search means 108c searches the information reputation score storage means 105 using the content ID of the information reputation score acquisition message stored in the temporary memory 111 as a key, and the information reputation score (corresponding to this content ID ( FIG. 10A is extracted (step S23). Note that the extracted information reputation score is stored in the temporary memory 111.

一方、ステップS21で情報提供スコア・情報評価スコア取得メッセージが受信されたと判断された場合には、制御手段110は、情報提供スコア及び情報評価スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報提供スコア・情報評価スコア取得メッセージの利用者IDをキーとして、情報提供スコア格納手段106及び情報評価スコア格納手段107を検索し、この利用者IDに対応する情報提供スコア及び情報評価スコア(図10(b))を抽出する(ステップS24)。尚、抽出された情報提供スコア及び情報評価スコアは一時メモリ111に格納される。   On the other hand, when it is determined in step S21 that the information provision score / information evaluation score acquisition message has been received, the control unit 110 gives a search instruction for the information provision score and the information evaluation score. Upon receiving this, the score search means 108c searches the information provision score storage means 106 and the information evaluation score storage means 107 using the user ID of the information provision score / information evaluation score acquisition message stored in the temporary memory 111 as a key. Then, an information provision score and an information evaluation score (FIG. 10B) corresponding to this user ID are extracted (step S24). Note that the extracted information provision score and information evaluation score are stored in the temporary memory 111.

次に、メッセージ生成手段108dにおいて、一時メモリ111から上記ステップS23やS24で取得されたスコアと、対応するコンテンツIDや利用者IDとを読み出し、それらの情報を例えば、コンテンツIDや利用者ID別に振り分けたり、スコアの大きい順序で並び替えたりしたメッセージを生成する(ステップS25)。生成されたメッセージは、一時メモリ111に格納され、さらに送信手段108eによって読み込まれ、ネットワーク300を通じて利用者端末装置200−1〜mに送信される(ステップS26)。   Next, in the message generation unit 108d, the score acquired in the above steps S23 and S24 and the corresponding content ID and user ID are read from the temporary memory 111, and the information is obtained, for example, for each content ID and user ID. Messages that are sorted or rearranged in descending order of score are generated (step S25). The generated message is stored in the temporary memory 111, further read by the transmission unit 108e, and transmitted to the user terminal devices 200-1 to 200-m through the network 300 (step S26).

このように各スコアを利用者に提供することにより、利用者は、コミュニティ中の大量の情報の中からコミュニティにとって有益な情報を取得することや、当該有益な情報のランキングを取得することが可能となる。
<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。例えば、また、上述の各種の処理は、上述した記載に従った時系列で実行されるのみならず、処理を実行する装置の処理能力或いは必要に応じて並列的に或いは個別に実行されてもよい。
By providing each score to the user in this way, the user can acquire useful information for the community from a large amount of information in the community and can obtain a ranking of the useful information. It becomes.
<Modifications>
The present invention is not limited to the embodiment described above. For example, the above-described various processes are not only executed in time series according to the above description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Good.

また、例えば、図9で示したステップS11からステップS16の計算手順は、図12(a)による反復計算を行うことでも全く同様に計算できる。この場合には、r、a、hが反復により同時に計算されるため、ステップS13からステップS15が統合された形態で実施される。この計算手順は、行列の要素表現で表すと、図12(b)のようにも表現することできる。ここで、prov(j)はコンテンツjを提供した利用者(prov(j)∈{1…m})、eval(j)はコンテンツjを評価している利用者の集合(eval(j)∈{1…m})、prov(i)は利用者iが提供したコンテンツの集合(prov(i)∈{1…n})、eval(i)は利用者iが評価したコンテンツの集合(eval(i)∈{1…n})である。これらの情報は、図1に示す情報提供リンク格納手段102及び情報評価リンク格納手段103から利用者ID或いはコンテンツIDを利用して検索することにより容易に抽出することが可能である。尚、図12(b)において||x||1及び||x||2はベクトルxのノルムを表し、||x||1はx の要素の絶対値の和、||x||2はx の要素の2乗の和の平方根(ユークリッドノルム)を表す。このように本発明では、スコアの算出に固有ベクトルを用いることとしたため、反復アルゴリズムを適用し、簡単にこれらのスコアが算出することが可能とである。 Further, for example, the calculation procedure from step S11 to step S16 shown in FIG. 9 can be calculated in exactly the same way by performing iterative calculation according to FIG. In this case, since r, a, and h are calculated simultaneously by iteration, steps S13 to S15 are performed in an integrated manner. This calculation procedure can also be expressed as shown in FIG. 12B in terms of matrix element expression. Here, prov (j) is the user who provided the content j (prov (j) ε {1 ... m}), and eval (j) is the set of users who are evaluating the content j (eval (j) ε {1 ... m}), prov (i) is a set of contents provided by user i (prov (i) ∈ {1 ... n}), eval (i) is a set of contents evaluated by user i (eval (i) ∈ {1 ... n}). Such information can be easily extracted by searching using the user ID or the content ID from the information providing link storage unit 102 and the information evaluation link storage unit 103 shown in FIG. In FIG. 12B, || x || 1 and || x || 2 represent the norm of the vector x, || x || 1 is the sum of the absolute values of the elements of x, and || x || 2 represents the square root (Euclidean norm) of the sum of the squares of the elements of x. As described above, in the present invention, since eigenvectors are used for the calculation of scores, it is possible to easily calculate these scores by applying an iterative algorithm.

図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。尚、図13ではベクトルを示す矢印を省略してある。図13の処理の場合、まず、ステップS11と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、行列C,Eを生成し(ステップS31)、これらを第1正規化手段104ca及び第2正規化手段104cbにおいて正規化して一時メモリ111に格納する(ステップS32)。また、演算手段104ccにおいて、ベクトルa(0)=(1,...,1)T, ベクトルh(0)=(1,...,1)T,変数k=0とし、これらを一時メモリ111に格納する(ステップS33)。次に、演算手段104ccにおいて、一時メモリ111から正規化後の行列C,Eとベクトルa(k), h(k)とを読み込み、ベクトルr(k+1)=αCTa(k)+(1‐α)ETh(k)を算出し、一時メモリ111に格納する(ステッS34)。尚、αは前述のように予め定めておく。次に、演算手段104ccにおいて、一時メモリ111からベクトルr(k+1)を読み込み、図12(b)に示したようにこれを正規化して一時メモリ111に格納する(ステップS35)。次に、スコア算出手段104dにおいて、一時メモリ111から正規化後の行列C,Eとベクトルh(k+1)とを読み込み、ベクトルa(k+1)=C・r(k+1)及びh(k+1)=E・r(k+1)を算出し、ベクトルa(k+1),h(k+1)を一時メモリ111に格納する(ステップS36)。次に、制御手段110において、一時メモリ111からベクトルr(k),r(k+1)を読み込み、全てのj∈{1…n}についてrj (k)‐rj (k+1)<δが成り立つか否かを判断する(ステップS37)。尚、rj (k)はベクトルr(k)のj番目の要素を示し、rj (k+1)はベクトルr(k+1)のj番目の要素を示す。また、δは予め設定された十分小さい定数とする。ここで、rj (k)‐rj (k+1)<δでなかった場合には、制御手段110は演算手段104ccに指示を与える。これをトリガに演算手段104ccは、一時メモリ111から変数kを読み込み、k+1を演算し、その演算結果を新たなkとして一時メモリ111に格納する(ステップS38)。そして、制御手段110は処理をステップS34に戻す。一方、ステップS37の判断でrj (k)‐rj (k+1)<δと判断された場合には、制御手段110は書き込み手段104eに指示を与える。これをトリガに書き込み手段104eは、一時メモリ111からベクトルrj (k+1),a(k+1),h(k+1)を読み込み、これらの各要素をそれぞれ情報評判スコア、情報提供スコア及び情報評価スコアとして前述のように情報評判スコア格納手段105、情報提供スコア格納手段106及び情報評価スコア格納手段107に格納する(ステップS39)。 FIG. 13 is a diagram illustrating a flow for explaining processing when r, a, and h are calculated by the algorithm of FIG. In FIG. 13, an arrow indicating a vector is omitted. In the case of the process of FIG. 13, first, similarly to step S11, the first adjacency matrix generation unit 104a and the second adjacency matrix generation unit 104b generate matrices C and E (step S31), and first normalize them. Normalized by means 104ca and second normalizing means 104cb and stored in temporary memory 111 (step S32). Further, in the calculation means 104cc, the vector a (0) = (1, ..., 1) T , the vector h (0) = (1, ..., 1) T , and the variable k = 0 are set, Store in the memory 111 (step S33). Next, in the operation means 104cc, the normalized matrices C and E and the vectors a (k) and h (k) are read from the temporary memory 111, and the vector r (k + 1) = αC T a (k) + (1-α) E T h (k) is calculated and stored in the temporary memory 111 (step S34). Α is determined in advance as described above. Next, the computing means 104cc reads the vector r (k + 1) from the temporary memory 111, normalizes it as shown in FIG. 12B, and stores it in the temporary memory 111 (step S35). Next, the score calculation unit 104d reads the normalized matrices C and E and the vector h (k + 1) from the temporary memory 111, and the vector a (k + 1) = C · r (k + 1) and h (k + 1) = E · r (k + 1) is calculated, and vectors a (k + 1) and h (k + 1) are stored in the temporary memory 111 (step S36). Next, the control means 110 reads the vectors r (k) and r (k + 1) from the temporary memory 111, and r j (k) −r j (k + 1) for all j∈ {1. It is determined whether or not <δ holds (step S37). R j (k) represents the j-th element of the vector r (k) , and r j (k + 1) represents the j-th element of the vector r (k + 1) . Also, δ is set to a sufficiently small constant set in advance. Here, if r j (k) −r j (k + 1) <δ is not satisfied, the control means 110 gives an instruction to the calculation means 104cc. Using this as a trigger, the calculation means 104cc reads the variable k from the temporary memory 111, calculates k + 1, and stores the calculation result as a new k in the temporary memory 111 (step S38). And the control means 110 returns a process to step S34. On the other hand, if it is determined in step S37 that r j (k) −r j (k + 1) <δ, the control unit 110 gives an instruction to the writing unit 104e. Using this as a trigger, the writing means 104e reads the vectors r j (k + 1) , a (k + 1) , and h (k + 1) from the temporary memory 111, and provides each of these elements as an information reputation score and information. The scores and information evaluation scores are stored in the information reputation score storage means 105, the information provision score storage means 106, and the information evaluation score storage means 107 as described above (step S39).

また、上述の本形態を情報評価リンク情報が単調増加するコミュニティに適用した場合、このコミュニティで活動する期間が長い利用者ほど、その新しい活動(コンテンツの提供や評価)がスコアに与える影響が小さくなってしまう。これは、その利用者の過去の活動により作られた大量の情報評価リンク情報による影響と、前述の第2正規化手段104cb(図3)における正規化手法の影響によるものである。このような事態は、その参加者の活動を行うインセンティブを低下させる等の問題がある。よって、このような場合には、行列E(情報評価リンク隣接行列)に対し、これらの各要素が時間の経過に伴って小さくなるような正規化を行うことが有効である。具体的には、例えば、第2正規化手段104cb(図3)において、一時メモリ111から行列Eの各要素を読み込み、次式のような時間減衰のファクターを導入して行列Eを正規化し、一時メモリ111に格納する。そして、この時刻tにおける行列E(t)を本形態の行列E(正規化後の情報評価リンク隣接行列)として用いる。 In addition, when the above-described embodiment is applied to a community in which information evaluation link information monotonously increases, the longer the period of activity in this community, the smaller the impact of the new activity (content provision and evaluation) on the score. turn into. This is due to the influence of a large amount of information evaluation link information created by the user's past activities and the influence of the normalization method in the second normalization means 104cb (FIG. 3). Such a situation has problems such as reducing the incentive to perform the activities of the participants. Therefore, in such a case, it is effective to normalize the matrix E (information evaluation link adjacency matrix) so that these elements become smaller as time passes. Specifically, for example, in the second normalization means 104cb (FIG. 3), each element of the matrix E is read from the temporary memory 111, and a time decay factor such as the following equation is introduced to normalize the matrix E. Store in the temporary memory 111. Then, the matrix E (t) at the time t is used as the matrix E ( information evaluation link adjacency matrix after normalization ) of this embodiment.

Figure 0004344339
ただし、tは現在時刻、time(eij)はeijが入力された時刻、ρは[0,1]を定義域とする減衰定数である。またeij (t)は現在時刻tにおける行列E(t)のi行j列目の要素である。尚、この場合、第2正規化手段104cb(図3)は、例えば、情報評価装置100内の図示していない内部時計等から出力される情報を現在時刻tとして用いる。さらに、この場合、情報取得手段101が情報評価リンク格納手段103に情報評価リンク情報を格納する際、その受信時間や格納時間等を各情報評価リンク情報に関連付けて格納しておく。そして、第2正規化手段104cb(図3)は、例えば、この情報評価リンク格納手段103に格納された受信時間や格納時間等を、それに関連付けられている情報評価リンク情報に対応するtime(eij)として利用する。
Figure 0004344339
Where t is the current time, time (e ij ) is the time when e ij is input, and ρ is an attenuation constant with [0, 1] as the domain. E ij (t) is an element in the i-th row and j-th column of the matrix E (t) at the current time t. In this case, the second normalization means 104cb (FIG. 3) uses, for example, information output from an internal clock (not shown) in the information evaluation apparatus 100 as the current time t. Further, in this case, when the information acquisition unit 101 stores the information evaluation link information in the information evaluation link storage unit 103, the reception time, the storage time, and the like are stored in association with each information evaluation link information. Then, the second normalization means 104cb (FIG. 3) uses, for example, the reception time and storage time stored in the information evaluation link storage means 103 as time (e) corresponding to the information evaluation link information associated therewith. ij ).

また、本形態では、上述の式(1)〜式(4)を用いて式(6)のような変形を行い、(αCT C +(1‐α)ET E)をスコア推移行列Sとしてその固有ベクトルrを求め、さらに式(3)及び式(4)によりベクトルa,hを求めることとした。しかし、上述の式(1)〜式(4)を用い、
a=Cr=(CET)h=(CETE)r=(CETECT)a …(15)
或いは
h=Er=(ECT)a=(ECTC)r=(ECTCET)h …(16)
のような変形を行い、これらの式からスコア推移行列をS= CETECT或いはS= ECTCETとおいてもよい。この場合、演算手段104cc(図3)が算出するのは、固有ベクトルa或いはhであり、スコア算出手段104dが式(1)〜(4)を用いて算出するのは、ベクトルh,r或いはa,rとなる。尚、この場合の処理の詳細は、スコア推移行列が異なる点と、スコア算出手段104dが用いる式及びベクトルの種類が異なる点を除いて上述の実施の形態と同様である。もちろん、この場合に、図12による反復計算の変形を用いてもよいことはいうまでもない。
Further, in this embodiment, the above-described equations (1) to (4) are used to perform the transformation as equation (6), and (αC T C + (1−α) E T E) is converted to the score transition matrix S. Then, the eigenvector r is obtained, and the vectors a and h are obtained from the equations (3) and (4). However, using the above equations (1) to (4),
a = Cr = (CE T ) h = (CE T E) r = (CE T EC T ) a… (15)
Or
h = Er = (EC T) a = (EC T C) r = (EC T CE T) h ... (16)
Perform modifications such as, a score transition matrix may be placed with S = CE T EC T or S = EC T CE T from these equations. In this case, the calculation means 104cc (FIG. 3) calculates the eigenvector a or h, and the score calculation means 104d calculates using the equations (1) to (4), the vectors h, r or a , R. Note that the details of the processing in this case are the same as those in the above-described embodiment except that the score transition matrix is different and the types of equations and vectors used by the score calculation unit 104d are different. Of course, it goes without saying that a modification of the iterative calculation according to FIG. 12 may be used in this case.

また、上述の実施の形態では、情報評判スコア、情報提供スコア及び情報評価スコアの3つのスコアを算出することとした。しかし、これらのスコアの一部のみを算出する構成としてもよい。
さらに、本形態では、スコア出力手段108において、情報評判スコア取得メッセージ及び情報提供スコア・情報評価スコア取得メッセージの2種類のメッセージを受け付ける構成とした。しかし、用途によっては、スコア出力手段108が情報提供スコア・情報評価スコア取得メッセージを受け付けないこととし、上記のステップS24(図11)の処理を実行しない構成としてもよい。
In the above-described embodiment, the three scores of the information reputation score, the information provision score, and the information evaluation score are calculated. However, only a part of these scores may be calculated.
Furthermore, in the present embodiment, the score output means 108 is configured to accept two types of messages: an information reputation score acquisition message and an information provision score / information evaluation score acquisition message. However, depending on the application, the score output unit 108 may not accept the information provision score / information evaluation score acquisition message, and the process of step S24 (FIG. 11) may not be executed.

〔第2の実施の形態〕
次に、本発明における第2の実施の形態について説明する。
<原理>
既に述べたように、本発明の情報評価装置は、問題解決型コミュニティ、商品・サービス評価型コミュニティ等の特定のコミュニティに対して適用することが可能である。しかし、これに留まらず、インターネット上の動画、画像、音楽、ニュース等の様々なコンテンツ検索システムにおける検索結果のランキング表示に本発明を適用することもできる。本形態は、このようなコンテンツ検索システムに本発明を適用した例である。尚、本形態では、blog(ブログ)記事をコンテンツの具体例とし、blog記事検索システムとして本コンテンツ検索システムを利用する場合を説明する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described.
<Principle>
As described above, the information evaluation apparatus of the present invention can be applied to a specific community such as a problem-solving community or a product / service evaluation community. However, the present invention is not limited to this, and the present invention can also be applied to ranking display of search results in various content search systems such as videos, images, music, and news on the Internet. The present embodiment is an example in which the present invention is applied to such a content search system. In this embodiment, a blog article is used as a specific example of content, and a case where the content search system is used as a blog article search system will be described.

本形態では、blog記事(コンテンツ)を以下のような構造上の特徴を有するものとする。尚、本形態の手法ではblog記事の内容には関与しない。
(a)個人を編集主体とし、個人単位にトップページ(blogサイトトップ)を有する。
(b)トップページから各記事(blogエントリ)へのリンクを有し、各記事はURI(Uniform Resource Identifier)を有する。
(c)双方向リンクを生成するためのメカニズム(トラックバック)が提供されている。
In this embodiment, a blog article (content) has the following structural features. Note that the technique of this embodiment is not involved in the contents of blog articles.
(A) An individual is an editing subject and has a top page (blog site top) in an individual unit.
(B) There is a link from the top page to each article (blog entry), and each article has a URI (Uniform Resource Identifier).
(C) A mechanism (trackback) for generating a bi-directional link is provided.

このようなblog記事に対して、本発明を適用するためには、収集したblog記事の集合から情報提供リンク情報と、情報評価リンク情報とを抽出する必要がある。このためには、まず情報提供者と情報評価者の利用者IDを取得できなくてはならない。ここで、blog記事の場合には、上記のように編集主体が個人であり、またblogのホスティングサービス毎に各blog記事のトップページのURIの形式がほぼ決まっている。そこで本形態では、利用者IDとしてblogサイトトップのURIを用いる。また、blogのシステムでは、基本的に、各blog記事のエントリに永続的なURIが付与される。よって、本形態では、blog記事に付与されたURIをコンテンツIDとして用いることにする。このようにすることにより、情報提供リンク情報は、blogサイトトップのURI(利用者ID)と、その配下にあるblog記事エン卜リのURI(コンテンツID)との2つ組を含む集合として生成できる。   In order to apply the present invention to such a blog article, it is necessary to extract information provision link information and information evaluation link information from a set of collected blog articles. For this purpose, first, the user IDs of the information provider and the information evaluator must be acquired. Here, in the case of a blog article, the editing subject is an individual as described above, and the URI format of the top page of each blog article is almost determined for each blog hosting service. Therefore, in this embodiment, the URI of the blog site top is used as the user ID. In the blog system, basically, a permanent URI is given to each blog article entry. Therefore, in this embodiment, the URI given to the blog article is used as the content ID. In this way, the information providing link information is generated as a set including two sets of URI (user ID) of the blog site top and URI (content ID) of the blog article entry under the blog site. it can.

同様に情報評価リンク情報についでも、blogサイトトップのURI(利用者ID)と、その配下にある各記事に含まれるリンク先である外部のblog記事URI(コンテンツID)との2つ組を含む集合として生成できる。これは、「あるblogger(利用者)iのblog記事から外部のblog記事jに対してリンクが存在する」ということが「このblogger(利用者)iが、blog記事j(コンテンツ)に対して関心がある」と考えられるからである。この場合、リンクの有無により、eij=1(リンク有り)或いはeij=0(リンク無し)とすることで、情報評価リンク情報に対応する行列E(情報評価リンク隣接行列)を生成することができる。ただし、blogでは、トラックバック機能により、リンクされたblog記事に、自動的にそのリンク元のblog記事への逆リンクが生成される。即ち、自動的に相互リンクが形成される。その結果、本来関心がもたれないblog記事に対しても、トラックバックされる側のblog記事からトラックバックする側のblog記事への逆向きのリンク(トラックバックリンク)が張られる。その結果、関心を持たれない記事に対して多くの被リンクが張られる、いわゆるトラックバックスパムという攻撃が存在する。そこで本形態では、トラックバックする側からトラックバックされる側へのリンク(すなわち通常のリンク)は情報評価リンク情報の生成に用いるが、トラックバックリンクは情報評価リンク情報の生成に用いない。尚、もちろん、トラックバックに依らない一般のblog記事間のリンクは情報評価リンク情報の生成に用いる。 Similarly, the information evaluation link information includes two sets of a blog site top URI (user ID) and an external blog article URI (content ID) which is a link destination included in each article under the blog site. Can be generated as a set. This means that “There is a link from a blog article of a certain blogger (user) i to an external blog article j”, “This blogger (user) i is associated with a blog article j (content). This is because it is considered to be interested. In this case, the matrix E (information evaluation link adjacency matrix) corresponding to the information evaluation link information is generated by setting e ij = 1 (with link) or e ij = 0 (without link) depending on the presence or absence of the link. Can do. However, in the blog, a reverse link to the blog article of the link source is automatically generated in the linked blog article by the trackback function. That is, a mutual link is automatically formed. As a result, a reverse link (trackback link) from the blog article on the trackback side to the blog article on the trackback side is also set for the blog article that is not of interest. As a result, there is an attack called so-called trackback spam, in which many backlinks are made to articles that are not of interest. Therefore, in this embodiment, the link from the trackback side to the trackback side (that is, a normal link) is used for generating information evaluation link information, but the trackback link is not used for generating information evaluation link information. Of course, links between general blog articles that do not depend on trackbacks are used to generate information evaluation link information.

また、第1の実施の形態では、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化する手法を例示した。しかし、blogスペースにおいては、数千のblog記事を書く人もいる一方、数件のblog記事を書いてやめてしまう人も多い。このような様々なblogger(利用者)全てに対し、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化すると、blog記事の提供が少ない利用者のblog記事に対してリンクが張られた場合に、そのリンク情報を元に算出された情報提供スコアが非常に高い値となってしまう。利用者の情報提供能力が本当に高い場合にはこれでもよいが、情報提供スコアが運によって左右されすいという問題がある。−方、正規化を行わない場合、すなわち、例えば、blog記事の追加に伴い単純に行列C(情報提供リンク隣接行列)の要素cijに1を追加し、blog記事間のリンクの追加に伴い単純に行列E(情報評価リンク隣接行列)の要素eijに1を追加した場合には、利用者がたくさんの記事を書くことにより、故意にスコアを上げることができるという問題がある。 In the first embodiment, a method of normalizing the matrices C and E so that the total number of contents provided by one user and the sum of evaluation information values is 1 is exemplified. However, in the blog space, some people write thousands of blog articles, and many people stop writing a few blog articles. For all such various bloggers (users), if the matrices C and E are normalized so that the total number of contents and evaluation information provided by one user is 1, the provision of blog articles is small. When a link is made to a user's blog article, the information provision score calculated based on the link information becomes a very high value. This may be sufficient when the information provision ability of the user is really high, but there is a problem that the information provision score is easily influenced by luck. -On the other hand, when normalization is not performed, that is, for example, 1 is simply added to the element c ij of the matrix C (information providing link adjacency matrix) with the addition of a blog article, and with the addition of a link between blog articles If 1 is simply added to the element e ij of the matrix E (information evaluation link adjacency matrix), there is a problem that the user can intentionally increase the score by writing many articles.

そこで、本形態では、blog記事の投稿数やリンク数に応じて計算される値を用い、中間レベルの正規化を実施することで、この問題を解決する。具体的には、例えば以下のように、コンテンツや評価の投稿数の平方根(Sqrt)の重みで利用者一人当たりの投稿数を正規化する。
C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=sqrt(Σj=1...n(cij))×cijj=1...n(cij)=cij/sqrt(Σj=1...n(cij)) …(17)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=sqrt(Σj=1...n(eij))×eijj=1...n(eij)=eij/sqrt(Σj=1...n(eij)) …(18)
上記のSqrt関数による正規化は、blog記事へ本発明を適用する場合には、特に有効であることが経験的に知られている。しかし、本発明を、他のコミュニティ、例えば電子掲示板システム(BBS)に適用する場合、以下のように自然対数(ln)関数を用いて正規化を行うとよい結果が得られることがある。
Therefore, in this embodiment, this problem is solved by performing normalization at an intermediate level using values calculated according to the number of posts of blog articles and the number of links. Specifically, for example, as described below, the number of posts per user is normalized with the weight of the square root (Sqrt) of the number of posts of content and evaluation.
C '= [c' ij ] (i = 1, ..., m, j = 1, ..., n)
c ' ij = sqrt (Σ j = 1 ... n (c ij )) × c ij / Σ j = 1 ... n (c ij ) = c ij / sqrt (Σ j = 1 ... n ( c ij ))… (17)
E '= [e' ij ] (i = 1, ..., m, j = 1, ..., n)
e ' ij = sqrt (Σ j = 1 ... n (e ij )) × e ij / Σ j = 1 ... n (e ij ) = e ij / sqrt (Σ j = 1 ... n ( e ij ))… (18)
It has been empirically known that normalization by the above Sqrt function is particularly effective when the present invention is applied to a blog article. However, when the present invention is applied to another community such as an electronic bulletin board system (BBS), good results may be obtained by performing normalization using a natural logarithm (ln) function as follows.

C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=ln(Σj=1...n(cij))×cijj=1...n(cij) …(19)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=ln(Σj=1...n(eij))×eijj=1...n(eij) …(20)
<構成>
次に、上記で述べた考え方に基づき、本発明の情報評価装置をblog記事の検索に適用したコンテンツ検索システムの構成を説明する。尚、以下では第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
C '= [c' ij ] (i = 1, ..., m, j = 1, ..., n)
c ' ij = ln (Σ j = 1 ... n (c ij )) × c ij / Σ j = 1 ... n (c ij )… (19)
E '= [e' ij ] (i = 1, ..., m, j = 1, ..., n)
e ' ij = ln (Σ j = 1 ... n (e ij )) × e ij / Σ j = 1 ... n (e ij )… (20)
<Configuration>
Next, based on the concept described above, the configuration of a content search system in which the information evaluation apparatus of the present invention is applied to search for blog articles will be described. In the following, differences from the first embodiment will be mainly described, and description of matters common to the first embodiment will be omitted.

図14は、本形態におけるコンテンツ検索システム1の構成を示す図である。
図14に例示するように、この例のコンテンツ検索システム1は、blog記事の提供やコンテンツ情報の収集を行う利用者i=1,...,pが利用する利用者端末装置500−1〜p、blog記事が格納されるコンテンツサーバ装置600−1〜q、コンテンツサーバ装置600−1〜qから送信されるコンテンツの更新情報を配信するPINGサーバ(Weblog Updates Ping サーバ)装置700及びコンテンツ検索装置1000を有しており、これらはインターネット等のネットワークを通じて接続されている。また、コンテンツ検索装置1000は、インターネット上で公開されているコンテンツ(ここでは、blog記事、blog entryとも呼ぶ)情報をコンテンツサーバ装置600−1〜qから収集するコンテンツ情報収集手段1100と、収集されたコンテンツ情報を蓄積格納するコンテンツ情報格納手段1200と、−定時間間隔或いは、一定数のコンテンツ情報が収集されるたびに、コンテンツ情報格納手段から情報提供リンク情報と情報評価リンク情報を抽出し、各スコアを算出する情報評価装置1300と、利用者端末装置500−1〜pからネットワーク300を介して検索語を受け取り、コンテンツ情報格納手段1200に記録されているコンテンツのデータセットからキーワードに−致するコンテンツ情報を検索し、検索結果を利用者端末装置500−1〜pに返送するコンテンツ情報検索手段1400と、一時メモリ1010と、制御手段1020と、内部時計1030とから構成されている。尚、第1の実施の形態と同様、コンテンツサーバ装置600−1〜q、PINGサーバ装置700及びコンテンツ検索装置1000は、公知のコンピュータに所定のプログラムを実行させることにより構成されるものである。
FIG. 14 is a diagram showing a configuration of the content search system 1 in the present embodiment.
As illustrated in FIG. 14, the content search system 1 of this example includes user terminal devices 500-1 to 500-1 used by users i = 1,..., P who provide blog articles and collect content information. Content server apparatuses 600-1 to q for storing p and blog articles, a PING server (Weblog Updates Ping server) apparatus 700 for distributing update information of contents transmitted from the content server apparatuses 600-1 to 600-q, and a content search apparatus 1000, which are connected through a network such as the Internet. In addition, the content search device 1000 is collected with content information collection means 1100 that collects content (herein also referred to as blog articles and blog entries) information published on the Internet from the content server devices 600-1 to q. Content information storage means 1200 for accumulating and storing stored content information;-whenever a certain time interval or a certain number of content information is collected, information providing link information and information evaluation link information are extracted from the content information storage means, A search term is received from the information evaluation device 1300 for calculating each score and the user terminal devices 500-1 to 500-p via the network 300, and the keyword is matched with the keyword from the content data set recorded in the content information storage unit 1200. Search for content information to search The content information search means 1400 for returning the results to the user terminal devices 500-1 to 500-p, a temporary memory 1010, a control means 1020, and an internal clock 1030 are included. As in the first embodiment, the content server apparatuses 600-1 to 600-q, the PING server apparatus 700, and the content search apparatus 1000 are configured by causing a known computer to execute a predetermined program.

図15は、図14のコンテンツ情報収集手段1100の詳細構成を例示した図である。
この図に例示するように、この例のコンテンツ情報収集手段1100は、通信手段1110、更新情報読み込み手段1120、コンテンツ情報読み込み手段1130及びコンテンツ情報解析手段1140を有している。尚、図15における矢印はデータの流れを示しているが、制御手段1020及び内部時計1030に入出力されるデータの流れの記載は省略してある。
図16は、図14の情報評価装置1300の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
FIG. 15 is a diagram illustrating a detailed configuration of the content information collection unit 1100 of FIG.
As illustrated in this figure, the content information collection unit 1100 of this example includes a communication unit 1110, an update information reading unit 1120, a content information reading unit 1130, and a content information analysis unit 1140. The arrows in FIG. 15 indicate the flow of data, but the description of the flow of data input / output to / from the control means 1020 and the internal clock 1030 is omitted.
FIG. 16 is a diagram illustrating a detailed configuration of the information evaluation apparatus 1300 of FIG. In this figure, the same reference numerals as those in the first embodiment are used for portions common to the first embodiment.

この図に例示するように、この例の情報評価装置1300は、情報取得手段1301、情報提供リンク格納手段102、情報評価リンク格納手段103及びスコア計算手段104を有している。尚、図16における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図17は、図16の情報取得手段1301の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
As illustrated in this figure, the information evaluation apparatus 1300 of this example includes an information acquisition unit 1301, an information provision link storage unit 102, an information evaluation link storage unit 103, and a score calculation unit 104. Note that the arrows in FIG. 16 indicate the flow of data, but the description of the flow of data input to and output from the control means 1020 is omitted.
FIG. 17 is a diagram illustrating a detailed configuration of the information acquisition unit 1301 of FIG. In this figure, the same reference numerals as those in the first embodiment are used for portions common to the first embodiment.

この図に例示するように、この例の情報取得手段1301は、読み込み手段1301a、情報提供リンク生成手段101e、情報評価リンク生成手段101f及び書き込み手段101gを有している。尚、図17における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図18は、図16におけるスコア計算手段104の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
As illustrated in this figure, the information acquisition unit 1301 of this example includes a reading unit 1301a, an information providing link generation unit 101e, an information evaluation link generation unit 101f, and a writing unit 101g. Note that the arrows in FIG. 17 indicate the flow of data, but the description of the flow of data input to and output from the control means 1020 is omitted.
FIG. 18 is a diagram illustrating a detailed configuration of the score calculation unit 104 in FIG. In this figure, the same reference numerals as those in the first embodiment are used for portions common to the first embodiment.

この図に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d及び書き込み手段104eを有している。また、固有ベクトル算出手段104cは、第1正規化手段104ca、第2正規化手段104cb及び演算手段104ccを有している。尚、図18における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図19は、図14におけるコンテンツ情報検索手段1400の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
As illustrated in this figure, the score calculation unit 104 of this example includes a first adjacency matrix generation unit 104a, a second adjacency matrix generation unit 104b, an eigenvector calculation unit 104c, a score calculation unit 104d, and a writing unit 104e. Yes. The eigenvector calculation unit 104c includes a first normalization unit 104ca, a second normalization unit 104cb, and a calculation unit 104cc. Note that the arrows in FIG. 18 indicate the flow of data, but the description of the flow of data input to and output from the control means 1020 is omitted.
FIG. 19 is a diagram illustrating a detailed configuration of the content information search unit 1400 in FIG. In this figure, the same reference numerals as those in the first embodiment are used for portions common to the first embodiment.

この図に例示するように、この例のコンテンツ情報検索手段1400は、受信手段1410、コンテンツ情報検索手段1420、コンテンツ情報提供リスト生成手段1430及び送信手段1440を有している。
<動作>
次に、本形態のコンテンツ検索装置1000の動作を説明する。
[概要]
本形態のコンテンツ検索システム900は、コンテンツサーバ装置600−1〜pに格納されたコンテンツに関する情報を前述のスコアを利用して加工し、提供するシステムである。この情報提供を行う場合、まず、コンテンツ検索装置1000のコンテンツ情報収集手段1100において、コンテンツサーバ装置600−1〜pに格納されているblog記事(コンテンツ)の情報を収集し、コンテンツ情報格納手段1200に格納する。そして、情報評価装置1300において、第1の実施の形態と同様にコンテンツ情報格納手段1200に格納されたコンテンツ情報から各スコアを算出し、これをコンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する。そして、コンテンツ情報検索手段1400が、利用者端末装置500−1〜pから送られた検索条件に従ってコンテンツ情報格納手段1200に格納された情報を検索し、その検索結果を利用者端末装置500−1〜pに返す。尚、コンテンツ検索装置1000の各処理は、制御手段1020の制御のもと実行される。
As illustrated in this figure, the content information search unit 1400 of this example includes a reception unit 1410, a content information search unit 1420, a content information provision list generation unit 1430, and a transmission unit 1440.
<Operation>
Next, the operation of the content search apparatus 1000 of this embodiment will be described.
[Overview]
The content search system 900 according to the present embodiment is a system that processes and provides information related to content stored in the content server apparatuses 600-1 to 600-p using the above-described score. When providing this information, first, the content information collection unit 1100 of the content search device 1000 collects information on blog articles (contents) stored in the content server devices 600-1 to 600-p, and the content information storage unit 1200 is collected. To store. Then, in the information evaluation apparatus 1300, as in the first embodiment, each score is calculated from the content information stored in the content information storage unit 1200 and stored in the content information storage unit 1200 in association with the content information. . Then, the content information search unit 1400 searches the information stored in the content information storage unit 1200 according to the search conditions sent from the user terminal devices 500-1 to 500-p, and the search result is used as the user terminal device 500-1. Return to ~ p. Each process of the content search apparatus 1000 is executed under the control of the control means 1020.

[スコア算出処理の詳細]
図20は、本形態のコンテンツ検索装置1000で行われるスコア算出処理を説明するためのフローを示した図である。以下、図20に沿ってこの処理を説明する。
まず、制御手段1020は、内部時計1030を参照し、前回更新情報の読み込みを行ってから所定の時間が経過したか否かを判断する(ステップS101)。ここで、所定の時間が経過したと判断された場合、制御手段1020は、更新情報読み込み手段1120に指示を与え、更新情報読み込み手段1120は、通信手段1110及びネットワーク300を通じてPINGサーバ装置700から更新情報を読み込んで一時メモリ1010に格納する(S102)。ここで更新情報としては、例えば、PINGサーバ装置700で公開されるChanges.Xmlフォーマットやblogホスティングサービス等で公開されるblog記事のサマリ情報(RSS(Rich Site Summary))等を例示できる。
[Details of score calculation processing]
FIG. 20 is a diagram illustrating a flow for explaining score calculation processing performed in the content search apparatus 1000 according to the present embodiment. Hereinafter, this process will be described with reference to FIG.
First, the control means 1020 refers to the internal clock 1030 and determines whether or not a predetermined time has elapsed since the last update information was read (step S101). Here, when it is determined that a predetermined time has elapsed, the control unit 1020 gives an instruction to the update information reading unit 1120, and the update information reading unit 1120 updates from the PING server apparatus 700 through the communication unit 1110 and the network 300. Information is read and stored in the temporary memory 1010 (S102). Here, as the update information, for example, summary information (RSS (Rich Site Summary)) of blog articles published by the Changes.Xml format published by the PING server apparatus 700, the blog hosting service, or the like can be exemplified.

次に、制御手段110は、一時メモリ1010に格納された更新情報を読み込み、これを用いて何れかのコンテンツサーバ装置600−1〜qに格納されたコンテンツ(blog記事)が更新されたか否かを判定する(ステップS103)。ここでコンテンツの更新がないと判断された場合には、制御手段110は、処理をステップS101に戻す。一方、コンテンツの更新があると判断された場合には、制御手段110は、コンテンツ情報読み込み手段1130に指示を与え、コンテンツ情報読み込み手段1130は、通信手段1110(コンテンツ情報受信手段)及びネットワーク300を通じ、コンテンツサーバ装置600−1〜qから更新されたコンテンツに関する情報を取得し、一時メモリ1010に格納する。尚、コンテンツサーバ装置(blogサイト等)600−1〜qを巡回(crawling)して記事を収集する方法・プログラムコードについては、例えば、文献「宮川達彦、伊藤直也著「BIog Hacks」、オライリー・ジャパン」に詳しく記載されている。   Next, the control unit 110 reads the update information stored in the temporary memory 1010, and using this, whether or not the content (blog article) stored in any of the content server devices 600-1 to 600-q has been updated. Is determined (step S103). If it is determined that there is no content update, the control unit 110 returns the process to step S101. On the other hand, when it is determined that the content is updated, the control unit 110 gives an instruction to the content information reading unit 1130, and the content information reading unit 1130 passes through the communication unit 1110 (content information receiving unit) and the network 300. Information regarding the updated content is acquired from the content server devices 600-1 to 600-q and stored in the temporary memory 1010. For the method and program code for collecting articles by crawling the content server devices (blog sites, etc.) 600-1 to q, for example, the documents “Tatsuhiko Miyagawa and Naoya Ito“ BIog Hacks ”, O'Reilly It is described in detail in “Japan”.

図22は、このように一時メモリ1010に格納されたコンテンツに関する情報であるブログ情報1500を例示した概念図である。尚、図22では、一人のblogger(利用者)に関するブログ情報のみを図示するが、実際はこれ以上のloggerに関するブログ情報が収集される。
この図に例示するように、この例のブログ情報1500は、blogサイトトップのURIであるサイトトップURI1510、blogサイトトップの記事1511、コンテンツ1520,1530を有する。また、コンテンツ1520,1530は、それぞれ、それが位置するリソースのURIであるブログURI1521、そのコンテンツ1520,1530を投稿した利用者の意思で設定したリンク先である通常リンクURI1522,1532、記事1523,1533、及びトラックバック機能に基づく逆リンク先であるトラックバックURI1524,1525,1534,1535,1536を有している。
FIG. 22 is a conceptual diagram exemplifying blog information 1500 that is information regarding the content stored in the temporary memory 1010 as described above. In FIG. 22, only the blog information related to one blogger (user) is illustrated, but actually more blog information related to the logger is collected.
As illustrated in this figure, the blog information 1500 in this example includes a site top URI 1510 that is a URI of the blog site top, an article 1511 of the blog site top, and contents 1520 and 1530. The contents 1520 and 1530 are a blog URI 1521 which is a URI of a resource where the contents 1520 and 1530 are located, normal link URIs 1522 and 1532 which are link destinations set by the user who posted the contents 1520 and 1530, and an article 1523, respectively. 1533, and trackback URIs 1524, 1525, 1534, 1535, and 1536, which are reverse link destinations based on the trackback function.

コンテンツ情報解析手段1140は、一時メモリ1010からこのようなコンテンツの情報を読み込み、これを解析して図23に例示するような情報をコンテンツ情報リスト1600として抽出し、これをDBMS等のテープルとしてコンテンツ情報格納手段1200に格納する。ここで、DocIDは、コンテンツ情報収集手段1100によって収集されたblog記事等のコンテンツに付与されるユニークなIDを格納するカラムである。また、URIは、コンテンツが公開されているリソースのURI(ブログURI1521,1531等)を格納するカラムである。ただし、コンテンツがblogサイトトップである場合には、そのURI(サイトトップURI1510等)がURIのカラムに格納される。keywordsは、収集されたblog記事(記事1511,1523,1533等)に対して形態素解析を施し、抽出された単語を格納するカラムである。また、blog−URIは、blog記事の属するblogサイトトップのURI(サイトトップURI1510等)を格納するカラムである。ただし、コンテンツがblogサイトトップ自身の場合には<nil>を格納する。また、Refer−URIは、blog記事の本文内で−般リンクとして参照している他のblog記事のURI(通常リンクURI1522,1532等)を格納するカラムである。ただし、−般リンクとして他のblog記事を参照していないコンテンツに対しては<nil>を格納し、複数のリンクを持つ場合には、複数のリンク先のURIを格納する。尚、図23の例では、トラックバックとして参照されているURI(トラックバックURI1524,1525,1534,1535,1536等)は格納しない。また、Dateは、巡回してblog記事を取得した日時を格納するカラムである。尚、blog記事を取得した日時は、例えば内部時計1030から出力される日時情報を用いる。Scoreは、後で述べるように情報評価装置1300によって計算されたスコアを格納するカラムである。ただし、コンテンツがblogサイトトップの場合には、そのblogger(利用者)に対する情報提供スコアを、コンテンツがblog記事の場合には、その記事の情報評判スコアを格納する。尚、情報評価スコアは、本形態では使用しない。また、既に述べたように、本システムでは、blogサイトトップのURI(blog−URIのカラムのURI)を利用者IDとして利用する。また、URI及びrefer−URIのカラムのURIをコンテンツIDとして利用する。また、blog−URIのカラムのデータは、請求項中の「コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報」に相当し、URIのカラムのデータは請求項中の「当該コンテンツのアドレスを示すコンテンツアドレス情報」に相当し、refer−URIのカラムのデータは、「他のコンテンツのアドレスを示すポインタ情報とを含む情報」に相当する。また、コンテンツ情報リスト1600のURIカラム、keywordsカラム、blog−URIカラム及びrefer−URIカラムのデータが請求項の「コンテンツ情報」に相当する。   The content information analysis means 1140 reads such content information from the temporary memory 1010, analyzes it, extracts information as illustrated in FIG. 23 as a content information list 1600, and uses this as a table such as a DBMS The information is stored in the information storage unit 1200. Here, DocID is a column that stores a unique ID assigned to content such as a blog article collected by the content information collection unit 1100. The URI is a column for storing the URI (blog URI 1521, 1531, etc.) of the resource whose contents are disclosed. However, if the content is the blog site top, the URI (site top URI 1510 or the like) is stored in the URI column. “keywords” is a column for storing extracted words after performing morphological analysis on collected blog articles (articles 1511, 1523, 1533, etc.). The blog-URI is a column for storing the URI of the blog site top to which the blog article belongs (site top URI 1510, etc.). However, if the content is the blog site top itself, <nil> is stored. The Refer-URI is a column for storing URIs of other blog articles that are referred to as general links in the body of the blog article (normal link URIs 1522, 1532, etc.). However, <nil> is stored for a content that does not refer to another blog article as a general link, and when there are a plurality of links, URIs of a plurality of link destinations are stored. In the example of FIG. 23, URIs referred to as trackbacks (trackback URIs 1524, 1525, 1534, 1535, 1536, etc.) are not stored. Date is a column that stores the date and time when the blog article was acquired by patrol. For example, date information output from the internal clock 1030 is used as the date when the blog article is acquired. The Score is a column for storing the score calculated by the information evaluation apparatus 1300 as will be described later. However, when the content is the blog site top, the information provision score for the blogger (user) is stored, and when the content is the blog article, the information reputation score of the article is stored. Note that the information evaluation score is not used in this embodiment. Further, as described above, this system uses the URI of the blog site top (the URI of the blog-URI column) as the user ID. The URI of the URI and refer-URI column is used as the content ID. The data in the blog-URI column corresponds to “content provider information that is information corresponding to the user who provided the content” in the claims, and the data in the URI column is “the content in question” in the claims. The data in the refer-URI column corresponds to “information including pointer information indicating the address of other content”. Further, the data of the URI column, the keywords column, the blog-URI column, and the refer-URI column of the content information list 1600 correspond to “content information” in the claims.

その後、制御手段1020において、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたか否かを判断する(ステップS106)。ここで、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されていないと判断された場合、制御手段1020はその処理をステップS101に戻す。一方、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたと判断された場合には、情報評価装置1300において、情報提供リンク情報と情報評価リンク情報とを生成する。そして、情報評価装置1300は、それらからスコアを算出し、コンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する(ステップS107)。尚、−定期間が経過したことを契機としてステップS107を実行することとしてよい。   Thereafter, the control means 1020 determines whether or not a predetermined number or more of content information before score calculation has been accumulated in the content information storage means 1200 (step S106). If it is determined that the content information before score calculation is not accumulated in the content information storage unit 1200 in a predetermined number or more, the control unit 1020 returns the process to step S101. On the other hand, if it is determined that a predetermined number or more of content information before score calculation is stored in the content information storage unit 1200, the information evaluation device 1300 generates information provision link information and information evaluation link information. Then, the information evaluation device 1300 calculates a score from them, and stores it in the content information storage unit 1200 in association with the content information (step S107). It should be noted that step S107 may be executed when the fixed period has elapsed.

[ステップS107の詳細]
まず、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとURIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(a)に記載されるような利用者IDとコンテンツIDの2つ組みが関連付けられた情報提供リンク情報1611〜1615を生成し、情報提供リンク格納手段102に格納する。また、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとrefer−URIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(b)に記載されるような利用者IDとコンテンツIDと評価情報との3つ組みが関連付けられた情報評価リンク情報1621〜1626を生成し、情報評価リンク格納手段103に格納する。
[Details of Step S107]
First, the information acquisition means 1301 extracts the blog-URI and URI column elements (content information) stored in the content information storage means 1200, and uses them to describe them in FIG. 24 (a). Information provision link information 1611 to 1615 in which two combinations of a user ID and a content ID are associated with each other are generated and stored in the information provision link storage unit 102. In addition, the information acquisition unit 1301 extracts the elements (content information) of the blog-URI and refer-URI columns stored in the content information storage unit 1200, and uses them to describe them in FIG. 24 (b). Information evaluation link information 1621 to 1626 associated with such a triplet of user ID, content ID, and evaluation information is generated and stored in the information evaluation link storage means 103.

図21は、これらの情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。以下この図に従って、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明する。
まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS111)。具体的には、例えば、スコアを算出するコンテンツ情報リスト1600の先頭のDocIDをvに代入する。
次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、一時メモリ1010から、v行目のblog−URIのカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のURIのカラムのデータ(コンテンツアドレス情報)をコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS112)、一時メモリ1010に格納する。尚、blog−URIのカラムのデータが<nil>である場合には、その行に対する情報提供リンク情報は生成しない。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS113)。
FIG. 21 is a diagram illustrating a flow for explaining details of the calculation processing of the information provision link information and the information evaluation link information. The details of the calculation processing of the information provision link information and the information evaluation link information will be described below with reference to this figure.
First, the control means 1020 substitutes an initial value for the variable v and stores it in the temporary memory 1010 (step S111). Specifically, for example, the top DocID of the content information list 1600 for calculating the score is substituted for v.
Next, the reading means 1301a reads the content information (see FIG. 23) of the v-th row from the content information storage means 1200 and stores it in the temporary memory 1010. Then, in the information provision link generation means 101e, the data (content provider information) in the v-th row blog-URI column is used as the user ID from the temporary memory 1010, and the data in the v-th URI column (content address). Information) as a content ID. And the information provision link production | generation means 101e produces | generates the information provision link information with which these were linked | related (step S112), and stores it in the temporary memory 1010. If the data in the blog-URI column is <nil>, the information provision link information for the row is not generated. Then, the writing unit 101g reads the information provision link information from the temporary memory 1010 and stores it in the information provision link storage unit 102 (step S113).

また、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のrefer−URIカラムのデータ(ポインタ情報)をコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータ(ポインタ情報)を含むか否かによって定まる値を評価情報として設定する。この例では、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含む場合、評価情報を+1と設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS114)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS115)。尚、この例のコンテンツ情報格納手段1200に格納されるコンテンツ情報リスト1600のrefer−URIのカラムには、トラックバックに基づくURIは格納されていない。よって、この例の情報評価リンク生成手段101fは、トラックバック以外のURI(ポインタ情報)を用いて情報評価リンク情報を生成することになる。尚、コンテンツ情報リスト1600の生成時に、トラックバックに基づくURIもコンテンツ情報リスト1600に含めることとし、情報評価リンク情報の生成時に、情報評価リンク生成手段101fがこのトラックバックに基づくURI以外の情報を用いて情報評価リンク情報を生成することとしてもよい。   Also, in the information evaluation link generation means 101f, the data (content provider information) in the v-th row-URI column is used as the user ID from the temporary memory 1010, and the data (pointer information) in the v-th refer-URI column. ) As a content ID. Further, the information evaluation link generation unit 101f sets, as evaluation information, a value determined by whether or not the content information list 1600 of the v-th row includes data (pointer information) in the refer-URI column. In this example, when the content information list 1600 in the v-th row includes the refer-URI column data, the evaluation information is set to +1. Then, the information evaluation link generation unit 101f generates information evaluation link information in which the extracted user ID, content ID, and evaluation information are associated with each other, and stores the information evaluation link information in the temporary memory 1010 (step S114). Then, the writing unit 101g reads this information evaluation link information from the temporary memory 1010 and stores it in the information evaluation link storage unit 103 (step S115). Note that the refer-URI column of the content information list 1600 stored in the content information storage unit 1200 of this example does not store a URI based on the trackback. Therefore, the information evaluation link generation unit 101f of this example generates information evaluation link information using a URI (pointer information) other than trackback. When the content information list 1600 is generated, the URI based on the trackback is also included in the content information list 1600, and when the information evaluation link information is generated, the information evaluation link generation unit 101f uses information other than the URI based on this trackback. Information evaluation link information may be generated.

次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値(コンテンツ情報リスト1600におけるDocIDカラムのデータの最大値)であるか否かを判断する(ステップS116)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS117)。一方、変数vがDocIDの最大値であれば、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。   Next, the control unit 1020 reads the variable v stored in the temporary memory 1010 and determines whether or not it is the maximum value of DocID (maximum value of data in the DocID column in the content information list 1600) ( Step S116). Here, if the variable v is not the maximum value of DocID, the control means 1020 calculates v + 1, stores the calculation result as a new variable v in the temporary memory 1010, and returns the process to step S112 ( Step S117). On the other hand, if the variable v is the maximum value of DocID, the calculation process of the information provision link information and the information evaluation link information ends.

その後、第1の実施の形態と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された、情報提供リンク情報及び情報評価リンクを用い、行列E,Cを生成する。そして、第1の実施の形態と同様に、固有ベクトル算出手段104cにおいて、行列E,Cからスコア推移行列Sの固有ベクトルを情報評判スコア又は情報提供スコアとして算出し、スコア算出手段104dにおいて他のスコアを算出する。尚、この例の第1の正規化手段104ca及び第2正規化手段104cbは、例えば前述の式(17)(18)又は式(19)(20)に従って行列E,Cを正規化し、演算手段104ccは、この正規化後の行列E,Cを用いてスコア推移行列Sの固有ベクトルを算出する。最後に、書き込み手段104eが、算出された各スコアを前述のようにコンテンツ情報リスト1600内に関連付けてコンテンツ情報格納手段1200に格納させる。   After that, as in the first embodiment, the information provision link stored in the information provision link storage means 102 and the information evaluation link storage means 103 in the first adjacency matrix generation means 104a and the second adjacency matrix generation means 104b. The matrices E and C are generated using the information and the information evaluation link. Then, as in the first embodiment, the eigenvector calculation means 104c calculates the eigenvector of the score transition matrix S from the matrices E and C as an information reputation score or information provision score, and the score calculation means 104d obtains another score. calculate. Note that the first normalization means 104ca and the second normalization means 104cb in this example normalize the matrices E and C according to, for example, the above-described equations (17), (18) or (19), (20), and calculate the calculation means. 104 cc calculates the eigenvector of the score transition matrix S using the normalized matrices E and C. Finally, the writing unit 104e associates the calculated scores with the content information list 1600 as described above and stores them in the content information storage unit 1200.

[コンテンツ情報検索処理の詳細]
次に、コンテンツ情報検索手段1400が行うコンテンツ情報検索処理の詳細について説明する。
図25は、このコンテンツ情報検索処理の詳細を説明するためのフローを示した図である。以下、この図を用い、コンテンツ情報検索処理の詳細を説明する。
この例の場合、まず、−般的なApache等のwebサーバ装置(図示せず)とHTTPプロトコルとを用い、利用者端末装置500−1〜pに検索語の入力を促進する画面を表示させる。利用者端末装置500−1〜pの利用者は、これに従い利用者端末装置500−1〜pに検索語(検索条件)を入力し、これを含むメッセージを、ネットワーク300を通じてコンテンツ検索装置1000に送信する。コンテンツ情報検索手段1400の受信手段1410(図19)は、この利用者端末装置500−1〜pから送信された検索語を含むメッセージを受信し(ステップS121)、一時メモリ1010に格納する。
[Details of content information search processing]
Next, details of content information search processing performed by the content information search means 1400 will be described.
FIG. 25 is a diagram showing a flow for explaining details of the content information search processing. Hereinafter, details of the content information search processing will be described with reference to FIG.
In the case of this example, first, using a general web server device such as Apache (not shown) and the HTTP protocol, the user terminal devices 500-1 to 500-p are displayed with a screen for promoting the input of a search term. . The users of the user terminal devices 500-1 to 500-p input search words (search conditions) to the user terminal devices 500-1 to 500-p in accordance with this, and send messages including this to the content search device 1000 via the network 300. Send. The receiving means 1410 (FIG. 19) of the content information searching means 1400 receives the message including the search word transmitted from the user terminal devices 500-1 to 500-p (step S121) and stores it in the temporary memory 1010.

次に、コンテンツ情報検索手段1420において、一時メモリ1010から上述の検索語を読み出し、コンテンツ情報格納手段1200に格納されているコンテンツ情報の中から当該検索語で指定された条件を充足するすべてのコンテンツ情報を検索する。そして、コンテンツ情報検索手段1420は、この条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段1200から抽出し一時メモリ1010に格納する(ステップS122)。具体的には、例えば、コンテンツ情報検索手段1420は、一時メモリ1010から上述の検索語を読み出し、その検索語をキーとしてコンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)のKeywordsカラムを検索する。そして、コンテンツ情報検索手段1420は、この検索語と一致する語が存在するすべてのコンテンツ情報リスト1600のレコード(Scoreのカラム情報含む)を読み出し、一時メモリ1010に格納する。   Next, in the content information search means 1420, all the contents satisfying the condition specified by the search word from the content information stored in the content information storage means 1200 by reading the search word from the temporary memory 1010. Search for information. Then, the content information search means 1420 extracts the content information satisfying this condition from the content information storage means 1200 together with at least one of the information reputation score and the information provision score associated therewith and stores it in the temporary memory 1010 (step S122). Specifically, for example, the content information search unit 1420 reads the above-described search word from the temporary memory 1010 and searches the Keywords column of the content information list 1600 (FIG. 23) of the content information storage unit 1200 using the search word as a key. To do. Then, the content information search unit 1420 reads all the records (including the column information of the score) of the content information list 1600 in which a word matching the search word exists, and stores it in the temporary memory 1010.

次に、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010からステップS122で抽出されたレコードを、例えば情報評判スコアの値をキーとしてソートすることでコンテンツ情報提供リストを生成し、これを含むメッセージを一時メモリ1010に格納する(ステップS123)。具体的には、この例のコンテンツ提供情報リスト生成手段1430は、このコンテンツ情報リストに、利用者端末装置500−1〜pがwebブラウザを用いてこのリストを表示するために必要なHTMLタグを付与したメッセージを生成する。
その後、送信手段1440において、一時メモリ1010からステップS123で生成されたメッセージを読み込み、これを検索語に対する検索結果として、当該検索語を送信した利用者端末装置500−1〜pに送信する(ステップS124)。利用者端末装置500−1〜pは、このメッセージを受信し、例えばwebブラウザを用い、メッセージが有するコンテンツ情報リストを検索結果画面として表示する。
Next, the content information provision list generation unit 1430 generates a content information provision list by sorting the records extracted from the temporary memory 1010 in step S122 using, for example, the information reputation score value as a key, and a message including the list. Is stored in the temporary memory 1010 (step S123). Specifically, the content provision information list generation means 1430 of this example adds HTML tags necessary for the user terminal devices 500-1 to 500-p to display this list using the web browser. Generate the assigned message.
Thereafter, the transmission unit 1440 reads the message generated in step S123 from the temporary memory 1010, and transmits the message as a search result for the search term to the user terminal devices 500-1 to 500-p that have transmitted the search term (step S1440). S124). The user terminal devices 500-1 to 500-p receive this message and display a content information list included in the message as a search result screen using, for example, a web browser.

<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。
例えば、情報提供リンク生成手段101eが、コンテンツ情報格納手段1200に格納された全てのレコードに対して情報提供リンク情報を生成するのではなく、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成することとしてもよい。
図26は、この変形例に対応するスコア計算手段2104の構成を例示した図である。また、図27は、この変形例の処理を説明するためのフローを示した図である。
この変形例の場合、スコア計算手段104の代わりにスコア計算手段2104が配置される。また、前述した図21の処理の代わりに図27の処理が実行される。すなわち、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS131)。次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行(レコード)が存在するか否かを検索する(ステップS132)。
<Modifications>
The present invention is not limited to the embodiment described above.
For example, the information provision link generation unit 101e does not generate the information provision link information for all the records stored in the content information storage unit 1200, but only the information provision link information corresponding to the content for which the evaluation exists. It may be generated.
FIG. 26 is a diagram illustrating the configuration of score calculation means 2104 corresponding to this modification. FIG. 27 is a diagram illustrating a flow for explaining the processing of this modification.
In the case of this modification, a score calculation unit 2104 is arranged instead of the score calculation unit 104. In addition, the process of FIG. 27 is executed instead of the process of FIG. 21 described above. That is, first, the control means 1020 assigns an initial value to the variable v and stores it in the temporary memory 1010 (step S131). Next, the reading means 1301a reads the content information (see FIG. 23) of the v-th row from the content information storage means 1200 and stores it in the temporary memory 1010. Then, the information providing link generation unit 101e searches for another row (record) having the value of the URI column of the content information of the v-th row as the value of the refer-URI column (step S132).

ここで、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行が存在すると判断された場合、情報提供リンク生成手段101eは、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のURIカラムのデータをコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS133)、一時メモリ1010に格納する。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS134)。一方、ステップS132でv行目のコンテンツ情報におけるURIカラムの値を、refer−URIカラムにおける値とする他の行が存在しない判断された場合、情報提供リンク生成手段101eは、v行目のコンテンツ情報を用いた情報提供リンク情報の生成は行わない。   Here, when it is determined that there is another row with the value of the URI column of the content information of the v-th row as the value of the refer-URI column, the information provision link generation unit 101e reads the v-th row from the temporary memory 1010. The blog-URI column data is read as the user ID, and the v-th row URI column data is read as the content ID. And the information provision link production | generation means 101e produces | generates the information provision link information with which these were linked | related (step S133), and stores it in the temporary memory 1010. Then, the writing unit 101g reads the information provision link information from the temporary memory 1010 and stores it in the information provision link storage unit 102 (step S134). On the other hand, if it is determined in step S132 that there is no other row in which the value of the URI column in the content information of the v-th row is the value in the refer-URI column, the information providing link generation unit 101e The information providing link information using the information is not generated.

次に、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のrefer−URIカラムのデータをコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含むか否かによって定まる値を評価情報として設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS135)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS136)。   Next, the information evaluation link generation unit 101f reads from the temporary memory 1010 the data in the blog-URI column of the vth row as the user ID and the data of the refer-URI column in the vth row as the content ID. Further, the information evaluation link generation unit 101f sets, as evaluation information, a value that is determined depending on whether or not the content information list 1600 of the v-th row includes data of the refer-URI column. Then, the information evaluation link generation unit 101f generates information evaluation link information in which the extracted user ID, content ID, and evaluation information are associated with each other, and stores the information evaluation link information in the temporary memory 1010 (step S135). Then, the writing unit 101g reads this information evaluation link information from the temporary memory 1010 and stores it in the information evaluation link storage unit 103 (step S136).

次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS137)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS138)。一方、変数vがDocIDの最大値であれば、制御手段1020は、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。
その後、情報評判スコア推定手段2104f(図26)において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとしてコンテンツ情報格納手段1200に出力し、格納することとしてもよい。
Next, the control means 1020 reads the variable v stored in the temporary memory 1010, and determines whether or not it is the maximum value of DocID (step S137). Here, if the variable v is not the maximum value of DocID, the control means 1020 calculates v + 1, stores the calculation result as a new variable v in the temporary memory 1010, and returns the process to step S112 ( Step S138). On the other hand, if the variable v is the maximum value of DocID, the control means 1020 ends the calculation process of the information provision link information and the information evaluation link information.
Thereafter, in the information reputation score estimation means 2104f (FIG. 26), the calculation result of the function depending on the information provision score of the user and the number of contents provided by the user is evaluated as the content provided by the user. May be output to the content information storage unit 1200 and stored as an information reputation score.

図28は、この場合の情報評判スコア推定手段2104fの処理を説明するためのフローの例示である。
この場合、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS141)。次に情報評判スコア推定手段2104fは、例えば、コンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600(図23参照)のscoreカラムにデータが格納されているか否かを判断する(ステップS142)。
FIG. 28 is an example of a flow for explaining the processing of the information reputation score estimating means 2104f in this case.
In this case, first, the control means 1020 assigns an initial value to the variable v and stores it in the temporary memory 1010 (step S141). Next, the information reputation score estimation unit 2104f determines whether or not data is stored in the score column of the content information list 1600 of the v-th row stored in the content information storage unit 1200 (see FIG. 23), for example (see FIG. 23). Step S142).

ここで、データが格納されていないと判断された場合、情報評判スコア推定手段2104fは、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のURIカラムを検索する。そして、情報評判スコア推定手段2104fは、このキーとURIカラムの値とが一致した行のScoreカラムの値をaに代入し、このa(利用者の情報提供スコア)を一時メモリ1010に格納する(ステップS143)。次に、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のblog−URIカラムのすべての行を検索し、blog−URIカラムの値がv行目のblog−URIカラムの値に等しい行の数を数え、それをn(当該利用者が提供したコンテンツ数)として一時メモリ1010に格納する(ステップS144)。次に、情報評判スコア推定手段2104fは、一時メモリ1010からaとnとを読み出し、aとnとに依存した関数の演算を行う。そして、情報評判スコア推定手段2104fは、この演算結果(当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコア)を、v行目のコンテンツ情報リスト1600のScoreカラムに格納する(ステップS145)。尚、aとnとに依存した関数としては、例えば、r=a/sqrt(n)を例示できる。ここでsqrt(X)はXの平方根を返す関数である。また、aはコンテンツjを提供したコンテンツ提供者vの情報提供スコアに相当し、nはコンテンツ提供者vのコンテンツ提供数に相当する。 If it is determined that no data is stored, the information reputation score estimation unit 2104f searches the URI column of the content information list 1600 using the value of the blog-URI column of the content information list 1600 of the v-th row as a key. To do. The information reputation score estimator 2104f sets the value of the Score column on the line and the value of this key and URI column matches substituted into a v, in the a v (user of the information providing scores) temporary memory 1010 Store (step S143). Next, all the rows of the blog-URI column of the content information list 1600 are searched using the value of the blog-URI column of the content information list 1600 of the v-th row as a key, and the value of the blog-URI column is the blog of the v-th row. counting the number of rows equal to the value of -URI column, and stores it in n v temporary memory 1010 as (the user number of contents provided) (step S144). Next, the information reputation score estimator 2104f the temporary reads the a v and n v from the memory 1010, it performs the calculation of the function that depends on the a v and n v. Then, the information reputation score estimating means 2104f stores this calculation result (information reputation score of the content provided by the user and having no evaluation) in the Score column of the content information list 1600 in the v-th row ( Step S145). As the function that depends on the a v and n v, for example, can be exemplified r j = a v / sqrt ( n v). Here, sqrt (X) is a function that returns the square root of X. Further, a v corresponds to the information providing scores of content provider v that provided the content j, n v is equivalent to the number of providing the content of the content provider v.

ステップS145が終了した場合、或いは、ステップS142の判断においてコンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600のscoreカラムにデータが格納されていると判断された場合、制御手段1020は、以下のステップS146の処理を実行する。
まず、制御手段1020は、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS146)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS142に戻す(ステップS147)。一方、変数vがDocIDの最大値であれば処理を終了する。
このような情報評判スコアの計算手法を採ることにより、blog記事のようにほとんどのコンテンツに対してリンクが張られていない(=情報評価リンク情報がない)場合に、情報評価装置1300による計算対象のコンテンツ数を著しく減少させることができる。その結果、高速なスコアの算出が可能となる。
When step S145 is completed, or when it is determined in step S142 that data is stored in the score column of the content information list 1600 of the v-th row stored in the content information storage unit 1200, the control unit 1020 Performs the following step S146.
First, the control means 1020 reads the variable v stored in the temporary memory 1010, and determines whether or not it is the maximum value of DocID (step S146). Here, if the variable v is not the maximum value of DocID, the control means 1020 calculates v + 1, stores the calculation result as a new variable v in the temporary memory 1010, and returns the process to step S142 ( Step S147). On the other hand, if the variable v is the maximum value of DocID, the process ends.
By adopting such an information reputation score calculation method, when a link is not made to almost all contents like a blog article (= no information evaluation link information), an object to be calculated by the information evaluation apparatus 1300 The number of contents can be significantly reduced. As a result, high-speed score calculation is possible.

また、コンテンツ情報検索手段が、検索語に関連する記事を検索するのではなく、検索語に関連するコンテンツ提供者(blogに適用した場合にはblogger)を検索して出力することとしてもよい。これにより、利用者は、検索語に関連するオピニオンリーダのblogサイトを見つけることができる。そして、この利用者は、オピニオンリーダのblogサイトの記事を読むことで、検索語に関連した網羅的な知識を習得することが可能となる。このような検索語に関連する情報提供者のコンテンツ提供者リストを生成する一つの方法は、検索語を含むコンテンツを1件でも書いたコンテンツ提供者のリストを作成し、それを情報提供スコアでソートするという方法である。しかし、情報提供スコアは、検索語が与えられる前に、一定時間間隔等を契機に事前に情報提供リンク情報と情報評価リンク情報を抽出して計算されているものである。そのため、この情報提供スコアの値と関連語との関連性は低い。従って、情報提供スコアによって検索結果のコンテンツ提供者リストをソートした場合、高い情報提供スコアを持つ情報提供者がたまたま1件の関連語を含む記事を記載すると直ちにコンテンツ提供者リストの上位になってしまう可能性がある。   The content information search means may search for and output a content provider (blogger when applied to blog) related to the search word, instead of searching for an article related to the search word. Thereby, the user can find the blog site of the opinion leader related to the search term. And this user can acquire the comprehensive knowledge relevant to a search word by reading the blog site of an opinion reader. One method of generating a content provider list of information providers related to such a search term is to create a list of content providers in which at least one content including the search term is written, and use it as an information provision score. It is a method of sorting. However, the information provision score is calculated by extracting the information provision link information and the information evaluation link information in advance at a predetermined time interval before a search word is given. Therefore, the relevance between the value of the information provision score and the related word is low. Therefore, when the content provider list of the search result is sorted by the information provision score, if an information provider having a high information provision score happens to write an article containing one related word, it immediately becomes higher in the content provider list. There is a possibility.

そこでこの例の情報評判スコア集計手段は、検索語の条件を充足する複数のコンテンツの情報評判スコアをコンテンツ提供者毎に集計し、この集計したスコアに基づいて、その検索語に関する記事を書いたコンテンツ提供者のリストをソートし、コンテンツ提供者リストを生成する。そして、この例の情報評判スコア集計手段は、このコンテンツ提供者リストを検索語に対する検索結果として利用者端末装置500−1〜pに送信する。
図29は、このようなコンテンツ情報検索手段2400の構成を例示した図である。また、図30は、コンテンツ情報検索手段2400の処理を説明するためのフローを例示した図である。
Therefore, the information reputation score counting means in this example totals information reputation scores of a plurality of contents satisfying the search term condition for each content provider, and based on the total score, wrote an article about the search term. Sort the list of content providers to generate a content provider list. And the information reputation score totaling means of this example transmits this content provider list to the user terminal devices 500-1 to 500-p as a search result for the search word.
FIG. 29 is a diagram illustrating the configuration of such content information search means 2400. FIG. 30 is a diagram illustrating a flow for explaining the processing of the content information search means 2400.

コンテンツ情報検索手段2400は、受信手段1410において、検索語を含む検索条件を受信すると(ステップS151)、一時メモリ1010にその検索条件のデータを格納する。次に、コンテンツ情報検索手段1420において、一時メモリ1010から検索条件のデータを読み出し、コンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)から、keywordsカラムのデータがこの検索条件を充足し、blog−URIのカラムが<nil>でない全てのコンテンツ情報の行を、それらに関連付けられている情報評判スコア(Scoreカラムのデータ)とともに抽出し、それらを関連付けて一時メモリ1010に格納する(ステップS152)。次に、情報評判スコア集計手段2450が、一時メモリ1010に格納された情報評判スコアを、それに関連付けられたコンテンツ情報のblog−URIカラムの値(コンテンツ提供者情報)毎に加算する。そして、情報評判スコア集計手段2450は、この加算値と対応するblog−URIカラムの値とを一時メモリ1010に出力して格納する(ステップS153)。その後、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010から、加算値と、それに対応するblog−URIカラムの値とを読み出し、加算値をキーとしてblog−URIカラムの値を並び替えて生成したリストを含むメッセージを生成し、一時メモリ1010に格納する。さらに、このメッセージは、一時メモリ1010から送信手段1440に送られ、送信手段144は、このメッセージを、検索条件を送信した利用者端末装置500−1〜pに送信する。
その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
When the receiving unit 1410 receives a search condition including a search word (step S151), the content information search unit 2400 stores the search condition data in the temporary memory 1010. Next, the content information search unit 1420 reads the search condition data from the temporary memory 1010, and the data in the keywords column satisfies the search condition from the content information list 1600 (FIG. 23) of the content information storage unit 1200. -All content information rows whose URI column is not <nil> are extracted together with the information reputation score (Score column data) associated with them, and stored in the temporary memory 1010 in association with each other (step S152). . Next, the information reputation score totaling unit 2450 adds the information reputation score stored in the temporary memory 1010 for each blog-URI column value (content provider information) of the content information associated therewith. Then, the information reputation score totaling means 2450 outputs the added value and the value of the corresponding blog-URI column to the temporary memory 1010 and stores it (step S153). After that, the content information provision list generation unit 1430 reads the added value and the corresponding blog-URI column value from the temporary memory 1010, and rearranges the blog-URI column value using the added value as a key. A message including the list is generated and stored in the temporary memory 1010. Further, this message is sent from the temporary memory 1010 to the transmission unit 1440, and the transmission unit 144 transmits this message to the user terminal devices 500-1 to 500-p that transmitted the search condition.
Needless to say, other modifications are possible without departing from the spirit of the present invention.
Further, when the above-described configuration is realized by a computer, processing contents of functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
The program describing the processing contents can be recorded on a computer-readable recording medium. The computer-readable recording medium may be any medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, or a semiconductor memory. Specifically, for example, the magnetic recording device may be a hard disk device or a flexible Discs, magnetic tapes, etc. as optical disks, DVD (Digital Versatile Disc), DVD-RAM (Random Access Memory), CD-ROM (Compact Disc Read Only Memory), CD-R (Recordable) / RW (ReWritable), etc. As the magneto-optical recording medium, MO (Magneto-Optical disc) or the like can be used, and as the semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory) or the like can be used.
The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。尚、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

図1は、第1の実施の形態における情報評価システムの構成を示す図である。FIG. 1 is a diagram showing the configuration of the information evaluation system in the first embodiment. 図2は、図1における情報取得手段の詳細構成を例示した図である。FIG. 2 is a diagram illustrating a detailed configuration of the information acquisition unit in FIG. 図3は、図1におけるスコア計算手段の詳細構成を例示した図である。FIG. 3 is a diagram illustrating a detailed configuration of the score calculation means in FIG. 図1におけるスコア出力手段の詳細構成を例示した図である。It is the figure which illustrated the detailed structure of the score output means in FIG. 図5は、情報取得手段の処理の詳細を説明するためのフローを示す図である。FIG. 5 is a diagram illustrating a flow for explaining details of processing of the information acquisition unit. 図6(a)は、このように受信されるコンテンツ提供メッセージのデータ構成の例示であり、図6(b)はコンテンツ評価メッセージの例である。FIG. 6A shows an example of the data structure of the content providing message received in this way, and FIG. 6B shows an example of the content evaluation message. 図7(a)は、情報提供リンク情報のデータ構成を例示する図である。図7(b)は、情報評価リンク情報のデータ構成を示す図である。FIG. 7A is a diagram illustrating a data configuration of information providing link information. FIG. 7B is a diagram illustrating a data configuration of the information evaluation link information. 利用者からコンテンツに対する2種類のリンクを示した概念図である。It is the conceptual diagram which showed two types of links with respect to a content from a user. 図9は、スコア計算手段の処理を説明するためのフローを例示した図である。FIG. 9 is a diagram illustrating a flow for explaining the processing of the score calculation means. 図10(a)は、情報評判スコア格納手段が管理するデータ構造図である。図10(b)は、情報提供スコア格納手段および情報評価スコア格納手段が管理するデータ構造図である。FIG. 10A is a data structure diagram managed by the information reputation score storage means. FIG. 10B is a data structure diagram managed by the information provision score storage means and the information evaluation score storage means. 図11は、スコア出力手段の処理の詳細を説明するためのフローを示す図である。FIG. 11 is a diagram showing a flow for explaining details of processing of the score output means. 図12(a)は、スコア計算手段の反復計算手順を行列表現で示す図である。図12(b)は、スコア計算手段の反復計算手順を要素表現で示す図である。FIG. 12A is a diagram showing the iterative calculation procedure of the score calculation means in matrix expression. FIG. 12B is a diagram showing the iterative calculation procedure of the score calculation means in element expression. 図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。FIG. 13 is a diagram illustrating a flow for explaining processing when r, a, and h are calculated by the algorithm of FIG. 図14は、第2の実施の形態におけるコンテンツ検索システムの構成を示す図である。FIG. 14 is a diagram illustrating a configuration of a content search system according to the second embodiment. 図15は、図14のコンテンツ情報収集手段の詳細構成を例示した図である。FIG. 15 is a diagram illustrating a detailed configuration of the content information collection unit of FIG. 図16は、図14の情報評価装置の詳細構成を例示した図である。FIG. 16 is a diagram illustrating a detailed configuration of the information evaluation apparatus in FIG. 図17は、図16の情報取得手段の詳細構成を例示した図である。FIG. 17 is a diagram illustrating a detailed configuration of the information acquisition unit in FIG. 図18は、図16におけるスコア計算手段の詳細構成を例示した図である。FIG. 18 is a diagram illustrating a detailed configuration of the score calculation means in FIG. 図19は、図14におけるコンテンツ情報検索手段の詳細構成を例示した図である。FIG. 19 is a diagram illustrating a detailed configuration of the content information search means in FIG. 図20は、第2の実施の形態のスコア算出処理を説明するためのフローを示した図である。FIG. 20 is a diagram illustrating a flow for explaining the score calculation processing according to the second embodiment. 図21は、第2の実施の形態における、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。FIG. 21 is a diagram illustrating a flow for explaining details of the calculation processing of the information provision link information and the information evaluation link information in the second embodiment. 図22は、ブログ情報を例示した概念図である。FIG. 22 is a conceptual diagram illustrating blog information. 図23は、コンテンツ情報リストを例示した概念図である。FIG. 23 is a conceptual diagram illustrating a content information list. 図24(a)は、情報提供リンク情報のデータ構成を例示する図である。図24(b)は、情報評価リンク情報のデータ構成を示す図である。FIG. 24A is a diagram illustrating a data configuration of information providing link information. FIG. 24B shows the data structure of the information evaluation link information. 図25は、コンテンツ情報検索処理の詳細を説明するためのフローを示した図である。FIG. 25 is a diagram illustrating a flow for explaining details of the content information search processing. 図26は、スコア計算手段の変形例の構成を例示した図である。FIG. 26 is a diagram illustrating a configuration of a modified example of the score calculation means. 図27は、スコア計算手段の処理の変形例を説明するためのフローを示した図である。FIG. 27 is a diagram illustrating a flow for explaining a modification of the processing of the score calculation unit. 図28は、情報評判スコア推定手段の処理を説明するためのフローの例示である。FIG. 28 is an example of a flow for explaining the processing of the information reputation score estimating means. 図29は、コンテンツ情報検索手段の変形例の構成を例示した図である。FIG. 29 is a diagram illustrating a configuration of a modified example of the content information search means. 図30は、コンテンツ情報検索手段の処理の変形例を説明するためのフローを例示した図である。FIG. 30 is a diagram illustrating a flow for explaining a modification of the processing of the content information search means.

符号の説明Explanation of symbols

1 情報評価システム
100 情報評価装置
200−1〜m,500−1〜p 利用者端末装置
300 ネットワーク
600−1〜q コンテンツサーバ装置
1000 コンテンツ検索装置
DESCRIPTION OF SYMBOLS 1 Information evaluation system 100 Information evaluation apparatus 200-1 to m, 500-1 to p User terminal apparatus 300 Network 600-1 to q Content server apparatus 1000 Content search apparatus

Claims (7)

利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア算出する情報評価装置において、
コンテンツ提供者の利用者IDと、当該コンテンツ提供者によって提供されたコンテンツの識別子であるコンテンツIDと、の組を有する情報提供リンク情報を格納する情報提供リンク格納手段と、
コンテンツ評価者の利用者IDと、当該コンテンツ評価者によって評価されたコンテンツの識別子であるコンテンツIDと、当該コンテンツ評価者当該コンテンツに対して行った評価の数値情報である評価情報と、の組を有する情報評価リンク情報を格納する情報評価リンク格納手段と、
用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報提供リンク情報が前記情報提供リンク格納手段に格納されているか否かを示す数値を、当該利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報提供リンク隣接行列を生成して出力する第1隣接行列生成手段と、
用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとのを有する情報評価リンク情報が有する評価情報の値を、当該コンテンツ評価者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報評価リンク隣接行列を生成して出力する第2隣接行列生成手段と、
αを0以上1以下の実数とし、βをβの転置行列とした場合における、
S=αCC+(1−α)E
の計算によってスコア推移行列Sを算出し、当該スコア推移行列の固有ベクトルを算出し、この固有ベクトルの要素を前記情報評判スコアとして出力する固有ベクトル算出手段と、
前記情報評判スコアを、情報評判スコア格納手段格納させる書き込み手段と、を有する、
ことを特徴とする情報評価装置。
In an information evaluation device that calculates an information reputation score that quantifies the reputation of content that is electronic information provided by a user,
A user ID of the content provider, and the information providing link storage means for storing a content ID, the set information providing link information having the an identifier of content provided by the content provider,
A user ID of the content evaluator, a content ID is an identifier of the content evaluated by the content evaluator, and evaluation information is numerical information, reviews the content evaluator performed with respect to the content, a set Information evaluation link storage means for storing information evaluation link information having
For each set of a Subscriber ID and the content ID, a numerical value indicating whether or not the information providing link information having a set of the said user ID and the content ID is stored in the information providing link storage means, the use First adjacency matrix generation means for generating and outputting an information provision link adjacency matrix C as a matrix element corresponding to a set of a person ID and the content ID ;
For each set of a Subscriber ID and the content ID, the value of the evaluation information information evaluation link information having a set of the said user ID and the content ID has a user ID and the content ID of the content evaluator Second adjacency matrix generation means for generating and outputting an information evaluation link adjacency matrix E as matrix elements corresponding to the set of
When α is a real number between 0 and 1 and β T is a transposed matrix of β,
S = αC TC + (1-α) E T E
Eigenvector calculation means for calculating a score transition matrix S by calculating the eigenvector r of the score transition matrix S , and outputting an element of the eigenvector r as the information reputation score;
Writing means for storing the information reputation score in an information reputation score storage means ;
An information evaluation apparatus characterized by that.
請求項に記載の情報評価装置であって、
前記固有ベクトル算出手段が、
前記情報提供リンク隣接行列の各要素を、同一の前記コンテンツ提供者の利用者IDに対応する要素の集合毎に定まる第1関数によって正規化し、当該正規化された情報提供リンク隣接行列を出力する第1正規化手段と、
前記情報評価リンク隣接行列の各要素を、同一の前記コンテンツ評価者の利用者IDに対応する要素の集合毎に定まる第2関数によって正規化し、当該正規化された情報評価リンク隣接行列を出力する第2正規化手段と、
前記正規化された情報提供リンク隣接行列と前記正規化された情報評価リンク隣接行列とを用いて前記スコア推移行列Sを算出し、当該スコア推移行列Sの前記固有ベクトルを算出し、この固有ベクトルの要素を前記情報評判スコアとして出力する演算手段と、を有する手段であ
前記第1関数は、前記情報提供リンク格納手段において前記利用者IDと組をなす前記コンテンツIDの数に依存した関数であり、
前記第2関数は、前記情報評価リンク格納手段において前記利用者IDと組をなす前記コンテンツIDの数に依存した関数である、
ことを特徴とする情報評価装置。
The information evaluation device according to claim 1 ,
The eigenvector calculating means is
Each element of the information provision link adjacency matrix C is normalized by a first function determined for each set of elements corresponding to the same user ID of the content provider, and the normalized information provision link adjacency matrix is output. First normalizing means to
Each element of the information evaluation link adjacency matrix E is normalized by a second function determined for each set of elements corresponding to the same user ID of the content evaluator, and the normalized information evaluation link adjacency matrix is output. A second normalization means to:
The score transition matrix S is calculated using the normalized information provision link adjacency matrix C and the normalized information evaluation link adjacency matrix E, and the eigenvector r of the score transition matrix S is calculated. calculating means for outputting the elements of the eigenvector r as the information reputation score, Ri means der having,
The first function is a function depending on the number of the content IDs paired with the user ID in the information provision link storage unit,
The second function is a function depending on the number of the content IDs paired with the user ID in the information evaluation link storage unit.
An information evaluation apparatus characterized by that.
コンテンツサーバ装置に格納されたコンテンツに関する情報を提供するコンテンツ検索装置であって、
ブログサイトのサイトトップのURIと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIと、当該ブログ記事と、当該ブログ記事が参照している他のブログ記事のURIとを含むコンテンツ受信するコンテンツ情報受信手段と、
前記ブログサイトのサイトトップのURIと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIと、当該ブログ記事から抽出されたキーワードと、当該ブログ記事が参照している他のブログ記事のURIとを対応付けたコンテンツ情報のリストであるコンテンツ情報リストを格納するコンテンツ情報格納手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報リストから、前記ブログサイトのサイトトップのURIをコンテンツ提供者の利用者IDとして抽出し、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIを前記コンテンツ提供者によって提供されたコンテンツのコンテンツIDとして抽出し、当該コンテンツ提供者の利用者IDと当該コンテンツIDとの組を有する情報提供リンク情報を生成して出力する情報提供リンク生成手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報リストから、前記ブログサイトのサイトトップのURIをコンテンツ評価者の利用者IDとして抽出し、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事が参照している他のブログ記事のURIを当該コンテンツ評価者によって評価されたコンテンツのコンテンツIDとして抽出し、当該コンテンツ評価者の利用者IDと、当該コンテンツ評価者によって評価されたコンテンツのコンテンツIDと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事が参照している他のブログ記事のURIが存在するか否かによって定まる数値情報である評価情報と、の組を有する情報評価リンク情報を生成して出力する情報評価リンク生成手段と、
前記情報提供リンク情報を格納する情報提供リンク格納手段と、
前記情報評価リンク情報を格納する情報評価リンク格納手段と、
用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報提供リンク情報が前記情報提供リンク格納手段に格納されているか否かを示す数値を、当該コンテンツ提供者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報提供リンク隣接行列Cを生成して出力する第1隣接行列生成手段と、
用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報評価リンク情報が有する評価情報の値を、当該コンテンツ評価者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報評価リンク隣接行列Eを生成して出力する第2隣接行列生成手段と、
αを0以上1以下の実数とし、β をβの転置行列とした場合における、
S=αC C+(1−α)E
の計算によって前記スコア推移行列Sを算出し、当該スコア推移行列Sの固有ベクトルrを算出し、この固有ベクトルrの要素を各コンテンツ情報に対応する情報評判スコアとして出力する固有ベクトル算出手段と、
前記情報評判スコアを、それに対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させる書き込み手段と、
利用者端末装置から送信された検索を受信する検索条件受信手段と、
前記検索用いて前記コンテンツ情報リストを検索し、前記検索語と一致する前記キーワードを含む前記コンテンツ情報を、それらに関連付けられた前記情報評判スコアとともに前記コンテンツ情報格納手段から抽出する検索手段と、を備える、
ことを特徴とするコンテンツ検索装置。
A content search device that provides information about content stored in a content server device,
Includes the URI of the site top of the blog site, the URI of the blog article of the blog site linked to the site top of the blog site, the URI of the blog article, and the other blog articles referenced by the blog article Content information receiving means for receiving content;
The URI of the site top of the blog site, the URI of the blog article of the blog site linked to the site top of the blog site, the keyword extracted from the blog article, and other blogs referenced by the blog article Content information storage means for storing a content information list that is a list of content information associated with the URI of an article ;
From the content information list stored in the content information storage unit, the blog site top URI sites extracted by the user ID of the content provider, of the blog site that links to a site top of the blog site the URI of posts extracted by the content ID of the content provided by the content provider generates and outputs the information providing link information having a set of the user ID and the content ID of the content provider An information providing link generating means;
From the content information list stored in the content information storage unit, the blog site top URI sites extracted by the user ID of the content evaluator, of the blog site that links to a site top of the blog site the URI of the other blog post blog post is referring extracted by the content ID of the content that has been evaluated by the content evaluator, and the user ID of the content evaluator, it has been evaluated by the content evaluator and the content ID of the content, and the evaluation information is a numerical value information which is determined by whether or not the blog site other blog post URI that blog post is a reference to link to the site top of the blog site exists, set information evaluation link students to generate and output the information evaluation link information with a And means,
Information providing link storage means for storing the information providing link information;
Information evaluation link storage means for storing the information evaluation link information;
For each set of a Subscriber ID and the content ID, a numerical value indicating whether or not the information providing link information having a set of the said user ID and the content ID is stored in the information providing link storage means, the contents First adjacency matrix generation means for generating and outputting an information provision link adjacency matrix C as a matrix element corresponding to a set of a provider user ID and the content ID;
For each set of a Subscriber ID and the content ID, the value of the evaluation information information evaluation link information having a set of the said user ID and the content ID has a user ID and the content ID of the content evaluator Second adjacency matrix generation means for generating and outputting an information evaluation link adjacency matrix E as matrix elements corresponding to the set of
When α is a real number between 0 and 1 and β T is a transposed matrix of β,
S = αC TC + (1-α) E T E
Eigenvector calculation means for calculating the score transition matrix S by calculating the eigenvector r of the score transition matrix S, and outputting an element of the eigenvector r as an information reputation score corresponding to each content information;
The information reputation score, it in association with the corresponding the content information, and writing means for storing in the content information storing means,
Search condition receiving means for receiving a search term transmitted from the user terminal device;
Search means for searching the content information list using the search terms, and extracting the content information including the keywords that match the search terms from the content information storage means together with the information reputation score associated therewith; Comprising
A content search apparatus characterized by that.
利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア算出する情報評価装置の情報評価方法において、
前記情報評価装置の情報提供リンク格納手段に、コンテンツ提供者の利用者IDと、当該コンテンツ提供者によって提供されたコンテンツの識別子であるコンテンツIDと、の組を有する情報提供リンク情報を格納するステップと、
前記情報評価装置の情報評価リンク格納手段に、コンテンツ評価者の利用者IDと、当該コンテンツ評価者によって評価されたコンテンツの識別子であるコンテンツIDと、当該コンテンツ評価者当該コンテンツに対して行った評価の数値情報である評価情報と、の組を有する情報評価リンク情報を格納するステップと、
前記情報評価装置の第1隣接行列生成手段において、利用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報提供リンク情報が前記情報提供リンク格納手段に格納されているか否かを示す数値を、当該コンテンツ提供者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報提供リンク隣接行列Cを生成して出力するステップと、
前記情報評価装置の第2隣接行列生成手段において、利用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報評価リンク情報が有する評価情報の値を、当該コンテンツ評価者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報評価リンク隣接行列Eを生成して出力するステップと、
前記情報評価装置の固有ベクトル算出手段において、αを0以上1以下の実数とし、β をβの転置行列とした場合における、
S=αC C+(1−α)E
の計算によって前記スコア推移行列Sを算出し、当該スコア推移行列Sの固有ベクトルrを算出し、この固有ベクトルrの要素を前記情報評判スコアとして出力するステップと、
前記情報評価装置の情報評判スコア格納手段に、前記情報評判スコアを格納するステップと、を有する、
ことを特徴とする情報評価方法。
In the information evaluation method of the information evaluation apparatus that calculates the information reputation score that quantifies the reputation of the content that is electronic information provided by the user,
The information providing link storage means of the information evaluation device, storing the user ID of the content provider, a content ID is an identifier of content provided by the content provider, the set information providing link information having the When,
The information evaluation link storage means of the data evaluator, a user ID of the content evaluator, a content ID is an identifier of the content evaluated by the content evaluator, the content evaluator performed against the content Storing information evaluation link information having a set of evaluation information which is numerical information of evaluation; and
In the first adjacency matrix generating means of the data evaluator, for each set of a Subscriber ID and the content ID, the information providing link information having a set of the said user ID and content ID the information providing link storage means Generating and outputting an information providing link adjacency matrix C having a numerical value indicating whether or not stored as a matrix element corresponding to a set of the content provider's user ID and the content ID; and
In the second adjacency matrix generating means of the data evaluator, for each set of a Subscriber ID and the content ID, the value of the evaluation information information evaluation link information having a set of the said user ID and the content ID has, Generating and outputting an information evaluation link adjacency matrix E as a matrix element corresponding to a set of the user ID of the content evaluator and the content ID;
In the eigenvector calculation means of the information evaluation apparatus, when α is a real number not less than 0 and not more than 1 and β T is a transposed matrix of β,
S = αC TC + (1-α) E T E
Calculating the score transition matrix S by calculation, calculating an eigenvector r of the score transition matrix S, and outputting an element of the eigenvector r as the information reputation score;
Information reputation score storage unit of the information evaluation device, and a step of storing the information reputation score,
An information evaluation method characterized by that.
コンテンツサーバ装置に格納されたコンテンツ関する情報を提供するコンテンツ検索装置のコンテンツ検索方法であって、
前記コンテンツ検索装置のコンテンツ情報受信手段において、ブログサイトのサイトトップのURIと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIと、当該ブログ記事と、当該ブログ記事が参照している他のブログ記事のURIとを含むコンテンツを受信するステップと、
前記コンテンツ検索装置のコンテンツ情報格納手段に、前記ブログサイトのサイトトップのURIと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIと、当該ブログ記事から抽出されたキーワードと、当該ブログ記事が参照している他のブログ記事のURIとを対応付けたコンテンツ情報のリストであるコンテンツ情報リストを格納するステップと、
前記コンテンツ検索装置の情報提供リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報リストから、前記ブログサイトのサイトトップのURIをコンテンツ提供者の利用者IDとして抽出し、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事のURIを前記コンテンツ提供者によって提供されたコンテンツのコンテンツIDとして抽出し、当該コンテンツ提供者の利用者IDと当該コンテンツIDとの組を有する情報提供リンク情報を生成して出力するステップと、
前記情報提供リンク情報を前記コンテンツ検索装置の情報提供リンク格納手段に格納するステップと、
前記コンテンツ検索装置の情報評価リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報リストから、前記ブログサイトのサイトトップのURIをコンテンツ評価者の利用者IDとして抽出し、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事が参照している他のブログ記事のURIを当該コンテンツ評価者によって評価されたコンテンツのコンテンツIDとして抽出し、当該コンテンツ評価者の利用者IDと、当該コンテンツ評価者によって評価されたコンテンツのコンテンツIDと、当該ブログサイトのサイトトップにリンクする当該ブログサイトのブログ記事が参照している他のブログ記事のURIが存在するか否かによって定まる数値情報である評価情報と、の組を有する情報評価リンク情報を生成して出力するステップと、
前記情報評価リンク情報を前記コンテンツ検索装置の情報評価リンク格納手段に格納するステップと、
前記コンテンツ検索装置の第1隣接行列生成手段において、利用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報提供リンク情報が前記情報提供リンク格納手段に格納されているか否かを示す数値を、当該コンテンツ提供者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報提供リンク隣接行列Cを生成して出力するステップと、
前記コンテンツ検索装置の第2隣接行列生成手段において、利用者IDとコンテンツIDとの各組について、当該利用者IDとコンテンツIDとの組を有する情報評価リンク情報が有する評価情報の値を、当該コンテンツ評価者の利用者IDと当該コンテンツIDとの組に対応する行列要素とする情報評価リンク隣接行列Eを生成して出力するステップと、
前記コンテンツ検索装置の固有ベクトル算出手段において、αを0以上1以下の実数とし、β をβの転置行列とした場合における、
S=αC C+(1−α)E
の計算によって前記スコア推移行列Sを算出し、当該スコア推移行列Sの固有ベクトルrを算出し、この固有ベクトルrの要素を各コンテンツ情報に対応する情報評判スコアとして出力するステップと、
前記コンテンツ検索装置の書き込み手段において、前記情報評判スコアを、それに対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させるステップと、
前記コンテンツ検索装置の検索条件受信手段において、利用者端末装置から送信された検索を受信するステップと、
前記コンテンツ検索装置の検索手段において、前記検索用いて前記コンテンツ情報リストを検索し、前記検索語と一致する前記キーワードを含む前記コンテンツ情報を、それらに関連付けられた前記情報評判スコアとともに前記コンテンツ情報格納手段から抽出して出力するステップと、を有する
ことを特徴とするコンテンツ検索方法。
A content search method of a content search device that provides information about content stored in a content server device,
The content information receiving means of the content search device refers to the URI of the site top of the blog site, the URI of the blog article of the blog site linked to the site top of the blog site, the blog article, and the blog article. Receiving content including URIs of other blog articles that are present ;
In the content information storage means of the content search device, the URI of the site top of the blog site, the URI of the blog article of the blog site linked to the site top of the blog site, the keyword extracted from the blog article, Storing a content information list which is a list of content information associated with URIs of other blog articles referred to by the blog article ;
The information providing link generation unit of the content retrieval device, said from the content information list stored in the content information storing means, and extracted with user ID of the content provider site top URI of the blog site, the the URI of the blog site of the blog post that links to the site the top of the blog site extracted by the content ID of the content provided by the content provider, the combination of the user ID and the content ID of the content provider Generating and outputting information providing link information having :
Storing the information provision link information in an information provision link storage means of the content search device ;
In the above information evaluation link generating means of the content retrieval device, from the content information list stored in the content information storing means, and extracted with user ID of the content evaluator sites top URI of the blog site, the the URI of the other blog post blog post of the blog sites that link to the site the top of the blog site is referring extracted by the content ID of the content that has been evaluated by the content evaluator, use of the content evaluator A user ID, a content ID of the content evaluated by the content evaluator, and a URI of another blog article referenced by the blog article of the blog site linked to the site top of the blog site. and the evaluation information is a numerical value information which is determined by a set of Yes And a step for generating and outputting a that information evaluation link information,
Storing the information evaluation link information in an information evaluation link storage means of the content search device ;
In the first adjacency matrix generation unit of the content retrieval device, for each set of a Subscriber ID and the content ID, the information providing link information having a set of the said user ID and content ID the information providing link storage means Generating and outputting an information providing link adjacency matrix C having a numerical value indicating whether or not stored as a matrix element corresponding to a set of the content provider's user ID and the content ID; and
In the second adjacency matrix generation unit of the content retrieval device, for each set of a Subscriber ID and the content ID, the value of the evaluation information information evaluation link information having a set of the said user ID and the content ID has, Generating and outputting an information evaluation link adjacency matrix E as a matrix element corresponding to a set of the user ID of the content evaluator and the content ID;
In eigenvector computing means of the content retrieval device, in the case where the α is 0 or 1 less real, and beta T was transposed matrix of beta,
S = αC TC + (1-α) E T E
Calculating the score transition matrix S by the calculation of, calculating an eigenvector r of the score transition matrix S, and outputting an element of the eigenvector r as an information reputation score corresponding to each content information ;
In the writing means of the content retrieval device; the information reputation score, it in association with the corresponding the content information to be stored in the content information storing means,
In the search condition receiving means of the content search device, receiving a search term transmitted from the user terminal device;
In search means of the content retrieval device, the content of the content information including the keyword searching the content information list by using the search word, matches the search term, the information reputation score together with their associated It has a step of extracting and outputting the information storage means, and
A content search method characterized by the above.
請求項1又は2の情報評価装置又は請求項のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。 A program for causing a computer to function as the information evaluation device according to claim 1 or 2 or the content search device according to claim 3 . 請求項6に記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium storing the program according to claim 6.
JP2005128413A 2004-12-24 2005-04-26 Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium Active JP4344339B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005128413A JP4344339B2 (en) 2004-12-24 2005-04-26 Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004372487 2004-12-24
JP2005128413A JP4344339B2 (en) 2004-12-24 2005-04-26 Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium

Publications (2)

Publication Number Publication Date
JP2006202253A JP2006202253A (en) 2006-08-03
JP4344339B2 true JP4344339B2 (en) 2009-10-14

Family

ID=36960171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005128413A Active JP4344339B2 (en) 2004-12-24 2005-04-26 Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium

Country Status (1)

Country Link
JP (1) JP4344339B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019185768A (en) * 2018-04-05 2019-10-24 裕一郎 河野 Article evaluation system

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165490A (en) * 2006-12-28 2008-07-17 Nec Corp Information selection apparatus and method, program, and recording medium
JP4464975B2 (en) 2007-01-22 2010-05-19 インターナショナル・ビジネス・マシーンズ・コーポレーション Computer apparatus, computer program, and method for calculating the importance of an electronic document on a computer network based on a critique of the electronic document by another electronic document related to the electronic document
JP4905209B2 (en) * 2007-03-23 2012-03-28 日本電気株式会社 Web page reliability determination system, Web page reliability determination management server, Web page reliability determination management method, and program
JP2008305258A (en) * 2007-06-08 2008-12-18 Nec Mobiling Ltd Evaluation method for user, user evaluation system and program
WO2009051261A1 (en) * 2007-10-18 2009-04-23 Nec Corporation Information influence evaluation method, information influence evaluation system and information influence evaluation program
EP2359275A4 (en) * 2008-12-01 2013-01-23 Topsy Labs Inc Estimating influence
JP5640015B2 (en) * 2008-12-01 2014-12-10 トプシー ラブズ インコーポレイテッド Ranking and selection entities based on calculated reputation or impact scores
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
JP5489924B2 (en) * 2010-08-30 2014-05-14 株式会社Nttドコモ Apparatus and method for discovering influencers
JP5467062B2 (en) * 2011-01-17 2014-04-09 日本電信電話株式会社 Information recommendation apparatus, method and program
JP5318917B2 (en) * 2011-06-30 2013-10-16 楽天株式会社 Review posting control device, review posting control method, review posting control program, and computer-readable recording medium for recording the program
JP5516925B2 (en) * 2012-01-12 2014-06-11 日本電気株式会社 Reliability calculation device, reliability calculation method, and program
CN111680189B (en) 2020-04-10 2023-07-25 北京百度网讯科技有限公司 Movie and television play content retrieval method and device
JP2024046474A (en) 2022-09-22 2024-04-03 富士通株式会社 Information management program, information processing system and information management method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099548A (en) * 1998-07-22 2000-04-07 Nec Corp Information filtering method/device and storage medium recording information filtering program
JP3892815B2 (en) * 2001-04-04 2007-03-14 光一 渡邉 Information processing system and method
JP2003085433A (en) * 2001-09-06 2003-03-20 Matsushita Electric Ind Co Ltd Information evaluation system and its program
JP2003187176A (en) * 2001-12-20 2003-07-04 Hottolink:Kk Information ranking calculation method
JP2003316925A (en) * 2002-04-23 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> Information reliability evaluating device and information ranking system
JP4199045B2 (en) * 2003-05-13 2008-12-17 日本電信電話株式会社 Information evaluation apparatus and information evaluation method
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019185768A (en) * 2018-04-05 2019-10-24 裕一郎 河野 Article evaluation system

Also Published As

Publication number Publication date
JP2006202253A (en) 2006-08-03

Similar Documents

Publication Publication Date Title
JP4344339B2 (en) Information evaluation device, content search device, information evaluation method, content search method, program thereof, and recording medium
Khan et al. Modelling to identify influential bloggers in the blogosphere: A survey
Rubin et al. Assessing Credibility of Weblogs.
Morrison Tagging and searching: Search retrieval effectiveness of folksonomies on the World Wide Web
Jansen et al. Defining a session on Web search engines
US8612435B2 (en) Activity based users&#39; interests modeling for determining content relevance
JP5731250B2 (en) System and method for recommending interesting content in an information stream
US20100257184A1 (en) Method and apparatus for scoring electronic documents
Abbasi et al. A social network system for analyzing publication activities of researchers
Nassar et al. Overview of the crowdsourcing process
Shapira et al. Personalized search: Integrating collaboration and social networks
Akritidis et al. Identifying influential bloggers: Time does matter
KR20210037842A (en) Advertising Decision Making System Using Big Data Processing
Li et al. A hybrid model for experts finding in community question answering
Kim et al. Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network
Ng et al. An intelligent agent for web advertisements
Cagliero et al. Discovering cross-topic collaborations among researchers by exploiting weighted association rules
Sharma et al. A framework of hybrid recommender system for web personalisation
Nechaev et al. Linking knowledge bases to social media profiles
Kazai et al. Effects of social approval votes on search performance
Collins et al. A first analysis of meta-learned per-instance algorithm selection in scholarly recommender systems
Gordon et al. The architecture of commKnowledge: combining link structure and user actions to support an online community
Safran et al. Success factors in a weblog community.
Li et al. People search: Searching people sharing similar interests from the Web
Chen et al. The best answers? Think twice: identifying commercial campagins in the CQA forums

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060811

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090710

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4344339

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350