JP4374417B1 - Information analysis apparatus and information analysis program - Google Patents

Information analysis apparatus and information analysis program Download PDF

Info

Publication number
JP4374417B1
JP4374417B1 JP2008282457A JP2008282457A JP4374417B1 JP 4374417 B1 JP4374417 B1 JP 4374417B1 JP 2008282457 A JP2008282457 A JP 2008282457A JP 2008282457 A JP2008282457 A JP 2008282457A JP 4374417 B1 JP4374417 B1 JP 4374417B1
Authority
JP
Japan
Prior art keywords
information
propagation
propagator
user
propagation distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008282457A
Other languages
Japanese (ja)
Other versions
JP2010108444A (en
Inventor
亨 竹内
博史 澤
健人 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to JP2008282457A priority Critical patent/JP4374417B1/en
Application granted granted Critical
Publication of JP4374417B1 publication Critical patent/JP4374417B1/en
Publication of JP2010108444A publication Critical patent/JP2010108444A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる情報分析装置及び情報分析プログラムを提供すること。
【解決手段】情報伝播者によって伝播された情報を格納する情報提供装置3に対して、ネットワーク2を介して通信可能に接続された情報分析装置10であって、複数の情報伝播者を介した情報の伝播の連鎖回数に対応する伝播距離、伝播を行った複数の情報伝播者の伝播人数、及び伝播を行った情報伝播者が属する分類、を取得する情報取得部12aと、この情報取得部12aにて取得された伝播距離及び伝播人数と、情報取得手段にて取得された分類に基づいて決定される重み係数とに基づいて、情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定部12bを備える。
【選択図】図1
To provide an information analysis apparatus and an information analysis program capable of discovering information having high propagating property early without depending on the content of the information.
An information analysis apparatus connected to an information providing apparatus for storing information propagated by an information propagator via a network so as to communicate with the information provider. An information acquisition unit 12a that acquires a propagation distance corresponding to the number of information propagation chains, the number of propagation of a plurality of information propagators who performed propagation, and a classification to which the information propagator who performed the propagation belongs, and this information acquisition unit The weighted average propagation distance indicating the possibility of information propagation is calculated based on the propagation distance and propagation number acquired in 12a and the weighting factor determined based on the classification acquired by the information acquisition means. The calculating part 12b is provided.
[Selection] Figure 1

Description

本発明は、WEB上において情報伝播者によって伝播される各種の情報を分析する情報分析装置及び情報分析プログラムに関する。   The present invention relates to an information analysis apparatus and an information analysis program for analyzing various types of information transmitted by an information propagator on a WEB.

従来、新規市場開拓や需要予測を行うため、ブログやSNS(Social Networking Service)の如きWeb上で発信された情報に基づいて、商品やサービスの流行を予測する方法が提案されている。   2. Description of the Related Art Conventionally, in order to develop a new market and predict demand, a method for predicting the fashion of products and services based on information transmitted on the Web such as a blog or SNS (Social Networking Service) has been proposed.

例えば、ブログ記事等の情報から抽出したキーワードを抽出し、このキーワードの使用状況を定量化し、定量化したキーワードの使用状況を時系列で監視することで、近い将来の流行を予測するトレンド予測装置が提案されている(例えば、特許文献1参照)。   For example, a trend prediction device that extracts keywords extracted from information such as blog articles, quantifies the usage status of the keywords, and monitors the quantified keyword usage status in time series, thereby predicting a trend in the near future Has been proposed (see, for example, Patent Document 1).

しかしながら、このような従来の方法では、キーワードという「情報の内容」に依存して予測を行っていたので、情報の内容自体が不明確である伝播の初期段階では当該情報の内容を適切に設定することが困難であり、既にある程度伝播している情報についてしか予測を行うことができなかった。あるいは、監視対象としたキーワードが何らかの理由によって意図的に隠語や略語等に置き換えられて情報が発信される場合もあり、このような場合には、実質的には当該キーワードが示す情報と同様の情報であるにも関わらず当該キーワードを含んだ情報として把握されない可能性があるほか、キーワードを想定すること自体が困難な場合もあった。   However, in such a conventional method, the prediction is performed depending on the keyword “information content”, so that the information content is appropriately set at the initial stage of propagation when the information content itself is unclear. It was difficult to do so, and it was only possible to predict information that had already been propagated to some extent. Alternatively, there are cases where the keyword to be monitored is intentionally replaced with a secret word or abbreviation for some reason and information is transmitted. In such a case, the keyword is substantially the same as the information indicated by the keyword. Although it is information, it may not be grasped as information including the keyword, and it may be difficult to assume the keyword itself.

そこで、本願発明者等は、情報の内容ではなく、複数の情報伝播者の相互間における「情報の伝播形態」に注目して予測を行う手法を提案した。この手法では、情報の伝播形態を、情報の伝播元となった情報伝播者を「親」とすると共に情報の伝播先となった情報伝播者を「子」とした木構造(以下「伝達木」)でとらえ、情報の平均的な伝播距離を示す指標である「平均伝播距離」を算定し、この平均伝播距離によって情報の伝播形態を評価する。例えば、この平均伝播距離が長い傾向がある情報は、ユーザにとって面白いあるいは重要な情報だと判断される傾向がある。このような手法によれば、「情報の内容」に依存することなく情報伝播の予測を行うことができ、伝播の初期段階や情報の内容が意図的に改変される場合であっても、伝播情報を早期に発見できる可能性がある(例えば、非特許文献1参照)。   Accordingly, the inventors of the present application have proposed a method of making a prediction by paying attention not to the content of information but to an “information propagation form” among a plurality of information propagators. In this method, the information propagation form is a tree structure in which the information propagator that is the information propagation source is “parent” and the information propagator that is the information propagation destination is “child” (hereinafter “transmission tree”). )), An “average propagation distance” that is an index indicating an average propagation distance of information is calculated, and the propagation form of information is evaluated based on the average propagation distance. For example, information that tends to have a long average propagation distance tends to be judged as interesting or important information for the user. According to such a method, information propagation can be predicted without depending on “content of information”, and even if the initial stage of propagation or the content of information is intentionally altered, There is a possibility that information can be discovered early (see, for example, Non-Patent Document 1).

特開2006−227965号公報JP 2006-227965 A 竹内 亨,大野 翼,秋吉 政徳,薦田 憲久,「インターネット上の情報の伝播予測のための口コミ型コミュニケーションによる伝達形態の特性評価」,電気学会,情報システム研究会,IS−07−19,21−26頁,2007年6月29日Satoshi Takeuchi, Tsubasa Ohno, Masanori Akiyoshi, Norihisa Kouda, “Characteristic Evaluation of Transmission Forms by Word-of-mouth Communication for Predicting Information Propagation on the Internet”, Institute of Electrical Engineers, Information Systems Study Group, IS-07-19, 21- 26 pages, 29 June 2007

ここで、一般に、ブログやSNSを介して情報を伝播する情報伝播者は、情報伝播における影響度に応じて分類することができる。例えば、流行に至る可能性のあるアイテムにいち早く着目する「サイバーブロガ」、このサイバーブロガと比較して流行に至る可能性のあるアイテムに着目するタイミングは遅いものの他の情報伝播者に対してある程度の影響力を有する「オピニオンリーダ」、これらオピニオンリーダやサイバーブロガに該当しない「一般ブロガ」に分類することができる。そして、サイバーブロガからオピニオンリーダへ伝播された情報や、オピニオンリーダから一般ブロガへ伝播された情報のように、分類を跨いで伝播された情報は、単に同一の分類の中で伝播された情報に比べて、情報の伝播性が高いことを示していると考えられる。   Here, generally, the information propagator who propagates information via a blog or SNS can be classified according to the degree of influence in information propagation. For example, “Cyber bloggers” that focus on items that are likely to become epidemic early, and to some extent for other information disseminators who are late in focusing on items that are likely to become epidemic compared to this cyber blogger Can be classified into “opinion leaders” having the influence of “general” and “general bloggers” not corresponding to these opinion leaders or cyber bloggers. Information propagated across classifications, such as information propagated from cyber bloggers to opinion leaders and information propagated from opinion leaders to general bloggers, is simply changed to information propagated within the same classification. Compared to this, it is considered that the information has high propagating properties.

しかしながら、非特許文献1において本願発明者等が提案した平均伝播距離を用いた情報伝播予測手法では、このような情報伝播者の影響度までは考慮しておらず、情報伝播の際に情報伝播者の分類を跨いだ場合と跨がなかった場合との間で情報の伝播距離に差を設けていなかった。このため、複数の分類における情報伝播者が重要だと判断した情報と、単一分類における情報伝播者のみが重要だと判断した情報との間で、伝播形態の評価に差異を付けることができず、分類を跨いで情報が伝播した事実を情報の伝播予測に反映させることができない可能性があった。   However, the information propagation prediction method using the average propagation distance proposed by the inventors of the present application in Non-Patent Document 1 does not consider the degree of influence of such an information propagater, and information propagation is performed at the time of information propagation. There was no difference in the propagation distance of information between the case where the person's classification was straddled and the case where the person was not straddled. Therefore, it is possible to make a difference in the evaluation of propagation patterns between information judged to be important by information propagators in multiple categories and information judged to be important only by information propagators in a single category. Therefore, there is a possibility that the fact that information is propagated across the classification cannot be reflected in the information propagation prediction.

本発明は、上記に鑑みてなされたものであって、伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる、情報分析装置及び情報分析プログラムを提供することを目的とする。   The present invention has been made in view of the above, and provides an information analysis apparatus and an information analysis program that can discover information having high propagating properties early without depending on the content of the information. With the goal.

この請求項1、2、又は6に記載の情報分析装置又は情報分析プログラムによれば、複数の情報伝播者を介した情報の伝播の連鎖回数に対応する伝播距離と、伝播を行った複数の情報伝播者の伝播人数と、伝播を行った情報伝播者が属する分類に基づく重み係数とに基づいて、重み付け平均伝播距離が算定されるので、情報の伝播形態に着目して伝播予測を行う上で、情報伝播者の分類を跨いで情報が伝播した事実を伝播予測に反映させることができるため、伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる。   According to the information analysis apparatus or the information analysis program according to claim 1, 2, or 6, the propagation distance corresponding to the number of chain propagation of information through a plurality of information propagators and the plurality of propagation The weighted average propagation distance is calculated based on the number of information propagators and the weighting factor based on the classification to which the propagating information propagator belongs. Thus, since the fact that the information has been propagated across the categories of information propagators can be reflected in the propagation prediction, it is possible to find information with high propagating properties early without depending on the content of the information.

また、請求項3に記載の情報分析装置によれば、複数の情報毎に伝播距離と伝播人数とに基づいて平均伝播距離を算定し、当該算定した平均伝播距離と伝播人数との間の回帰式を導出し、分析対象の情報についての伝播人数を回帰式に代入して基準伝播距離を算定し、当該基準伝播距離と分析対象の情報の重み付け平均伝播距離とに基づいて、情報の伝播力を示す情報伝播力指数を算定するので、分析対象の情報の伝播人数の大小に関わらず、情報の伝播力を対比可能な客観的な指標を得ることができる。   According to the information analysis apparatus of claim 3, the average propagation distance is calculated based on the propagation distance and the number of propagation persons for each of a plurality of pieces of information, and the regression between the calculated average propagation distance and the number of propagation persons is performed. Calculate the reference propagation distance by substituting the propagation number of the information to be analyzed into the regression equation and calculate the propagation power of the information based on the reference propagation distance and the weighted average propagation distance of the information to be analyzed. Therefore, an objective index capable of comparing the propagation power of information can be obtained regardless of the number of people who transmit the information to be analyzed.

また、請求項4に記載の情報分析装置によれば、分析対象の情報の伝播の可能性を基準値を用いて自動的に判定することで、伝播性が高い情報を、当該情報の内容に依存せずに正確かつ迅速に把握することが可能となる。   In addition, according to the information analysis device of the fourth aspect, by automatically determining the possibility of propagation of the information to be analyzed using the reference value, the information having high propagation property is changed to the content of the information. It becomes possible to grasp accurately and quickly without depending on it.

また、請求項5に記載の情報分析装置によれば、情報は、ブログを介して伝播する情報であり、情報伝播者は、ブログによる前記情報の発信者であり、分類は、ブログの影響力に基づいて前記発信者を区分するための分類であるので、近年の情報伝播に大きな影響力を発揮するブログによる情報伝播の可能性を、ブログの発信者の影響力に基づく分類を考慮に入れて判定することができる。   Further, according to the information analysis apparatus according to claim 5, the information is information propagated through the blog, the information propagator is a sender of the information by the blog, and the classification is the influence of the blog. Therefore, we consider the possibility of information transmission by blogs that have a great influence on information propagation in recent years, taking into account the classification based on the influence of blog senders. Can be determined.

以下に添付図面を参照して、この発明に係る情報分析装置及び情報分析プログラムの実施の形態を詳細に説明する。   Embodiments of an information analysis apparatus and an information analysis program according to the present invention will be described below in detail with reference to the accompanying drawings.

(構成)
まず、情報分析システムの構成を説明する。図1は情報分析システムの全体構成を機能概念的に示す説明図である。この情報分析システム1は、インターネット等のネットワーク2を介して、複数の情報提供装置3、複数の端末装置4、及び情報分析装置10を相互に通信可能に接続して構成されている。
(Constitution)
First, the configuration of the information analysis system will be described. FIG. 1 is an explanatory diagram conceptually showing the overall configuration of the information analysis system. The information analysis system 1 is configured by connecting a plurality of information providing apparatuses 3, a plurality of terminal apparatuses 4, and an information analysis apparatus 10 via a network 2 such as the Internet so that they can communicate with each other.

(構成−情報提供装置)
情報提供装置3は、例えば、SNSサーバや、各種ブログサイトのサーバの如き公知のWebサーバとして構成することができ、その具体的な提供情報の内容は任意である。この情報提供装置3は、端末装置4や情報分析装置10からの要求に応じて、情報伝播者から提供された情報を格納したり、当該格納した情報を当該端末装置4や当該情報分析装置10に送信する機能を有する。
(Configuration-Information provision device)
The information providing apparatus 3 can be configured as a known Web server such as an SNS server or various blog site servers, and the specific content of the provided information is arbitrary. The information providing device 3 stores information provided by an information propagator in response to a request from the terminal device 4 or the information analysis device 10, or stores the stored information in the terminal device 4 or the information analysis device 10. It has the function to transmit to.

(構成−端末装置)
端末装置4は、情報伝播者が情報提供装置3との間において情報の入出力を行い、あるいは情報分析システム1を使用する分析者が情報分析装置10との間において情報の入出力を行うための端末であり、公知のパーソナルコンピュータとして構成することができる。
(Configuration-terminal device)
In the terminal device 4, an information propagator inputs / outputs information to / from the information providing device 3, or an analyst using the information analysis system 1 inputs / outputs information to / from the information analyzing device 10. It can be configured as a known personal computer.

(構成−情報分析装置)
情報分析装置10は、ネットワークインタフェース(以下「ネットワークIF」)11、制御部12、及び記憶部13をバスにて通信可能に接続して構成されている。
(Configuration-Information analyzer)
The information analysis apparatus 10 is configured by connecting a network interface (hereinafter “network IF”) 11, a control unit 12, and a storage unit 13 so that they can communicate with each other via a bus.

ネットワークIF11は、情報分析装置10がネットワーク2を介した通信を行うための通信制御インターフェースであり、入力手段及び出力手段である。このネットワークIF11は、例えばネットワークボードとして構成されている。   The network IF 11 is a communication control interface for the information analysis apparatus 10 to communicate via the network 2, and is an input unit and an output unit. The network IF 11 is configured as a network board, for example.

制御部12は、情報分析装置10の各部を制御する制御手段であり、機能概念的に、情報取得部12a、算定部12b、及び判定部12cを備える。情報取得部12aは、情報の伝播形態に関する伝播情報をネットワーク2を介して情報提供装置3から取得する情報取得手段である。算定部12bは、後述する各種の数値や回帰式を算定する算定手段である。判定部12cは、情報の伝播の可能性を判定する判定手段である。この制御部12は、具体的には、CPU(Central Processing Unit)や、このCPU上で解釈実行される各種のプログラム(OSなどの制御プログラムや、各種の処理手順などを規定したプログラム)、及び所要プログラムや所要データを格納するための内部メモリを備えて構成される。   The control unit 12 is a control unit that controls each unit of the information analysis apparatus 10, and includes an information acquisition unit 12a, a calculation unit 12b, and a determination unit 12c in terms of functional concept. The information acquisition unit 12 a is information acquisition means for acquiring propagation information related to the information propagation form from the information providing apparatus 3 via the network 2. The calculating unit 12b is a calculating unit that calculates various numerical values and regression equations described later. The determination unit 12c is a determination unit that determines the possibility of information propagation. Specifically, the control unit 12 includes a CPU (Central Processing Unit), various programs interpreted and executed on the CPU (control programs such as an OS, programs that define various processing procedures, and the like), and An internal memory for storing required programs and required data is provided.

記憶部13は、例えばハードディスクやその他の記録媒体によって構成されており、ユーザ情報データベース(以下「DB」)13a及び伝播情報DB13bを備えている。   The storage unit 13 is configured by, for example, a hard disk or other recording medium, and includes a user information database (hereinafter “DB”) 13a and a propagation information DB 13b.

ユーザ情報DB13aは、情報提供装置3に情報を提供する情報伝播者に関する情報(以下、ユーザ情報)を格納するための情報伝播者格納手段であり、図2(a)に例示するように、DB項目として「ユーザID」「格納先」「分類」「重み係数」を備え、これらに対応する情報が相互に関連付けられて格納されている。項目「ユーザID」に対応して格納される情報は、情報伝播者を一意に識別するための識別情報である。項目「格納先」に対応して格納される情報は、各情報伝播者から提供される提供情報の格納先(ここでは情報提供装置3)を示す情報であり、例えばURLアドレスやRSS(Rich Site Summary 又は RDF Site Summary)である。項目「分類」に対応して格納される情報は、所定の基準に基づく情報伝播者の分類を特定するための情報であり、各情報伝播者が提供する提供情報の内容に応じた分類である「得意カテゴリ」や、情報伝播者の情報提供における影響度に応じた分類である「クラス」に対応する情報を格納する。「クラス」に対応して格納される情報としては、例えば、上述した「サイバーブロガ(以下、サイバー)」、「オピニオンリーダ(以下、OP)」、「一般ブロガ(以下、一般)」等の情報を用いることができる。項目「重み係数」に対応して格納される情報は、算定部12bが重み付け平均伝播距離を算定する際に用いられる重み係数であり、ここでは、重み係数は各情報伝播者が属する分類に基づいて決定されており、例えば情報伝播者のクラスがサイバーの場合は「0」、OPの場合は「1」、「一般」の場合は「2」を格納する。これらの各情報をユーザ情報DB13aに格納するタイミングや方法は任意であり、例えば分析者によって端末装置4からネットワーク2を介して入力され、当該ユーザ情報DB13aに格納される。   The user information DB 13a is information propagator storage means for storing information about an information propagator that provides information to the information providing apparatus 3 (hereinafter referred to as user information). As illustrated in FIG. Items include “user ID”, “storage destination”, “classification”, and “weighting coefficient”, and information corresponding to these items is stored in association with each other. Information stored corresponding to the item “user ID” is identification information for uniquely identifying the information propagator. The information stored corresponding to the item “storage location” is information indicating the storage location of the provided information provided by each information propagator (in this case, the information providing device 3). For example, the URL address or RSS (Rich Site) is stored. (Summary or RDF Site Summary). The information stored corresponding to the item “classification” is information for specifying the classification of the information propagator based on a predetermined standard, and is a classification according to the contents of the provided information provided by each information propagator. Information corresponding to “special category” and “class” that is a classification according to the degree of influence in providing information by the information propagator is stored. Examples of information stored corresponding to “class” include information such as “cyber blogger (hereinafter referred to as cyber)”, “opinion reader (hereinafter referred to as OP)”, and “general blogger (hereinafter referred to as general)”. Can be used. The information stored corresponding to the item “weight coefficient” is a weight coefficient used when the calculation unit 12b calculates the weighted average propagation distance. Here, the weight coefficient is based on the classification to which each information propagator belongs. For example, “0” is stored when the information propagator class is cyber, “1” is stored when it is OP, and “2” is stored when it is “general”. The timing and method for storing these pieces of information in the user information DB 13a are arbitrary. For example, the information is input from the terminal device 4 via the network 2 by an analyst and stored in the user information DB 13a.

図1の伝播情報DB13bは、情報の伝播形態に関する情報(以下、伝播情報)を格納するための伝播情報格納手段であり、図2(b)に例示するように、DB項目として「情報ID」、「提供ユーザID」、「伝播ユーザID」、「伝播人数」、「更新日」、を備え、これらに対応する情報が相互に関連付けて格納されている。項目「情報ID」に対応して格納される情報は、情報伝播者によって提供され、他の情報伝播者を介して伝播される情報を一意に識別するための情報である。項目「提供ユーザID」に対応して格納される情報は、各情報を最初に情報提供装置3に提供した情報伝播者を特定するための情報であり、例えば情報を提供した情報伝播者のユーザIDが格納される。項目「伝播ユーザID」に対応して格納される情報は、情報提供装置3に提供された情報を伝播した情報伝播者を特定するための情報であり、例えば、情報を伝播した情報伝播者のユーザIDを、当該情報の伝播順に、情報の伝播元のユーザIDと伝播先のユーザIDとを相互に対応付けて格納する。図2(b)に示した例では、UID005の情報伝播者からUID419の情報伝播者に伝播された情報が、さらにUID420及びUID690の情報伝播者に伝播されたこと等を示している。さらに、この項目「伝播ユーザID」に対応して、各情報伝播者に情報が伝播されるまでの伝播の連鎖回数に対応する伝播距離を特定するための情報が、ユーザIDに付随して格納される。例えば図2(b)に示したように、UID005の情報伝播者によって提供された情報がUID419及びUID690の情報伝播者を介してUID377の情報伝播者まで伝播された場合、伝播の連鎖回数は3回であるので、ユーザIDに付随して伝播距離「3」が格納される(図2(b)における「UID377(3)」)。項目「伝播人数」に対応して格納される情報は、伝播を行った複数の情報伝播者の伝播人数を各情報毎に特定するための情報である。項目「更新日」に対応して格納される情報は、各情報毎に伝播情報DB13bの内容が更新された日を特定するための情報である。これらの各情報を伝播情報DB13bに格納するタイミングや方法は任意であり、例えば後述する情報取得処理において、情報提供装置3からネットワーク2を介して情報取得部12aによって取得され、当該伝播情報DB13bに格納される。   The propagation information DB 13b in FIG. 1 is a propagation information storage unit for storing information relating to the propagation form of information (hereinafter, propagation information). As illustrated in FIG. , “Provided user ID”, “propagation user ID”, “number of propagation users”, and “update date”, and information corresponding to these is stored in association with each other. The information stored in correspondence with the item “information ID” is information for uniquely identifying information provided by the information propagator and propagated through other information propagators. The information stored corresponding to the item “provided user ID” is information for identifying the information propagator who first provided each information to the information providing apparatus 3, for example, the user of the information propagator who provided the information ID is stored. The information stored in correspondence with the item “propagation user ID” is information for identifying the information propagator who propagated the information provided to the information providing apparatus 3, for example, the information propagator who propagated the information The user ID is stored in association with the user ID of the information propagation source and the user ID of the transmission destination in the order of propagation of the information. In the example shown in FIG. 2B, information transmitted from the information propagator of UID005 to the information propagator of UID419 is further propagated to the information propagators of UID420 and UID690. Further, in correspondence with this item “propagation user ID”, information for specifying the propagation distance corresponding to the number of times of propagation until the information is propagated to each information propagator is stored along with the user ID. Is done. For example, as shown in FIG. 2B, when the information provided by the information propagator of UID005 is propagated to the information propagator of UID377 via the information propagators of UID419 and UID690, the number of propagation chains is 3 Therefore, the propagation distance “3” is stored in association with the user ID (“UID 377 (3)” in FIG. 2B). The information stored in correspondence with the item “number of propagation persons” is information for specifying the number of propagation persons of a plurality of information propagation persons who have propagated for each piece of information. The information stored corresponding to the item “update date” is information for specifying the date when the contents of the propagation information DB 13b are updated for each information. The timing and method for storing these pieces of information in the propagation information DB 13b are arbitrary. For example, in the information acquisition process described later, the information acquisition unit 12a acquires the information from the information providing device 3 via the network 2, and stores the information in the propagation information DB 13b. Stored.

(処理)
次に、図1に示した情報分析装置10にて行われる処理について、情報取得処理と算定判定処理に大別して説明する。
(processing)
Next, the processing performed by the information analysis apparatus 10 shown in FIG. 1 will be described broadly as information acquisition processing and calculation determination processing.

(処理−情報取得処理)
図3は情報取得処理のフローチャートである。この情報取得処理を繰り返し実行することにより、伝播情報DB13bに常に最新の伝播情報を格納しておくことが可能となる。
(Processing-Information acquisition processing)
FIG. 3 is a flowchart of the information acquisition process. By repeatedly executing this information acquisition process, the latest propagation information can always be stored in the propagation information DB 13b.

この情報取得処理の前提として、分析者は、分析対象となる情報を情報提供装置3に提供する情報伝播者のブログを任意の方法で特定し、当該情報伝播者及びブログに関する情報をユーザ情報DB13aに格納する。その後、情報分析装置10に所定方法で情報取得処理の開始が指示されると、情報取得部12aは、ユーザ情報DB13aの格納先を参照して情報提供装置3に対するクローリングを行い(SA1)、情報伝播者によって新たに情報が提供されたか否かを公知の手法で判定する(SA2)。   As a premise of this information acquisition processing, the analyst specifies the blog of the information propagator who provides information to be analyzed to the information providing apparatus 3 by an arbitrary method, and sets the information related to the information propagator and the blog to the user information DB 13a. To store. Thereafter, when the information analysis apparatus 10 is instructed to start the information acquisition process by a predetermined method, the information acquisition unit 12a refers to the storage location of the user information DB 13a and performs crawling on the information providing apparatus 3 (SA1). It is determined by a known method whether or not information is newly provided by the propagator (SA2).

そして、情報取得部12aは、新たに情報提供がされない間(SA2、No)はクローリングを続行し(SA1)、新たに情報提供がされたものと判定した場合(SA2、Yes)、当該提供された情報(以下「提供情報」)が伝播情報DB13bに登録済みか否かを判定する(SA3)。例えば、この判定には、この提供情報に含まれているリンク先情報やトラックバック先情報を用いることができる。具体的には、この提供情報にリンク先情報やトラックバック先情報が含まれているか否かを判定し、これらの情報が含まれていない場合には、当該提供情報は登録済みではない新規な提供情報であると判定し、これらの情報が含まれている場合には、当該提供情報は登録済みの提供情報であると判定する。   Then, the information acquisition unit 12a continues the crawling while the information is not newly provided (SA2, No) (SA1), and when it is determined that the information is newly provided (SA2, Yes), the information is provided. It is determined whether the information (hereinafter “provided information”) has been registered in the propagation information DB 13b (SA3). For example, for this determination, link destination information or track back destination information included in the provided information can be used. Specifically, it is determined whether or not link information or trackback destination information is included in the provision information. If such information is not included, the provision information is a new provision that has not been registered. It is determined that the information is information, and when such information is included, the provision information is determined to be registered provision information.

そして、提供情報が登録済みではない新規な提供情報であると判定した場合(SA3、No)、情報取得部12aは、この提供情報の格納先に基づいてユーザ情報DB13aを参照することにより、この提供情報を提供した情報伝播者(以下「提供ユーザ」)のユーザIDを特定する(SA6)。さらに、情報取得部12aは、この提供ユーザが提供した提供情報に新規の情報IDを割り当てる(SA7)。そして、情報取得部12aは、これらユーザIDと情報IDを用いて、伝播情報DB13bの内容を更新する(SA8)。すなわち、SA7で割り当てた情報IDを項目「情報ID」に新たに格納し、この情報IDに対応付けて、SA6で特定したユーザIDを項目「提供ユーザID」に格納し、当該更新を行った日を項目「更新日」に格納する。   And when it determines with provision information being new provision information which has not been registered (SA3, No), the information acquisition part 12a refers to user information DB13a based on the storage location of this provision information, and this The user ID of the information propagator who provided the provided information (hereinafter “provided user”) is specified (SA6). Furthermore, the information acquisition unit 12a assigns a new information ID to the provided information provided by the providing user (SA7). And the information acquisition part 12a updates the content of propagation information DB13b using these user ID and information ID (SA8). That is, the information ID assigned in SA7 is newly stored in the item “information ID”, the user ID specified in SA6 is stored in the item “provided user ID” in association with this information ID, and the update is performed. Store the date in the item "update date".

一方、提供情報が登録済みの提供情報であると判定した場合(SA3、Yes)、情報取得部12aは、この提供情報の格納先に基づいてユーザ情報DB13aを参照することにより、この提供情報を伝播した情報伝播者(以下「伝播ユーザ」)のユーザIDを特定する(SA4)。さらに、情報取得部12aは、この提供情報に含まれているリンク先情報やトラックバック先情報に基づいて、この提供情報の伝播元となった情報(以下「伝播元情報」)を提供した情報伝播者(以下「伝播元ユーザ」)のユーザIDを特定する(SA5)。その後、情報取得部12aは、これら特定した情報に基づいて、伝播情報DB13bの内容を更新する(SA8)。すなわち、項目「提供ユーザID」又は「伝播ユーザID」における当該特定された伝播元ユーザのユーザIDに対応付けて、SA4で特定した伝播ユーザのユーザID及び伝播距離を項目「伝播ユーザID」に格納し、また当該特定された伝播元ユーザのユーザIDに対応する伝播人数を増分すると共に、当該特定された伝播元ユーザのユーザIDに対応する更新日を更新する。以降同様に、SA1からSA8を再帰的に行う。   On the other hand, when it is determined that the provision information is registered provision information (SA3, Yes), the information acquisition unit 12a refers to the user information DB 13a based on the storage location of the provision information, thereby obtaining the provision information. The user ID of the propagated information propagator (hereinafter “propagation user”) is specified (SA4). Furthermore, the information acquisition unit 12a provides information propagation that provides information (hereinafter referred to as "propagation source information") from which the provision information is propagated based on link destination information and trackback destination information included in the provision information. The user ID of the user (hereinafter referred to as “propagation source user”) is specified (SA5). Thereafter, the information acquisition unit 12a updates the contents of the propagation information DB 13b based on the specified information (SA8). That is, in association with the user ID of the specified propagation source user in the item “provided user ID” or “propagation user ID”, the user ID and propagation distance of the propagation user identified in SA4 are set in the item “propagation user ID”. In addition, the number of propagations corresponding to the user ID of the specified propagation source user is incremented, and the update date corresponding to the user ID of the specified propagation source user is updated. Thereafter, similarly, SA1 to SA8 are recursively performed.

(処理−算定判定処理)
次に、各種数値を算定して情報の伝播の可能性を判定する算定判定処理について説明する。図4は算定判定処理のフローチャートである。この算定判定処理は、例えば分析者がネットワーク2を介して端末装置4から情報分析装置10に算定判定処理の実行指示を入力した場合に起動される。この際、分析者により、分析対象情報を特定する情報IDが情報分析装置10に入力される。
(Processing-Calculation judgment process)
Next, calculation determination processing for calculating various numerical values to determine the possibility of information propagation will be described. FIG. 4 is a flowchart of the calculation determination process. This calculation determination process is started, for example, when an analyst inputs an execution instruction for the calculation determination process from the terminal device 4 to the information analysis apparatus 10 via the network 2. At this time, an information ID for specifying the analysis target information is input to the information analysis apparatus 10 by the analyst.

算定判定処理が起動されると、算定部12bは情報取得部12aにて取得された情報(ここでは伝播情報DB13bに格納された情報)を参照し、各提供情報についての伝播情報(例えば伝播ユーザID、伝播距離、伝播人数)を取得する(SB1)。さらに、取得した各伝播ユーザIDに基づいてユーザ情報DB13aを参照し、各伝播ユーザIDに対応する重み係数を取得する(SB2)。そして、SB1で取得した伝播距離及び伝播人数と、SB2で取得した重み係数とに基づいて、各提供情報毎に重み付け平均伝播距離(Trend−weighted Average Propagation Distance、以下「TAPD」)を算定する(SB3)。   When the calculation determination process is activated, the calculation unit 12b refers to the information acquired by the information acquisition unit 12a (here, the information stored in the propagation information DB 13b), and propagates information about each provided information (for example, propagation user) ID, propagation distance, propagation number) are acquired (SB1). Further, the user information DB 13a is referred to based on each acquired propagation user ID, and a weighting factor corresponding to each propagation user ID is acquired (SB2). Then, based on the propagation distance and number of propagation obtained in SB1 and the weighting coefficient obtained in SB2, a weighted average propagation distance (hereinafter referred to as “TAPD”) is calculated for each provided information (hereinafter referred to as “TAPD”). SB3).

このTAPDは、以下の算定式を用いて算定される(ここで、tapd(m)はTAPD、l(m,u)は分析対象情報mを受け取った伝播ユーザuにおける伝播距離(ただし、分析対象情報を最初に提供した提供ユーザuにおける当該伝播距離は0とする)、|R|は伝播人数、phase(sender)は分析対象情報を提供した伝播元ユーザsenderが属する分類に対応する重み係数、phase(u)は分析対象情報を受け取った伝播ユーザuが属する分類に対応する重み係数、kは所定の重み付け定数)。なお、「phase(sender)−phase(u)」に対する絶対値を取っているのは、サイバーブロガから一般ブロガに情報が伝播された場合のみならず、一般ブロガからサイバーブロガに情報が伝播された場合にも、分類を跨いで情報が伝播されたという事実としては伝播予測に対して同様の影響度を持つためである。

Figure 0004374417
This TAPD is calculated using the following calculation formula (where tapd (m) is TAPD, l (m, u) is the propagation distance in the propagation user u that has received the analysis target information m (however, the analysis target) The propagation distance in the providing user u that first provided the information is 0), | R | is the number of propagation, phase (sender) is a weighting factor corresponding to the classification to which the propagation source user sender who provided the analysis target information belongs, phase (u) is a weighting factor corresponding to the classification to which the propagation user u that received the analysis target information belongs, and k is a predetermined weighting constant). In addition, the absolute value for “phase (sender) -phase (u)” is taken not only when information is transmitted from the cyber blogger to the general blogger, but also from the general blogger to the cyber blogger. Even in this case, the fact that the information is propagated across the classifications has the same influence on the propagation prediction.
Figure 0004374417

このように、伝播ユーザの分類に応じて伝播距離に重み付けを行うことにより、相互に異なる分類に属する伝播ユーザ間を跨いで情報の伝播が行われた場合の影響を、TAPDに反映させることができる。例えば、重み付け定数kの値を1よりも大きくした場合、サイバーからOPへ伝播された情報や、OPから一般へ伝播された情報のように、分類を跨いで伝播された情報については、相対的にTAPDが大きくなるため、情報の伝播性が高いことが数値的に表される。   In this way, by weighting the propagation distance according to the propagation user classification, it is possible to reflect the effect when information is propagated across propagation users belonging to different classifications in TAPD. it can. For example, when the value of the weighting constant k is larger than 1, information that is propagated across classifications, such as information propagated from cyber to OP and information propagated from OP to the general public, Since TAPD becomes large, it is numerically expressed that information is highly transmitted.

続いて算定部12bは、SB3で算出したTAPDと伝播人数との間の回帰式を公知の数学的手法を用いて導出する(SB4)。図5は、横軸を伝播人数、縦軸をTAPDとして、各提供情報についてのデータをプロットした散布図であり、図中の直線は算定部12bが導出した回帰式に対応した回帰線である。   Subsequently, the calculation unit 12b derives a regression equation between the TAPD calculated in SB3 and the number of persons transmitted using a known mathematical method (SB4). FIG. 5 is a scatter diagram in which data about each provided information is plotted with the number of people on the horizontal axis and the TAPD on the vertical axis, and the straight line in the figure is a regression line corresponding to the regression equation derived by the calculation unit 12b. .

図4に戻り、算定部12bは、分析対象情報に対応する基準伝播距離を算定する(SB5)。具体的には、分析者にて指示された分析対象情報の情報IDに対応する伝播人数を伝播情報DB13bから取得し、この分析対象情報の伝播人数を、SB4で導出した回帰式に代入することにより、基準伝播距離を算定する。例えば図5に示した回帰線に対応する回帰式(伝播人数に対応する平均的なTAPD(=基準伝播距離)を算定する式)が「y=0.0655x+1.925」であって(yは基準伝播距離、xは伝播人数に対応)、分析対象情報の情報IDに対応する伝播人数が266人である場合、基準伝播距離は19.348となる。   Returning to FIG. 4, the calculation unit 12b calculates a reference propagation distance corresponding to the analysis target information (SB5). Specifically, the number of propagation persons corresponding to the information ID of the analysis target information specified by the analyst is acquired from the propagation information DB 13b, and the number of propagation numbers of the analysis target information is substituted into the regression equation derived in SB4. Based on this, the standard propagation distance is calculated. For example, a regression equation corresponding to the regression line shown in FIG. 5 (an equation for calculating an average TAPD (= reference propagation distance) corresponding to the number of persons propagated) is “y = 0.0655x + 1.925” (y is If the propagation number corresponding to the information ID of the analysis target information is 266, the reference propagation distance is 19.348.

次いで、算定部12bは、TAPDを基準伝播距離で除することにより、情報伝播力指数(Information Propagation Power Index、以下「IPIX」)を算定する(SB6)。この算定によれば、分析対象情報のTAPDを、各情報のTAPDと伝播人数から得られた相関関係に基づいて、分析対象の情報の伝播人数の大小に影響されない客観性のある指数としてのIPIXに置換することができる。例えば、分析対象情報のTAPDが31.84である場合、これを基準伝播距離19.348で除すると、IPIXが1.65として求められる。   Next, the calculation unit 12b calculates an information propagation power index (hereinafter referred to as “IPIX”) by dividing the TAPD by the reference propagation distance (SB6). According to this calculation, based on the correlation obtained from the TAPD of each piece of information and the number of people transmitted, the IPIX as an objective index that is not affected by the size of the number of people transferred. Can be substituted. For example, when the TAPD of the analysis target information is 31.84, when this is divided by the reference propagation distance 19.348, IPIX is obtained as 1.65.

その後、判定部12cは、算定部12bが算定したIPIXに基づいて分析対象情報の伝播可能性の判定と、この判定結果の送信を行う(SB7)。例えば、判定部12cは、IPIXを所定の基準値(ここでは1)と比較し、IPIXが基準値より大きい場合(図5においてTAPDが回帰線より上の領域にある場合)は、分析対象情報が伝播する可能性が高いと判定し、IPIXが基準値以下の場合(図5においてTAPDが回帰線上又は回帰線より下の領域にある場合)には、分析対象情報が伝播する可能性が低いか、又はデマによる意図的に伝播されている可能性が高いと判定する。例えば、上述のようにIPIXが1.65と求められた場合、基準値である1より大きいことから、当該分析対象情報が伝播する可能性が高いと判定する。そして、判定部12cは、この判定結果を示す所定の形式の情報を、分析者の端末装置4に送信する。この端末装置4では、分析対象情報の判定結果を示す情報が所定の形式で出力されるため、分析者は、この分析対象情報の伝播の予測結果を把握することが可能となる。   Thereafter, the determination unit 12c determines the possibility of propagation of the analysis target information based on the IPIX calculated by the calculation unit 12b and transmits the determination result (SB7). For example, the determination unit 12c compares IPIX with a predetermined reference value (here, 1), and when IPIX is larger than the reference value (when TAPD is in a region above the regression line in FIG. 5), the analysis target information If the IPIX is below the reference value (when TAPD is on the regression line or in the region below the regression line in FIG. 5), the analysis target information is unlikely to propagate. It is determined that there is a high possibility that it is propagated intentionally by hoax. For example, when IPIX is obtained as 1.65 as described above, it is determined that the analysis target information is highly likely to be propagated because it is larger than the reference value of 1. And the determination part 12c transmits the information of the predetermined format which shows this determination result to the analyzer's terminal device 4. FIG. In this terminal device 4, information indicating the determination result of the analysis target information is output in a predetermined format, so that the analyst can grasp the prediction result of the propagation of the analysis target information.

〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
[Modifications to Embodiment]
Although the embodiments of the present invention have been described above, the specific configuration and means of the present invention can be arbitrarily modified and improved within the scope of the technical idea of each invention described in the claims. Can do. Hereinafter, such a modification will be described.

(情報取得処理について)
実施の形態では、情報取得処理において、情報取得部12aが伝播情報DB13bの伝播情報の内容を情報提供装置3から取得しているが、最新の伝播情報をその他の任意の方法で伝播情報DB13bに格納しておき、情報取得部12aが必要に応じて伝播情報DB13bから伝播情報を取得して算定部12bに受け渡すようにしてもよい。
(About information acquisition processing)
In the embodiment, in the information acquisition process, the information acquisition unit 12a acquires the content of the propagation information in the propagation information DB 13b from the information providing device 3, but the latest propagation information is transferred to the propagation information DB 13b by any other method. The information may be stored, and the information acquisition unit 12a may acquire propagation information from the propagation information DB 13b as necessary and pass it to the calculation unit 12b.

(算定判定処理について)
実施の形態では、算定判定処理において、算定部12bが各提供情報毎にTAPDを算定すると説明したが、情報取得処理において伝播情報DB13bの内容が更新される際に、当該更新に関連する提供情報についてのTAPDを算定し、伝播情報DB13bに格納させることもできる。この場合、算定判定処理においては、算定部12bは伝播情報DB13bからTAPDを取得し、当該取得したTAPDと伝播人数との間の回帰式を導出することができる。また、TAPD自体も情報伝播を予測する上で有効な情報であるため、回帰式の導出やIPIXの算定を行うことなく、TAPDのみを端末装置4に送信してもよい。
(About calculation judgment processing)
In the embodiment, it has been described that the calculation unit 12b calculates the TAPD for each provided information in the calculation determination process. However, when the content of the propagation information DB 13b is updated in the information acquisition process, the provided information related to the update is provided. Can be calculated and stored in the propagation information DB 13b. In this case, in the calculation determination process, the calculation unit 12b can acquire the TAPD from the propagation information DB 13b and derive a regression equation between the acquired TAPD and the number of persons transmitted. Since TAPD itself is also effective information for predicting information propagation, only TAPD may be transmitted to the terminal device 4 without deriving a regression equation or calculating IPIX.

(伝播情報DBについて)
実施の形態では、伝播情報を図2(b)に例示した伝播情報DB13bに格納すると説明したが、「情報ID」、「送信者ID」、「受信者ID」、「伝播距離」、「更新日時」、をデータ項目とするリストデータとしての伝播情報を記憶部13に格納してもよい。例えば、最初に情報を提供した情報伝播者Aが情報伝播者BとCに情報を発信した場合は、「001,userA,userA,0,200810081420」、「001,userA,userB,1,200810081420」、「001,userA,userC,1,200810081420」の如きリストデータが格納される。また、BがDに転送した場合は、「001,userB,userD,2,200810081530」の如きリストデータが格納される。この場合、例えば情報ID「001」に対応する情報の伝播人数を特定するためには、当該情報ID「001」を含むリストデータの数を調べることで伝播人数を特定することができる。
(About propagation information DB)
In the embodiment, it has been described that propagation information is stored in the propagation information DB 13b illustrated in FIG. 2B. However, “information ID”, “sender ID”, “receiver ID”, “propagation distance”, “update” Propagation information as list data having “date and time” as a data item may be stored in the storage unit 13. For example, when the information propagator A who first provided the information sends information to the information propagators B and C, “001, userA, userA, 0, 200800810081420”, “001, userA, userB, 1,00810081420” , “001, userA, userC, 1,00810081420” are stored. When B transfers to D, list data such as “001, userB, userD, 2, 20080081530” is stored. In this case, for example, in order to identify the number of people who propagate information corresponding to the information ID “001”, the number of people propagated can be identified by examining the number of list data including the information ID “001”.

(変形例−分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、情報分析装置10と情報提供装置3を相互に統合してもよい。
(Modification-About distribution and integration)
Further, each of the electrical components described above is functionally conceptual and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each part is not limited to the one shown in the figure, and all or a part thereof may be functionally or physically distributed / integrated in arbitrary units according to various loads and usage conditions. Can be configured. For example, the information analysis device 10 and the information providing device 3 may be integrated with each other.

情報分析システムの全体構成を機能概念的に示す説明図である。It is explanatory drawing which shows the whole structure of an information analysis system functionally conceptually. (a)はユーザ情報DBに格納されている情報を示す表、(b)は伝播情報DBに格納されている情報を示す表である。(A) is a table | surface which shows the information stored in user information DB, (b) is a table | surface which shows the information stored in propagation information DB. 情報取得処理のフローチャートである。It is a flowchart of an information acquisition process. 算定判定処理のフローチャートである。It is a flowchart of a calculation determination process. 横軸を伝播人数、縦軸をTAPDとして、各提供情報についてのデータをプロットした散布図である。It is the scatter diagram which plotted the data about each provision information by making a horizontal axis the propagation number of persons and a vertical axis | shaft with TAPD.

符号の説明Explanation of symbols

1 情報分析システム
2 ネットワーク
3 情報提供装置
4 端末装置
10 情報分析装置
11 ネットワークIF
12 制御部
12a 情報取得部
12b 算定部
12c 判定部
13 記憶部
13a ユーザ情報DB
13b 伝播情報DB
DESCRIPTION OF SYMBOLS 1 Information analysis system 2 Network 3 Information provision apparatus 4 Terminal apparatus 10 Information analysis apparatus 11 Network IF
12 control unit 12a information acquisition unit 12b calculation unit 12c determination unit 13 storage unit 13a user information DB
13b Propagation information DB

Claims (6)

情報伝播者によって伝播された情報を格納する情報提供装置に対して、ネットワークを介して通信可能に接続された情報分析装置であって、
前記情報伝播者を一意に識別するためのユーザID、当該情報伝播者が属する分類、及び重み係数を、相互に関連付けて格納するユーザ情報DBと、
前記情報を伝播した情報伝播者のユーザID、複数の前記情報伝播者を介した前記情報の伝播の連鎖回数に対応する伝播距離、及び前記伝播を行った前記複数の情報伝播者の伝播人数を相互に関連付けて格納する伝播情報DBと、
前記伝播情報DBに格納されている前記伝播距離及び前記伝播人数と、前記情報を伝播した情報伝播者のユーザIDに対応する分類に関連付けて前記ユーザ情報DBに格納されている重み係数とに基づいて、前記情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定手段と、
を備えることを特徴とする情報分析装置。
An information analysis device connected to be able to communicate via a network with respect to an information providing device that stores information propagated by an information propagator,
A user ID for uniquely identifying the information propagator, a classification to which the information propagator belongs, and a user information DB that stores the weighting coefficient in association with each other;
The user ID information propagation who propagate the information, the propagation distance corresponding to the chain number of the propagation of the information through the plurality of the information propagation person, and the propagation number of the plurality of information propagation who performed the propagation Propagation information DB stored in association with each other;
Based on the propagation distance and the number of propagation people stored in the propagation information DB, and the weighting factor stored in the user information DB in association with the classification corresponding to the user ID of the information propagator who propagated the information Calculating means for calculating a weighted average propagation distance indicating the possibility of propagation of the information;
An information analysis apparatus comprising:
前記算定手段は、前記重み付け平均伝播距離を以下の算定式を用いて算定すること(ここで、tapd(m)は前記重み付け平均伝播距離、l(m,u)は前記情報mを受け取った前記情報伝播者uにおける前記伝播距離(ただし、前記情報を最初に提供した前記情報伝播者uにおける当該伝播距離は0とする)、|R|は前記伝播人数、phase(sender)は前記情報を提供した前記情報伝播者senderが属する前記分類に対応する重み係数、phase(u)は前記情報を受け取った前記情報伝播者uが属する前記分類に対応する重み係数、kは所定の重み付け定数)、
Figure 0004374417
を特徴とする請求項1に記載の情報分析装置。
The calculating means calculates the weighted average propagation distance using the following calculation formula (where tapd (m) is the weighted average propagation distance and l (m, u) is the information m received: The propagation distance in the information propagator u (provided that the propagation distance in the information propagator u that first provided the information is 0), | R | is the number of propagators, and phase (sender) provides the information A weighting factor corresponding to the classification to which the information propagator sender belongs, phase (u) is a weighting factor corresponding to the classification to which the information propagator u that has received the information belongs, k is a predetermined weighting constant),
Figure 0004374417
The information analysis apparatus according to claim 1.
前記算定手段は、
複数の前記情報毎に前記伝播距離と前記伝播人数とに基づいて前記重み付け平均伝播距離を算定し、
前記算定した重み付け平均伝播距離と前記伝播人数との間の回帰式を導出し、
複数の前記情報の中から所定方法で特定された分析対象の情報についての前記伝播人数を、前記回帰式に代入することにより得られた値を、前記分析対象の情報の基準伝播距離とし
前記分析対象の情報の前記重み付け平均伝播距離を、前記分析対象の情報の前記基準伝播距離で除することにより得られた値を、前記分析対象の情報の伝播力を示す情報伝播力指数すること、
を特徴とする請求項1又は2に記載の情報分析装置。
The calculating means is
Calculate the weighted average propagation distance based on the propagation distance and the number of propagation persons for each of a plurality of the information,
Deriving a regression equation between the calculated weighted average propagation distance and the number of propagation persons,
The propagation number for analyte information specified by a predetermined method from among the plurality of the information, a value obtained by substituting the regression equation, a reference propagation distance of the analyte information,
The weighted average propagation distance of the analyte information, a value obtained by dividing the reference propagation distance of the analyte information, the information diffusion force index indicating a propagation force of the analyte information thing,
The information analysis apparatus according to claim 1 or 2, characterized by the above.
前記算定手段が算定した前記情報伝播力指数と所定の基準値とを比較することにより、前記分析対象の情報の伝播の可能性を判定する判定手段、
を備えることを特徴とする請求項3に記載の情報分析装置。
A determination means for determining the possibility of propagation of the information to be analyzed by comparing the information propagation power index calculated by the calculation means with a predetermined reference value;
The information analysis apparatus according to claim 3, further comprising:
前記情報は、ブログを介して伝播する情報であり、
前記情報伝播者は、前記ブログによる前記情報の発信者であり、
前記分類は、前記ブログの影響力に基づいて前記発信者を区分するための分類であること、
を特徴とする請求項1から4のいずれか一項に記載の情報分析装置。
The information is information propagated through a blog,
The information propagator is a sender of the information by the blog,
The classification is a classification for classifying the caller based on the influence of the blog;
The information analysis device according to any one of claims 1 to 4, wherein
情報伝播者によって伝播された情報を格納する情報提供装置に対して、ネットワークを介して通信可能に接続された情報分析装置としてのコンピュータに実行させる情報分析プログラムであって、
前記コンピュータを、
前記情報伝播者を一意に識別するためのユーザID、当該情報伝播者が属する分類、及び重み係数を、相互に関連付けて格納するユーザ情報DBと、
前記情報を伝播した情報伝播者のユーザID、複数の前記情報伝播者を介した前記情報の伝播の連鎖回数に対応する伝播距離、及び前記伝播を行った前記複数の情報伝播者の伝播人数を相互に関連付けて格納する伝播情報DBと、
前記伝播情報DBに格納されている前記伝播距離及び前記伝播人数と、前記情報を伝播した情報伝播者のユーザIDに対応する分類に関連付けて前記ユーザ情報DBに格納されている重み係数とに基づいて、前記情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定手段と、
として機能させるための情報分析プログラム。
An information analysis program that causes a computer as an information analysis apparatus connected to be able to communicate via a network to an information providing apparatus that stores information propagated by an information propagator,
The computer,
A user ID for uniquely identifying the information propagator, a classification to which the information propagator belongs, and a user information DB that stores the weight coefficient in association with each other;
The user ID of the information propagator who propagated the information, the propagation distance corresponding to the number of chain propagation of the information via the plurality of information propagators, and the number of propagation of the plurality of information propagators who performed the propagation Propagation information DB stored in association with each other;
Based on the propagation distance and the number of propagation people stored in the propagation information DB, and a weighting factor stored in the user information DB in association with the classification corresponding to the user ID of the information propagator who propagated the information Calculating means for calculating a weighted average propagation distance indicating the possibility of propagation of the information;
Information analysis program to function as
JP2008282457A 2008-10-31 2008-10-31 Information analysis apparatus and information analysis program Active JP4374417B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008282457A JP4374417B1 (en) 2008-10-31 2008-10-31 Information analysis apparatus and information analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008282457A JP4374417B1 (en) 2008-10-31 2008-10-31 Information analysis apparatus and information analysis program

Publications (2)

Publication Number Publication Date
JP4374417B1 true JP4374417B1 (en) 2009-12-02
JP2010108444A JP2010108444A (en) 2010-05-13

Family

ID=41459692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008282457A Active JP4374417B1 (en) 2008-10-31 2008-10-31 Information analysis apparatus and information analysis program

Country Status (1)

Country Link
JP (1) JP4374417B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5791455B2 (en) * 2011-10-05 2015-10-07 Kddi株式会社 User classification device, user classification method, and program
EP3100221A4 (en) * 2014-01-29 2017-07-19 Nokia Technologies OY Method, apparatus and system for content recommendation

Also Published As

Publication number Publication date
JP2010108444A (en) 2010-05-13

Similar Documents

Publication Publication Date Title
Xuan et al. Uncertainty analysis for the keyword system of web events
Fang et al. An estimation of distribution algorithm and new computational results for the stochastic resource-constrained project scheduling problem
Bryden et al. Word usage mirrors community structure in the online social network Twitter
KR101681250B1 (en) Network-aware product rollout in online social networks
Quercia et al. Friendsensing: recommending friends using mobile phones
Le et al. Probabilistic mapping of descriptive health status responses onto health state utilities using Bayesian networks: an empirical analysis converting SF-12 into EQ-5D utility index in a national US sample
KR101519401B1 (en) Method of parameterizing rules for broadcasting personal data
TW201443811A (en) Social media impact assessment (1)
Briley et al. Nonparametric estimates of gene× environment interaction using local structural equation modeling
CN103927297A (en) Evidence theory based Chinese microblog credibility evaluation method
Lin et al. Blog popularity mining using social interconnection analysis
JP2016045504A (en) Method, system, and program for generating teacher data for eliminating ambiguity
Wang et al. An adaptive multivariate CUSUM control chart for signaling a range of location shifts
Zhao et al. Power‐law link strength distribution in paper cocitation networks
WO2012073718A1 (en) Content analyzing system, content analyzing apparatus, content analyzing method, and content analyzing program
JPWO2012017786A1 (en) Communication support device, communication support method, and program
JP4374417B1 (en) Information analysis apparatus and information analysis program
TWI480749B (en) Method of identifying organic search engine optimization
Yu et al. Link prediction in directed network and its application in microblog
Shirgahi et al. A new method of trust mirroring estimation based on social networks parameters by fuzzy system
Avrachenkov et al. Subsampling for chain-referral methods
Boczar et al. Determining the repeatability of acoustic emission generated by the Hsu-Nielsen calibrating source
JP5165722B2 (en) Information providing server and information providing system
JP6838007B2 (en) Information processing system
Koopmeiners et al. Early termination of a two‐stage study to develop and validate a panel of biomarkers

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090805

R150 Certificate of patent or registration of utility model

Ref document number: 4374417

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250