JP4374417B1 - Information analysis apparatus and information analysis program - Google Patents
Information analysis apparatus and information analysis program Download PDFInfo
- Publication number
- JP4374417B1 JP4374417B1 JP2008282457A JP2008282457A JP4374417B1 JP 4374417 B1 JP4374417 B1 JP 4374417B1 JP 2008282457 A JP2008282457 A JP 2008282457A JP 2008282457 A JP2008282457 A JP 2008282457A JP 4374417 B1 JP4374417 B1 JP 4374417B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- propagation
- propagator
- user
- propagation distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる情報分析装置及び情報分析プログラムを提供すること。
【解決手段】情報伝播者によって伝播された情報を格納する情報提供装置3に対して、ネットワーク2を介して通信可能に接続された情報分析装置10であって、複数の情報伝播者を介した情報の伝播の連鎖回数に対応する伝播距離、伝播を行った複数の情報伝播者の伝播人数、及び伝播を行った情報伝播者が属する分類、を取得する情報取得部12aと、この情報取得部12aにて取得された伝播距離及び伝播人数と、情報取得手段にて取得された分類に基づいて決定される重み係数とに基づいて、情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定部12bを備える。
【選択図】図1To provide an information analysis apparatus and an information analysis program capable of discovering information having high propagating property early without depending on the content of the information.
An information analysis apparatus connected to an information providing apparatus for storing information propagated by an information propagator via a network so as to communicate with the information provider. An information acquisition unit 12a that acquires a propagation distance corresponding to the number of information propagation chains, the number of propagation of a plurality of information propagators who performed propagation, and a classification to which the information propagator who performed the propagation belongs, and this information acquisition unit The weighted average propagation distance indicating the possibility of information propagation is calculated based on the propagation distance and propagation number acquired in 12a and the weighting factor determined based on the classification acquired by the information acquisition means. The calculating part 12b is provided.
[Selection] Figure 1
Description
本発明は、WEB上において情報伝播者によって伝播される各種の情報を分析する情報分析装置及び情報分析プログラムに関する。 The present invention relates to an information analysis apparatus and an information analysis program for analyzing various types of information transmitted by an information propagator on a WEB.
従来、新規市場開拓や需要予測を行うため、ブログやSNS(Social Networking Service)の如きWeb上で発信された情報に基づいて、商品やサービスの流行を予測する方法が提案されている。 2. Description of the Related Art Conventionally, in order to develop a new market and predict demand, a method for predicting the fashion of products and services based on information transmitted on the Web such as a blog or SNS (Social Networking Service) has been proposed.
例えば、ブログ記事等の情報から抽出したキーワードを抽出し、このキーワードの使用状況を定量化し、定量化したキーワードの使用状況を時系列で監視することで、近い将来の流行を予測するトレンド予測装置が提案されている(例えば、特許文献1参照)。 For example, a trend prediction device that extracts keywords extracted from information such as blog articles, quantifies the usage status of the keywords, and monitors the quantified keyword usage status in time series, thereby predicting a trend in the near future Has been proposed (see, for example, Patent Document 1).
しかしながら、このような従来の方法では、キーワードという「情報の内容」に依存して予測を行っていたので、情報の内容自体が不明確である伝播の初期段階では当該情報の内容を適切に設定することが困難であり、既にある程度伝播している情報についてしか予測を行うことができなかった。あるいは、監視対象としたキーワードが何らかの理由によって意図的に隠語や略語等に置き換えられて情報が発信される場合もあり、このような場合には、実質的には当該キーワードが示す情報と同様の情報であるにも関わらず当該キーワードを含んだ情報として把握されない可能性があるほか、キーワードを想定すること自体が困難な場合もあった。 However, in such a conventional method, the prediction is performed depending on the keyword “information content”, so that the information content is appropriately set at the initial stage of propagation when the information content itself is unclear. It was difficult to do so, and it was only possible to predict information that had already been propagated to some extent. Alternatively, there are cases where the keyword to be monitored is intentionally replaced with a secret word or abbreviation for some reason and information is transmitted. In such a case, the keyword is substantially the same as the information indicated by the keyword. Although it is information, it may not be grasped as information including the keyword, and it may be difficult to assume the keyword itself.
そこで、本願発明者等は、情報の内容ではなく、複数の情報伝播者の相互間における「情報の伝播形態」に注目して予測を行う手法を提案した。この手法では、情報の伝播形態を、情報の伝播元となった情報伝播者を「親」とすると共に情報の伝播先となった情報伝播者を「子」とした木構造(以下「伝達木」)でとらえ、情報の平均的な伝播距離を示す指標である「平均伝播距離」を算定し、この平均伝播距離によって情報の伝播形態を評価する。例えば、この平均伝播距離が長い傾向がある情報は、ユーザにとって面白いあるいは重要な情報だと判断される傾向がある。このような手法によれば、「情報の内容」に依存することなく情報伝播の予測を行うことができ、伝播の初期段階や情報の内容が意図的に改変される場合であっても、伝播情報を早期に発見できる可能性がある(例えば、非特許文献1参照)。 Accordingly, the inventors of the present application have proposed a method of making a prediction by paying attention not to the content of information but to an “information propagation form” among a plurality of information propagators. In this method, the information propagation form is a tree structure in which the information propagator that is the information propagation source is “parent” and the information propagator that is the information propagation destination is “child” (hereinafter “transmission tree”). )), An “average propagation distance” that is an index indicating an average propagation distance of information is calculated, and the propagation form of information is evaluated based on the average propagation distance. For example, information that tends to have a long average propagation distance tends to be judged as interesting or important information for the user. According to such a method, information propagation can be predicted without depending on “content of information”, and even if the initial stage of propagation or the content of information is intentionally altered, There is a possibility that information can be discovered early (see, for example, Non-Patent Document 1).
ここで、一般に、ブログやSNSを介して情報を伝播する情報伝播者は、情報伝播における影響度に応じて分類することができる。例えば、流行に至る可能性のあるアイテムにいち早く着目する「サイバーブロガ」、このサイバーブロガと比較して流行に至る可能性のあるアイテムに着目するタイミングは遅いものの他の情報伝播者に対してある程度の影響力を有する「オピニオンリーダ」、これらオピニオンリーダやサイバーブロガに該当しない「一般ブロガ」に分類することができる。そして、サイバーブロガからオピニオンリーダへ伝播された情報や、オピニオンリーダから一般ブロガへ伝播された情報のように、分類を跨いで伝播された情報は、単に同一の分類の中で伝播された情報に比べて、情報の伝播性が高いことを示していると考えられる。 Here, generally, the information propagator who propagates information via a blog or SNS can be classified according to the degree of influence in information propagation. For example, “Cyber bloggers” that focus on items that are likely to become epidemic early, and to some extent for other information disseminators who are late in focusing on items that are likely to become epidemic compared to this cyber blogger Can be classified into “opinion leaders” having the influence of “general” and “general bloggers” not corresponding to these opinion leaders or cyber bloggers. Information propagated across classifications, such as information propagated from cyber bloggers to opinion leaders and information propagated from opinion leaders to general bloggers, is simply changed to information propagated within the same classification. Compared to this, it is considered that the information has high propagating properties.
しかしながら、非特許文献1において本願発明者等が提案した平均伝播距離を用いた情報伝播予測手法では、このような情報伝播者の影響度までは考慮しておらず、情報伝播の際に情報伝播者の分類を跨いだ場合と跨がなかった場合との間で情報の伝播距離に差を設けていなかった。このため、複数の分類における情報伝播者が重要だと判断した情報と、単一分類における情報伝播者のみが重要だと判断した情報との間で、伝播形態の評価に差異を付けることができず、分類を跨いで情報が伝播した事実を情報の伝播予測に反映させることができない可能性があった。
However, the information propagation prediction method using the average propagation distance proposed by the inventors of the present application in Non-Patent
本発明は、上記に鑑みてなされたものであって、伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる、情報分析装置及び情報分析プログラムを提供することを目的とする。 The present invention has been made in view of the above, and provides an information analysis apparatus and an information analysis program that can discover information having high propagating properties early without depending on the content of the information. With the goal.
この請求項1、2、又は6に記載の情報分析装置又は情報分析プログラムによれば、複数の情報伝播者を介した情報の伝播の連鎖回数に対応する伝播距離と、伝播を行った複数の情報伝播者の伝播人数と、伝播を行った情報伝播者が属する分類に基づく重み係数とに基づいて、重み付け平均伝播距離が算定されるので、情報の伝播形態に着目して伝播予測を行う上で、情報伝播者の分類を跨いで情報が伝播した事実を伝播予測に反映させることができるため、伝播性が高い情報を、当該情報の内容に依存せずに早期に発見することができる。
According to the information analysis apparatus or the information analysis program according to
また、請求項3に記載の情報分析装置によれば、複数の情報毎に伝播距離と伝播人数とに基づいて平均伝播距離を算定し、当該算定した平均伝播距離と伝播人数との間の回帰式を導出し、分析対象の情報についての伝播人数を回帰式に代入して基準伝播距離を算定し、当該基準伝播距離と分析対象の情報の重み付け平均伝播距離とに基づいて、情報の伝播力を示す情報伝播力指数を算定するので、分析対象の情報の伝播人数の大小に関わらず、情報の伝播力を対比可能な客観的な指標を得ることができる。
According to the information analysis apparatus of
また、請求項4に記載の情報分析装置によれば、分析対象の情報の伝播の可能性を基準値を用いて自動的に判定することで、伝播性が高い情報を、当該情報の内容に依存せずに正確かつ迅速に把握することが可能となる。 In addition, according to the information analysis device of the fourth aspect, by automatically determining the possibility of propagation of the information to be analyzed using the reference value, the information having high propagation property is changed to the content of the information. It becomes possible to grasp accurately and quickly without depending on it.
また、請求項5に記載の情報分析装置によれば、情報は、ブログを介して伝播する情報であり、情報伝播者は、ブログによる前記情報の発信者であり、分類は、ブログの影響力に基づいて前記発信者を区分するための分類であるので、近年の情報伝播に大きな影響力を発揮するブログによる情報伝播の可能性を、ブログの発信者の影響力に基づく分類を考慮に入れて判定することができる。
Further, according to the information analysis apparatus according to
以下に添付図面を参照して、この発明に係る情報分析装置及び情報分析プログラムの実施の形態を詳細に説明する。 Embodiments of an information analysis apparatus and an information analysis program according to the present invention will be described below in detail with reference to the accompanying drawings.
(構成)
まず、情報分析システムの構成を説明する。図1は情報分析システムの全体構成を機能概念的に示す説明図である。この情報分析システム1は、インターネット等のネットワーク2を介して、複数の情報提供装置3、複数の端末装置4、及び情報分析装置10を相互に通信可能に接続して構成されている。
(Constitution)
First, the configuration of the information analysis system will be described. FIG. 1 is an explanatory diagram conceptually showing the overall configuration of the information analysis system. The
(構成−情報提供装置)
情報提供装置3は、例えば、SNSサーバや、各種ブログサイトのサーバの如き公知のWebサーバとして構成することができ、その具体的な提供情報の内容は任意である。この情報提供装置3は、端末装置4や情報分析装置10からの要求に応じて、情報伝播者から提供された情報を格納したり、当該格納した情報を当該端末装置4や当該情報分析装置10に送信する機能を有する。
(Configuration-Information provision device)
The
(構成−端末装置)
端末装置4は、情報伝播者が情報提供装置3との間において情報の入出力を行い、あるいは情報分析システム1を使用する分析者が情報分析装置10との間において情報の入出力を行うための端末であり、公知のパーソナルコンピュータとして構成することができる。
(Configuration-terminal device)
In the
(構成−情報分析装置)
情報分析装置10は、ネットワークインタフェース(以下「ネットワークIF」)11、制御部12、及び記憶部13をバスにて通信可能に接続して構成されている。
(Configuration-Information analyzer)
The
ネットワークIF11は、情報分析装置10がネットワーク2を介した通信を行うための通信制御インターフェースであり、入力手段及び出力手段である。このネットワークIF11は、例えばネットワークボードとして構成されている。
The network IF 11 is a communication control interface for the
制御部12は、情報分析装置10の各部を制御する制御手段であり、機能概念的に、情報取得部12a、算定部12b、及び判定部12cを備える。情報取得部12aは、情報の伝播形態に関する伝播情報をネットワーク2を介して情報提供装置3から取得する情報取得手段である。算定部12bは、後述する各種の数値や回帰式を算定する算定手段である。判定部12cは、情報の伝播の可能性を判定する判定手段である。この制御部12は、具体的には、CPU(Central Processing Unit)や、このCPU上で解釈実行される各種のプログラム(OSなどの制御プログラムや、各種の処理手順などを規定したプログラム)、及び所要プログラムや所要データを格納するための内部メモリを備えて構成される。
The
記憶部13は、例えばハードディスクやその他の記録媒体によって構成されており、ユーザ情報データベース(以下「DB」)13a及び伝播情報DB13bを備えている。
The
ユーザ情報DB13aは、情報提供装置3に情報を提供する情報伝播者に関する情報(以下、ユーザ情報)を格納するための情報伝播者格納手段であり、図2(a)に例示するように、DB項目として「ユーザID」「格納先」「分類」「重み係数」を備え、これらに対応する情報が相互に関連付けられて格納されている。項目「ユーザID」に対応して格納される情報は、情報伝播者を一意に識別するための識別情報である。項目「格納先」に対応して格納される情報は、各情報伝播者から提供される提供情報の格納先(ここでは情報提供装置3)を示す情報であり、例えばURLアドレスやRSS(Rich Site Summary 又は RDF Site Summary)である。項目「分類」に対応して格納される情報は、所定の基準に基づく情報伝播者の分類を特定するための情報であり、各情報伝播者が提供する提供情報の内容に応じた分類である「得意カテゴリ」や、情報伝播者の情報提供における影響度に応じた分類である「クラス」に対応する情報を格納する。「クラス」に対応して格納される情報としては、例えば、上述した「サイバーブロガ(以下、サイバー)」、「オピニオンリーダ(以下、OP)」、「一般ブロガ(以下、一般)」等の情報を用いることができる。項目「重み係数」に対応して格納される情報は、算定部12bが重み付け平均伝播距離を算定する際に用いられる重み係数であり、ここでは、重み係数は各情報伝播者が属する分類に基づいて決定されており、例えば情報伝播者のクラスがサイバーの場合は「0」、OPの場合は「1」、「一般」の場合は「2」を格納する。これらの各情報をユーザ情報DB13aに格納するタイミングや方法は任意であり、例えば分析者によって端末装置4からネットワーク2を介して入力され、当該ユーザ情報DB13aに格納される。
The
図1の伝播情報DB13bは、情報の伝播形態に関する情報(以下、伝播情報)を格納するための伝播情報格納手段であり、図2(b)に例示するように、DB項目として「情報ID」、「提供ユーザID」、「伝播ユーザID」、「伝播人数」、「更新日」、を備え、これらに対応する情報が相互に関連付けて格納されている。項目「情報ID」に対応して格納される情報は、情報伝播者によって提供され、他の情報伝播者を介して伝播される情報を一意に識別するための情報である。項目「提供ユーザID」に対応して格納される情報は、各情報を最初に情報提供装置3に提供した情報伝播者を特定するための情報であり、例えば情報を提供した情報伝播者のユーザIDが格納される。項目「伝播ユーザID」に対応して格納される情報は、情報提供装置3に提供された情報を伝播した情報伝播者を特定するための情報であり、例えば、情報を伝播した情報伝播者のユーザIDを、当該情報の伝播順に、情報の伝播元のユーザIDと伝播先のユーザIDとを相互に対応付けて格納する。図2(b)に示した例では、UID005の情報伝播者からUID419の情報伝播者に伝播された情報が、さらにUID420及びUID690の情報伝播者に伝播されたこと等を示している。さらに、この項目「伝播ユーザID」に対応して、各情報伝播者に情報が伝播されるまでの伝播の連鎖回数に対応する伝播距離を特定するための情報が、ユーザIDに付随して格納される。例えば図2(b)に示したように、UID005の情報伝播者によって提供された情報がUID419及びUID690の情報伝播者を介してUID377の情報伝播者まで伝播された場合、伝播の連鎖回数は3回であるので、ユーザIDに付随して伝播距離「3」が格納される(図2(b)における「UID377(3)」)。項目「伝播人数」に対応して格納される情報は、伝播を行った複数の情報伝播者の伝播人数を各情報毎に特定するための情報である。項目「更新日」に対応して格納される情報は、各情報毎に伝播情報DB13bの内容が更新された日を特定するための情報である。これらの各情報を伝播情報DB13bに格納するタイミングや方法は任意であり、例えば後述する情報取得処理において、情報提供装置3からネットワーク2を介して情報取得部12aによって取得され、当該伝播情報DB13bに格納される。
The
(処理)
次に、図1に示した情報分析装置10にて行われる処理について、情報取得処理と算定判定処理に大別して説明する。
(processing)
Next, the processing performed by the
(処理−情報取得処理)
図3は情報取得処理のフローチャートである。この情報取得処理を繰り返し実行することにより、伝播情報DB13bに常に最新の伝播情報を格納しておくことが可能となる。
(Processing-Information acquisition processing)
FIG. 3 is a flowchart of the information acquisition process. By repeatedly executing this information acquisition process, the latest propagation information can always be stored in the
この情報取得処理の前提として、分析者は、分析対象となる情報を情報提供装置3に提供する情報伝播者のブログを任意の方法で特定し、当該情報伝播者及びブログに関する情報をユーザ情報DB13aに格納する。その後、情報分析装置10に所定方法で情報取得処理の開始が指示されると、情報取得部12aは、ユーザ情報DB13aの格納先を参照して情報提供装置3に対するクローリングを行い(SA1)、情報伝播者によって新たに情報が提供されたか否かを公知の手法で判定する(SA2)。
As a premise of this information acquisition processing, the analyst specifies the blog of the information propagator who provides information to be analyzed to the
そして、情報取得部12aは、新たに情報提供がされない間(SA2、No)はクローリングを続行し(SA1)、新たに情報提供がされたものと判定した場合(SA2、Yes)、当該提供された情報(以下「提供情報」)が伝播情報DB13bに登録済みか否かを判定する(SA3)。例えば、この判定には、この提供情報に含まれているリンク先情報やトラックバック先情報を用いることができる。具体的には、この提供情報にリンク先情報やトラックバック先情報が含まれているか否かを判定し、これらの情報が含まれていない場合には、当該提供情報は登録済みではない新規な提供情報であると判定し、これらの情報が含まれている場合には、当該提供情報は登録済みの提供情報であると判定する。
Then, the
そして、提供情報が登録済みではない新規な提供情報であると判定した場合(SA3、No)、情報取得部12aは、この提供情報の格納先に基づいてユーザ情報DB13aを参照することにより、この提供情報を提供した情報伝播者(以下「提供ユーザ」)のユーザIDを特定する(SA6)。さらに、情報取得部12aは、この提供ユーザが提供した提供情報に新規の情報IDを割り当てる(SA7)。そして、情報取得部12aは、これらユーザIDと情報IDを用いて、伝播情報DB13bの内容を更新する(SA8)。すなわち、SA7で割り当てた情報IDを項目「情報ID」に新たに格納し、この情報IDに対応付けて、SA6で特定したユーザIDを項目「提供ユーザID」に格納し、当該更新を行った日を項目「更新日」に格納する。
And when it determines with provision information being new provision information which has not been registered (SA3, No), the
一方、提供情報が登録済みの提供情報であると判定した場合(SA3、Yes)、情報取得部12aは、この提供情報の格納先に基づいてユーザ情報DB13aを参照することにより、この提供情報を伝播した情報伝播者(以下「伝播ユーザ」)のユーザIDを特定する(SA4)。さらに、情報取得部12aは、この提供情報に含まれているリンク先情報やトラックバック先情報に基づいて、この提供情報の伝播元となった情報(以下「伝播元情報」)を提供した情報伝播者(以下「伝播元ユーザ」)のユーザIDを特定する(SA5)。その後、情報取得部12aは、これら特定した情報に基づいて、伝播情報DB13bの内容を更新する(SA8)。すなわち、項目「提供ユーザID」又は「伝播ユーザID」における当該特定された伝播元ユーザのユーザIDに対応付けて、SA4で特定した伝播ユーザのユーザID及び伝播距離を項目「伝播ユーザID」に格納し、また当該特定された伝播元ユーザのユーザIDに対応する伝播人数を増分すると共に、当該特定された伝播元ユーザのユーザIDに対応する更新日を更新する。以降同様に、SA1からSA8を再帰的に行う。
On the other hand, when it is determined that the provision information is registered provision information (SA3, Yes), the
(処理−算定判定処理)
次に、各種数値を算定して情報の伝播の可能性を判定する算定判定処理について説明する。図4は算定判定処理のフローチャートである。この算定判定処理は、例えば分析者がネットワーク2を介して端末装置4から情報分析装置10に算定判定処理の実行指示を入力した場合に起動される。この際、分析者により、分析対象情報を特定する情報IDが情報分析装置10に入力される。
(Processing-Calculation judgment process)
Next, calculation determination processing for calculating various numerical values to determine the possibility of information propagation will be described. FIG. 4 is a flowchart of the calculation determination process. This calculation determination process is started, for example, when an analyst inputs an execution instruction for the calculation determination process from the
算定判定処理が起動されると、算定部12bは情報取得部12aにて取得された情報(ここでは伝播情報DB13bに格納された情報)を参照し、各提供情報についての伝播情報(例えば伝播ユーザID、伝播距離、伝播人数)を取得する(SB1)。さらに、取得した各伝播ユーザIDに基づいてユーザ情報DB13aを参照し、各伝播ユーザIDに対応する重み係数を取得する(SB2)。そして、SB1で取得した伝播距離及び伝播人数と、SB2で取得した重み係数とに基づいて、各提供情報毎に重み付け平均伝播距離(Trend−weighted Average Propagation Distance、以下「TAPD」)を算定する(SB3)。
When the calculation determination process is activated, the
このTAPDは、以下の算定式を用いて算定される(ここで、tapd(m)はTAPD、l(m,u)は分析対象情報mを受け取った伝播ユーザuにおける伝播距離(ただし、分析対象情報を最初に提供した提供ユーザuにおける当該伝播距離は0とする)、|R|は伝播人数、phase(sender)は分析対象情報を提供した伝播元ユーザsenderが属する分類に対応する重み係数、phase(u)は分析対象情報を受け取った伝播ユーザuが属する分類に対応する重み係数、kは所定の重み付け定数)。なお、「phase(sender)−phase(u)」に対する絶対値を取っているのは、サイバーブロガから一般ブロガに情報が伝播された場合のみならず、一般ブロガからサイバーブロガに情報が伝播された場合にも、分類を跨いで情報が伝播されたという事実としては伝播予測に対して同様の影響度を持つためである。
このように、伝播ユーザの分類に応じて伝播距離に重み付けを行うことにより、相互に異なる分類に属する伝播ユーザ間を跨いで情報の伝播が行われた場合の影響を、TAPDに反映させることができる。例えば、重み付け定数kの値を1よりも大きくした場合、サイバーからOPへ伝播された情報や、OPから一般へ伝播された情報のように、分類を跨いで伝播された情報については、相対的にTAPDが大きくなるため、情報の伝播性が高いことが数値的に表される。 In this way, by weighting the propagation distance according to the propagation user classification, it is possible to reflect the effect when information is propagated across propagation users belonging to different classifications in TAPD. it can. For example, when the value of the weighting constant k is larger than 1, information that is propagated across classifications, such as information propagated from cyber to OP and information propagated from OP to the general public, Since TAPD becomes large, it is numerically expressed that information is highly transmitted.
続いて算定部12bは、SB3で算出したTAPDと伝播人数との間の回帰式を公知の数学的手法を用いて導出する(SB4)。図5は、横軸を伝播人数、縦軸をTAPDとして、各提供情報についてのデータをプロットした散布図であり、図中の直線は算定部12bが導出した回帰式に対応した回帰線である。
Subsequently, the
図4に戻り、算定部12bは、分析対象情報に対応する基準伝播距離を算定する(SB5)。具体的には、分析者にて指示された分析対象情報の情報IDに対応する伝播人数を伝播情報DB13bから取得し、この分析対象情報の伝播人数を、SB4で導出した回帰式に代入することにより、基準伝播距離を算定する。例えば図5に示した回帰線に対応する回帰式(伝播人数に対応する平均的なTAPD(=基準伝播距離)を算定する式)が「y=0.0655x+1.925」であって(yは基準伝播距離、xは伝播人数に対応)、分析対象情報の情報IDに対応する伝播人数が266人である場合、基準伝播距離は19.348となる。
Returning to FIG. 4, the
次いで、算定部12bは、TAPDを基準伝播距離で除することにより、情報伝播力指数(Information Propagation Power Index、以下「IPIX」)を算定する(SB6)。この算定によれば、分析対象情報のTAPDを、各情報のTAPDと伝播人数から得られた相関関係に基づいて、分析対象の情報の伝播人数の大小に影響されない客観性のある指数としてのIPIXに置換することができる。例えば、分析対象情報のTAPDが31.84である場合、これを基準伝播距離19.348で除すると、IPIXが1.65として求められる。
Next, the
その後、判定部12cは、算定部12bが算定したIPIXに基づいて分析対象情報の伝播可能性の判定と、この判定結果の送信を行う(SB7)。例えば、判定部12cは、IPIXを所定の基準値(ここでは1)と比較し、IPIXが基準値より大きい場合(図5においてTAPDが回帰線より上の領域にある場合)は、分析対象情報が伝播する可能性が高いと判定し、IPIXが基準値以下の場合(図5においてTAPDが回帰線上又は回帰線より下の領域にある場合)には、分析対象情報が伝播する可能性が低いか、又はデマによる意図的に伝播されている可能性が高いと判定する。例えば、上述のようにIPIXが1.65と求められた場合、基準値である1より大きいことから、当該分析対象情報が伝播する可能性が高いと判定する。そして、判定部12cは、この判定結果を示す所定の形式の情報を、分析者の端末装置4に送信する。この端末装置4では、分析対象情報の判定結果を示す情報が所定の形式で出力されるため、分析者は、この分析対象情報の伝播の予測結果を把握することが可能となる。
Thereafter, the
〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
[Modifications to Embodiment]
Although the embodiments of the present invention have been described above, the specific configuration and means of the present invention can be arbitrarily modified and improved within the scope of the technical idea of each invention described in the claims. Can do. Hereinafter, such a modification will be described.
(情報取得処理について)
実施の形態では、情報取得処理において、情報取得部12aが伝播情報DB13bの伝播情報の内容を情報提供装置3から取得しているが、最新の伝播情報をその他の任意の方法で伝播情報DB13bに格納しておき、情報取得部12aが必要に応じて伝播情報DB13bから伝播情報を取得して算定部12bに受け渡すようにしてもよい。
(About information acquisition processing)
In the embodiment, in the information acquisition process, the
(算定判定処理について)
実施の形態では、算定判定処理において、算定部12bが各提供情報毎にTAPDを算定すると説明したが、情報取得処理において伝播情報DB13bの内容が更新される際に、当該更新に関連する提供情報についてのTAPDを算定し、伝播情報DB13bに格納させることもできる。この場合、算定判定処理においては、算定部12bは伝播情報DB13bからTAPDを取得し、当該取得したTAPDと伝播人数との間の回帰式を導出することができる。また、TAPD自体も情報伝播を予測する上で有効な情報であるため、回帰式の導出やIPIXの算定を行うことなく、TAPDのみを端末装置4に送信してもよい。
(About calculation judgment processing)
In the embodiment, it has been described that the
(伝播情報DBについて)
実施の形態では、伝播情報を図2(b)に例示した伝播情報DB13bに格納すると説明したが、「情報ID」、「送信者ID」、「受信者ID」、「伝播距離」、「更新日時」、をデータ項目とするリストデータとしての伝播情報を記憶部13に格納してもよい。例えば、最初に情報を提供した情報伝播者Aが情報伝播者BとCに情報を発信した場合は、「001,userA,userA,0,200810081420」、「001,userA,userB,1,200810081420」、「001,userA,userC,1,200810081420」の如きリストデータが格納される。また、BがDに転送した場合は、「001,userB,userD,2,200810081530」の如きリストデータが格納される。この場合、例えば情報ID「001」に対応する情報の伝播人数を特定するためには、当該情報ID「001」を含むリストデータの数を調べることで伝播人数を特定することができる。
(About propagation information DB)
In the embodiment, it has been described that propagation information is stored in the
(変形例−分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、情報分析装置10と情報提供装置3を相互に統合してもよい。
(Modification-About distribution and integration)
Further, each of the electrical components described above is functionally conceptual and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each part is not limited to the one shown in the figure, and all or a part thereof may be functionally or physically distributed / integrated in arbitrary units according to various loads and usage conditions. Can be configured. For example, the
1 情報分析システム
2 ネットワーク
3 情報提供装置
4 端末装置
10 情報分析装置
11 ネットワークIF
12 制御部
12a 情報取得部
12b 算定部
12c 判定部
13 記憶部
13a ユーザ情報DB
13b 伝播情報DB
DESCRIPTION OF
12
13b Propagation information DB
Claims (6)
前記情報伝播者を一意に識別するためのユーザID、当該情報伝播者が属する分類、及び重み係数を、相互に関連付けて格納するユーザ情報DBと、
前記情報を伝播した情報伝播者のユーザID、複数の前記情報伝播者を介した前記情報の伝播の連鎖回数に対応する伝播距離、及び前記伝播を行った前記複数の情報伝播者の伝播人数を相互に関連付けて格納する伝播情報DBと、
前記伝播情報DBに格納されている前記伝播距離及び前記伝播人数と、前記情報を伝播した情報伝播者のユーザIDに対応する分類に関連付けて前記ユーザ情報DBに格納されている重み係数とに基づいて、前記情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定手段と、
を備えることを特徴とする情報分析装置。 An information analysis device connected to be able to communicate via a network with respect to an information providing device that stores information propagated by an information propagator,
A user ID for uniquely identifying the information propagator, a classification to which the information propagator belongs, and a user information DB that stores the weighting coefficient in association with each other;
The user ID information propagation who propagate the information, the propagation distance corresponding to the chain number of the propagation of the information through the plurality of the information propagation person, and the propagation number of the plurality of information propagation who performed the propagation Propagation information DB stored in association with each other;
Based on the propagation distance and the number of propagation people stored in the propagation information DB, and the weighting factor stored in the user information DB in association with the classification corresponding to the user ID of the information propagator who propagated the information Calculating means for calculating a weighted average propagation distance indicating the possibility of propagation of the information;
An information analysis apparatus comprising:
複数の前記情報毎に前記伝播距離と前記伝播人数とに基づいて前記重み付け平均伝播距離を算定し、
前記算定した重み付け平均伝播距離と前記伝播人数との間の回帰式を導出し、
複数の前記情報の中から所定方法で特定された分析対象の情報についての前記伝播人数を、前記回帰式に代入することにより得られた値を、前記分析対象の情報の基準伝播距離とし、
前記分析対象の情報の前記重み付け平均伝播距離を、前記分析対象の情報の前記基準伝播距離で除することにより得られた値を、前記分析対象の情報の伝播力を示す情報伝播力指数とすること、
を特徴とする請求項1又は2に記載の情報分析装置。 The calculating means is
Calculate the weighted average propagation distance based on the propagation distance and the number of propagation persons for each of a plurality of the information,
Deriving a regression equation between the calculated weighted average propagation distance and the number of propagation persons,
The propagation number for analyte information specified by a predetermined method from among the plurality of the information, a value obtained by substituting the regression equation, a reference propagation distance of the analyte information,
The weighted average propagation distance of the analyte information, a value obtained by dividing the reference propagation distance of the analyte information, the information diffusion force index indicating a propagation force of the analyte information thing,
The information analysis apparatus according to claim 1 or 2, characterized by the above.
を備えることを特徴とする請求項3に記載の情報分析装置。 A determination means for determining the possibility of propagation of the information to be analyzed by comparing the information propagation power index calculated by the calculation means with a predetermined reference value;
The information analysis apparatus according to claim 3, further comprising:
前記情報伝播者は、前記ブログによる前記情報の発信者であり、
前記分類は、前記ブログの影響力に基づいて前記発信者を区分するための分類であること、
を特徴とする請求項1から4のいずれか一項に記載の情報分析装置。 The information is information propagated through a blog,
The information propagator is a sender of the information by the blog,
The classification is a classification for classifying the caller based on the influence of the blog;
The information analysis device according to any one of claims 1 to 4, wherein
前記コンピュータを、
前記情報伝播者を一意に識別するためのユーザID、当該情報伝播者が属する分類、及び重み係数を、相互に関連付けて格納するユーザ情報DBと、
前記情報を伝播した情報伝播者のユーザID、複数の前記情報伝播者を介した前記情報の伝播の連鎖回数に対応する伝播距離、及び前記伝播を行った前記複数の情報伝播者の伝播人数を相互に関連付けて格納する伝播情報DBと、
前記伝播情報DBに格納されている前記伝播距離及び前記伝播人数と、前記情報を伝播した情報伝播者のユーザIDに対応する分類に関連付けて前記ユーザ情報DBに格納されている重み係数とに基づいて、前記情報の伝播の可能性を示す重み付け平均伝播距離を算定する算定手段と、
として機能させるための情報分析プログラム。 An information analysis program that causes a computer as an information analysis apparatus connected to be able to communicate via a network to an information providing apparatus that stores information propagated by an information propagator,
The computer,
A user ID for uniquely identifying the information propagator, a classification to which the information propagator belongs, and a user information DB that stores the weight coefficient in association with each other;
The user ID of the information propagator who propagated the information, the propagation distance corresponding to the number of chain propagation of the information via the plurality of information propagators, and the number of propagation of the plurality of information propagators who performed the propagation Propagation information DB stored in association with each other;
Based on the propagation distance and the number of propagation people stored in the propagation information DB, and a weighting factor stored in the user information DB in association with the classification corresponding to the user ID of the information propagator who propagated the information Calculating means for calculating a weighted average propagation distance indicating the possibility of propagation of the information;
Information analysis program to function as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008282457A JP4374417B1 (en) | 2008-10-31 | 2008-10-31 | Information analysis apparatus and information analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008282457A JP4374417B1 (en) | 2008-10-31 | 2008-10-31 | Information analysis apparatus and information analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4374417B1 true JP4374417B1 (en) | 2009-12-02 |
JP2010108444A JP2010108444A (en) | 2010-05-13 |
Family
ID=41459692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008282457A Active JP4374417B1 (en) | 2008-10-31 | 2008-10-31 | Information analysis apparatus and information analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4374417B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5791455B2 (en) * | 2011-10-05 | 2015-10-07 | Kddi株式会社 | User classification device, user classification method, and program |
EP3100221A4 (en) * | 2014-01-29 | 2017-07-19 | Nokia Technologies OY | Method, apparatus and system for content recommendation |
-
2008
- 2008-10-31 JP JP2008282457A patent/JP4374417B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010108444A (en) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xuan et al. | Uncertainty analysis for the keyword system of web events | |
Fang et al. | An estimation of distribution algorithm and new computational results for the stochastic resource-constrained project scheduling problem | |
Bryden et al. | Word usage mirrors community structure in the online social network Twitter | |
KR101681250B1 (en) | Network-aware product rollout in online social networks | |
Quercia et al. | Friendsensing: recommending friends using mobile phones | |
Le et al. | Probabilistic mapping of descriptive health status responses onto health state utilities using Bayesian networks: an empirical analysis converting SF-12 into EQ-5D utility index in a national US sample | |
KR101519401B1 (en) | Method of parameterizing rules for broadcasting personal data | |
TW201443811A (en) | Social media impact assessment (1) | |
Briley et al. | Nonparametric estimates of gene× environment interaction using local structural equation modeling | |
CN103927297A (en) | Evidence theory based Chinese microblog credibility evaluation method | |
Lin et al. | Blog popularity mining using social interconnection analysis | |
JP2016045504A (en) | Method, system, and program for generating teacher data for eliminating ambiguity | |
Wang et al. | An adaptive multivariate CUSUM control chart for signaling a range of location shifts | |
Zhao et al. | Power‐law link strength distribution in paper cocitation networks | |
WO2012073718A1 (en) | Content analyzing system, content analyzing apparatus, content analyzing method, and content analyzing program | |
JPWO2012017786A1 (en) | Communication support device, communication support method, and program | |
JP4374417B1 (en) | Information analysis apparatus and information analysis program | |
TWI480749B (en) | Method of identifying organic search engine optimization | |
Yu et al. | Link prediction in directed network and its application in microblog | |
Shirgahi et al. | A new method of trust mirroring estimation based on social networks parameters by fuzzy system | |
Avrachenkov et al. | Subsampling for chain-referral methods | |
Boczar et al. | Determining the repeatability of acoustic emission generated by the Hsu-Nielsen calibrating source | |
JP5165722B2 (en) | Information providing server and information providing system | |
JP6838007B2 (en) | Information processing system | |
Koopmeiners et al. | Early termination of a two‐stage study to develop and validate a panel of biomarkers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4374417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120918 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |