JP2012008680A - Program and information analyzing device - Google Patents
Program and information analyzing device Download PDFInfo
- Publication number
- JP2012008680A JP2012008680A JP2010142380A JP2010142380A JP2012008680A JP 2012008680 A JP2012008680 A JP 2012008680A JP 2010142380 A JP2010142380 A JP 2010142380A JP 2010142380 A JP2010142380 A JP 2010142380A JP 2012008680 A JP2012008680 A JP 2012008680A
- Authority
- JP
- Japan
- Prior art keywords
- data elements
- node
- data element
- updated
- connection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 abstract description 10
- 238000004458 analytical method Methods 0.000 description 19
- 230000007704 transition Effects 0.000 description 13
- 238000000034 method Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、プログラム及び情報分析装置に関する。 The present invention relates to a program and an information analysis apparatus.
論文、特許文献、ウェブページ等の文書間には引用、参照等の有向の接続関係があり、これらの文書をデータ要素(ノード)、接続関係をリンクとしたネットワークの情報を解析し有意な情報を得ることが行われている。例えば、下記の非特許文献1には、多くの引用を集める文書ほど価値が高くなるようにして、各文書の評価値を算出する技術が記載されている。
There are directed connections such as citations and references between documents such as papers, patent documents, web pages, etc., and network information using these documents as data elements (nodes) and connection relationships as links is significant. Getting information is done. For example, the following Non-Patent
過去の文献を引用する文書群から構成されるネットワークにおいては、リンクを通じて評価値が過去の文書へと流れてしまうため、リンクを仮想的に双方向化して各文書の評価値を算出することが考えられる。この際、被引用数が少ないが引用数の多い文書を不当に高く評価することがないよう、各文書の引用数を規定値に揃えて計算する技術も提案されている。ただし、こうした場合にも、引用数が少ない文書が評価の高い文書を引用していると、実際の文書の価値よりも高い評価値が算出されてしまうことがあった。 In a network composed of documents that cite past documents, the evaluation value flows to the past document through the link. Therefore, it is possible to calculate the evaluation value of each document by virtually bidirectionalizing the link. Conceivable. At this time, a technique has been proposed in which the number of citations of each document is calculated so as to be equal to a specified value so that a document with a small number of citations but a large number of citations is not unreasonably high. However, even in such a case, if a document with a small number of citations cites a document with a high evaluation, an evaluation value higher than the value of the actual document may be calculated.
本発明の目的は、有向の接続関係があるデータ要素間の接続関係を双方向化して各データ要素の評価値を算出する場合に、他のデータ要素への接続数が少ないデータ要素が接続先のデータ要素と結びつきが過度に強くなることを抑制するプログラム及び情報分析装置を提供することにある。 An object of the present invention is to connect a data element having a small number of connections to other data elements when calculating the evaluation value of each data element by bidirectionalizing the connection relation between data elements having a directed connection relation. It is an object of the present invention to provide a program and an information analysis apparatus that suppress an excessively strong connection with a previous data element.
上記目的を達成するために、請求項1に記載の発明は、コンピュータを、複数のデータ要素間に設定された有向の接続関係を示す接続情報を取得する取得手段と、有向の接続関係を有する複数のデータ要素に、当該複数のデータ要素の各データ要素から接続され、且つ、当該複数のデータ要素の各データ要素に接続する仮想データ要素を追加して、前記取得手段により取得される接続情報を更新する第1更新手段と、前記複数のデータ要素のうち他のデータ要素への接続数が予め定められた第1の値に満たないデータ要素を選択すると共に、当該選択したデータ要素の接続数が前記第1の値に達するまで前記仮想データ要素への接続関係を設定して、前記第1更新手段により更新される接続情報を更新する第2更新手段と、前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された、前記第2更新手段により更新される接続情報に示される接続関係を双方向化して、前記第2更新手段により更新される接続情報を更新する第3更新手段と、前記第3更新手段により更新される接続情報に示される各接続関係の重みを算出する算出手段として機能させるためのプログラムである。
In order to achieve the above object, the invention according to
また、請求項2に記載の発明は、前記コンピュータをさらに、前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された接続関係を示す隣接行列を、各データ要素からの接続数が予め定められた第2の値に一致するように生成する生成手段として機能させ、前記算出手段は、前記生成手段により生成された隣接行列を前記第3更新手段により更新した後に、当該更新された隣接行列に基づき、各データ要素からの接続関係の重みが合計で1となるように算出することを特徴とする請求項1に記載のプログラムである。
In the invention according to claim 2, the computer further includes an adjacency matrix indicating a connection relationship set for each of the plurality of data elements and the virtual data element, and the number of connections from each data element is predetermined. The generation means for generating the second matrix so as to match the second value, and the calculation means updates the adjacency matrix generated by the generation means by the third update means, and then updates the updated adjacency matrix. The program according to
また、請求項3に記載の発明は、前記第1の値は、前記複数のデータ要素のデータ要素数で、前記取得手段により取得される接続情報に示される接続数を除して算出される平均の接続数に基づいて定められることを特徴とする請求項1又は2に記載のプログラムである。
In the invention according to claim 3, the first value is calculated by dividing the number of data elements of the plurality of data elements by the number of connections indicated in the connection information acquired by the acquisition unit. 3. The program according to
また、請求項4に記載の発明は、前記コンピュータをさらに、前記複数のデータ要素毎の評価値を、前記算出手段により算出される各接続関係の重みに従って更新する処理を、予め定められた終了条件が満足されるまで繰り返し実行する更新手段として機能させるための請求項1から3のいずれかに記載のプログラムである。
According to a fourth aspect of the present invention, the computer further updates the evaluation value for each of the plurality of data elements according to the weight of each connection relation calculated by the calculation means, in a predetermined end. The program according to any one of
また、請求項5に記載の発明は、複数のデータ要素間に設定された有向の接続関係を示す接続情報を取得する取得手段と、有向の接続関係を有する複数のデータ要素に、当該複数のデータ要素の各データ要素から接続され、且つ、当該複数のデータ要素の各データ要素に接続する仮想データ要素を追加して、前記取得手段により取得される接続情報を更新する第1更新手段と、前記複数のデータ要素のうち他のデータ要素への接続数が予め定められた第1の値に満たないデータ要素を選択すると共に、当該選択したデータ要素の接続数が前記第1の値に達するまで前記仮想データ要素への接続関係を設定して、前記追加更新手段により更新される接続情報を更新する第2更新手段と、前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された、前記第2更新手段により更新される接続情報に示される接続関係を双方向化して、前記第2更新手段により更新される接続情報を更新する第3更新手段と、前記第3更新手段により更新される接続情報に示される各接続関係の重みを算出する算出手段と、を含むことを特徴とする情報分析装置である。 In addition, the invention according to claim 5 includes an acquisition unit that acquires connection information indicating a directed connection relationship set between a plurality of data elements, and a plurality of data elements having a directed connection relationship. First update means for updating connection information acquired by the acquisition means by adding a virtual data element connected from each data element of the plurality of data elements and connected to each data element of the plurality of data elements And selecting a data element in which the number of connections to other data elements is less than a predetermined first value among the plurality of data elements, and the number of connections of the selected data element is the first value A second update unit that sets connection relations to the virtual data elements until reaching the value and updates connection information updated by the additional update unit, and each of the plurality of data elements and the virtual data elements Third update means for updating the connection information updated by the second update means by bidirectionalizing the set connection relation indicated by the connection information updated by the second update means; and the third update Calculating means for calculating the weight of each connection relationship indicated in the connection information updated by the means.
請求項1及び5に記載の発明によれば、有向の接続関係があるデータ要素間の接続関係を双方向化して各データ要素の評価値を算出する場合に、他のデータ要素への接続数が少ないデータ要素が接続先のデータ要素と結びつきが過度に強くなることを抑制できる。 According to the first and fifth aspects of the present invention, when the evaluation value of each data element is calculated by bidirectionalizing the connection relation between data elements having a directed connection relation, the connection to other data elements It can be suppressed that the data elements with a small number are excessively connected to the data element of the connection destination.
請求項2に記載の発明によれば、データ要素間の接続関係の重みをデータ要素からデータ要素への遷移確率で表す場合に、他のデータ要素への接続数が少ないデータ要素が接続先のデータ要素と結びつきが過度に強くなることを抑制できる。 According to the second aspect of the present invention, when the weight of the connection relation between the data elements is expressed by the transition probability from the data element to the data element, the data element having a small number of connections to the other data elements is the connection destination. It is possible to prevent the connection with the data element from becoming excessively strong.
請求項3に記載の発明によれば、データ要素全体における平均の接続数に満たないデータ要素が接続先のデータ要素と結びつきが過度に強くなることを抑制できる。 According to the third aspect of the present invention, it is possible to prevent the data element that is less than the average number of connections in the entire data element from being excessively strongly linked to the connection destination data element.
請求項4に記載の発明によれば、他のデータ要素への接続数が少ないデータ要素が評価の高いデータ要素に接続していた場合、過度に高い評価値を得ることを抑制できる。 According to the fourth aspect of the present invention, when a data element having a small number of connections to other data elements is connected to a highly evaluated data element, it is possible to suppress obtaining an excessively high evaluation value.
以下、本発明を実施するための実施の形態(以下、実施形態という)を、図面に従って説明する。 Hereinafter, embodiments for carrying out the present invention (hereinafter referred to as embodiments) will be described with reference to the drawings.
図1には、本実施形態に係る情報分析装置10の機能ブロック図を示した。図1に示されるように、情報分析装置10は、ノードデータ取得部100、仮想ノード追加設定部102、隣接行列生成部104、正則化処理部106、双方向化処理部108、遷移確率行列生成部110、評価値更新部112、及び処理結果保持部114を含む。上記の各部の機能は、CPU等の制御手段、メモリ等の記憶手段、外部デバイスとデータを送受信する入出力手段等を備えたコンピュータが、コンピュータ読み取り可能な情報記憶媒体に格納されたプログラムを読み込み実行することで実現されるものとしてよい。なお、プログラムは情報記憶媒体によって情報分析装置10として機能するコンピュータに供給されることとしてもよいし、インターネット等のデータ通信手段を介してコンピュータに供給されることとしてもよい。
FIG. 1 shows a functional block diagram of an
ノードデータ取得部100は、複数のノード(データ要素)の各データを取得すると共に、各ノードのリンク先(接続先)を示す接続情報を取得するものである。なお、本実施形態におけるノード(データ要素)とは、グラフ理論におけるグラフを構成する節点(頂点)に相当し、リンク(接続関係)とは節点を結ぶ辺(エッジ)に相当するものであって、本実施形態では電子文書等の1つのデータファイルを1つのノードに対応させた例について説明する。例えば、情報分析装置10が文書間の引用ネットワークを解析する場合には、文書をノード、文書間の引用関係をリンクとしてよい。その場合に、ノードデータ取得部100は、文書を格納したデータベースにアクセスして文書を取得することとしてよく、取得した文書が引用する文書(引用文書)の情報は、取得した文書の内容から取得してもよいし、文書を格納しているデータベースに問い合わせて取得することとしてもよい。例えば、文書が特許文献である場合には、特許文献における先行技術文献の欄から引用文書を特定してもよいし、特許文献の識別情報に基づいて審査情報を取得し、当該取得した審査情報に基づいて引用文書を特定することとしてもよい。また、文書が科学技術論文である場合には、科学技術論文の引用欄から引用文書を抽出することとしてよい。
The node
図2には、ノードデータ取得部100により取得されるノードデータに基づき、各ノードをその接続関係に従って接続したネットワークの一例を示す図である。図2において、1つのノードは1つの文書に対応しており、ノードi(ni)からノードj(nj)へ接続する矢印は、ノードiがノードjを引用する関係を表している。
FIG. 2 is a diagram illustrating an example of a network in which each node is connected according to the connection relation based on the node data acquired by the node
仮想ノード追加設定部102は、ノードデータ取得部100により取得されたノード群に仮想ノードを追加すると共に、当該追加した仮想ノードとノード群の間にリンクを設定するものである。仮想ノードは、ノード群の全てのノードに引用され、そしてノード群の全てのノードを引用されるノードである。ここで、仮想ノード追加設定部102は、ノード群に含まれるノードのうち、他のノードを引用する引用数が規定値に満たないノードについては、引用数が規定値に達するまで、仮想ノードを引用するようにノードの接続情報を設定する。なお、引用数の規定値は、所与の定数としてもよいし、ノード群における平均の引用数としてもよいし、ノード群における引用数の最大値であってもよい。ノード群における平均の引用数が整数でない場合には、平均の引用数を四捨五入、切り捨て、又は切り上げにより整数とすることとしてよい。なお、仮想ノード追加設定部102は、ノードデータ取得部100により取得されたノード群の接続関係を示す隣接行列に、仮想ノードの行及び列を追加し、仮想ノードと、ノード群の各ノードとの間に接続関係を設定することで隣接行列を更新し、さらに、ノード群に含まれるノードのうち他のノードへの接続数が予め定められた第1の値に満たないノードを選択すると共に、当該選択したノードの接続数が第1の値に達するまで仮想データ要素への接続関係を設定して、上記更新された隣接行列をさらに更新することとしてよい。
The virtual node
図3には、ノードデータ取得部100により取得されたノード群に仮想ノードを追加して拡張したネットワークの一例を示す。図3に示されるように、仮想ノードはノード群の全てのノードと少なくとも1つの双方向のリンクを有している。このうち引用数が少ないノードからは、仮想ノードへの複数本のリンクが設けられる。例えば、引用数の規定値が3であり、ノードiの引用数が2である場合には、ノードiから仮想ノードへ1本の引用リンクが設定されることとなり、ノードjの引用数が1である場合には、ノードjから仮想ノードへ2本の引用リンクが設定される。
FIG. 3 shows an example of a network expanded by adding a virtual node to the node group acquired by the node
隣接行列生成部104は、ノードデータ取得部100により取得されたノード群に、仮想ノード追加設定部102により仮想ノードが追加されると共に仮想ノードへのリンクが設定されて拡張されたネットワークを表す隣接行列を生成するものである。
The adjacency
具体的には、隣接行列生成部104は、ノードj(nj)がノードi(ni)を引用している時に、隣接行列Aの成分Aijを以下の式(1)で表す。
Aij=1 (1)
ここで、i及びjは1〜N(Nは仮想ノードを含めたノード数)の自然数である。ただし、ノードjがノードiをL回引用している場合には、Aij=Lとなる。また、ノードjがノードiを引用していないときにはAijは以下の式(2)で表す。
Aij=0 (2)
なお、各ノードは自分自身を引用することはないため隣接行列Aの対角成分は以下の式(3)で表される。
Aii=0 (3)
本実施形態では、以上の処理により隣接行列Aを生成する。
Specifically, the adjacency
A ij = 1 (1)
Here, i and j are natural numbers of 1 to N (N is the number of nodes including virtual nodes). However, if node j cites node i L times, A ij = L. When node j does not cite node i, A ij is expressed by the following equation (2).
A ij = 0 (2)
Since each node does not quote itself, the diagonal component of the adjacency matrix A is expressed by the following equation (3).
A ii = 0 (3)
In the present embodiment, the adjacency matrix A is generated by the above processing.
ここで、ノードjのアウトリンク数(引用数)kout(j)は以下の式(4)で、ノードjのインリンク数(被引用数)kin(j)は以下の式(5)で表される。
正則化処理部106は、各ノードのアウトリンク数をm(mは自然数)本に揃える処理(正規化)を行うものである。具体的には、正規化処理部は、全てのノードには少なくとも規定値以上の引用数があるため、i≠jのときkout(j)≠0であり、隣接行列Aを以下の式(6)により変換して、正規化された隣接行列A(チルダ)を生成する。
双方向化処理部108は、正規化された隣接行列A(チルダ)におけるリンクを双方向化して、隣接行列を更新するものである。双方向化処理部108は、i≠jのとき、正規化された隣接行列A(チルダ)を用いて、双方向化された隣接行列A(オーバーライン)を以下の式(8)により生成する。
ここで、双方向化された隣接行列A(オーバーライン)に基づくノードjのアウトリンク数k(j)は、以下の式(11)により得られる。
図4には、双方向化された隣接行列の表すネットワークの一例を示した。図4において、ノードjからの実線のリンクが元々ノード間に設定されているリンクを示し、点線のリンクが双方向化処理により新たに設定されたリンクを示している。なお、ノードjのアウトリンク数k(j)の第1項目は、実線のリンクに基づく項であり、第2項目は、双方向化処理により追加された点線のリンクに基づく項である。 FIG. 4 shows an example of a network represented by a bidirectional adjacency matrix. In FIG. 4, a solid line link from the node j indicates a link originally set between nodes, and a dotted line link indicates a link newly set by bidirectional processing. Note that the first item of the number of outlinks k (j) of the node j is a term based on the solid line link, and the second item is a term based on the dotted line link added by the bidirectional processing.
遷移確率行列生成部110は、双方向化された隣接行列を、各ノードにおいてアウトリンクの重みの総計が1となるように(すなわち、リンクの重みが確率を表すように)規格化するものである。具体的には、遷移確率行列生成部110は、双方向化された隣接行列に基づき、遷移確率行列Tijを以下の式(13)により生成する。
図5には、ノード間のリンクを単純に双方向化した場合の例(A)と、本実施形態で用いた手法で双方向化した場合の例(B)を示した。図5では、ノードiが、多くの引用を集める価値の高いノードjのみを引用している場合を想定している。ここで、ノードjからのノードiに与える影響、すなわち遷移確率行列Tijの値を求める。ノードiはノードjを引用し、逆の引用はないから、式(14)に基づき、Tijは以下の式(15)により表される。
評価値更新部112は、遷移確率行列生成部110により生成された遷移確率行列に基づいて、各ノードの評価値を予め定められた終了条件が満足されるまで繰り返し更新するものである。評価値更新部112により更新された各ノードの評価値が大きい順に各ノードの順位(ランク)が決まる。以下、評価値更新部112による処理の一例を以下説明する。
Based on the transition probability matrix generated by the transition probability
評価値更新部112は、ノードiの評価値piを以下の式(16)により算出する。
処理結果保持部114は、評価値更新部112により更新された各ノードの評価値(ランク値)を保持するものである。処理結果保持部114に保持された各ノードの評価値は、各種の処理に供されることとしてよい。例えば、情報分析装置10は、処理対象の複数のノードの中から、指定された検索条件に合致するノードを検索し、当該検索されたノードを、処理結果保持部114に保持される各ノードの評価値に基づく順位で表示させる表示データを生成し出力することとしてよい。
The processing
次に、図6に示されるフローチャートを参照して、情報分析装置10により行われるノードの評価値の算出処理の一例について説明する。
Next, an example of a node evaluation value calculation process performed by the
図6に示されるように、情報分析装置10は、複数のノードを含むノード群と、各ノード間に定められた有向リンク(引用関係)の情報を含むノードデータを取得する(S1001)。情報分析装置10は、取得したノード群に仮想ノードを追加する(S1002)。ここで、情報分析装置10は、ノード群に含まれるノードのうち未選択のノードを1つ選択し(S1003)、当該選択したノードのアウトリンク数(引用数)が規定値に達していない場合には(S1004:N)、アウトリンク数が規定値に達するまで仮想ノードへのリンクを設定する(S1005)。上記選択したノードのアウトリンク数が規定値以上である場合(S1004:Y)、又はS1005の処理を終えると、情報分析装置10はノード群に未選択のノードがあるか否かを判断し(S1006)、未選択のノードがある場合には(S1006:Y)、S1003に戻ってそれ以降の処理を繰り返し、未選択のノードがない場合には(S1006:N)、S1007の処理に進む。
As illustrated in FIG. 6, the
情報分析装置10は、以上の処理により仮想ノードを含むノード群の間に設定されたリンクにより構成されるネットワークの情報を示す隣接行列を生成する(S1007)。そして、情報分析装置10は、上記生成した隣接行列に対して、各ノードからのアウトリンク数を一定数に揃える正則化処理を行うと共に(S1008)、さらに正則化された隣接行列に対して、各有向リンクを双方向化する双方向化処理を行う(S1009)。情報分析装置10は、双方向化された隣接行列に基づいて、各ノードからのアウトリンクの重みを、当該アウトリンクを介して他のノードにデータ値が遷移する遷移確率を示すように規格化して遷移確率行列を算出する(S1010)。
The
情報分析装置10は、上記算出した遷移確率行列に従って各ノードの評価値(ランク値)を順次更新する処理を、各ノードの評価値の変化量が所与の閾値を下回るまで実行し(S1011)、各ノードの評価値を得て処理を終了する。
The
本実施形態に係る情報分析装置10では、ノード間の引用関係を双方向化し、各ノードの引用数を計算上揃えた上で各ノードの評価値を算出する際に、全てのノードと接続、被接続の関係にある仮想ノードを引用数が規定値に達するまで引用するようにしたことで、引用数の少ないノードが引用先のノードと結びつきが強くなることを回避している。こうして、被引用数が少ないにもかかわらず、引用先のノードの価値が高いことにより大きな評価を受けるノードが存在しないようにした。
In the
本実施形態では、文書をノード、引用関係をリンクとした例を説明したが、本発明は上記の例に限られず、有向リンクにより接続されるノード全般に同様に適用されるものであることはもちろんである。 In this embodiment, an example in which a document is a node and a citation relationship is a link has been described. However, the present invention is not limited to the above example, and is similarly applied to all nodes connected by directed links. Of course.
10 情報分析装置、100 ノードデータ取得部、102 仮想ノード追加設定部、104 隣接行列生成部、106 正則化処理部、108 双方向化処理部、110 遷移確率行列生成部、112 評価値更新部、114 処理結果保持部。
DESCRIPTION OF
Claims (5)
複数のデータ要素間に設定された有向の接続関係を示す接続情報を取得する取得手段と、
有向の接続関係を有する複数のデータ要素に、当該複数のデータ要素の各データ要素から接続され、且つ、当該複数のデータ要素の各データ要素に接続する仮想データ要素を追加して、前記取得手段により取得される接続情報を更新する第1更新手段と、
前記複数のデータ要素のうち他のデータ要素への接続数が予め定められた第1の値に満たないデータ要素を選択すると共に、当該選択したデータ要素の接続数が前記第1の値に達するまで前記仮想データ要素への接続関係を設定して、前記第1更新手段により更新される接続情報を更新する第2更新手段と、
前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された、前記第2更新手段により更新される接続情報に示される接続関係を双方向化して、前記第2更新手段により更新される接続情報を更新する第3更新手段と、
前記第3更新手段により更新される接続情報に示される各接続関係の重みを算出する算出手段
として機能させるためのプログラム。 Computer
An acquisition means for acquiring connection information indicating a directed connection relationship set between a plurality of data elements;
The acquisition is performed by adding a virtual data element connected to each data element of the plurality of data elements to a plurality of data elements having a directed connection relationship and connected to each data element of the plurality of data elements. First update means for updating connection information acquired by the means;
A data element whose number of connections to other data elements is less than a predetermined first value is selected from the plurality of data elements, and the number of connections of the selected data element reaches the first value. Second update means for setting connection relations to the virtual data elements until the connection information updated by the first update means is updated;
Connection information that is set by each of the plurality of data elements and the virtual data element and that is updated by the second update unit by bidirectionalizing the connection relationship indicated by the connection information that is updated by the second update unit. A third updating means for updating
The program for functioning as a calculation means for calculating the weight of each connection relationship indicated in the connection information updated by the third update means.
前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された接続関係を示す隣接行列を、各データ要素からの接続数が予め定められた第2の値に一致するように生成する生成手段として機能させ、
前記算出手段は、前記生成手段により生成された隣接行列を前記第3更新手段により更新した後に、当該更新された隣接行列に基づき、各データ要素からの接続関係の重みが合計で1となるように算出する
ことを特徴とする請求項1に記載のプログラム。 The computer further
Generation means for generating an adjacency matrix indicating connection relations set for each of the plurality of data elements and the virtual data element so that the number of connections from each data element matches a predetermined second value Make it work
The calculating means updates the adjacency matrix generated by the generating means by the third updating means, and then, based on the updated adjacency matrix, the weight of connection relation from each data element becomes 1 in total. The program according to claim 1, wherein the program is calculated as follows.
ことを特徴とする請求項1又は2に記載のプログラム。 The first value is determined based on an average number of connections calculated by dividing the number of connections indicated in the connection information acquired by the acquisition unit by the number of data elements of the plurality of data elements. The program according to claim 1 or 2, characterized in that
前記複数のデータ要素毎の評価値を、前記算出手段により算出される各接続関係の重みに従って更新する処理を、予め定められた終了条件が満足されるまで繰り返し実行する更新手段
として機能させるための請求項1から3のいずれかに記載のプログラム。 The computer further
A function for updating the evaluation value for each of the plurality of data elements in accordance with the weight of each connection relationship calculated by the calculation unit until the predetermined end condition is satisfied is functioned as an update unit. The program according to any one of claims 1 to 3.
有向の接続関係を有する複数のデータ要素に、当該複数のデータ要素の各データ要素から接続され、且つ、当該複数のデータ要素の各データ要素に接続する仮想データ要素を追加して、前記取得手段により取得される接続情報を更新する第1更新手段と、
前記複数のデータ要素のうち他のデータ要素への接続数が予め定められた第1の値に満たないデータ要素を選択すると共に、当該選択したデータ要素の接続数が前記第1の値に達するまで前記仮想データ要素への接続関係を設定して、前記追加更新手段により更新される接続情報を更新する第2更新手段と、
前記複数のデータ要素及び前記仮想データ要素のそれぞれに設定された、前記第2更新手段により更新される接続情報に示される接続関係を双方向化して、前記第2更新手段により更新される接続情報を更新する第3更新手段と、
前記第3更新手段により更新される接続情報に示される各接続関係の重みを算出する算出手段と、を含む
ことを特徴とする情報分析装置。 An acquisition means for acquiring connection information indicating a directed connection relationship set between a plurality of data elements;
The acquisition is performed by adding a virtual data element connected to each data element of the plurality of data elements to a plurality of data elements having a directed connection relationship and connected to each data element of the plurality of data elements. First update means for updating connection information acquired by the means;
A data element whose number of connections to other data elements is less than a predetermined first value is selected from the plurality of data elements, and the number of connections of the selected data element reaches the first value. Second update means for setting connection relations to the virtual data elements until the connection information updated by the additional update means is updated;
Connection information that is set by each of the plurality of data elements and the virtual data element and that is updated by the second update unit by bidirectionalizing the connection relationship indicated by the connection information that is updated by the second update unit. A third updating means for updating
Calculating means for calculating a weight of each connection relation indicated in the connection information updated by the third updating means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010142380A JP5545063B2 (en) | 2010-06-23 | 2010-06-23 | Program and information analyzer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010142380A JP5545063B2 (en) | 2010-06-23 | 2010-06-23 | Program and information analyzer |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012008680A true JP2012008680A (en) | 2012-01-12 |
JP5545063B2 JP5545063B2 (en) | 2014-07-09 |
Family
ID=45539174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010142380A Expired - Fee Related JP5545063B2 (en) | 2010-06-23 | 2010-06-23 | Program and information analyzer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5545063B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101965277B1 (en) * | 2018-08-10 | 2019-04-03 | 주식회사 비트나인 | System and method for analysis of hypergraph data and computer program for the same |
KR101965276B1 (en) * | 2018-08-10 | 2019-04-03 | 주식회사 비트나인 | System and method for analysis of data based on graph and computer program for the same |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009151392A (en) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | Information analysis device and information analysis program |
-
2010
- 2010-06-23 JP JP2010142380A patent/JP5545063B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009151392A (en) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | Information analysis device and information analysis program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101965277B1 (en) * | 2018-08-10 | 2019-04-03 | 주식회사 비트나인 | System and method for analysis of hypergraph data and computer program for the same |
KR101965276B1 (en) * | 2018-08-10 | 2019-04-03 | 주식회사 비트나인 | System and method for analysis of data based on graph and computer program for the same |
Also Published As
Publication number | Publication date |
---|---|
JP5545063B2 (en) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105934755B (en) | Enhancing search results with social tags | |
US10936950B1 (en) | Processing sequential interaction data | |
JP4633162B2 (en) | Index generation system, information retrieval system, and index generation method | |
CN101828185B (en) | Ranking and providing search results based in part on a number of click-through features | |
US8412665B2 (en) | Action prediction and identification temporal user behavior | |
CN104361081A (en) | WEB document-based automatic abstracting method | |
CN108090104B (en) | Method and device for acquiring webpage information | |
JP2015079395A (en) | Information processing device, method, and program | |
JP5545063B2 (en) | Program and information analyzer | |
Cortez | A tutorial on using the rminer R package for data mining tasks | |
CN102541947A (en) | Method and equipment for updating authority score of webpage based on friefox event | |
CN103984754A (en) | Search system and search method | |
JP2013041530A (en) | Program for route calculation, and route calculation device | |
JP2009146213A (en) | Information analysis device and information analysis program | |
JP5194765B2 (en) | Information analysis apparatus and information analysis program | |
US9195940B2 (en) | Jabba-type override for correcting or improving output of a model | |
JP5833068B2 (en) | Series data analysis device and program | |
JP5471877B2 (en) | Program and information analyzer | |
JP6739379B2 (en) | Information processing apparatus, information processing method, program, and advertisement information processing system | |
US20220035885A1 (en) | Link localization by country | |
Karmitsa et al. | Diagonal bundle method with convex and concave updates for large-scale nonconvex and nonsmooth optimization | |
KR101564616B1 (en) | Method for analyzing big data based on association rule | |
JP2014044552A (en) | Evaluation method, information processing device, and program | |
US20130185401A1 (en) | Configuration management device, configuration management method, and configuration management program | |
JP5589009B2 (en) | RECOMMENDED QUERY EXTRACTION DEVICE, METHOD, AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5545063 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |