JP5375065B2 - Information analysis apparatus and program - Google Patents
Information analysis apparatus and program Download PDFInfo
- Publication number
- JP5375065B2 JP5375065B2 JP2008316627A JP2008316627A JP5375065B2 JP 5375065 B2 JP5375065 B2 JP 5375065B2 JP 2008316627 A JP2008316627 A JP 2008316627A JP 2008316627 A JP2008316627 A JP 2008316627A JP 5375065 B2 JP5375065 B2 JP 5375065B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- information group
- analysis
- unit
- analysis target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報分析装置及びプログラムに関する。 The present invention relates to an information analysis apparatus and a program.
例えば文書等をノード(要素)、文書間の引用関係等をリンク(接続関係)としてネットワークを構成し、構成したネットワークを分析することで有用な情報を得る技術がある。例えば、下記の特許文献1には、ノードに付与されるデータ値をノードのリンクに従って伝播させて得た各ノードのデータ値をノードの重要度として利用することが開示されている。 For example, there is a technique for obtaining useful information by configuring a network using documents (nodes) as nodes (elements), citation relationships between documents as links (connection relationships), and analyzing the configured networks. For example, Patent Document 1 below discloses that the data value of each node obtained by propagating the data value assigned to the node according to the link of the node is used as the importance of the node.
こうしたネットワーク分析では、メモリ量、計算時間等の制約からネットワーク全体から抽出した一部のネットワークを分析対象として設定しているため、分析結果には分析対象から外れたノードの影響は反映されない。また、ネットワークのノード及びリンクのデータは時間が経つと更新されることがあり、分析対象を固定していると、こうしたデータの更新を分析結果に反映させることができない。
本発明の目的の一つは、ネットワーク全体の一部に設定された分析対象を分析内容に応じて更新することができる情報分析装置及びプログラムを提供することにある。 One of the objects of the present invention is to provide an information analysis apparatus and program capable of updating an analysis target set in a part of the entire network according to the analysis content.
上記目的を達成するために、請求項1に記載の情報分析装置の発明は、複数の要素と、当該複数の要素間の接続関係との情報を含む情報群の母集合から一部の情報群を抽出すると共に、当該抽出した一部の情報群を分析対象に設定する設定手段と、前記設定手段により設定された分析対象の情報群に含まれる要素に値を付与すると共に、当該付与した値を当該分析対象の情報群に含まれる要素間の接続関係に基づいて更新する処理を予め定められた条件を満たすまで繰り返し実行する処理実行手段と、前記処理実行手段による処理の結果得られた前記分析対象の情報群に含まれる各要素の値に基づいて、当該分析対象の情報群に含まれる少なくとも一部の要素を選択する選択手段と、前記選択手段により選択した要素に関して前記情報群の母集合から取得される情報に基づいて前記分析対象の情報群を更新する更新手段と、を含むことを特徴とする。 In order to achieve the above object, the invention of the information analysis apparatus according to claim 1 provides a partial information group from a population of information groups including information on a plurality of elements and a connection relationship between the plurality of elements. A setting means for setting the extracted part of the information group as an analysis target, a value for the element included in the analysis target information group set by the setting means, and the assigned value Is executed as a result of the processing by the processing execution means, and the processing execution means for repeatedly executing the processing to update based on the connection relation between the elements included in the information group to be analyzed until a predetermined condition is satisfied Based on the value of each element included in the information group to be analyzed, a selection unit that selects at least a part of elements included in the information group to be analyzed, and a mother of the information group with respect to the element selected by the selection unit Based on the information obtained from the case, characterized in that it comprises, updating means for updating the information group the analyte.
また、請求項2に記載の発明は、請求項1に記載の情報分析装置において、前記更新手段は、前記選択手段により選択した要素と接続関係にある要素であって、前記分析対象の情報群に含まれていない要素を前記分析対象の情報群に追加して更新することを特徴とする。 Further, the invention according to claim 2 is the information analysis apparatus according to claim 1, wherein the updating means is an element connected to the element selected by the selection means, and the information group to be analyzed An element not included in the information is added to the information group to be analyzed and updated.
また、請求項3に記載の発明は、請求項1又は2に記載の情報分析装置において、前記更新手段は、前記選択手段により選択した要素についての情報が前記情報群の母集合において更新されている場合に、当該選択した要素の情報を更新することを特徴とする。 According to a third aspect of the present invention, in the information analysis apparatus according to the first or second aspect, the update unit updates the information about the element selected by the selection unit in the population of the information group. If it is, the information of the selected element is updated.
また、請求項4に記載の発明は、請求項1乃至3のいずれかに記載の情報分析装置において、前記選択手段は、前記分析対象の情報群に含まれる各要素のうち値が大きい順に予め定められた数の要素を選択することを特徴とする。 According to a fourth aspect of the present invention, in the information analysis apparatus according to any one of the first to third aspects, the selecting unit is configured in advance in descending order of each element included in the information group to be analyzed. A predetermined number of elements are selected.
また、請求項5に記載の発明は、請求項1乃至4のいずれかに記載の情報分析装置において、前記処理実行手段は、前記更新手段により更新された分析対象の情報群について前記処理を実行し、前記処理実行手段、前記選択手段、及び前記更新手段による処理を予め定められた終了条件を満たすまで再帰的に実行することを特徴とする。 According to a fifth aspect of the present invention, in the information analysis apparatus according to any one of the first to fourth aspects, the processing execution unit executes the processing on the information group to be analyzed updated by the updating unit. The processing by the processing execution means, the selection means, and the updating means is recursively executed until a predetermined end condition is satisfied.
また、請求項6に記載の発明は、請求項1乃至5のいずれかに記載の情報分析装置において、前記処理実行手段は、前記分析対象の情報群に含まれる要素のうち予め指定された条件に従って選択された要素群とそれ以外の要素群とに異なる初期値を付与して前記処理を実行することを特徴とする。 The invention according to claim 6 is the information analysis apparatus according to any one of claims 1 to 5, wherein the processing execution means is a condition specified in advance among elements included in the information group to be analyzed. The process is executed by assigning different initial values to the element group selected according to the above and other element groups.
また、請求項7に記載のプログラムの発明は、複数の要素と、当該複数の要素間の接続関係との情報を含む情報群の母集合から一部の情報群を抽出すると共に、当該抽出した一部の情報群を分析対象に設定する設定手段と、前記設定手段により設定された分析対象の情報群に含まれる要素に値を付与すると共に、当該付与した値を当該分析対象の情報群に含まれる要素間の接続関係に基づいて更新する処理を予め定められた条件を満たすまで繰り返し実行する処理実行手段と、前記処理実行手段による処理の結果得られた前記分析対象の情報群に含まれる各要素の値に基づいて、当該分析対象の情報群に含まれる少なくとも一部の要素を選択する選択手段と、前記選択手段により選択した要素に関して前記情報群の母集合から取得される情報に基づいて前記分析対象の情報群を更新する更新手段としてコンピュータを機能させることを特徴とする。 The invention of the program according to claim 7 extracts a part of an information group from a population of information groups including information on a plurality of elements and a connection relationship between the plurality of elements, and extracts the information group. A setting unit that sets a part of the information group as an analysis target, and a value is given to an element included in the information group of the analysis target set by the setting unit, and the given value is added to the information group of the analysis target Included in the process execution means for repeatedly executing the process to be updated based on the connection relation between the included elements until a predetermined condition is satisfied, and the analysis target information group obtained as a result of the process by the process execution means Selection means for selecting at least a part of elements included in the information group to be analyzed based on the value of each element, and information acquired from the population of the information group regarding the elements selected by the selection means Based wherein the causing the computer to function as an update means for updating the information group of the analysis target.
請求項1及び7に記載の発明によれば、分析対象について行われた処理の結果選択された要素に基づいて分析対象を更新できる。 According to invention of Claim 1 and 7, an analysis object can be updated based on the element selected as a result of the process performed about the analysis object.
請求項2に記載の発明によれば、分析対象について行われた処理の結果選択された要素と接続関係にある要素を分析対象に含めることができる。 According to the second aspect of the present invention, an element that is connected to the element selected as a result of the process performed on the analysis object can be included in the analysis object.
請求項3に記載の発明によれば、分析対象について行われた処理の結果選択された要素の情報を更新できる。 According to the third aspect of the present invention, the information on the element selected as a result of the process performed on the analysis target can be updated.
請求項4に記載の発明によれば、分析対象の中で分析結果に与える影響の大きい要素に基づいて分析対象を更新できる。 According to the fourth aspect of the present invention, the analysis target can be updated based on an element having a large influence on the analysis result among the analysis target.
請求項5に記載の発明によれば、分析対象の更新を繰り返して分析対象を初期の状態よりも分析内容に適したものとすることができる。 According to the fifth aspect of the present invention, it is possible to make the analysis target more suitable for the analysis content than the initial state by repeatedly updating the analysis target.
請求項6に記載の発明によれば、指定された条件に基づいて設定された初期条件の下で分析対象について行われた処理の結果選択された要素に基づいて分析対象を更新できる。 According to the sixth aspect of the present invention, the analysis object can be updated based on the element selected as a result of the process performed on the analysis object under the initial condition set based on the specified condition.
以下、本発明を実施するための好適な実施の形態(以下、実施形態という)を、図面に従って説明する。 DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments (hereinafter referred to as embodiments) for carrying out the invention will be described with reference to the drawings.
図1には、本実施形態に係る情報分析システム1の構成図を示す。図1に示されるように、情報分析システム1は、データベース5と、データベース5にアクセスして得た情報を分析する情報分析装置10とを含む。 FIG. 1 shows a configuration diagram of an information analysis system 1 according to the present embodiment. As shown in FIG. 1, the information analysis system 1 includes a database 5 and an information analysis device 10 that analyzes information obtained by accessing the database 5.
データベース5は、ノード(要素)と、ノード間に設定されたリンク(接続関係)との情報を含むネットワークデータを格納するものである。例えば、ノードを文書、リンクを文書間の引用関係に対応させることとしてよく、図2には、ノードを特許文献、リンクを特許文献について審査官により引用された引用関係とした場合のネットワークデータの一例を示した。 The database 5 stores network data including information on nodes (elements) and links (connection relationships) set between the nodes. For example, a node may be a document, a link may be associated with a citation relationship between documents, and FIG. 2 shows network data in a case where a node is a patent document and a link is a citation relationship cited by an examiner for a patent document. An example is shown.
図2に示されるように、本実施形態におけるネットワークデータは「引用」と「被引用」の特許文献をそれぞれ関連づけたテーブルにより構成され、例えば、「特開2000−100001」は「実開昭48−100114」を引用していることを示している。なお、データベース5にはネットワークデータの全データが格納されていることとし、文書や引用関係の追加等に応じて情報が逐次最新の状態に保たれている。 As shown in FIG. 2, the network data in the present embodiment is configured by a table in which “cited” and “cited” patent documents are associated with each other. "-100114". It is assumed that all data of the network data is stored in the database 5, and information is sequentially kept up-to-date according to addition of documents and citation relationships.
また、図1に示されるように、情報分析装置10は、分析対象データ取得部12、データ記憶部14、種ノード設定部16、引用分析部18、重要ノード選択部20、分析対象データ更新部22、終了判定部24、及び結果表示部26を含む。上記の各部の機能は、CPU等の制御手段、メモリ等の記憶手段、外部デバイスとデータを送受信する入出力手段等を備えたコンピュータが、コンピュータ読み取り可能な情報記憶媒体に格納されたプログラムを読み込み実行することで実現されるものとしてよい。なお、プログラムは情報記憶媒体によってコンピュータたる情報分析装置10に供給されることとしてもよいし、インターネット等のデータ通信ネットワークを介して供給されることとしてもよい。 As shown in FIG. 1, the information analysis apparatus 10 includes an analysis target data acquisition unit 12, a data storage unit 14, a seed node setting unit 16, a citation analysis unit 18, an important node selection unit 20, and an analysis target data update unit. 22, an end determination unit 24, and a result display unit 26. The functions of the above-described units are such that a computer having a control unit such as a CPU, a storage unit such as a memory, and an input / output unit that transmits and receives data to and from an external device reads a program stored in a computer-readable information storage medium. It may be realized by executing. The program may be supplied to the information analysis apparatus 10 that is a computer by an information storage medium, or may be supplied via a data communication network such as the Internet.
分析対象データ取得部12は、データベース5にアクセスして分析の対象とするデータを取得するものである。本実施形態では、分析対象データ取得部12は、データベース5に格納されたネットワークデータの中から指定した条件に基づいて一部のデータを分析対象として抽出して取得する。このデータの抽出の際には、例えば、ノードたる文書に付与された分野情報、日時情報、人物情報等の属性情報や、文書内容等が利用者により指定された条件と合致するものを抽出することとしてよい。 The analysis target data acquisition unit 12 accesses the database 5 and acquires data to be analyzed. In the present embodiment, the analysis target data acquisition unit 12 extracts and acquires a part of data as an analysis target based on a specified condition from the network data stored in the database 5. When this data is extracted, for example, attribute information such as field information, date / time information, person information, etc. given to a document as a node, or a document whose contents match a condition specified by the user is extracted. That's good.
図3Aには、分析対象データ取得部12により初期の分析対象データとして取得されるネットワークの一例を示す。図3Aに示されるように、初期の分析対象データは、データベース5に格納されたネットワークデータの母集合の一部であり、この分析対象データの集合の中には分析対象データの集合外の文書と引用関係を有する文書があるが、こうした分析対象データの集合外の文書は分析の対象とはされない。 FIG. 3A shows an example of a network acquired as initial analysis target data by the analysis target data acquisition unit 12. As shown in FIG. 3A, the initial analysis target data is a part of the population of network data stored in the database 5, and the analysis target data set includes documents outside the analysis target data set. However, documents outside the collection of data to be analyzed are not subject to analysis.
データ記憶部14は、半導体メモリ等の記憶素子を含み構成され、分析対象データを記憶する他、後述する分析処理の作業用メモリとしても用いられるものである。 The data storage unit 14 includes a storage element such as a semiconductor memory, and stores data to be analyzed, and is also used as a working memory for analysis processing to be described later.
種ノード設定部16は、分析対象データ取得部12により取得した分析対象データの中から種ノードを設定するものである。種ノードとは、利用者の指定に基づいて選択されるノードであり、例えば利用者が直接種ノードを指定してもよいし、利用者により指定された検索条件に合致するノードのうち予め定められた検索順位までのノードを種ノードとして設定することとしてよい。例えば、特許文献をノードとすれば、利用者が調査を望む分野の特許文献のうち予め既知のものを種文書(種ノード)として設定することとしてよい。 The seed node setting unit 16 sets a seed node from the analysis target data acquired by the analysis target data acquisition unit 12. The seed node is a node that is selected based on the designation by the user. For example, the seed node may be directly designated by the user, or the seed node is determined in advance among the nodes that match the search condition designated by the user. The nodes up to the specified search order may be set as seed nodes. For example, if a patent document is a node, a known document in advance in a field that the user desires to search may be set as a seed document (seed node).
引用分析部18は、データ記憶部14に記憶された分析対象のネットワークデータにおいて、種ノード設定部16により設定された種ノードとそれ以外のノードとに異なる初期データ値を付与してノード間のリンクに従ったデータ値の伝播処理を行い、各ノードのデータ値が収束するまで上記伝播処理を繰り返し行うものである。引用分析部18は、例えば種ノードのみに正の初期データ値を付与しそれ以外のノードの初期データ値は0とすることとしてもよい。 The citation analysis unit 18 assigns different initial data values to the seed node set by the seed node setting unit 16 and other nodes in the network data to be analyzed stored in the data storage unit 14, so Data value propagation processing is performed according to the link, and the above propagation processing is repeated until the data values of the nodes converge. For example, the citation analysis unit 18 may assign a positive initial data value only to the seed node and set the initial data values of other nodes to 0.
具体的には、ノードiを被引用文献、ノードjを引用文献とした場合に、被引用文献たるノードiのデータ値piは、以下の式(1)により求められる。
重要ノード選択部20は、引用分析部18による分析の結果得られた各ノードの重要度に基づいて重要なノード(重要ノード)を選択するものである。重要ノード選択部20は、引用分析部18による分析の結果得られた各ノードを重要度に従って上位から予め定められた件数(例えばM件)抽出し、こうして抽出したノードを重要ノードとして選択することとしてよい。 The important node selection unit 20 selects an important node (important node) based on the importance of each node obtained as a result of the analysis by the citation analysis unit 18. The important node selection unit 20 extracts each node obtained as a result of the analysis by the citation analysis unit 18 from a higher number in advance (for example, M) according to the importance, and selects the extracted node as an important node. As good as
分析対象データ更新部22は、重要ノード選択部20により選択された重要ノードの引用関係を確認し、当該重要ノードと引用関係にあるノードが分析対象のネットワークに含まれていない場合には、当該ノードについてデータベース5にアクセスして情報を取得し分析対象に追加する。また、分析対象データ更新部22は、重要ノード選択部20により選択されたノードについての更新の有無をデータベース5に問い合わせ、更新がある場合にはその更新情報を取得してノードの情報を更新することとしてもよい。なお、重要ノード選択部20は、ノードの追加に関して選択する重要ノードと、ノード自体の情報更新に関して選択する重要ノードの数をそれぞれ変更することとしても構わない。 The analysis target data update unit 22 confirms the citation relationship of the important node selected by the important node selection unit 20, and if a node having a citation relationship with the important node is not included in the analysis target network, the analysis target data update unit 22 The node accesses the database 5 to acquire information and adds it to the analysis target. Further, the analysis target data update unit 22 inquires of the database 5 about whether or not the node selected by the important node selection unit 20 is updated, and if there is an update, acquires the update information and updates the node information. It is good as well. The important node selection unit 20 may change the number of important nodes to be selected for adding a node and the number of important nodes to be selected for updating information of the node itself.
図3Bには、分析対象データ更新部22により更新される分析対象のネットワークの一例を示す。図3Bにおいて、ノードk,ノードlが重要ノードとして選択されたとすると、ノードkと引用関係にあるノードは現在の分析対象に含まれるが、ノードlと引用関係にあるノードmについては現在の分析対象に含まれていないため、分析対象データ更新部22は、ノードmを新たに分析対象に追加することにより分析対象のネットワークデータを更新する。なお、分析対象データ更新部22は、更新した分析対象のネットワークデータをデータ記憶部14に記憶する。 FIG. 3B shows an example of an analysis target network updated by the analysis target data update unit 22. In FIG. 3B, assuming that the nodes k and l are selected as important nodes, the node having the citation relationship with the node k is included in the current analysis target, but the node m having the citation relationship with the node l is currently analyzed. Since it is not included in the object, the analysis object data update unit 22 updates the network data to be analyzed by newly adding the node m to the analysis object. The analysis target data update unit 22 stores the updated analysis target network data in the data storage unit 14.
引用分析部18は、分析対象データ更新部22により更新された分析対象のネットワークデータに対して、種ノード設定部16により設定された種ノードに正の初期データ値を付与して再度引用分析処理を行い、各ノードの重要度を得る。また、重要ノード選択部20は、引用分析部18により得られた重要度に基づいてノードを選択する。そして、分析対象データ更新部22は、重要ノード選択部20により選択されたノードに基づいて分析対象のネットワークデータを更新する。情報分析装置10では、以上の引用分析部18、重要ノード選択部20、分析対象データ更新部22による各処理を、以下の終了判定部24により終了と判定されるまで再帰的に実行する。 The citation analysis unit 18 assigns a positive initial data value to the seed node set by the seed node setting unit 16 for the analysis target network data updated by the analysis target data update unit 22, and again performs the citation analysis process. To obtain the importance of each node. Further, the important node selection unit 20 selects a node based on the importance obtained by the citation analysis unit 18. Then, the analysis target data update unit 22 updates the analysis target network data based on the node selected by the important node selection unit 20. In the information analysis apparatus 10, the above-described processes performed by the citation analysis unit 18, the important node selection unit 20, and the analysis target data update unit 22 are recursively executed until the end determination unit 24 determines the end.
終了判定部24は、上記の再帰的処理が予め定められた終了条件を満足するか否かを判定するものである。以下、終了判定部24において用いられる終了判定条件を例示して説明する。 The end determination unit 24 determines whether or not the above recursive process satisfies a predetermined end condition. Hereinafter, the end determination condition used in the end determination unit 24 will be described as an example.
まず第1に、終了判定部24は、分析対象データ更新部22により追加するノードがない場合に、処理を終了すると判定することとしてよい。 First, the end determination unit 24 may determine to end the process when there is no node to be added by the analysis target data update unit 22.
第2に、終了判定部24は、分析対象データ更新部22によるデータ更新が予め定められた上限回数に達した場合に、処理を終了すると判定することとしてよい。 Second, the end determination unit 24 may determine to end the process when the data update by the analysis target data update unit 22 reaches a predetermined upper limit number of times.
そして、第3に、終了判定部24は、引用分析部18による引用分析処理の結果、各ノードの重要度の少なくとも一部の順位に変動がなくなった場合に、処理を終了すると判定することとしてよい。なお、上記一部の順位とは、上位から予め定められた件数までの順位としてよい。 Thirdly, the end determination unit 24 determines that the process is to be ended when there is no change in the order of importance of each node as a result of the citation analysis process by the citation analysis unit 18. Good. The partial ranking may be a ranking from the top to a predetermined number of cases.
結果表示部26は、終了判定部24により処理を終了すると判定された場合に、引用分析部18により得られた各ノードの重要度に基づいて引用分析の処理結果を表示するものである。処理結果としては、例えば各ノードとリンクを可視化したグラフを生成して表示することとしてもよいし、各ノードを重要度順に並べたリストを生成して表示することとしてもよい。なお、上記グラフ表示においては各ノードを重要度に応じたサイズにより表示することとしてもよい。 The result display unit 26 displays the processing result of the citation analysis based on the importance of each node obtained by the citation analysis unit 18 when the end determination unit 24 determines that the process is to be ended. As the processing result, for example, a graph in which each node and link are visualized may be generated and displayed, or a list in which each node is arranged in order of importance may be generated and displayed. In the graph display, each node may be displayed with a size corresponding to the importance.
次に、図4に示した引用分析処理のフローチャートを参照しながら、情報分析装置10において行われる引用分析処理の流れを説明する。 Next, the flow of the citation analysis process performed in the information analysis apparatus 10 will be described with reference to the flowchart of the citation analysis process shown in FIG.
図4に示されるように、情報分析装置10は、ネットワークデータを格納したデータベース5にアクセスして(S101)、利用者が要望する分野の文書を取得し(S102)、取得した文書について文書間に定められた引用関係に基づいて生成した分析対象のネットワークデータを記憶する(S103)。 As shown in FIG. 4, the information analysis apparatus 10 accesses the database 5 storing network data (S101), acquires a document in a field desired by the user (S102), and acquires the acquired document between documents. The network data to be analyzed generated based on the citation relationship defined in (1) is stored (S103).
次に、情報分析装置10は、例えば利用者により入力された検索文字列を含む文書を検索してこれを種文書に設定し(S104)、分析対象のネットワークデータにおいて上記設定した種文書に正の初期データ値を付与して引用分析処理を行う(S105)。 Next, the information analysis apparatus 10 searches for a document including a search character string input by a user, for example, sets it as a seed document (S104), and corrects the set seed document in the network data to be analyzed. The citation analysis process is performed by assigning the initial data value (S105).
情報分析装置10は、引用分析の結果得られた各文書の重要度に基づいて上位M件の文書を重要文書として選択し(S106)、選択した重要文書と引用関係にある文書が分析対象のネットワークデータに含まれているか否かに基づいて分析対象のネットワークデータの更新の要否を判断する(S107)。情報分析装置10は、S107で含まれていないと判断する場合には(S107:N)、当該含まれていない文書をデータベース5から取得して(S108)、分析対象データを更新する(S109)。そして、情報分析装置10は、引用分析処理が終了条件を満たすか否かを判断して(S110)、満たさないと判断する場合には(S110:N)、処理S105に戻って更新された分析対象データについて引用分析処理を行うと共にそれ以降の処理を繰り返す。一方で、引用分析処理が終了条件を満たすと判断した場合には(S110:Y)、引用分析の結果得られた各文書の重要度に基づいて結果を表示して(S111)、処理を終了する。 The information analysis apparatus 10 selects the top M documents as important documents based on the importance of each document obtained as a result of the citation analysis (S106), and documents that have a citation relationship with the selected important document are analyzed. It is determined whether or not the network data to be analyzed needs to be updated based on whether it is included in the network data (S107). If the information analysis apparatus 10 determines that it is not included in S107 (S107: N), it acquires the document that is not included from the database 5 (S108), and updates the analysis target data (S109). . Then, the information analysis apparatus 10 determines whether or not the citation analysis process satisfies the termination condition (S110), and if not (S110: N), returns to the process S105 and updates the analysis. The citation analysis process is performed on the target data and the subsequent processes are repeated. On the other hand, if it is determined that the citation analysis process satisfies the termination condition (S110: Y), the result is displayed based on the importance of each document obtained as a result of the citation analysis (S111), and the process is terminated. To do.
本発明は、上記の実施形態に限定されるものではない。例えば、引用分析部18においては、線形活性伝播法、連続アトラクター力学に基づく方法、パーソナライズされたPageRankアルゴリズム等の手法を用いることとしてよい。 The present invention is not limited to the above embodiment. For example, the citation analysis unit 18 may use a method such as a linear activity propagation method, a method based on continuous attractor dynamics, or a personalized PageRank algorithm.
また、上記の実施形態では、文書をノード、文書間の引用関係をリンクとしたネットワークデータの分析に本発明を適用した例を示したが、本発明はその他の多様なネットワークデータの分析にも適用してもよいのはもちろんである。 In the above embodiment, the example in which the present invention is applied to the analysis of network data in which the document is a node and the citation relationship between documents is a link has been shown. Of course, it may be applied.
1 情報分析システム、5 データベース、10 情報分析装置、12 分析対象データ取得部、14 データ記憶部、16 種ノード設定部、18 引用分析部、20 重要ノード選択部、22 分析対象データ更新部、24 終了判定部、26 結果表示部。 DESCRIPTION OF SYMBOLS 1 Information analysis system, 5 Database, 10 Information analysis apparatus, 12 Analysis object data acquisition part, 14 Data storage part, 16 seed node setting part, 18 Citation analysis part, 20 Important node selection part, 22 Analysis object data update part, 24 End determination unit, 26 result display unit.
Claims (7)
前記設定手段により設定された分析対象の情報群に含まれる要素に値を付与すると共に、当該付与した値を当該分析対象の情報群に含まれる要素間の接続関係に基づいて更新する処理を予め定められた条件を満たすまで繰り返し実行する処理実行手段と、
前記処理実行手段による処理の結果得られた前記分析対象の情報群に含まれる各要素の値に基づいて、当該分析対象の情報群に含まれる少なくとも一部の要素を選択する選択手段と、
前記選択手段により選択した要素に関して前記情報群の母集合から取得される情報に基づいて前記分析対象の情報群を更新する更新手段と、を含む
ことを特徴とする情報分析装置。 A setting unit that extracts a part of an information group from a population of information groups including information on a plurality of elements and a connection relationship between the plurality of elements, and sets the extracted part of the information group as an analysis target When,
A process of assigning a value to an element included in the analysis target information group set by the setting unit and updating the assigned value based on a connection relation between elements included in the analysis target information group in advance Process execution means for repeatedly executing until a predetermined condition is satisfied;
Selection means for selecting at least a part of elements included in the information group of the analysis target based on the value of each element included in the information group of the analysis target obtained as a result of the processing by the processing execution unit;
Updating means for updating the information group to be analyzed based on information acquired from the population of the information group regarding the element selected by the selection means.
ことを特徴とする請求項1に記載の情報分析装置。 The update means adds an element that is connected to the element selected by the selection means and is not included in the information group to be analyzed to the information group to be analyzed, and updates the element. The information analysis apparatus according to claim 1.
ことを特徴とする請求項1又は2に記載の情報分析装置。 The update unit updates the information of the selected element when the information about the element selected by the selection unit is updated in the population of the information group. The information analysis device described.
ことを特徴とする請求項1乃至3のいずれかに記載の情報分析装置。 4. The information analysis according to claim 1, wherein the selection unit selects a predetermined number of elements in descending order from among the elements included in the information group to be analyzed. 5. apparatus.
前記処理実行手段、前記選択手段、及び前記更新手段による処理を予め定められた終了条件を満たすまで再帰的に実行する
ことを特徴とする請求項1乃至4のいずれかに記載の情報分析装置。 The process execution means executes the process for the analysis target information group updated by the update means,
5. The information analysis apparatus according to claim 1, wherein processing by the processing execution unit, the selection unit, and the updating unit is recursively executed until a predetermined end condition is satisfied.
ことを特徴とする請求項1乃至5のいずれかに記載の情報分析装置。 The process executing means executes the process by assigning different initial values to an element group selected in accordance with a predesignated condition among elements included in the information group to be analyzed and other element groups. The information analysis apparatus according to claim 1, wherein:
前記設定手段により設定された分析対象の情報群に含まれる要素に値を付与すると共に、当該付与した値を当該分析対象の情報群に含まれる要素間の接続関係に基づいて更新する処理を予め定められた条件を満たすまで繰り返し実行する処理実行手段と、
前記処理実行手段による処理の結果得られた前記分析対象の情報群に含まれる各要素の値に基づいて、当該分析対象の情報群に含まれる少なくとも一部の要素を選択する選択手段と、
前記選択手段により選択した要素に関して前記情報群の母集合から取得される情報に基づいて前記分析対象の情報群を更新する更新手段としてコンピュータを機能させることを特徴とするプログラム。 A setting unit that extracts a part of an information group from a population of information groups including information on a plurality of elements and a connection relationship between the plurality of elements, and sets the extracted part of the information group as an analysis target When,
A process of assigning a value to an element included in the analysis target information group set by the setting unit and updating the assigned value based on a connection relation between elements included in the analysis target information group in advance Process execution means for repeatedly executing until a predetermined condition is satisfied;
Selection means for selecting at least a part of elements included in the information group of the analysis target based on the value of each element included in the information group of the analysis target obtained as a result of the processing by the processing execution unit;
A program that causes a computer to function as an update unit that updates the information group to be analyzed based on information acquired from a population of the information group regarding an element selected by the selection unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316627A JP5375065B2 (en) | 2008-12-12 | 2008-12-12 | Information analysis apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316627A JP5375065B2 (en) | 2008-12-12 | 2008-12-12 | Information analysis apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010140296A JP2010140296A (en) | 2010-06-24 |
JP5375065B2 true JP5375065B2 (en) | 2013-12-25 |
Family
ID=42350382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008316627A Expired - Fee Related JP5375065B2 (en) | 2008-12-12 | 2008-12-12 | Information analysis apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5375065B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6310721B2 (en) * | 2014-02-19 | 2018-04-11 | 国立大学法人京都大学 | Relationship graph evaluation system |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4094844B2 (en) * | 2000-12-27 | 2008-06-04 | 富士通株式会社 | Document collection apparatus for specific use, method thereof, and program for causing computer to execute |
JP2003167920A (en) * | 2001-11-30 | 2003-06-13 | Fujitsu Ltd | Needs information constructing method, needs information constructing device, needs information constructing program and recording medium with this program recorded thereon |
JP3864235B2 (en) * | 2002-05-24 | 2006-12-27 | 株式会社 日立東日本ソリューションズ | Information retrieval system and information retrieval program |
JP2007241459A (en) * | 2006-03-06 | 2007-09-20 | Fuji Xerox Co Ltd | Document data analyzer |
JP2008217637A (en) * | 2007-03-07 | 2008-09-18 | Fuji Xerox Co Ltd | Information analysis device and program |
-
2008
- 2008-12-12 JP JP2008316627A patent/JP5375065B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010140296A (en) | 2010-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11190536B2 (en) | Website vulnerability scan method, device, computer apparatus, and storage medium | |
CN110276446A (en) | The method and apparatus of model training and selection recommendation information | |
CN114329201B (en) | Training method of deep learning model, content recommendation method and device | |
AU2017268599B2 (en) | Method, device, server and storage medium of searching a group based on social network | |
US9280402B2 (en) | System and method for updating a dual layer browser | |
CN110209378A (en) | Page generation method, device, terminal and storage medium | |
CN113986933A (en) | Materialized view creating method and device, storage medium and electronic equipment | |
JP2007148885A (en) | Content collection device and content collection system | |
JP6685985B2 (en) | Classification support device, classification support method, and classification support program | |
JP2012073812A (en) | Data analysis support system and method | |
CN114254950A (en) | Telecommunication resource data processing method and device, electronic equipment and storage medium | |
JP5084796B2 (en) | Relevance determination device, relevance determination method, and program | |
Gaur et al. | Unconventional optimization for achieving well-informed design solutions for the automobile industry | |
CN110489131B (en) | Gray level user selection method and device | |
JP5375065B2 (en) | Information analysis apparatus and program | |
JP2020529777A (en) | Systems and methods for extracting structures from large, high density, high noise networks | |
CN111325357A (en) | Machine learning modeling method, device, equipment and computer readable storage medium | |
CN117009659A (en) | Package recommendation method, device, equipment and storage medium | |
CN111552549A (en) | Multitask request dynamic configuration method and system for intelligent equipment | |
CN108197288B (en) | House source pushing method, device, equipment and medium according to user characteristic preference | |
CN113590985B (en) | Page jump configuration method and device, electronic equipment and computer readable medium | |
JP2023161741A (en) | Test support program, test support apparatus, and test support method | |
JP5521319B2 (en) | Information analysis apparatus and program | |
JP2018147235A (en) | Information processing system, information processing method, and program | |
CN111104600B (en) | WEB site webpage recommendation method, device, equipment and medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130827 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5375065 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |