JP2019144939A - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2019144939A JP2019144939A JP2018029736A JP2018029736A JP2019144939A JP 2019144939 A JP2019144939 A JP 2019144939A JP 2018029736 A JP2018029736 A JP 2018029736A JP 2018029736 A JP2018029736 A JP 2018029736A JP 2019144939 A JP2019144939 A JP 2019144939A
- Authority
- JP
- Japan
- Prior art keywords
- node
- nodes
- network information
- sequence
- generation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
第1の実施の形態の概要を述べる。第1の実施の形態に係る情報処理装置は、互いに異なるネットワークを構成する各ノードに、同じ基準で特徴ベクトルを割り当てる。ここで、「ノードの特性を示す特徴ベクトル」とは、ネットワークにおける「他のノードとの接続関係」を示すベクトルである。
図2は、第1の実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。
Pu=log(Wk(1)*|V|+e)/{d+log(Wk(1)*|V|+e)} (1)
Pd=1−Pu (2)
ここでexp(x)はxの指数関数を表し、|x|はxの絶対値を表す。また、cはスケーリングファクターであり、0より大きい実数である。図5(b)はc=1.0の場合を示している。なお、式(3)の絶対値に変えて、二乗値にしても構わない。
Sij=exp(−cfk(i,j)) (3)’
図7は、第1の実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
以上説明したように、第1の実施の形態に係る情報処理装置1によれば、複数の異なるネットワークそれぞれを構成する各ノードに、統一した特徴ベクトルを割り当てることができる。
第2の実施の形態の概要を述べる。第2の実施の形態に係る情報処理装置1も、第1の実施の形態に係る情報処理装置1と同様に、互いに異なるネットワークを構成する各ノードに、同じ基準で特徴ベクトルを割り当てる。しかしながら、第2の実施の形態に係る情報処理装置1の学習用コーパス登録部33が登録するノードシーケンスは、第1の実施の形態に係る学習用コーパス登録部33が登録するノードシーケンスと異なる。
図8は、第2の実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。第2の実施の形態に係る情報処理装置1は記憶部2と制御部3とを備える。また、記憶部2は、ネットワーク情報取得部30、重みスコア算出部31、ノードシーケンス生成部32、学習用コーパス登録部33、ベクトル生成部34、及びノードシーケンス比較部35を備える。
図11は、第2の実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
以上説明したように、第2の実施の形態に係る情報処理装置1によれば、複数の異なるネットワークそれぞれを構成する各ノードに、統一した特徴ベクトルを割り当てることができる。
ノードシーケンス比較部35は第1ネットワーク情報に由来するノードスコアシーケンスと、第2ネットワーク情報に由来するノードスコアシーケンスとを比較することにより、対コーパスを生成してもよい。これにより、ノードシーケンス比較部35は、ステージ2において、第1完全グラフと第2完全グラフとを接続するパスを生成せずに、ノードスコアシーケンスを生成することができる。組み合わせが多大となる完全グラフ同士の接続を省略できるので、ノードシーケンス比較部35はノードスコアの生成に要する計算量及びメモリを節約することができる。
上記では、重みスコア算出部31は、ネットワークを構成する全てのノードの接続数の総和に対する各ノードの接続数の割合を、ノードの重みスコアWとする場合について主に説明した。しかしながら、この重みスコアWの算出方法は一例であり、他のノードとの接続数が多いノードは、他のノードとの接続数が少ないノードよりも大きな重みスコアWとなることを条件として、重みスコア算出部31は他の算出方法で重みスコアWを算出してもよい。
・ノード1からkホップで到達できる近傍ノード集合1をRk(1)
・ノード2からkホップで到達できる近傍ノード集合2をRk(2)
・近傍ノード集合1に対応する各ノードの次数の集合を昇順にソートした近傍ノード次数集合1をs(Rk(1))
・近傍ノード集合2に対応する各ノードの次数の集合を昇順にソートした近傍ノード次数集合2をs(Rk(2))
とし、近傍ノード次数集合1と近傍ノード次数集合2をシーケンスとして比較し、DTWによりシーケンス間の距離に基づいて、2ノード間の接続関係に基づく距離fk(1,2)を評価する。
Wk(1,2)=exp(−fk(1,2))/{exp(−fk(1,2))+exp(−fk(1,3))+exp(−fk(1,4))}
としてノード毎の重みの合計が1となるよう再配分する。
2・・・記憶部
3・・・制御部
30・・・ネットワーク情報取得部
31・・・重みスコア算出部
32・・・ノードシーケンス生成部
33・・・学習用コーパス登録部
34・・・ベクトル生成部
340・・・第1生成部
341・・・第2生成部
342・・・ノルム算出部
35・・・ノードシーケンス比較部
Claims (12)
- 複数のノード及び各ノード間の接続関係から構成されるネットワーク情報を取得するネットワーク情報取得部と、
前記ネットワーク情報取得部が取得した第1ネットワーク情報と前記第1ネットワーク情報とは異なる第2ネットワーク情報とのそれぞれについて、各ノードが接続する他のノードの数に基づいて各ノードの重みスコアを算出する重みスコア算出部と、
前記第1ネットワーク情報に含まれるノードと前記第2ネットワーク情報に含まれるノードとを並べて構成されるノードシーケンスであって、1つの初期ノードを取り出し、前記重みスコア算出部が算出した重みスコアに応じて設定されたノード間の類似度にしたがって初期ノードに類似する類似ノードを取り出し、前記初期ノードと前記類似ノードとが並べられたノードシーケンスを生成するノードシーケンス生成部と、
前記ノードシーケンス生成部が生成した複数のノードシーケンスを学習用コーパスとして登録する学習用コーパス登録部と、
前記学習用コーパスを用いて、各ノードそれぞれについて他のノードとの関係性を示す特徴ベクトルを生成するベクトル生成部と、
を備える情報処理装置。 - 前記ノードシーケンス生成部は、前記1の初期ノードとの類似度が大きいノードほど、前記類似ノードとして取り出す蓋然性を高くする、
請求項1に記載の情報処理装置。 - ノードシーケンス生成部は、前記第1ネットワーク情報と前記第2ネットワーク情報とのそれぞれに含まれるノードを並べて構成されるノードシーケンスであって、前記重みスコア算出部が算出した重みスコアに応じて設定されたノード間の類似度に基づく遷移確率にしたがって2以上のノードが並べられたノードシーケンスを生成する、
請求項1又は2に記載の情報処理装置。 - 前記ノードシーケンス生成部は、前記第1ネットワーク情報に含まれるノードを構成要素とする完全グラフである第1完全グラフと、前記第2ネットワーク情報に含まれるノードを構成要素とする完全グラフである第2完全グラフと、前記第1完全グラフに含まれるノードと前記第2完全グラフに含まれるノードとを接続するパスとを生成し、前記第1完全グラフ内のノード間の遷移確率、前記第2完全グラフ内のノード間の遷移確率、及び前記第1完全グラフのノードと前記第2完全グラフのノードとの間の遷移確率にしたがってノードシーケンスを生成する、
請求項1から3のいずれか一項に記載の情報処理装置。 - 前記重みスコア生成部は、他のノードとの接続数が多いノードは、他のノードとの接続数が少ないノードよりも大きな重みスコアを割り当て、
前記ノードシーケンス生成部は、前記第1完全グラフのノードに割り当てられた重みスコアが大きいほど前記第2完全グラフのノードに遷移する確率を高く設定し、かつ前記第2完全グラフのノードに割り当てられた重みスコアが大きいほど前記第1完全グラフのノードに遷移する確率を高く設定する、
請求項4に記載の情報処理装置。 - 前記ベクトル生成部は、前記学習用コーパスを構成する各ノードを単語とみなし、Skip−gramモデルを用いて各ノードの特徴ベクトルを生成する、
請求項1から5のいずれか一項に記載の情報処理装置。 - 前記ノードシーケンス生成部が生成した複数のノードシーケンスそれぞれを構成する各ノードを、当該ノードの重みスコアに置き換えたシーケンスの集合であるノードスコアシーケンス群を生成してノードスコアシーケンスを比較し、類似するノードシーケンス同士の組み合わせを構成するノードシーケンス比較部をさらに有し、
前記学習用コーパス登録部は、前記第1ネットワーク情報と前記第2ネットワーク情報とのそれぞれから得られた2つの異なるノードシーケンス群と、前記ノードシーケンス比較部において紐づけられたノードシーケンス群とから構成される学習用コーパスを登録する、
請求項1に記載の情報処理装置。 - 前記ノードシーケンス比較部は、前記第1ネットワーク情報に由来するノードスコアシーケンスと、前記第2ネットワーク情報に由来するノードスコアシーケンスとを比較する、
請求項7に記載の情報処理装置。 - 前記ベクトル生成部は、
前記第1ネットワーク情報に由来するノードシーケンスを学習データとして各ノードそれぞれについて他のノードとの関係性を示す第1特徴ベクトルを生成する第1生成部と、
前記第2ネットワーク情報に由来するノードシーケンスを学習データとして各ノードそれぞれについて他のノードとの関係性を示す第2特徴ベクトルを生成する第2生成部と、
前記学習用コーパスにおけるノードシーケンス群の各組み合わせについて、組み合わせを構成する一方のノードシーケンスに含まれる各ノードの特徴ベクトルの平均値と、他方のノードシーケンスに含まれる各ノードの特徴ベクトルの平均値との差分ベクトルの2ノルムを算出するノルム算出部と、を備え、
前記第1生成部と前記第2生成部とは、前記ノルム算出部が算出した2ノルムが小さくなるように、それぞれ前記第1特徴ベクトルと前記第2特徴ベクトルとを生成する、
請求項7又は8に記載の情報処理装置。 - 前記ベクトル生成部は、前記組み合わせシーケンス生成部が生成したノードシーケンスを連結してできる新たなノードシーケンスを構成する各ノードを単語とみなし、Skip−gramモデルを用いて各ノードの特徴ベクトルを生成する、
請求項7又は8に記載の情報処理装置。 - プロセッサが、
複数のノード及び各ノード間の接続関係から構成されるネットワーク情報を取得するステップと、
取得した前記第1ネットワーク情報と前記第1ネットワーク情報とは異なる第2ネットワーク情報とのそれぞれについて、各ノードが接続する他のノードの数に基づいて各ノードの重みスコアを算出するステップと、
前記第1ネットワーク情報に含まれるノードと前記第2ネットワーク情報に含まれるノードとを並べて構成されるノードシーケンスであって、1の初期ノードを取り出し、前記重みスコア算出部が算出した重みスコアに応じて設定されたノード間の類似度にしたがって前記初期ノードに類似する類似ノードを取り出すステップと、
前記初期ノードと前記類似ノードとが並べられたノードシーケンスを生成するステップと、
生成した複数のノードシーケンスを学習用コーパスとして登録するステップと、
前記学習用コーパスを用いて、各ノードそれぞれについて他のノードとの関係性を示す特徴ベクトルを生成するステップと、
を実行する情報処理方法。 - コンピュータに、
複数のノード及び各ノード間の接続関係から構成されるネットワーク情報を取得する機能と、
取得した前記第1ネットワーク情報と前記第1ネットワーク情報とは異なる第2ネットワーク情報とのそれぞれについて、各ノードが接続する他のノードの数に基づいて各ノードの重みスコアを算出する機能と、
前記第1ネットワーク情報に含まれるノードと前記第2ネットワーク情報に含まれるノードとを並べて構成されるノードシーケンスであって、1の初期ノードを取り出し、前記重みスコア算出部が算出した重みスコアに応じて設定されたノード間の類似度にしたがって前記初期ノードに類似する類似ノードを取り出す機能と、
前記初期ノードと前記類似ノードとが並べられたノードシーケンスを生成する機能と、
生成した複数のノードシーケンスを学習用コーパスとして登録する機能と、
前記学習用コーパスを用いて、各ノードそれぞれについて他のノードとの関係性を示す特徴ベクトルを生成する機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029736A JP6842436B2 (ja) | 2018-02-22 | 2018-02-22 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029736A JP6842436B2 (ja) | 2018-02-22 | 2018-02-22 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019144939A true JP2019144939A (ja) | 2019-08-29 |
JP6842436B2 JP6842436B2 (ja) | 2021-03-17 |
Family
ID=67773867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018029736A Active JP6842436B2 (ja) | 2018-02-22 | 2018-02-22 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6842436B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559868A (zh) * | 2020-12-17 | 2021-03-26 | 广州博冠信息科技有限公司 | 信息召回方法、装置、存储介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101562568A (zh) * | 2009-05-26 | 2009-10-21 | 中国科学院计算技术研究所 | 覆盖网备用路径生成方法和装置 |
WO2011001806A1 (ja) * | 2009-06-30 | 2011-01-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | グラフの類似度計算システム、方法及びプログラム |
JP2013101634A (ja) * | 2006-11-08 | 2013-05-23 | Epals Inc | 意味ネットワークにおけるノードの動的特性化 |
JP2014228975A (ja) * | 2013-05-20 | 2014-12-08 | 日本電信電話株式会社 | 検索装置、検索方法および検索プログラム |
JP2014235474A (ja) * | 2013-05-31 | 2014-12-15 | 国立大学法人京都大学 | 関係性グラフ相互連携システム |
US20160078148A1 (en) * | 2014-09-16 | 2016-03-17 | Microsoft Corporation | Estimating similarity of nodes using all-distances sketches |
CN107454196A (zh) * | 2017-09-15 | 2017-12-08 | 曙光信息产业(北京)有限公司 | 一种邻居节点的分配方法 |
JP2017220222A (ja) * | 2016-06-06 | 2017-12-14 | 富士通株式会社 | データグラフを比較する方法、プログラム、及び装置 |
-
2018
- 2018-02-22 JP JP2018029736A patent/JP6842436B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013101634A (ja) * | 2006-11-08 | 2013-05-23 | Epals Inc | 意味ネットワークにおけるノードの動的特性化 |
CN101562568A (zh) * | 2009-05-26 | 2009-10-21 | 中国科学院计算技术研究所 | 覆盖网备用路径生成方法和装置 |
WO2011001806A1 (ja) * | 2009-06-30 | 2011-01-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | グラフの類似度計算システム、方法及びプログラム |
JP2014228975A (ja) * | 2013-05-20 | 2014-12-08 | 日本電信電話株式会社 | 検索装置、検索方法および検索プログラム |
JP2014235474A (ja) * | 2013-05-31 | 2014-12-15 | 国立大学法人京都大学 | 関係性グラフ相互連携システム |
US20160078148A1 (en) * | 2014-09-16 | 2016-03-17 | Microsoft Corporation | Estimating similarity of nodes using all-distances sketches |
JP2017220222A (ja) * | 2016-06-06 | 2017-12-14 | 富士通株式会社 | データグラフを比較する方法、プログラム、及び装置 |
CN107454196A (zh) * | 2017-09-15 | 2017-12-08 | 曙光信息产业(北京)有限公司 | 一种邻居节点的分配方法 |
Non-Patent Citations (1)
Title |
---|
白賀 昌宏、外4名: "大学サイトモチーフの類似度ネットワークによる分析法", 第3回データ工学と情報マネジメントに関するフォーラム 論文集, JPN6020045791, 4 August 2011 (2011-08-04), JP, ISSN: 0004398402 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559868A (zh) * | 2020-12-17 | 2021-03-26 | 广州博冠信息科技有限公司 | 信息召回方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6842436B2 (ja) | 2021-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102129640B1 (ko) | 스트링 변환의 귀납적 합성을 위한 랭킹 기법 | |
JP5755822B1 (ja) | 類似度算出システム、類似度算出方法およびプログラム | |
JP2021504781A (ja) | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム | |
JP6816421B2 (ja) | 学習プログラム、学習方法及び学習装置 | |
EP3327592A1 (en) | Information processing method, information processing apparatus, and non-transitory recording medium | |
US11514198B2 (en) | Deep-learning based functional correlation of volumetric designs | |
Chen et al. | ASCOS: an asymmetric network structure context similarity measure | |
JP2015230570A (ja) | 学習モデル作成装置、判定システムおよび学習モデル作成方法 | |
CN111142681A (zh) | 一种确定汉字拼音的方法、系统、装置及存储介质 | |
US20190243811A1 (en) | Generation method, generation device, and computer-readable recording medium | |
JP6842436B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2019082860A (ja) | 生成プログラム、生成方法及び生成装置 | |
JP6773412B2 (ja) | コロプレスマップの設計 | |
JP2015162113A (ja) | システムパラメタ学習装置、情報処理装置、方法、及びプログラム | |
JP2022166126A (ja) | 文書処理モデルのトレーニング方法、装置、機器、記憶媒体及びプログラム | |
JP7087931B2 (ja) | 探索プログラム、探索方法及び探索装置 | |
JP2022185799A (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP2022052481A (ja) | 説明文出力装置、説明文出力プログラム及び説明文出力方法 | |
JP6633267B2 (ja) | 次元削減装置、方法及びプログラム | |
JP7474536B1 (ja) | 情報処理システム、情報処理方法 | |
CN115510203B (zh) | 问题答案确定方法、装置、设备、存储介质及程序产品 | |
JP5766753B2 (ja) | システムパラメータ学習装置、情報処理装置、方法、及びプログラム | |
WO2022168208A1 (ja) | 情報処理装置、変換パターンの決定方法、名寄せ方法、学習方法、変換パターン決定プログラム、名寄せプログラム、および学習プログラム | |
CN110688446B (zh) | 一种句义数学空间表示方法、系统、介质和设备 | |
JP2022116979A (ja) | 文章生成装置、プログラムおよび文章生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6842436 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |