JP2022090562A - Information processing device and program - Google Patents
Information processing device and program Download PDFInfo
- Publication number
- JP2022090562A JP2022090562A JP2020203042A JP2020203042A JP2022090562A JP 2022090562 A JP2022090562 A JP 2022090562A JP 2020203042 A JP2020203042 A JP 2020203042A JP 2020203042 A JP2020203042 A JP 2020203042A JP 2022090562 A JP2022090562 A JP 2022090562A
- Authority
- JP
- Japan
- Prior art keywords
- node
- analysis
- information
- analysis target
- targets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 90
- 238000010801 machine learning Methods 0.000 claims abstract description 75
- 238000012545 processing Methods 0.000 claims abstract description 72
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、分析対象に係る分析処理を行う情報処理装置及びプログラムに関する。 The present invention relates to an information processing apparatus and a program that perform analysis processing related to an analysis target.
近年ではソーシャルネットワークサービス(SNS)等の種々のソーシャルメディアが多くの人々の生活に欠かせないものとなってきている。しかし一方で、SNS等で発信される情報は膨大となっており、その分析対象に適切な情報を提供することが困難となってきている。 In recent years, various social media such as social network services (SNS) have become indispensable to the lives of many people. However, on the other hand, the amount of information transmitted by SNS and the like is enormous, and it is becoming difficult to provide appropriate information to the analysis target.
特許文献1には、分析対象グループに属する分析対象のうち、他の分析対象が購入したものを購入していない分析対象に対して購入推薦情報を提供する例が開示されている。
上記従来例によれば、例えばあるSNSなどのソーシャルメディアのユーザ間で、共通して購入されている商品の情報を提供することができる。しかしながら、ソーシャルメディアの規模が増大するにつれて、分析対象であるユーザの数も大規模になり、ユーザの興味が多様になるため、共通して購入した商品や共通して利用しているハッシュタグ、などといった情報の数はユーザの数に対して小さいものとなる。 According to the above-mentioned conventional example, it is possible to provide information on products that are commonly purchased among users of social media such as a certain SNS. However, as the scale of social media grows, so does the number of users to be analyzed, and the interests of users diversify. The number of information such as is small compared to the number of users.
つまり、分析対象の数が増大するにつれて、一般に分析対象間の関係や、分析対象と購入した商品、分析対象が用いたハッシュタグ(見出し語)などの関係を表す情報は、疎(sparse)になっているのが実情である。このような疎な関係に対しては、上記従来例のような方法は有効でないことが知られている。 In other words, as the number of analysis targets increases, information that generally represents the relationship between the analysis targets, the products purchased with the analysis target, and the hashtag (headword) used by the analysis target becomes sparse. The reality is that it has become. It is known that the method as in the above conventional example is not effective for such a sparse relationship.
本発明は上記実情に鑑みて為されたもので、関係が疎であるようなソーシャルメディアであっても、分析対象と商品などといった情報項目間の関係を定量化し、利用に供することのできる情報処理装置、及びプログラムを提供することを、その目的の一つとする。 The present invention has been made in view of the above circumstances, and information that can be used by quantifying the relationship between information items such as analysis targets and products even in social media where the relationship is sparse. One of the purposes is to provide a processing device and a program.
上記従来例の問題点を解決する本発明の一態様は、情報処理装置であって、互いの関係が設定された複数の分析対象について、分析対象ごとに設定されるベクトル値を、分散表現情報として保持する手段と、前記分析対象間に設定された関係が、互いに予め定めた所定の第1の関係にあるとされる前記複数の分析対象の一部を、第1分析対象群として抽出し、当該抽出した第1分析対象群の順列または組み合わせに基づいて、当該第1分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第1機械学習手段と、前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にあるとされる前記複数の分析対象の一部と、前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にないとされる前記複数の分析対象の一部とを第2分析対象群として、当該第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、前記第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第2機械学習手段と、前記第1機械学習手段と第2機械学習手段とにより機械学習された分析対象ごとの分散表現情報を、所定の処理に供する処理手段と、を含むものである。 One aspect of the present invention that solves the problems of the above-mentioned conventional example is an information processing apparatus, in which vector values set for each analysis target are set as distributed representation information for a plurality of analysis targets for which mutual relationships are set. A part of the plurality of analysis targets, which is said to have a predetermined first relationship in which the means set as the analysis target and the analysis target have a predetermined first relationship with each other, is extracted as the first analysis target group. , The first machine learning means for machine learning the distributed expression information related to each of the analysis targets included in the first analysis target group based on the sequence or combination of the extracted first analysis target group, and the analysis target. A part of the plurality of analysis targets in which the relationship set in the above is considered to be a predetermined second relationship predetermined to each other, and the relationship set between the analysis targets is a predetermined second relationship predetermined to each other. The second analysis target group is defined as a part of the plurality of analysis targets that are not related to the second analysis target group, and is based on the relationship set for each of the analysis targets included in the second analysis target group. A second machine learning means for machine learning the distributed expression information related to each of the analysis targets included in the analysis target group, and a distributed expression for each analysis target machine-learned by the first machine learning means and the second machine learning means. It includes a processing means for providing information to a predetermined processing.
本発明によると、関係が疎であるようなソーシャルメディアであっても、分析対象と商品などといった情報項目間の関係を定量化し、利用に供することができる。 According to the present invention, even in social media where the relationship is sparse, the relationship between information items such as an analysis target and a product can be quantified and used.
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る情報処理装置1は、図1に例示するように、制御部11、記憶部12、操作部13、表示部14、及び通信部15を含んで構成されている。制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されたプログラムに基づいて動作する。本実施の形態ではこの制御部11は、互いの関係が設定された複数の分析対象について、分析対象ごとに設定されるベクトル値を、分散表現情報として記憶部12に保持する。またこの制御部11は、当該分析対象間に設定された関係を用いて、所定の第1の関係にあると判断される複数の分析対象の一部を、第1分析対象群として抽出する。そして制御部11は、当該抽出した第1分析対象群の順列または組み合わせに基づいて、分散表現情報を機械学習する第1機械学習処理を実行する。
An embodiment of the present invention will be described with reference to the drawings. As illustrated in FIG. 1, the
またこの制御部11は、第1分析対象群とは別の分析対象を第2分析対象群として抽出し、当該抽出した第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第2機械学習処理を実行する。
Further, the
本実施の形態の一例では、制御部11は、ある分析対象Aとの間に設定された関係が、互いに予め定めた所定の第2の関係にあると判断される、分析対象Aとは異なる分析対象(他の分析対象と呼ぶ。複数あってもよい)Bと、ある分析対象Aとの間に設定された関係が、互いに予め定めた所定の第2の関係にないと判断される他の分析対象Bとを含む第2分析対象群を、複数の分析対象のうちから抽出する。そして制御部11は、当該抽出した第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する。
In one example of the present embodiment, the
そして制御部11は、第1機械学習処理と第2機械学習処理とで得られた分析対象ごとの分散表現情報を、所定の処理、例えば分析対象間の類似性の判断等の処理に供する。この制御部11の詳しい処理の内容については後に述べる。
Then, the
記憶部12は、メモリデバイスやディスクデバイス等であり、制御部11により実行されるプログラムを保持する。この記憶部12に格納されたプログラムは、コンピュータ可読、かつ非一時的な記録媒体に格納されて提供され、この記憶部12に格納されたものであってもよい。また本実施の形態の記憶部12は、制御部11のワークメモリとしても動作する。
The
操作部13は、キーボードやマウス等であり、情報処理装置1のユーザの操作を受け入れて、当該操作の内容を表す情報を、制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。
The
通信部15は、ネットワークインタフェース等である。本実施の形態の一例では、この通信部15は、制御部11から入力される指示に従って、SNSのサーバS等にアクセスし、これらのサーバS等から分析対象の情報や、分析対象の投稿した情報等を受信して制御部11に出力する。またこの通信部15は、制御部11から入力される指示に従い、ネットワークを介して、ユーザ側の端末Uに対し、情報を送出し、ユーザに提示させることとしてもよい。
The
次に、本実施の形態の制御部11の動作の内容について説明する。本実施の形態の制御部11は、記憶部12に格納されたプログラムに従って動作することにより、図2に例示するように、機能的に、情報取得部21と、グラフ生成部22と、第1機械学習処理部23と、第2機械学習処理部24と、統合処理部25と、評価処理部26と、出力処理部27とを含む構成を実現する。
Next, the contents of the operation of the
なお、以下の説明では、一例として、ツイッター(登録商標)や、インスタグラム(登録商標)等のSNSの利用者のアカウント(便宜的に一般アカウントと呼ぶ)と、利用者がフォローする別のアカウント(以下の例では特に、商品ブランドの公式のアカウントなど、一般アカウント以外の、予め定めたアカウントに限定する、以下、公式アカウントと呼ぶ)と、各利用者(一般アカウントであると公式アカウントであるとを問わない)の投稿に含まれるタグ(ハッシュタグ)とのそれぞれを分析対象として、各分析対象を特定する情報を取得する。 In the following explanation, as an example, an account of an SNS user such as Twitter (registered trademark) or Instagram (registered trademark) (referred to as a general account for convenience) and another account that the user follows. (In the following example, in particular, it is limited to predetermined accounts other than general accounts such as official accounts of product brands, hereinafter referred to as official accounts) and each user (general account is an official account). The information that identifies each analysis target is acquired by using each of the tags (hash tags) included in the post (regardless of) as the analysis target.
この例ではアカウントと当該アカウントの投稿に含まれるタグの情報、並びに一般アカウントを特定する情報と、当該情報で特定される一般アカウントがフォローしている公式アカウントを特定する情報と、が本発明における、分析対象間の互いの関係に相当する。 In this example, the information of the account and the tag included in the post of the account, the information specifying the general account, and the information specifying the official account followed by the general account specified by the information are in the present invention. , Corresponds to the mutual relationship between the analysis targets.
情報取得部21は、評価の対象とする分析対象を含む、複数の分析対象の各々を特定する情報と、当該分析対象の少なくとも一人に対して所定の関係を有する、少なくとも一種類の情報項目とを取得する。本実施の形態の一例では、ツイッター(登録商標)や、インスタグラム(登録商標)等のSNSの一つを対象として、当該対象としたSNSの利用者のアカウントを分析対象とする。
The
この例では、情報取得部21は、当該SNSのウェブサイトあるいはSNSの運営者から、当該SNSの利用者のアカウントの一覧(全体でなく、分析対象となるアカウントを、所定の条件により限定してもよい)と、その一覧に属するアカウントからの投稿に含まれるタグ(ハッシュタグ)の情報と、当該一覧に属するアカウントごとに、当該アカウントがフォローする別のアカウント(ここでは公式アカウントに限るものとする)を特定する情報とを取得すればよい。
In this example, the
グラフ生成部22は、情報取得部21が取得した情報で特定される、分析対象の各々を表すノードを設定するとともに、所定の関係を有するノード間を連結したグラフを生成する。
The
図3に、SNSを対象とした場合の、このグラフ生成部22が生成するグラフを概念的に示す。図3では、一般アカウントの各々を表すノードを含む層Bと、公式アカウントのノードを含む層Aと、各アカウントが利用したハッシュタグを表すノードを含む層Cとをそれぞれ別々の層として表している。
FIG. 3 conceptually shows a graph generated by the
グラフ生成部22は、各層間、あるいは層内のそれぞれについて予め定めた関係を有するノード間にエッジを設定する。具体的に図3の例では、次の規則に従い、エッジを設定する:
・層Bと層Aとの間では、層B内のノードと、当該ノードが表す一般アカウントがフォローする公式アカウントを表す層A内のノードとの間にエッジを設定する。
・層Bと層Cとの間では、層B内のノードと、当該ノードが表す一般アカウントが投稿したテキストに含まれるハッシュタグを表す層C内のノードとの間にエッジを設定する。
・層C内のノード間では、一つの投稿に一度に含まれる(つまり共起している)複数のハッシュタグのそれぞれを表すノードの間にエッジを設定する。
こととする。ここでの例では、公式アカウントと公式アカウントが利用したハッシュタグとの関係は考慮しないこととしている。
The
An edge is set between the layer B and the layer A between the node in the layer B and the node in the layer A representing the official account that the general account represented by the node represents.
An edge is set between the layer B and the layer C between the node in the layer B and the node in the layer C representing the hashtag included in the text posted by the general account represented by the node.
-Between the nodes in layer C, an edge is set between the nodes representing each of the plurality of hashtags included (that is, co-occurring) at one time in one post.
I will do it. In the example here, the relationship between the official account and the hashtag used by the official account is not considered.
グラフ生成部22は、上述の規則に従って層Bと層Aとの間、層Bと層Cとの間、層B内のノード間、層C内のノード間に係るエッジを設定する。つまりグラフ生成部22は、層Bに属する一般アカウントのノードを一つずつ選択し、選択したノードから、当該ノードが表す一般アカウントがフォローする、層Aに属する公式アカウントのノードへのエッジを設定する。
The
またグラフ生成部22は、上記層Bのうちから選択したノードから、当該選択したノードが表す一般アカウントの投稿に含まれるハッシュタグのノードに対してエッジを設定する。
Further, the
グラフ生成部22は、このエッジの設定を、層Bに属する一般アカウントの各ノードについて行う。さらに、このグラフ生成部22は、所定の関係を有する一対のハッシュタグを表す一対のノード、及び所定の関係を有する一対の公式アカウントを表す一対のノードをさらに連結してもよい。
The
具体的にこのグラフ生成部22は、層Cに属する一対のノードがそれぞれ表す、互いに異なる一対のハッシュタグであって、一つの投稿に共通して現れている(つまり共起している)一対のハッシュタグを表す一対のノード間にエッジを設定する。例えばある投稿にハッシュタグα、β、γが含まれる場合、グラフ生成部22は、ハッシュタグα-β間、β-γ間、α-γ間にエッジを設定する。
Specifically, this
またグラフ生成部22は、この層C内のノード間のエッジには、共起が生じた回数に応じて、重みを設定してもよい。さらに、グラフ生成部22は、一般アカウントのノード(層Bに属するノード)と、当該一般アカウントの利用者からの投稿に含まれるハッシュタグのノード(層Cに属するノード)との間のエッジについても、当該一般アカウントによる当該ハッシュタグの使用回数に応じて重みを設定してもよい。
Further, the
ここでグラフ生成部22が設定する各エッジは、いずれも方向のないエッジとしておいてよい。つまり、グラフ生成部22が生成するグラフは、無向グラフでよい。
Here, each edge set by the
第1機械学習処理部23は、グラフ生成部22が生成したグラフに含まれるノードの連結関係、つまり、分析対象間に設定された関係を用いて所定の第1の関係にあると判断される複数の分析対象の一部を、第1分析対象群として抽出する。
The first machine
一例としてこの第1機械学習処理部23は、グラフ生成部22が生成したグラフの任意のノードを起点として、当該起点から任意に定めた回数だけエッジを辿って到達できるノード(第1分析対象群)のリスト(順列、または組み合わせ)を複数組生成する。以下、このように、起点から任意に定めた回数以内の回数だけエッジを辿って到達できるとの条件(所定の条件)を満足するノードを、起点となったノードに対する連結ノードと呼び、これら起点ノードと連結ノードとは互いに連結された関係にあると呼ぶこととする。
As an example, the first machine
そして第1機械学習処理部23は、当該抽出した第1分析対象群の、例えば順列に基づいて、分散表現情報を機械学習する。具体的に第1機械学習処理部23は、生成した各リストに含まれる各ノードについてネガティブサンプリングによるスキップグラム(skipgram)学習を行って、各ノードの分散表現情報であるベクトル情報を得る。この方法は、例えば、T. Mikolov, et al., “Distributed Representations of Words and Phrases and their Compositionality”, arXiv, arXiv:1310.4546に開示されているので、この方法についてのここでの詳細な説明は省略する。
Then, the first machine
すなわちこの第1機械学習処理部23は、いわゆるグラフ・エンベディング(Graph embedding)の方法により、生成されたグラフの各ノードの分散表現情報として、ノードごとのベクトル情報を得る。
That is, the first machine
第2機械学習処理部24は、分析対象間に設定された関係が、互いに予め定めた所定の関係にあるとされる複数の分析対象の一部と、分析対象間に設定された関係が、互いに予め定めた所定の関係にないとされる前記複数の分析対象の一部とを第2分析対象群として、当該第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、当該第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する。 In the second machine learning processing unit 24, the relationship set between the analysis targets is a part of a plurality of analysis targets that are considered to have a predetermined relationship predetermined with each other, and the relationship set between the analysis targets is set. A part of the plurality of analysis targets that are not considered to have a predetermined relationship with each other as a second analysis target group, based on the relationship set for each of the analysis targets included in the second analysis target group. , Machine learning of distributed expression information related to each of the analysis targets included in the second analysis target group.
本実施の形態の一例では、この第2機械学習処理部24は、グラフ情報を用いた所定の条件により互いに連結された関係にあると判断される場合に、上記所定の関係にあるものとして、第2分析対象群を抽出する。 In an example of the present embodiment, when it is determined that the second machine learning processing unit 24 has a relationship of being connected to each other under a predetermined condition using graph information, it is assumed that the second machine learning processing unit 24 has the above-mentioned predetermined relationship. The second analysis target group is extracted.
具体的に、この例の処理を行う第2機械学習処理部24は、層Bに属する一般アカウントの各ノードを順次、注目ノードBnとして選択しつつ次の処理を行う。すなわち第2機械学習処理部24は、層Cに属するノードのうち、選択した注目ノードBnとの間でエッジが設定されているノードCxを少なくとも一つ選択する。また、第2機械学習処理部24は、層Cに属するノードのうち、選択した注目ノードBnとの間でエッジが設定されていないノードCyを少なくとも一つ選択する。ここで選択されたノードCx,Cyが本発明における第2分析対象群となる。 Specifically, the second machine learning processing unit 24 that performs the processing of this example performs the next processing while sequentially selecting each node of the general account belonging to the layer B as the node of interest Bn. That is, the second machine learning processing unit 24 selects at least one node Cx whose edge is set between the selected node Bn and the node of interest among the nodes belonging to the layer C. Further, the second machine learning processing unit 24 selects at least one node Cy whose edge is not set between the selected node Bn and the node belonging to the layer C among the nodes belonging to the layer C. The nodes Cx and Cy selected here are the second analysis target group in the present invention.
なお、ここでは第1分析対象群については起点としたノードから予め定めた回数以内の回数だけエッジを辿って到達できるとの条件を満足するノードを抽出しているのに対し、第2分析対象群については起点としたノードとの間でエッジが設定されているノードと、エッジが設定されていないノードとを選択することとしているが、これは一例であり、本実施の形態の別の例では、第2の分析対象群の抽出においても、起点としたノードから予め定めた回数以内の回数だけエッジを辿って到達できるとの条件を満足するノードと、当該条件を満足しないノードとを選択することとしてもよい。 As for the first analysis target group, the node satisfying the condition that the node can be reached by tracing the edge within a predetermined number of times from the node as the starting point is extracted here, whereas the second analysis target is extracted. Regarding the group, a node having an edge set between the node and the node as the starting point and a node having no edge set are selected, but this is an example, and is another example of the present embodiment. Then, also in the extraction of the second analysis target group, a node that satisfies the condition that the node can be reached by tracing the edge within a predetermined number of times from the node as the starting point and a node that does not satisfy the condition are selected. You may do it.
第2機械学習処理部24は、注目ノードBnの分散表現情報とノードCxの(複数ある場合はそのそれぞれの)分散表現情報との距離が、注目ノードBnの分散表現情報とノードCy(複数ある場合はそのそれぞれの)分散表現情報との距離よりも近接した距離となるように、少なくとも注目ノードBnの分散表現情報を定めることとする。なお、ここでの各ノードの分散表現情報の初期値は、ランダムに定めておくこととしてもよいし、第1機械学習処理部23が得たベクトル値に設定されてもよい。
In the second machine learning processing unit 24, the distance between the distributed representation information of the node Bn of interest and the distributed representation information of the node Cx (if there are a plurality of them) is different between the distributed representation information of the node Bn of interest and the node Cy (plural). In that case, at least the distributed representation information of the node Bn of interest is determined so that the distance is closer than the distance to the distributed representation information (of each of them). The initial value of the distributed representation information of each node here may be set at random, or may be set to the vector value obtained by the first machine
初期化後、i番目に選択した注目ノードBnの分散表現情報をxi(i=1,2,…)、ノードCxの分散表現情報をxj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)として、第2機械学習処理部24は、損失LPARIGを、
である。またここでaはゲインであり、適宜実験的に、例えばa=1などと定める。
After initialization, the distributed representation information of the node Bn of interest selected i-th is xi (i = 1, 2, ...), The distributed representation information of the node Cx is xj (j = 1, 2, ...), And the distribution of the node Cy. Assuming that the expression information is xj'(j'= 1, 2, ...), The second machine learning processing unit 24 sets the loss LPARIG.
Is. Further, here, a is a gain, and is appropriately experimentally determined, for example, a = 1.
さらにここで
は、条件Bに係る指示関数であり、(1)式の例では所定のmを定めたとき、
であれば「1」、そうでなければ「0」となる関数である。
Further here
Is an indicator function according to the condition B, and in the example of the equation (1), when a predetermined m is defined,
If it is, it is "1", otherwise it is "0".
つまりこの損失関数LPARIGは、注目ノードBnの分散表現情報とノードCxの(複数ある場合はそのそれぞれの)分散表現情報との距離が、注目ノードBnの分散表現情報とノードCy(複数ある場合はそのそれぞれの)分散表現情報との距離よりも近接した距離となるように、少なくとも注目ノードBnの分散表現情報を定めようとするものであるが、そもそも注目ノードBnの分散表現情報とあるノードCxの分散表現情報との距離が、注目ノードBnの分散表現情報とあるノードCyの分散表現情報との距離よりも十分小さい場合のみ、当該距離の差を考慮するように調整したものである。 That is, in this loss function LPARIG, the distance between the distributed representation information of the attention node Bn and the distributed representation information of the node Cx (if there are a plurality of them) is the variance representation information of the attention node Bn and the node Cy (if there are a plurality of them). At least the distributed representation information of the attention node Bn is determined so that the distance is closer than the distance to the distributed representation information (of each of them), but in the first place, the distributed representation information of the attention node Bn and a certain node Cx Only when the distance from the distributed expression information of the node Bn of interest is sufficiently smaller than the distance between the distributed expression information of the node Cy of interest and the distributed expression information of a certain node Cy, the difference in the distance is taken into consideration.
第2機械学習処理部24は、この損失LPARIGを最小とするように注目ノードBnの分散表現情報xiと、ノードCxの分散表現情報xj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)を更新して機械学習する。 The second machine learning processing unit 24 has the distributed representation information xi of the node Bn of interest, the distributed representation information xj (j = 1, 2, ...) Of the node Cx, and the distributed representation of the node Cy so as to minimize this loss LPARIG. The information is machine-learned by updating xj'(j'= 1, 2, ...).
第2機械学習処理部24は、層Bに属する各ノードの分散表現情報xi(i=1,2…)をこの処理により取得する。なお、ここで述べた第2機械学習処理部24における、分散表現情報を損失が小さくなるよう更新する機械学習の処理は広く知られている処理を採用できるので、ここでのこれ以上の詳細な説明を省略する。 The second machine learning processing unit 24 acquires the distributed representation information xi (i = 1, 2, ...) Of each node belonging to the layer B by this processing. Since the machine learning process for updating the distributed representation information so that the loss is small in the second machine learning processing unit 24 described here can be a widely known process, more detailed processing here can be adopted. The explanation is omitted.
統合処理部25は、分析対象を表すノードについて、第1機械学習処理部23で得られた分散表現情報と、第2機械学習処理部24で得られた分散表現情報とを用いて、後に評価処理部26で利用する分析対象を表すノードについての分散表現情報を生成する。
The
具体的にこの統合処理部25は、層Bに属する各ノードBi(i=1,2,…)についての分散表現情報Xi(以下、統合分散表現情報と呼ぶ)を、当該ノードBiについて第1機械学習処理部23で得られた分散表現情報yiと、第2機械学習処理部24で得られた分散表現情報xiとを用いて、
とする。なお、ここで
は、ベクトルの要素を連接することを意味する。つまりここでは分散表現情報yiの次元がny、分散表現情報xiの次元がnxであるとするとき、統合分散表現情報Xiは、その成分の数が(ny+nx)であり、その最初のny個はyiの成分とし、残るnx個の成分はxiの成分としたものである。
Specifically, the
And. In addition, here
Means concatenating the elements of a vector. That is, here, assuming that the dimension of the distributed representation information yi is ny and the dimension of the distributed representation information xi is nx, the integrated distributed representation information Xi has the number of components (ny + nx), and the first ny pieces are The components of yi are used, and the remaining nx components are the components of xi.
評価処理部26は、統合処理部25により得られた層Bに属するノードごとの統合分散表現情報を用いて個人アカウント間の類似性を評価する。この例では評価処理部26は、層Bに属する複数のノードについて、それらの統合分散表現情報間の距離情報を得る。この距離情報は、ユークリッド距離であってもよいし、コサイン類似度(各ベクトルのノルムの積でベクトルの内積を除したもの)であってもよい。
The
そして評価処理部26は、個人アカウントのノードごとに、当該ノードと別のノードとの間の距離情報に基づいて距離が近いと判断される別のノード(ユークリッド距離であれば所定のしきい値を下回るもの、コサイン類似度であれば、0以上1未満の所定のしきい値を超えるもの)を類似アカウントのノードとして選択する。そして評価処理部26は、個人アカウントのノードごとに選択した類似アカウントのノードを特定する情報を出力する。
Then, the
出力処理部27は、評価処理部26から入力される情報で特定される個人アカウントのアカウント名やそのプロファイルなどの情報を、表示部14に表示出力したり、通信部15を介してユーザ側の端末Uへ送出したりするなどして、情報処理装置1のユーザに提示する。
The
[動作]
本実施の形態は以上の構成を備えており、次のように動作する。以下の例では、情報処理装置1は、ツイッター(登録商標)や、インスタグラム(登録商標)等のSNSの運営者により管理されるサーバ装置、あるいは当該SNSの運営者と契約した業者により管理されるサーバ装置として実現され、当該SNSのユーザからアクセス可能に配されているものとする。
[motion]
The present embodiment has the above configuration and operates as follows. In the following example, the
この例の情報処理装置1は、当該SNSの利用者の個人アカウントと、投稿されたテキストに含まれるハッシュタグと、当該SNSにアカウントを有する企業等の公式アカウントとを分析対象とする。また、情報処理装置1は個人アカウントを特定する情報を、予めユーザから受け入れる。具体的には、情報処理装置1は、SNSの利用者の一人であるユーザから、当該ユーザ自身を特定する情報を、評価の対象とする個人アカウントを特定する情報として受け入れておく。
The
以下の動作の例では、当該受け入れた情報で、評価の対象として特定されたアカウントに対し、類似する他の個人アカウントを提示するものとする。 In the example of the following behavior, the accepted information shall present another similar personal account to the account identified for evaluation.
この例の情報処理装置1は、図4に例示するように、対象とするSNSのウェブサイト等から、当該SNSの利用者の個人アカウントの一覧と、その一覧に属する個人アカウントからの投稿に含まれるタグ(ハッシュタグ)の情報と、当該一覧に属する個人アカウントごとに、当該個人アカウントがフォローする別のアカウント(ここでは説明のため公式アカウントに限るものとする)を特定する情報とを取得する(S11:情報収集)。
As illustrated in FIG. 4, the
なお、ここで情報処理装置1が取得する個人アカウントは、SNSの利用者全体の個人アカウントでなくてもよい。ただし、評価の対象とする個人アカウントを含めるものとする。
The personal account acquired by the
情報処理装置1は、当該取得した個人アカウントの各々を表すノードを含む層Bと、公式アカウントのノードを含む層Aと、アカウントが利用したハッシュタグを表すノードを含む層Cとを仮想的に設定する。
The
そして情報処理装置1は、評価の対象を含む分析対象である層Bに属するアカウントのノードを所定の順に一つずつ選択し、選択したノードから、当該ノードが表すアカウントがフォローする、層Aに属する公式アカウントのノードへのエッジを設定する。
Then, the
また情報処理装置1は、上記選択した層Bに属するアカウントのノードから、当該選択したノードが表すアカウントの投稿に含まれるハッシュタグのノードに対してエッジを設定する。さらに情報処理装置1は、層Cに属するハッシュタグを表すノードにおいて、一つの投稿に共通して現れている(つまり共起している)ハッシュタグ間にエッジを設定する。
Further, the
また情報処理装置1は、この層C内のノード間のエッジに、エッジに係る一対のノードが表すハッシュタグの共起の回数に応じて、重みを設定する。さらに、情報処理装置1は、個人アカウントのノード(層Bに属するノード)と、当該個人アカウントからの投稿に含まれるハッシュタグのノード(層Cに属するノード)との間のエッジについても、当該個人アカウントのハッシュタグの使用回数に応じた重みを設定する(S12:グラフの生成)。
Further, the
次に情報処理装置1は、ステップS12で生成したグラフに含まれるノードの連結関係に基づき、ノードの分散表現情報を機械学習する第1の機械学習処理を実行する(S13)。ここでは具体的に情報処理装置1は、グラフエンベディングの手法を用いて、各ノードの分散表現情報を得るものとする。
Next, the
すなわち、情報処理装置1はステップS13において、いわゆるディープ・ウォーク(DeepWalk)の手法を用いて各ノードの分散表現情報を得る(Bryan Perozzi, et al., DeepWalk: Online Learning of Social Representations, arXiv:1403.6652v2, 27 Jun 2014)。より詳しくは、この情報処理装置1は、ステップS13においてランダムな整数値γを一つ生成し、カウンタkをk=0にリセットする。
That is, in step S13, the
情報処理装置1は、層Bに属するノードVの一つを初期ノードVj(0)(jは、この処理の繰り返し回数であり、j=1,2,…)として選択する。そして情報処理装置1は、この初期ノードVj(0)を記録する。次に、情報処理装置1は当該初期ノードVj(0)に接続されているエッジを一つランダムに選択して、当該選択したエッジを介して隣接するノードVj(1)へ移動して、当該ノードVj(1)を初期ノードに連接して記録する。そして情報処理装置1はカウンタkを「1」だけインクリメントする。
The
以下、k<γの間、移動先のノードVj(k)から、当該ノードVj(k)に含まれるエッジを一つランダムに選択して、隣接するノードVj(k+1)へ移動して、移動先のノードVj(k+1)をそれまでに移動したノードの記録に連接して記録する処理を繰り返す。 Hereinafter, while k <γ, one edge included in the node Vj (k) is randomly selected from the destination node Vj (k), and the node is moved to the adjacent node Vj (k + 1) to move. The process of concatenating and recording the previous node Vj (k + 1) with the recording of the node that has been moved up to that point is repeated.
なお、ここで現在のノードから当該ノードに接続されているエッジをランダムに選択する際、情報処理装置1は、エッジの重みを考慮してもよい。エッジの重みを考慮する場合は、情報処理装置1は、エッジに設定されている重みの比により、選択される確率を制御する。例えば現在のノードVj(k)にn個のエッジEi(i=1,2…,n)が連結され、それぞれに重みwiが設定されている場合(なお、ここでは重みの設定のないエッジについては予め定めた値、あるいは、当該ノードに連結されたエッジのうち重みが設定されているエッジの重みに基づく統計値(平均値、中央値、最大値、最小値など)、あるいは、グラフ内で重みが設定されているエッジの重みに基づく統計値などにより定めておく)、情報処理装置1は、ノードEiを選択する確率を、wi/Σwiとする(Σwiは、wiの総和を意味する)。このように確率に応じてランダムに選択する方法については広く知られた種々の方法を採用できるので、ここでの説明は省略する。
Here, when randomly selecting an edge connected to the node from the current node, the
これにより情報処理装置1は、γ個のノードのリスト(ノードリストと呼ぶ)Lj(j=1,2…):
Lj=[Vj(0),Vj(1),Vj(2)…,Vj(γ)]
を得る。
As a result, the
Lj = [Vj (0), Vj (1), Vj (2) ..., Vj (γ)]
To get.
情報処理装置1は、層Bに属するノードViの各々を順次選択して、上記の処理を実行し、それぞれ互いに異なる長さの、ランダムなノードのリストを得る。
The
情報処理装置1は、層Bに属するノードViを起点としてエッジを辿って得たノードリストであって、評価の対象とする個人アカウントのノードを少なくとも所定の数(例えば1以上)だけ含んだ数のノードリストが得られるまで、ステップS13の処理を繰り返し実行して、複数個のノードリストLj(j=1,2…)を生成する。
The
例えば情報処理装置1は、起点とするノードを選択する際に、層Bのノードのすべてを順次抽出することとしてもよい。また情報処理装置1は、処理により得られたノードリストのうちに、層Bに含まれる互いに異なるノードの数nをカウントし、このnの値が所定のしきい値(便宜的に第1しきい値と呼ぶ)を超えたか否かを判断してもよい。ここで第1しきい値は、例えば層Bに含まれるノードの数Nのうち、所定の割合α(0<α≦1)の数を超えない最大の整数値floor(αN)とすればよい。そして、このnが所定の第1しきい値を下回るか、または、得られているノードリストのうちに、評価の対象とするアカウントのノードが予め定めた第2しきい値未満の数だけしか含まれていない場合に、情報処理装置1は、起点とするノードを選択する処理から繰り返して実行して、さらに別のノードリストを生成する処理を繰り返すようにしてもよい。
For example, the
一例として、図5に例示するように、A層にノードV11,V12,V13…が含まれ、B層にノードV21,V22…が含まれ、C層にノードV31,V32,V33…が含まれているとき、B層ノードV21と、A層のノードV11との間にエッジが設定され、当該ノードV21とC層のノードV31,V32にエッジが設定されているとする。またB層のノードV22と、C層のノードV32にエッジが設定されているものとし、C層のノードV31,32間、V32,33間、及びV31,33間にそれぞれエッジが設定されているものとする。 As an example, as illustrated in FIG. 5, the A layer contains nodes V11, V12, V13 ..., The B layer contains nodes V21, V22 ..., And the C layer contains nodes V31, V32, V33 ... At this time, it is assumed that an edge is set between the B-layer node V21 and the A-layer node V11, and an edge is set between the node V21 and the C-layer nodes V31 and V32. Further, it is assumed that the edge is set between the node V22 of the B layer and the node V32 of the C layer, and the edge is set between the nodes V31, 32, V32, 33, and V31, 33 of the C layer, respectively. It shall be.
このとき、例えばV21を初期ノードとして、5個のノードからなるノードリストをDeepWalkの方法で生成するとする。この例ではV21から酔歩(random walk)により、V21→V11→V21→V31→V33のように移動して、順列
L1=[V21,V11,V21,V31,V33]
を得る。
At this time, for example, it is assumed that V21 is set as the initial node and a node list consisting of five nodes is generated by the Deep Walk method. In this example, it moves from V21 in the order of V21 → V11 → V21 → V31 → V33 by random walk, and the sequence L1 = [V21, V11, V21, V31, V33].
To get.
また同じV21を初期ノードとした場合に、別のノードリストとして、別の順列である
L2=[V21,V31,V32,V22]
のようなノードリストが生成されてもよい。
Also, when the same V21 is used as the initial node, another node list is L2 = [V21, V31, V32, V22], which is a different order.
A node list such as may be generated.
情報処理装置1は、次に、生成した各ノードリストに含まれる各ノードについて、例えばネガティブサンプリングによるスキップグラム(skipgram)学習を行って、各ノードの分散表現情報であるベクトル情報を得る。つまり、情報処理装置1は、生成したノードリストを一つの「文」、当該文であるノードリストに含まれるノードを「語」として、word2vec等、広く知られた方法により分散表現情報を生成する。
Next, the
これにより情報処理装置1は、評価対象の個人アカウントを含む、複数の分析対象を表すノードについての分散表現情報を得る。
As a result, the
また情報処理装置1は、分析対象間に設定された関係が、互いに予め定めた所定の関係にあるとされる複数の分析対象の一部と、分析対象間に設定された関係が、互いに予め定めた所定の関係にないとされる前記複数の分析対象の一部とを第2分析対象群として、当該第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、当該第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する(S14)。
Further, in the
具体的に情報処理装置1は当初は(ノードの分散表現情報がステップS14の処理により演算されたことがなければ)、各ノードの分散表現情報の初期値をランダムに定める。
Specifically, the
また情報処理装置1は、層Bに属する一般アカウントの各ノードを順次、注目ノードBnとして選択する。そして情報処理装置1は、層Cに属するノードのうち、選択した注目ノードBnとの間でエッジが設定されているノードCx(正例分析対象)を少なくとも一つ選択する。また情報処理装置1は、層Cに属するノードのうち、選択した注目ノードBnとの間でエッジが設定されていないノードCy(負例分析対象)を少なくとも一つ、ノードCxと同じ数だけ選択する。
Further, the
情報処理装置1は、i番目に選択した注目ノードBnの分散表現情報をxi(i=1,2,…)、ノードCxの分散表現情報をxj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)として、第2機械学習処理部24は、損失LPARIGを、
である。さらにここで
は、条件Bに係る指示関数であり、(1)式の例では所定のmを定めたとき、
であれば「1」、そうでなければ「0」となる関数である。
In the
Is. Further here
Is an indicator function according to the condition B, and in the example of the equation (1), when a predetermined m is defined,
If it is, it is "1", otherwise it is "0".
情報処理装置1は、この損失LPARIGを用いて、勾配法により、注目ノードBnの分散表現情報xiと、ノードCxの分散表現情報xj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)を、Bnの分散表現情報xiとノードCxの分散表現情報xjとの間の距離が、Bnの分散表現情報xiとノードCyの分散表現情報xjとの間の距離より小さくなるよう機械学習する。
Using this loss LPARIG, the
情報処理装置1は、評価の処理に用いるノード、ここでは層Bに属する各ノードの分散表現情報xi(i=1,2…)を、ステップS13における処理とは独立に生成する。そして情報処理装置1は、ノードごとに、ステップS13で求めた当該ノードの分散表現情報とステップS14で求めた当該ノードの分散表現情報とを連接して、当該ノードの統合分散表現情報を得る(S15)。
The
本実施の形態において特徴的なことの一つは、ステップS13において求められるノードの分散表現情報が、当該ノードからエッジを辿って得られる情報(すなわちグラフのローカルな特徴)に基づいて得られるものであるのに対し、ステップS14において求められるノードの分散表現情報が、当該ノードと連結されていない他のノードの情報を用いて演算されるものであり、グラフのグローバルな特徴に基づいて得られるものであることである。 One of the characteristics of this embodiment is that the distributed representation information of the node obtained in step S13 is obtained based on the information obtained by tracing the edge from the node (that is, the local feature of the graph). On the other hand, the distributed representation information of the node obtained in step S14 is calculated using the information of other nodes that are not connected to the node, and is obtained based on the global characteristics of the graph. It is a thing.
このようにローカルな特徴に基づく分散表現情報と、グローバルな特徴に基づく分散表現情報とを含む統合分散表現情報を用いることで、ローカルな特徴とグローバルな特徴とを含んだ情報に基づいて評価を行うことが可能となる。 By using the integrated distributed representation information including the distributed representation information based on the local features and the distributed representation information based on the global features in this way, the evaluation is performed based on the information including the local features and the global features. It will be possible to do.
情報処理装置1は、ノードごとに得られた統合分散表現情報を用いて、評価の対象としたノード間の関連性を評価する。ここでの例では指定された個人アカウントのノードと、他の個人アカウントのノードとの類似度を評価する(S16)。
The
すなわち情報処理装置1は、評価の対象となった個人アカウントのノードの統合分散表現情報と、他の個人アカウントのノードの統合分散表現情報との距離情報として、例えば各統合分散表現情報のユークリッド距離を求める。
That is, the
そして情報処理装置1は、得られた距離情報に基づいて、評価の対象となった個人アカウントのノードと、統合分散表現情報に基づく距離が比較的近いと判断される、他の個人アカウントのノードを少なくとも一つ選択する。そして情報処理装置1は、当該選択したノードが表す個人アカウントの情報を出力してユーザに提示する(S17)。
Then, the
例えば情報処理装置1は、当該選択したノードにエッジを介して連結されている層A内の公式アカウントのノードのうち、評価の対象となった個人アカウントのノードにエッジを介して連結されていない層A内の公式アカウントのノードを特定する情報を得る。
For example, the
ここで選択したノードにエッジを介して連結されている層A内の公式アカウントのノードのうち、評価の対象となったアカウントのノードにエッジを介して連結されていない層A内の公式アカウントのノードがない場合は、さらに先に得られた距離情報に基づいて距離が近いと判断されるアカウントのノードのうち、別のノードを選択して、当該選択したノードにエッジを介して連結されている層A内の公式アカウントのノードのうち、評価の対象となったアカウントのノードにエッジを介して連結されていない層A内の公式アカウントのノードを特定する情報を得ることとすればよい。 Of the official account nodes in layer A that are linked to the node selected here via the edge, the official accounts in layer A that are not linked to the node of the account that was evaluated through the edge. If there is no node, select another node from the nodes of the account that is judged to be close based on the distance information obtained earlier, and connect to the selected node via the edge. Among the nodes of the official account in the layer A, the information that identifies the node of the official account in the layer A that is not connected to the node of the account to be evaluated via the edge may be obtained.
情報処理装置1は、ここで得られた評価の対象となったアカウントのノードにエッジを介して連結されていないノードで特定される、公式アカウントに係る情報、つまり、当該公式アカウントのアカウント名や、そのプロファイル情報等を、ユーザに提示する。例えば情報処理装置1は、当該公式アカウントのアカウント名や、そのプロファイル情報等を、ユーザに提示する。この情報の提示は例えば、ユーザが使用する端末装置に対して当該情報を送信して表示させることによって行われてもよい。
The
本実施の形態のこの例によると、ユーザと当該ユーザがフォローする公式アカウントとの関係、あるいはユーザと当該ユーザが使用しているハッシュタグとの関係、さらには一つの投稿で共起するハッシュタグ間の関係などといった情報に基づいてグラフネットワークを形成し、当該グラフのローカルな特徴とグローバルな特徴との双方を用いてユーザの個人アカウントの統合分散表現情報(なお、統合分散表現情報は公式アカウントやハッシュタグ等についても求めてもよい)を得て、ユーザ間の関係の近さ等の定量評価を可能としている。このため各ユーザが共通したハッシュタグを利用している回数が少なくても、つまり、関係が疎であっても、各ユーザ間の距離を、ローカルな特徴とグローバルな特徴の双方の観点に基づいて定量化可能としている。 According to this example of this embodiment, the relationship between the user and the official account that the user follows, the relationship between the user and the hash tag used by the user, and the hash tag that co-occurs in one post. A graph network is formed based on information such as the relationship between the graphs, and the integrated distributed representation information of the user's personal account is used for both the local and global characteristics of the graph (note that the integrated distributed representation information is the official account. , Hash tags, etc. may also be obtained), enabling quantitative evaluation of the closeness of relationships between users. Therefore, even if each user uses a common hashtag less often, that is, even if the relationship is sparse, the distance between each user is based on both local and global characteristics. Can be quantified.
[エッジの設定方法の他の例]
ここまでの説明では、グラフを生成する際に、分析対象、あるいは、情報項目を表すノード間に設定するエッジを定めるにあたり、分析対象と、情報項目とをそれぞれの種類ごとに層A,B,C…に分けた上で、予め定めた規則に従ってエッジを設定していた。
[Other examples of how to set edges]
In the explanation so far, when the analysis target or the edge to be set between the nodes representing the information items is determined when the graph is generated, the analysis target and the information item are divided into layers A, B, and layers for each type. After dividing into C ..., the edge was set according to a predetermined rule.
すなわちここまでの例では、
・層Bと層Aとの間では、層B内のノードと、当該ノードが表すアカウントがフォローする公式アカウントを表す層A内のノードとの間にエッジを設定する。
・層Bと層Cとの間では、層B内のノードと、当該ノードが表すアカウントが投稿したテキストに含まれるハッシュタグを表す層C内のノードとの間にエッジを設定する。
・層C内のノード間では、一つの投稿に一度に含まれる(つまり共起している)複数のハッシュタグのそれぞれを表すノードの間にエッジを設定する。
こととしていた。しかしながらエッジの設定方法はこの例に限られるものではない。
That is, in the examples so far,
• Between layer B and layer A, an edge is set between the node in layer B and the node in layer A that represents the official account that the account represented by that node follows.
An edge is set between the layer B and the layer C between the node in the layer B and the node in the layer C representing the hashtag included in the text posted by the account represented by the node.
-Between the nodes in layer C, an edge is set between the nodes representing each of the plurality of hashtags included (that is, co-occurring) at one time in one post.
I was supposed to. However, the edge setting method is not limited to this example.
この他に例えば、層B内のノード間で、相互フォローしている一対のアカウントのノード間にエッジを設定することとしてもよい。 In addition to this, for example, an edge may be set between the nodes of a pair of accounts that are following each other among the nodes in the layer B.
また、層A内のノードにおいて、別に行われた調査・分析により、互いに類似していると判断される公式アカウント同士について相互にエッジを設定することとしてもよい。例えば公式アカウントが何らかのブランドのアカウントである場合に、顧客が類似しているなどと分析されたブランドの公式アカウント間にエッジを設定してもよい。 Further, in the node in the layer A, the edges may be set for the official accounts that are judged to be similar to each other by the investigation and analysis conducted separately. For example, if the official account is an account of some brand, an edge may be set between the official accounts of the brands analyzed as having similar customers.
[重みの正規化]
なお、ここまでの説明では、情報処理装置1は、層C内のノード間のエッジに、対応するハッシュタグの共起の回数に応じて、重みを設定するとともに、層Bに属するノードと、対応する個人アカウントからの投稿に含まれるハッシュタグを表す層Cに属するノードとの間のエッジにも、当該個人アカウントのハッシュタグの使用回数に応じた重みを設定することとしていた。
[Weight normalization]
In the description so far, the
この重みは次のように正規化されたものであってもよい。具体的に情報処理装置1は、層B-層C間のエッジ(個人アカウントとハッシュタグ間のエッジ)についての重みとして、対応する個人アカウント(ノードViとする)が、対応するハッシュタグ(ノードVjとする)を使用した回数w′ijを用いて、
というように正規化した重みを設定してもよい。
This weight may be normalized as follows. Specifically, in the
You may set the normalized weight like this.
また情報処理装置1は、層C内の一対のノードVi,Vj間のエッジについては次のように重みを設定する。すなわち、以下の例では情報処理装置1は、ハッシュタグの共起の回数が「1」など所定のしきい値以下となっているときには初期の重みをw′ij=0とする。これはグラフの複雑さを低減して、機械学習に係る処理負荷を軽減するためである。また情報処理装置1は、当該所定のしきい値を超える回数だけ共起したハッシュタグ間の重みを初期的にw′ij=Nc(ここでNcはノードVi,Vjに対応するハッシュタグが共起している投稿の数、すなわち共起回数)とする。
Further, the
そして情報処理装置1は、層C内の一対のノードVi,Vj間のエッジの重みを、上記初期の重みw′ijを用いて、
と設定する。
Then, the
And set.
このように重みを正規化することで、例えばディープ・ウォークの処理を行う際に各ノードが比較的等確率で選択されるように調整される。 By normalizing the weights in this way, for example, when performing a deep walk process, each node is adjusted to be selected with a relatively equal probability.
[有向グラフとする例]
また以上の説明では、生成するグラフは、方向のない無向グラフとしていたが、例えばエッジを設定する際に、層B内のノード間で、いずれか一方が他方をフォローしている一対のノード(相互フォローとなっていない場合を含む)間に、フォローをしているアカウントのノードから、フォローされているアカウントのノードへと、方向のあるエッジを設定することとしてもよい。この例では相互フォローとなっている一対のノードVa,Vb間には、VaからVbへの方向を有するエッジEabと、VbからVaへの方向を有するエッジEbaとが(つまり双方向のエッジが)設定される。
[Example of directed graph]
Further, in the above description, the generated graph is an undirected graph with no direction. However, for example, when setting an edge, a pair of nodes in which one of them follows the other among the nodes in the layer B. During (including non-mutual follow), you may want to set a directional edge from the node of the account you are following to the node of the account you are following. In this example, between a pair of nodes Va and Vb that follow each other, an edge Eba having a direction from Va to Vb and an edge Eba having a direction from Vb to Va (that is, bidirectional edges are ) Set.
またこの場合、層A内の公式アカウントのノードと、層B内のアカウントのノードとの間では相互フォローでない場合でも、層A内のノードVcと、層B内のノードVd間には、Vcの公式アカウントがVdのアカウントをフォローしていなくても、VdのアカウントがVcの公式アカウントをフォローしていれば、VcからVdへの方向を有するエッジEcdと、VdからVcへの方向を有するエッジEdcと(つまり双方向のエッジ)を設定する。 Also, in this case, even if there is no mutual follow-up between the node of the official account in layer A and the node of the account in layer B, Vc is between the node Vc in layer A and the node Vd in layer B. Even if the official account of Vd does not follow the account of Vd, if the account of Vd follows the official account of Vc, it has the edge Edd having the direction from Vc to Vd and the direction from Vd to Vc. Set the edge Edc (that is, the bidirectional edge).
層B,層C間においても同様に、双方向のエッジを設定するものとし、層C間でも一つの投稿内で共起しているハッシュタグに対応する一対のノード間には双方向のエッジ(上述のような2つのエッジでもよい)を設定する。 Similarly, bidirectional edges are set between layers B and C, and bidirectional edges are set between a pair of nodes corresponding to hashtags co-occurring in one post even between layers C. (It may be two edges as described above) is set.
このように有向グラフとした場合は、ディープ・ウォークを行う際に、エッジの方向に従ってのみ移動することとする。従って、移動先のノードにおいて、外向きのエッジが存在しない場合は、そこでリスト終了とする。 In the case of a directed graph in this way, when performing a deep walk, it is assumed that the graph moves only according to the direction of the edge. Therefore, if there is no outward edge in the destination node, the list ends there.
[第2機械学習処理部による演算の他の例]
また本実施の形態のここまでの説明においては、第2機械学習処理部24は、i番目に選択した注目ノードBnの分散表現情報をxi(i=1,2,…)、ノードCxの分散表現情報をxj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)として、損失としてLPARIGを(1)式により演算することとしていた。
[Other examples of operations by the second machine learning processing unit]
Further, in the description of the present embodiment so far, the second machine learning processing unit 24 uses xi (i = 1, 2, ...) And the distribution of the node Cx for the distributed representation information of the node Bn of interest selected i-th. The expression information is xj (j = 1, 2, ...), The distributed expression information of the node Cy is xj'(j'= 1, 2, ...), And LPARIG is calculated as the loss by the equation (1).
しかしながら、これは一例であり、損失LBPRを、(1)式のLPARIGに代えて、次の(2)式により求めることとしてもよい。すなわち、第2機械学習処理部24は、
この例においても、第2機械学習処理部24は、この損失LBPRを最小とするように注目ノードBnの分散表現情報xiと、ノードCxの分散表現情報xj(j=1,2,…)、ノードCyの分散表現情報をxj′(j′=1,2…)を更新して機械学習する(例えばSteffen Rendle, et.al., “BPR:Bayesian personalized ranking from implicit feedback”, UAI '09: Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence, June 2009 Pages 452-461等に記載されている処理と同様)。この更新の方法は、損失の演算が異なるだけで、既に述べた例と同様の方法で行うことができるのでその説明を省略する。 In this example as well, the second machine learning processing unit 24 uses the distributed representation information xi of the node Bn of interest and the distributed representation information xj (j = 1, 2, ...) Of the node Cx so as to minimize this loss LBPR. Machine learning is performed by updating xj'(j'= 1, 2, ...) The distributed representation information of the node Cy (for example, Steffen Rendle, et.al., "BPR: Bayesian personalized ranking from implicit feedback", UAI '09: Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence, June 2009 Pages 452-461, etc.). Since this update method can be performed by the same method as the above-mentioned example except that the loss calculation is different, the description thereof will be omitted.
なお、この第2機械学習処理部24においてグローバルな特徴を表す分散表現情報を生成する方法としては、ここまでで述べた方法に限られず、Yehuda Koren, et al., “MATRIX FACTORIZATION TECHNIQUES FOR RECOMMENDER SYSTEMS”, Computer, 42(8), pp.30-37, 2009に記載の方法や、Xiangunan He, et al., “Neural Collaborative Filtering”, arXiv:1708.05031v2, 26 Aug 2017に記載の方法などを利用してもよい。 The method of generating distributed representation information representing global features in the second machine learning processing unit 24 is not limited to the methods described so far, and Yehuda Koren, et al., “MATRIX FACTORIZATION TECHNIQUES FOR RECOMMENDER SYSTEMS” ”, Computer, 42 (8), pp.30-37, 2009 and the method described in Xiangunan He, et al.,“ Neural Collaborative Filtering ”, arXiv: 1708.05031v2, 26 Aug 2017, etc. You may.
[第1機械学習処理部における演算の変形例]
また、ローカルな特徴を表す分散表現情報を生成する第1機械学習処理部23の処理も、ここで述べた例に限られない。第1機械学習処理部23は、いわゆるnode2vec(Aditya Grover, et al., Scalable Feature Learning for Networks, DOI: http://dx.doi.org/10.1145/2939672.2939754)を用いてローカルな特徴を表す分散表現情報を生成してもよいし、William Hamilton, et al., ”Inductive Representation Learning on Large Graphs”, In Advances in neural information processing systems, pp.1024-1034 (31st Conference on Neural Information Processing Systems (NIPS 2017))に開示された方法を採用して分散表現情報を生成してもよい。
[Modification example of calculation in the first machine learning processing unit]
Further, the processing of the first machine
[中間的特徴を含める例]
さらにここまでの説明では、第2機械学習処理部24は、グラフの全体から注目ノードBnとの間に所定の関係(例えばエッジを所定回数以内の回数だけ辿って到達できる関係)にないノードCyを選択していたが、本実施の形態はこの例に限られない。例えば第2機械学習処理部24は、グラフから得られる部分グラフのうち、注目ノードBnを含む部分グラフを生成し、当該部分グラフから注目ノードBnとの間に所定の関係にないノードCyを選択することとしてもよい。この例では、グローバルな特徴ではあるものの、ミッドレンジの特徴を表す分散表現情報が生成される。
[Example of including intermediate features]
Further, in the description so far, the second machine learning processing unit 24 has a node Cy that is not in a predetermined relationship (for example, a relationship that can be reached by tracing the edge within a predetermined number of times) from the entire graph to the node Bn of interest. However, the present embodiment is not limited to this example. For example, the second machine learning processing unit 24 generates a subgraph including the attention node Bn from the subgraphs obtained from the graph, and selects a node Cy that does not have a predetermined relationship with the attention node Bn from the subgraph. You may do it. In this example, although it is a global feature, distributed representation information representing a midrange feature is generated.
また別の例では、第2機械学習処理部24は、注目ノードBnからエッジをα回以内の回数(ここでαは自然数)だけ辿って到達できる関係にあるノードCxと、注目ノードBnからエッジをβ(β>α+1、α,βは自然数)回以内の回数だけ辿って到達できる関係にないノードCyを選択して、当該ノードCx,Cyを用いて、注目ノードBnのグローバルな特徴を表す分散表現情報を生成するとともに、β>γ>αなる自然数γを用い、注目ノードBnからエッジをα+1以上、γ回以下の回数だけ辿って到達できる関係にないノードCy′を選択し、ノードCxとこのノードCy′とを用いて、注目ノードBnのミッドレンジのグローバルな特徴を表す分散表現情報を得てもよい。後者の例では、α,β(及びγ)の範囲を制御することでどの程度グローバルな特徴を含めるかを調整できる。 In another example, the second machine learning processing unit 24 has a relationship that can be reached by tracing the edge from the attention node Bn within α times (where α is a natural number) and the edge from the attention node Bn. Is β (β> α + 1, α, β is a natural number), and the node Cy that is not in a relationship that can be reached is selected, and the node Cx, Cy is used to represent the global characteristics of the node Bn of interest. While generating distributed representation information, using the natural number γ such that β> γ> α, select a node Cy'that is not related to be reachable by tracing the edge from the note node Bn a number of times α + 1 or more and γ times or less, and select node Cx. And this node Cy'may be used to obtain distributed representation information representing the global characteristics of the midrange of the node Bn of interest. In the latter example, the extent to which global features are included can be adjusted by controlling the range of α, β (and γ).
[他の例]
また本実施の形態のここまでの説明ではSNS等のユーザに対して、フォローする公式アカウントを推薦する例を示したが、本実施の形態の情報処理装置1の利用分野は、この例に限られるものではない。
[Other examples]
Further, in the explanation so far of this embodiment, an example of recommending an official account to be followed is shown to a user such as SNS, but the field of use of the
例えば、公式アカウント側からは、自己をフォローしているユーザ(フォロー中ユーザと呼ぶ)に近いユーザであって、自己をフォローしていないユーザ(フォロー外ユーザと呼ぶ)を、ユーザの個人アカウントのノードの統合分散表現情報を利用して分析してもよい。 For example, from the official account side, a user who is close to a user who is following himself (called a following user) but who is not following himself (called an unfollowed user) is a user's personal account. It may be analyzed by using the integrated distributed representation information of the node.
つまり、情報処理装置1は、公式アカウント側からの要求に応答して、当該要求を行った公式アカウントのフォロー中ユーザの個人アカウントに係る統合分散表現情報を得る。そして情報処理装置1は、当該得た統合分散表現情報のうち例えばN個(Nは1以上の自然数とする)をランダムに選択して、選択した統合分散表現情報と、当該公式アカウントに対するフォロー外ユーザの統合分散表現情報との距離情報を演算する。そして当該距離情報が表す一対の分散表現情報が互いに類似していると判断される場合(コサイン類似度の場合は0より大きく1以下の所定の値以上である場合)に、情報処理装置1は、当該フォロー外ユーザの個人アカウントの情報を要求元の公式アカウントに対して提示する。
That is, the
なお、複数のフォロー中ユーザに係る統合分散表現情報を用いる場合(上記Nが2以上の場合)は、そのいずれにも類似していると判断される場合、あるいはあるフォロー外ユーザに係る統合分散表現情報に類似していると判断されるフォロー中ユーザに係る統合分散表現情報の数をnとしたとき、n/Nが所定の判定しきい値を超える場合に、当該フォロー外ユーザのアカウントの情報を要求元の公式アカウントに対して提示することとしてもよい。 When the integrated distributed expression information related to a plurality of following users is used (when N is 2 or more), it is judged to be similar to any of them, or the integrated distributed related to a certain unfollowed user. When the number of integrated distributed expression information related to the following user judged to be similar to the expression information is n, and n / N exceeds a predetermined judgment threshold, the account of the unfollowed user Information may be presented to the requesting official account.
さらに本実施の形態の情報処理装置1の分析対象は、SNSに関連する情報である必要はない。例えば、結婚相手を紹介するシステムにおいては、登録者(結婚相手を探しているユーザ)をノードとし、登録者が興味ありとしている情報項目(属している興味グループを表す情報など)をまた別のノードとして、これらのノードの間をエッジで連結してネットワークを生成してもよい。
Further, the analysis target of the
この場合、情報処理装置1は、当該ネットワークに関するローカルな特徴を表す分散表現情報を、例えばネットワークエンベディングの方法により登録者ごとに得るとともに、グローバルな特徴を表す分散表現情報を、Bayesian personalized ranking from implicit feedback等の情報によって登録者ごとに得て、これらを統合した統合分散表現情報を登録者ごとに生成する。
In this case, the
そして情報処理装置1は、当該統合分散表現情報間の類似度により、登録者間の類似度を求め、この類似度の情報を、推奨する相手となる登録者を紹介する処理に供してもよい。この例においても、同じ登録者が共通して属している興味グループがある場合は、当該興味グループ間にもエッジを設定することとしてもよい。
Then, the
またこの例では、自己(登録者Pとする)に係る分散表現情報と類似度の高い分散表現情報となっている他の登録者Qが、既に交際を申し込んで断られている登録者Xが存在するときには、登録者Pに対して、登録者Xについては交際の可能性を低い相手として提示することも考えられる。 Further, in this example, the registrant X who has already applied for dating and has been refused by another registrant Q whose distributed expression information has a high degree of similarity to the distributed expression information related to himself (referred to as registrant P) is When present, it is conceivable to present the registrant P with a low possibility of dating with respect to the registrant X.
このように本実施の形態のある例では、分析対象の一つであるPの統合分散表現情報と類似度が比較的高い(例えばコサイン類似度の場合は0より大きく1以下の所定の値以上であるなど)として判断される統合分散表現情報に係る他の分析対象Qが存在し、かつ当該分析対象Qが他の分析対象Xとの間にエッジを設定するべきでない関係(いわば負例となる関係)がある場合に、情報処理装置1は、分析対象Pと、当該情報項目または分析対象Xとの間の関係も負例となり得ることを、情報処理装置1のユーザに提示することとしてもよい。またその確率として、当該分析対象Pと類似すると判断される統合分散表現情報に係る複数の他の分析対象Q1,Q2…の数Nに対し、当該分析対象Qのうち情報項目または分析対象Xとの間の関係が負例となっている分析対象Qの数nを求め、その割合n/Nを示してもよい。
As described above, in an example of this embodiment, the similarity with the integrated distributed representation information of P, which is one of the analysis targets, is relatively high (for example, in the case of cosine similarity, it is greater than 0 and equal to or less than a predetermined value of 1 or more. There is another analysis target Q related to the integrated distributed representation information that is judged to be (such as), and the analysis target Q should not set an edge with the other analysis target X (so to speak, with a negative example). When there is a relationship), the
[公式アカウントの分散情報の例]
また本実施の形態のある例では、情報処理装置1は、公式アカウント(層A)のノードViの分散表現aiを次のように求めてもよい。
[Example of distributed information for official accounts]
Further, in an example of the present embodiment, the
すなわち、このノードViで表される公式アカウントAiをフォローする層Bの個人アカウントのノードVkのインデックスkの集合をF(i)と書き、その要素の総数(公式アカウントAiをフォローする個人アカウントの総数)を|F(i)|として、情報処理装置1は、当該公式アカウントAiの分散表現aiを、層BのノードVkの統合分散表現情報Xkを用いて、
として求めてもよい。
That is, the set of the index k of the node Vk of the individual account of the layer B that follows the official account Ai represented by this node Vi is written as F (i), and the total number of its elements (the individual account that follows the official account Ai). The total number) is | F (i) |, and the
May be sought as.
この例では、個人アカウントのノードVjと、この公式アカウントAiのノードViとの類似度(スコア)を、aiと、個人アカウントのノードVjの統合分散表現情報Xjとのコサイン類似度により決定してもよい。 In this example, the similarity (score) between the node Vj of the personal account and the node Vi of this official account Ai is determined by the cosine similarity between ai and the integrated distributed representation information Xj of the node Vj of the personal account. May be good.
1 情報処理装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部、21 情報取得部、22 グラフ生成部、23 第1機械学習処理部、24 第2機械学習処理部、25 統合処理部、26 評価処理部、27 出力処理部。
1 Information processing device, 11 Control unit, 12 Storage unit, 13 Operation unit, 14 Display unit, 15 Communication unit, 21 Information acquisition unit, 22 Graph generation unit, 23 1st machine learning processing unit, 24 2nd machine learning processing unit , 25 integrated processing unit, 26 evaluation processing unit, 27 output processing unit.
Claims (6)
前記分析対象間に設定された関係が、互いに予め定めた所定の第1の関係にあるとされる前記複数の分析対象の一部を、第1分析対象群として抽出し、当該抽出した第1分析対象群の順列または組み合わせに基づいて、当該第1分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第1機械学習手段と、
前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にあるとされる前記複数の分析対象の一部と、前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にないとされる前記複数の分析対象の一部とを第2分析対象群として、当該第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、前記第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第2機械学習手段と、
前記第1機械学習手段と第2機械学習手段とにより機械学習された分析対象ごとの分散表現情報を、所定の処理に供する処理手段と、
を含む情報処理装置。 A means for holding vector values set for each analysis target as distributed representation information for a plurality of analysis targets for which mutual relationships are set, and
A part of the plurality of analysis targets, which are considered to have a predetermined first relationship in which the relationships set between the analysis targets are predetermined to each other, is extracted as a first analysis target group, and the extracted first. A first machine learning means for machine learning distributed expression information related to each of the analysis targets included in the first analysis target group based on the order or combination of the analysis target groups.
A part of the plurality of analysis targets in which the relationship set between the analysis targets is considered to have a predetermined second relationship predetermined to each other, and the relationship set between the analysis targets are predetermined to each other. Based on the relationship set for each of the analysis targets included in the second analysis target group, a part of the plurality of analysis targets that are not considered to have a predetermined second relationship is set as the second analysis target group. , A second machine learning means for machine learning distributed expression information related to each of the analysis targets included in the second analysis target group.
A processing means for subjecting the distributed expression information for each analysis target machine-learned by the first machine learning means and the second machine learning means to a predetermined process,
Information processing equipment including.
前記分析対象間に設定される関係は、分析対象の各々をノードとし、当該ノード間を連結したグラフ情報で表され、
前記予め定めた所定の第1の関係は、前記グラフ情報を用いた所定の条件により互いに連結された関係にあると判断されることであり、
前記第1機械学習手段は、前記分析対象の一つを所定の方法で選択し、当該選択した分析対象に係るノードと連結されていると判断されるノードに係る前記複数の分析対象の一部を、第1分析対象群として抽出する情報処理装置。 The information processing apparatus according to claim 1.
The relationship set between the analysis targets is represented by graph information in which each of the analysis targets is a node and the nodes are connected.
The predetermined first relationship determined in advance is that it is determined that the relationship is connected to each other by a predetermined condition using the graph information.
The first machine learning means selects one of the analysis targets by a predetermined method, and a part of the plurality of analysis targets related to the node determined to be connected to the node related to the selected analysis target. Is an information processing device that extracts as a first analysis target group.
前記分析対象間に設定される関係は、分析対象の各々をノードとし、当該ノード間を連結したグラフ情報で表され、
前記予め定めた所定の第2の関係は、前記グラフ情報により表される対応するノードが互いに連結されていることであり、
前記第2機械学習手段は、前記分析対象の一つを所定の方法で選択し、当該選択した分析対象に係るノードと連結されているノードに係る分析対象と、当該選択した分析対象に係るノードと連結されていないと判断されるノードに係る分析対象とを第2分析対象群として抽出する情報処理装置。 The information processing apparatus according to claim 1 or 2.
The relationship set between the analysis targets is represented by graph information in which each of the analysis targets is a node and the nodes are connected.
The predetermined second relationship is that the corresponding nodes represented by the graph information are connected to each other.
The second machine learning means selects one of the analysis targets by a predetermined method, and the analysis target related to the node connected to the node related to the selected analysis target and the node related to the selected analysis target. An information processing device that extracts an analysis target related to a node that is determined not to be connected to the second analysis target group.
前記第2機械学習手段は、前記第2分析対象群に含まれる分析対象のうち、前記選択した分析対象に係るノードと連結されていると判断されるノードに係る分析対象を正例分析対象とし、前記選択した分析対象に係るノードと連結されないと判断されるノードに係る分析対象を負例分析対象として、前記選択した分析対象と、前記正例分析対象と、前記負例分析対象との組を用いて、少なくとも前記選択した分析対象に係る分散表現情報を機械学習する情報処理装置。 The information processing apparatus according to claim 3.
The second machine learning means sets the analysis target related to the node determined to be connected to the node related to the selected analysis target among the analysis targets included in the second analysis target group as the normal analysis target. , The set of the selected analysis target, the positive analysis target, and the negative analysis target, with the analysis target related to the node determined not to be connected to the node related to the selected analysis target as the negative example analysis target. An information processing device that machine-learns at least the distributed expression information related to the selected analysis target using the above.
前記処理手段は、前記第1機械学習手段と第2機械学習手段とにより機械学習された分析対象ごとの分散表現情報を用いて、当該分析対象の少なくとも一部について、その相互の類似度を評価する処理を実行する情報処理装置。 The information processing apparatus according to any one of claims 1 to 4.
The processing means evaluates the degree of similarity between at least a part of the analysis target by using the distributed expression information for each analysis target machine-learned by the first machine learning means and the second machine learning means. An information processing device that executes the processing to be performed.
互いの関係が設定された複数の分析対象について、分析対象ごとに設定されるベクトル値を、分散表現情報として保持する手段と、
前記分析対象間に設定された関係が、互いに予め定めた所定の第1の関係にあるとされる前記複数の分析対象の一部を、第1分析対象群として抽出し、当該抽出した第1分析対象群の順列または組み合わせに基づいて、当該第1分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第1機械学習手段と、
前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にあるとされる前記複数の分析対象の一部と、前記分析対象間に設定された関係が、互いに予め定めた所定の第2の関係にないとされる前記複数の分析対象の一部とを第2分析対象群として、当該第2分析対象群に含まれる分析対象の各々に設定された関係に基づいて、前記第2分析対象群に含まれる分析対象のそれぞれに係る分散表現情報を機械学習する第2機械学習手段と、
前記第1機械学習手段と第2機械学習手段とにより機械学習された分析対象ごとの分散表現情報を、所定の処理に供する処理手段と、として機能させるプログラム。
Computer,
A means for holding vector values set for each analysis target as distributed representation information for a plurality of analysis targets for which mutual relationships are set, and
A part of the plurality of analysis targets, which are considered to have a predetermined first relationship in which the relationships set between the analysis targets are predetermined to each other, is extracted as a first analysis target group, and the extracted first. A first machine learning means for machine learning distributed expression information related to each of the analysis targets included in the first analysis target group based on the order or combination of the analysis target groups.
A part of the plurality of analysis targets in which the relationship set between the analysis targets is considered to have a predetermined second relationship predetermined to each other and the relationship set between the analysis targets are predetermined to each other. Based on the relationship set for each of the analysis targets included in the second analysis target group, a part of the plurality of analysis targets that are not considered to have a predetermined second relationship is set as the second analysis target group. , A second machine learning means for machine learning distributed expression information related to each of the analysis targets included in the second analysis target group.
A program that functions as a processing means for subjecting distributed expression information for each analysis target machine-learned by the first machine learning means and the second machine learning means to a predetermined process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020203042A JP2022090562A (en) | 2020-12-07 | 2020-12-07 | Information processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020203042A JP2022090562A (en) | 2020-12-07 | 2020-12-07 | Information processing device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022090562A true JP2022090562A (en) | 2022-06-17 |
Family
ID=81992314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020203042A Pending JP2022090562A (en) | 2020-12-07 | 2020-12-07 | Information processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022090562A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7280425B1 (en) | 2022-10-11 | 2023-05-23 | PayPay株式会社 | Information processing device, information processing method and information processing program |
-
2020
- 2020-12-07 JP JP2020203042A patent/JP2022090562A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7280425B1 (en) | 2022-10-11 | 2023-05-23 | PayPay株式会社 | Information processing device, information processing method and information processing program |
JP2024056383A (en) * | 2022-10-11 | 2024-04-23 | PayPay株式会社 | Information processing device, information processing method, and information processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357793B (en) | Information recommendation method and device | |
CN112119388A (en) | Training image embedding model and text embedding model | |
CN111506820B (en) | Recommendation model, recommendation method, recommendation device, recommendation equipment and recommendation storage medium | |
TW201814556A (en) | Information matching method and related device | |
CN112074828A (en) | Training image embedding model and text embedding model | |
KR20170011963A (en) | Method and server for recommending item | |
KR20170027576A (en) | Apparatus and method of researcher rcommendation based on matching studying career | |
Yu et al. | NAIRS: A neural attentive interpretable recommendation system | |
CN111324724B (en) | Data processing method and device, electronic equipment and computer readable storage medium | |
US9058328B2 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
CN113656699B (en) | User feature vector determining method, related equipment and medium | |
Hoang et al. | Academic event recommendation based on research similarity and exploring interaction between authors | |
JP2022090562A (en) | Information processing device and program | |
Piao et al. | Learning to rank tweets with author-based long short-term memory networks | |
Ntalianis et al. | Social relevance feedback based on multimedia content power | |
CN116823410A (en) | Data processing method, object processing method, recommending method and computing device | |
Yin et al. | Rsygan: Generative adversarial network for recommender systems | |
CN116957128A (en) | Service index prediction method, device, equipment and storage medium | |
Liraki et al. | Predicting the Users' Navigation Patterns in Web, using Weighted Association Rules and Users' Navigation Information | |
CN115600017A (en) | Feature coding model training method and device and media object recommendation method and device | |
JP2023550510A (en) | Recommendation methods, devices, electronic devices and storage media | |
WO2021172220A1 (en) | Information processing device, and control method for same | |
Tran et al. | Deep news recommendation with contextual user profiling and multifaceted article representation | |
Sun et al. | High dimensional explicit feature biased matrix factorization recommendation | |
Liu et al. | Pinterest analysis and recommendations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231205 |