CN112770013B - 一种基于边采样的异质信息网络嵌入方法 - Google Patents

一种基于边采样的异质信息网络嵌入方法 Download PDF

Info

Publication number
CN112770013B
CN112770013B CN202110055438.XA CN202110055438A CN112770013B CN 112770013 B CN112770013 B CN 112770013B CN 202110055438 A CN202110055438 A CN 202110055438A CN 112770013 B CN112770013 B CN 112770013B
Authority
CN
China
Prior art keywords
walk
array
wandering
information element
element node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110055438.XA
Other languages
English (en)
Other versions
CN112770013A (zh
Inventor
王梦惟
利强
潘晔
王沙飞
邵怀宗
林静然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110055438.XA priority Critical patent/CN112770013B/zh
Publication of CN112770013A publication Critical patent/CN112770013A/zh
Application granted granted Critical
Publication of CN112770013B publication Critical patent/CN112770013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32288Multiple embedding, e.g. cocktail embedding, or redundant embedding, e.g. repeating the additional information at a plurality of locations in the image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于边采样的异质信息网络嵌入方法,包括以下步骤:S1、对情报数据集中每一条边的权重进行预处理,得到游走权重;S2、从情报元素节点集中选取第i个情报元素节点作为游走起点,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;S3、重复步骤S2,直到i等于情报元素节点集V中节点的总数|V|,将多个游走数组构建为游走数组集;S4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,训练单隐层神经网络;S5、将情报元素节点集中的情报元素节点输入训练完成的单隐层神经网络,得到嵌入向量;本发明解决了目前已有的图嵌入算法中不能处理带权图和游走受限的问题。

Description

一种基于边采样的异质信息网络嵌入方法
技术领域
本发明涉及数据安全技术领域,具体涉及一种基于边采样的异质信息网络嵌入方法。
背景技术
现有技术中关于情报数据层次分级的方法很少,仅有根据用户属性或特定行为进行划分的方法,该类方法依赖于用户属性和行为,扩展性不强。现有技术中存在情报分析的方法,基于内容相似度的推送方法中使用关键词及专家打分建立用户兴趣模型,并计算相似度后进行推荐,其本质还是基础矩阵分解的内容,缺点是无法解决矩阵稀疏性的问题;基于检索系统的方法中使用不同的国际和国内联机联合检索系统,对于关键词进行筛选、对比、分类等操作,缺点是无法针对每个用户做出个性化的推荐;基于情报定制服务的方法中,根据用户属性和特点进行主动的情报推送,缺点是没有挖掘并利用用户的隐式需求。
现有技术中的图嵌入算法包括基于相似度保留、消息传递和关系学习的图嵌入算法。
基于相似度保留的图嵌入算法有metapathvec,由元路径约束,在关系网络中进行随机游走,并使用skip-gram算法进行训练。缺点是游走结果必须匹配元路径,捕捉到的节点结构信息不够全面。基于消息传递的图嵌入使用图神经网络,HAN在第k层卷积使用聚合邻点信息得到节点向量。缺点是图神经网络开销较大,在图卷积过程中需要将整张图输入到内存中。并且只针对同类型节点之间的边效果较好。基于关系学习的图嵌入将关系网络中每个边看成一个三元组,transE优化一个打分函数,对任意三元组进行评估。缺点是只对处理一对一的关系有效,不能处理一对多或多对一的关系。
上述方法共同缺点是没有考虑到处理边带权的异质信息网络,均将带权边作为不加权的边进行处理。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于边采样的异质信息网络嵌入方法解决了目前已有的图嵌入算法中不能处理带权图和游走受限的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于边采样的异质信息网络嵌入方法,包括以下步骤:
S1、对情报数据集中每一条边的权重进行预处理,得到游走权重;
S2、从情报元素节点集中选取第i个情报元素节点作为游走起点,基于游走权重,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;
S3、判断i是否等于|V|,若是,将得到的多个游走数组构建为游走数组集,并跳转至步骤S4,若否,则将i自加1,返回步骤S2,其中,|V|为情报元素节点集V中情报元素节点的总数,1≤i≤|V|;
S4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,将训练样本输入单隐层神经网络,并采用随机梯度下降法进行训练,得到训练完成的单隐层神经网络;
S5、将情报元素节点集中的情报元素节点输入训练完成的单隐层神经网络,得到嵌入向量。
进一步地:步骤S1中游走权重的计算公式为:
Figure BDA0002900455170000021
Figure BDA0002900455170000031
其中,w′为游走权重,ap,q(npre,nnext)为游走偏移,
Figure BDA0002900455170000032
为当前情报元素节点ncur和下一跳情报元素节点nnext间所连边的权重,npre为当前情报元素节点ncur的上一跳情报元素节点,p为控制游走偏向DFS的参数,q为控制游走偏向BFS的参数,
Figure BDA0002900455170000033
为从上一跳情报元素节点npre到下一跳情报元素节点nnext的跳数。
进一步地:步骤S2中对游走起点基于边采样进行额定长度的多次游走,得到游走数组包括以下分步骤:
A1、对游走起点ni的每条邻边构建矩形,将面积大于1的游走起点ni的第j条邻边的矩形大于1的部分分配至面积小于1的矩形中,得到面积为1的多个矩形;
A2、将多个矩形构建为矩形框,并基于矩形框构建第一数组accept和第二数组alias,其中,accept[j]为游走起点ni的第j条邻边对应的邻情报元素节点
Figure BDA0002900455170000034
占矩形框第j列矩形的面积比例,alias[j]为矩形框的第j列矩形中另一个邻情报元素节点的编号;
A3、生成两组随机数randomri∈[0,N-1]和ari~U(0,1),其中,N为游走起点ni的邻情报元素节点总数,U(0,1)为服从0到1的均匀分布,ri为游走起点ni当前游走的第ri次;
A4、判断随机数ari是否小于面积比例accept[j],若是,则将邻情报元素节点
Figure BDA0002900455170000035
加入游走数组walki,若否,则将邻情报元素节点
Figure BDA0002900455170000036
加入游走数组walki
A5、判断游走数组walki中的元素数量是否小于额定长度,若是,则返回步骤A3,若否,则得到的游走数组walki
上述进一步方案的有益效果为:使用较低时间复杂度的方法根据边权重对情报元素节点进行有偏游走,令采样得到的游走数组能够更好表征该异质信息网络的结构。
进一步地:步骤A2中未分配前构建的游走起点ni的第j条邻边对应的矩形面积为:
Figure BDA0002900455170000041
其中,
Figure BDA0002900455170000042
为游走起点ni的第j条邻边对应权重,
Figure BDA0002900455170000043
为游走起点ni的第m条邻边对应权重,M为矩形的数量,j为游走起点ni的第j条邻边,m为游走起点ni的第m条邻边。
进一步地:步骤A1中的矩形容纳不超过2个邻边的矩形的面积。
进一步地:步骤S4中单隐层神经网络包括:输入层、隐层和输出层;所述输入层、隐层和输出层依次连接,所述输入层的输入端作为单隐层神经网络的输入端,所述输出层的输出端作为单隐层神经网络的输出端。
进一步地:步骤S4包括以下分步骤:
S41、取游走数组walki中的情报元素节点wim为中心词,其中,walki为游走数组集中第i个游走数组,walki=[wi1,wi2,wi3,…,wil],1≤m≤l,m初值为1,l为游走数组walki中的元素的数量;
S42、取中心词wim前后的游走数组walki中的k个情报元素节点,结合中心词wim组成节点总长为2*k+1的序列
Figure BDA0002900455170000044
S43、将序列
Figure BDA0002900455170000045
与中心词wim作为训练样本
Figure BDA0002900455170000046
S44、随机初始化输入层的节点向量为|V|*d的输入层到隐层权重矩阵X∈R|V|*d,其中,d为每个节点向量维度,R|V|*d为|V|*d维向量空间,权重矩阵X∈R|V|*d中元素的取值范围为
Figure BDA0002900455170000051
S45、将隐层到输出层的权重矩阵进行初始化,得到维度为|V|*d的全0的权重矩阵Y∈R|V|*d
S46、采用随机梯度下降法对目标函数进行优化,使目标函数最大化并更新权重矩阵X∈R|V|*d和Y∈R|V|*d,得到训练完成的单隐层神经网络。
进一步地:步骤S46中目标函数为:
Figure BDA0002900455170000052
其中,O(x)为目标函数,v为情报元素节点集V中的情报元素节点,Tv为情报元素节点类型集,t为节点类型集Tv中的情报元素节点类型,ct为情报元素节点v的邻点中并其类型属于t的情报元素节点,Xct为情报元素节点ct的嵌入向量,Xv为情报元素节点v的嵌入向量,u为情报元素节点集V中的情报元素节点,Xu为情报元素节点u的嵌入向量,Nt(v)为v的邻点集中类型是t的所有情报元素节点。
上述进一步方案的有益效果为:将游走数组等效为句子文本,将情报元素节点等效为单词,对文本进行词嵌入。通过训练一个单隐层神经网络,得到情报元素节点的低维嵌入。
综上,本发明的有益效果为:在随机游走的基础上提出了基于有偏采样的游走,使用较低时间复杂度的方法根据边权重对情报元素节点进行有偏采样的游走,得到的游走数组能够更好表征该异质信息网络的结构;并改进了原有词嵌入算法的目标函数,通过训练一个单隐层神经网络,得到情报元素节点的低维嵌入。
附图说明
图1为一种基于边采样的异质信息网络嵌入方法的流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于边采样的异质信息网络嵌入方法,包括以下步骤:
S1、对情报数据集中每一条边的权重进行预处理,得到游走权重;
步骤S1中游走权重的计算公式为:
Figure BDA0002900455170000061
Figure BDA0002900455170000062
其中,w′为游走权重,ap,q(npre,nnext)为游走偏移,
Figure BDA0002900455170000063
为当前情报元素节点ncur和下一跳情报元素节点nnext间所连边的权重,npre为当前情报元素节点ncur的上一跳情报元素节点,p为控制游走偏向DFS的参数,p越小则游走的下一个节点离情报元素节点v越近,即维持游走序列在点ncur周围,q为控制游走偏向BFS的参数,q越小则游走的下一个节点距离点ncur越远,
Figure BDA0002900455170000064
为从上一跳情报元素节点npre到下一跳情报元素节点nnext的跳数。
S2、从情报元素节点集中选取第i个情报元素节点作为游走起点,基于游走权重,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;
步骤S2中对游走起点基于边采样进行额定长度的多次游走,得到游走数组包括以下分步骤:
A1、对游走起点ni的每条邻边构建矩形,将面积大于1的游走起点ni的第j条邻边的矩形大于1的部分分配至面积小于1的矩形中,得到面积为1的多个矩形;
步骤A1中的矩形容纳不超过2个邻边的矩形的面积。
A2、将多个矩形构建为矩形框,并基于矩形框构建第一数组accept和第二数组alias,其中,accept[j]为游走起点ni的第j条邻边对应的邻情报元素节点
Figure BDA0002900455170000071
占矩形框第j列矩形的面积比例,alias[j]为矩形框的第j列矩形中另一个邻情报元素节点的编号;
步骤A2中未分配前构建的游走起点ni的第j条邻边对应的矩形面积为:
Figure BDA0002900455170000072
其中,
Figure BDA0002900455170000073
为游走起点ni的第j条邻边对应权重,
Figure BDA0002900455170000074
为游走起点ni的第m条邻边对应权重,M为矩形的数量,j为游走起点ni的第j条邻边,m为游走起点ni的第m条邻边。
A3、生成两组随机数randomri∈[0,N-1]和ari~U(0,1),其中,N为游走起点ni的邻情报元素节点总数,U(0,1)为服从0到1的均匀分布,ri为游走起点ni当前游走的第ri次;
A4、判断随机数ari是否小于面积比例accept[j],若是,则将邻情报元素节点
Figure BDA0002900455170000075
加入游走数组walki,若否,则将邻情报元素节点
Figure BDA0002900455170000076
加入游走数组walki
A5、判断游走数组walki中的元素数量是否小于额定长度,若是,则返回步骤A3,若否,则得到的游走数组walki
S3、判断i是否等于|V|,若是,将得到的多个游走数组构建为游走数组集,并跳转至步骤S4,若否,则将i自加1,返回步骤S2,其中,|V|为情报元素节点集V中情报元素节点的总数,1≤i≤|V|;
S4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,将训练样本输入单隐层神经网络,并采用随机梯度下降法进行训练,得到训练完成的单隐层神经网络;
步骤S4中单隐层神经网络包括:输入层、隐层和输出层;所述输入层、隐层和输出层依次连接,所述输入层的输入端作为单隐层神经网络的输入端,所述输出层的输出端作为单隐层神经网络的输出端。
步骤S4包括以下分步骤:
S41、取游走数组walki中的情报元素节点wim为中心词,其中,walki为游走数组集中第i个游走数组,walki=[wi1,wi2,wi3,…,wil],1≤m≤l,m初值为1,l为游走数组walki中的元素的数量;
S42、取中心词wim前后的游走数组walki中的k个情报元素节点,结合中心词wim组成节点总长为2*k+1的序列
Figure BDA0002900455170000081
S43、将序列
Figure BDA0002900455170000082
与中心词wim作为训练样本
Figure BDA0002900455170000083
S44、随机初始化输入层的节点向量为|V|*d的输入层到隐层权重矩阵X∈R|V|*d,其中,d为每个节点向量维度,R|V|*d为|V|*d维向量空间,权重矩阵X∈R|V|*d中元素的取值范围为
Figure BDA0002900455170000084
S45、将隐层到输出层的权重矩阵进行初始化,得到维度为|V|*d的全0的权重矩阵Y∈R|V|*d
S46、采用随机梯度下降法对目标函数进行优化,使目标函数最大化并更新权重矩阵X∈R|V|*d和Y∈R|V|*d,得到训练完成的单隐层神经网络。
步骤S46中目标函数为:
Figure BDA0002900455170000085
其中,O(x)为目标函数,v为情报元素节点集V中的情报元素节点,Tv为情报元素节点类型集,t为节点类型集Tv中的情报元素节点类型,ct为情报元素节点v的邻点中并其类型属于t的情报元素节点,
Figure BDA0002900455170000091
为情报元素节点ct的嵌入向量,Xv为情报元素节点v的嵌入向量,u为情报元素节点集V中的情报元素节点,Xu为情报元素节点u的嵌入向量,Nt(v)为v的邻点集中类型是t的所有情报元素节点。
S5、将情报元素节点集中的情报元素节点输入训练完成的单隐层神经网络,得到嵌入向量。

Claims (7)

1.一种基于边采样的异质信息网络嵌入方法,其特征在于,包括以下步骤:
S1、对情报数据集中每一条边的权重进行预处理,得到游走权重;
S2、从情报元素节点集中选取第i个情报元素节点作为游走起点,基于游走权重,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;
步骤S2中对游走起点基于边采样进行额定长度的多次游走,得到游走数组包括以下分步骤:
A1、对游走起点ni的每条邻边构建矩形,将面积大于1的游走起点ni的第j条邻边的矩形大于1的部分分配至面积小于1的矩形中,得到面积为1的多个矩形;
A2、将多个矩形构建为矩形框,并基于矩形框构建第一数组accept和第二数组alias,其中,第一数组accept中元素accept[j]为游走起点ni的第j条邻边对应的邻情报元素节点
Figure FDA0003522756990000011
占矩形框第j列矩形的面积比例,第二数组alias中元素alias[j]为矩形框的第j列矩形中另一个邻情报元素节点的编号;
A3、生成两组随机数randomri∈[0,N-1]和ari~U(0,1),其中,N为游走起点ni的邻情报元素节点总数,U(0,1)为服从0到1的均匀分布,ri为游走起点ni当前游走的第ri次;
A4、判断随机数ari是否小于面积比例accept[j],若是,则将邻情报元素节占
Figure FDA0003522756990000012
加入游走数组walki,若否,则将邻情报元素节点
Figure FDA0003522756990000013
加入游走数组walki
A5、判断游走数组walki中的元素数量是否小于额定长度,若是,则返回步骤A3,若否,则得到的游走数组walki
S3、判断i是否等于|V|,若是,将得到的多个游走数组构建为游走数组集,并跳转至步骤S4,若否,则将i自加1,返回步骤S2,其中,|V|为情报元素节点集V中情报元素节点的总数,1≤i≤|V|;
S4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,将训练样本输入单隐层神经网络,并采用随机梯度下降法进行训练,得到训练完成的单隐层神经网络;
S5、将情报元素节点集中的情报元素节点输入训练完成的单隐层神经网络,得到嵌入向量。
2.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S1中游走权重的计算公式为:
Figure FDA0003522756990000021
Figure FDA0003522756990000022
其中,w′为游走权重,
Figure FDA0003522756990000023
为游走偏移,
Figure FDA0003522756990000024
为当前情报元素节点ncur和下一跳情报元素节点nnext间所连边的权重,npre为当前情报元素节点ncur的上一跳情报元素节点,p为控制游走偏向DFS的参数,q为控制游走偏向BFS的参数,
Figure FDA0003522756990000025
为从上一跳情报元素节点npre到下一跳情报元素节点nnext的跳数。
3.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤A2中未分配前构建的游走起点ni的第j条邻边对应的矩形面积为:
Figure FDA0003522756990000026
其中,
Figure FDA0003522756990000027
为游走起点ni的第j条邻边对应权重,
Figure FDA0003522756990000028
为游走起点ni的第m条邻边对应权重,M为矩形的数量,j为游走起点ni的第j条邻边,m为游走起点ni的第m条邻边。
4.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤A1中的矩形容纳不超过2个邻边的矩形的面积。
5.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S4中单隐层神经网络包括:输入层、隐层和输出层;所述输入层、隐层和输出层依次连接,所述输入层的输入端作为单隐层神经网络的输入端,所述输出层的输出端作为单隐层神经网络的输出端。
6.根据权利要求5所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S4包括以下分步骤:
S41、取游走数组walki中的情报元素节点wim为中心词,其中,walki为游走数组集中第i个游走数组,walki=[wi1,wi2,wi3,...,wil],1≤m≤l,m初值为1,l为游走数组walki中的元素的数量;
S42、取中心词wim前后的游走数组walki中的k个情报元素节点,结合中心词wim组成节点总长为2*k+1的序列
Figure FDA0003522756990000031
S43、将序列
Figure FDA0003522756990000032
与中心词wim作为训练样本
Figure FDA0003522756990000033
S44、随机初始化输入层的节点向量为|V|*d的输入层到隐层权重矩阵X∈R|V|*d,其中,d为每个节点向量维度,R|V|*d为|V|*d维向量空间,权重矩阵X∈R|V|*d中元素的取值范围为
Figure FDA0003522756990000034
S45、将隐层到输出层的权重矩阵进行初始化,得到维度为|V|*d的全0的权重矩阵Y∈R|V|*d
S46、采用随机梯度下降法对目标函数进行优化,使目标函数最大化并更新权重矩阵X∈R|V|*d和Y∈R|V|*d,得到训练完成的单隐层神经网络。
7.根据权利要求6所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S46中目标函数为:
Figure FDA0003522756990000041
其中,O(x)为目标函数,v为情报元素节点集V中的情报元素节点,Tv为情报元素节点类型集,t为节点类型集Tv中的情报元素节点类型,ct为情报元素节点v的邻点中并其类型属于t的情报元素节点,
Figure FDA0003522756990000042
为情报元素节点ct的嵌入向量,Xv为情报元素节点v的嵌入向量,u为情报元素节点集V中的情报元素节点,Xu为情报元素节点u的嵌入向量,Nt(v)为v的邻点集中类型是t的所有情报元素节点。
CN202110055438.XA 2021-01-15 2021-01-15 一种基于边采样的异质信息网络嵌入方法 Active CN112770013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110055438.XA CN112770013B (zh) 2021-01-15 2021-01-15 一种基于边采样的异质信息网络嵌入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110055438.XA CN112770013B (zh) 2021-01-15 2021-01-15 一种基于边采样的异质信息网络嵌入方法

Publications (2)

Publication Number Publication Date
CN112770013A CN112770013A (zh) 2021-05-07
CN112770013B true CN112770013B (zh) 2022-05-20

Family

ID=75701874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110055438.XA Active CN112770013B (zh) 2021-01-15 2021-01-15 一种基于边采样的异质信息网络嵌入方法

Country Status (1)

Country Link
CN (1) CN112770013B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254550B (zh) * 2021-06-29 2022-04-19 浙江大华技术股份有限公司 基于知识图谱的推荐方法、电子设备和计算机存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10803127B2 (en) * 2016-06-06 2020-10-13 Salesforce.Com, Inc. Relevant information retrieval in record management systems
CN106875002A (zh) * 2017-02-20 2017-06-20 中国石油大学(华东) 基于梯度下降法与广义逆的复值神经网络训练方法
CN107145977B (zh) * 2017-04-28 2020-07-31 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN110555050B (zh) * 2018-03-30 2023-03-31 华东师范大学 一种基于元路径的异构网络节点表示学习方法
CN109800232B (zh) * 2019-01-21 2021-03-19 北京邮电大学 一种异质信息网络嵌入方法、装置、电子设备及存储介质
CN110852437A (zh) * 2019-10-29 2020-02-28 天津大学 一种针对异质信息网络的表示学习方法
CN111325326A (zh) * 2020-02-21 2020-06-23 北京工业大学 一种基于异质网络表示学习的链路预测方法

Also Published As

Publication number Publication date
CN112770013A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
Gibert et al. Graph embedding in vector spaces by node attribute statistics
Bandyopadhyay et al. An evolutionary technique based on K-means algorithm for optimal clustering in RN
US20100161652A1 (en) Rapid iterative development of classifiers
CN108038492A (zh) 一种基于深度学习的感性词向量及情感分类方法
CN112508085A (zh) 基于感知神经网络的社交网络链路预测方法
CN111125358A (zh) 一种基于超图的文本分类方法
CN110197286A (zh) 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法
US20210134387A1 (en) Ancestry inference based on convolutional neural network
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
Forti et al. Growing Hierarchical Tree SOM: An unsupervised neural network with dynamic topology
Perrone et al. Poisson random fields for dynamic feature models
Santhanam et al. A non-parametric approach to extending generic binary classifiers for multi-classification
CN110704510A (zh) 一种结合用户画像的题目推荐方法及系统
CN112770013B (zh) 一种基于边采样的异质信息网络嵌入方法
Jubran et al. Coresets for decision trees of signals
Imani et al. A new feature selection method based on ant colony and genetic algorithm on persian font recognition
US11914672B2 (en) Method of neural architecture search using continuous action reinforcement learning
Elthakeb et al. Divide and conquer: Leveraging intermediate feature representations for quantized training of neural networks
Wu et al. Mini-batch metropolis–hastings with reversible sgld proposal
Wang et al. On variable selection in matrix mixture modelling
Maji Efficient design of neural network tree using a new splitting criterion
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN116094977A (zh) 基于时间感知面向特征优化的服务Qos预测的深度学习方法
Huang et al. Efficient diversified mini-batch selection using variable high-layer features
CN113344069A (zh) 一种基于多维关系对齐的无监督视觉表征学习的图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant