CN110807130A - 确定网络中群组的向量表示的方法、装置和计算机设备 - Google Patents

确定网络中群组的向量表示的方法、装置和计算机设备 Download PDF

Info

Publication number
CN110807130A
CN110807130A CN201910982737.0A CN201910982737A CN110807130A CN 110807130 A CN110807130 A CN 110807130A CN 201910982737 A CN201910982737 A CN 201910982737A CN 110807130 A CN110807130 A CN 110807130A
Authority
CN
China
Prior art keywords
group
objects
matrix
network
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910982737.0A
Other languages
English (en)
Inventor
唐杰
韩矞
郑宇飞
陈谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910982737.0A priority Critical patent/CN110807130A/zh
Publication of CN110807130A publication Critical patent/CN110807130A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种确定网络中群组的向量表示的方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取网络中的对象和群组,所述对象为节点或基本图;所述基本图是从所述群组内选取预设数量的节点生成的;根据所述对象生成所述对象间的目标转移矩阵;根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。本申请提供的方案可以将网络中的每个群组转化为对应的向量表示,以确定群组间的相似度,提高网络中的分类、聚类任务的准确性。

Description

确定网络中群组的向量表示的方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种确定网络中群组的向量表示的方法、装置、计算机可读存储介质和计算机设备。
背景技术
网络结构作为一种重要的信息表示方式,在许多领域都有广泛的研究和应用,比如社会网络分析领域,生物信息学领域等。连接紧密的两个节点向量在向量空间中的距离就会很相近,因此利用网络表示学习来将网络中的数据元素映射为低维向量表示能够解决网络中的各种应用任务,比如分类任务、聚类任务等。
网络中的节点间、节点与群组之间,以及群组与群组之间的相似度,对社会网络分析和生物信息网络等方面的研究有极大地影响。而目前有各种针对节点的网络表示学习方法,通过将节点转化为向量表示以确定节点之间的相似度,但对于网络中的群组并未有相应的表示学习方法。
发明内容
基于此,有必要针对背景技术中的技术问题,提供一种确定网络中群组的向量表示的方法、装置、计算机可读存储介质和计算机设备。
一种确定网络中群组的向量表示的方法,所述方法包括:
获取网络中的对象和群组,所述对象为节点或基本图;所述基本图是从所述群组内选取预设数量的节点生成的;
根据所述对象生成所述对象间的目标转移矩阵;
根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
一种确定网络中群组的向量表示的装置,所述装置包括:
获取模块,用于获取网络中的对象和群组,所述对象为节点或基本图;
第一生成模块,用于根据所述对象生成所述对象间的目标转移矩阵;
第二生成模块,用于根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
第三生成模块,用于获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
输出模块,用于将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取网络中的对象和群组,所述对象为节点或基本图;所述基本图是从所述群组内选取预设数量的节点生成的;
根据所述对象生成所述对象间的目标转移矩阵;
根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取网络中的对象和群组,所述对象为节点或基本图;所述基本图是从所述群组内选取预设数量的节点生成的;
根据所述对象生成所述对象间的目标转移矩阵;
根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
上述确定网络中群组的向量表示的方法、装置、计算机可读存储介质和计算机设备,获取网络中的对象和群组,该对象为节点或基本图;该基本图是从该群组内选取预设数量的节点生成的,根据该对象生成该对象间的目标转移矩阵,根据该对象和群组生成该对象与该群组之间的转移矩阵,获取阈值,根据该阈值、该对象间的目标转移矩阵以及该对象与该群组之间的转移矩阵生成目标群组序列,将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。采用本方案能够实现将网络中的每个群组转化为对应的向量表示,可确定网络中的群组之间的相似度,从而通过群组之间的相似度提高网络中的分类任务、聚类任务的准确性。
附图说明
图1为一个实施例中确定网络中群组的向量表示的方法的应用环境图;
图2为一个实施例中确定网络中群组的向量表示的方法的流程示意图;
图3为一个实施例中生成对象间的目标转移矩阵的步骤的流程示意图;
图4为另一个实施例中得到对象间的目标转移矩阵的步骤的流程示意图;
图5为一个实施例中生成目标群组序列的步骤的流程示意图;
图6为一个实施例中生成每个群组对应的基本图的步骤的流程示意图;
图7为一个实施例中将对象转换为对应的向量表示的步骤的流程示意图;
图8为一个实施例中基本图的类型;
图9为一个实施例中确定网络中群组的向量表示的方法的流程示意图;
图10为一个实施例中一个网络的结构图;
图11为一个实施例中基于两种群组相似性得到的群组向量表示的示意图;
图12为另一个实施例中确定网络中群组的向量表示的装置的结构框图;
图13为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中确定网络中群组的向量表示的方法的应用环境图。参照图1,该确定网络中群组的向量表示的方法应用于确定网络中群组的向量表示的系统。该确定网络中群组的向量表示的系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在本实施例中,终端110可获取需要确定群组的向量表示的网络,并将该网络发送给服务器120,服务器120接收该网络,获取网络中的对象和群组,该对象为节点或基本图。该基本图是从群组内选取预设数量的节点生成的。接着,服务器120根据该对象生成该对象间的目标转移矩阵,根据该对象和群组生成该对象与该群组之间的转移矩阵。接着,服务器120获取阈值,根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列。接着,服务器120将该目标群组序列输入词向量模型,即可得到该网络中的每个群组的向量表示。
在其它实施例中,终端110可直接获取网络中的对象和群组,该对象为节点或基本图。该基本图是从该群组内选取预设数量的节点生成的。接着,终端110根据该对象生成对象间的目标转移矩阵,以及根据对象和群组生成对象与群组之间的转移矩阵。接着,终端110获取阈值,根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列。接着,终端110将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。
如图2所示,在一个实施例中,提供了一种确定网络中群组的向量表示的方法。本实施例主要以该方法应用于上述图1中的终端110来举例说明。参照图2,该确定网络中群组的向量表示的方法具体包括如下步骤:
步骤202,获取网络中的对象和群组,该对象为节点或基本图;该基本图是从群组内选取预设数量的节点生成的。
其中,网络是指在线社交网络、学术网络、生物信息学领域的网络和化学信息学领域的网络。在线社交网络具体可以是用户的群关系、活跃群关系、讨论组、收发消息、发表内容(文章、状态、社交图片和视频等)、为他人或内容点赞/评论、发送/接收红包、用户关联地理位置、用户的年龄或者职业等数据作为对象所组成的网络。生物信息学领域的网络具体可以是蛋白质交互网络,化学信息学领域的网络具体可以是分子结构网络,但不限于此。对象是指节点或者基本图。基本图是指节点和连接节点的边所构成的图。群组指的是网络中的一组节点及其内部的边。
具体地,终端获取待确定群组的向量表示的网络,并获取该网络中所有的群组。接着,终端从每个群组中随机选择预设数量的节点生成每个群组对应的基本图。进一步地,终端可多次从群组中随机选择预设数量的节点生成基本图,使得每个群组对应指定数量的基本图。
步骤204,根据对象生成对象间的目标转移矩阵。
其中,对象间的目标转移矩阵是指每一个对象向另一个对象转移的可能性所组成的矩阵。例如,对象为节点时,对象间的目标转移矩阵是指网络中的每一个节点向另一个节点转移的可能性所组成的矩阵。对象为基本图时,对象间的目标转移矩阵是指每一个基本图向另一个基本图转移的可能性所组成的矩阵。
具体地,终端可获取网络中的所有对象,计算每一个对象向网络中的另一个对象转移的可能性,从而得到对象间的目标转移矩阵。例如,网络中共有100个对象,可组成100*100的目标转移矩阵。该目标转移矩阵中的元素可用aij表示,aij表示该目标矩阵第i行第j列的元素,并且该元素aij表示第i个节点向第j个节点转移的可能性。
在本实施例中,当对象为节点时,终端可先构建网络中各节点之间的关系矩阵,并计算网络中的每一个节点向另一个节点转移的可能性,从而得到节点间的目标转移矩阵。
在本实施例中,当对象为基本图时,终端可先构建基本图之间的关系矩阵,并计算每一个基本图向另一个基本图转移的可能性,从而得到基本图之间的目标转移矩阵。
步骤206,根据对象和群组生成对象与群组之间的转移矩阵。
其中,对象与群组之间的转移矩阵可包括:对象向群组的转移矩阵和群组向对象的转移矩阵。对象向群组的转移矩阵是指对象向群组转移的可能性所构成的矩阵,群组向对象的转移矩阵是指群组向对象转移的可能性所构成的矩阵。
具体地,终端确定网络中群组的数量,以及每个群组中包含的对象的数量。接着,终端计算每个对象向每个群组转移的可能性,得到对象向群组的转移矩阵。并且,终端计算每个群组向每个对象转移的可能性,得到群组向对象的转移矩阵。
在本实施例中,当对象为节点时,终端确定每个群组中包含的节点的数量。当对象为基本图时,终端确定每个群组对应的基本图的数量。
步骤208,获取阈值,根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列。
其中,阈值是指从预设区间中选取的值。目标群组序列中的每个元素均为群组,是指由群组作为元素所组成的序列。进一步地,当对象为节点时,目标群组序列是指删除节点,保留群组,将保留的群组作为序列的元素得到的序列。当对象为基本图时,目标群组序列是指删除基本图,保留群组,将保留的群组作为序列的元素得到的序列。
具体地,终端从预设区间中选取一个值作为阈值。接着按照预设规则根据阈值、对象间的目标转移矩阵、对象向群组的转移矩阵和群组向对象的转移矩阵,选取出群组和对象作为序列的元素生成目标群组序列。
步骤210,将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。
其中,词向量模型用于学习词向量的无监督学习模型。给定一个语料库,该词向量模型可以捕捉序列上距离相近的词之间的相似性来学习词向量。该词向量模型可以是Skip-gram模型。
具体地,终端将每个群组对应的目标群组序列输入词向量模型,该词向量模型可以捕捉序列上距离相近的词之间的相似性来学习词向量。而网络上相近的节点更容易位于同一条随机游走序列中,而且在序列中的位置也较近。因此将生成的目标群组序列输入skip-gram模型,就可以捕捉到节点之间的相似性以得到群组向量表示。
上述确定网络中群组的向量表示的方法,获取网络中的对象和群组,该对象为节点或基本图,该基本图是从该群组内选取预设数量的节点生成的,根据该对象生成该对象间的目标转移矩阵,根据该对象和群组生成该对象与该群组之间的转移矩阵,获取阈值,根据该阈值、该对象间的目标转移矩阵以及该对象与该群组之间的转移矩阵生成目标群组序列,将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。采用本方案能够实现将网络中的每个群组转化为对应的向量表示,从而可确定网络中的群组之间的相似度,从而通过群组之间的相似度提高网络中的分类任务、聚类任务的准确性。
在一个实施例中,如图3所示,根据对象生成对象间的目标转移矩阵,包括:
步骤302,将该对象转换为对应的向量表示。
具体地,终端可将网络中的每个对象转换为对应的向量表示。当对象为节点时,将网络中的每个节点转换为各节点对应的向量表示。当对象为基本图时,将每个群组对应的基本图转换为各基本图对应的向量表示。
在本实例中,当对象为节点时,终端可在该网络上运行DeepWalk模型,首先在网络上进行随机游走,生成多条节点序列,再将节点序列输入到训练好的skip-gram模型中,skip-gram模型可输出各节点对应的向量表示。
步骤304,根据每两个对象的向量表示确定该每两个对象之间的相似度。
具体地,终端可先构建网络中的对象之间的关系矩阵,例如,网络中有100个对象,可构建100*100的关系矩阵。接着,终端可将每两个对象对应的向量表示作内积,得到该每两个对象之间的相似度。
步骤306,根据该每两个对象之间的相似度得到对象间的目标转移矩阵。
具体的,终端将每两个对象之间的相似度替换该关系矩阵中对应的每两个对象的元素,得到对象间的目标转移矩阵。例如,关系矩阵中的元素可用aij表示,这里的i和j均表示对象,aij表示该关系矩阵中第i行第j列的元素。则终端将第i个对象的向量表示与第j个对象的向量表示作内积,得到第i个对象与第j个对象之间的相似度,用该相似度替换该关系矩阵中第i行第j列的元素,即用第i个对象与第j个对象之间的相似度替换aij。将关系矩阵中的aij均替换为对应的相似度后,即可得到对象间的目标转移矩阵。
在本实施例中,在将每两个对象之间的相似度替换该关系矩阵中对应的每两个对象的元素之后,还包括:将替换后的矩阵进行对一化处理,得到对象间的目标转移矩阵。
上述确定网络中群组的向量表示的方法,将该对象转换为对应的向量表示,根据每两个对象的向量表示确定该每两个对象之间的相似度,根据该每两个对象之间的相似度得到对象间的目标转移矩阵,能够对网络中的对象之间的相似度进行度量,明确表示出对象间的相关性。
在一个实施例中,当对象为节点时,根据对象生成对象间的目标转移矩阵,包括:
确定网络邻接矩阵;将该邻接矩阵做归一化处理,得到节点间的目标转移矩阵。
其中,邻接矩阵(Adjacency Matrix):是表示顶点之间相邻关系的矩阵。
具体地,终端可获取网络中的节点和边,并确定节点的数量和边的数量。终端可确定每条边两端所对应的节点,以每条边为起点,根据每条边两端的节点生成邻接表,再根据该邻接表转换为网络的邻接矩阵。通过确定网络邻接矩阵可简单快速地确定节点间的目标转移矩阵。
在一个实施例中,如图4所示,该根据该每两个对象之间的相似度得到对象间的目标转移矩阵,包括:
步骤402,根据该每两个对象之间的相似度得到对象间的初始转移矩阵。
具体地,终端可先构建网络中的对象之间的关系矩阵,例如,网络中有100个对象,可构建100*100的关系矩阵。接着,终端可将每两个对象对应的向量表示作内积,得到该每两个对象之间的相似度。终端将每两个对象之间的相似度替换该关系矩阵中对应的每两个对象的元素,得到对象间的初始转移矩阵。
步骤404,从对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0。
步骤406,将替换后得到的转移矩阵作为对象间的目标转移矩阵。
具体地,当网络中的对象较多时,得到的初始转移矩阵会非常稠密。则终端可以从初始转移矩阵的每行选取预设数量的元素的值,保留所选取的元素的值。接着,终端将该初始转移矩阵中每行除选取的元素以外的元素的值均替换为0。完成替换之后得到的转移矩阵即为对象间的目标转移矩阵。
上述确定网络中群组的向量表示的方法,根据该每两个对象之间的相似度得到对象间的初始转移矩阵,从对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0,将替换后得到的转移矩阵作为对象间的目标转移矩阵,可减少计算量并节省内存空间。
在一个实施例中,该从对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0,包括:
从该对象间的初始转移矩阵中每行的元素的值从高到低选取预设数量的元素,将每行中除选取的预设数量的元素以外的其余元素的值均替换为0。
具体地,终端得到该对象间的初始转移矩阵后,针对该初始转移矩阵中的每一行,按照元素的值从高到低选取预设数量的元素。保留每行中选取的元素的值,并将除选取的元素以外的其余元素的值均替换为0,从而得到对象间的目标转移矩阵。通过保留初始转移矩阵的每行中最大的若干个值,可最大限度的保留每行元素的关键信息,并将其它元素的值均替换为0,可减少计算量,从而提高将网络中群组转化为对应的向量表示的效率。
在一个实施例中,该将替换后得到的转移矩阵作为该对象间的目标转移矩阵,包括:
将替换后得到的转移矩阵进行归一化处理,得到对象间的目标转移矩阵。
其中,归一化能够将一个含任意实数K维向量转换到另一个K维实向量中,使得每个元素的范围都在0到1之间,并且所有元素之和为1。
具体地,替换后得到的转移矩阵中某些元素的值比较大,因此计算量也大,为了减少计算量并达到与原来的值相同的效果,可按行将矩阵中的元素的值进行归一化处理,得到归一化之后的转移矩阵,即对象间的目标转移矩阵。进一步地,终端可确定替换后的矩阵中每行元素的最大值,并将每行元素的值均除以该行的最大值,从而实现矩阵的归一化。通过将替换后得到的转移矩阵进行归一化处理,得到对象间的目标转移矩阵,使得目标转移矩阵依然保留原有数据的关键信息,并能够有效减少计算量。
在一个实施例中,该对象与该群组之间的转移矩阵包括群组向对象的转移矩阵和对象向群组的转移矩阵;
该根据该对象和群组生成该对象与该群组之间的转移矩阵,包括:
根据群组和对象生成群组向对象的转移矩阵;将群组向对象的转移矩阵进行转置处理,得到对象向群组的转移矩阵。
具体地,终端获取网络中的所有群组和对象,可为网络中的群组标号,并为网络中的各对象标号,群组的标号和对象的标号均可以是数字标号或字母标号等。接着,终端确定群组和对象之间的关系,即确定每个群组中分别包含哪些对象。并按照群组标号将各群组作为矩阵的行,按照对象标号作为各对象作为矩阵的列,即可得到群组向对象的转移矩阵。
在本实施例中,当对象为节点时,终端可确定网络中的每个群组分别包含哪些节点。根据节点与群组的所属关系,按照群组的标号将网络中的每个群组作为矩阵的行,并按照节点的标号将各节点作为矩阵的列,从而得到群组向节点的转移矩阵。
在本实施例中,当对象为基本图时,终端可确定网络中的每个群组分别对应哪些基本图。根据基本图与群组的对应关系,按照群组的标号将网络中的每个群组作为矩阵的行,并按照基本图的标号将各基本图作为矩阵的列,从而得到群组向基本图的转移矩阵。
接着,终端将群组向对象的转移矩阵进行转置处理,可得到对象向群组的转移矩阵。进一步地,终端将群组向对象的转移矩阵进行转置处理之后,可进行归一化处理,从而得到对象向群组的转移矩阵,以减少计算量。
上述确定网络中群组的向量表示的方法,通过根据群组和对象生成群组向对象的转移矩阵,可得到群组向对象转移的可能性,并将群组向对象转移的可能性通过转移矩阵表示,使得数据更直观。通过将群组向对象的转移矩阵进行转置处理,得到对象向群组的转移矩阵,可快速准确得到群组向对象转移的可能性。
在一个实施例中,该根据群组和对象生成群组向对象的转移矩阵,包括:
根据对象和群组之间的所属关系,确定群组与对象之间的关系矩阵;将该关系矩阵作为群组向对象的转移矩阵。
其中,对象和群组之间的所属关系是指群组所包含的对象或者群组所对应的对象。
具体地,终端获取网络中的所有群组和对象,可为网络中的群组标号,并为网络中的各对象标号。接着,终端确定群组和对象之间的关系,即确定每个群组中分别包含哪些对象。并按照群组标号将各群组作为矩阵的行,按照对象标号作为各对象作为矩阵的列,并将该矩阵进行归一化处理即可得到群组向对象的转移矩阵。
本实施例中确定网络中群组的向量表示的方法,根据对象和群组之间的所属关系,确定群组与对象之间的关系矩阵,将该关系矩阵作为群组向对象的转移矩阵,可得到群组向对象转移的可能性,并将群组向对象转移的可能性通过转移矩阵表示,使得数据更直观。
在一个实施例中,该将该关系矩阵作为该群组向对象的转移矩阵,包括:
当该关系矩阵中的元素均为0或1时,确定关系矩阵中值为1的元素;确定值为1的元素对应的词权重,将该元素在关系矩阵中的1替换为对应的词权重,得到群组向对象的转移矩阵。
具体地,该群组向对象的关系矩阵可以是0,1矩阵,即关系矩阵中的元素均为0或1。即如果第i个群组包含第j个节点,则关系矩阵中对应的第i行第j列的元素为1,否则为0。接着,终端可确定该关系矩阵中值为1的元素,并计算该值为1的元素对应的词权重,将该元素在关系矩阵中的1替换为对应的词权重。元素的词权重可以是该元素的TF-IDF(termfrequency–inverse document frequency)值。TF是指词频(Term Frequency),IDF是指逆文本频率指数(Inverse Document Frequency)。
例如,第i行第j列的元素为1,则终端计算第i行第j列的元素的TF-IDF值,并用计算的到的TF-IDF值替换该第i行第j列的元素对应的1。将关系矩阵中的1均替换为对应的元素的TF-IDF值后,即可得到群组向对象的转移矩阵。
在本实施例中,当对象为节点时,终端可计算该关系矩阵中值为1的元素的词权重,并用该词权重替换关系矩阵中的1,以得到群组向节点的转移矩阵。
在本实施例中,当对象为基本图时,终端可计算该关系矩阵中值为1的元素的词权重,并用该词权重替换关系矩阵中的1,以得到群组向基本图的转移矩阵。
在本实施中,可将替换后得到的矩阵进行归一化处理,得到群组向对象的转移矩阵。
本实施例中的确定网络中群组的向量表示的方法,当该关系矩阵中的元素均为0或1时,确定关系矩阵中值为1的元素,确定值为1的元素对应的词权重,将该元素在关系矩阵中的1替换为对应的词权重,得到群组向对象的转移矩阵。通过0,1关系矩阵简单直观地表示群组与对象之间的关系,并通过词向量替换关系矩阵中的1,能够更准确的表示群组向对象转移的可能性。
在一个实施例中,如图5所示,该根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列,包括:
步骤502,选取任一群组或对象作为初始群组序列的首元素,该首元素作为当前元素。
其中,初始群组序列中的元素为群组或对象。
具体地,终端可选取网络中的任意一个对象或群组作为初始群组序列的首元素,并将首元素作为当前元素。
步骤504,当当前元素为群组时,根据群组向对象的转移矩阵抽取一个对象作为初始群组序列的下一个元素。
具体地,当终端获取群组作为当前元素时,终端获取群组向对象的转移矩阵,从该群组向对象的转移矩阵中抽取任意一个元素。群组向对象的转移矩阵中的行表示每个群组中所包含的对象,群组向对象的转移矩阵中的列表示每个对象在每个群组中的排序。接着,终端检测所抽取的元素是属于网络中的哪个群组的,并且确定该元素对应的对象在该群组中的排序,将该对象作为初始群组序列的下一个元素。例如,终端从该群组向对象的转移矩阵中抽取的元素为a36,表示该元素为第3个群组中的第6个对象,则将该第3个群组中的第6个对象作为初始群组序列的下一个元素。
进一步地,终端可获取该抽取的元素对应的值,将该元素对应的值作为初始群组序列的下一个元素。
步骤506,当当前元素为对象时,则生成一个预设区间内的数值。
具体地,当终端获取对象作为当前元素时,终端获取预先设置的区间,并随机选取该预设区间内的一个实数。例如,预设区间为[0,1],则终端从该[0,1]区间中随机获取一个实数。或者,终端可自动生成一个预设区间内的实数。
步骤508,将该数值与阈值进行比较,根据该数值与阈值的比较结果确定该初始群组序列的下一个元素。
具体地,终端将生成的数值与预先设置的阈值进行对比,根据该数值与阈值的比较结果获取相应的操作,从而可得到该初始群组序列的下一个元素。
步骤510,直到该初始群组序列的长度达到预设长度时,停止选取元素。
具体地,终端每确定初始群组序列中的一个元素,则将该元素作为当前元素,并继续执行步骤504至步骤508的操作。并且,终端每确定初始群组序列中的一个元素,则检测此时初始群组序列的长度。终端获取预设长度,将此时的初始群组序列的长度与该预设长度进行对比,当该初始群组序列的长度小于预设长度时,继续执行步骤504至步骤508的操作,以确定初始群组序列的下一个元素。当该初始群组序列的长度达到预设长度时,停止选取元素,得到最终的初始群组序列。
步骤512,获取该初始群组序列中的群组,得到目标群组序列。
其中,目标群组序列是由群组所组成的序列。
具体地,终端从该初始群组序列中获取群组,按照初始群组序列中的群组的排序将获取的群组排序,得到目标群组序列。
在本实施例中,终端可轮流将网络中的每个群组作为初始群组序列的首元素,并得到以每个群组为首元素对应的目标群组序列。
在本实施例中,终端可轮流将网络中的每个对象作为初始群组序列的首元素,并得到以每个对象为首元素所对应的目标群组序列。
上述确定网络中群组的向量表示的方法,通过选取任一群组或对象作为初始群组序列的首元素,首元素作为当前元素,并根据当前元素所满足的条件,从对象间的目标转移矩阵、对象向群组的转移矩阵、群组向对象的转移矩阵或预设区间内选择初始群组序列的下一元素,能够大概率保证数据的随机性,从而使得选取的数据更具有可信度。并且当当前元素满足不同的条件时,使用不同的方式获取序列的下一元素,提供了多种可能的情况,更能满足实际应用的需求。当初始群组序列的长度达到预设长度时,保留初始群组序列中的群组,得到目标群组序列,使得目标群组序列中的元素更符合实际处理时数据的随机性,增强数据的可靠性。
在一个实施例中,该将该数值与阈值进行比较,根据该数值与阈值的比较结果确定该初始群组序列的下一个元素,包括:
当该数值大于阈值时,根据对象间的目标转移矩阵抽取一个对象作为该初始群组序列的下一个元素;当该数值小于或等于阈值时,根据对象向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。
具体地,当终端检测到所生成的数值大于阈值时,获取对象间的目标转移矩阵。接着,终端从该对象间的目标转移矩阵随机抽取一个元素,并将该元素对应的对象作为该初始群组序列的下一个元素。进一步地,终端将将该元素的值作为该初始群组序列的下一个元素。
当终端检测到所生成的数值小于或等于阈值时,获取对象向群组的转移矩阵。对象向群组的转移矩阵中的行表示每个对象在每个群组中的排序,群组向对象的转移矩阵中的列表示每个群组中所包含的对象。接着,终端从该对象向群组的转移矩阵随机抽取一个元素,并将该元素对应的群组作为该初始群组序列的下一个元素。进一步地,终端将该抽取的元素的值作为该初始群组序列的下一个元素。例如,终端从该群组向对象的转移矩阵中抽取的元素为a36,表示该元素为第6个群组中的第3个对象,则将该第6个群组作为初始群组序列的下一个元素。
上述确定网络中群组的向量表示的方法,通过当当前元素为对象时,则生成一个预设区间内的数值,当该数值大于阈值时,根据对象间的目标转移矩阵抽取一个对象作为该初始群组序列的下一个元素。当该数值小于或等于阈值时,根据对象向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。从而可根据当前元素所满足的条件确定初始群组序列的下一个元素,为当前元素所满足的不同条件提供不同的选择元素的方式,保证了数据的随机性,使得更能满足实际应用中出现的各种情况。
在一个实施例中,该获取该初始群组序列中的群组,得到目标群组序列,包括:
删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,得到目标群组序列。
具体地,初始群组序列中包含群组和节点,目标群组序列为群组所组成的序列。因此为了得到目标群组,终端可删除该初始群组序列中的对象,从而得到目标群组序列。进一步地,终端可按照初始群组序列各元素的排序,只删除将初始群组序列中的对象,保留群组,并保持各群组的排序。
在一个实施例中,终端可筛选出该初始群组序列中的群组,从而得到目标群组序列。进一步地,终端可按照初始群组序列各元素的排序将群组筛选出来,并保持各群组的排序。例如,目标群组序列为AaBbCcDcEe,对象为a、b、c、d和e,群组为A、B、C、D和E,则删除将初始群组序列中的对象或筛选出该初始群组序列中的群组得到的序列为ABCDE,该序列ABCDE即为目标群组序列。
在本实施例中,当对象为节点时,删除该初始群组序列中的节点,或筛选出该初始群组序列中的群组,得到目标群组序列。
在本实施例中,当对象为基本图时,删除该初始群组序列中的基本图,或筛选出该初始群组序列中的群组,得到目标群组序列。
上述确定网络中群组的向量表示的方法,通过删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,可简单快速的得到目标群组序列。
在一个实施例中,当对象为节点时,该阈值为第一阈值,该根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列,包括:
选取任一群组或节点作为初始群组序列的首元素,该首元素作为当前元素。
当该当前元素为群组时,根据该群组向节点的转移矩阵抽取一个节点作为该初始群组序列的下一个元素。
当该当前元素为节点时,则生成一个预设区间内的数值。
当该数值大于该第一阈值时,根据该节点间的目标转移矩阵抽取一个节点作为该初始群组序列的下一个元素。
当该数值小于或等于该第一阈值时,根据该节点向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。
直到该初始群组序列的长度达到预设长度时,停止选取元素。
删除该初始群组序列中的节点,或筛选出该初始群组序列中的群组,得到目标群组序列。
上述确定网络中群组的向量表示的方法,通过选取任一群组或节点作为初始群组序列的首元素,首元素作为当前元素,并根据当前元素所满足的条件,从对象间的目标转移矩阵、对象向群组的转移矩阵、群组向对象的转移矩阵或预设区间内选择初始群组序列的下一元素,能够大概率保证数据的随机性,从而使得选取的数据更具有可信度。当初始群组序列的长度达到预设长度时,保留初始群组序列中的群组,得到目标群组序列,使得目标群组序列中的元素更符合实际处理时数据的随机性,增强数据的可靠性。
在一个实施例中,当对象为基本图时,该阈值为第二阈值,该根据阈值、对象间的目标转移矩阵以及对象与群组之间的转移矩阵生成目标群组序列,包括:
选取任一群组或基本图作为初始群组序列的首元素,该首元素作为当前元素;
当该当前元素为群组时,根据该群组向基本图的转移矩阵抽取一个基本图作为该初始群组序列的下一个元素;
当该当前元素为基本图时,则生成一个预设区间内的数值;
当该数值大于该第二阈值时,根据该基本图之间的目标转移矩阵抽取一个基本图作为该初始群组序列的下一个元素;
当该数值小于或等于该第二阈值时,根据该基本图向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素;
直到该初始群组序列的长度达到预设长度时,停止选取元素;
删除该初始群组序列中的基本图元素,或筛选出该初始群组序列中的群组,得到目标群组序列。
上述确定网络中群组的向量表示的方法,通过选取任一群组或基本图作为初始群组序列的首元素,首元素作为当前元素,并根据当前元素所满足的条件,从对象间的目标转移矩阵、对象向群组的转移矩阵、群组向对象的转移矩阵或预设区间内选择初始群组序列的下一元素,能够保证数据来源的随机性,从而使得选取的数据更具有可信度。并且当当前元素满足不同的条件时,使用不同的方式获取序列的下一元素,提供了多种可能的情况,更能满足实际应用的需求。当初始群组序列的长度达到预设长度时,保留初始群组序列中的群组,得到目标群组序列,使得目标群组序列中的元素更符合实际处理时数据的随机性,增强数据的可靠性。
在一个实施例中,节点所对应的第一阈值与基本图所对应的第二阈值可以是从同一个预设区间内选取出来的同一个阈值,即第一阈值与第二阈值相同。也可以是从不同的预设区间内选取出来的不同的阈值,即第一阈值与第二阈值不相同。
在一个实施例中,当该对象为基本图时,该获取网络中的对象和群组,包括:
获取网络中的群组;从该网络中的每个群组中获取预设数量的节点生成每个群组对应的基本图。
具体地,终端获取网络中的群组,接着,终端从每个群组中获取预设数量的节点生成基本图。进一步地,终端从每个群组中多次随机抽取预设数量的节点,每次抽取的节点生成一个基本图,从而得到每个群组对应的多个基本图。
本实施例中,通过获取网络中的群组,从该网络中的每个群组中获取预设数量的节点生成每个群组对应的基本图。获取预设数量的节点,保证了数据的随机性。同时,从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。
在一个实施例中,如图6所示,该从该网络中的每个群组中获取预设数量的节点生成该每个群组对应的基本图,包括:
步骤602,针对每个群组,从群组中随机抽取预设数量的节点。
步骤604,确定预设数量的节点之间的连接关系。
步骤606,根据预设数量的节点和该连接关系生成该群组对应的基本图。
具体地,群组包含一组节点和内部连接节点的边。终端从一个群组中随机抽取预设数量的节点,并确定所抽取的预设数量的节点之间的连接关系。节点之间的连接关系表现为连接节点的边。根据连接关系将所抽取的预设数量的节点进行连接,得到一个基本图,该基本图与该群组对应。接着,终端再次从该群组中随机抽取预设数量的节点,确定预设数量的节点之间的连接关系,以生成基本图。反复执行上述步骤,直到该群组对应指定数量的基本图。针对每一个群组,进行相同的处理,可得到每个群组均对应指定数量的基本图。
本实施例中,获取预设数量的节点,保证了获取节点的随机性,也保证了生成的基本图的随机性。明确预设数量的节点之间的连接关系,根据预设数量的节点和连接关系生成群组对应的基本图,使得从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。针对每个群组均执行相同操作,明确了各基本图和各群组之间的对应关系,并且保证数据获取方式的一致性。
在一个实施例中,如图7所示,当该对象为基本图时,该将该对象转换为对应的向量表示,包括:
步骤702,针对每个群组,从群组中随机抽取预设数量的节点。
步骤704,确定预设数量的节点之间的连接关系。
步骤706,根据该预设数量的节点和该连接关系生成基本图。
具体地,群组包含一组节点和内部连接节点的边。终端从一个群组中随机抽取预设数量的节点,并确定所抽取的预设数量的节点之间的连接关系。节点之间的连接关系表现为连接节点的边。根据连接关系将所抽取的预设数量的节点进行连接,得到一个基本图,该基本图与该群组对应。
步骤708,重复执行从群组中随机抽取预设数量的节点直至生成基本图的操作。
具体地,针对每一个群组,终端重复执行从群组中随机抽取预设数量的节点直至生成基本图的操作,使得每个群组对应多个基本图。进一步地,终端采用放回抽样的方式,对于从群组中已获取的节点和边并不排除,每次均从原始的群组中抽取预设数量的节点,以生成基本图。
步骤710,当基本图的数量达到指定数量时,按照节点的抽取顺序将基本图进行排序,得到该群组对应的基本图序列。
具体地,针对每一个群组,终端检测群组基本图的数量,当群组对应的基本图的数量达到指定数量时,按照节点的抽取顺序将对应生成的基本图进行排序,得到该群组对应的基本图序列。进一步地,终端可在每生成一个基本图的同时,将该基本图作为基本图序列的一个元素,即可在基本图的数量达到指定数量的同时,得到该群组对应的基本图序列。该基本图序列中包含指定数量的元素。
步骤712,将该群组对应的基本图序列输入词向量模型,得到每个基本图对应的向量表示。
具体地,终端将每个群组对应的基本图序列输入词向量模型,可得到词向量模型输出的每个基本图对应的向量表示。
本实施例中,获取预设数量的节点,保证了数据随机性。明确预设数量的节点之间的连接关系,根据预设数量的节点和连接关系生成群组对应的基本图,使得从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。针对每个群组均执行相同操作,明确了各基本图和各群组之间的对应关系,并且保证数据获取方式的一致性。重复执行相同的操作,直到基本图的数量达到指定数量,以得到群组对应的基本图序列。将该群组对应的基本图序列输入词向量模型,得到每个基本图对应的向量表示,从而将基本图转化为对应的向量,能够用向量表示基本图所代表的信息。
如图8所示,为一个实施例中基本图的4种类型。图8中的(a)、(b)、(c)和(d)为大小为3的4种基本图,本实施例中选取大小为3的基本图,则需要生成一个这些基本图之间的转移矩阵。该矩阵的每个元素表示对应的基本图的转移可能性。要生成该矩阵,首先需要在每个群组内部进行基本图的采样,按照采样的顺序生成基本图的序列。该采样可以采用随机采样,即随机在群组内部选择三个节点,并确定在群组内部这三节点的连接关系。这三个节点和它们之间的连接关系所构成的基本图是(a)、(b)、(c)和(d)中哪个基本图,就将该基本图加入序列中。也可以采用马尔科夫链式的采样,即首先随机采样一个基本图作为基本图序列的起始元素,然后随机去掉构成这个基本图的若干个节点,再从群组内部随机选择相同个数的节点补充进来,这样就得到了一组新的节点组合,该节点组合是(a)、(b)、(c)和(d)中哪个基本图,就将该基本图加入序列中。这样在每个群组中都可以采样若干条序列,将这些序列输入skip-gram模型,就可以为序列中的每个基本图学到一个向量表示。将基本图的向量表示作内积便可得到它们的相似度,再对相似度矩阵做行归一化便可得到基本图之间的转移矩阵。
如图9所示,为一个实施例中确定网络中群组的向量表示的方法的流程图。本实施例中总结了两种群组相似性。第一种相似性是基于节点之间的路径距离的。如果两个群组有较多的共同节点,或者两个群组所包含的节点之间距离较近,那么这两个群组的第一种相似性就较大。第一种相似性是基于节点之间的路径距离的。如果两个群组有较多的共同节点,或者两个群组所包含的节点之间距离较近,那么这两个群组的第一种相似性就较大。在进行群组表示学习前需要选择一种群组相似性。如果选择的是第一种群组相似性,那么需要生成节点之间的转移矩阵;接着,需要生成群组与节点之间的转移矩阵;如果选择的是第二种群组相似性,那么生成基本图之间的转移矩阵,并生成群组与基本图之间的转移矩阵。在[0,1]区间内选取一个阈值。根据预设规则,利用生成的转移矩阵和阈值来生成群组序列。如果选择的是第一种群组相似性,则根据阈值、节点间的转移矩阵,以及群组与节点之间的转移矩阵来生成第一种群组序列。将生成的第一种群组序列输入训练好的skip-gram模型,即可输出学习到的群组向量,该群组向量是基于第一种群组相似性得到的。如果选择的是第二种群组相似性,则根据阈值、基本图间的转移矩阵,以及群组与基本图之间的转移矩阵来生成第二种群组序列。将生成的第二种群组序列输入训练好的skip-gram模型,即可输出学习到的群组向量,该群组向量是基于第二种群组相似性得到的。
在一个实施例中,分别利用两种群组相似性得到两种群组向量后,可将两种群组相似性进行拼接,将拼接后的向量作为最终的群组向量。
本实施中以一个简易网络为例来说明如何进行群组的无监督表示学习。给定一个网络(V,E)和网络上的群组G=(g1,g2,g3,g4)以及必要的超参数。其中V表示网络上的所有节点,E表示网络上的所有边,G表示网络上的所有群组,群组个数标记为M。该网络结构如图10所示。该网络包含23个节点和4个群组(g1,g2,g3,g4)。本实施例中总结了两种群组相似性。第一种相似性是基于节点之间的路径距离的。如果两个群组有较多的共同节点,或者两个群组所包含的节点之间距离较近,那么这两个群组的第一种相似性就较大。比如图10中的4个群组,如果以第一种相似性来考量,那么g2和g1、g4与g1的相似性就比g3与g1的相似性大。第二种相似性是基于群组内部拓扑结构的。如果两个群组的内部拓扑结构较类似,那么这两个群组的第二种相似性就较大。比如图10中的4个群组,如果以第二种相似性来考量,那么g2与g4较相似,g1与g3较相似,因为g2与g4的内部结构都类似“星状”,而g1和g3的内部结构都类似于“网状”。在进行群组的无监督表示学习前,首先要选择一种相似性,之后便基于所选择的相似性来进行学习。
将图10中所示的四个群组分别基于两种群组相似性学习向量表示,并以此向量作为坐标将其显示在图11中。图11中的e1是基于第一种相似性学习到的向量表示,e2是基于第二种相似性学习到的向量表示。本方案中可输出学习到的群组向量,该群组的向量表示可用于各种应用,比如可视化,群组分类、聚类等。
在一个实施例中,提供了一种网络中群组的向量表示的方法,包括:
终端获取网络中的对象和群组,该对象为节点或基本图;该基本图是从该群组内选取预设数量的节点生成的。
终端将该对象转换为对应的向量表示。
终端根据每两个对象的向量表示确定该每两个对象之间的相似度。
终端根据该每两个对象之间的相似度得到该对象间的初始转移矩阵。
终端从该对象间的初始转移矩阵中每行的元素的值从高到低选取预设数量的元素,将该每行中除选取的该预设数量的元素以外的其余元素的值均替换为0。
终端将替换后得到的转移矩阵进行归一化处理,得到该对象间的目标转移矩阵。
该对象与该群组之间的转移矩阵包括群组向对象的转移矩阵和对象向群组的转移矩阵,终端根据该对象和该群组之间的所属关系,确定该群组与该对象之间的关系矩阵。
终端将该关系矩阵作为该群组向对象的转移矩阵。
当该关系矩阵中的元素均为0或1时,终端确定该关系矩阵中值为1的元素。
终端确定该值为1的元素对应的词权重,将该元素在该关系矩阵中的1替换为该对应的词权重,得到该群组向对象的转移矩阵。
终端将该群组向对象的转移矩阵进行转置处理,得到该对象向群组的转移矩阵。
终端获取阈值,选取任一群组或对象作为初始群组序列的首元素,该首元素作为当前元素。
当该当前元素为群组时,终端根据该群组向对象的转移矩阵抽取一个对象作为该初始群组序列的下一个元素。
当该当前元素为对象时,终端生成一个预设区间内的数值。
当该数值大于该阈值时,终端根据该对象间的目标转移矩阵抽取一个对象作为该初始群组序列的下一个元素。
当该数值小于或等于该阈值时,终端根据该对象向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。
直到该初始群组序列的长度达到预设长度时,停止选取元素。
终端删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,得到目标群组序列。
终端将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。
上述确定网络中群组的向量表示的方法,获取网络中的对象和群组,该对象为节点或基本图,该基本图是从该群组内选取预设数量的节点生成的。根据每两个对象的向量表示确定该每两个对象之间的相似度,根据该每两个对象之间的相似度得到对象间的目标转移矩阵,能够对网络中的对象之间的相似度进行度量,明确表示出对象间的相关性。
根据该每两个对象之间的相似度得到对象间的初始转移矩阵,从对象间的初始转移矩阵中每行的元素的值从高到低选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0,将替换后得到的转移矩阵进行归一化处理得到目标转移矩阵,可减少计算量并节省内存空间,从而提高将网络中群组转化为对应的向量表示的效率。
通过0,1关系矩阵简单直观地表示群组与对象之间的关系,并通过词权值替换关系矩阵中的1,能够更准确的表示群组向对象转移的可能性。
通过选取任一群组或对象作为初始群组序列的首元素,首元素作为当前元素,并根据当前元素所满足的条件,从对象间的目标转移矩阵、对象向群组的转移矩阵、群组向对象的转移矩阵或预设区间内选择初始群组序列的下一元素,能够大概率保证数据的随机性,从而使得选取的数据更具有可信度。并且当当前元素满足不同的条件时,使用不同的方式获取序列的下一元素,提供了多种可能的情况,更能满足实际应用的需求。当初始群组序列的长度达到预设长度时,保留初始群组序列中的群组,得到目标群组序列,使得目标群组序列中的元素更符合实际处理时数据的随机性,增强数据的可靠性。
通过删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,可简单快速的得到目标群组序列。
将该目标群组序列输入词向量模型,可快速准确得到该网络中的每个群组的向量表示。采用本方案能够实现将网络中的每个群组转化为对应的向量表示,从而可确定网络中的群组之间的相似度。
图2-图8为一个实施例中确定网络中群组的向量表示的方法的流程示意图。应该理解的是,虽然图2-图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图12所示,提供了一种确定网络中群组的向量表示的装置,该装置包括:获取模块1202、第一生成模块1204、第二生成模块1206、第三生成模块1208和输出模块1210。
获取模块1202,用于获取网络中的对象和群组,该对象为节点或基本图。
第一生成模块1204,用于根据该对象生成该对象间的目标转移矩阵。
第二生成模块1206,用于根据该对象和群组生成该对象与该群组之间的转移矩阵。
第三生成模块1208,用于获取阈值,根据该阈值、该对象间的目标转移矩阵以及该对象与该群组之间的转移矩阵生成目标群组序列。
输出模块1210,用于将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。
上述确定网络中群组的向量表示的装置,获取网络中的对象和群组,该对象为节点或基本图,该基本图是从该群组内选取预设数量的节点生成的,根据该对象生成该对象间的目标转移矩阵,根据该对象和群组生成该对象与该群组之间的转移矩阵,获取阈值,根据该阈值、该对象间的目标转移矩阵以及该对象与该群组之间的转移矩阵生成目标群组序列,将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示。采用本方案能够实现将网络中的每个群组转化为对应的向量表示,从而可确定网络中的群组之间的相似度。
在一个实施例中,第一生成模块1204还用于:将该对象转换为对应的向量表示;根据每两个对象的向量表示确定该每两个对象之间的相似度;根据该每两个对象之间的相似度得到该对象间的目标转移矩阵。
上述确定网络中群组的向量表示的装置,将该对象转换为对应的向量表示,根据每两个对象的向量表示确定该每两个对象之间的相似度,根据该每两个对象之间的相似度得到对象间的目标转移矩阵,能够对网络中的对象之间的相似度进行度量,明确表示出对象间的相关性。
在一个实施例中,第一生成模块1204还用于:根据该每两个对象之间的相似度得到该对象间的初始转移矩阵;从该对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0;将替换后得到的转移矩阵作为该对象间的目标转移矩阵。
上述确定网络中群组的向量表示的装置,根据该每两个对象之间的相似度得到对象间的初始转移矩阵,从对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的该预设数量的元素以外的其余元素的值均替换为0,将替换后得到的转移矩阵作为对象间的目标转移矩阵,可减少计算量并节省内存空间。
在一个实施例中,第一生成模块1204还用于:从该对象间的初始转移矩阵中每行的元素的值从高到低选取预设数量的元素,将该每行中除选取的该预设数量的元素以外的其余元素的值均替换为0。通过保留初始转移矩阵的每行中最大的若干个值,可最大限度的保留每行元素的关键信息,并将其它元素的值均替换为0,可减少计算量,从而提高将网络中群组转化为对应的向量表示的效率。
在一个实施例中,第一生成模块1204还用于:将替换后得到的转移矩阵进行归一化处理,得到该对象间的目标转移矩阵。通过将替换后得到的转移矩阵进行归一化处理,得到对象间的目标转移矩阵,使得目标转移矩阵依然保留原有数据的关键信息,并能够有效减少计算量。
在一个实施例中,该对象与该群组之间的转移矩阵包括群组向对象的转移矩阵和对象向群组的转移矩阵;该第二生成模块1206还用于:根据该群组和该对象生成该群组向对象的转移矩阵;将该群组向对象的转移矩阵进行转置处理,得到该对象向群组的转移矩阵。
上述确定网络中群组的向量表示的装置,通过根据群组和对象生成群组向对象的转移矩阵,可得到群组向对象转移的可能性,并将群组向对象转移的可能性通过转移矩阵表示,使得数据更直观。通过将群组向对象的转移矩阵进行转置处理,得到对象向群组的转移矩阵,可快速准确得到群组向对象转移的可能性。
在一个实施例中,该第二生成模块1206还用于:根据该对象和该群组之间的所属关系,确定该群组与该对象之间的关系矩阵;将该关系矩阵作为该群组向对象的转移矩阵。
本实施例中确定网络中群组的向量表示的装置,根据对象和群组之间的所属关系,确定群组与对象之间的关系矩阵,将该关系矩阵作为群组向对象的转移矩阵,可得到群组向对象转移的可能性,并将群组向对象转移的可能性通过转移矩阵表示,使得数据更直观。
在一个实施例中,该第二生成模块1206还用于:当该关系矩阵中的元素均为0或1时,确定该关系矩阵中值为1的元素;确定该值为1的元素对应的词权重,将该元素在该关系矩阵中的1替换为该对应的词权重,得到该群组向对象的转移矩阵。通过0,1关系矩阵简单直观地表示群组与对象之间的关系,并通过词向量替换关系矩阵中的1,能够更准确的表示群组向对象转移的可能性。
在一个实施例中,第三生成模块1208还用于:选取任一群组或对象作为初始群组序列的首元素,该首元素作为当前元素;当该当前元素为群组时,根据该群组向对象的转移矩阵抽取一个对象作为该初始群组序列的下一个元素;当该当前元素为对象时,则生成一个预设区间内的数值;将该数值与该阈值进行比较,根据该数值与该阈值的比较结果确定该初始群组序列的下一个元素;直到该初始群组序列的长度达到预设长度时,停止选取元素;获取该初始群组序列中的群组,得到目标群组序列。
上述确定网络中群组的向量表示的装置,通过选取任一群组或对象作为初始群组序列的首元素,首元素作为当前元素,并根据当前元素所满足的条件,从对象间的目标转移矩阵、对象向群组的转移矩阵、群组向对象的转移矩阵或预设区间内选择初始群组序列的下一元素,能够大概率保证数据的随机性,从而使得选取的数据更具有可信度。并且当当前元素满足不同的条件时,使用不同的方式获取序列的下一元素,提供了多种可能的情况,更能满足实际应用的需求。当初始群组序列的长度达到预设长度时,保留初始群组序列中的群组,得到目标群组序列,使得目标群组序列中的元素更符合实际处理时数据的随机性,增强数据的可靠性。
在一个实施例中,第三生成模块1208还用于:当该数值大于该阈值时,根据该对象间的目标转移矩阵抽取一个对象作为该初始群组序列的下一个元素。
当该数值小于或等于该阈值时,根据该对象向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。
上述确定网络中群组的向量表示的装置,通过当当前元素为对象时,则生成一个预设区间内的数值,当该数值大于阈值时,根据对象间的目标转移矩阵抽取一个对象作为该初始群组序列的下一个元素。当该数值小于或等于阈值时,根据对象向群组的转移矩阵抽取一个群组作为该初始群组序列的下一个元素。从而可根据当前元素所满足的条件确定初始群组序列的下一个元素,为当前元素所满足的不同条件提供不同的选择元素的方式,保证了数据的随机性,使得更能满足实际应用中出现的各种情况。
在一个实施例中,第三生成模块1208还用于:删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,得到目标群组序列。通过删除该初始群组序列中的对象,或筛选出该初始群组序列中的群组,可简单快速的得到目标群组序列。
在一个实施例中,当该对象为基本图时,获取模块1202还用于:获取网络中的群组;从该网络中的每个群组中获取预设数量的节点生成该每个群组对应的基本图。
本实施例中,通过获取网络中的群组,从该网络中的每个群组中获取预设数量的节点生成每个群组对应的基本图。获取预设数量的节点,保证了数据的随机性。同时,从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。
在一个实施例中,获取模块1202还用于:针对每个群组,从该群组中随机抽取预设数量的节点;确定该预设数量的节点之间的连接关系;根据该预设数量的节点和该连接关系生成该群组对应的基本图。
本实施例中,获取预设数量的节点,保证了获取节点的随机性,也保证了生成的基本图的随机性。明确预设数量的节点之间的连接关系,根据预设数量的节点和连接关系生成群组对应的基本图,使得从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。针对每个群组均执行相同操作,明确了各基本图和各群组之间的对应关系,并且保证数据获取方式的一致性。
在一个实施例中,当该对象为基本图时,第一生成模块1204还用于:针对每个群组,从该群组中随机抽取预设数量的节点;确定该预设数量的节点之间的连接关系;根据该预设数量的节点和该连接关系生成基本图;重复执行从该群组中随机抽取预设数量的节点直至生成基本图的操作;当该基本图的数量达到指定数量时,按照该节点的抽取顺序将该基本图进行排序,得到该群组对应的基本图序列;将该群组对应的基本图序列输入词向量模型,得到每个基本图对应的向量表示。
本实施例中,获取预设数量的节点,保证了数据随机性。明确预设数量的节点之间的连接关系,根据预设数量的节点和连接关系生成群组对应的基本图,使得从哪个群组中获取的节点生成的基本图仍对应该群组,明确了基本图和群组之间的关系。针对每个群组均执行相同操作,明确了各基本图和各群组之间的对应关系,并且保证数据获取方式的一致性。重复执行相同的操作,直到基本图的数量达到指定数量,以得到群组对应的基本图序列。将该群组对应的基本图序列输入词向量模型,得到每个基本图对应的向量表示,从而将基本图转化为对应的向量,能够用向量表示基本图所代表的信息。
图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图10所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现确定网络中群组的向量表示的方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行确定网络中群组的向量表示的方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的确定网络中群组的向量表示的装置可以实现为一种计算机程序的形式,计算机程序可在如图13所示的计算机设备上运行。计算机设备的存储器中可存储组成该确定网络中群组的向量表示的装置的各个程序模块,比如,图12所示的获取模块1202、第一生成模块1204、第二生成模块1206、第三生成模块1208和输出模块1210。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的确定网络中群组的向量表示的方法中的步骤。
例如,图13所示的计算机设备可以通过如图12所示的确定网络中群组的向量表示的装置中的获取模块1202执行获取网络中的对象和群组,该对象为节点或基本图的步骤。计算机设备可通过第一生成模块1204执行根据该对象生成该对象间的目标转移矩阵的步骤。计算机设备可通过第二生成模块1206执行根据该对象和群组生成该对象与该群组之间的转移矩阵。计算机设备可通过第三生成模块1208执行获取阈值,根据该阈值、该对象间的目标转移矩阵以及该对象与该群组之间的转移矩阵生成目标群组序列的步骤。计算机设备可通过输出模块1210执行将该目标群组序列输入词向量模型,得到该网络中的每个群组的向量表示的步骤。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述确定网络中群组的向量表示的方法的步骤。此处确定网络中群组的向量表示的方法的步骤可以是上述各个实施例的确定网络中群组的向量表示的方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述确定网络中群组的向量表示的方法的步骤。此处确定网络中群组的向量表示的方法的步骤可以是上述各个实施例的确定网络中群组的向量表示的方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种确定网络中群组的向量表示的方法,其特征在于,所述方法包括:
获取网络中的对象和群组,所述对象为节点或基本图;所述基本图是从所述群组内选取预设数量的节点生成的;
根据所述对象生成所述对象间的目标转移矩阵;
根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
2.根据权利要求1所述的方法,其特征在于,所述根据所述对象生成所述对象间的目标转移矩阵,包括:
将所述对象转换为对应的向量表示;
根据每两个对象的向量表示确定所述每两个对象之间的相似度;
根据所述每两个对象之间的相似度得到所述对象间的目标转移矩阵。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每两个对象之间的相似度得到所述对象间的目标转移矩阵,包括:
根据所述每两个对象之间的相似度得到所述对象间的初始转移矩阵;
从所述对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的所述预设数量的元素以外的其余元素的值均替换为0;
将替换后得到的转移矩阵作为所述对象间的目标转移矩阵。
4.根据权利要求3所述的方法,其特征在于,所述从所述对象间的初始转移矩阵中的元素的值选取预设数量的元素,将选取的所述预设数量的元素以外的其余元素的值均替换为0,包括:
从所述对象间的初始转移矩阵中每行的元素的值从高到低选取预设数量的元素,将所述每行中除选取的所述预设数量的元素以外的其余元素的值均替换为0。
5.根据权利要求1所述的方法,其特征在于,所述对象与所述群组之间的转移矩阵包括群组向对象的转移矩阵和对象向群组的转移矩阵;
所述根据所述对象和群组生成所述对象与所述群组之间的转移矩阵,包括:
根据所述群组和所述对象生成所述群组向对象的转移矩阵;
将所述群组向对象的转移矩阵进行转置处理,得到所述对象向群组的转移矩阵。
6.根据权利要求5所述的方法,其特征在于,所述根据所述群组和所述对象生成所述群组向对象的转移矩阵,包括:
根据所述对象和所述群组之间的所属关系,确定所述群组与所述对象之间的关系矩阵;
将所述关系矩阵作为所述群组向对象的转移矩阵。
7.根据权利要求6所述的方法,其特征在于,所述将所述关系矩阵作为所述群组向对象的转移矩阵,包括:
当所述关系矩阵中的元素均为0或1时,确定所述关系矩阵中值为1的元素;
确定所述值为1的元素对应的词权重,将所述元素在所述关系矩阵中的1替换为所述对应的词权重,得到所述群组向对象的转移矩阵。
8.根据权利要求5至7中任一项所述的方法,其特征在于,所述根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列,包括:
选取任一群组或对象作为初始群组序列的首元素,所述首元素作为当前元素;
当所述当前元素为群组时,根据所述群组向对象的转移矩阵抽取一个对象作为所述初始群组序列的下一个元素;
当所述当前元素为对象时,则生成一个预设区间内的数值;
将所述数值与所述阈值进行比较,根据所述数值与所述阈值的比较结果确定所述初始群组序列的下一个元素;
直到所述初始群组序列的长度达到预设长度时,停止选取元素;
获取所述初始群组序列中的群组,得到目标群组序列。
9.根据权利要求5至7中任一项所述的方法,其特征在于,所述将所述数值与所述阈值进行比较,根据所述数值与所述阈值的比较结果确定所述初始群组序列的下一个元素,包括:
当所述数值大于所述阈值时,根据所述对象间的目标转移矩阵抽取一个对象作为所述初始群组序列的下一个元素;
当所述数值小于或等于所述阈值时,根据所述对象向群组的转移矩阵抽取一个群组作为所述初始群组序列的下一个元素。
10.根据权利要求1所述的方法,其特征在于,当所述对象为基本图时,所述获取网络中的对象和群组,包括:
获取网络中的群组;
从所述网络中的每个群组中获取预设数量的节点生成所述每个群组对应的基本图。
11.根据权利要求10所述的方法,其特征在于,所述从所述网络中的每个群组中获取预设数量的节点生成所述每个群组对应的基本图,包括:
针对每个群组,从所述群组中随机抽取预设数量的节点;
确定所述预设数量的节点之间的连接关系;
根据所述预设数量的节点和所述连接关系生成所述群组对应的基本图。
12.根据权利要求2所述的方法,其特征在于,当所述对象为基本图时,所述将所述对象转换为对应的向量表示,包括:
针对每个群组,从所述群组中随机抽取预设数量的节点;
确定所述预设数量的节点之间的连接关系;
根据所述预设数量的节点和所述连接关系生成基本图;
重复执行从所述群组中随机抽取预设数量的节点直至生成基本图的操作;
当所述基本图的数量达到指定数量时,按照所述节点的抽取顺序将所述基本图进行排序,得到所述群组对应的基本图序列;
将所述群组对应的基本图序列输入词向量模型,得到每个基本图对应的向量表示。
13.一种确定网络中群组的向量表示的装置,其特征在于,所述装置包括:
获取模块,用于获取网络中的对象和群组,所述对象为节点或基本图;
第一生成模块,用于根据所述对象生成所述对象间的目标转移矩阵;
第二生成模块,用于根据所述对象和群组生成所述对象与所述群组之间的转移矩阵;
第三生成模块,用于获取阈值,根据所述阈值、所述对象间的目标转移矩阵以及所述对象与所述群组之间的转移矩阵生成目标群组序列;
输出模块,用于将所述目标群组序列输入词向量模型,得到所述网络中的每个群组的向量表示。
14.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
CN201910982737.0A 2019-10-16 2019-10-16 确定网络中群组的向量表示的方法、装置和计算机设备 Pending CN110807130A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910982737.0A CN110807130A (zh) 2019-10-16 2019-10-16 确定网络中群组的向量表示的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910982737.0A CN110807130A (zh) 2019-10-16 2019-10-16 确定网络中群组的向量表示的方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN110807130A true CN110807130A (zh) 2020-02-18

Family

ID=69488516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910982737.0A Pending CN110807130A (zh) 2019-10-16 2019-10-16 确定网络中群组的向量表示的方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN110807130A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111427875A (zh) * 2020-03-19 2020-07-17 广东蔚海数问大数据科技有限公司 一种数据质量检测的抽样方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111427875A (zh) * 2020-03-19 2020-07-17 广东蔚海数问大数据科技有限公司 一种数据质量检测的抽样方法、系统及存储介质
CN111427875B (zh) * 2020-03-19 2023-09-12 广东蔚海数问大数据科技有限公司 一种数据质量检测的抽样方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN110362723B (zh) 一种题目特征表示方法、装置及存储介质
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN110222709B (zh) 一种多标签智能打标方法及系统
CN112380344B (zh) 文本分类的方法、话题生成的方法、装置、设备及介质
Asim et al. Significance of machine learning algorithms in professional blogger's classification
CN111666370B (zh) 面向多源异构航天数据的语义索引方法和装置
CN110166522B (zh) 服务器识别方法、装置、可读存储介质和计算机设备
CN115293919B (zh) 面向社交网络分布外泛化的图神经网络预测方法及系统
Davila-Frias et al. All-terminal network reliability estimation using convolutional neural networks
Gomaa The impact of deep learning techniques on SMS spam filtering
Souravlas et al. Probabilistic community detection in social networks
CN113656690A (zh) 产品推荐方法、装置、电子设备及可读存储介质
Silva et al. An instance selection method for large datasets based on markov geometric diffusion
CN117909517A (zh) 知识图谱补全方法、装置、设备、存储介质和程序产品
CN110807130A (zh) 确定网络中群组的向量表示的方法、装置和计算机设备
Liu et al. Margin-based two-stage supervised hashing for image retrieval
CN113705201B (zh) 基于文本的事件概率预测评估算法、电子设备及存储介质
CN116191398A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN112685574B (zh) 领域术语层次关系的确定方法、装置
CN115062619A (zh) 中文实体链接方法、装置、设备及存储介质
CN114692573A (zh) 文本结构化处理方法、装置、计算机设备、介质和产品
CN114329065A (zh) 视频标签预测模型的处理方法、视频标签预测方法和装置
Chen et al. Hypergraph neural networks for time-series forecasting
CN110415006B (zh) 广告点击率预估方法和装置
Gu et al. Defining and identifying the optimal embedding dimension of networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20200323

Address after: 100084 Beijing city Haidian District Shuangqing Road No. 30

Applicant after: TSINGHUA University

Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination