CN113886688A - 对象的关联关系预测方法、装置、终端设备以及存储介质 - Google Patents

对象的关联关系预测方法、装置、终端设备以及存储介质 Download PDF

Info

Publication number
CN113886688A
CN113886688A CN202111139757.5A CN202111139757A CN113886688A CN 113886688 A CN113886688 A CN 113886688A CN 202111139757 A CN202111139757 A CN 202111139757A CN 113886688 A CN113886688 A CN 113886688A
Authority
CN
China
Prior art keywords
similarity
order similarity
order
matrix
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111139757.5A
Other languages
English (en)
Other versions
CN113886688B (zh
Inventor
曲博
李聪
石敏
王海燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peng Cheng Laboratory
Original Assignee
Peng Cheng Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peng Cheng Laboratory filed Critical Peng Cheng Laboratory
Priority to CN202111139757.5A priority Critical patent/CN113886688B/zh
Publication of CN113886688A publication Critical patent/CN113886688A/zh
Application granted granted Critical
Publication of CN113886688B publication Critical patent/CN113886688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种对象的关联关系预测方法,包括:基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;利用所述目标异构信息图,生成重构输入矩阵;将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。本发明还公开一种对象的关联关系预测装置、终端设备以及计算机可读存储介质。利用本发明的方法,获得的预测关联关系考虑到了高阶相似度、二阶相似度和一阶相似度,从而使得预测关联关系的准确度较高。

Description

对象的关联关系预测方法、装置、终端设备以及存储介质
技术领域
本发明涉及信息预测技术领域,特别涉及一种对象的关联关系预测方法、装置、终端设备以及计算机可读存储介质。
背景技术
随着互联网的发展,越来越多的人开始在网络上搜索自己感兴趣的信息,用户还可以基于现有的对象间的关系,进行对象关系的预测,例如,A用户和B用户是曾经合作写论文的用户,则可以利用预测模型,对A用户和B用户是否还会继续合作进行预测。
目前,现有的对象关系预测方法中,利用多个对象和多个对象的关联关系,获得异构信息图,然后对异构信息图进行分析,获得多个对象的关联关系预测结果。
但是,采用现有的对象关系预测方法,获得的关联关系预测结果准确率较低。
发明内容
本发明的主要目的是提供一种对象的关联关系预测方法、装置、终端设备以及计算机可读存储介质,旨在解决现有技术中采用现有的对象关系预测方法,获得的关联关系预测结果准确率较低的技术问题。
为实现上述目的,本发明提出一种对象的关联关系预测方法,所述方法包括以下步骤:
基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;
利用所述目标异构信息图,生成重构输入矩阵;
将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;
基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
可选的,所述目标异构信息图包括属性矩阵和邻接矩阵;所述利用所述目标异构信息图,生成重构输入矩阵的步骤,包括:
利用所述属性矩阵,生成属性相似度矩阵;
在所述目标异构信息图中获取社团信息;
基于所述社团信息,获得社团相似度矩阵;
利用所述邻接矩阵、所述属性相似度矩阵和所述社团相似度矩阵,生成重构输入矩阵。
可选的,所述将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度的步骤,包括:
将所述重构输入矩阵输入所述预设相似度模型的编码器,获得表示向量;
将所述表示向量输入所述预设相似度模型的解码器,获得输出向量;
基于所述重构输入矩阵和所述输出向量,获得所述高阶相似度;
将所述表示向量输入所述预设相似度模型的二阶相似度模块,获得所述二阶相似度;
将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度。
可选的,所述将所述重构输入矩阵输入所述预设相似度模型的编码器,获得表示向量的步骤,包括:
将所述重构输入矩阵输入所述预设相似度模型的编码器,以使所述编码器利用公式一,对所述重构输入矩阵进行运算,获得所述表示向量;
所述公式一为:
Figure BDA0003282747280000021
Figure BDA0003282747280000022
其中,yi为所述表示向量的第i行数据,Ri为所述重构输入矩阵的第i行数据,W和b为模型参数,k为层数,δ为预设非线性激活函数,K为预设层数。
可选的,所述基于所述重构输入矩阵和所述输出向量,获得所述高阶相似度的步骤,包括:
基于所述重构输入矩阵和所述输出向量,利用公式二,获得所述高阶相似度;
所述公式二为:
Figure BDA0003282747280000031
其中,Lae为所述高阶相似度,
Figure BDA0003282747280000032
为输出向量的第i行数据,Ri为所述重构输入矩阵的第i行数据。
可选的,所述将所述表示向量输入所述预设相似度模型的二阶相似度模块,获得所述二阶相似度的步骤,包括:
将所述表示向量输入所述预设相似度模型的二阶相似度模块,以使所述二阶相似度模块利用公式三,对所述表示向量进行运算,获得所述二阶相似度;
所述公式三为:
Figure BDA0003282747280000033
其中,Lsg为所述二阶相似度,b为预设窗口的大小,c∈C表示从所述目标异构信息图中取节点进行计算,h′i为预设权重矩阵H的第i行,其中,预设权重矩阵基于所述表示向量和所述输出向量获得。
可选的,所述将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度的步骤,包括:
将所述表示向量输入所述预设相似度模型的一阶相似度模块,以使所述一阶相似度模块利用公式四,对所述表示向量进行运算,获得所述一阶相似度;
Figure BDA0003282747280000034
Figure BDA0003282747280000035
其中,ωij为联合概率,LFoP为所述一阶相似度。
此外,为实现上述目的,本发明还提出了一种对象的关联关系预测装置,所述装置包括:
获得模块,用于基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;
生成模块,用于利用所述目标异构信息图,生成重构输入矩阵;
模型分析模块,用于将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;
预测模块,用于基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系
此外,为实现上述目的,本发明还提出了一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行对象的关联关系预测程序,所述对象的关联关系预测程序被所述处理器执行时实现如上述任一项所述的对象的关联关系预测方法的步骤。
此外,为实现上述目的,本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有对象的关联关系预测程序,所述对象的关联关系预测程序被处理器执行时实现如上述任一项所述的对象的关联关系预测方法的步骤。
本发明技术方案提出了一种对象的关联关系预测方法,所述方法包括以下步骤:基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;利用所述目标异构信息图,生成重构输入矩阵;将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
由于,现有的方法中,利用预测模型对异构信息图进行分析时,未考虑高阶相似度、二阶相似度和一阶相似度,使得获得的预测关联关系准确度较差。而本发明中,基于目标异构信息图对应的重构输入矩阵,获得高阶相似度、二阶相似度和一阶相似度,从而使得获得的预测关联关系考虑到了高阶相似度、二阶相似度和一阶相似度,从而使得预测关联关系的准确度较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图;
图2为本发明对象的关联关系预测方法第一实施例的流程示意图;
图3为本发明对象的关联关系预测装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图。
通常,终端设备包括:至少一个处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的对象的关联关系预测程序,所述对象的关联关系预测程序配置为实现如前所述的对象的关联关系预测方法的步骤。
处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。处理器301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关对象的关联关系预测方法操作,使得对象的关联关系预测方法模型可以自主训练学习,提高效率和准确度。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器301所执行以实现本申请中方法实施例提供的对象的关联关系预测方法。
在一些实施例中,终端还可选包括有:通信接口303和至少一个外围设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与通信接口303相连。具体地,外围设备包括:射频电路304、显示屏305和电源306中的至少一种。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路304包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏305是触摸显示屏时,显示屏305还具有采集在显示屏305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器301进行处理。此时,显示屏305还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏305可以为一个,电子设备的前面板;在另一些实施例中,显示屏305可以为至少两个,分别设置在电子设备的不同表面或呈折叠设计;在再一些实施例中,显示屏305可以是柔性显示屏,设置在电子设备的弯曲表面上或折叠面上。甚至,显示屏305还可以设置成非矩形的不规则图形,也即异形屏。显示屏305可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
电源306用于为电子设备中的各个组件进行供电。电源306可以是交流电、直流电、一次性电池或可充电电池。当电源306包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图1中示出的结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有对象的关联关系预测程序,所述对象的关联关系预测程序被处理器执行时实现如上文所述的对象的关联关系预测方法的步骤。因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。确定为示例,程序指令可被部署为在一个终端设备上执行,或者在位于一个地点的多个终端设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个终端设备备上执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
基于上述硬件结构,提出本发明对象的关联关系预测方法的实施例。
参照图2,图2为本发明对象的关联关系预测方法第一实施例的流程示意图,所述方法用于终端设备,所述方法包括以下步骤:
步骤S11:基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图。
需要说明的是,本发明的执行主体是终端设备,终端设备安装对象的关联关系预测程序,终端设备执行对象的关联关系预测程序时,实现本发明的对象的关联关系预测方法的步骤。
在本发明中,目标对象可以任何形式的物体或生物,关联关系则是目标对象对应的一种关系,例如,目标对象是论文发布者,目标对象的关联关系则是论文发布者合作写论文的关联关系,又或,目标对象是商品,目标对象的关联关系则是商品之间的推荐关系。
目标对象势必要是多个,才会存在关联关系,多个目标对象用于作为异构信息图(所述目标异构信息图是指多个目标对象对应的)的节点,多个目标对象之间的关联关系为目标异构信息图中的边(两个目标对象间有关联关系,则他们对应的两个节点之间有一条边)。在本发明中,获得的目标异构信息图是具有属性的,在本发明中,目标异构信息图可以表示为G=(V,E,A,X),其中,V={v1,v1,...,vn}是节点的集合,E是节点之间的边对应的集合,A是邻接矩阵,A中元素aij代表节点vi和vj之间的关系强度,对于对称的异构信息图有aij=aji,X为属性矩阵,X中的第i行xi代表节点vi的属性。
步骤S12:利用所述目标异构信息图,生成重构输入矩阵。
获得上述目标异构信息图之后,需要利用目标异构信息图进行重构操作,以获得重构输入矩阵,然后利用重构后获得的重构输入矩阵进行后续计算。
具体的,所述目标异构信息图包括属性矩阵和邻接矩阵;所述利用所述目标异构信息图,生成重构输入矩阵的步骤,包括:利用所述属性矩阵,生成属性相似度矩阵;在所述目标异构信息图中获取社团信息;基于所述社团信息,获得社团相似度矩阵;利用所述邻接矩阵、所述属性相似度矩阵和所述社团相似度矩阵,生成重构输入矩阵。
其中,基于属性矩阵,利用公式五,获得属性相似度矩阵,公式五如下:
Figure BDA0003282747280000081
其中,Sim函数为向量相似度函数,例如余弦相似度函数等,
Figure BDA0003282747280000082
为属性相似度矩阵X(s)中一个元素,用于表示X中的第i行xi和第j行xj的相似度。
然后在目标异构信息图中采用社团划分算法(例如标签传播算法,infomap,multilevel等)获取社团信息,节点i的社团信息用ci表示,例如,一个异构信息图划分为1000个社团,则ci为1000维,仅节点i所在的社团好对应维的值为1,其余维的值为0。然后基于社团信息,利用公式六,获得社团相似度矩阵,公式六如下:
Figure BDA0003282747280000091
其中,
Figure BDA0003282747280000092
为社团相似度矩阵C(s)中一个元素,用于表示ci和cj的相似度,其中Sim函数与上文的Sim函数意义相同。
然后再利用公式七,基于所述邻接矩阵、所述属性相似度矩阵和所述社团相似度矩阵,获得重构输入矩阵,公式七如下:
Figure BDA0003282747280000093
其中,α为邻接矩阵的权重,
Figure BDA0003282747280000094
为属性相似度矩阵的权重,
Figure BDA0003282747280000095
社团相似度矩阵的权重,他们可以根据实际的相似度分析过程和情况获得,并在运行过程中,进行微调。
在本发明实施例中,重构输入矩阵考虑到了社团信息和属性信息,使得当异构信息图信息中的数据信息相对稀疏时,重构输入矩阵依旧具有较多的有效数据,从而提高了最终预测关联关系的准确率。
步骤S13:将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度。
可以理解的是,本发明将重构输入矩阵输入预设相似度模型,获得三种相似度,相较于现有的技术,获得的相似度包含了高阶相似度、二阶相似度和一阶相似度,提高了运算结果的准确率。
具体的,所述将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度的步骤,包括:将所述重构输入矩阵输入所述预设相似度模型的编码器,获得表示向量;将所述表示向量输入所述预设相似度模型的解码器,获得输出向量;基于所述重构输入矩阵和所述输出向量,获得所述高阶相似度;将所述表示向量输入所述预设相似度模型的二阶相似度模块,获得所述二阶相似度;将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度。
其中,所述将所述重构输入矩阵输入所述预设相似度模型的编码器,获得表示向量的步骤,包括:将所述重构输入矩阵输入所述预设相似度模型的编码器,以使所述编码器利用公式一,对所述重构输入矩阵进行运算,获得所述表示向量;所述公式一为:
Figure BDA0003282747280000096
Figure BDA0003282747280000097
其中,yi为所述表示向量的第i行数据,Ri为所述重构输入矩阵的第i行数据,W和b为模型参数,k为层数,δ为预设非线性激活函数,可以根据场景选择合适的激活函数,K为预设层数,一般K设定为三层。通过上述过程,编码器即将重构输入矩阵映射为表示向量。
然后解码器在对表示向量进行还原,还原为与重构输入矩阵等长的输出向量,然后,基于所述重构输入矩阵和所述输出向量,利用公式二,获得所述高阶相似度;所述公式二为:
Figure BDA0003282747280000101
其中,Lae为所述高阶相似度,
Figure BDA0003282747280000102
为输出向量的第i行数据,Ri为所述重构输入矩阵的第i行数据。在具体应用中,视具体的应用和任务,考虑到矩阵R可能较为稀疏,可引入惩罚系统等方法,对如上损失函数进行优化,保证更关注于矩阵R的非0部分。
之后,将所述表示向量输入所述预设相似度模型的二阶相似度模块,以使所述二阶相似度模块利用公式三,对所述表示向量进行运算,获得所述二阶相似度;所述公式三为:
Figure BDA0003282747280000103
其中,Lsg为所述二阶相似度,b为预设窗口的大小(基于经验确定,本发明不做具体限定),yi为所述表示向量的第i行数据,c∈C表示从所述目标异构信息图中取节点进行计算,h′i为预设权重矩阵H的第i行,其中,预设权重矩阵基于所述表示向量和所述输出向量获得,即权重矩阵H表示重构输入矩阵到输出向量的权重。目标异构信息图中的节点是具有序列的,即c∈C表示从目标异构信息图中的节点序列中取出的节点。
具体应用中,编码器视为skip-gram模型的前半部分,表示向量视为隐藏层。
再之后,所述将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度的步骤,包括:将所述表示向量输入所述预设相似度模型的一阶相似度模块,以使所述一阶相似度模块利用公式四,对所述表示向量进行运算,获得所述一阶相似度;
Figure BDA0003282747280000104
Figure BDA0003282747280000111
其中,ωij为联合概率,LFoP为所述一阶相似度,yi为所述表示向量的第i行数据。
可以理解的是,在本发明中,预设相似度模型包括编码器、解码器、一阶相似度模块和二阶相似度模块等四个部分,每一个部分利用对应的公式计算对应的数据,以获得最终的高阶相似度、二阶相似度和一阶相似度。
可以理解的是,在本发明中,四个部分可以分别进行训练,即编码器、解码器、一阶相似度模块和二阶相似度模块是耦合的,利用同样的训练数据进行训练,使得编码器、解码器、一阶相似度模块和二阶相似度具有较高的对应关系,保证了预设相似度模型具有较高的预测准确率。
具体的训练过程本发明不做赘述,参照上文目标异构信息图的处理过程,训练过程类似,只是训练过程需要大量的训练异构信息图。
步骤S14:基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
在获得所述高阶相似度、所述二阶相似度和所述一阶相似度之后,将他们进行组合运算,获得最终的相似度,然后基于最终的相似度确定多个目标对象间的关联关系,该关联关系即为所述预设相似度模型预测的结果,所以获得的关联关系也叫目标对象的预测关联关系,表示的是一种预测结果。
具体的,基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系,包括:基于所述高阶相似度、所述二阶相似度、所述一阶相似度、所述二阶相似度权重和所述一阶相似度权重,获得最终的相似度,基于最终的相似度,获得多个所述目标对象的预测关联关系。
具体的,上述计算过程表示为公式八,公式八如下:
L=Lae+βLsg+γLFoP
其中,β为所述二阶相似度权重,γ为所述一阶相似度权重,L为所述最终的相似度。β和γ视具体的应用和任务,可考虑使用相关技术,以防止过拟合。
例如,基于100论文发布者对应的异构信息图,1号论文发布者和89号论文发布者之间的最终的相似度最高,且,超过预设阈值,表示1号论文发布者和89号论文发布可能再次合作论文撰写,在该例子中,高于预设阈值的最终的相似度表示对象之间具有关联关系,低于预设阈值的最终的相似度表示对象之间不具有关联关系。
在本发明技术方案提出了一种对象的关联关系预测方法,所述方法包括以下步骤:基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;利用所述目标异构信息图,生成重构输入矩阵;将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
由于,现有的方法中,利用预测模型对异构信息图进行分析时,未考虑高阶相似度、二阶相似度和一阶相似度,使得获得的预测关联关系准确度较差。而本发明中,基于目标异构信息图对应的重构输入矩阵,获得高阶相似度、二阶相似度和一阶相似度,从而使得获得的预测关联关系考虑到了高阶相似度、二阶相似度和一阶相似度,从而使得预测关联关系的准确度较高。
同时,模型中各个部分均是采用耦合方式训练的,使得获得的预测关联关系的准确度较高。
参照图3,图3为本发明对象的关联关系预测装置第一实施例的结构框图,所述装置用于终端设备,基于与前述实施例相同的发明构思,所述装置包括:
获得模块10,用于基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;
生成模块20,用于利用所述目标异构信息图,生成重构输入矩阵;
模型分析模块30,用于将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;
预测模块40,用于基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
需要说明的是,由于本实施例的装置所执行的步骤与前述方法实施例的步骤相同,其具体的实施方式以及可以达到的技术效果都可参照前述实施例,这里不再赘述。
以上所述仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种对象的关联关系预测方法,其特征在于,所述方法包括以下步骤:
基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;
利用所述目标异构信息图,生成重构输入矩阵;
将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;
基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
2.如权利要求1所述的方法,其特征在于,所述目标异构信息图包括属性矩阵和邻接矩阵;所述利用所述目标异构信息图,生成重构输入矩阵的步骤,包括:
利用所述属性矩阵,生成属性相似度矩阵;
在所述目标异构信息图中获取社团信息;
基于所述社团信息,获得社团相似度矩阵;
利用所述邻接矩阵、所述属性相似度矩阵和所述社团相似度矩阵,生成重构输入矩阵。
3.如权利要求2所述的方法,其特征在于,所述将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度的步骤,包括:
将所述重构输入矩阵输入所述预设相似度模型的编码器,获得表示向量;
将所述表示向量输入所述预设相似度模型的解码器,获得输出向量;
基于所述重构输入矩阵和所述输出向量,获得所述高阶相似度;
将所述表示向量输入所述预设相似度模型的二阶相似度模块,获得所述二阶相似度;
将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度。
4.如权利要求3所述的方法,其特征在于,所述将所述重构输入矩阵输入昕述预设相似度模型的编码器,获得表示向量的步骤,包括:
将所述重构输入矩阵输入所述预设相似度模型的编码器,以使所述编码器利用公式一,对所述重构输入矩阵进行运算,获得所述表示向量;
所述公式一为:
Figure FDA0003282747270000021
Figure FDA0003282747270000022
其中,yi为所述表示向量的第i行数据,Ri为所述重构输入矩阵的第i行数据,W和b为模型参数,k为层数,δ为预设非线性激活函数,K为预设层数。
5.如权利要求4所述的方法,其特征在于,所述基于所述重构输入矩阵和所述输出向量,获得所述高阶相似度的步骤,包括:
基于所述重构输入矩阵和所述输出向量,利用公式二,获得所述高阶相似度;
所述公式二为:
Figure FDA0003282747270000023
其中,Lae为所述高阶相似度,
Figure FDA0003282747270000025
为输出向量的第i行数据,Ri为所述重构输入矩阵的第i行数据。
6.如权利要求5所述的方法,其特征在于,所述将所述表示向量输入所述预设相似度模型的二阶相似度模块,获得所述二阶相似度的步骤,包括:
将所述表示向量输入所述预设相似度模型的二阶相似度模块,以使所述二阶相似度模块利用公式三,对所述表示向量进行运算,获得所述二阶相似度;
所述公式三为:
Figure FDA0003282747270000024
其中,Lsg为所述二阶相似度,b为预设窗口的大小,c∈C表示从所述目标异构信息图中取节点进行计算,h′i为预设权重矩阵H的第i行,其中,预设权重矩阵基于所述表示向量和所述输出向量获得。
7.如权利要求6所述的方法,其特征在于,所述将所述表示向量输入所述预设相似度模型的一阶相似度模块,获得所述一阶相似度的步骤,包括:
将所述表示向量输入所述预设相似度模型的一阶相似度模块,以使所述一阶相似度模块利用公式四,对所述表示向量进行运算,获得所述一阶相似度;
Figure FDA0003282747270000031
Figure FDA0003282747270000032
其中,ωij为联合概率,LFoP为所述一阶相似度。
8.一种对象的关联关系预测装置,其特征在于,所述装置包括:
获得模块,用于基于多个目标对象和多个所述目标对象之间的关联关系,获得目标异构信息图;
生成模块,用于利用所述目标异构信息图,生成重构输入矩阵;
模型分析模块,用于将所述重构输入矩阵输入预设相似度模型进行运算,获得所述目标异构信息图对应的高阶相似度、二阶相似度和一阶相似度;
预测模块,用于基于所述高阶相似度、所述二阶相似度和所述一阶相似度,获得多个所述目标对象的预测关联关系。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行对象的关联关系预测程序,所述对象的关联关系预测程序被所述处理器执行时实现如权利要求1至7中任一项所述的对象的关联关系预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有对象的关联关系预测程序,所述对象的关联关系预测程序被处理器执行时实现如权利要求1至7中任一项所述的对象的关联关系预测方法的步骤。
CN202111139757.5A 2021-09-27 2021-09-27 对象的关联关系预测方法、装置、终端设备以及存储介质 Active CN113886688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111139757.5A CN113886688B (zh) 2021-09-27 2021-09-27 对象的关联关系预测方法、装置、终端设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111139757.5A CN113886688B (zh) 2021-09-27 2021-09-27 对象的关联关系预测方法、装置、终端设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113886688A true CN113886688A (zh) 2022-01-04
CN113886688B CN113886688B (zh) 2024-07-05

Family

ID=79007252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111139757.5A Active CN113886688B (zh) 2021-09-27 2021-09-27 对象的关联关系预测方法、装置、终端设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113886688B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114418012A (zh) * 2022-01-21 2022-04-29 建信金融科技有限责任公司 对象关联关系确定方法、装置、设备及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447261A (zh) * 2018-10-09 2019-03-08 北京邮电大学 一种基于多阶邻近相似度的网络表示学习的方法
CN111931023A (zh) * 2020-07-01 2020-11-13 西北工业大学 一种基于网络嵌入的社团结构识别方法及装置
CN112017669A (zh) * 2020-11-02 2020-12-01 鹏城实验室 语音对抗样本检测方法、装置、终端设备以及存储介质
CN112417219A (zh) * 2020-11-16 2021-02-26 吉林大学 基于超图卷积的超边链接预测方法
CN113222023A (zh) * 2021-05-17 2021-08-06 广州华多网络科技有限公司 数据关系重构方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447261A (zh) * 2018-10-09 2019-03-08 北京邮电大学 一种基于多阶邻近相似度的网络表示学习的方法
CN111931023A (zh) * 2020-07-01 2020-11-13 西北工业大学 一种基于网络嵌入的社团结构识别方法及装置
CN112017669A (zh) * 2020-11-02 2020-12-01 鹏城实验室 语音对抗样本检测方法、装置、终端设备以及存储介质
CN112417219A (zh) * 2020-11-16 2021-02-26 吉林大学 基于超图卷积的超边链接预测方法
CN113222023A (zh) * 2021-05-17 2021-08-06 广州华多网络科技有限公司 数据关系重构方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114418012A (zh) * 2022-01-21 2022-04-29 建信金融科技有限责任公司 对象关联关系确定方法、装置、设备及计算机存储介质
CN114418012B (zh) * 2022-01-21 2024-08-23 建信金融科技有限责任公司 对象关联关系确定方法、装置、设备及计算机存储介质

Also Published As

Publication number Publication date
CN113886688B (zh) 2024-07-05

Similar Documents

Publication Publication Date Title
CN111414736B (zh) 故事生成模型训练方法、装置、设备及存储介质
CN110162604B (zh) 语句生成方法、装置、设备及存储介质
CN112100841A (zh) 盾构机姿态预测方法、装置、终端设备以及存储介质
CN111753498B (zh) 文本处理方法、装置、设备及存储介质
CN107678858A (zh) 应用处理方法、装置、存储介质及电子设备
CN115512005A (zh) 一种数据处理方法及其装置
CN112215227B (zh) 图像目标检测模型攻击方法、装置、终端设备及存储介质
CN111914180B (zh) 基于图结构的用户特征确定方法、装置、设备及介质
CN114549728A (zh) 图像处理模型的训练方法、图像处理方法、装置及介质
CN115171212A (zh) 手语识别方法、装置、设备及存储介质
CN114677350B (zh) 连接点提取方法、装置、计算机设备及存储介质
CN112883036A (zh) 索引创建方法、装置、存储服务器以及存储介质
CN111931842A (zh) 盾构机导向预测方法、模型训练方法、装置以及设备
CN112506904A (zh) 数据质量评估方法、装置、终端设备以及存储介质
CN111178515A (zh) 图神经网络的节点编码方法及节点编码终端、电子设备
CN114333774B (zh) 语音识别方法、装置、计算机设备及存储介质
CN113886688B (zh) 对象的关联关系预测方法、装置、终端设备以及存储介质
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质
CN111414737B (zh) 故事生成模型训练方法、装置、设备及存储介质
CN112200623A (zh) 产品推荐方法、装置、设备及存储介质
CN112150396A (zh) 高光谱图像降维方法、装置、终端设备及存储介质
CN113225234B (zh) 资产探测方法、装置、终端设备以及计算机可读存储介质
CN114610911B (zh) 多模态知识本征表示学习方法、装置、设备及存储介质
CN114252100B (zh) 传感器在线标定方法、装置、设备及存储介质
CN114972861A (zh) 对抗样本生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant