CN117725219A - 企业实体间关系预测方法、装置、存储介质及电子设备 - Google Patents
企业实体间关系预测方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117725219A CN117725219A CN202310598839.9A CN202310598839A CN117725219A CN 117725219 A CN117725219 A CN 117725219A CN 202310598839 A CN202310598839 A CN 202310598839A CN 117725219 A CN117725219 A CN 117725219A
- Authority
- CN
- China
- Prior art keywords
- path
- basic information
- target
- vector representation
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 239000013598 vector Substances 0.000 claims description 156
- 239000011159 matrix material Substances 0.000 claims description 40
- 238000012512 characterization method Methods 0.000 claims description 36
- 238000013528 artificial neural network Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 244000240602 cacao Species 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书公开了企业实体间关系预测方法、装置、存储介质及电子设备,其中,方法通过在知识图谱中获取的切片时序,输入预测模型判断两企业实体之间是否存在关联关系,相比现有技术考虑到了企业关系沿时间轴的依赖性,考虑到了时间维度,通过对不同企业实体在不同时间的关系进行分析,发现企业实体关系随时间变化的关系,根据该关系对企业实体关系进行预测,得到预测结果。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及企业实体间关系预测方法、装置、存储介质及电子设备。
背景技术
目前,由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈,导致现有的模型难以根据其变化预测其未来与其他企业的经营关系。
发明内容
本说明书提供了一种企业实体间关系预测方法、装置、存储介质及电子设备,所述技术方案如下:
第一方面,本说明书提供了一种企业实体间关系预测方法,所述方法包括:
从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片,所述知识图谱以多个企业实体为节点,以所述企业实体之间的关系为边建立,所述企业实体包括第一企业实体和第二企业实体;
从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为所述第一企业实体和所述第二企业实体之间的路径;
根据每个所述目标路径集合,确定路径向量表征;
根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;
根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
第二方面,本说明书提供了一种企业实体间关系预测装置,所述装置包括:
时间序列模块,用于从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片;
路径抽取模块,用于从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为第一企业实体和第二企业实体之间的路径;
路径向量模块,用于根据每个所述目标路径集合,确定路径向量表征;
基础向量模块,用于根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;
预测结果模块,用于根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
第三方面,本说明书提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本说明书提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
在本说明书一个或多个实施例中,通过在知识图谱中获取的切片时序,输入预测模型判断两企业实体之间是否存在关联关系,相比现有技术考虑到了企业关系沿时间轴的依赖性,考虑到了时间维度,通过对不同企业实体在不同时间的关系进行分析,发现企业实体关系随时间变化的关系,根据该关系对企业实体关系进行预测,可以解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题,使得企业实体的关系判断更加准确。
附图说明
为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种企业实体间关系预测系统的场景示意图。
图2是本说明书提供的一种企业实体间关系预测方法的流程示意图。
图3是根据图2对应实施例示出的企业实体间关系预测方法中步骤S300的一种具体实现流程图。
图4是根据图3对应实施例示出的企业实体间关系预测方法中步骤S400的一种具体实现流程图。
图5是根据图2对应实施例示出的企业实体间关系预测方法的模型结构示意图。
图6为本说明书提供的一种企业实体间关系预测装置的结构示意图。
图7是本说明书提供的一种电子设备的结构示意图;
图8是本说明书提供的操作系统和用户空间的结构示意图;
图9是图8中安卓操作系统的架构图;
图10是图8中IOS操作系统的架构图。
具体实施方式
下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
下面结合具体的实施例对本说明书进行详细说明。
请参见图1,为本说明书提供的一种企业实体间关系预测系统的场景示意图。如图1所示,所述企业实体间关系预测系统至少可以包括客户端集群和服务平台100。
所述客户端集群可以包括至少一个客户端,如图1所示,具体包括用户1对应的客户端1、用户2对应的客户端2、…、用户n对应的客户端n,n为大于0的整数。
客户端集群中的各客户端可以是具备通信功能的电子设备,该电子设备包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中电子设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的电子设备等。
所述服务平台100可以是单独的服务器设备,例如:机架式、刀片、塔式、或者机柜式的服务器设备,或采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是采用多个服务器组成的服务器集群,所述服务集群中的各服务器可以是以对称方式组成的,其中每台服务器在事务链路中功能等价、地位等价,各服务器均可单独对外提供服务,所述单独提供服务可以理解为无需另外的服务器的辅助。
在本说明书的一个或多个实施例中,服务平台100与客户端集群中的至少一个客户端可建立通信连接,基于该通信连接完成企业实体间关系预测过程中数据的交互,诸如线上事务数据交互,事务数据包括但不限于各种类型的知识图谱数据交互,具体事务服务类型基于实际应用情况确定。
如服务平台100可基于本说明书的企业实体间关系预测方法得到的企业关系可实现向客户端进行数据筛选;又如,服务平台100可从客户端上获取训练数据。
需要说明的是,服务平台100与客户端集群中的至少一个客户端通过网络建立通信连接进行交互通信,其中,网络可以是无线网络,也可以是有线网络,无线网络包括但不限于蜂窝网络、无线局域网、红外网络或蓝牙网络,有线网络包括但不限于以太网、通用串行总线(universal serial bus,USB)或控制器局域网络。在说明书一个或多个实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据(如目标压缩包)。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
本说明书所提供的企业实体间关系预测系统实施例与一个或多个实施例中的所述企业实体间关系预测方法属于同一构思,在说明书一个或多个实施例涉及的所述企业实体间关系预测方法对应的执行主体可以是上述服务平台100;在说明书一个或多个实施例涉及的所述企业实体间关系预测方法对应的执行主体也可以是客户端所对应的电子设备,具体基于实际应用环境确定。企业实体间关系预测系统实施例其体现实现过程可详见下述的方法实施例,这里不再赘述。
基于图1所示的场景示意图,下面对本说明书一个或多个实施例提供的企业实体间关系预测方法进行详细介绍。
请参见图2,为本说明书一个或多个实施例提供了一种企业实体间关系预测方法的流程示意图,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的企业实体间关系预测装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。所述企业实体间关系预测装置可以为服务平台。
具体的,该企业实体间关系预测方法包括:
步骤S100,从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片,所述知识图谱以多个企业实体为节点,以所述企业实体之间的关系为边建立,所述企业实体包括第一企业实体和第二企业实体。
步骤S200,从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为所述第一企业实体和所述第二企业实体之间的路径。
步骤S300,根据每个所述目标路径集合,确定路径向量表征。
步骤S400,根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息。
步骤S500,根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
在本说明书的实施例中,通过在知识图谱中获取的切片时序,输入预测模型判断两企业实体之间在目标时间是否存在直接的关联关系,相比现有技术考虑到了企业关系沿时间轴的依赖性,考虑到了时间维度,通过对不同企业实体在不同时间的关系进行分析,发现企业实体关系随时间变化的关系,根据该关系对企业实体关系进行预测,可以解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题,使得企业实体的关系判断更加准确。
在此,需要说明的是,沿时间轴的依赖性的含义为,将两企业实体按照时间顺序构成的时间序列之间的相关性,如在t1时刻的知识图谱中,A和B两个企业实体间的路径为P1 A,B,在t2,…,tT时刻的知识图谱中的路径分别为P2 A,B,…,PT A,B,沿时间轴的依赖性即P1 A,B,P2 A,B,…,PT A,B所按照时间顺序构成的时间序列之间的相关性。彼此间的协同相关性的含义为在在同一时间,目标路径集合中各目标路径之间的相关性。
本说明书即旨在预测未来时间T+1时图谱中两企业实体间的关系(链接预测),与此同时,不同历史时间下两企业实体间的路径又对于反映两企业实体间的潜在关联性具有重要作用。因此,一方面,放眼全局,刻画这些路径在历史时间上的相关性,有助于理解两企业实体间随时间变化的特征;另一方面,聚焦局部,同一时间连接两企业实体间的路径之间亦有相互影响。进而,如缺乏对这些重要的特征的有效建模,将丢失非常有价值的隐藏信息,严重降低预测效果。
具体地,在指定需要判断关系的两个企业实体后,通过抽取来自知识图谱的切片时序中各时间切片的两个企业实体之间的目标路经后,进行向量化表征,得到路径向量表征,该路径向量表征包含有来自知识图谱的路径信息和搭载在目标路径上的各种信息,例如行业信息、地理位置信息等。需要说明的是,路径向量表征是由各时间切片中的路径得出的,其本身是带有时间维度的,即其上所承载的路径信息是具有时间维度的,路径上搭载的各种信息也具有时间维度。同时,收集两个企业实体的基础信息,即第一基础信息和第二基础信息,对该基础信息进行向量化表征,得到基础信息向量表征,该基础信息向量表征包含有两企业实体的各种基础信息,例如名称、法人、规模、行业、地址等。最后对路径向量表征和基础信息向量表征进行分析,即对带有时间维度的路径信息、路径上搭载带有时间维度的信息以及基础信息进行分析,得到最终的预测结果。该预测结果是综合考虑的两个企业实体之间路径信息以及搭载在路径上的各种信息随时间变化的过程以及两个企业实体的基础信息后,得出的结果,其不仅考虑到了多维度因素随时间变化的过程,能够很好地解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题。还由于考虑到了多种维度因素,使得企业关系的变化能够较为准确地被把握,提高了预测结果的准确性。
在步骤S100中,切片时序包含多个预定时间切片,其按照时间顺序排列,形成一个时间序列。预定时间切片为在预定时间范围内的时间切片,时间切片的选取可以是任意的,其只要是在预定时间范围内的时间切片,都可以作为预定时间切片,时间切片的排列不需要严格按照时间等距排列。
例如,在一个实施例中,预定时间范围为T0∈[T-8,T],则其所取的时间切片可以为T-6、T-5、T-4、T-2、T五个时间的时间切片,其不一定必须抽取T-4、T-3、T-2、T-1、T五个时间的时间切片。
时间切片的预定时间范围可以根据实际情况确定,其也和目标时间相关。在一些实施例中,预定时间范围一般表示为T0∈[T-(τ-1),T],目标时间一般可以对应表示为T1=T+1,即在本说明书的实施例中,是通过处于T-(τ-1)至T这个时间范围内的时间切片,预测T+1时间的两企业实体之间的关系,该T+1时间可以是未来的时间。
在上述实施例中,可以通过调整系数τ的大小调整预定时间范围,预定时间范围越宽,预定时间切片越多,预测结果也就越好越准确。
上述的知识图谱以多个企业实体为节点,以所述企业实体之间的关系为边建立,上述的企业实体包括第一企业实体和第二企业实体。
在一些实施例中,知识图谱不仅仅以企业实体为节点,其还可以以自然人实体、地理位置实体以及行业实体等实体要素为节点,则其边就不仅包括企业实体之间的关系,还可以包括企业实体与自然人实体之间的关系、企业实体与行业实体之间的关系、企业实体与地理位置实体之间的关系、自然人实体与地理位置实体之间的关系、自然人实体与自然人实体之间的关系、行业实体与行业实体之间的关系、地理位置实体与地理位置实体之间的关系。
在步骤S200中,在预定时间切片中分别抽取第一企业实体和所述第二企业实体之间的路径,即目标路径。每个时间切片中抽取的目标路径数量一般不大于预定路径数量,以避免计算量过大,而效果提升不明显。将目标路径按照其来自的时间切片(也可以认为是按照时间)聚合在一起,即得到目标路径集合。
需要说明的是,抽取路径时,路径可以经过任意节点,该节点不一定必须是企业实体,也可以是其他类型的节点。
具体的,在一些实施例中,步骤S200的具体实施方式可以参阅如下实施例。本实施例是根据图2对应实施例示出的企业实体间关系预测方法中步骤S200的细节描述,所述企业实体间关系预测方法中,步骤S200可以包括以下步骤:
抽取所述时间切片中所有的目标路径;
选取预定数量个所述目标路径,形成所述目标路径集合。
在本说明书的实施例中,先在时间切片中抽取所有目标路径,再在所有目标路径中选取预定数量个目标路径,形成该时间切片对应的目标路径集合。
具体地,在选择目标路径时,可以根据各目标路径的跃点数选取最短的几个目标路径形成目标路径集合,目标路径的跃点数越大,该目标路径越长。
在步骤S300中,每个目标路径集合中所包含的目标路径都是最短的几个目标路径,同时每个目标路径集合又对应着时间切片,其具有时间属性。因此,可以在时间维度上分析目标路径的变化规律,形成具有考虑到历史相关性的路径向量表征。
具体的,在一些实施例中,步骤S300的具体实施方式可以参阅图3。图3是根据图2对应实施例示出的企业实体间关系预测方法中步骤S300的细节描述,所述企业实体间关系预测方法中,步骤S300可以包括以下步骤:
步骤S310,根据每个所述目标路径集合,确定对应的输出矩阵。
步骤S320,将每个所述输出矩阵逐个输入长短期记忆网络,得到路径向量表征。
在本说明书的实施例中,先根据每个目标路径集合确定其对应的输出矩阵,然后将输出矩阵按照时间顺序逐个输入长短期记忆网络,得到路径向量表征。
在步骤S310中,对目标路径集合进行向量化处理和精细化映射,得到对应的输出矩阵,以便进行进一步的处理。
具体的,在一些实施例中,步骤S310的具体实施方式可以参阅如下实施例。如下实施例是根据图3对应实施例示出的企业实体间关系预测方法中步骤S310的细节描述,所述企业实体间关系预测方法中,步骤S310可以包括以下步骤:
对每个所述目标路径集合进行嵌入式编码,得到对应的嵌入矩阵。
将每个所述嵌入矩阵分别输入多头自注意力网络,得到对应的输出矩阵。
在本说明书的实施例中,先对每个目标路径集合进行嵌入式编码,将目标集合路径向量化,得到嵌入矩阵,每个嵌入矩阵均对应一个目标路径集合,即对应一个时间切片。再将嵌入矩阵分别输入多头自注意力网络,由多头自注意力网络分别进行计算,得到对应的输出矩阵。
具体地,在进行嵌入式编码时,可以采用Doc2Vec的方式,即将目标路径集合中的各目标路径分别输入到Doc2Vec模型中,由Doc2Vec模型输出各目标路径对应的嵌入式向量,将各目标路径的嵌入式向量排列在一起,即得到嵌入矩阵。该嵌入矩阵为K*d维矩阵,其中,K为目标路径的条数,d为各目标路径对应的嵌入式向量的向量维度。该嵌入矩阵与时间切片具有关联,每个嵌入矩阵均表示了一个时间内的两企业实体之间的路径关系。
在将嵌入矩阵输入多头自注意力网络后,通过多头自注意力网络学习同一时间窗口下不同序列之间的相关性,得到输出矩阵。
多头自注意力网络包含多个自注意力网络,将嵌入矩阵分别输入多个自注意力网络后,每一头自注意力网络均会对嵌入矩阵进行独立的处理,得到对应的自注意力结果。当各头自注意力网络均输出各自的自注意力结果后,将所有的自注意力结果结合在一起进行加总计算,即得到输出矩阵。该输出矩阵仍为K*d维矩阵,其中,K为目标路径的条数,d为各目标路径对应的嵌入式向量的向量维度。本说明书实施例中,注意力网络可以多头并行计算,使模型推理更高效。
需要说明的是,由于嵌入矩阵有多个,每一个嵌入矩阵都会被多头自注意力网络单独处理,得到输出矩阵。该输出矩阵包含同一时间窗口下不同路径序列之间的相关性信息。
在步骤S320中,将输出矩阵按照时间顺序输入长短期记忆网络,长短期记忆神经网络学习这些输出矩阵在历史事件窗口内随时间的变化规律,得到路径向量表征,最终实现对从知识图谱中挖掘到的多视图关系序列进行多元关系的协同演化学习,其得到的路径向量表征为d维的向量,其向量维度与各目标路径对应的嵌入式向量的向量维度相同。
在步骤S400中,对两企业实体的基础信息,即第一基础信息和第二基础信息,进行分析,得到基础信息向量表征。
需要说明的是,步骤S400既可以与步骤S100~S300中的任意一步同步执行,也可以与上述步骤异步执行,其既可以先于步骤S100执行,也可以后于步骤S300执行,本说明书在此不做限定。
具体的,在一些实施例中,步骤S400的具体实施方式可以参阅图4。图4是根据图2对应实施例示出的企业实体间关系预测方法中步骤S400的细节描述,所述企业实体间关系预测方法中,步骤S400可以包括以下步骤:
步骤S410,分别对所述第一基础信息和第二基础信息进行编码,得到第一编码信息和第二编码信息。
步骤S420,将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征。
在本说明书的实施例中,先对基础信息编码得到编码信息,以便深度神经网络进行运算,然后通过深度神经网络得到基础信息向量表征。
在步骤S410中,对基础信息(包括第一基础信息和第二基础信息)的编码方式可以是通过one-hot编码实现,将基础信息都转化为二进制特征,得到机器学习模型易于利用的编码信息(包括第一编码信息和第二编码信息)。
在步骤S420中,将编码后的第一编码信息和第二编码信息输入深度神经网络,由深度神经网络进行分析,得到基础信息向量表征。该基础信息向量表征为d维的向量,其包含多个维度的基础信息,例如第一企业实体的位置、规模、所处行业等,以及第二企业实体的位置、规模、所处行业等。
具体的,在一些实施例中,步骤S420的具体实施方式可以参阅如下实施例。本实施例是根据图4对应实施例示出的企业实体间关系预测方法中步骤S420的细节描述,所述企业实体间关系预测方法中,步骤S420可以包括以下步骤:
将所述第一编码信息和所述第二编码信息拼接,得到拼接编码信息;
将所述拼接编码信息输入深度神经网络,得到所述基础信息向量表征。
在本说明书的实施例中,先将第一编码信息和第二编码信息拼接在一起,形成一个编码信息,即拼接编码信息。将该拼接编码信息输入深度神经网络,利用深度神经网络对两个企业实体的基础信息进行深度编码并作为基础信息特征,得到基础信息向量表征。
在步骤S500中,对路径向量表征和基础信息向量表征进行融合,最后实现对企业间供应链关系的精准预测。
具体的,在一些实施例中,步骤S500的具体实施方式可以参阅如下实施例。本实施例是根据图2对应实施例示出的企业实体间关系预测方法中步骤S500的细节描述,所述企业实体间关系预测方法中,步骤S500可以包括以下步骤:
将所述路径向量表征和所述基础信息向量表征进行拼接,得到拼接向量表征。
将所述拼接向量表征输入多层感知器网络,得到预测结果。
在本说明书的实施例中,先将路径向量表征和基础信息向量表征拼接融合为一个拼接向量表征,然后将该拼接向量表征输入多层感知器网络,得到预测结果,该预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系,实现对企业间供应链关系的精准预测。
在本说明书中,请参阅图5,输入多层感知器网络的路径向量表征可以有多个,在其中一个实施例中,路径向量表征包括一般路径向量表征和位置路径向量表征,其分别由一般目标路径和位置目标路径得到,即在本说明书中,目标路径也可以有多个。
具体的,在一些实施例中,步骤S300的具体实施方式可以参阅如下实施例。本实施例是根据图2对应实施例示出的企业实体间关系预测方法中步骤S300的细节描述,所述企业实体间关系预测方法中,所述目标路径包括一般目标路径和位置目标路径,所述目标路径集合包括一般目标路径集合和位置目标路径集合,所述路径向量表征包括一般路径向量表征和位置路径向量表征,步骤S300可以包括以下步骤:
根据每个所述一般目标路径集合,确定一般路径向量表征。
根据每个所述位置目标路径集合,确定位置路径向量表征。
在本实施例中,在执行步骤S200抽取目标路径时,可以从一个时间切片中分别抽取到一般目标路径和位置目标路径两个目标路径,分别形成一般目标路径集合和位置目标路径集合。
需要说明的是,一般目标路径仅包含路径信息,位置目标路径不仅包含路径信息还包含位置信息,其是以实体路径为载体,附带有位置信息的一种带有位置信息的路径。
然后在步骤S300确定路径向量表征时,根据每个一般目标路径集合,确定一般路径向量表征,根据每个位置目标路径集合,确定位置路径向量表征。
一般路径向量表征由一般目标路径得到,其用于实现同时从知识图谱本体语义层对中小微企业实体路径的挖掘。位置路径向量表征由位置目标路径得到,用于针对中小微企业的地理供应链分布关系实现了有效建模,现有方案中鲜有对中小微企业的地理位置分布规律进行深入建模,而本实施例通过抽取位置目标路径后进行建模分析,有效利用了位置信息。地理位置在一定程度上也能影响到企业实体之间的关系,两个企业之间的地理位置越近,产生关系的可能性也就越大。单纯基于知识图谱的路径与预测企业实体间的关系通常所发挥出的性能是不足够的,因为企业间的是否具有供应链关系链接与他们各自所处的地理位置信息也是息息相关的。因此,路径中企业实体的地理位置分布关系同样应在被建模中考虑。然而,既有的基于知识图谱的链接预测方案均忽略了对此类信息的有效利用。
可以理解地,上述企业实体间关系预测方案可以打包形成一个企业实体间关系预测模型,该预测模型可以执行上述实施例的方法步骤对任意两个位于知识图谱中的企业之间的关系进行预测。
在一个实施例中,该预测模型的训练方法,或者说,上述企业实体间关系预测方法中使用到的各种神经网络(多头自注意力网络、长短记忆网络以及多层感知网络等)的训练方法采用时间序列和窗口滑移结合的方式进行。
即在预测模型的应用阶段,是通过处于T-(τ-1)至T这个时间范围内的时间切片,预测T+1时间的两企业实体之间的关系;则在预测模型的训练阶段,可以通过处于T-τ至T-1这个时间范围内的时间切片,预测T时间的两企业实体之间的关系,通过处于T-(τ+1)至T-2这个时间范围内的时间切片,预测T-1时间的两企业实体之间的关系,T时间和T-1时间都是有对应的时间切片,在该时间下两企业实体之间的关系是已知的,可以作为样本标签,与预测结果进行对比计算出损失函数。然后根据损失函数对预测模型进行参数更新,亦即对预测模型中多头自注意力网络、长短记忆网络以及多层感知网络等各种神经网络进行参数更新,直至损失函数收敛或者小于预定损失阈值(一般为0.001)。
其中,上述的损失函数的计算可以采用如下公式:
其中,Lclass为损失函数,t为样本目标时间,为在样本目标时间t的真实结果,为在样本目标时间t的预测结果,R+为正实体样本对,其包括的两个企业实体在样本目标时间t下有直接关系,R-为负样本对,其包括的两个企业实体在样本目标时间t下没有直接关系。
在另一个实施例中,该预测模型的训练方法,或者说,上述企业实体间关系预测方法中使用到的各种神经网络(多头自注意力网络、长短记忆网络以及多层感知网络等)的训练方法包括:
获取实体样本对集,该实体样本对集中包含多个实体样本对,每个实体样本对均包括两个企业实体,即第一企业实体和第二企业实体。实体样本对分为正实体样本对和负实体样本对,每个实体样本对上均标记有关系标签,正实体样本对上的关系标签包括两个企业实体在样本目标时间下有直接关系,负实体样本对上的关系标签包括两个企业实体在样本目标时间下没有直接关系,该样本时间是上述的知识图谱中某一时间切片对应的时间。
将所述实体样本对输入预测模型,预测模型执行图2至5所示实施例的方法得到预测结果,该预测结果包括该实体样本对中两企业实体在样本目标时间是否有直接关系。
如果该实体样本对集中只有不超过预定比例的正实体样本对输入到预测模型后得到两个企业实体在样本目标时间下有直接关系的结果,或者只有不超过预定比例的负实体样本对输入到预测模型后得到两个企业实体在样本目标时间下没有直接关系的结果,则调整所述预测模型的系数,即调整预测模型中多头自注意力网络、长短记忆网络以及多层感知网络等各种神经网络的系数。
如果该实体样本对集中有超过预定比例的正实体样本对输入到预测模型后得到两个企业实体在样本目标时间下有直接关系的结果,且有超过预定比例的负实体样本对输入到预测模型后得到两个企业实体在样本目标时间下没有直接关系的结果,则训练结束。
下面将结合图6,对本说明书提供的企业实体间关系预测装置进行详细介绍。需要说明的是,图6所示的企业实体间关系预测装置,用于执行本说明书图1~图5所示实施例的方法,为了便于说明,仅示出了与本说明书相关的部分,具体技术细节未揭示的,请参照本说明书图1~图5所示的实施例。
请参见图6,其示出本说明书的企业实体间关系预测装置的结构示意图。该企业实体间关系预测装置600可以通过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该企业实体间关系预测装置600包括时间序列模块610、路径抽取模块620、路径向量模块630、基础向量模块640、预测结果模块650,具体用于:
时间序列模块610,用于从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片;
路径抽取模块620,用于从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为第一企业实体和第二企业实体之间的路径;
路径向量模块630,用于根据每个所述目标路径集合,确定路径向量表征;
基础向量模块640,用于根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;
预测结果模块650,用于根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
在一个实施例中,所述目标路径包括一般目标路径和位置目标路径,所述目标路径集合包括一般目标路径集合和位置目标路径集合,所述路径向量表征包括一般路径向量表征和位置路径向量表征,路径向量模块630具体包括:一般路径子模块,用于根据每个所述一般目标路径集合,确定一般路径向量表征;位置路径子模块,用于根据每个所述位置目标路径集合,确定位置路径向量表征。
在一个实施例中,路径向量模块630具体包括:路径编码子模块,用于根据每个所述目标路径集合,确定对应的输出矩阵;路径表征子模块,用于将每个所述输出矩阵逐个输入长短期记忆网络,得到路径向量表征。
在一个实施例中,所述路径编码子模块具体包括:嵌入矩阵单元,用于对每个所述目标路径集合进行嵌入式编码,得到对应的嵌入矩阵;输出矩阵单元,用于将每个所述嵌入矩阵分别输入多头自注意力网络,得到对应的输出矩阵。
在一个实施例中,路径抽取模块620具体包括:路径抽取子模块,用于抽取所述时间切片中所有的目标路径;路径筛选子模块,用于选取预定数量个所述目标路径,形成所述目标路径集合。
在一个实施例中,基础向量模块640具体包括:基础编码子模块,用于分别对所述第一基础信息和第二基础信息进行编码,得到第一编码信息和第二编码信息;基础表征子模块,用于将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征。
在一个实施例中,所述基础表征子模块具体包括:编码拼接单元,用于将所述第一编码信息和所述第二编码信息拼接,得到拼接编码信息;基础表征单元,用于将所述拼接编码信息输入深度神经网络,得到所述基础信息向量表征。
在一个实施例中,预测结果模块650具体包括:向量拼接子模块,用于将所述路径向量表征和所述基础信息向量表征进行拼接,得到拼接向量表征;结果预测子模块,用于将所述拼接向量表征输入多层感知器网络,得到预测结果。
需要说明的是,上述实施例提供的企业实体间关系预测装置在执行企业实体间关系预测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的企业实体间关系预测装置与企业实体间关系预测方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本说明书序号仅仅为了描述,不代表实施例的优劣。
在本说明书中,通过在知识图谱中获取的切片时序,输入预测模型判断两企业实体之间在目标时间是否存在直接的关联关系,相比现有技术考虑到了企业关系沿时间轴的依赖性,考虑到了时间维度,通过对不同企业实体在不同时间的关系进行分析,发现企业实体关系随时间变化的关系,根据该关系对企业实体关系进行预测,可以解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题,使得企业实体的关系判断更加准确。
具体地,在指定需要判断关系的两个企业实体后,通过抽取来自知识图谱的切片时序中各时间切片的两个企业实体之间的目标路经后,进行向量化表征,得到路径向量表征,该路径向量表征包含有来自知识图谱的路径信息和搭载在目标路径上的各种信息,例如行业信息、地理位置信息等。需要说明的是,路径向量表征是由各时间切片中的路径得出的,其本身是带有时间维度的,即其上所承载的路径信息是具有时间维度的,路径上搭载的各种信息也具有时间维度。同时,收集两个企业实体的基础信息,即第一基础信息和第二基础信息,对该基础信息进行向量化表征,得到基础信息向量表征,该基础信息向量表征包含有两企业实体的各种基础信息,例如名称、法人、规模、行业、地址等。最后对路径向量表征和基础信息向量表征进行分析,即对带有时间维度的路径信息、路径上搭载带有时间维度的信息以及基础信息进行分析,得到最终的预测结果。该预测结果是综合考虑的两个企业实体之间路径信息以及搭载在路径上的各种信息随时间变化的过程以及两个企业实体的基础信息后,得出的结果,其不仅考虑到了多维度因素随时间变化的过程,能够很好地解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题。还由于考虑到了多种维度因素,使得企业关系的变化能够较为准确地被把握,提高了预测结果的准确性。
本说明书还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图5所示实施例的所述企业实体间关系预测方法,具体执行过程可以参见图1~图5所示实施例的具体说明,在此不进行赘述。
本说明书还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图5所示实施例的所述企业实体间关系预测方法,具体执行过程可以参见图1~图5所示实施例的具体说明,在此不进行赘述。
请参考图7,其示出了本说明书一个示例性实施例提供的电子设备的结构方框图。本说明书中的电子设备可以包括一个或多个如下部件:处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。
处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。在一个实施例中,处理器110可以采用数字信号处理(digital signal processing,DSP)、现场可编程门阵列(field-programmable gate array,FPGA)、可编程逻辑阵列(programmable logic Array,PLA)中的至少一种硬件形式来实现。处理器110可集成中心处理器(central processing unit,CPU)、图像处理器(graphics processing unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(random Access Memory,RAM),也可以包括只读存储器(read-only memory,ROM)。在一个实施例中,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等,该操作系统可以是安卓(Android)系统,包括基于Android系统深度开发的系统、苹果公司开发的IOS系统,包括基于IOS系统深度开发的系统或其它系统。存储数据区还可以存储电子设备在使用中所创建的数据比如电话本、音视频数据、聊天记录数据,等。
参见图8所示,存储器120可分为操作系统空间和用户空间,操作系统即运行于操作系统空间,原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果,操作系统针对不同第三方应用程序为其分配相应的系统资源。然而,同一第三方应用程序中不同应用场景对系统资源的需求也存在差异,比如,在本地资源加载场景下,第三方应用程序对磁盘读取速度的要求较高;在动画渲染场景下,第三方应用程序则对GPU性能的要求较高。而操作系统与第三方应用程序之间相互独立,操作系统往往不能及时感知第三方应用程序当前的应用场景,导致操作系统无法根据第三方应用程序的具体应用场景进行针对性的系统资源适配。
为了使操作系统能够区分第三方应用程序的具体应用场景,需要打通第三方应用程序与操作系统之间的数据通信,使得操作系统能够随时获取第三方应用程序当前的场景信息,进而基于当前场景进行针对性的系统资源适配。
以操作系统为Android系统为例,存储器120中存储的程序和数据如图9所示,存储器120中可存储有Linux内核层320、系统运行时库层340、应用框架层360和应用层380,其中,Linux内核层320、系统运行库层340和应用框架层360属于操作系统空间,应用层380属于用户空间。Linux内核层320为电子设备的各种硬件提供了底层的驱动,如显示驱动、音频驱动、摄像头驱动、蓝牙驱动、Wi-Fi驱动、电源管理等。系统运行库层340通过一些C/C++库来为Android系统提供了主要的特性支持。如SQLite库提供了数据库的支持,OpenGL/ES库提供了3D绘图的支持,Webkit库提供了浏览器内核的支持等。在系统运行时库层340中还提供有安卓运行时库(Android runtime),它主要提供了一些核心库,能够允许开发者使用Java语言来编写Android应用。应用框架层360提供了构建应用程序时可能用到的各种API,开发者也可以通过使用这些API来构建自己的应用程序,比如活动管理、窗口管理、视图管理、通知管理、内容提供者、包管理、通话管理、资源管理、定位管理。应用层380中运行有至少一个应用程序,这些应用程序可以是操作系统自带的原生应用程序,比如联系人程序、短信程序、时钟程序、相机应用等;也可以是第三方开发者所开发的第三方应用程序,比如游戏类应用程序、即时通信程序、相片美化程序等。
以操作系统为IOS系统为例,存储器120中存储的程序和数据如图10所示,IOS系统包括:核心操作系统层420(Core OS layer)、核心服务层440(Core Services layer)、媒体层460(Media layer)、可触摸层480(Cocoa Touch Layer)。核心操作系统层420包括了操作系统内核、驱动程序以及底层程序框架,这些底层程序框架提供更接近硬件的功能,以供位于核心服务层440的程序框架所使用。核心服务层440提供给应用程序所需要的系统服务和/或程序框架,比如基础(Foundation)框架、账户框架、广告框架、数据存储框架、网络连接框架、地理位置框架、运动框架等等。媒体层460为应用程序提供有关视听方面的接口,如图形图像相关的接口、音频技术相关的接口、视频技术相关的接口、音视频传输技术的无线播放(AirPlay)接口等。可触摸层480为应用程序开发提供了各种常用的界面相关的框架,可触摸层480负责用户在电子设备上的触摸交互操作。比如本地通知服务、远程推送服务、广告框架、游戏工具框架、消息用户界面接口(User Interface,UI)框架、用户界面UIKit框架、地图框架等等。
在图10所示出的框架中,与大部分应用程序有关的框架包括但不限于:核心服务层440中的基础框架和可触摸层480中的UIKit框架。基础框架提供许多基本的对象类和数据类型,为所有应用程序提供最基本的系统服务,和UI无关。而UIKit框架提供的类是基础的UI类库,用于创建基于触摸的用户界面,iOS应用程序可以基于UIKit框架来提供UI,所以它提供了应用程序的基础架构,用于构建用户界面,绘图、处理和用户交互事件,响应手势等等。
其中,在IOS系统中实现第三方应用程序与操作系统数据通信的方式以及原理可参考Android系统,本说明书在此不再赘述。
其中,输入装置130用于接收输入的指令或数据,输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据,输出装置140包括但不限于显示设备和扬声器等。在一个示例中,输入装置130和输出装置140可以合设,输入装置130和输出装置140为触摸显示屏,该触摸显示屏用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作,以及显示各个应用程序的用户界面。触摸显示屏通常设置在电子设备的前面板。触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合,本说明书对此不加以限定。
除此之外,本领域技术人员可以理解,上述附图所示出的电子设备的结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,电子设备中还包括射频电路、输入单元、传感器、音频电路、无线保真(wireless fidelity,WiFi)模块、电源、蓝牙模块等部件,在此不再赘述。
在本说明书中,各步骤的执行主体可以是上文介绍的电子设备。在一个实施例中,各步骤的执行主体为电子设备的操作系统。操作系统可以是安卓系统,也可以是IOS系统,或者其它操作系统,本说明书对此不作限定。
本说明书的电子设备,其上还可以安装有显示设备,显示设备可以是各种能实现显示功能的设备,例如:阴极射线管显示器(cathode ray tubedisplay,简称CR)、发光二极管显示器(light-emitting diode display,简称LED)、电子墨水屏、液晶显示屏(liquidcrystal display,简称LCD)、等离子显示面板(plasma display panel,简称PDP)等。用户可以利用电子设备101上的显示设备,来查看显示的文字、图像、视频等信息。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
在图7所示的电子设备中,其中电子设备可以是一种终端,处理器110可以用于调用存储器120中存储的网络优化应用程序,并具体执行以下操作:从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片,所述知识图谱以多个企业实体为节点,以所述企业实体之间的关系为边建立,所述企业实体包括第一企业实体和第二企业实体;从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为所述第一企业实体和所述第二企业实体之间的路径;根据每个所述目标路径集合,确定路径向量表征;根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
在一个实施例中,所述目标路径包括一般目标路径和位置目标路径,所述目标路径集合包括一般目标路径集合和位置目标路径集合,所述路径向量表征包括一般路径向量表征和位置路径向量表征;处理器110在执行根据每个所述目标路径集合,确定路径向量表征时,具体执行以下操作:根据每个所述一般目标路径集合,确定一般路径向量表征;根据每个所述位置目标路径集合,确定位置路径向量表征。
在一个实施例中,处理器110在执行根据每个所述目标路径集合,确定路径向量表征时,具体执行以下操作:根据每个所述目标路径集合,确定对应的输出矩阵;将每个所述输出矩阵逐个输入长短期记忆网络,得到路径向量表征。
在一个实施例中,处理器110在执行根据每个所述目标路径集合,确定对应的输出矩阵时,具体执行以下操作:对每个所述目标路径集合进行嵌入式编码,得到对应的嵌入矩阵;将每个所述嵌入矩阵分别输入多头自注意力网络,得到对应的输出矩阵。
在一个实施例中,处理器110在执行从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合时,具体执行以下操作:抽取所述时间切片中所有的目标路径;选取预定数量个所述目标路径,形成所述目标路径集合。
在一个实施例中,所述处理器110在执行根据第一基础信息和第二基础信息,得到基础信息向量表征时,具体执行以下操作:
分别对所述第一基础信息和第二基础信息进行编码,得到第一编码信息和第二编码信息;
将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征。
在一个实施例中,处理器110在执行将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征时,具体执行以下操作:将所述第一编码信息和所述第二编码信息拼接,得到拼接编码信息;将所述拼接编码信息输入深度神经网络,得到所述基础信息向量表征。
在一个实施例中,处理器110在执行根据所述路径向量表征和所述基础信息向量表征,得到预测结果时,具体执行以下操作:将所述路径向量表征和所述基础信息向量表征进行拼接,得到拼接向量表征;将所述拼接向量表征输入多层感知器网络,得到预测结果。
在本说明书中,通过在知识图谱中获取的切片时序,输入预测模型判断两企业实体之间在目标时间是否存在直接的关联关系,相比现有技术考虑到了企业关系沿时间轴的依赖性,考虑到了时间维度,通过对不同企业实体在不同时间的关系进行分析,发现企业实体关系随时间变化的关系,根据该关系对企业实体关系进行预测,可以解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题,使得企业实体的关系判断更加准确。
具体地,在指定需要判断关系的两个企业实体后,通过抽取来自知识图谱的切片时序中各时间切片的两个企业实体之间的目标路经后,进行向量化表征,得到路径向量表征,该路径向量表征包含有来自知识图谱的路径信息和搭载在目标路径上的各种信息,例如行业信息、地理位置信息等。需要说明的是,路径向量表征是由各时间切片中的路径得出的,其本身是带有时间维度的,即其上所承载的路径信息是具有时间维度的,路径上搭载的各种信息也具有时间维度。同时,收集两个企业实体的基础信息,即第一基础信息和第二基础信息,对该基础信息进行向量化表征,得到基础信息向量表征,该基础信息向量表征包含有两企业实体的各种基础信息,例如名称、法人、规模、行业、地址等。最后对路径向量表征和基础信息向量表征进行分析,即对带有时间维度的路径信息、路径上搭载带有时间维度的信息以及基础信息进行分析,得到最终的预测结果。该预测结果是综合考虑的两个企业实体之间路径信息以及搭载在路径上的各种信息随时间变化的过程以及两个企业实体的基础信息后,得出的结果,其不仅考虑到了多维度因素随时间变化的过程,能够很好地解决由于中小微企业经营不确定性极强,其间的经营关系随时间变化快而且剧烈而导致的模型难以根据其变化预测其未来与其他企业的经营关系的问题。还由于考虑到了多种维度因素,使得企业关系的变化能够较为准确地被把握,提高了预测结果的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的对象特征、交互行为特征以及用户信息等都是在充分授权的情况下获取的。
以上所揭露的仅为本说明书较佳实施例而已,当然不能以此来限定本说明书之权利范围,因此依本说明书权利要求所作的等同变化,仍属本说明书所涵盖的范围。
Claims (12)
1.一种企业实体间关系预测方法,所述方法包括:
从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片,所述知识图谱以多个企业实体为节点,以所述企业实体之间的关系为边建立,所述企业实体包括第一企业实体和第二企业实体;
从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为所述第一企业实体和所述第二企业实体之间的路径;
根据每个所述目标路径集合,确定路径向量表征;
根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;
根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
2.如权利要求1所述的方法,所述目标路径包括一般目标路径和位置目标路径,所述目标路径集合包括一般目标路径集合和位置目标路径集合,所述路径向量表征包括一般路径向量表征和位置路径向量表征;
所述根据每个所述目标路径集合,确定路径向量表征,具体包括:
根据每个所述一般目标路径集合,确定一般路径向量表征;
根据每个所述位置目标路径集合,确定位置路径向量表征。
3.根据权利要求1所述的方法,所述根据每个所述目标路径集合,确定路径向量表征,具体包括:
根据每个所述目标路径集合,确定对应的输出矩阵;
将每个所述输出矩阵逐个输入长短期记忆网络,得到路径向量表征。
4.根据权利要求3所述的方法,所述根据每个所述目标路径集合,确定对应的输出矩阵,具体包括:
对每个所述目标路径集合进行嵌入式编码,得到对应的嵌入矩阵;
将每个所述嵌入矩阵分别输入多头自注意力网络,得到对应的输出矩阵。
5.根据权利要求1所述的方法,所述从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,具体包括:
抽取所述时间切片中所有的目标路径;
选取预定数量个所述目标路径,形成所述目标路径集合。
6.根据权利要求1所述的方法,所述根据第一基础信息和第二基础信息,得到基础信息向量表征,具体包括:
分别对所述第一基础信息和第二基础信息进行编码,得到第一编码信息和第二编码信息;
将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征。
7.根据权利要求6所述的方法,所述将所述第一编码信息和第二编码信息输入深度神经网络,得到所述基础信息向量表征,具体包括:
将所述第一编码信息和所述第二编码信息拼接,得到拼接编码信息;
将所述拼接编码信息输入深度神经网络,得到所述基础信息向量表征。
8.如权利要求1所述的方法,所述根据所述路径向量表征和所述基础信息向量表征,得到预测结果,具体包括:
将所述路径向量表征和所述基础信息向量表征进行拼接,得到拼接向量表征;
将所述拼接向量表征输入多层感知器网络,得到预测结果。
9.一种企业实体间关系预测装置,所述装置包括:
时间序列模块,用于从知识图谱中获取切片时序,所述切片时序包含多个预定时间切片,所述预定时间切片为在预定时间范围内的时间切片;
路径抽取模块,用于从每个所述预定时间切片中分别抽取目标路径,得到对应的目标路径集合,所述目标路径集合包括至少一个所述目标路径,所述目标路径为第一企业实体和第二企业实体之间的路径;
路径向量模块,用于根据每个所述目标路径集合,确定路径向量表征;
基础向量模块,用于根据第一基础信息和第二基础信息,得到基础信息向量表征,所述第一基础信息为所述第一企业实体的基础信息,第二基础信息为所述第二企业实体的基础信息;
预测结果模块,用于根据所述路径向量表征和所述基础信息向量表征,得到预测结果,所述预测结果包括所述第一企业实体和第二企业实体在目标时间是否存在直接关系。
10.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~8任意一项的方法步骤。
11.一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由处理器加载并执行如权利要求1~8任意一项的方法步骤。
12.一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~8任意一项的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598839.9A CN117725219A (zh) | 2023-05-22 | 2023-05-22 | 企业实体间关系预测方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598839.9A CN117725219A (zh) | 2023-05-22 | 2023-05-22 | 企业实体间关系预测方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117725219A true CN117725219A (zh) | 2024-03-19 |
Family
ID=90205824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310598839.9A Pending CN117725219A (zh) | 2023-05-22 | 2023-05-22 | 企业实体间关系预测方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725219A (zh) |
-
2023
- 2023-05-22 CN CN202310598839.9A patent/CN117725219A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902186B (zh) | 用于生成神经网络的方法和装置 | |
CN111199459B (zh) | 商品推荐方法、装置、电子设备、及存储介质 | |
CN111447107B (zh) | 网络状态确定方法、装置、存储介质及电子设备 | |
CN112650841A (zh) | 信息处理方法、装置和电子设备 | |
CN113688310B (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
CN112395022B (zh) | 信息显示方法、装置、电子设备及计算机可读存储介质 | |
CN115049068A (zh) | 一种模型处理方法、装置、存储介质及电子设备 | |
CN116228391A (zh) | 一种风险识别方法、装置、存储介质及电子设备 | |
CN113628097A (zh) | 图像特效配置方法、图像识别方法、装置及电子设备 | |
CN115858556A (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN116129534A (zh) | 一种图像活体检测方法、装置、存储介质及电子设备 | |
CN115379005A (zh) | 一种消息处理方法、装置、存储介质及电子设备 | |
CN117725219A (zh) | 企业实体间关系预测方法、装置、存储介质及电子设备 | |
CN116416018A (zh) | 内容输出方法、装置、计算机可读介质及电子设备 | |
CN111770510A (zh) | 网络体验状态确定方法、装置、存储介质及电子设备 | |
CN116071527B (zh) | 一种对象处理方法、装置、存储介质及电子设备 | |
CN117688484A (zh) | 数据异常检测方法、装置、存储介质及电子设备 | |
CN112270170B (zh) | 一种隐式表述语句的分析方法、装置、介质和电子设备 | |
CN116881465A (zh) | 一种企业关系图谱生成方法、装置、存储介质及电子设备 | |
CN117972513A (zh) | 数据分类模型训练方法及数据分类方法、装置及存储介质 | |
CN113283115B (zh) | 图像模型生成方法、装置和电子设备 | |
CN118070923A (zh) | 模型训练数据生成方法、装置、存储介质及电子设备 | |
CN116152403B (zh) | 一种形象生成方法、装置、存储介质及电子设备 | |
CN116522996A (zh) | 一种推荐模型的训练方法、推荐方法以及相关装置 | |
CN116229585A (zh) | 一种图像活体检测方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |