CN114418012A - 对象关联关系确定方法、装置、设备及计算机存储介质 - Google Patents

对象关联关系确定方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN114418012A
CN114418012A CN202210074863.8A CN202210074863A CN114418012A CN 114418012 A CN114418012 A CN 114418012A CN 202210074863 A CN202210074863 A CN 202210074863A CN 114418012 A CN114418012 A CN 114418012A
Authority
CN
China
Prior art keywords
objects
similarity
semantic
determining
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210074863.8A
Other languages
English (en)
Inventor
许宇秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202210074863.8A priority Critical patent/CN114418012A/zh
Publication of CN114418012A publication Critical patent/CN114418012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种对象关联关系确定方法、装置、设备及计算机存储介质,方法包括:获取多个第一对象和多个第二对象的业务数据、多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系;根据多个第一对象之间的初始关联关系及其业务数据,确定多个第一对象基于语义的业务相似度;根据多个第二对象之间的初始关联关系及其业务数据,确定多个第二对象基于功能的业务相似度;通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵及基于功能的业务相似度的特征矩阵;根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系。本申请实施例能够准确地评价对象关联关系。

Description

对象关联关系确定方法、装置、设备及计算机存储介质
技术领域
本申请属于信息处理领域,尤其涉及一种对象关联关系确定方法、装置、设备及介质。
背景技术
随着社会的发展,与社会活动相关的各个对象之间的联系日趋复杂。研究各个对象之间的关联关系,能够更真实、更全面地反映各个对象的实际情况。
随着大数据的发展,可以从多个维度获取各个对象的相关信息。在现有技术中,一般是根据多个对象各自的相关信息粗略地判断其是否相关,这样得到的对象与对象之间的关联关系较为主观,不够客观、准确。
发明内容
本申请实施例提供以一种对象关联关系确定方法、装置、设备及计算机存储介质,能够准确地确定多个对象之间的关联关系。
第一方面,本申请实施例提供一种对象关联关系确定方法,方法包括:
获取多个第一对象和多个第二对象的业务数据,以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系;
根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度;
根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度;
通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵;
根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系。
在一种可选的实施方式中,上述根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度,包括:
根据第一对象的业务数据,确定多个第一对象之间的语义相似度;
根据多个第一对象之间的初始关联关系以及语义相似度,确定多个第一对象基于语义的业务相似度。
在一种可选的实施方式中,上述根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度,包括:
根据第二对象的业务数据,确定多个第二对象之间的功能相似度;
根据多个第二对象之间的初始关联关系和功能相似度,确定多个第二对象基于功能的业务相似度。
在一种可选的实施方式中,通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵,包括:
根据基于语义的业务相似度构建基于语义的业务相似矩阵;
根据基于功能的业务相似度构建基于功能的业务相似矩阵;
对基于语义的业务相似矩阵和基于功能的业务相似矩阵分别进行奇异值分解;
根据所述奇异值分解结果获取n个基于语义的业务相似矩阵的特征,构建基于语义的业务相似度的特征矩阵;
根据奇异值分解结果获取n个基于功能的业务相似矩阵的特征,构建基于功能的业务相似度的特征矩阵,
其中,n≥2。
在一种可选的实施方式中,根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系,包括:
将基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵进行向量相乘,得到多个第一对象和所述多个第二对象的关联关系矩阵。
第二方面,本申请实施例提供了一种对象关联关系确定装置,装置包括:
获取模块,用于获取多个第一对象和多个第二对象的业务数据,以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系;
确定模块,用于根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度;
确定模块,还用于根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度;
处理模块,用于通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵;确定模块,还用于根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系。
在一种可选的实施方式中,确定模块用于根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度,包括:
确定模块,用于根据第一对象的业务数据,确定多个第一对象之间的语义相似度;
确定模块,用于根据多个第一对象之间的初始关联关系以及语义相似度,确定多个第一对象基于语义的业务相似度。
在一种可选的实施方式中,确定模块用于根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度,包括:
确定模块,用于根据第二对象的业务数据,确定多个第二对象之间的功能相似度;
确定模块,用于根据多个第二对象之间的初始关联关系和功能相似度,确定多个第二对象基于功能的业务相似度。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器以及存储有计算机程序指令的存储器;
该处理器读取并执行上述计算机程序指令,以实现如第一方面,或者第一方面任一可选实施方式的对象关联关系确定方法。
第四方面,本申请实施例提供了一种计算机存储介质,该计算机存储介质上存储有计算机程序指令,该计算机程序指令被处理器执行时实现如第一方面,或者第一方面任一可选实施方式的对象关联关系确定方法。
本申请实施例的对象关联关系确定方法、装置、设备及计算机存储介质,通过获取多个第一对象和多个第二对象的业务数据以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系,确定多个第一对象基于语义的业务相似关系以及多个第二对象基于功能的业务相似关系,再通过邻近网络特征嵌入算法得到第一对象的基于语义的业务相似度的特征矩阵和基于功能的业务相似度的特征矩阵,进而确定多个第一对象和多个第二对象的关联关系。这样,可以由多个对象的初始关联关系和业务数据,得到多个对象之间的关联关系。如此,不仅能够从整个对象群体的层面评价对象的关联关系,还可以从多个方面入手,更客观、准确地评价对象的关联关系。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种对象关联关系确定方法的流程示意图;
图2是本申请实施例提供的一种对象关联关系确定装置的结构示意图;
图3是本申请实施例提供的一种对象关联关系确定设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
随着社会的发展,与社会活动相关的各个对象之间的联系日趋复杂。研究各个对象之间的关联关系,能够更真实、更全面地反映对象的实际情况。
各个对象之间的关联关系在社会生活的方方面面都有着非常重要的作用以及广泛的应用场景。例如,对于一个企业对象来说,可以将一个企业对象与其他企业对象的关联关系作为衡量该企业的信用程度的其中一个维度,在信用贷款或者依据信用扩展的市场应用场景,如信用担保等多种方面都可以使用。还例如,安全风控、营销推广等多个场景都可以考虑对象与其他对象的关联关系。
随着大数据的发展,可以从多个维度获取对象的相关信息。在现有技术中,一般是根据多个对象各自的相关信息粗略地判断其是否相关,而没有从整个对象群体的层面上评价各对象之间的关联关系。
为了解决现有技术中存在的对于对象关联关系的评价不够客观、准确的问题,本申请实施例提供一种户关联关系确定方法、装置、设备及计算机存储介质。下面首先对本申请实施例所提供的对象关联关系确定方法进行介绍。
图1示出了本申请一个实施例提供的对象关联关系确定方法的流程示意图。如图1所示,对象关联关系确定方法可以包括以下步骤S110~S150。
S110,获取多个第一对象和多个第二对象的业务数据,以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系。
其中,对象可以为企业、商户等群体,例如可以为独资企业、合伙企业、公司等企业,也可以为超市、饭店等商户。上述第一对象、第二对象可以为不同类型的对象,例如,第一对象可以为独资企业,第二对象可以为合伙企业,或者,第一对象可以为从事制造业的企业,第二对象可以为从事销售业的企业。上述第一对象、第二对象也可以为相同类型的对象,例如,第一对象可以为从事上游产品制造的企业,第二对象可以为从事下游产品制造的企业。上述初始关联关系可以是根据多个对象各自的相关信息,粗略地确定的关联关系。例如,当两个对象有直接的业务往来时,认为这两个对象的初始关联关系为相关,反之,则为不相关。
在一个实施例中,为了便于确定多个第一对象之间的初始关联关系以及多个第二对象之间的初始关联关系,可以根据多个对象之间的初始关联关系建立初始关联关系矩阵。如此,不仅可以从初始关联关系矩阵中更直观地得到各个对象之间的初始关联关系,还可以从初始关联关系矩阵中直接提取多个第一对象之间的初始关联关系以及多个第二对象之间的初始关联关系,从而能够更方便地确定多个第一对象之间的初始关联关系以及多个第二对象之间的初始关联关系。
具体地,在一个示例中,为了便于分析,对于a个对象,可以建立a×a的初始关联关系矩阵H,矩阵H中的任一元素可以用Hij表示,其含义为第i个对象与第j个对象的初始关联关系。当第i个对象和第j个对象有直接的业务往来时,Hij=1,反之,Hij=0。
上述业务数据可以包括对象的类型、对象的规模、对象的结算交易数据、担保数据、票据、工商数据、股份等与对象业务相关的数据。
在一个实施例中,获取多个第一对象和多个第二对象的业务数据之后,还可以对业务数据进行数据预处理,例如可以对脏数据进行清洗,和/或新增特征。具体地,可以对数据进行去除唯一值属性,在一些数据为标签数据等唯一属性的数据时,去除这些数据;还可以对数据进行缺失值处理,对于缺失值,可以删除含有缺失值的数据或者进行缺失值补全;还可以对数据进行属性编码,对数据进行特征二元化或者独热编码(One-Hot Encoding),还可以对数据进行求和、取平均值、取最大值、取最小值等运算,从而得到新增的数据特征。如此,能够根据业务数据更准确地评价对象之间的关联关系。
S120,根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度。
在一个实施例中,可以根据第一对象的业务数据,确定多个第一对象业务数据上的语义相似度,将多个第一对象业务数据上的语义相似度与多个第一对象的初始关联关系进行分析处理,确定多个第一对象基于语义的业务相似度。
在一个实施例中,可以将多个第一对象业务数据上的语义相似度、多个第一对象的初始关联关系量化,加权处理后得到多个第一对象的基于语义的业务相似度。
S130,根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度。
步骤S130中,可以根据第二对象的业务数据,确定多个第二对象业务数据上的功能相似度,将多个第二对象业务数据上的功能相似度与多个第一对象的初始关联关系进行分析处理,确定多个第二对象基于功能的业务相似度。
类似的,在一个实施例中,也可以将多个第二对象业务数据上的功能相似度、多个第二对象的初始关联关系量化,加权处理后得到多个第二对象基于功能的业务相似度。
S140,通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵。
通过邻近网络特征嵌入算法提取的过程可以包括以下步骤(1)~(3)。
步骤(1),建立任意阶邻近矩阵。
对于一个矩阵A,当其为对称矩阵时,矩阵Am也为对称矩阵。此时,可以通过公式1建立任意阶邻近矩阵S。
S=w1A+w2A2+…+wmAm 公式1
其中,wk为预设的k阶矩阵的权重,k取1~m的整数,wk=βk,βk是收敛的,β∈(0~1)。
步骤(2),对任意阶邻近矩阵进行奇异值分解,将分解得到的特征值进行降序排序,获得前n个特征值的绝对值。
对于一个对称矩阵A,其具有一个特征值λ和特征向量x,即Ax=λx。则对于m阶矩阵Am有:Am=Am-1λx=λAm-1x=λmx,结合公式1可得:
Figure BDA0003483477470000081
如此,可以通过奇异值分解(Singular Value Decomposition)对上述任意阶邻近矩阵S进行特征分解,将得到的特征值进行降序排序,获得前n个特征值的绝对值。
步骤(3),根据前n个特征的绝对值,构建特征矩阵。
在一个实施例中,可以将基于语义的业务相似度和基于功能的业务相似度分别构建对称矩阵,并作为矩阵A代入上述步骤(1)~(3),从而得到基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵。
S150,根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系。
本申请实施例中,通过获取多个第一对象和多个第二对象的业务数据以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系,确定多个第一对象基于语义的业务相似关系以及多个第二对象基于功能的业务相似关系,再通过邻近网络特征嵌入算法得到第一对象的基于语义的业务相似度的特征矩阵和基于功能的业务相似度的特征矩阵,进而确定多个第一对象和多个第二对象的关联关系。这样,可以由多个对象的初始关联关系和业务数据,得到多个对象之间的关联关系。如此,不仅能够从整个对象群体的层面评价对象的关联关系,还可以从多个方面入手,更客观、准确地评价对象的关联关系。
在一个实施例中,上述根据多个第一对象之间的初始关联关系和第一对象的业务数据,确定多个第一对象基于语义的业务相似度,具体可以包括:
根据第一对象的业务数据,确定多个第一对象之间的语义相似度。
根据多个第一对象之间的初始关联关系以及语义相似度,确定多个第一对象基于语义的业务相似度。
在一个实施例中,上述根据第一对象的业务数据,确定多个第一对象之间的语义相似度,可以通过构建语义特征矩阵CS实现。语义特征矩阵CS可以表示多个第一对象之间在业务上的语义相似度。语义特征矩阵CS可以通过如下的公式2~8构建,具体步骤如下:
通过公式2可以计算每一第一对象c对第一对象C的贡献值C1C(c)。其中,ε表示语义贡献因子,d表示在第一DAG中为第一对象的子节点的第一对象d。对于第一对象ci和cj,与ci和cj在第一DAG中共同相关联的第一对象记为第一对象t(即,第一对象t同时为ci和cj在第一DAG中的子节点,记为t∈T(ci)∩T(cj)),根据公式2可以分别计算得到第一对象t对ci的贡献值
Figure BDA0003483477470000091
以及对cj的贡献值
Figure BDA0003483477470000092
根据公式2计算出每一第一对象c对第一对象C的贡献值后,通过公式3将所有第一对象c∈T(C)对第一对象C的贡献值相加得到第一对象C的语义价值CV1(C)。对于第一对象ci和cj,可以通过类似的过程计算得到ci的语义价值CV1(ci)以及cj的语义价值CV1(cj)。
如公式4所示,将所有与ci和cj在第一DAG中共同相关联的第一对象t对ci的贡献值
Figure BDA0003483477470000093
以及对cj的贡献值
Figure BDA0003483477470000094
相加后除以ci的语义价值CV1(ci)以及cj的语义价值CV1(cj)之和,即可得到第一对象ci和第一对象cj的语义相似度SS1(ci,cj)。
公式5中,C、c′分别表示第一对象C和第一对象c′,第一对象c′表示第一DAG中与第一对象C相关联的一个第一对象(即第一对象C在第一DAG中的子节点),t′表示与第一对象c′在第一DAG中相关联的第一对象(即第一对象c′在第一DAG中的子节点),the number ofDAGs includes t′表示的第一DAG中与第一对象t′相关联的第一对象的数量,the numberof Core enterprises表示第一DAG中第一对象的总数量。通过公式5可以计算出第一DAG中,每个第一对象c′基于父节点第一对象C的C2C(c′)的值。将第一对象C在第一DAG中的所有子节点第一对象c′的C2C(c′)的值代入公式6,即得每个第一对象C基于对象关联关系的语义价值CV2(C)。
公式7中,第一对象t的意义与公式4中相同(与ci和cj在第一DAG中共同相关联的第一对象),
Figure BDA0003483477470000101
为第一对象t基于父节点第一对象ci的C2C(c′)的值,
Figure BDA0003483477470000102
为第一对象t基于父节点第一对象cj的C2C(c′)的值,容易理解的,
Figure BDA0003483477470000103
Figure BDA0003483477470000104
在数值上相等。CV2(ci)、CV2(cj)分别为第一对象ci和第一对象cj基于公式5、6计算得到的基于对象关联关系的语义价值。根据公式7,即可得到第一对象ci和第一对象cj的基于对象关联关系的语义相似度SS2(ci,cj)。
如此,计算所有第一对象中每个第一对象与每个其他第一对象的SS1、SS2,通过公式8即可得到第一对象的基于业务的语义相似度矩阵CS。
Figure BDA0003483477470000105
CV1(C)=∑c∈T(C)C1C(c) 公式3
Figure BDA0003483477470000106
Figure BDA0003483477470000107
CV2(C)=∑c∈T(C)C2C(c′) 公式6
Figure BDA0003483477470000108
Figure BDA0003483477470000109
上述根据多个第一对象之间的初始关联关系以及语义相似度,确定多个第一对象基于语义的业务相似度,可以包括:根据多个第一对象之间的初始关联关系,通过高斯核函数计算得到用于表征多个第一对象之间的高斯核相似性的高斯核矩阵KC。再根据预设的权重对CS和KC进行处理,从而得到用于表征多个第一对象基于语义的业务相似度的矩阵SC。在一个示例中,可以通过公式9确定SC。
SC=CS⊙α+KC⊙(1-α) 公式9
其中,α为预设的权重。
如此,可以通过多个第一对象在业务上的语义相似度以及高斯核相似度确定多个第一对象基于语义的业务相似度,从而更全面地确定多个第一对象之间的业务相似关系。
在一个实施例中,上述根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度,具体可以包括:
根据第二对象的业务数据,确定多个第二对象之间的功能相似度。
根据多个第二对象之间的初始关联关系和功能相似度,确定多个第二对象基于功能的业务相似度。
在一个实施例中,上述根据第二对象的业务数据,确定多个第二对象之间的功能相似度,可以通过构建功能相似矩阵US实现。功能相似矩阵US可以表示多个第二对象在业务上的功能相似度。功能相似矩阵US具体可以通过如下的公式10~11构建。
具体地,可以将多个第二对象根据拓扑排序的原理创建第二DAG。其中,与第二对象ui在DAG中相关的其他第二对象(即,ui在第二DAG中的子节点)数量为nc,与第二对象uj在DAG中相关的其他第二对象(即,uj在第二DAG中的子节点)数量为nu。根据公式10可以计算nc个二对象中每一第二对象与整个与uj相关的第二对象群体的最大相似度。相似地,也可以计算出nu个第二对象中每一第二对象与整个与ui相关的第二对象群体的最大相似度。在公式11中,DT1表示与uj相关的第二对象群体,DT2表示与ui相关的第二对象群体,S为相似度计算函数,可以是余弦相似度计算,也可以是皮尔逊相关系数计算。将nc个第一对象中每一第二对象与整个与uj相关的第二对象群体的最大相似度及nu个第二对象中每一第二对象与整个与ui相关的第二对象群体的最大相似度的计算结果代入公式11,即可得到ui跟uj的功能相似度US(ui,uj)。
Figure BDA0003483477470000121
Figure BDA0003483477470000122
如此,可以计算出每个第二对象与每个其他第二对象的功能相似度,得到功能相似矩阵US。上述根据多个第二对象之间的初始关联关系和功能相似度,确定多个第二对象基于功能的业务相似度,可以包括根据多个第二对象之间的初始关联关系,通过高斯核函数计算得到用于表征多个第二对象之间的高斯核相似性的高斯核矩阵KU,再根据预设的权重对US和KU进行处理,从而得到用于表征确定多个第二对象基于功能的业务相似度的矩阵SU。在一个示例中,可以通过公式12确定SU。
SU=US⊙β+KU⊙(1-β) 公式12
其中,β为预设的权重。
如此,可以通过多个第二对象在业务上的功能相似度以及高斯核相似度确定多个第二对象基于功能的业务相似度,从而更全面地确定多个第二对象之间的业务相似关系。
在一个实施例中,通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵,可以包括:
根据基于语义的业务相似度构建基于语义的业务相似矩阵。
根据基于功能的业务相似度构建基于功能的业务相似矩阵。
对基于语义的业务相似矩阵和基于功能的业务相似矩阵分别进行奇异值分解。
根据奇异值分解结果获取n个所述基于语义的业务相似矩阵的特征,构建基于语义的业务相似度的特征矩阵。
根据奇异值分解结果获取n个基于功能的业务相似矩阵的特征,构建所述基于功能的业务相似度的特征矩阵。
其中,n≥2。
在一个示例中,可以将上述矩阵SC和SU作为对称矩阵,分别代入邻近网络特征嵌入算法中,从而得到多个第一对象的基于语义的业务相似度的特征矩阵FC和多个第二对象的基于功能的业务相似度的特征矩阵FU。
在一个实施例中,上述根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系,可以包括:
将基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵进行向量相乘,得到多个第一对象和多个第二对象的关联关系矩阵。
如此,可以根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,得到多个第一对象和多个第二对象的关联关系矩阵,从而可以从该关联关系矩阵中获取每个对象与其他对象之间的关联关系。
具体地,可以将上述FC和FU进行向量相乘,得到多个第一对象和第二对象的关联关系矩阵CU。如此,从矩阵CU中可以直观地表示出多个对象中任意两个对象的关联关系。并且,对于与一个目标对象相关的多个其他对象,还可以根据其他对象与目标对象的关联程度进行排名,从而得到目标对象的关联关系网络。
基于相同的发明构思,本申请实施例还提供了一种对象关联关系确定装置。具体结合图2进行说明
图2是本申请实施例提供的一种对象关联关系确定装置的结构示意图。
如图2所示,该对象关联关系确定装置200可以包括:获取模块210、确定模块220和处理模块230。
获取模块210,用于获取多个第一对象和多个第二对象的业务数据,以及所述多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系。
确定模块220,用于根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度。
确定模块220,还用于根据所述多个第二对象之间的初始关联关系和所述第二对象的业务数据,确定所述多个第二对象基于功能的业务相似度。
处理模块230,用于通过邻近网络特征嵌入算法提取所述基于语义的业务相似度的特征矩阵以及所述基于功能的业务相似度的特征矩阵。
确定模块220,还用于根据所述基于语义的业务相似度的特征矩阵、所述基于功能的业务相似度特征矩阵,确定所述多个第一对象和所述多个第二对象的关联关系。
本申请实施例中,通过获取多个第一对象和多个第二对象的业务数据以及多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系,确定多个第一对象基于语义的业务相似关系以及多个第二对象基于功能的业务相似关系,再通过邻近网络特征嵌入算法得到第一对象的基于语义的业务相似度的特征矩阵和基于功能的业务相似度的特征矩阵,进而确定多个第一对象和多个第二对象的关联关系。这样,可以由多个对象的初始关联关系和业务数据,得到多个对象之间的关联关系。如此,不仅能够从整个对象群体的层面评价对象的关联关系,还可以从多个方面入手,更客观、准确地评价对象的关联关系。
在一个实施例中,确定模块220用于根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度,具体可以包括:
确定模块220,用于根据第一对象的业务数据,确定多个第一对象之间的语义相似度。
确定模块220,用于根据多个第一对象之间的初始关联关系以及语义相似度,确定多个第一对象基于语义的业务相似度。
在一个实施例中,确定模块220用于根据多个第二对象之间的初始关联关系和第二对象的业务数据,确定多个第二对象基于功能的业务相似度,具体可以包括:
确定模块220,用于根据第二对象的业务数据,确定多个第二对象之间的功能相似度。
确定模块220,用于根据多个第二对象之间的初始关联关系和功能相似度,确定多个第二对象基于功能的业务相似度。
在一个实施例中,对象关联关系确定装置200还包括构建模块,上述处理模块230用于通过邻近网络特征嵌入算法提取基于语义的业务相似度的特征矩阵以及基于功能的业务相似度的特征矩阵,具体可以包括:
构建模块,用于根据基于语义的业务相似度构建基于语义的业务相似矩阵。
上述构建模块,还用于根据基于功能的业务相似度构建基于功能的业务相似矩阵。
处理模块230,用于对基于语义的业务相似矩阵和基于功能的业务相似矩阵分别进行奇异值分解。
上述构建模块,还用于根据奇异值分解结果获取n个基于语义的业务相似矩阵的特征,构建基于语义的业务相似度的特征矩阵。
上述构建模块,还用于根据奇异值分解结果获取n个基于功能的业务相似矩阵的特征,构建基于功能的业务相似度的特征矩阵。
其中,n≥2。
在一个实施例中,确定模块220用于根据基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵,确定多个第一对象和多个第二对象的关联关系,具体可以包括:
确定模块220,用于将基于语义的业务相似度的特征矩阵、基于功能的业务相似度的特征矩阵进行向量相乘,得到多个第一对象和多个第二对象的关联关系矩阵。
基于同一发明构思,本申请实施例还提供了一种电子设备,具体结合图3进行详细说明。
图3是本申请实施例提供的一种对象关联关系确定设备的结构示意图。
如图3所示,本实施例中的文本处理设备300包括输入设备301、输入接口302、中央处理器303、存储器304、输出接口305、以及输出设备306。其中,输入接口302、中央处理器303、存储器304、以及输出接口305通过总线310相互连接,输入设备301和输出设备306分别通过输入接口302和输出接口305与总线310连接,进而与信息获取设备300的其他组件连接。
具体地,输入设备301接收来自外部的输入信息,并通过输入接口302将输入信息传送到中央处理器303;中央处理器303基于存储器304中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器304中,然后通过输出接口305将输出信息传送到输出设备306;输出设备306将输出信息输出到信息获取设备300的外部供用户使用。
在一个实施例中,图3所示的对象关联关系确定设备300包括:存储器304,用于存储程序;处理器303,用于运行存储器中存储的程序,以执行本申请实施例提供的图1所示实施例的方法。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本申请实施例提供的图1所示实施例的方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和展示出了若干具体地步骤作为示例。但是,本申请的方法过程并不限于所描述和展示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种对象关联关系确定方法,其特征在于,包括:
获取多个第一对象和多个第二对象的业务数据,以及所述多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系;
根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度;
根据所述多个第二对象之间的初始关联关系和所述第二对象的业务数据,确定所述多个第二对象基于功能的业务相似度;
通过邻近网络特征嵌入算法提取所述基于语义的业务相似度的特征矩阵以及所述基于功能的业务相似度的特征矩阵;
根据所述基于语义的业务相似度的特征矩阵、所述基于功能的业务相似度特征矩阵,确定所述多个第一对象和所述多个第二对象的关联关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度,包括:
根据所述第一对象的业务数据,确定所述多个第一对象之间的语义相似度;
根据所述多个第一对象之间的初始关联关系以及所述语义相似度,确定所述多个第一对象基于语义的业务相似度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个第二对象之间的初始关联关系和所述第二对象的业务数据,确定所述多个第二对象基于功能的业务相似度,包括:
根据所述第二对象的业务数据,确定所述多个第二对象之间的功能相似度;
根据所述多个第二对象之间的初始关联关系和所述功能相似度,确定所述多个第二对象基于功能的业务相似度。
4.根据权利要求1所述的方法,其特征在于,所述通过邻近网络特征嵌入算法提取所述基于语义的业务相似度的特征矩阵以及所述基于功能的业务相似度的特征矩阵,包括:
根据所述基于语义的业务相似度构建基于语义的业务相似矩阵;
根据所述基于功能的业务相似度构建基于功能的业务相似矩阵;
对所述基于语义的业务相似矩阵和所述基于功能的业务相似矩阵分别进行奇异值分解;
根据所述奇异值分解结果获取n个所述基于语义的业务相似矩阵的特征,构建所述基于语义的业务相似度的特征矩阵;
根据所述奇异值分解结果获取n个所述基于功能的业务相似矩阵的特征,构建所述基于功能的业务相似度的特征矩阵,
其中,n≥2。
5.根据权利要求1所述的方法,其特征在于,所述根据所述基于语义的业务相似度的特征矩阵、所述基于功能的业务相似度的特征矩阵,确定所述多个第一对象和所述多个第二对象的关联关系,包括:
将所述基于语义的业务相似度的特征矩阵、所述基于功能的业务相似度的特征矩阵进行向量相乘,得到所述多个第一对象和所述多个第二对象的关联关系矩阵。
6.一种对象关联关系确定装置,其特征在于,包括:
获取模块,用于获取多个第一对象和多个第二对象的业务数据,以及所述多个第一对象之间的初始关联关系和多个第二对象之间的初始关联关系;
确定模块,用于根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度;
所述确定模块,还用于根据所述多个第二对象之间的初始关联关系和所述第二对象的业务数据,确定所述多个第二对象基于功能的业务相似度;
处理模块,用于通过邻近网络特征嵌入算法提取所述基于语义的业务相似度的特征矩阵以及所述基于功能的业务相似度的特征矩阵;
所述确定模块,还用于根据所述基于语义的业务相似度的特征矩阵、所述基于功能的业务相似度特征矩阵,确定所述多个第一对象和所述多个第二对象的关联关系。
7.根据权利要求6所述的装置,其特征在于,所述确定模块用于根据所述多个第一对象之间的初始关联关系和所述第一对象的业务数据,确定所述多个第一对象基于语义的业务相似度,包括:
所述确定模块,用于根据所述第一对象的业务数据,确定所述多个第一对象之间的语义相似度;
所述确定模块,用于根据所述多个第一对象之间的初始关联关系以及所述语义相似度,确定所述多个第一对象基于语义的业务相似度。
8.根据权利要求6所述的装置,其特征在于,所述确定模块用于根据所述多个第二对象之间的初始关联关系和所述第二对象的业务数据,确定所述多个第二对象基于功能的业务相似度,包括:
所述确定模块,用于根据所述第二对象的业务数据,确定所述多个第二对象之间的功能相似度;
所述确定模块,用于根据所述多个第二对象之间的初始关联关系和所述功能相似度,确定所述多个第二对象基于功能的业务相似度。
9.一种对象关联关系确定设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-5任意一项所述的对象关联关系确定方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-5任意一项所述的对象关联关系确定方法。
CN202210074863.8A 2022-01-21 2022-01-21 对象关联关系确定方法、装置、设备及计算机存储介质 Pending CN114418012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210074863.8A CN114418012A (zh) 2022-01-21 2022-01-21 对象关联关系确定方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210074863.8A CN114418012A (zh) 2022-01-21 2022-01-21 对象关联关系确定方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114418012A true CN114418012A (zh) 2022-04-29

Family

ID=81276333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210074863.8A Pending CN114418012A (zh) 2022-01-21 2022-01-21 对象关联关系确定方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114418012A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860886A (zh) * 2022-05-25 2022-08-05 北京百度网讯科技有限公司 生成关系图的方法和确定匹配关系的方法、装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860886A (zh) * 2022-05-25 2022-08-05 北京百度网讯科技有限公司 生成关系图的方法和确定匹配关系的方法、装置

Similar Documents

Publication Publication Date Title
US11995702B2 (en) Item recommendations using convolutions on weighted graphs
CN107066616B (zh) 用于账号处理的方法、装置及电子设备
CN107464132B (zh) 一种相似用户挖掘方法及装置,电子设备
CN112085172B (zh) 图神经网络的训练方法及装置
CN111966904B (zh) 基于多用户画像模型的信息推荐方法和相关装置
CN111523976A (zh) 商品推荐方法、装置、电子设备及存储介质
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
EP4242955A1 (en) User profile-based object recommendation method and device
CN110162711B (zh) 一种基于网络嵌入法的资源智能推荐方法及系统
CN106651427B (zh) 基于用户行为的数据关联方法
CN108512674B (zh) 用于输出信息的方法、装置和设备
CN111639700A (zh) 目标相似度识别方法、装置、计算机设备及可读存储介质
CN114418012A (zh) 对象关联关系确定方法、装置、设备及计算机存储介质
CN116127184A (zh) 产品的推荐方法及装置、非易失性存储介质、电子设备
CN111538909A (zh) 一种信息推荐方法及装置
CN111340566B (zh) 一种商品分类方法、装置、电子设备及存储介质
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN117574915A (zh) 基于多方数据源的公共数据平台及其数据分析方法
CN116340643B (zh) 对象推荐的调整方法及装置、存储介质、电子设备
CN107656927B (zh) 一种特征选择方法及设备
CN112559640B (zh) 图谱表征系统的训练方法及装置
CN114997327A (zh) 目标对象的分类方法、装置、存储介质以及电子设备
CN113554288A (zh) 一种通用数据质量评估方法及装置
CN112819404A (zh) 数据处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination