CN117076770A

CN117076770A - 基于图计算的数据推荐方法、装置、存储价值及电子设备

Info

Publication number: CN117076770A
Application number: CN202311049158.3A
Authority: CN
Inventors: 郑凡奇; 沈梦婷; 胡傈纹; 张梦迪
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2023-08-18
Filing date: 2023-08-18
Publication date: 2023-11-17

Abstract

本申请公开了一种基于图计算的数据推荐方法、装置、存储价值及电子设备。涉及人工智能领域、金融科技领域及其他相关技术领域，该方法包括：获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户。通过本申请，解决了相关技术中向数据分析师推荐的数据准确性较低的问题。

Description

基于图计算的数据推荐方法、装置、存储价值及电子设备

技术领域

本申请涉及人工智能领域，具体而言，涉及一种基于图计算的数据推荐方法、装置、存储价值及电子设备。

背景技术

相关技术中，通过BI(Business Intelligence，商业智能)平台等系统开展数据分析和挖掘工作。数据分析师根据不同业务需求和数据处理的难易程度选择编写SQL(Structured Query Language，结构化查询语言)方式、模板查询方式、拖拉拽等方式实现数据的查询探索，并通过实时或者异步的方式返回查询结果，将查询结果在前端页面展现并支持下载，数据查询在业务日常工作中已得到广泛使用。

然而，虽然相关技术中通过BI平台进行数据查询方式已经积累大量的数据分析成果，例如SQL查询模板、固定报表、可视化看板等，但分析师用户在使用数据时还是需要从0开始自助分析，系统在用户分析过程中也缺少相关的BI模型推荐等功能，导致数据分析效率很低。

针对相关技术中向数据分析师推荐的数据准确性较低的问题，目前尚未提出有效的解决方案。

发明内容

本申请的主要目的在于提供一种基于图计算的数据推荐方法、装置、存储价值及电子设备，以解决相关技术中向数据分析师推荐的数据准确性较低的问题。

为了实现上述目的，根据本申请的一个方面，提供了一种基于图计算的数据推荐方法。该方法包括：获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户。

可选地，基于身份信息从目标关系网络中确定其他用户包括：获取目标关系网络中的每个用户的身份信息；计算每个用户的身份信息与目标用户的身份信息的相似度；将相似度大于等于相似度阈值的用户确定为其他用户。

可选地，确定每个推荐节点的节点重要性评估值包括：计算每个推荐节点在目标关系网络中的度数、度中心性评估值和相关性评估值；确定度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；基于第一权重、第二权重和第三权重对度数、度中心性评估值和相关性评估值进行加权求和，得到推荐节点的节点重要性评估值。

可选地，在基于身份信息从目标关系网络中确定其他用户之前，该方法还包括：获取目标机构的所有用户的数据操作记录，从数据操作记录中提取每个用户处理业务时调用的模型和访问的数据表，并提取每个模型调用的数据表；将用户、模型以及数据表分别确定为一个节点，在每个用户访问过的数据表对应的节点与用户对应的节点之间连接边，在每个用户调用的模型对应的节点与用户对应的节点之间连接边，并在每个模型对应的节点与模型调用的数据表对应的节点之间连接边；基于节点和边构建目标关系网络。

可选地，在确定推荐节点集合中每个推荐节点的节点重要性评估值之前，该方法还包括：确定与推荐节点之间存在边的关联节点，将关联节点确定为新的推荐节点；将新的推荐节点添加至推荐节点集合，得到更新后的推荐节点集合；基于更新后的推荐节点集合执行确定推荐节点集合中每个推荐节点的节点重要性评估值的步骤。

可选地，在按照目标序列的顺序将模型或数据表推荐给目标用户之后，该方法还包括：获取目标用户访问的未推荐模型和未推荐数据表，其中，未推荐模型和未推荐数据表是除目标序列以外的模型和数据表；将未推荐模型对应的节点和未推荐数据表对应的节点均确定为待处理节点，在目标关系网络中包含待处理节点的情况下，在目标用户对应的节点与待处理节点之间连接边；在目标关系网络中未包含待处理节点的情况下，将待处理节点添加至目标关系网络，并在目标用户对应的节点与待处理节点之间连接边。

可选地，在按照目标序列的顺序将模型或数据表推荐给目标用户之后，该方法还包括：获取目标用户访问的目标序列中的推荐模型和推荐数据表；确定推荐模型和推荐数据表在目标序列中的位置；在位置不属于目标序列中的预设位置范围内的情况下，更新度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；基于更新后的第一权重、第二权重和第三权重执行确定每个推荐节点的节点重要性评估值的步骤。

为了实现上述目的，根据本申请的另一方面，提供了一种基于图计算的数据推荐装置。该装置包括：获取单元，用于获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；第一确定单元，用于将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；第二确定单元，用于确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；推荐单元，用于按照目标序列的顺序将模型或数据表推荐给目标用户。

通过本申请，采用以下步骤：获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户，解决了相关技术中向数据分析师推荐的数据准确性较低的问题。通过构建目标关系网络，基于目标关系网络向目标用户推荐模型和数据，进而达到了提高数据分析效率的效果。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例提供的基于图计算的数据推荐方法的流程图；

图2是根据本申请实施例提供的可选的基于图计算的数据推荐方法的流程图；

图3是根据本申请实施例提供的基于图计算的数据推荐装置的示意图；

图4是根据本申请实施例提供的电子设备的示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

为了便于描述，以下对本申请实施例涉及的部分名词或术语进行说明：

BI：Business Intelligence，商业智能。指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术，对数据进行分析以实现商业价值。

图数据：图(Graph)是一种重要的数据结构，由节点V(或称为顶点，实体)，与边E(即个体之间的联系)构成，一般将图表示成G(V，E)。图数据的典型例子有网页链接关系，社交网络，商品推荐等。

图计算：图计算是以图作为数据模型来表达问题并予以解决的过程。图计算过程中，会用到图算法。

下面结合优选的实施步骤对本发明进行说明，图1是根据本申请实施例提供的基于图计算的数据推荐方法的流程图，如图1所示，该方法包括如下步骤：

步骤S101，获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值。

具体地，目标用户可以为数据分析师，身份信息可以包括数据分析师在企业中的身份编号、姓名、所属部门和公司级别等信息，目标关系网络可以为基于企业的所有数据分析师、模型和数据表以及数据操作记录构建的关系网络，例如，将每个数据分析师作为关系网络中的一个节点、将每个数据表也作为关系网络中的一个节点，并将每个模型也作为关系网络中的一个节点，对象之间的交互关系例如数据分析师访问数据表或模型，模型调用数据表等交互关系。将存在交互关系的任意两个对象之间连接边，从而构建目标关系网络。为了向目标用户推荐其可能用到的模型或数据表，可以先通过确定与目标用户的身份信息相似的其他用户，通过其他用户访问的模型和数据表对目标用户进行推荐。

步骤S102，将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点。

具体地，目标关系网络中以节点和边的关系表征其他用户访问过的数据表以及模型，因此通过确定其他用户对应的目标节点，并将目标关系网络中与目标节点连接的数据表或模型对应的节点作为推荐节点，推荐节点对应的数据表或者模型也即其他用户曾经访问过的数据表或模型。

步骤S103，确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列。

具体地，节点重要性评估值可以为基于推荐节点的度数、度中心性评估值和相关性评估值等综合计算得到的。根据节点重要性评估值对推荐节点对应的模型或数据表进行排序，生成推荐列表，也即目标序列。目标序列可以根据用户需求设置推荐数量和类型。

步骤S104，按照目标序列的顺序将模型或数据表推荐给目标用户。

具体地，将目标序列按照目标序列的顺序将模型或数据表展示给目标用户，例如提供可视化的界面，方便用户浏览、选择、支持分组展示、按主题展示等。

本申请实施例提供的基于图计算的数据推荐方法，通过获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户，解决了相关技术中向数据分析师推荐的数据准确性较低的问题。通过构建目标关系网络，基于目标关系网络向目标用户推荐模型和数据，进而达到了提高数据分析效率的效果。

其他用户通过与目标用户的身份信息的相似度来确定，可选地，在本申请实施例提供的基于图计算的数据推荐方法中，基于身份信息从目标关系网络中确定其他用户包括：获取目标关系网络中的每个用户的身份信息；计算每个用户的身份信息与目标用户的身份信息的相似度；将相似度大于等于相似度阈值的用户确定为其他用户。

具体地，相似度可以为余弦相似度或皮尔森相关系数等，通过计算目标关系网络中每个用户的身份信息与目标用户的身份信息的相似度，并人为设置一个相似度阈值，将相似度大于等于相似度阈值的用户确定为其他用户。本实施例通过确定其他用户来获取用于推荐给目标用户的数据表或模型。

例如，通过计算分析师之间、模型之间、表之间的相似度，可以找到与目标用户相似的其他用户，然后推荐其他用户访问过的模型和表。相似度可以基于实体的属性如分析师的所属机构和级别、模型的使用次数、表的主题域等和关系如访问的表和模型来计算。

通过度数、度中心性评估值和相关性评估值来确定节点重要性评估值，可选地，在本申请实施例提供的基于图计算的数据推荐方法中，确定每个推荐节点的节点重要性评估值包括：计算每个推荐节点在目标关系网络中的度数、度中心性评估值和相关性评估值；确定度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；基于第一权重、第二权重和第三权重对度数、度中心性评估值和相关性评估值进行加权求和，得到推荐节点的节点重要性评估值。

具体地，推荐节点在目标关系网络中的度数是指与推荐节点连接的边的数量，度中心性评估值可以为基于度数的大小设置的评估值，度数越大则度中心性评估值越大，说明推荐节点在目标关系网络中越重要。相关性评估值可以为PageRank(佩奇排名)，如果一个模型或数据表被多个分析师访问，那么它可能是一个重要的模型或数据表，值得推荐给其他分析师。因此通过人为设置第一权重、第二权重和第三权重，基于第一权重、第二权重和第三权重对度数、度中心性评估值和相关性评估值进行加权求和作为推荐节点的节点重要性评估值，基于节点重要性评估值向目标用户推荐数据表或模型。本实施例通过计算节点重要性评估值，对目标关系网络进行分析，确定待推荐给目标用户的数据表和BI模型。

需要说明的是，以节点(顶点)为中心的图计算模型(vertex-centric model)的基本思想可以总结为“从顶点的角度思考(think like a vertex)”。在该模型上实现算法主要需完成“描述计算中顶点行为”的用户自定义函数。举例来讲，PageRank的计算被抽象成为各个顶点上的运算和顶点间的消息通信。计算中的每一轮迭代都会为每个顶点调用一次该VertexCompute函数。这样一来，为不同顶点函数的调用就可以并行执行，充分利用单机多核、集群多机的特性。

在向目标用户推荐数据表或模型之前需要先构建目标关系网络，可选地，在本申请实施例提供的基于图计算的数据推荐方法中，在基于身份信息从目标关系网络中确定其他用户之前，该方法还包括：获取目标机构的所有用户的数据操作记录，从数据操作记录中提取每个用户处理业务时调用的模型和访问的数据表，并提取每个模型调用的数据表；将用户、模型以及数据表分别确定为一个节点，在每个用户访问过的数据表对应的节点与用户对应的节点之间连接边，在每个用户调用的模型对应的节点与用户对应的节点之间连接边，并在每个模型对应的节点与模型调用的数据表对应的节点之间连接边；基于节点和边构建目标关系网络。

具体地，在构建目标关系网络之前首先需要进行数据采集，涵盖数据资产、用户行为信息、用户历史访问数据，也即数据操作记录等多方面内容。例如数据资产的采集包括：公司内部各种数据资产，如数据库表、数据仓库、数据集、数据流等。这些数据资产可以来源于业务系统、日志系统、外部数据接口等。在数据采集过程中，需要记录数据资产的相关信息，如名称、描述、创建时间、更新时间、数据类型、数据结构等。

行为信息的采集包括：收集分析师用户在BI平台上的行为信息，如查询记录、报表查看、看板操作等。这些行为信息可以帮助了解用户的兴趣和需求，为后续的推荐提供依据。同时，需要记录行为信息的时间、操作类型、操作对象等细节。历史数据的采集包括：搜集过去的数据分析成果，如SQL查询模板、固定报表、可视化看板等。这些历史数据可以为构建知识图谱提供丰富的关联信息。同时，需要记录历史数据的创建时间、作者、使用次数、关联数据资产等信息。用户信息的采集包括：收集分析师用户的基本信息，如角色、部门、职责、专业背景等。这些信息可以帮助了解用户的需求特点，为个性化推荐提供支持。

在完成数据采集后，需要对收集到的数据进行预处理，以提高数据质量和便于后续的分析。预处理步骤包括：数据清洗，检查数据中的缺失值、异常值、重复值等，进行相应的处理，如填充、删除或替换。数据整合，将不同来源和格式的数据整合到统一的数据结构中，如关系型数据库或图数据库。在整合过程中，需要处理数据之间的冲突和不一致问题。数据标准化，将数据转换为统一的度量单位、数据类型和编码格式，以便于后续的计算和分析。

采集完数据并对数据预处理后，基于采集的数据构建目标关系网络。目标关系网络包含三类实体：分析师、模型和表，以及它们之间的三类关系：分析师访问的表、分析师访问的模型、模型和表的关系。确定目标关系网络中的节点也即确定实体，例如实体构建包括：分析师实体包括：分析师ID、姓名、所属机构和级别等属性。这些属性可以反映分析师的身份特征和专业能力，对于个性化推荐和用户分群有重要价值。模型实体包括：模型ID和模型名称等属性。这些属性可以描述模型的基本信息，帮助用户理解和选择模型。数据表实体包括：数据表ID、名称和主题域等属性。这些属性可以描述表的内容和业务领域，对于数据查询和分析有指导意义。

确定目标关系网络中的节点后，基于实体之间的交互关系构建边，交互关系例如分析师访问的表关系：描述分析师与他们访问的表之间的关系，包括近一个月访问的次数和近一年访问的次数等属性。这些属性可以反映分析师的兴趣和需求，对于推荐有重要依据。分析师访问的模型关系：描述分析师与他们访问的模型之间的关系，包括近一个月访问的次数和近一年访问的次数等属性。这些属性可以反映分析师对模型的使用情况和喜好，对于推荐有重要依据。模型和表的关系：描述模型和表之间的关系。这种关系可以反映模型和表的相互关联，对于模型的理解和使用有帮助。

在构建目标关系网络时，可以使用图数据库来存储和管理实体和关系，如Neo4j(一种图形数据库)、JanusGraph(一种图形数据库)等。图数据库提供了丰富的图查询和分析功能，可以方便地对目标关系网络进行操作和查询。通过构建目标关系网络为推荐算法提供输入，为数据分析和数据可视化提供支持。通过探索和分析目标关系网络，了解数据资产和BI模型的关联和规律，提升数据分析的效率和质量。

可选地，在本申请实施例提供的基于图计算的数据推荐方法中，在确定推荐节点集合中每个推荐节点的节点重要性评估值之前，该方法还包括：确定与推荐节点之间存在边的关联节点，将关联节点确定为新的推荐节点；将新的推荐节点添加至推荐节点集合，得到更新后的推荐节点集合；基于更新后的推荐节点集合执行确定推荐节点集合中每个推荐节点的节点重要性评估值的步骤。

具体地，除了通过其他用户访问的数据表或模型向目标用户进行推荐以外，还可以基于图遍历的计算方式向目标用户进行推荐模型或数据表，通过图遍历，可以发现目标关系网络中的关联模式和路径，为数据表或模型推荐提供依据。例如，如果一个分析师访问了某个模型，那么可以推荐与该模型关联的其他模型或表；如果一个分析师访问了某个表，那么可以推荐其他访问过该表的分析师所访问的模型。也即确定与推荐节点之间存在边的关联节点，将关联节点确定为新的推荐节点，并基于更新后的推荐节点集合确定推荐列表。本实施例通过关联节点向目标用户推荐数据表或模型，可以为目标用户提供更多选择，扩容推荐列表。

需要说明的是，基于目标关系网络的图算法可以包括基于相似度的计算、基于节点重要性的计算和基于图遍历的计算等，这些图算法可以单独使用，也可以结合使用。例如，可以先通过相似度推荐找到候选的模型和表，然后通过节点重要性和图遍历进一步筛选和排序。在实际应用中，需要根据业务需求和数据特点，选择和调整合适的推荐算法和参数。

通过目标用户对推荐的模型和数据表的实际访问情况对目标关系网络实时更新，可选地，在本申请实施例提供的基于图计算的数据推荐方法中，在按照目标序列的顺序将模型或数据表推荐给目标用户之后，该方法还包括：获取目标用户访问的未推荐模型和未推荐数据表，其中，未推荐模型和未推荐数据表是除目标序列以外的模型和数据表；将未推荐模型对应的节点和未推荐数据表对应的节点均确定为待处理节点，在目标关系网络中包含待处理节点的情况下，在目标用户对应的节点与待处理节点之间连接边；在目标关系网络中未包含待处理节点的情况下，将待处理节点添加至目标关系网络，并在目标用户对应的节点与待处理节点之间连接边。

具体地，通过收集用户对推荐的目标序列的反馈，持续优化推荐算法和知识图谱。例如，在每次向用户推荐目标序列后，获取目标用户实际访问的数据表和模型，若目标用户实际访问的模型或数据表不在目标序列中，则将该模型确定为未推荐模型，将数据表确定为未推荐数据表，若目标关系网络中包含未推荐模型和未推荐数据表对应的节点，则通过将目标用户对应的节点与待处理节点之间连接边，从而更新目标关系网络，若目标关系网络中不包含未推荐模型和未推荐数据表对应的节点，则需要先在目标关系网络中添加待处理节点，然后再将目标用户对应的节点与待处理节点之间连接边，从而更新目标关系网络。通过结合用户反馈，实时更新目标关系网络，使推荐的模型和数据表更加精确和个性化。

可选地，在本申请实施例提供的基于图计算的数据推荐方法中，在按照目标序列的顺序将模型或数据表推荐给目标用户之后，该方法还包括：获取目标用户访问的目标序列中的推荐模型和推荐数据表；确定推荐模型和推荐数据表在目标序列中的位置；在位置不属于目标序列中的预设位置范围内的情况下，更新度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；基于更新后的第一权重、第二权重和第三权重执行确定每个推荐节点的节点重要性评估值的步骤。

具体地，除了基于未推荐数据表和未推荐模型更新目标关系网络以外，还可以基于目标序列中模型或数据表的推荐顺序来更新节点重要性评估值，从而实现更精准的推荐数据表或模型，例如，若目标用户实际访问的数据表和模型不在目标序列的前30％的范围内，说明本次推荐的目标序列中模型和数据表的排列顺序不够精确，因此，通过调整计算节点重要性评估值的计算方式来更新目标序列的排列方式，通过更新度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重，重新计算各个模型或数据表的节点重要性评估值，直到目标序列中目标用户实际访问的数据表和模型排在目标序列的前30％范围内。

根据本申请的另一实施例，还提供了一种可选的基于图计算的数据推荐方法，图2是根据本申请实施例提供的可选的基于图计算的数据推荐方法的流程图。如图2所示，该方法包括：首先进行数据采集，采集的数据涵盖数据资产、用户行为信息、用户历史访问数据和用户身份信息等多方面内容。在完成数据采集后，需要对收集到的数据进行预处理，以提高数据质量和便于后续的分析。预处理步骤包括：数据清洗、数据整合和数据标准化。数据预处理完成后，基于采集的数据构建知识图谱，构建步骤包括：实体构建、关系构建和图谱构建。

构建知识图谱后，确定图计算的方法，图计算方法主要包括：基于相似度的计算、基于节点重要性的计算和基于图遍历的计算。图计算的方法可以单独使用，也可以结合使用。基于图计算的方法生成对目标用户的推荐列表，并将推荐列表作为结果向目标用户进行结果展示。对目标用户展示结果后接收用户反馈，并基于用户反馈更新知识图谱以及图计算的方法。

本实施例通过可选的基于图计算的数据推荐方法，通过收集用户的行为数据和身份信息，利用图数据和图计算等技术手段，推断出用户感兴趣的领域或专业，并根据推断结果自动向用户推荐相应的数据资产和BI模型。帮助用户快速找到所需资源，并降低用户门槛，提高用户使用数据分析工具的效率，为企业的决策制定和发展提供有力支持。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例还提供了一种基于图计算的数据推荐装置，需要说明的是，本申请实施例的基于图计算的数据推荐装置可以用于执行本申请实施例所提供的用于基于图计算的数据推荐方法。以下对本申请实施例提供的基于图计算的数据推荐装置进行介绍。

图3是根据本申请实施例提供的基于图计算的数据推荐装置的示意图。如图3所示，该装置包括：

第一获取单元10，用于获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；

第一确定单元20，用于将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；

第二确定单元30，用于确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；

推荐单元40，用于按照目标序列的顺序将模型或数据表推荐给目标用户。

本申请实施例提供的基于图计算的数据推荐装置，通过第一获取单元10，获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；第一确定单元20，将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；第二确定单元30，确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；推荐单元40，按照目标序列的顺序将模型或数据表推荐给目标用户，解决了相关技术中向数据分析师推荐的数据准确性较低的问题，通过构建目标关系网络，基于目标关系网络向目标用户推荐模型和数据，进而达到了提高数据分析效率的效果。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，第一获取单元10包括：获取模块，用于获取目标关系网络中的每个用户的身份信息；第一计算模块，用于计算每个用户的身份信息与目标用户的身份信息的相似度；第一确定模块，用于将相似度大于等于相似度阈值的用户确定为其他用户。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，第二确定单元30包括：第二计算模块，用于计算每个推荐节点在目标关系网络中的度数、度中心性评估值和相关性评估值；第二确定模块，用于确定度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；求和模块，用于基于第一权重、第二权重和第三权重对度数、度中心性评估值和相关性评估值进行加权求和，得到推荐节点的节点重要性评估值。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，该装置还包括：第二获取单元，用于获取目标机构的所有用户的数据操作记录，从数据操作记录中提取每个用户处理业务时调用的模型和访问的数据表，并提取每个模型调用的数据表；第三确定单元，用于将用户、模型以及数据表分别确定为一个节点，在每个用户访问过的数据表对应的节点与用户对应的节点之间连接边，在每个用户调用的模型对应的节点与用户对应的节点之间连接边，并在每个模型对应的节点与模型调用的数据表对应的节点之间连接边；构建单元，用于基于节点和边构建目标关系网络。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，该装置还包括：第四确定单元，用于确定与推荐节点之间存在边的关联节点，将关联节点确定为新的推荐节点；第一添加单元，用于将新的推荐节点添加至推荐节点集合，得到更新后的推荐节点集合；第一执行单元，用于基于更新后的推荐节点集合执行确定推荐节点集合中每个推荐节点的节点重要性评估值的步骤。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，该装置还包括：第三获取单元，用于获取目标用户访问的未推荐模型和未推荐数据表，其中，未推荐模型和未推荐数据表是除目标序列以外的模型和数据表；第五确定单元，用于将未推荐模型对应的节点和未推荐数据表对应的节点均确定为待处理节点，在目标关系网络中包含待处理节点的情况下，在目标用户对应的节点与待处理节点之间连接边；第二添加单元，用于在目标关系网络中未包含待处理节点的情况下，将待处理节点添加至目标关系网络，并在目标用户对应的节点与待处理节点之间连接边。

可选地，在本申请实施例提供的基于图计算的数据推荐装置中，该装置还包括：第四获取单元，用于获取目标用户访问的目标序列中的推荐模型和推荐数据表；第六确定单元，用于确定推荐模型和推荐数据表在目标序列中的位置；更新单元，用于在位置不属于目标序列中的预设位置范围内的情况下，更新度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；第二执行单元，用于基于更新后的第一权重、第二权重和第三权重执行确定每个推荐节点的节点重要性评估值的步骤。

基于图计算的数据推荐装置包括处理器和存储器，上述第一获取单元10、第一确定单元20、第二确定单元30和推荐单元40等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来提高数据分析效率。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现基于图计算的数据推荐方法。

本发明实施例提供了一种处理器，处理器用于运行程序，其中，程序运行时执行基于图计算的数据推荐方法。

图4是根据本申请实施例提供的电子设备的示意图。如图4所示，电子设备401包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户。本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：获取待推荐的目标用户的身份信息，基于身份信息从目标关系网络中确定其他用户，其中，目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，其他用户是目标关系网络中除目标用户以外的用户，其他用户的身份信息与目标用户的身份信息的相似度大于等于相似度阈值；将目标关系网络中其他用户对应的节点确定为目标节点，并确定目标关系网络中目标节点通过边连接的推荐节点，得到推荐节点集合，其中，推荐节点为表征其他用户访问过的模型或数据表对应的节点；确定推荐节点集合中每个推荐节点的节点重要性评估值，基于重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；按照目标序列的顺序将模型或数据表推荐给目标用户。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于图计算的数据推荐方法，其特征在于，包括：

获取待推荐的目标用户的身份信息，基于所述身份信息从目标关系网络中确定其他用户，其中，所述目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，所述其他用户是所述目标关系网络中除所述目标用户以外的用户，所述其他用户的身份信息与所述目标用户的身份信息的相似度大于等于相似度阈值；

将所述目标关系网络中所述其他用户对应的节点确定为目标节点，并确定所述目标关系网络中所述目标节点通过边连接的推荐节点，得到推荐节点集合，其中，所述推荐节点为表征所述其他用户访问过的模型或数据表对应的节点；

确定所述推荐节点集合中每个推荐节点的节点重要性评估值，基于所述重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；

按照所述目标序列的顺序将模型或数据表推荐给所述目标用户。

2.根据权利要求1所述的方法，其特征在于，基于所述身份信息从目标关系网络中确定其他用户包括：

获取所述目标关系网络中的每个用户的身份信息；

计算每个用户的身份信息与所述目标用户的身份信息的相似度；

将相似度大于等于所述相似度阈值的用户确定为所述其他用户。

3.根据权利要求1所述的方法，其特征在于，确定每个推荐节点的节点重要性评估值包括：

计算每个推荐节点在所述目标关系网络中的度数、度中心性评估值和相关性评估值；

确定所述度数的第一权重、所述度中心性评估值的第二权重和所述相关性评估值的第三权重；

基于所述第一权重、所述第二权重和所述第三权重对所述度数、所述度中心性评估值和所述相关性评估值进行加权求和，得到所述推荐节点的节点重要性评估值。

4.根据权利要求1所述的方法，其特征在于，在基于所述身份信息从目标关系网络中确定其他用户之前，所述方法还包括：

获取目标机构的所有用户的数据操作记录，从所述数据操作记录中提取每个用户处理业务时调用的模型和访问的数据表，并提取每个模型调用的数据表；

将用户、模型以及数据表分别确定为一个节点，在每个用户访问过的数据表对应的节点与所述用户对应的节点之间连接边，在每个用户调用的模型对应的节点与所述用户对应的节点之间连接边，并在每个模型对应的节点与所述模型调用的数据表对应的节点之间连接边；

基于所述节点和所述边构建所述目标关系网络。

5.根据权利要求1所述的方法，其特征在于，在确定所述推荐节点集合中每个推荐节点的节点重要性评估值之前，所述方法还包括：

确定与所述推荐节点之间存在边的关联节点，将所述关联节点确定为新的推荐节点；

将所述新的推荐节点添加至所述推荐节点集合，得到更新后的推荐节点集合；

基于更新后的推荐节点集合执行确定所述推荐节点集合中每个推荐节点的节点重要性评估值的步骤。

6.根据权利要求1所述的方法，其特征在于，在按照所述目标序列的顺序将模型或数据表推荐给所述目标用户之后，所述方法还包括：

获取所述目标用户访问的未推荐模型和未推荐数据表，其中，所述未推荐模型和所述未推荐数据表是除所述目标序列以外的模型和数据表；

将所述未推荐模型对应的节点和所述未推荐数据表对应的节点均确定为待处理节点，在所述目标关系网络中包含所述待处理节点的情况下，在所述目标用户对应的节点与所述待处理节点之间连接边；

在所述目标关系网络中未包含所述待处理节点的情况下，将所述待处理节点添加至所述目标关系网络，并在所述目标用户对应的节点与所述待处理节点之间连接边。

7.根据权利要求1所述的方法，其特征在于，在按照所述目标序列的顺序将模型或数据表推荐给所述目标用户之后，所述方法还包括：

获取所述目标用户访问的所述目标序列中的推荐模型和推荐数据表；

确定所述推荐模型和所述推荐数据表在所述目标序列中的位置；

在所述位置不属于所述目标序列中的预设位置范围内的情况下，更新度数的第一权重、度中心性评估值的第二权重和相关性评估值的第三权重；

基于更新后的第一权重、第二权重和第三权重执行确定每个推荐节点的节点重要性评估值的步骤。

8.一种基于图计算的数据推荐装置，其特征在于，包括：

获取单元，用于获取待推荐的目标用户的身份信息，基于所述身份信息从目标关系网络中确定其他用户，其中，所述目标关系网络由多个节点和多条边构成，每个节点表征以下对象之一：用户、模型和数据表，任意两个节点之间的边由节点表征的对象之间的交互关系构建，所述其他用户是所述目标关系网络中除所述目标用户以外的用户，所述其他用户的身份信息与所述目标用户的身份信息的相似度大于等于相似度阈值；

第一确定单元，用于将所述目标关系网络中所述其他用户对应的节点确定为目标节点，并确定所述目标关系网络中所述目标节点通过边连接的推荐节点，得到推荐节点集合，其中，所述推荐节点为表征所述其他用户访问过的模型或数据表对应的节点；

第二确定单元，用于确定所述推荐节点集合中每个推荐节点的节点重要性评估值，基于所述重要性评估值从大到小的顺序对所有推荐节点对应的模型或数据表进行排序，得到目标序列；

推荐单元，用于按照所述目标序列的顺序将模型或数据表推荐给所述目标用户。

9.一种非易失性存储介质，其特征在于，所述非易失性存储介质包括存储的程序，其中，所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至7中任意一项所述的基于图计算的数据推荐方法。

10.一种电子设备，其特征在于，包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至7中任意一项所述的基于图计算的数据推荐方法。