CN116401379A - 金融产品数据推送方法、装置、设备及存储介质 - Google Patents

金融产品数据推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116401379A
CN116401379A CN202310475129.7A CN202310475129A CN116401379A CN 116401379 A CN116401379 A CN 116401379A CN 202310475129 A CN202310475129 A CN 202310475129A CN 116401379 A CN116401379 A CN 116401379A
Authority
CN
China
Prior art keywords
data
stored
product
node
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310475129.7A
Other languages
English (en)
Inventor
于嘉玮
陈永录
牛伯宇
赵瑞龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310475129.7A priority Critical patent/CN116401379A/zh
Publication of CN116401379A publication Critical patent/CN116401379A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种金融产品数据推送方法、装置、设备及存储介质,属于大数据技术领域。该方法包括:得到用户基础数据,得到产品属性数据,得到图谱特征数据,确定图谱建模数据,确定本体领域对象,确定本体领域对象。按照本体领域对象对图谱建模数据进行本体抽取处理,得到本体概念数据;从预存产品数据中得到实例数据;得到资源描述框架数据;生成第一知识图谱;根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型;生成第二知识图谱;生成目标推荐模型;将目标用户数据输入目标推荐模型,生成目标金融产品数据;将目标金融产品数据推送至目标用户终端。本申请提高了推送的金融产品数据的准确性和可解释性。

Description

金融产品数据推送方法、装置、设备及存储介质
技术领域
本申请涉及大数据技术领域,尤其涉及一种金融产品数据推送方法、装置、设备及存储介质。
背景技术
目前,在金融行业的飞速发展下,各种各样的金融产品逐渐出现,以满足人们增长的理财需求。面对种类繁多的金融产品,如何提升给用户推送的金融产品的准确性,以满足用户的要求。
现有技术中,金融产品的推送一般是先通过调查问卷的形式对用户选择产品偏好的相关信息进行采集,再根据采集的信息进行分析,判断用户属于保守型、稳健型和积极型中的哪种类型,从而根据用户的类型推送对应的金融产品。
然而,发明人发现现有技术至少存在以下技术问题:使用现有技术中的金融产品数据推送方法推送金融产品数据时,由于用户对大部分金融产品的了解太少,使得推送的金融产品与用户实际需求的匹配度较低,产生了推送的金融产品数据的准确性和可解释性较低的问题。
发明内容
本申请提供一种金融产品数据推送方法、装置、设备及存储介质,用以解决推送的金融产品数据的准确性和可解释性较低的问题。
一方面,本申请提供一种金融产品数据推送方法,包括:
对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据;
对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据;
根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据;
根据所述图谱建模数据,确定本体领域对象;
按照所述本体领域对象对所述图谱建模数据进行本体抽取处理,得到本体概念数据;
启动预存本体构建工具,按照所述本体概念数据从所述预存产品数据中得到实例数据;
对所述实例数据进行格式转换处理,得到资源描述框架数据;
启动预存导入工具将所述资源描述框架数据导入预设图数据库,生成第一知识图谱;
根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型;
根据所述第一知识图谱和所述目标学习模型,生成第二知识图谱;
将所述第二知识图谱引入预存推荐模型,生成目标推荐模型;
获取目标用户数据,并将所述目标用户数据输入目标推荐模型,生成目标金融产品数据;
将所述目标金融产品数据推送至目标用户终端。
在一种可能的实现方式中,所述对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据,包括:执行预存预处理脚本从所述预存产品数据中提取产品类型数据、产品价格变动数据、产品评级数据和产品源数据,将所述产品类型数据、产品价格变动数据、产品评级数据和产品源数据确定为产品属性数据;执行所述预存预处理脚本从所述用户基础数据中提取用户描述数据和用户偏好数据,就用户描述数据和用户偏好数据确定为用户基础数据。
在一种可能的实现方式中,所述对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据,包括:对所述产品属性数据和所述用户基础数据进行分类处理,得到离散型数据和身份标识数据;对所述离散型数据进行归一化处理,得到归一化特征数据;对所述身份标识数据进行嵌入处理,得到身份标识特征数据;根据所述归一化特征数据和所述身份标识特征数据,得到图谱特征数据。
在一种可能的实现方式中,所述根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据,包括:根据所述图谱特征数据,确定图谱实体数据,并根据所述图谱实体数据和所述图谱特征数据,确定图谱属性数据;启动预存语义分析工具对所述预存产品数据和所述图谱实体数据进行语义分析,生成实体关系数据;对所述预存产品数据进行知识融合处理,确定标准图谱实体数据;将所述标准图谱实体数据、所述图谱属性数据和所述实体关系数据存为图谱建模数据。
在一种可能的实现方式中,所述根据预建多关系共现矩阵和预存图卷积神经网络模型,确定目标学习模型,包括:根据所述预存图卷积神经网络模型,确定多个节点;根据预建多关系共现矩阵和所述多个节点,确定每两个节点之间的关系重要性系数和关系类型数据;根据所有的关系重要性系数和关系类型数据,确定每两个节点中其中一个节点对另一个节点的重要程度值;根据所有的重要程度值和所述预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据;在训练所述预存图卷积神经网络模型时,使用预存块对角矩阵对预存模型权重矩阵Wr进行正则化操作,生成每个节点的目标权重矩阵;根据所述编码层节点表示数据、每个节点的目标权重矩阵、所述预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数;根据所述知识图谱优化参数对所述预存图卷积神经网络模型进行训练,构建目标学习模型。
在一种可能的实现方式中,所述根据预建多关系共现矩阵和所述多个节点,确定每两个节点之间的关系重要性系数和关系类型数据,的计算公式为:
Figure BDA0004205245340000031
式中,
Figure BDA0004205245340000032
为大小是R×R且对角线为1的预建多关系共现矩阵,其中R为正整数,ri为节点e的第i批节点之间的关系类型,rj为节点e的第j批节点之间的关系类型,其中r和j均为正整数,sum(e,ri)为节点e的相邻的节点中关系类型是ri的边数之和,sum(e,rj)为节点e的相邻的节点中关系类型是rj的边数之和,/>
Figure BDA0004205245340000033
为关系类型ri对关系类型rj的重要性系数,|R|为节点e周围所有关系类型的总个数。
在一种可能的实现方式中,根据所有的关系重要性系数和节点关系,确定每两个节点中其中一个节点对另一个节点的重要程度值,的计算公式为:
Figure BDA0004205245340000034
式中,
Figure BDA0004205245340000035
为节点ej在关系ri下对目标节点eh的重要程度值,/>
Figure BDA0004205245340000036
为节点ej周围的节点数。
在一种可能的实现方式中,所述预存图卷积神经网络模型包括多个编码层;相应地,所述根据所有的重要程度值和所述预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据,的计算公式为:
Figure BDA0004205245340000037
式中,eh (l+1)为预存卷积神经网络的编码层中第l+1层的一个节点eh的编码层节点表示数据,
Figure BDA0004205245340000038
为节点eh周围的节点数,/>
Figure BDA00042052453400000311
为不同的关系类型r下需要学习的权重矩阵,
Figure BDA0004205245340000039
表示与其他节点之间无关系类型的节点的权重矩阵,/>
Figure BDA00042052453400000310
为预存卷积神经网络的编码层中第l层中的节点eh对节点ej的重要程度值。
在一种可能的实现方式中,所述使用预存块对角矩阵对预存模型权重矩阵进行正则化操作,生成每个节点的目标权重矩阵,的计算公式为:
Figure BDA0004205245340000041
式中,b∈[1,B),则
Figure BDA0004205245340000042
为预存模型权重矩阵的块对角矩阵。
在一种可能的实现方式中,所述预存知识图谱包括有效的三元组集合,所述预存图卷积神经网络模型包括多个卷积核;
相应地,所述根据所述编码层节点表示数据、每个节点的目标权重矩阵、所述预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数,的计算公式为:
f(v)=concat((eh,er,et)*ωm))·W
式中,v=(eh,er,et),v∈V,V为预存知识图谱中有效的三元组的集合,V′表示负样本集合,*为卷积操作,ωm表示预存图卷积神经网络模型中的第m个卷积核,其中m为正整数,W为每个节点的目标权重矩阵。
在一种可能的实现方式中,所述根据所述知识图谱优化参数对所述预存图卷积神经网络模型进行训练,的计算公式为:
Figure BDA0004205245340000043
式中,
Figure BDA0004205245340000044
为1或-1,当/>
Figure BDA0004205245340000045
时,表示三元组(eh,er,et)为正样本,当
Figure BDA0004205245340000046
时,表示三元组(eh,er,et)为负样本,L表示损失函数,λ为预设损失常数。
在一种可能的实现方式中,所述预存推荐模型包括二部图;相应地,所述将所述第二知识图谱引入预存推荐模型,生成目标推荐模型,包括:将所述二部图和所述第二知识图谱进行融合处理,生成协同知识图谱;按照预设元路径将所述协同知识图谱拆分成多个同构子图;根据所述多个同构子图,确定每个同构子图的特征参数;对每个同构子图进行聚合融合处理,得到知识图谱嵌入表示数据;将所述知识图谱嵌入表示数据导入所述预存推荐模型,生成目标推荐模型。
第二方面,本申请提供了一种金融产品数据推送装置,包括:
数据处理模块,用于对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据;
所述数据处理模块,还用于对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据;
产品知识图谱构建模块,用于根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据;
所述产品知识图谱构建模块,还用于根据所述图谱建模数据,确定本体领域对象;
所述产品知识图谱构建模块,还用于按照所述本体领域对象对所述图谱建模数据进行本体抽取处理,得到本体概念数据;
所述产品知识图谱构建模块,还用于启动预存本体构建工具,按照所述本体概念数据从所述预存产品数据中得到实例数据;
所述产品知识图谱构建模块,还用于对所述实例数据进行格式转换处理,得到资源描述框架数据;
所述产品知识图谱构建模块,还用于启动预存导入工具将所述资源描述框架数据导入预设图数据库,生成第一知识图谱;
推送模块,用于根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型;
所述推送模块,还用于根据所述第一知识图谱和所述目标学习模型,生成第二知识图谱;
所述推送模块,还用于将所述第二知识图谱引入预存推荐模型,生成目标推荐模型;
所述推送模块,还用于获取目标用户数据,并将所述目标用户数据输入目标推荐模型,生成目标金融产品数据;
所述推送模块,还用于将所述目标金融产品数据推送至目标用户终端。
第三方面,本申请提供了一种金融产品数据推送设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的金融产品数据推送方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的金融产品数据推送方法。
第五方面,本申请提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现第一方面所述的金融产品数据推送方法
本申请提供的金融产品数据推送方法、装置、设备及存储介质,通过对后台服务端的预存用户数据和预存产品数据进行预处理,再进行特征处理,得到图谱特征数据,用于构建知识图谱,以降低减少与金融产品的推送无关的数据对金融产品数据结果的影响,初步提高准确性。再在构建第一知识图谱的过程中减少为确定本体领域、本体抽取得到本体概念数据并启动预存本体构建工具按照本体概念数据从预存产品数据中得到实例数据、对实例数据进行格式化转换处理得到资源描述框架数据以及启动预存导入工具将资源描述框架数据导入预设图数据库,生成第一知识图谱一共四步,减少了构建知识图谱的步骤流程,达到了快速、批量的导入数据,提高了知识图谱的构建效率。还通过根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型,并根据目标学习模型和第一知识图谱,生成第二知识图谱,由于该目标学习模型能更加明确的区分一个实体周围不同关系的重要程度,因此第二知识图谱能用于为后续的目标推荐模型提供更高质量的训练数据。最后将引入第二知识图谱预存推荐模型,生成目标推荐模型。提高了该目标推荐模型生成的目标金融产品数据的准确性和可解释性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的金融产品数据推送方法的应用场景示意图;
图2为本申请实施例提供的金融产品数据推送方法的流程示意图;
图3为本申请实施例提供的一种目标学习模型架构示意图;
图4为本申请实施例提供的一种目标推荐模型架构示意图;
图5为本申请实施例提供的金融产品数据推送装置的结构示意图;
图6为本申请实施例提供的金融产品数据推送设备的结构示意图。
通过上述附图,以示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
目前,在金融行业的飞速发展下,各种金融产品逐渐出现,以满足人们增长的理财需求。面对种类繁多的金融产品,如何提升给用户推送的金融产品的准确性,以满足用户的要求。现有技术中,金融产品的推送一般是先通过调查问卷的形式对用户选择产品偏好的相关信息进行采集,再根据采集的信息进行分析,判断用户属于保守型、稳健型和积极型中的哪种类型,从而根据用户的类型推送对应的金融产品。发明人发现,由于金融市场的飞速发展和快节奏的变化,仅根据用户的类型来推送金融产品,会出现推送的金融产品数据与用户选择金融产品的要求匹配度低的情况,产生推送给用户的金融产品数据的准确性和可解释性较低的问题。
为解决上述技术问题,本申请实施例提供了以下解决问题的技术构思:通过根据用户信息和金融产品信息,使用改进的四步法构建知识图谱,再结合改进的知识图谱表示学习模型GCN-CM从知识图谱中提取知识图谱信息,为推荐模型提供更高质量的知识图谱训练特征。再通过推荐模型先融合成的协同知识图谱分成多个同构子图,并在每个子图中使用注意力机制聚合多跳邻居信息,输出推荐的金融产品信息。由于知识图谱中都是有关联的图谱信息,基于这些图谱信息能提升推荐的金融产品数据的准确性和可解释性。
本申请提供的数据传输的方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
请参考图1,图1为本申请实施例提供的金融产品数据推送方法的应用场景示意图,如图1所示,包括:客户端101和服务端102。
其中,客户端101,可以用于显示、供客户查看金融产品以及供用户输入对应的参数和选择信息,客户端101可以是服务器如计算机,或移动终端如平板、手机或笔记本。服务端102,可以用于调用金融市场相关金融产品的实时产品数据,以及与客户端101进行交互,并根据客户端101发送的信息进行相应的操作,以向客户端101推送对应的金融产品数据。服务端102可以是物理服务器或云服务器。
请参考图2,图2为本申请实施例提供的金融产品数据推送方法的流程示意图,本实施例的执行主体可以为图1所示实施例中的服务端102,也可以是其他的计算机的相关设备,对此本实施例此处不作特别限制。如图2所示,该金融产品数据推送方法包括:
S201:对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据。
本实施例中,预存用户数据可以是经过用户许可的与用户相关的数据或通过问卷调查采集的用户数据。提取处理可以是采用数据提取软件进行自动抓取的方式进行有效数据提取的操作。用户基础数据可以是描述用户基本信息的数据,例如:用户的年龄、性别或职业。预存产品数据可以是服务端存储的金融产品相关的数据,也可以是服务端从金融市场调取的金融产品相关的数据。产品属性数据可以是用于分析金融产品的属性需求时所用数据。例如:金融产品的类型、近一年的涨跌幅和净值。
S202:对产品属性数据和用户基础数据进行特征处理,得到图谱特征数据。
本实施例中,特征处理可以包括归一化处理和嵌入处理。图谱特征数据可以是用于构建知识图谱的特征数据。
具体的,在本申请一可选的实施例中,步骤S202包括:
S202a:对产品属性数据和用户基础数据进行分类处理,得到离散型数据和身份标识数据。
本实施例中,离散型数据可以是只能用自然数或整数单位计算的数据,例如某个用户保有的金融产品个数、金融产品的风险等级和用户的年龄。身份标识数据可以是表示某个用户或金融产品的唯一标识,例如金融产品的编号和用户的编号。
S202b:对离散型数据进行归一化处理,得到归一化特征数据。
S202c:对身份标识数据进行嵌入处理,得到身份标识特征数据。
本实施例中,归一化可以是将有数值的数据或能用数值表示的数据限定在一定范围内的过程,例如该范围是区间0至1或区间-1至1。嵌入处理可以是指将离散变量转为连续向量的过程,例如用户的性别男对应数字1,性别女对应数字0,用户成年对应数字1,未成年对应数字0,则用户A女士是成年人,则经过嵌入处理后,得到一组向量(1,0)。
本实施例中,归一化特征数据可以是被限制在一定数值区间范围内的数值数据,身份标识特征数据可以是用于标识身份标识的向量数据。
S202d:根据归一化特征数据和身份标识特征数据,得到图谱特征数据。
本实施例中,图谱特征数据可以是用于提取构建知识图谱的原始数据的特征类数据。例如该图谱特征数据可以是向量和表示语义的数字段。
S203:根据图谱特征数据和预存产品数据,确定图谱建模数据。
本实施例中,图谱建模数据可以是组成知识图谱的组成数据,例如:图谱特征数据可以是三元组数据。得到图谱特征数据的整个过程可以包括属性抽取、关系抽取和实体抽取,其中,属性抽取和实体抽取属于命名实体识别,例如经过关系抽取和实体抽取后,得到金融产品的负责销售人员、金融产品的所属公司等信息实体。
具体地,在本申请一可选的实施例中,步骤S203包括:根据图谱特征数据,确定图谱实体数据,并根据图谱实体数据和图谱特征数据,确定图谱属性数据;
S203a:启动预存语义分析工具对预存产品数据和图谱实体数据进行语义分析,生成实体关系数据。
本实施例中,预存语义分析工具可以用于抽取两个或多个实体之间的语义关系,预存语义分析工具可以是封装好的工具库。例如:预存语义分析工具可以是NLTK(naturallanguage toolkit,自然语义处理工具集)或Stanford CoreNLP(Stanford Core NaturalLanguage Processing,斯坦福核心自然语言处理工具)。实体关系数据可以是两个或多个实体与实体之间的语义关系,例如:“用户A的1号金融产品的产品经理为张三,张三就职于X公司。”,则实体“张三”与实体“1号金融产品”之间的语义关系为“产品经理为”,实体“张三”与实体“X公司”之间的语义关系为“就职于”。
S203b:对预存产品数据进行知识融合处理,确定标准图谱实体数据。
S203c:将标准图谱实体数据、图谱属性数据和实体关系数据存为图谱建模数据。
本实施例中,知识融合处理可以是统一实体的表达、消除预存产品数据中存在的矛盾和歧义,以完成对不同文本中相近的实体进行筛选。知识融合处理可以采用手动预先定义标准的方式,例如:同时出现“产品经理、经理”,则将这类信息统一称为“产品经理”。
S204:根据图谱建模数据,确定本体领域对象。
本实施例中,本体领域对象可以是描述待构建知识图谱的本体的专业领域或范畴的概括词。例如:确定的本体领域对象可以是金融产品。确定本体领域对象的过程可以是如人为确定或软件自动确定。
S205:按照本体领域对象对图谱建模数据进行本体抽取处理,得到本体概念数据。
本实施例中,本体抽取处理可以是从图谱建模数据中进行索引和提取处理,具体可以采用提取工具如Python程序脚本。本体概念数据可以是与含本体领域的数据,例如:本体领域为金融产品,则本体概念数据可以包括金融产品购入或售出范围、金融产品的发布时间、金融产品的规模、金融产品的托管人和金融产品的管理人等。
S206:启动预存本体构建工具,按照本体概念数据从预存产品数据中得到实例数据。
本实施例中,预存本体构建工具可以是本体建模工具,例如:该预存本体构建工具可以是本体编辑和知识获取软件Protégé中的内置模块Cellfie插件,该插件用于将电子表格数据导入owl本体。具体使用预存本体构建工具的过程可以是:先在工具栏中点击“Create axioms from Excel”,导入电子表格形式的金融产品数据,以形成实例数据。
S207:对实例数据进行格式转换处理,得到资源描述框架数据。
本实施例中,格式转换处理可以采用格式转换工具从一种数据形式转换到另一种数据形式的过程。例如:使用定义资源框架工具rdf2rdf包,再输入命令行,即可将生成的OWL(Ontology Wed Language,网络本体语言)数据转换成RDF(Resource DescriptionFramework,资源描述框架)数据。
S208:启动预存导入工具将资源描述框架数据导入预设图数据库,生成第一知识图谱。
本实施例中,预存导入工具可以是脚本或可执行语句,例如:可以是图形数据库查询Cypher语句。将从步骤S207转换处理得到的RDF数据导入预存图数据库。预存图数据可以是面向网络结构的数据库,例如:该预存图数据库可以是Neo4j图数据库。
S209:根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型。
本实施例中,多关系共现矩阵可以是行数与列数相等,且对角线为1的矩阵。预存图卷积神经网络模型GCN可以是采用卷积操作的图神经网络。目标学习模型可以是知识图谱表示学习模型。
具体的,在本申请一可选的实施例中,步骤S209包括:
S209a:根据预存图卷积神经网络模型,确定多个节点。
S209b:根据预建多关系共现矩阵和多个节点,确定每两个节点之间的关系重要性系数和关系类型数据。
本实施例中,预存图卷积神经网络模型的输入可以是神经网络的节点和边,输出为多个节点,多个节点包括每个节点的特征信息。预建多关系共现矩阵可以是人为设定的共现矩阵,应用于多关系数据建模,以区分一个实体周围不同关系之间的重要程度。
在上述实施例的基础上,作为本申请一可选的实施例,步骤S209b的计算公式为:
Figure BDA0004205245340000101
式中,
Figure BDA0004205245340000102
为大小是R×R且对角线为1的预建多关系共现矩阵,其中R为正整数,ri为节点e的第i批节点之间的关系类型,rj为节点e的第j批节点之间的关系类型,其中r和j均为正整数,sum(e,ri)为节点e的相邻的节点中关系类型是ri的边数之和,sum(e,rj)为节点e的相邻的节点中关系类型是rj的边数之和,/>
Figure BDA0004205245340000111
为关系类型ri对关系类型rj的重要性系数,|R|为节点e周围所有关系类型的总个数。
本实施例中,关系类型可以是描述两个节点关系的表示,例如:“张三的金融产品是产品A”,联系上下文信息,可知,关系类型可以表述为“用户,金融产品,产品A”。
示例性的,当多个节点中的节点e通过关系ri与节点e1和e2建立联系,通过关系rj节点e3建立联系,则根据矩阵计算方法可知,C[ri][rj]=C[rj][ri]=2,以此类推,再利用上述实施例中的公式
Figure BDA0004205245340000112
计算出整个多关系共现矩阵的值中数值最大的值。
S209c:根据所有的关系重要性系数和关系类型数据,确定每两个节点中其中一个节点对另一个节点的重要程度值。
本实施例中,关系重要性系数为邻居节点与目标节点之间通过关系x连接,在邻居节点和关系x共同出现频率高的关系y的重要性,用于为该关系y分配更大的权重。关系类型数据可以包括多个关系类型,例如:关系类型ri和关系类型rj
以上述实施例为基础,在本申请一可选的实施例中,步骤S209中,确定每两个节点中其中一个节点对另一个节点的重要程度值的计算公式为:
Figure BDA0004205245340000113
式中,
Figure BDA0004205245340000114
为节点ej在关系ri下对目标节点eh的重要程度值,/>
Figure BDA0004205245340000115
为节点ej周围的节点数。
S209d:根据所有的重要程度值和预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据。
本实施例中,预存待训练数据可以是预先经过数据提取处理的特征数据组成的矩阵。例如预存待训练数据可以包括用户名、实时金融产品数据和管理金融产品的产品经理等实体特征数据。
在本申请一可选的实施例中,预存图卷积神经网络模型包括多个编码层,步骤S209d中,生成每一个节点对应的编码层节点表示数据,的计算公式为:
Figure BDA0004205245340000116
式中,eh (l+1)为预存卷积神经网络的编码层中第l+1层的一个节点eh的编码层节点表示数据,
Figure BDA0004205245340000117
为节点eh周围的节点数,/>
Figure BDA0004205245340000118
为不同的关系类型r下需要学习的权重矩阵,
Figure BDA0004205245340000121
表示与其他节点之间无关系类型的节点的权重矩阵,/>
Figure BDA0004205245340000122
为预存卷积神经网络的编码层中第l层中的节点eh对节点ej的重要程度值。
本实施例中,与其他节点之间无关系类型指的是自连接。多个编码层能用于传递多跳信息,当第一层代表输入特征,在处理节点自连接时使用线性变换,则第一层的输入特征为独热One-Hot编码。
S209e:在训练预存图卷积神经网络模型时,使用预存块对角矩阵对预存模型权重矩阵Wr进行正则化操作,生成每个节点的目标权重矩阵。
本实施例中,预存块对角矩阵可以是方形对角块组成的分块矩阵。正则化操作指的是将矩阵转换成可逆的矩阵的过程。
作为本申请一可选的实施例,步骤S209e中生成每个节点的目标权重矩阵,的计算公式为:
Figure BDA0004205245340000123
式中,b∈[1,B),则
Figure BDA0004205245340000124
为预存模型权重矩阵的块对角矩阵。
S209f:根据编码层节点表示数据、每个节点的目标权重矩阵、预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数。
本实施例中,知识图谱优化参数可以最满足正确的知识图谱组成要求的知识图谱单元数据,例如:经过评分优化参数计算得到的分数越高的三元组,越有可能是正确的并能用于构建知识图谱的三元组。
在本申请一可选的实施例中,步骤S209f中确定知识图谱优化参数,的计算公式为:
f(v)=concat((eh,er,et)*ωm))·W
式中,v=(eh,er,et),v∈V,V为预存知识图谱中有效的三元组的集合,V′表示负样本集合,*为卷积操作,ωm表示预存图卷积神经网络模型中的第m个卷积核,其中m为正整数,W为每个节点的目标权重矩阵。
本实施例中,V′相对于V,是当模型训练的时候,在知识图谱中不应该有关联的一些三元组被标记为负样本,用于确定知识图谱优化参数的计算公式中的损失函数的计算,迭代优化模型参数。
S209g:根据知识图谱优化参数对预存图卷积神经网络模型进行训练,构建目标学习模型。
请参考图3,图3为本申请实施例提供的一种目标学习模型架构示意图。如图3所示,该目标学习模型包括输入层、编码层、隐藏层和解码层,本实施例中,目标学习模型的获取过程对预存图卷积神经网络模型进行不断的模型训练得到的。
以上述实施例为基础,在本申请一可选的实施例中,步骤S209g中对预存图卷积神经网络模型进行训练,的计算公式为:
Figure BDA0004205245340000131
式中,
Figure BDA0004205245340000132
为1或-1,当/>
Figure BDA0004205245340000133
时,表示三元组(eh,er,et)为正样本,当
Figure BDA0004205245340000134
时,表示三元组(eh,er,et)为负样本,L表示损失函数,λ为预设损失常数。
本实施例中,对预存图卷积神经网络模型训练可以使用损失函数soft-margin。正样本指的是属于同一类的样本数据,负样本指的是不属于某一类别的样本数据。预设损失常数可以是人为设定的数值,例如:预设损失常数可以是1或0.5。
S2010:根据第一知识图谱和目标学习模型,生成第二知识图谱。
本实施例中,第二知识图谱为第一知识图谱中所有的图谱单元经过上述实施例筛选优化后得到的图谱单元组成的。
S2011:将第二知识图谱引入预存推荐模型,生成目标推荐模型。
本实施例中,预存推荐模型可以是融合协同知识图谱的推荐模型,例如:CKG-HAN(Collaborative Knowledge Graph Hierarchical Attention Network,融合协同过滤信息的知识图注意力网络)模型。目标推荐模型可以是使用外部知识图谱与预存推荐模型进行训练得到的推荐模型。
S2012:获取目标用户数据,并将目标用户数据输入目标推荐模型,生成目标金融产品数据。
本实施例中,目标用户数据指的是需要被推送的目标用户的相关数据,例如:填写金融产品购入前的评测问卷中的与用户相关的基本描述性数据。将目标用户数据输入目标推荐模型后,经过目标推荐模型的计算,输出目标金融产品数据。其中,目标金融产品数据可以是为目标用户个性化定制的金融产品数据。例如:目标金融产品数据可以包括多个金融产品的基本信息、购入时间、购入价格、卖出时间和卖出价格、预期收益等金融产品描述性数据的推荐列表。
S2013:将目标金融产品数据推送至目标用户终端。
本实施例中,推送目标金融产品可采用通信传输的方式,目标用户终端可以包括目标用户的手机、电脑、平板或智能手表等能够展示目标金融产品数据的终端设备。
综上,本申请实施例提供的金融产品数据推送方法,先通过对后台服务端的预存用户数据和预存产品数据进行预处理,再进行特征处理,得到图谱特征数据,用于构建知识图谱,以降低减少与金融产品的推送无关的数据对金融产品数据结果的影响,初步提高准确性。再在构建第一知识图谱的过程中减少为确定本体领域、本体抽取得到本体概念数据并启动预存本体构建工具按照本体概念数据从预存产品数据中得到实例数据、对实例数据进行格式化转换处理得到资源描述框架数据以及启动预存导入工具将资源描述框架数据导入预设图数据库,生成第一知识图谱一共四步,减少了构建知识图谱的步骤流程,达到了快速、批量的导入数据,提高了知识图谱的构建效率。还通过根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型,并根据目标学习模型和第一知识图谱,生成第二知识图谱,由于该目标学习模型能更加明确的区分一个实体周围不同关系的重要程度,因此第二知识图谱能用于为后续的目标推荐模型提供更高质量的训练数据。最后将引入第二知识图谱预存推荐模型,生成目标推荐模型。使用该目标推荐模型生成的目标金融产品数据的准确性和可解释性更高。
在上述实施例的基础上,作为本申请一可选的实施例,步骤S201具体包括:
S201a:执行预存预处理脚本从预存产品数据中提取产品类型数据、产品价格变动数据、产品评级数据和产品源数据,将产品类型数据、产品价格变动数据、产品评级数据和产品源数据确定为产品属性数据。
S201b:执行预存预处理脚本从用户基础数据中提取用户描述数据和用户偏好数据,就用户描述数据和用户偏好数据确定为用户基础数据。
本实施例中,预存预处理脚本可以是数据抓取Python脚本。产品类型数据可以是根据产品所属行业分类得到的类型。例如:例如产品类型可以包括机械类、白酒类、服务类和半导体类等。产品价格变动数据可以是产品的在固定时间段内的价格上涨值和价格下跌值。产品评级数据可以是产品的是否值得购入的等级。产品源数据可以包括产品所属公司、负责该产品的产品经理和产品的市场规模。用户基础数据可以包括:年龄,收入,职业和购入金融产品的个人偏好。
请参考图4,图4为本申请实施例提供的一种目标推荐模型架构示意图。如图3所示,该目标推荐模型包括输入层、节点注意力层、高阶信息聚合层、关系注意力层和输出层。其中,输入层中包括经过预处理的二部图和预处理的第二知识图谱形融合成的协同知识图谱,该协同知识图谱根据手动构建的元路径将其分成多个同构子图输入节点注意力层,再经过高阶信息聚合层,最后经由关系注意力层输出。
具体地,以上述实施例的基础上,在本申请一可选的实施例中,步骤S2011包括:
步骤a:将二部图和第二知识图谱进行融合处理,生成协同知识图谱。
步骤b:按照预设元路径将协同知识图谱拆分成多个同构子图。
步骤c:根据多个同构子图,确定每个同构子图的特征参数。
步骤d:对每个同构子图进行聚合融合处理,得到知识图谱嵌入表示数据。
步骤e:将知识图谱嵌入表示数据导入预存推荐模型,生成目标推荐模型。
本实施例中,步骤a在输入层中进行,步骤b在节点注意力层进行。节点注意力层的计算过程如下:A:由于知识图谱中的节点具有异构性,不同类型的节点具有不同的特征空间,所以首先需要一个变换矩阵,将不同类型LeakyReLU征投影到同一特征空间中,其中,变换过程的计算公式为:
Figure BDA0004205245340000151
式中:hi'表示投影特征;
Figure BDA0004205245340000152
表示变换矩阵;hi表示原始特征。通过变换操作,节点注意力层可以处理不同类型的节点。
B:在考虑邻居节点对目标节点的重要性时,注意力机制不仅能够加速模型训练的过程,而且能够很好地捕捉局部信息,很适合学习邻居节点对目标节点的重要程度。其中,注意力系数的计算公式为:
Figure BDA0004205245340000153
式中:
Figure BDA0004205245340000154
表示注意力系数,/>
Figure BDA0004205245340000155
表示用于调整向量的形状一个可学习的向量,Φ表示元路径,||表示拼接操作,h'j表示邻居节点j的特征,本实施例中可采用激活函数LeakyReLU。
如图3所示,高阶聚合层用可以叠加多层,在高阶聚合层中,使用
Figure BDA0004205245340000156
表示/>
Figure BDA0004205245340000157
进行归一化操作。根据系数/>
Figure BDA0004205245340000158
对同一元路径下的邻居节点信息进行有区别地聚合。上述过程只聚合了一跳邻居的信息,没有获取到更深层的、潜在的关系信息。需要设置一个高阶信息聚合层,通过叠加多层,使消息传递能够从一跳扩展到多跳。此外,由于异构图具有无标度性,节点之间的连接分布不均:部分节点关联的节点非常多,部分节点关联的节点非常少。为解决上述问题,因此,还需进行如下步骤:
C:重复若干次计算注意力系数的操作,获取更多邻居节点的信息。步骤C的计算公式为:
Figure BDA0004205245340000159
式中:
Figure BDA00042052453400001510
表示多头注意力机制的节点特征;||表示拼接操作;/>
Figure BDA00042052453400001511
表示节点j是节点i在同一子图中的邻居。
本实施例中,若干次计算注意力系数的操作可以是多头注意力机制。步骤C只聚合了一跳邻居的信息,没有获取更深层的、潜在的关系信息。因此还需要设置一个高阶信息聚合层。
D:高阶信息聚合层采用一个聚合函数
Figure BDA0004205245340000161
实现,考虑两种特征之间的相互作用,步骤D采用的计算公式为:
Figure BDA0004205245340000162
式中:W1和W2是线性变换矩阵;⊙表示两个矩阵的对应位置相乘。经过多个高阶信息聚合层,相当于向外扩展了多跳。因为从第二层开始,每个聚合层的输入是上一层的输出,具体的层数作为超参数。
最后,每个节点都可能会出现在多个同构子图中,节点在这些同构子图中拥有不同的特征,本实施例中,可采用
Figure BDA0004205245340000163
表示,其中,{Φ1,…,Φp}表示原路径集合。
E:定义一个用于学习的向量与一个全连接层,获得注意力系数。步骤E的计算公式为:
Figure BDA0004205245340000164
式中:
Figure BDA0004205245340000165
表示注意力系数,ν表示节点i出现在不同子图中,qT表示一个可学习的向量,主要用来调整向量的形状,b表示偏置项,本实施例中,可采用激活函数tanh。
F:对注意力系数进行归一化处理,得到学习的注意力系数。
G:根据学习的注意力系数,聚合节点在不同的同构子图中的特征。
本实施中,可采用损失函数BPR为得出输出值。步骤G的计算公式为:
Figure BDA0004205245340000166
式中:Ω={(u,i,j)|(u,i)∈I+,(u,j)∈I-}表示训练集,I+表示正样本,I-表示负样本;y(u,i)表示用户u与产品相关事件i存在交互的概率;σ表示非线性激活函数。
综上,本申请实施例提供的金融产品数据推送方法,通过用一个变换矩阵,将不同类型节点的特征投影到同一特征空间中,并用注意力机制加速模型目标推荐的训练过程,更好的捕捉局部信息,再使用多头注意力机制稳定模型学习的过程,以获取更多邻居节点的信息。在高阶信息聚合层中,还通过叠加多层,使消息传递能够从一跳扩展到多跳。还使用了BPR损失函数,让正样本和负样本之间得分之差尽可能大,为已知的用户与金融产品间的交互分配更高的分数,以得到准确性和可解释性更高的金融产品数据进行推送。
请参考图5,图5为本申请实施例提供的金融产品数据推送装置的结构示意图。如图5所示,该金融产品数据推送装置,包括:数据处理模块51、产品知识图谱构建模块52和推送模块53。
其中,数据处理模块51,用于对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据。
数据处理模块51,还用于对产品属性数据和用户基础数据进行特征处理,得到图谱特征数据。
产品知识图谱构建模块52,用于根据图谱特征数据和预存产品数据,确定图谱建模数据。
产品知识图谱构建模块52,还用于根据图谱建模数据,确定本体领域对象。
产品知识图谱构建模块52,还用于按照本体领域对象对图谱建模数据进行本体抽取处理,得到本体概念数据。
产品知识图谱构建模块52,还用于启动预存本体构建工具,按照本体概念数据从预存产品数据中得到实例数据。
产品知识图谱构建模块52,还用于对实例数据进行格式转换处理,得到资源描述框架数据。
产品知识图谱构建模块52,还用于启动预存导入工具将资源描述框架数据导入预设图数据库,生成第一知识图谱。
推送模块53,用于根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型。
推送模块53,还用于根据第一知识图谱和目标学习模型,生成第二知识图谱。
推送模块53,还用于将第二知识图谱引入预存推荐模型,生成目标推荐模型。
推送模块53,还用于获取目标用户数据,并将目标用户数据输入目标推荐模型,生成目标金融产品数据。
推送模块53,还用于将目标金融产品数据推送至目标用户终端。
在本申请一可选的实施例中,数据处理模块51,具体用于:执行预存预处理脚本从预存产品数据中提取产品类型数据、产品价格变动数据、产品评级数据和产品源数据,将产品类型数据、产品价格变动数据、产品评级数据和产品源数据确定为产品属性数据。执行预存预处理脚本从用户基础数据中提取用户描述数据和用户偏好数据,就用户描述数据和用户偏好数据确定为用户基础数据。
在本申请一可选的实施例中,数据处理模块51,还具体用于:对产品属性数据和用户基础数据进行分类处理,得到离散型数据和身份标识数据。对离散型数据进行归一化处理,得到归一化特征数据。对身份标识数据进行嵌入处理,得到身份标识特征数据。根据归一化特征数据和身份标识特征数据,得到图谱特征数据。
在本申请一可选的实施例中,产品知识图谱构建模块52,具体用于:根据图谱特征数据,确定图谱实体数据,并根据图谱实体数据和图谱特征数据,确定图谱属性数据。启动预存语义分析工具对预存产品数据和图谱实体数据进行语义分析,生成实体关系数据。对预存产品数据进行知识融合处理,确定标准图谱实体数据。将标准图谱实体数据、图谱属性数据和实体关系数据存为图谱建模数据。
在本申请一可选的实施例中,产品知识图谱构建模块52,还具体用于:根据预存图卷积神经网络模型,确定多个节点。根据预建多关系共现矩阵和多个节点,确定每两个节点之间的关系重要性系数和关系类型数据。根据所有的关系重要性系数和关系类型数据,确定每两个节点中其中一个节点对另一个节点的重要程度值。根据所有的重要程度值和预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据。在训练预存图卷积神经网络模型时,使用预存块对角矩阵对预存模型权重矩阵Wr进行正则化操作,生成每个节点的目标权重矩阵。根据编码层节点表示数据、每个节点的目标权重矩阵、预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数。根据知识图谱优化参数对预存图卷积神经网络模型进行训练,构建目标学习模型。
在本申请一可选的实施例中,产品知识图谱构建模块52,用于确定每两个节点之间的关系重要性系数和关系类型数据,的计算公式为:
Figure BDA0004205245340000181
式中,
Figure BDA0004205245340000182
为大小是R×R且对角线为1的预建多关系共现矩阵,其中R为正整数,ri为节点e的第i批节点之间的关系类型,rj为节点e的第j批节点之间的关系类型,其中r和j均为正整数,sum(e,ri)为节点e的相邻的节点中关系类型是ri的边数之和,sum(e,rj)为节点e的相邻的节点中关系类型是rj的边数之和,/>
Figure BDA0004205245340000183
为关系类型ri对关系类型rj的重要性系数,|R|为节点e周围所有关系类型的总个数。
在本申请一可选的实施例中,产品知识图谱构建模块52,用于生成每一个节点对应的编码层节点表示数据,的计算公式为:
Figure BDA0004205245340000191
式中,eh (l+1)为预存卷积神经网络的编码层中第l+1层的一个节点eh的编码层节点表示数据,
Figure BDA0004205245340000192
为节点eh周围的节点数,/>
Figure BDA0004205245340000193
为不同的关系类型r下需要学习的权重矩阵,
Figure BDA0004205245340000194
表示与其他节点之间无关系类型的节点的权重矩阵,/>
Figure BDA0004205245340000195
为预存卷积神经网络的编码层中第l层中的节点eh对节点ej的重要程度值。
在本申请一可选的实施例中,产品知识图谱构建模块52,用于生成每个节点的目标权重矩阵,的计算公式为:
Figure BDA0004205245340000196
式中,b∈[1,B),则
Figure BDA0004205245340000197
为预存模型权重矩阵的块对角矩阵。
在本申请一可选的实施例中,预存知识图谱包括有效的三元组集合,预存图卷积神经网络模型包括多个卷积核,相应地,产品知识图谱构建模块52,用于确定知识图谱优化参数,的计算公式为:
f(v)=concat((eh,er,et)*ωm))·W
式中,v=(eh,er,et),v∈V,V为预存知识图谱中有效的三元组的集合,V′表示负样本集合,*为卷积操作,ωm表示预存图卷积神经网络模型中的第m个卷积核,其中m为正整数,W为每个节点的目标权重矩阵。
在本申请一可选的实施例中,产品知识图谱构建模块52,用于对预存图卷积神经网络模型进行训练,的计算公式为:
Figure BDA0004205245340000198
式中,
Figure BDA0004205245340000199
为1或-1,当/>
Figure BDA00042052453400001910
时,表示三元组(eh,er,et)为正样本,当
Figure BDA00042052453400001911
时,表示三元组(eh,er,et)为负样本,L表示损失函数,λ为预设损失常数。
在本申请一可选的实施例中,预存推荐模型包括二部图,相应地,推送模块53,具体用于:相应地,将第二知识图谱引入预存推荐模型,生成目标推荐模型,包括:将二部图和第二知识图谱进行融合处理,生成协同知识图谱。按照预设元路径将协同知识图谱拆分成多个同构子图。根据多个同构子图,确定每个同构子图的特征参数。对每个同构子图进行聚合融合处理,得到知识图谱嵌入表示数据。将知识图谱嵌入表示数据导入预存推荐模型,生成目标推荐模型。
本实施例提供的金融产品数据推送装置,可用于执行上述方法实施例的技术方案,其实现原理与技术效果类似,本实施例此处不再赘述。
请参考图6,图6为本申请实施例提供的金融产品数据推送设备的结构示意图,如图6所示,该设备包括:至少一个处理器601以及存储器602。
其中,处理器601,用于存储计算机执行指令。
存储器602,用于执行存储器存储的计算机执行指令,以实现上述方法实施例中所涉及的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,存储器602既可以是独立的,也可以跟处理器601集成在一起。
当存储器602独立设置时,该设备还包括总线603,用于连接存储器602和处理器601。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行命令时,实现如上的金融产品数据推送方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上的金融产品数据推送方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块组成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例的方法的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外部设备互连(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序命令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
需要说明的是,本申请实施例提供的金融产品数据推送方法、装置、设备、存储介质及产品可用于大数据技术领域。也可用于除大数据技术领域以外的任意领域。本申请实施例提供的金融产品数据推送方法、装置、设备、存储介质及产品的应用领域不作限定。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (16)

1.一种金融产品数据推送方法,其特征在于,包括:
对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据;
对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据;
根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据;
根据所述图谱建模数据,确定本体领域对象;
按照所述本体领域对象对所述图谱建模数据进行本体抽取处理,得到本体概念数据;
启动预存本体构建工具,按照所述本体概念数据从所述预存产品数据中得到实例数据;
对所述实例数据进行格式转换处理,得到资源描述框架数据;
启动预存导入工具将所述资源描述框架数据导入预设图数据库,生成第一知识图谱;
根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型;
根据所述第一知识图谱和所述目标学习模型,生成第二知识图谱;
将所述第二知识图谱引入预存推荐模型,生成目标推荐模型;
获取目标用户数据,并将所述目标用户数据输入目标推荐模型,生成目标金融产品数据;
将所述目标金融产品数据推送至目标用户终端。
2.根据权利要求1所述的方法,其特征在于,所述对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据,包括:
执行预存预处理脚本从所述预存产品数据中提取产品类型数据、产品价格变动数据、产品评级数据和产品源数据,将所述产品类型数据、产品价格变动数据、产品评级数据和产品源数据确定为产品属性数据;
执行所述预存预处理脚本从所述用户基础数据中提取用户描述数据和用户偏好数据,就用户描述数据和用户偏好数据确定为用户基础数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据,包括:
对所述产品属性数据和所述用户基础数据进行分类处理,得到离散型数据和身份标识数据;
对所述离散型数据进行归一化处理,得到归一化特征数据;
对所述身份标识数据进行嵌入处理,得到身份标识特征数据;
根据所述归一化特征数据和所述身份标识特征数据,得到图谱特征数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据,包括:
根据所述图谱特征数据,确定图谱实体数据,并根据所述图谱实体数据和所述图谱特征数据,确定图谱属性数据;
启动预存语义分析工具对所述预存产品数据和所述图谱实体数据进行语义分析,生成实体关系数据;
对所述预存产品数据进行知识融合处理,确定标准图谱实体数据;
将所述标准图谱实体数据、所述图谱属性数据和所述实体关系数据存为图谱建模数据。
5.根据权利要求1所述的方法,其特征在于,所述根据预建多关系共现矩阵和预存图卷积神经网络模型,确定目标学习模型,包括:
根据所述预存图卷积神经网络模型,确定多个节点;
根据预建多关系共现矩阵和所述多个节点,确定每两个节点之间的关系重要性系数和关系类型数据;
根据所有的关系重要性系数和关系类型数据,确定每两个节点中其中一个节点对另一个节点的重要程度值;
根据所有的重要程度值和所述预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据;
在训练所述预存图卷积神经网络模型时,使用预存块对角矩阵对预存模型权重矩阵Wr进行正则化操作,生成每个节点的目标权重矩阵;
根据所述编码层节点表示数据、每个节点的目标权重矩阵、所述预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数;
根据所述知识图谱优化参数对所述预存图卷积神经网络模型进行训练,构建目标学习模型。
6.根据权利要求5所述的方法,其特征在于,所述根据预建多关系共现矩阵和所述多个节点,确定每两个节点之间的关系重要性系数和关系类型数据,的计算公式为:
Figure FDA0004205245310000021
式中,
Figure FDA0004205245310000022
为大小是R×R且对角线为1的预建多关系共现矩阵,其中R为正整数,ri为节点e的第i批节点之间的关系类型,rj为节点e的第j批节点之间的关系类型,其中r和j均为正整数,sum(e,ri)为节点e的相邻的节点中关系类型是ri的边数之和,sum(e,rj)为节点e的相邻的节点中关系类型是rj的边数之和,/>
Figure FDA0004205245310000031
为关系类型ri对关系类型rj的重要性系数,|R|为节点e周围所有关系类型的总个数。
7.根据权利要求6所述的方法,其特征在于,根据所有的关系重要性系数和节点关系,确定每两个节点中其中一个节点对另一个节点的重要程度值,的计算公式为:
Figure FDA0004205245310000032
式中,
Figure FDA0004205245310000033
为节点ej在关系ri下对目标节点eh的重要程度值,/>
Figure FDA0004205245310000034
为节点ej周围的节点数。
8.根据权利要求7所述的方法,其特征在于,所述预存图卷积神经网络模型包括多个编码层;
相应地,所述根据所有的重要程度值和所述预存图卷积神经网络模型,将预存待训练数据在每一个节点上进行消息传递,生成每一个节点对应的编码层节点表示数据,的计算公式为:
Figure FDA0004205245310000035
式中,eh (l+1)为预存卷积神经网络的编码层中第l+1层的一个节点eh的编码层节点表示数据,
Figure FDA0004205245310000036
为节点eh周围的节点数,/>
Figure FDA0004205245310000037
为不同的关系类型r下需要学习的权重矩阵,/>
Figure FDA0004205245310000038
表示与其他节点之间无关系类型的节点的权重矩阵,/>
Figure FDA0004205245310000039
为预存卷积神经网络的编码层中第l层中的节点eh对节点ej的重要程度值。
9.根据权利要求8所述的方法,其特征在于,所述使用预存块对角矩阵对预存模型权重矩阵进行正则化操作,生成每个节点的目标权重矩阵,的计算公式为:
Figure FDA00042052453100000310
式中,b∈[1,B),则
Figure FDA00042052453100000311
为预存模型权重矩阵的块对角矩阵。
10.根据权利要求5所述的方法,其特征在于,所述预存知识图谱包括有效的三元组集合,所述预存图卷积神经网络模型包括多个卷积核;
相应地,所述根据所述编码层节点表示数据、每个节点的目标权重矩阵、所述预存图卷积神经网络模型和预存知识图谱,确定知识图谱优化参数,的计算公式为:
f(v)=concat((eh,er,et)*ωm))·W
式中,v=(eh,er,et),v∈V,V为预存知识图谱中有效的三元组的集合,V′表示负样本集合,*为卷积操作,ωm表示预存图卷积神经网络模型中的第m个卷积核,其中m为正整数,W为每个节点的目标权重矩阵。
11.根据权利要求10所述的方法,其特征在于,所述根据所述知识图谱优化参数对所述预存图卷积神经网络模型进行训练,的计算公式为:
Figure FDA0004205245310000041
式中,
Figure FDA0004205245310000042
为1或-1,当/>
Figure FDA0004205245310000043
时,表示三元组(eh,er,et)为正样本,当/>
Figure FDA0004205245310000044
时,表示三元组(eh,er,et)为负样本,L表示损失函数,λ为预设损失常数。
12.根据权利要求1所述的方法,其特征在于,所述预存推荐模型包括二部图;
相应地,所述将所述第二知识图谱引入预存推荐模型,生成目标推荐模型,包括:
将所述二部图和所述第二知识图谱进行融合处理,生成协同知识图谱;
按照预设元路径将所述协同知识图谱拆分成多个同构子图;
根据所述多个同构子图,确定每个同构子图的特征参数;
对每个同构子图进行聚合融合处理,得到知识图谱嵌入表示数据;
将所述知识图谱嵌入表示数据导入所述预存推荐模型,生成目标推荐模型。
13.一种金融产品数据推送装置,其特征在于,包括:
数据处理模块,用于对预存用户数据进行提取处理,得到用户基础数据,并对预存产品数据进行提取处理,得到产品属性数据;
所述数据处理模块,还用于对所述产品属性数据和所述用户基础数据进行特征处理,得到图谱特征数据;
产品知识图谱构建模块,用于根据所述图谱特征数据和所述预存产品数据,确定图谱建模数据;
所述产品知识图谱构建模块,还用于根据所述图谱建模数据,确定本体领域对象;
所述产品知识图谱构建模块,还用于按照所述本体领域对象对所述图谱建模数据进行本体抽取处理,得到本体概念数据;
所述产品知识图谱构建模块,还用于启动预存本体构建工具,按照所述本体概念数据从所述预存产品数据中得到实例数据;
所述产品知识图谱构建模块,还用于对所述实例数据进行格式转换处理,得到资源描述框架数据;
所述产品知识图谱构建模块,还用于启动预存导入工具将所述资源描述框架数据导入预设图数据库,生成第一知识图谱;
推送模块,用于根据预建多关系共现矩阵和预存图卷积神经网络模型,构建目标学习模型;
所述推送模块,还用于根据所述第一知识图谱和所述目标学习模型,生成第二知识图谱;
所述推送模块,还用于将所述第二知识图谱引入预存推荐模型,生成目标推荐模型;
所述推送模块,还用于获取目标用户数据,并将所述目标用户数据输入目标推荐模型,生成目标金融产品数据;
所述推送模块,还用于将所述目标金融产品数据推送至目标用户终端。
14.一种金融产品数据推送设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至12任一项所述的金融产品数据推送方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至12任一项所述的金融产品数据推送方法。
16.一种计算机程序产品,其特征在于,包括计算机指令,该计算机指令被处理器执行时实现权利要求1至12任一项所述的金融产品数据推送方法。
CN202310475129.7A 2023-04-27 2023-04-27 金融产品数据推送方法、装置、设备及存储介质 Pending CN116401379A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310475129.7A CN116401379A (zh) 2023-04-27 2023-04-27 金融产品数据推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310475129.7A CN116401379A (zh) 2023-04-27 2023-04-27 金融产品数据推送方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116401379A true CN116401379A (zh) 2023-07-07

Family

ID=87017966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310475129.7A Pending CN116401379A (zh) 2023-04-27 2023-04-27 金融产品数据推送方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116401379A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629984A (zh) * 2023-07-24 2023-08-22 中信证券股份有限公司 基于嵌入模型的产品信息推荐方法、装置、设备和介质
CN117194771A (zh) * 2023-08-01 2023-12-08 广东工业大学 一种图模型表征学习的动态知识图谱服务推荐方法
CN118296244A (zh) * 2024-06-06 2024-07-05 光合新知(北京)科技有限公司 基于用户个性化定制的教育资源推荐方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629984A (zh) * 2023-07-24 2023-08-22 中信证券股份有限公司 基于嵌入模型的产品信息推荐方法、装置、设备和介质
CN116629984B (zh) * 2023-07-24 2024-02-06 中信证券股份有限公司 基于嵌入模型的产品信息推荐方法、装置、设备和介质
CN117194771A (zh) * 2023-08-01 2023-12-08 广东工业大学 一种图模型表征学习的动态知识图谱服务推荐方法
CN118296244A (zh) * 2024-06-06 2024-07-05 光合新知(北京)科技有限公司 基于用户个性化定制的教育资源推荐方法及系统

Similar Documents

Publication Publication Date Title
CN108876600A (zh) 预警信息推送方法、装置、计算机设备和介质
CN111582538B (zh) 一种基于图神经网络的社群价值预测方法及系统
CN116401379A (zh) 金融产品数据推送方法、装置、设备及存储介质
CN112418653A (zh) 一种基于机器学习算法的携号转网潜客识别系统及方法
CN112381154A (zh) 预测用户概率的方法、装置和计算机设备
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
CN111461225B (zh) 客户聚类系统及其方法
CN108572988A (zh) 一种房产评估数据生成方法和装置
CN112232944B (zh) 一种评分卡创建方法、装置和电子设备
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN118013120B (zh) 基于聚类标签优化推荐给用户的产品的方法、介质和设备
CN114493686A (zh) 一种运营内容生成推送方法及装置
Feldman et al. A methodology for quantifying the effect of missing data on decision quality in classification problems
CN116800831A (zh) 一种业务数据推送方法、装置、存储介质及处理器
CN111652708A (zh) 一种应用于房屋抵押贷款产品中的风险评估方法及装置
CN110619564B (zh) 一种反欺诈特征生成方法和装置
Yang et al. Automatic Feature Engineering‐Based Optimization Method for Car Loan Fraud Detection
Alshara [Retracted] Multilayer Graph‐Based Deep Learning Approach for Stock Price Prediction
CN114331665A (zh) 用于预定申请人的信用判定模型的训练方法、装置和电子设备
Kulothungan Loan Forecast by Using Machine Learning
CN113283979A (zh) 一种贷款申请人的贷款信用评估方法、装置及存储介质
Mahalle et al. Data Acquisition and Preparation
CN111882339A (zh) 预测模型训练及响应率预测方法、装置、设备及存储介质
Apitzsch et al. Cluster Analysis of Mixed Data Types in Credit Risk: A study of clustering algorithms to detect customer segments
Li et al. An Optimization-Based Order-and-Cut Approach for Fair Clustering of Data Sets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination