WO2020011200A1

WO2020011200A1 - 跨域数据融合方法、系统以及存储介质

Info

Publication number: WO2020011200A1
Application number: PCT/CN2019/095429
Authority: WO
Inventors: 张钧波; 郑宇�; 梁宇轩
Original assignee: 京东数字科技控股有限公司
Priority date: 2018-07-13
Filing date: 2019-07-10
Publication date: 2020-01-16
Also published as: CN108984733B; CN108984733A

Abstract

一种跨域数据融合方法、系统以及存储介质，涉及数据挖掘技术领域，其中方法包括：获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息（101），基于特征转换模型将与用户特征信息转换为隐含特征信息（102），根据预设的加密规则对用户关键词信息进行加密处理（103），对用户关键词信息密文与隐含特征信息进行融合处理，生成所述数据域的域用户融合特征（104），根据用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征（105）。上述跨域数据融合方法、系统以及存储介质，可以避免由于用户关键词泄露导致的用户原始数据泄露，将用户特征信息转换为隐含特征信息并进行融合处理，提高了对于各个领域数据汇总特征的表示能力，能够提升数据挖掘准确度和安全性。

Description

跨域数据融合方法、系统以及存储介质

相关申请的交叉引用

本申请是以 CN申请号为 201810766536. 2,申请日为 2018年 7月 13日的申请为基础, 并主张其优先权，该 CN申请的公开内容在此作为整体引入本申请中。技术领域

本公开涉及数据挖掘技术领域，尤其涉及一种跨域数据融合方法、系统以及存储介质。背景技术

传统数据挖掘通常处理的是来自单一数据域的数据，把将同一领域的多个数据集合并成具有一致数据模式的数据库。而在大数据时代背景下，经常面临着来自不同领域、不同来源的各类数据，这些数据往往由多种形式组成，每种形式都有着不同的表示、分布、规模以及密度。来自不同领域的多个数据集通过潜在对象进行了隐式连接，例如，一个用户的电商平台交易数据，个人信用记录和人口统计特性描述了该用户的潜在消费能力。发明内容

本公开的发明人发现上述相关技术中的的跨域数据融合的技术方案存在缺陷：可以利用用户 Key的密文反推得到用户 Key, 造成用户各领域知识甚至原始特征信息的泄露。

本公开的一个或多个实施例提供一种跨域数据融合方法，包括：获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息；基于特征转换模型将与所述用户特征信息转换为隐含特征信息；根据预设的加密规则对所述用户关键词信息进行多次加密处理；对用户关键词信息密文与所述隐含特征信息进行融合处理，生成所述数据域的域用户融合特征；根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征。

在一些实施例中，所述获得数据域中的数据源存储的与用户关键词相对应的用户特征信息包括：根据所述用户关键词信息并按照预设的关联映射规则生成查询 SQL语句；将所述查询 SQL语句发送到所述数据源中执行，用以获取所述用户特征信息。在一些实施例中，所述基于预设的加密规则对所述用户关键词信息进行加密处理包括：采用第一加密算法将所述用户关键词进行第一次加密；采用第二加密算法将第一次加密后的密文数据进行二次加密，获得所述用户关键词信息密文；其中，所述第一加密算法包括： MD5算法；所述第二加密算法包括： AES算法。

在一些实施例中，所述基于特征转换模型将与所述用户特征信息转换为隐含特征信息包括：将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本；使用深度学习方法并基于所述训练样本对预设的深度学习模型进行训练，获得所述特征转换模型；将所述预设的深度学习模型更新为所述特征转换模型，通过将所述用户特征信息输入所述特征转换模型，获得与所述用户特征信息相对应的所述隐含特征信息。

在一些实施例中，所述使对预设的深度学习模型进行训练包括：将所述初始用户特征信息作为输入特征数据，将与所述初始用户特征信息相对应的所述初始隐含特征信息作为初始预测结果；基于所述输入特征数据和所述初始预测结果对所述预设的深度学习模型进行训练。

在一些实施例中，所述用户特征信息包括多个特征参数，所述特征转换模型的数量为多个；所述获得与所述用户特征信息相对应的所述隐含特征信息包括：将所述多个特征参数中的至少一个特征参数输入各个所述特征转换模型，获得多个所述隐含特征信息。

在一些实施例中，所述特征转换模型包括：三层神经元模型；所述三层神经元模型包括：输入层神经元模型、中间层神经元模型和输出层神经元模型；每层神经元模型的输出作为下一层神经元模型的输入；其中，所述输入层神经元模型的神经元与所述多个特征参数中的至少一个特征参数相对应，所述输出层神经元模型的神经元与所述隐含特征信息相对应。

在一些实施例中，所述三层神经元模型为具有全连接结构的多个神经网络层的子网络结构；其中，所述中间层神经元模型为全连接层。

在一些实施例中，所述隐含特征信息为多维数字向量；其中，所述对所述用户关键词密文与所述隐含特征信息进行融合处理、生成所述数据域的域用户融合特征包括：获取多个所述特征转换模型输出的多个多维数字向量；将所述用户关键词信息密文与所述多个多维向量进行合并处理，生成域用户融合特征向量。

在一些实施例中，所述根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理、获得跨域用户融合特征包括：获取与所述用户关键词信息密文相对应的多个数据域的域用户融合特征向量；将所述多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向量。

根据本公开的另一方面，提供一种跨域数据融合系统，包括：原始信息获取模块，用于获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息；隐含特征生成模块，用于基于特征转换模型将与所述用户特征信息转换为隐含特征信息；关键词加密模块，用于根据预设的加密规则对所述用户关键词信息进行多次加密处理；域数据融合模块，用于对用户关键词信息密文与所述隐含特征信息进行融合处理，生成所述数据域的域用户融合特征；跨域数据融合模块，用于根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征。

在一些实施例中，所述原始信息获取模块，用于根据所述用户关键词信息并按照预设的关联映射规则生成查询 SQL语句；将所述查询 SQL语句发送到所述数据源中执行，用以获取所述用户特征信息。

在一些实施例中，所述关键词加密模块，用于采用第一加密算法将所述用户关键词进行第一次加密；采用第二加密算法将第一次加密后的密文数据进行二次加密，获得所述用户关键词信息密文；其中，所述第一加密算法包括： MD5算法；所述第二加密算法包括： AES算法。

在一些实施例中，所述隐含特征生成模块，包括：模型训练单元，用于将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本；使用深度学习方法并基于所述训练样本对预设的深度学习模型进行训练，获得所述特征转换模型；特征生成单元，用于将所述预设的深度学习模型更新为所述特征转换模型，通过将所述用户特征信息输入所述特征转换模型，获得与所述用户特征信息相对应的所述隐含特征信息。

在一些实施例中，所述模型训练单元，用于将所述初始用户特征信息作为输入特征数据，将与所述初始用户特征信息相对应的所述初始隐含特征信息作为初始预测结果；基于所述输入特征数据和所述初始预测结果对所述预设的深度学习模型进行训练。

在一些实施例中，所述用户特征信息包括多个特征参数，所述特征转换模型的数量为多个；其中，所述特征生成单元，用于将所述多个特征参数中的至少一个特征参数输入各个所述特征转换模型，获得多个所述隐含特征信息。

在一些实施例中，所述隐含特征信息为多维数字向量；所述域数据融合模块，用于获取多个所述特征转换模型输出的多个多维数字向量；将所述用户关键词信息密文与所述多个多维向量进行合并处理，生成域用户融合特征向量。

在一些实施例中，所述跨域数据融合模块，用于获取与所述用户关键词信息密文相对应的多个数据域的域用户融合特征向量；将所述多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向量。

根据本公开的又一方面，提供一种跨域数据融合系统，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如上所述的方法。

根据本公开的再一方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述指令被处理器执行如上所述的方法。

应用本公开的技术方案，将与用户特征信息转换为隐含特征信息，对用户关键词信息进行多次加密处理，对用户关键词信息密文与隐含特征信息进行融合处理生成域用户融合特征，对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征；可以避免由于用户关键词泄露导致的用户原始数据泄露，将用户特征信息转换为隐含特征信息并进行融合处理，提高了对于各个领域数据汇总特征的表示能力，能够提升数据挖掘准确度和安全性。附图说明

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本公开提供的跨域数据融合方法的一些实施例的流程示意图；

图 2为本公开提供的跨域数据融合方法的一些实施例中的数据融合的示意图；图 3为本公开提供的跨域数据融合系统的一些实施例的模块示意图；

图 4为本公开提供的跨域数据融合系统的一些实施例中的隐含特征生成模块的模块示意图；

图 5为本公开提供的跨域数据融合系统的另一些实施例的模块示意图。具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

相关技术的技术方案存在缺陷：对于相关的跨域数据融合技术，首先在不同的存储源当中分别进行用户的特征融合，之后通过用户的 Key（主键）的对应关系，将来自多个存储地方的所有特征进一步融合，最后得到用户关于多个存储地方的汇总跨域特征。用户的不同领域数据都是隐私敏感的，一旦用户 Key的加密方式泄露，攻击方可以利用用户 Key 的密文反推得到用户 Key, 造成用户各领域知识甚至原始特征信息的泄露，并且各个存储地方的输出是由用户 Key密文和低阶的原始特征融合组成，安全性较低。

下文中的“第一” 、 “第二”等仅用于描述上相区别，并没有其它特殊的含义。图 1为本公开提供的跨域数据融合方法的一些实施例的流程示意图，如图 1所示：步骤 101，获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息。数据域也称为数据领域，可以采用多种规则划分数据域，例如可以根据不同的电商系统划分数据域，也可以根据数据的存储地点划分数据域等。

用户关键词信息可以为身份证号、手机号、 QQ号、银行账号等，用户特征信息可以为身高、体重、年龄、工资等信息，也可以为购买商品数量、信用信息、工资、消费频率等信息。可以基于用户特征信息对用户进行画像，获得用户的消费习惯等，可用于对用户分级，推送广告等。

步骤 102, 基于特征转换模型将与用户特征信息转换为隐含特征信息。特征转换模型可以为多种模型，例如机器学习模型等，隐含特征信息可以为多种，例如为一个向量，隐含特征信息可由机器识别而人工则识别困难。

步骤 103, 根据预设的加密规则对用户关键词信息进行多次加密处理，可以为二次、三次加密等。

步骤 104, 对用户关键词信息密文与隐含特征信息进行融合处理，生成数据域的域用户融合特征，域用户融合特征可以为多维向量等。步骤 105, 根据用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征，跨域用户融合特征可以为多维向量等。

在一些实施例中，获得数据域中的数据源存储的与用户关键词相对应的用户特征信息可以有多种方法。例如，根据用户关键词信息并按照预设的关联映射规则生成查询 SQL语句，将查询 SQL语句发送到数据源中执行，用以获取用户特征信息。例如，用户关键词信息为身份证号，根据数据库的数据表以及字段与身份证号的关联映射规则确定需要检索的数据表以及字段，根据确定的数据表以及字段生成查询 SQL语句，将查询 SQL语句发送到数据库中执行，用以获取身高、体重、年龄、工资等信息用户特征信息。

加密规则可以为多种，对用户关键词信息进行多次加密处理。例如，采用第一加密算法将用户关键词进行第一次加密，采用第二加密算法将第一次加密后的密文数据进行二次加密，获得用户关键词信息密文。第一加密算法包括 MD5算法等，第二加密算法包括 AES 算法等。

基于特征转换模型将与用户特征信息转换为隐含特征信息可以有多种方法。例如，将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本，使用深度学习方法并基于训练样本对预设的深度学习模型进行训练，获得特征转换模型。将预设的深度学习模型更新为特征转换模型，通过将用户特征信息输入特征转换模型，获得与用户特征信息相对应的隐含特征信息。可以将初始用户特征信息作为输入特征数据，将与初始用户特征信息相对应的初始隐含特征信息作为初始预测结果，基于输入特征数据和初始预测结果对预设的深度学习模型进行训练。

用户特征信息包括多个特征参数，特征参数可以为身高、体重、年龄、工资、每月消费额等。特征转换模型的数量为多个，将多个特征参数中的至少一个特征参数输入各个特征转换模型，获得多个隐含特征信息。例如，将身高、体重、年龄输入一个特征转换模型，获得一个隐含特征信息，将工资、每月消费额输入另一个特征转换模型，获得另一个隐含特征信息。

深度学习模型包括 CNN, DBN、 RNN、 RNTN、自动编码器、 GAN等。特征转换模型包括三层神经元模型；三层神经元模型包括：输入层神经元模型、中间层神经元模型和输出层神经元模型，每层神经元模型的输出作为下一层神经元模型的输入。输入层神经元模型的神经元与多个特征参数中的至少一个特征参数相对应，输出层神经元模型的神经元与隐含特征信息相对应。三层神经元模型为具有全连接结构的多个神经网络层的子网络结构，中间层神经元模型为全连接层。隐含特征信息可以为多维数字向量，获取多个特征转换模型输出的多个多维数字向量，将用户关键词信息密文与多个多维向量进行合并处理，生成域用户融合特征向量。获取与用户关键词信息密文相对应的多个数据域的域用户融合特征向量，将多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向量。

图 2为本公开提供的跨域数据融合方法的一些实施例中的数据融合的示意图，如图 2 所示，在进行多源跨域数据融合时，各领域数据存储在不同的存储源，这些存储源之间互相隔离，严格保证数据的安全性。例如数据域 A中的数据源存储在 A地，数据域 B中的数据源存储在 B地。

来自不同存储源的数据融合需要使用用户的 Key（关键词）进行匹配，出于对用户的隐私保护，使用用户 Key加密后的密文进行匹配。当用户 Key加密方式泄露时，攻击方很容易通过还原用户 Key来获得用户在各存储源的原始特征。同时，在各存储源进行的单领域特征融合只是把一些低阶的原始特征进行融合，没有进行高阶表示的学习，很大程度上限制了该领域知识的表示能力。以数据域 A为例进行说明，数据域 B与数据域 A的处理方法相同。

对用户 Key二次加密，对数据域 A当中的用户 Key使用进行二次加密，可以采用 MD5 算法和 AES加密算法,保证加密算法的不可逆性,得到的用户 Key二次加密后的密文为 EK。根据用户 Key在数据域 A的数据库当中进行索引，得到该用户对应的所有原始特征，记为 A_x, A^A_P。将用户的所有原始特征 ^至\进行特定的组合作为不同的特征转换模块的输入，得到表示能力更强的高阶隐含特征 ₁至 „。例如，用户 Key为用户手机号，对用户手机号进行二次加密，可以对数据域 A当中的用户手机号采用 MD5算法和 AES加密算法进行二次加密，保证加密算法的不可逆性，用户手机号的二次加密后的密文为 EK。

根据用户手机号在数据域 A的数据库当中进行索引，得到该用户对应的所有原始特征，可以为年龄、职位、工资、工作年限等。将用户的所有原始特征年龄、职位、工资等进行特定的组合作为不同的特征转换模块的输入，得到表示能力更强的高阶隐含特征。不仅能够加强单领域特征的表示能力，而且由于特征学习模块是不可逆的，无法通过高阶隐含特征 HA1至 HAm反推来得到用户的原始特征，所以没有原始数据泄露的风险。

例如，特征转换模块的数量为两个，第一特征转换模块输入的特征为年龄、职位组合，第二特征转换模块的输入的特征为工资、工作年限组合。第一特征转换模块输出的第一隐含特征为第一向量｛05, 25, 34｝,第二特征转换模块输出的第二隐含特征为第二向量｛08, 35， 45｝。将用户 Key密文 EK和在各个数据域中得到的所有高阶隐含特征融合，得到该数据域的汇总特征，并可以得到来自不同数据域的特征集合，基于用户 Key密文进行跨域特征融合，来得到了用户的跨域特征。例如，将用户 Key密文 EK和在数据域 A中得到的所有高阶隐含特征融合，生成域用户融合特征向量｛EN, 05, 25, 34, 08, 35, 45｝。基于相同的方法生成对于数据域 B的对于此用户的域用户融合特征向量｛EN, 11, 20, 15, 30｝。根据 EN进行的跨域特征融合，获取与 EN相对应的多个数据域的域用户融合特征向量，将具有 EN元素的两个域用户融合特征向量进行合并处理，生成域用户融合特征向量｛EN, 05, 25, 34, 08, 35, 45, 11, 20, 15, 30｝。域用户融合特征向量、域用户融合特征向量可以由机器进行识别。

上述的跨域数据融合方法,可以保证在用户 Key泄露时,攻击方不能通过反推用户 Key 来获取用户的原始特征信息，也能在进行单领域特征融合的时候，进行高阶隐含特征的提取及融合，增加安全性。

在一些实施例中，如图 3所示，本公开提供一种跨域数据融合系统 30, 包括：原始信息获取模块 31、隐含特征生成模块 32、关键词加密模块 33、域数据融合模块 34和跨域数据融合模块 35。

原始信息获取模块 31获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息。隐含特征生成模块 32基于特征转换模型将与用户特征信息转换为隐含特征信息。关键词加密模块 33根据预设的加密规则对用户关键词信息进行多次加密处理。域数据融合模块 34对用户关键词信息密文与隐含特征信息进行融合处理，生成数据域的域用户融合特征。跨域数据融合模块 35根据用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征。

在一些实施例中，原始信息获取模块 31根据用户关键词信息并按照预设的关联映射规则生成查询 SQL语句，将查询 SQL语句发送到数据源中执行，用以获取用户特征信息。

关键词加密模块 33采用第一加密算法将用户关键词进行第一次加密；采用第二加密算法将第一次加密后的密文数据进行二次加密，获得用户关键词信息密文。第一加密算法包括 MD5算法等，第二加密算法包括 AES算法等。

如图 4所示，隐含特征生成模块 32包括：模型训练单元 321和特征生成单元 322。模型训练单元 321将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本，使用深度学习方法并基于训练样本对预设的深度学习模型进行训练，获得特征转换模型。特征生成单元 322将预设的深度学习模型更新为特征转换模型，通过将用户特征信息输入特征转换模型，获得与用户特征信息相对应的隐含特征信息。

模型训练单元 321将初始用户特征信息作为输入特征数据，将与初始用户特征信息相对应的初始隐含特征信息作为初始预测结果，基于输入特征数据和初始预测结果对预设的深度学习模型进行训练。用户特征信息包括多个特征参数，特征转换模型的数量为多个。特征生成单元 322将多个特征参数中的至少一个特征参数输入各个特征转换模型，获得多个隐含特征信息。

隐含特征信息为多维数字向量。域数据融合模块 34获取多个特征转换模型输出的多个多维数字向量，将用户关键词信息密文与多个多维向量进行合并处理，生成域用户融合特征向量。跨域数据融合模块 35获取与用户关键词信息密文相对应的多个数据域的域用户融合特征向量，将多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向量。

图 5为本公开提供的跨域数据融合系统的另一些实施例的模块示意图。如图 5所示，该装置可包括存储器 51、处理器 52、通信接口 53以及总线 54。存储器 51用于存储指令, 处理器 52耦合到存储器 51 , 处理器 52被配置为基于存储器 51存储的指令执行实现上述的跨域数据融合方法。

存储器 51可以为高速 RAM存储器、非易失性存储器 (non-volatile memory)等，存储器 51也可以是存储器阵列。存储器 51还可能被分块，并且块可按一定的规则组合成虚拟卷。处理器 52 可以为中央处理器 CPU, 或专用集成电路 ASIC (Application Specific Integrated Circuit), 或者是被配置成实施本公开的跨域数据融合方法的一个或多个集成电路。

在一些实施例中，本公开还提供一种计算机可读存储介质，其中计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如上任一实施例涉及的跨域数据融合方法。本领域内的技术人员应明白，本公开的实施例可提供为方法、装置、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质 (包括但不限于磁盘存储器、 CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备 (系统) 和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和 /或方框以及流程图和 /或方框图中的流程和 /或方框的结合。可提供这

Claims

些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的装置。上述实施例中的跨域数据融合方法、系统以及存储介质，获得数据域中的与用户关键词信息相对应的用户特征信息，将与用户特征信息转换为隐含特征信息，对用户关键词信息进行多次加密处理，对用户关键词信息密文与隐含特征信息进行融合处理生成域用户融合特征，根据用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征；可以避免由于用户关键词泄露导致的用户原始数据泄露，将用户特征信息转换为隐含特征信息并进行融合处理，提高了对于各个领域数据汇总特征的表示能力，能够提升数据挖掘准确度和安全性。可能以许多方式来实现本公开的方法和系统。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。本公开的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用，并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。权利要求

1.一种跨域数据融合方法，包括：

获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息；

基于特征转换模型将与所述用户特征信息转换为隐含特征信息；

根据预设的加密规则对所述用户关键词信息进行多次加密处理；

对用户关键词信息密文与所述隐含特征信息进行融合处理，生成所述数据域的域用户融合特征；

根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征。

2.如权利要求 1所述的方法，所述获得数据域中的数据源存储的与用户关键词相对应的用户特征信息包括：

根据所述用户关键词信息并按照预设的关联映射规则生成查询 SQL语句；

将所述查询 SQL语句发送到所述数据源中执行，用以获取所述用户特征信息。

3.如权利要求 1所述的方法，所述基于预设的加密规则对所述用户关键词信息进行多次加密处理包括：

采用第一加密算法将所述用户关键词进行第一次加密；

采用第二加密算法将第一次加密后的密文数据进行二次加密，获得所述用户关键词信息密文；

其中，所述第一加密算法包括： MD5算法；所述第二加密算法包括： AES算法。

4.如权利要求 1所述的方法，所述基于特征转换模型将与所述用户特征信息转换为隐含特征信息包括：

将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本；

使用深度学习方法并基于所述训练样本对预设的深度学习模型进行训练，获得所述特征转换模型；

将所述预设的深度学习模型更新为所述特征转换模型，通过将所述用户特征信息输入所述特征转换模型，获得与所述用户特征信息相对应的所述隐含特征信息。

5.如权利要求 4所述的方法，所述使对预设的深度学习模型进行训练包括：将所述初始用户特征信息作为输入特征数据，将与所述初始用户特征信息相对应的所述初始隐含特征信息作为初始预测结果; 基于所述输入特征数据和所述初始预测结果对所述预设的深度学习模型进行训练。

6.如权利要求 4所述的方法，所述用户特征信息包括多个特征参数，所述特征转换模型的数量为多个；所述获得与所述用户特征信息相对应的所述隐含特征信息包括：

将所述多个特征参数中的至少一个特征参数输入各个所述特征转换模型，获得多个所述隐含特征信息。

7.如权利要求 6所述的方法，其中，

所述特征转换模型包括：三层神经元模型；所述三层神经元模型包括：输入层神经元模型、中间层神经元模型和输出层神经元模型；每层神经元模型的输出作为下一层神经元模型的输入；

其中，所述输入层神经元模型的神经元与所述多个特征参数中的至少一个特征参数相对应，所述输出层神经元模型的神经元与所述隐含特征信息相对应。

8.如权利要求 7所述的方法，其中，

所述三层神经元模型为具有全连接结构的多个神经网络层的子网络结构；其中，所述中间层神经元模型为全连接层。

9.如权利要求 6所述的方法，所述隐含特征信息为多维数字向量；其中，所述对所述用户关键词密文与所述隐含特征信息进行融合处理、生成所述数据域的域用户融合特征包括：

获取多个所述特征转换模型输出的多个多维数字向量；

将所述用户关键词信息密文与所述多个多维向量进行合并处理，生成域用户融合特征向量。

10.如权利要求 9所述的方法，所述根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理、获得跨域用户融合特征包括：

获取与所述用户关键词信息密文相对应的多个数据域的域用户融合特征向量；将所述多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向

11.一种跨域数据融合系统，包括：

原始信息获取模块，用于获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息；

隐含特征生成模块，用于基于特征转换模型将与所述用户特征信息转换为隐含特征信息; 关键词加密模块，用于根据预设的加密规则对所述用户关键词信息进行多次加密处理；

域数据融合模块，用于对用户关键词信息密文与所述隐含特征信息进行融合处理，生成所述数据域的域用户融合特征；

跨域数据融合模块，用于根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理，获得跨域用户融合特征。

12.如权利要求 11所述的系统，其中，

所述原始信息获取模块，用于根据所述用户关键词信息并按照预设的关联映射规则生成查询 SQL语句；将所述查询 SQL语句发送到所述数据源中执行，用以获取所述用户特征信息。

13.如权利要求 11所述的系统，其中，

所述关键词加密模块，用于采用第一加密算法将所述用户关键词进行第一次加密；采用第二加密算法将第一次加密后的密文数据进行二次加密，获得所述用户关键词信息密文；其中，所述第一加密算法包括： MD5算法；所述第二加密算法包括： AES算法。

14.如权利要求 11所述的系统，其中，

所述隐含特征生成模块，包括：

模型训练单元，用于将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本；使用深度学习方法并基于所述训练样本对预设的深度学习模型进行训练，获得所述特征转换模型；

特征生成单元，用于将所述预设的深度学习模型更新为所述特征转换模型，通过将所述用户特征信息输入所述特征转换模型，获得与所述用户特征信息相对应的所述隐含特征信息。

15.如权利要求 14所述的系统，其中，

所述模型训练单元，用于将所述初始用户特征信息作为输入特征数据，将与所述初始用户特征信息相对应的所述初始隐含特征信息作为初始预测结果；基于所述输入特征数据和所述初始预测结果对所述预设的深度学习模型进行训练。

16.如权利要求 14所述的系统，所述用户特征信息包括多个特征参数，所述特征转换模型的数量为多个；其中，

所述特征生成单元，用于将所述多个特征参数中的至少一个特征参数输入各个所述特征转换模型，获得多个所述隐含特征信息。

17.如权利要求 16所述的系统，其中，

18.如权利要求 17所述的系统，其中，

19.如权利要求 16所述的系统，其中，所述隐含特征信息为多维数字向量；所述域数据融合模块，用于获取多个所述特征转换模型输出的多个多维数字向量；将所述用户关键词信息密文与所述多个多维向量进行合并处理，生成域用户融合特征向量。

20.如权利要求 19所述的系统，其中，

所述跨域数据融合模块，用于获取与所述用户关键词信息密文相对应的多个数据域的域用户融合特征向量；将所述多个数据域的域用户融合特征向量进行合并处理，生成跨域用户融合特征向量。

21.—种跨域数据融合系统，包括：

存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如权利要求 1至 10中任一项所述的方法。

22.—种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述指令被处理器执行如权利要求 1至 10中任一项所述的方法。