CN108133294A - 基于信息共享的预测方法及装置 - Google Patents

基于信息共享的预测方法及装置 Download PDF

Info

Publication number
CN108133294A
CN108133294A CN201810025073.4A CN201810025073A CN108133294A CN 108133294 A CN108133294 A CN 108133294A CN 201810025073 A CN201810025073 A CN 201810025073A CN 108133294 A CN108133294 A CN 108133294A
Authority
CN
China
Prior art keywords
multidimensional
real vector
data
client
data conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810025073.4A
Other languages
English (en)
Other versions
CN108133294B (zh
Inventor
张�杰
于皓
李犇
张涧
张卓博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sunshine Property Insurance Ltd By Share Ltd
Original Assignee
Sunshine Property Insurance Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sunshine Property Insurance Ltd By Share Ltd filed Critical Sunshine Property Insurance Ltd By Share Ltd
Priority to CN201810025073.4A priority Critical patent/CN108133294B/zh
Publication of CN108133294A publication Critical patent/CN108133294A/zh
Priority to PCT/CN2018/109728 priority patent/WO2019137049A1/zh
Application granted granted Critical
Publication of CN108133294B publication Critical patent/CN108133294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Hardware Design (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于信息共享的预测方法及装置,该方法包括:获取多维原始数据;按照客户端需求对多维原始数据进行数据转换,得到多维实数向量,数据转换中,多维实数向量对应的权重随之更新,得到更新后的权重;服务器接收多个客户端发送的多维实数向量,根据多维实数向量和其对应的更新后的权重进行预测,得到预测结果。该方法充分应用了数据的使用精度,提高了预测效果,客户端对原始数据进行数据转换,得到多维实数向量,在保证数据保持排序能力和量化能力的前提下,避免了攻击者对用户原始数据的反推,保证了用户隐私数据的安全,缓解了现有的方法在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。

Description

基于信息共享的预测方法及装置
技术领域
本发明涉及互联网的技术领域,尤其是涉及一种基于信息共享的预测方法及装置。
背景技术
互联网金融近几年得到了飞速发展,各类金融科技公司呈现百家争鸣、百花齐放的局面,伴随着产业的欣荣发展,信息共享问题随之而来,目前没有哪家公司能够掌握风控所需的全部数据,因此经常会有多家公司联合建立风险预测模型的需求。与此同时,客户隐私数据受到法律保护,未经用户授权的情况下,客户隐私数据不得交换、共享。
现有技术中,对于多家公司联合建立风险预测模型(即基于信息共享的方法联合建立风险预测模型)存在的已有的处理方式主要有以下几种,然而这些技术均存在一定的不足:
标签化处理:将原始数据的粒度变粗,输出等级值,比如将客户的月收入从实数值划分为有限的几档。这种做法会影响数据利用的精度,从而影响预测效果。
加密解密技术:对原始数据进行加密,该方法使得数据在加密之后丧失了排序能力和量化能力,从而不能应用于预测系统。
综上,现有的基于信息共享的预测方法在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。
发明内容
有鉴于此,本发明的目的在于提供基于信息共享的预测方法及装置,以缓解现有的基于信息共享的预测方法在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。
第一方面,本发明实施例提供了一种基于信息共享的预测方法,应用于客户端,所述方法包括:
获取用户的多维原始数据,其中,所述用户为在客户端存在历史数据的用户;
按照客户端需求对所述多维原始数据进行数据转换,得到多维实数向量,其中,当所述多维原始数据进行数据转换后,所述多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,所述联合建模预测模型为预先构建的预测模型;
将所述多维实数向量发送至服务器,其中,所述服务器接收多个客户端发送的多维实数向量后,根据所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,按照所述客户端需求对所述多维原始数据进行数据转换,得到多维实数向量包括:
获取数据转换规则,其中,所述数据转换规则由所述客户端自定义,所述数据转换规则不影响每一维度原始数据的历史分布规律;
根据所述数据转换规则对所述多维原始数据进行数据转换,得到所述多维实数向量,其中,所述数据转换规则对于其它客户端保密。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,将所述多维实数向量发送至服务器包括:
建立与所述服务器的连接关系;
基于所述连接关系将所述多维实数向量发送至所述服务器。
第二方面,本发明实施例还提供了一种基于信息共享的预测方法,应用于服务器,所述方法包括:
接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,所述多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
获取联合建模预测模型;
根据所述联合建模预测模型的控制对所述多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
基于所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,在得到所述预测结果后,所述方法还包括:
监控所述预测结果的稳定性,以及监控所述多维实数向量的稳定性。
第三方面,本发明实施例还提供了一种基于信息共享的预测装置,所述装置设置于客户端,所述装置包括:
数据获取模块,用于获取用户的多维原始数据,其中,所述用户为在客户端存在历史数据的用户;
数据转换模块,用于按照客户端需求对所述多维原始数据进行数据转换,得到多维实数向量,其中,当所述多维原始数据进行数据转换后,所述多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,所述联合建模预测模型为预先构建的预测模型;
发送模块,用于将所述多维实数向量发送至服务器,其中,所述服务器接收多个客户端发送的多维实数向量后,根据所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
结合第三方面,本发明实施例提供了第三方面的第一种可能的实施方式,其中,所述数据转换模块包括:
获取单元,用于获取数据转换规则,其中,所述数据转换规则由所述客户端自定义,所述数据转换规则不影响每一维度原始数据的历史分布规律;
数据转换单元,用于根据所述数据转换规则对所述多维原始数据进行数据转换,得到所述多维实数向量,其中,所述数据转换规则对于其它客户端保密。
结合第三方面,本发明实施例提供了第三方面的第二种可能的实施方式,其中,所述发送模块包括:
建立单元,用于建立与所述服务器的连接关系;
发送单元,用于基于所述连接关系将所述多维实数向量发送至所述服务器。
第四方面,本发明实施例还提供了一种基于信息共享的预测装置,所述装置设置于服务器,所述装置包括:
接收模块,用于接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,所述多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
获取模块,用于获取联合建模预测模型;
权重更新模块,用于根据所述联合建模预测模型的控制对所述多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
预测模块,用于基于所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
结合第四方面,本发明实施例提供了第四方面的第一种可能的实施方式,其中,在得到所述预测结果后,所述装置还包括:
监控模块,用于监控所述预测结果的稳定性,以及监控所述多维实数向量的稳定性。
本发明实施例带来了以下有益效果:本发明实施例提供了一种基于信息共享的预测方法及装置,该方法应用于客户端,包括:获取用户的多维原始数据,其中,用户为在客户端存在历史数据的用户;按照客户端需求对多维原始数据进行数据转换,得到多维实数向量,其中,当多维原始数据进行数据转换后,多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,联合建模预测模型为预先构建的预测模型;将多维实数向量发送至服务器,其中,服务器接收多个客户端发送的多维实数向量后,根据多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。
现有的基于信息共享的预测方法一般是将原始数据的粒度变粗,然后直接输出等级值,或者将原始数据进行加密,加密后的数据丧失了排序能力和量化能力,进而无法用于后续的预测过程。与现有的基于信息共享的预测方法相比,本发明实施例中的基于信息共享的预测方法中,先获取用户的多维原始数据,然后根据客户端的需求对多维原始数据进行数据转换,得到多维实数向量,并且联合建模预测模型同时会控制多维实数向量对应的权重进行更新,得到更新后的权重,最终,根据多个客户端发送的多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。该方法充分应用了数据的使用精度,提高了预测效果,并且客户端能够对原始数据进行数据转换,得到多维实数向量,在保证数据保持排序能力和量化能力的前提下,避免了攻击者对用户原始数据的反推,保证了用户隐私数据的安全性,缓解了现有的基于信息共享的预测方法在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于信息共享的预测方法的流程图;
图2为本发明实施例提供的按照客户端需求对多维原始数据进行数据转换,得到多维实数向量的流程图;
图3为本发明实施例提供的另一种基于信息共享的预测方法的流程图;
图4为本发明实施例提供的一种基于信息共享的预测装置的示意图;
图5为本发明实施例提供的另一种基于信息共享的预测装置的示意图;
图6为本发明实施例提供的基于信息共享的预测系统的示意图。
图标:
11-数据获取模块;12-数据转换模块;13-发送模块;21-接收模块;22-获取模块;23-权重更新模块;24-预测模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于信息共享的预测方法进行详细介绍。
实施例一:
一种基于信息共享的预测方法,应用于客户端,参考图1,该方法包括:
S102、获取用户的多维原始数据,其中,用户为在客户端存在历史数据的用户;
在本发明实施例中,客户端是指拥有原始数据的厂商,比如客户端可以为P2P,银行,小贷公司,淘宝,百度,运营商等,本发明实施例对其不做具体限制。
原始数据包括各种各样的数据,比如用户的基本信息(包括姓名,家庭住址,工作单位等),用户的收入信息,社保信息,公积金信息,电商购物记录信息,通话记录信息等,本发明实施例对其不做具体限制。
该获取用户的多维原始数据为线上获取数据的过程。
S104、按照客户端需求对多维原始数据进行数据转换,得到多维实数向量,其中,当多维原始数据进行数据转换后,多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,联合建模预测模型为预先构建的预测模型;
在得到多维原始数据后,按照客户端需求对多维原始数据进行转换,得到多维实数向量。所谓的客户端需求是指转换的频次,转化的时间,转换的规则可以根据客户端的需要而定,并没有具体限制。每次转换可以只针对其中的一个实数向量,也可以针对多个实数向量。
当对多维原始数据进行数据转换后,多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到每个实数向量对应的更新后的权重。
该数据转换的目的是为了防止使用者反推出多维原始数据,造成对用户隐私的泄密。
联合建模预测模型为预先构建的预测模型,该模型为线下建立的模型。比如预测结果的使用方是一家厂商,有自己的产品,想通过建立营销模型找到其潜在用户,或者预测结果的使用方已经有了用户,想通过建立信用评分模型预测该用户的履约能力,除了上述营销模型和信用评分模型外,预测模型还可能是反欺诈模型、申请评分模型、行为评分模型、催收模型等。如果要建立这个模型,使用方在没有自有数据或者自有数据不够的情况下,就需要找多家厂商,建立上述的模型。建模的过程中可以通过统计学习方法,事先选取一定数量的训练样本建立模型,也可以在没有训练样本的情况下依据专家经验设计这样一套模型。该预测模型的预测结果可能是关于实数向量与其对应的权重的函数(比如:y=f(w1*x1+w2*x2+...+wn*xn),其中,x1,x2,...,xn为n维实数向量的值,w1,w2,...,wn为n维实数向量对应的n个权重),也可能是概率分布函数,或是矩阵映射,或是神经网络结构等形式。
建模前需要对建模时用到的厂商提供的数据做一些数据调研,看一下数据的质量怎么样。比如说模型是用训练样本训练出来的机器学习模型,那样,可能需要自己先准备十万条样本,也就是十万个用户的数据,拿用户的唯一标识(比如身份证号,手机号码),先要去其他厂商,让那些厂商为我按照这些用户去准备他们拥有的数据。比如说有一家厂商A拥有的数据是x1到x200,另外一家厂商B拥有的数据是从x201到x5000,还有一家厂商C拥有的数据是x5001到x9000,最后一家厂商D拥有的数据是x9001到x100000,得到这些数据后,用这些数据去建立一个模型,通过统计学习方法,知道这十万条样本上面每个x相应的w是多少,就是机器学习的模型,通过历史的样本,让厂商ABCD把那些x给我,然后,进行拟合,使得历史的真实的y与拟合出来的y之间的差尽可能的小,这样就能训练得到一个模型。
当训练得到一个模型后,将该模型放在服务器端,以进行线上的预测。
线下建立模型的方式千差万别,本发明实施例对其不做具体限制。
如果在线下建立模型的时候使用的为ABCD四家厂商的数据,建立得到模型后,把这个模型放到服务器上,在线上使用时,也只能使用ABCD四家厂商的数据。并且,模型中的xi对应好了数据来源,比如x5001就是厂商C提供的数据,具体也对应好了是哪类数据,比如建模时x5001为家电类数据,那么,线上使用时x5001也为家电类数据。
S106、将多维实数向量发送至服务器,其中,服务器接收多个客户端发送的多维实数向量后,根据多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。
客户端在得到多维实数向量后,将多维实数向量发送至服务器。服务器接收多个客户端发送的多维实数向量后,如步骤S104所述,服务器在线上接收ABCD四家厂商发送的多维实数向量后,根据多维实数向量和多维实数向量对应的更新后的权重进行预测,就能够得到预测结果。
现有的基于信息共享的预测方法一般是将原始数据的粒度变粗,然后直接输出等级值,或者将原始数据进行加密,加密后的数据丧失了排序能力和量化能力,进而无法用于后续的预测过程。与现有的基于信息共享的预测方法相比,本发明实施例中的基于信息共享的预测方法中,先获取用户的多维原始数据,然后根据客户端的需求对多维原始数据进行数据转换,得到多维实数向量,并且联合建模预测模型同时会控制多维实数向量对应的权重进行更新,得到更新后的权重,最终,根据多个客户端发送的多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。该方法充分应用了数据的使用精度,提高了预测效果,并且客户端能够对原始数据进行数据转换,得到多维实数向量,在保证数据保持排序能力和量化能力的前提下,避免了攻击者对用户原始数据的反推,保证了用户隐私数据的安全性,缓解了现有的基于信息共享的预测方法在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。
上述过程对基于信息共享的预测方法进行了简要描述,下面对其中涉及到的具体内容进行详细描述。
可选地,参考图2,按照客户端需求对多维原始数据进行数据转换,得到多维实数向量包括:
S201、获取数据转换规则,其中,数据转换规则由客户端自定义,数据转换规则不影响每一维度原始数据的历史分布规律;
具体的,数据转换规则由客户端自定义,可以与建立联合建模预测模型时的规则不一致。
比如,客户端A提供的多维原始数据为电商购物记录(如在某时期花了某些钱买了某个产品),得到数据转换规则后,把多维的原始数据变成实数向量后,如第一维度代表家电类的消费金额,第二维度代表衣帽类的消费金额,第三维度代表化妆品类的消费金额等等,这些金额可以转换为0到1之间的实数,客户端可以改变数据转换规则,比如调换两个维度之间的顺序,将金额转换为0到100之间的实数等,本发明实施例对其不做具体限制。
另外,数据转换规则不影响每一维度原始数据的历史分布规律。比如,月收入总体上呈现出λ分布,数据转换规则改变后,月收入还是遵从λ分布,不影响每一维度的密度分布曲线。
每次转换规则的变化均伴随着每一维度的权重的更新。
S202、根据数据转换规则对多维原始数据进行数据转换,得到多维实数向量,其中,数据转换规则对于其它客户端保密。
具体的,A厂商的数据转换规则对于B厂商说是未知的。
可选地,将多维实数向量发送至服务器包括:
(1)建立与服务器的连接关系;
(2)基于连接关系将多维实数向量发送至服务器。
本发明提供的基于信息共享的预测方法中,先在客户端对多维原始数据做变形转换,使得用户的隐私数据得到了保护;在服务器端使用转换后的数据做预测的时候,根据客户端的变形转换规则,同步的更新了模型的权重,从而不影响数据的使用精度和预测效果。另外,客户端对多维原始数据的变形转换可以随时发起、随时更改规则,这样可以更进一步加大了攻击者反向推测出隐私数据的可能性。
因此,本发明可以对联合建模参与方的原始数据做加密,防止逆向破解,同时保持数据的使用效率不降低。
实施例二:
一种基于信息共享的预测方法,应用于服务器,参考图3,该方法包括:
S302、接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
S304、获取联合建模预测模型;
S306、根据联合建模预测模型的控制对多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
S308、基于多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。
该实施例二中的具体内容可以参考实施例一中的描述,在此不再赘述。
可选地,在得到预测结果后,该方法还包括:
监控预测结果的稳定性,以及监控多维实数向量的稳定性。
另外,在得到预测结果后,还可以监控预测结果以及多维实数向量的稳定性,根据监控结果采取对应的措施。比如对联合建模预测模型进行训练,对厂商提供的原始数据进行考察等。
实施例三:
一种基于信息共享的预测装置,该装置设置于客户端,参考图4,该装置包括:
数据获取模块11,用于获取用户的多维原始数据,其中,用户为在客户端存在历史数据的用户;
数据转换模块12,用于按照客户端需求对多维原始数据进行数据转换,得到多维实数向量,其中,当多维原始数据进行数据转换后,多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,联合建模预测模型为预先构建的预测模型;
发送模块13,用于将多维实数向量发送至服务器,其中,服务器接收多个客户端发送的多维实数向量后,根据多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。
本发明实施例中的基于信息共享的预测装置中,先获取用户的多维原始数据,然后根据客户端的需求对多维原始数据进行数据转换,得到多维实数向量,并且联合建模预测模型同时会控制多维实数向量对应的权重进行更新,得到更新后的权重,最终,根据多个客户端发送的多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。该装置充分应用了数据的使用精度,提高了预测效果,并且客户端能够对原始数据进行数据转换,得到多维实数向量,在保证数据保持排序能力和量化能力的前提下,避免了攻击者对用户原始数据的反推,保证了用户隐私数据的安全性,缓解了现有的基于信息共享的预测装置在保护客户隐私数据的前提下存在数据利用精度差,数据丧失排序能力和量化能力的技术问题。
可选地,数据转换模块包括:
获取单元,用于获取数据转换规则,其中,数据转换规则由客户端自定义,数据转换规则不影响每一维度原始数据的历史分布规律;
数据转换单元,用于根据数据转换规则对多维原始数据进行数据转换,得到多维实数向量,其中,数据转换规则对于其它客户端保密。
可选地,发送模块包括:
建立单元,用于建立与服务器的连接关系;
发送单元,用于基于连接关系将多维实数向量发送至服务器。
该实施例三中的具体内容可以参考实施例一中的具体描述,在此不再赘述。
实施例四:
一种基于信息共享的预测装置,该装置设置于服务器,参考图5,该装置包括:
接收模块21,用于接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
获取模块22,用于获取联合建模预测模型;
权重更新模块23,用于根据联合建模预测模型的控制对多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
预测模块24,用于基于多维实数向量和多维实数向量对应的更新后的权重进行预测,得到预测结果。
该实施例四中的具体描述也可参考实施例一中的描述,在此不再赘述。
可选地,在得到预测结果后,该装置还包括:
监控模块,用于监控预测结果的稳定性,以及监控多维实数向量的稳定性。
图6给出了基于信息共享的预测系统的示意图,其中,权重更新模块可以在服务器端,也可以在客户端,本发明实施例对其不做具体限制,图中示出了数据的传输方向。
本发明实施例所提供的基于信息共享的预测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于信息共享的预测方法,其特征在于,应用于客户端,所述方法包括:
获取用户的多维原始数据,其中,所述用户为在客户端存在历史数据的用户;
按照客户端需求对所述多维原始数据进行数据转换,得到多维实数向量,其中,当所述多维原始数据进行数据转换后,所述多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,所述联合建模预测模型为预先构建的预测模型;
将所述多维实数向量发送至服务器,其中,所述服务器接收多个客户端发送的多维实数向量后,根据所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,按照所述客户端需求对所述多维原始数据进行数据转换,得到多维实数向量包括:
获取数据转换规则,其中,所述数据转换规则由所述客户端自定义,所述数据转换规则不影响每一维度原始数据的历史分布规律;
根据所述数据转换规则对所述多维原始数据进行数据转换,得到所述多维实数向量,其中,所述数据转换规则对于其它客户端保密。
3.根据权利要求1所述的方法,其特征在于,将所述多维实数向量发送至服务器包括:
建立与所述服务器的连接关系;
基于所述连接关系将所述多维实数向量发送至所述服务器。
4.一种基于信息共享的预测方法,其特征在于,应用于服务器,所述方法包括:
接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,所述多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
获取联合建模预测模型;
根据所述联合建模预测模型的控制对所述多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
基于所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
5.根据权利要求4所述的方法,其特征在于,在得到所述预测结果后,所述方法还包括:
监控所述预测结果的稳定性,以及监控所述多维实数向量的稳定性。
6.一种基于信息共享的预测装置,其特征在于,所述装置设置于客户端,所述装置包括:
数据获取模块,用于获取用户的多维原始数据,其中,所述用户为在客户端存在历史数据的用户;
数据转换模块,用于按照客户端需求对所述多维原始数据进行数据转换,得到多维实数向量,其中,当所述多维原始数据进行数据转换后,所述多维实数向量对应的权重根据联合建模预测模型的控制进行更新,得到更新后的权重,每一个维度的实数向量对应一个更新后的权重,所述联合建模预测模型为预先构建的预测模型;
发送模块,用于将所述多维实数向量发送至服务器,其中,所述服务器接收多个客户端发送的多维实数向量后,根据所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
7.根据权利要求6所述的装置,其特征在于,所述数据转换模块包括:
获取单元,用于获取数据转换规则,其中,所述数据转换规则由所述客户端自定义,所述数据转换规则不影响每一维度原始数据的历史分布规律;
数据转换单元,用于根据所述数据转换规则对所述多维原始数据进行数据转换,得到所述多维实数向量,其中,所述数据转换规则对于其它客户端保密。
8.根据权利要求6所述的装置,其特征在于,所述发送模块包括:
建立单元,用于建立与所述服务器的连接关系;
发送单元,用于基于所述连接关系将所述多维实数向量发送至所述服务器。
9.一种基于信息共享的预测装置,其特征在于,所述装置设置于服务器,所述装置包括:
接收模块,用于接收多个客户端发送的多维实数向量,其中,每个客户端发送一个多维实数向量,所述多维实数向量为其对应的客户端按照客户端需求对多维原始数据进行数据转换得到的;
获取模块,用于获取联合建模预测模型;
权重更新模块,用于根据所述联合建模预测模型的控制对所述多维实数向量对应的权重进行更新,得到更新后的权重,其中,每一个维度的实数向量对应一个更新后的权重;
预测模块,用于基于所述多维实数向量和所述多维实数向量对应的更新后的权重进行预测,得到预测结果。
10.根据权利要求9所述的装置,其特征在于,在得到所述预测结果后,所述装置还包括:
监控模块,用于监控所述预测结果的稳定性,以及监控所述多维实数向量的稳定性。
CN201810025073.4A 2018-01-10 2018-01-10 基于信息共享的预测方法及装置 Active CN108133294B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810025073.4A CN108133294B (zh) 2018-01-10 2018-01-10 基于信息共享的预测方法及装置
PCT/CN2018/109728 WO2019137049A1 (zh) 2018-01-10 2018-10-10 基于信息共享的预测方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810025073.4A CN108133294B (zh) 2018-01-10 2018-01-10 基于信息共享的预测方法及装置

Publications (2)

Publication Number Publication Date
CN108133294A true CN108133294A (zh) 2018-06-08
CN108133294B CN108133294B (zh) 2020-12-04

Family

ID=62400596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810025073.4A Active CN108133294B (zh) 2018-01-10 2018-01-10 基于信息共享的预测方法及装置

Country Status (2)

Country Link
CN (1) CN108133294B (zh)
WO (1) WO2019137049A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635422A (zh) * 2018-12-07 2019-04-16 深圳前海微众银行股份有限公司 联合建模方法、装置、设备以及计算机可读存储介质
WO2019137049A1 (zh) * 2018-01-10 2019-07-18 阳光财产保险股份有限公司 基于信息共享的预测方法、装置、电子设备及计算机存储介质
CN110969261A (zh) * 2019-11-29 2020-04-07 中国银行股份有限公司 基于加密算法的模型构建方法及相关设备
CN111160573A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置
CN111367960A (zh) * 2020-02-25 2020-07-03 北京明略软件系统有限公司 一种实现数据处理的方法、装置、计算机存储介质及终端

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554476B (zh) * 2020-04-23 2024-04-19 京东科技控股股份有限公司 信用度预测模型的训练方法、系统、电子设备及存储介质
CN111915368B (zh) * 2020-07-30 2024-02-20 上海数策软件股份有限公司 汽车行业客户id识别系统、方法及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079063A (zh) * 2007-06-25 2007-11-28 腾讯科技(深圳)有限公司 一种基于场景信息推送广告的方法、系统及设备
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103886203A (zh) * 2014-03-24 2014-06-25 美商天睿信息系统(北京)有限公司 一种基于指标预测的自动建模系统及其方法
CN104700155A (zh) * 2014-12-24 2015-06-10 天津南大通用数据技术股份有限公司 商业智能中的业务模型利用pmml实现预测的方法及系统
CN104794406A (zh) * 2015-03-18 2015-07-22 云南电网有限责任公司电力科学研究院 一种基于数据迷彩模型的私密数据保护方法
CN105894336A (zh) * 2016-05-25 2016-08-24 北京比邻弘科科技有限公司 一种基于移动互联网的大数据挖掘方法及系统
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170061311A1 (en) * 2015-08-27 2017-03-02 Li Liu Method for providing data analysis service by a service provider to data owner and related data transformation method for preserving business confidential information of the data owner
CN108133294B (zh) * 2018-01-10 2020-12-04 阳光财产保险股份有限公司 基于信息共享的预测方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079063A (zh) * 2007-06-25 2007-11-28 腾讯科技(深圳)有限公司 一种基于场景信息推送广告的方法、系统及设备
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103886203A (zh) * 2014-03-24 2014-06-25 美商天睿信息系统(北京)有限公司 一种基于指标预测的自动建模系统及其方法
CN104700155A (zh) * 2014-12-24 2015-06-10 天津南大通用数据技术股份有限公司 商业智能中的业务模型利用pmml实现预测的方法及系统
CN104794406A (zh) * 2015-03-18 2015-07-22 云南电网有限责任公司电力科学研究院 一种基于数据迷彩模型的私密数据保护方法
CN105894336A (zh) * 2016-05-25 2016-08-24 北京比邻弘科科技有限公司 一种基于移动互联网的大数据挖掘方法及系统
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董正浩: "基于支持向量机的移动互联网用户行为偏好研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019137049A1 (zh) * 2018-01-10 2019-07-18 阳光财产保险股份有限公司 基于信息共享的预测方法、装置、电子设备及计算机存储介质
CN109635422A (zh) * 2018-12-07 2019-04-16 深圳前海微众银行股份有限公司 联合建模方法、装置、设备以及计算机可读存储介质
CN109635422B (zh) * 2018-12-07 2023-08-25 深圳前海微众银行股份有限公司 联合建模方法、装置、设备以及计算机可读存储介质
CN110969261A (zh) * 2019-11-29 2020-04-07 中国银行股份有限公司 基于加密算法的模型构建方法及相关设备
CN110969261B (zh) * 2019-11-29 2023-11-28 中国银行股份有限公司 基于加密算法的模型构建方法及相关设备
CN111367960A (zh) * 2020-02-25 2020-07-03 北京明略软件系统有限公司 一种实现数据处理的方法、装置、计算机存储介质及终端
CN111160573A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置

Also Published As

Publication number Publication date
WO2019137049A1 (zh) 2019-07-18
CN108133294B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN108133294A (zh) 基于信息共享的预测方法及装置
CN102870086A (zh) 具有隐私保护控制的个人属性、倾向、推荐行为和历史事件的数字简档系统
CN110147967A (zh) 风险防控方法及装置
CN109389478A (zh) 一种商品信息管理方法及系统、设备、计算机存储介质
CN108257033A (zh) 一种保单分析方法、装置、终端设备及存储介质
CN110210207A (zh) 授权方法及设备
CN110400219A (zh) 业务处理方法及系统、交易监控方法及系统
EP3961507A1 (en) Optimal policy learning and recommendation for distribution task using deep reinforcement learning model
DE102019106098A1 (de) Sichere visuelle transaktionen für mobile vorrichtungen
CN108460689A (zh) 一种保单分析方法、装置、终端设备及存储介质
CN108133373A (zh) 探寻涉机器行为的风险账户的方法及装置
CN107634989A (zh) 一种云钱包构建方法及服务器
CN106022706A (zh) 电子合约主体以及相关执行过程信息的全息呈现系统
CN106778941A (zh) 基于扫码终端的产品出库控制方法及装置
CN109948989A (zh) 基于区块链的订单状态更新方法、装置、设备及存储介质
CN115545709A (zh) 配资异常交易识别方法及装置
CN111582935A (zh) 一种基于区块链的积分互识方法及系统
CN107909439A (zh) 共享产品的推荐方法、装置以及电子设备
Murugun Technology Adoption in Indian Banking Sectors–2023
CN109785120A (zh) 一种基于区块链技术的个人征信系统
CN109636581A (zh) 贷款申请信息的处理方法及装置、存储介质、计算机设备
KR102123908B1 (ko) 트랜잭션 시점 결정 방법 및 시스템
Ma et al. Dynamic Hybrid Multiple Attribute Decision‐Making Problem Based on Reference Point Adaptation
CN110110499A (zh) 一种大数据确权方法及其系统
Loyd et al. Identifying Design patterns for risk management system using big data analytics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant