大数据信息的处理方法、处理系统以及信息收集设备
技术领域
本发明涉及信息处理方法及装置,特别涉及一种大数据信息的处理方法、处理系统以及信息收集设备。
背景技术
大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
为了能够获得可加工的数据,目前比较常规的办法就是通过在APP中加入某些后台程序,然后在使用APP之前强制用户同意某种使用协议,以使得APP能够在用户没有任何感知的情况下,将用户的浏览记录、使用APP时间、购买信息、甚至银行卡余额信息上传到云服务器。虽然获取用户信息是非常容易的,但是如何保证用户敏感信息不泄露,是现有技术不能很好解决的。目前通常的做法是对云服务器进行加密或者安装防火墙,以防止黑客的非法访问。但是众所周知的是,某些黑客行为是防不胜防的,所以一旦黑客破解密码或者突破防火墙,将会出现大规模的用户信息泄露的情况。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种大数据信息的处理方法、处理系统以及信息收集设备,从而克服现有技术的缺点。
为实现上述目的,本发明提供了一种大数据信息的处理方法,包括如下步骤:由第一信息收集设备从用户终端收集用户行为信息;由第一信息收集设备生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组;由第一信息收集设备将第一数据分组发送至云服务器;由第二信息收集设备从用户终端收集用户身份信息;由第二信息收集设备生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联;由云服务器对第一数据分组进行解码,并对用户行为信息进行大数据分析,生成分析结果;由云服务器基于分析结果,生成推送消息;由云服务器将推送消息与第一标识符编码为第二数据分组,并将第二数据分组发送给第一信息收集设备;由第一信息收集设备将第二数据分组发送给第二信息收集设备;由第二信息收集设备对第二数据分组进行解码,并基于关联寻找第二标识符;以及由第二信息收集设备基于第二标识符向用户终端发送推送信息。
优选地,上述技术方案中,第一数据分组不包括能够从中得到用户的个人信息和用户终端信息的任何信息。
优选地,上述技术方案中,第一信息收集设备和第二信息收集设备使用不同的加密算法进行加密。
优选地,上述技术方案中,方法还包括:在由第二信息收集设备基于第二标识符向用户终端发送推送信息之后,第二信息收集设备删除推送消息和第一表示符。
本发明还提供了一种大数据信息的处理系统,该处理系统包括:用于由第一信息收集设备从用户终端收集用户行为信息的单元;用于由第一信息收集设备生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组的单元;用于由第一信息收集设备将第一数据分组发送至云服务器的单元;用于由第二信息收集设备从用户终端收集用户身份信息的单元;用于由第二信息收集设备生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联的单元;用于由云服务器对第一数据分组进行解码,并对用户行为信息进行大数据分析,生成分析结果的单元;用于由云服务器基于分析结果,生成推送消息的单元;用于由云服务器将推送消息与第一标识符编码为第二数据分组,并将第二数据分组发送给第一信息收集设备的单元;用于由第一信息收集设备将第二数据分组发送给第二信息收集设备的单元;用于由第二信息收集设备对第二数据分组进行解码,并基于关联寻找第二标识符的单元;以及用于由第二信息收集设备基于第二标识符向用户终端发送推送信息的单元。
优选地,上述技术方案中,第一数据分组不包括能够从中得到用户的个人信息和用户终端信息的任何信息。
本发明还提供了一种信息收集设备,包括:存储器;以及处理器,处理器与存储器耦合;存储器中包括计算机可执行指令,当由处理器执行时,指令使处理器执行以下操作:从用户终端收集用户行为信息;生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组;将第一数据分组发送至云服务器;从云服务器接收第二数据分组,第二数据分组是通过云服务器将推送消息与第一标识符进行编码而生成的,并且推送消息是由云服务器基于分析结果生成的,其中,分析结果是由云服务器对第一数据分组进行解码并对用户行为信息进行大数据分析而生成的;以及将第二数据分组发送给其它信息收集设备。
优选地,上述技术方案中,第一数据分组不包括能够从中得到用户的个人信息和用户终端信息的任何信息。
本发明还提供了一种信息收集设备,包括:存储器;以及处理器,处理器与存储器耦合;存储器中包括计算机可执行指令,当由处理器执行时,指令使处理器执行以下操作:从用户终端收集用户身份信息;生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联,其中第一标识符是由其它信息收集设备收集的;从其它信息收集设备接收第二数据分组,第二数据分组是通过云服务器将推送消息与第一标识符进行编码而生成的,并且推送消息是由云服务器基于分析结果生成的,其中,分析结果是由云服务器对第一数据分组进行解码并对用户行为信息进行大数据分析而生成的,其中,第一数据分组是通过将第一标识符与用户行为信息进行编码而生成的,用户行为信息是由其它信息收集设备从用户终端接收的;对第二数据分组进行解码,并基于关联寻找第二标识符;以及基于第二标识符向用户终端发送推送信息。
优选地,上述技术方案中,第一数据分组不包括能够从中得到用户的个人信息和用户终端信息的任何信息。
与现有技术相比,本发明具有如下有益效果:本发明将用户身份信息与用户行为信息分离,并将两种信息分别存储在两个收集设备中,黑客同步破解两个设备的概率极低(一般而言,黑客即使同时破解两个设备,破解成功也具有先后顺序,概率意义上,很难做到真正的同时破解),所以黑客只能获得用户行为信息,但是黑客并不知道用户身份信息,那么此时用户行为信息是没有任何意义的。以这种方式,本发明成功的保证了用户个人敏感信息的安全。
附图说明
图1是根据本发明的实施例的方法流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
实施例1
图1是根据本发明的实施例的方法流程图。本发明的方法包括:步骤101:由第一信息收集设备从用户终端收集用户行为信息;步骤102:由第一信息收集设备生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组;步骤103:由第一信息收集设备将第一数据分组发送至云服务器;步骤104:由第二信息收集设备从用户终端收集用户身份信息;步骤105:由第二信息收集设备生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联;步骤106:由云服务器对第一数据分组进行解码,并对用户行为信息进行大数据分析,生成分析结果;步骤107:由云服务器基于分析结果,生成推送消息;步骤108:由云服务器将推送消息与第一标识符编码为第二数据分组,并将第二数据分组发送给第一信息收集设备;步骤109:由第一信息收集设备将第二数据分组发送给第二信息收集设备;步骤110:由第二信息收集设备对第二数据分组进行解码,并基于关联寻找第二标识符;步骤111:以及由第二信息收集设备基于第二标识符向用户终端发送推送信息。
实施例2
具体而言,第一信息收集设备和第二信息收集设备可以并置于同一物理位置,共享同一有线通信介质或者无线通信介质,在这种情况下,第一信息收集设备和第二信息收集设备可以保证基本上能够同时接收到从同一用户传输的行为信息和用户身份信息。生成第一标识符和第二标识符之间的关联关系是本领域任意的算法。在最简单的情况下,可以首先强制第一信息收集设备和第二信息收集设备每固定时间间隔只接收一个数据分组,该时间间隔应当远大于通信信道的时延预测值,同时在用户行为信息和身份信息中加入时间戳信息,在这种情况下,就可以通过时间戳和接收分组的先后顺序判断出第一标识符和第二标识符之间的对应关系。
实施例3
为了确保用户的敏感信息安全,第一数据分组不包括能够从中得到用户的个人信息和用户终端信息的任何信息。需要注意的是,第一信息收集设备只保存用户行为信息,在本发明中,用户行为信息应当广义理解,其包括例如用户的浏览记录、银行卡余额信息、APP使用时间信息等等。第一信息收集设备中没有能够从中得到用户的个人信息和用户终端信息的任何信息,其中,用户的个人信息是指用户姓名、手机号码、身份证号等等与用户个人一一对应的信息,用户终端信息是指例如终端的IP地址、MAC地址、地理位置信息等等。
实施例4
以下介绍如何保证用户敏感信息的安全。假设目前有黑客A试图获取信息收集设备中的信息,在最坏的情况下,A能够同时对两个信息收集设备进行攻击,当时概率意义上说,A在同一时间攻破两个设备的概率几乎为零(因为没有任何技术能够保证黑客可以在同一时间破解两个设备),所以A对于设备的破解必然存在一前一后的情况。此时,A可能能够获得用户姓名、手机号码、身份证号等等个人信息,或者能够获得用户的浏览记录、银行卡余额信息、APP使用时间信息等等行为信息,但是A不能同时获得两种信息,也不能将两种信息结合到一起。而显而易见的是,与同时泄露两种信息相比,只泄露一种信息的危险是小得多的(当然,如果为了更保险的保证用户信息不泄露,可以设计两个以上的信息收集装置,并将用户的上传信息拆分为多个部分,并将多个部分分别存储在两个以上的信息收集设备中)。同时一旦A攻破其中一个收集设备,那么该信息设备将马上告警,此时控制系统将作出响应,阻止A攻破另一收集设备。以此实现保证用户信息安全的目的。
实施例5
本发明还提供了一种大数据信息处理系统,处理系统包括:用于由第一信息收集设备从用户终端收集用户行为信息的单元;用于由第一信息收集设备生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组的单元;用于由第一信息收集设备将第一数据分组发送至云服务器的单元;用于由第二信息收集设备从用户终端收集用户身份信息的单元;用于由第二信息收集设备生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联的单元;用于由云服务器对第一数据分组进行解码,并对用户行为信息进行大数据分析,生成分析结果的单元;用于由云服务器基于分析结果,生成推送消息的单元;用于由云服务器将推送消息与第一标识符编码为第二数据分组,并将第二数据分组发送给第一信息收集设备的单元;用于由第一信息收集设备将第二数据分组发送给第二信息收集设备的单元;用于由第二信息收集设备对第二数据分组进行解码,并基于关联寻找第二标识符的单元;以及用于由第二信息收集设备基于第二标识符向用户终端发送推送信息的单元。
实施例6
本发明还提供了一种信息收集设备,包括:存储器;以及处理器,处理器与存储器耦合;存储器中包括计算机可执行指令,当由处理器执行时,指令使处理器执行以下操作:从用户终端收集用户行为信息;生成第一标识符,并将第一标识符与用户行为信息编码为第一数据分组;将第一数据分组发送至云服务器;从云服务器接收第二数据分组,第二数据分组是通过云服务器将推送消息与第一标识符进行编码而生成的,并且推送消息是由云服务器基于分析结果生成的,其中,分析结果是由云服务器对第一数据分组进行解码并对用户行为信息进行大数据分析而生成的;以及将第二数据分组发送给其它信息收集设备。
实施例7
本发明还提供了一种信息收集设备,包括:存储器;以及处理器,处理器与存储器耦合;存储器中包括计算机可执行指令,当由处理器执行时,指令使处理器执行以下操作:从用户终端收集用户身份信息;生成第二标识符,并建立第二标识符与用户身份信息和第一标识符之间的关联,其中第一标识符是由其它信息收集设备收集的;从其它信息收集设备接收第二数据分组,第二数据分组是通过云服务器将推送消息与第一标识符进行编码而生成的,并且推送消息是由云服务器基于分析结果生成的,其中,分析结果是由云服务器对第一数据分组进行解码并对用户行为信息进行大数据分析而生成的,其中,第一数据分组是通过将第一标识符与用户行为信息进行编码而生成的,用户行为信息是由其它信息收集设备从用户终端接收的;对第二数据分组进行解码,并基于关联寻找第二标识符;以及基于第二标识符向用户终端发送推送信息。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。