CN116012036B - 基于大数据的分布式数据处理系统 - Google Patents

基于大数据的分布式数据处理系统 Download PDF

Info

Publication number
CN116012036B
CN116012036B CN202310294841.7A CN202310294841A CN116012036B CN 116012036 B CN116012036 B CN 116012036B CN 202310294841 A CN202310294841 A CN 202310294841A CN 116012036 B CN116012036 B CN 116012036B
Authority
CN
China
Prior art keywords
data
frequency
login
browsing
main body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310294841.7A
Other languages
English (en)
Other versions
CN116012036A (zh
Inventor
程瑶
潘卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suan Xiaozhang (Shenzhen) Network Technology Co.,Ltd.
Original Assignee
Zhongke Yunce Shenzhen Scientific And Technological Achievement Transformation Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yunce Shenzhen Scientific And Technological Achievement Transformation Information Technology Co ltd filed Critical Zhongke Yunce Shenzhen Scientific And Technological Achievement Transformation Information Technology Co ltd
Priority to CN202310294841.7A priority Critical patent/CN116012036B/zh
Publication of CN116012036A publication Critical patent/CN116012036A/zh
Application granted granted Critical
Publication of CN116012036B publication Critical patent/CN116012036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于大数据的分布式数据处理系统,涉及互联网数据处理技术领域,解决了现有技术中,无法设置分布式终端对用户进行安全性管控、推送商品准确性监控以及推送时间段合理性监控的技术问题;本发明是将用户进行文本数据采集并挖掘,并通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接;还对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低。

Description

基于大数据的分布式数据处理系统
技术领域
本发明涉及互联网数据处理技术领域,具体为基于大数据的分布式数据处理系统。
背景技术
网上购物是通过互联网检索商品信息,并通过电子订购单发出购物请求,然后填上私人支票账号或信用卡的号码,厂商通过邮购的方式发货,或是通过快递公司送货上门,在互联网时代下,互联网数据进行分布式数据处理尤其重要;
但是在现有技术中的互联网网购领域内,无法设置分布式终端对用户进行安全性管控、推送商品准确性监控以及推送时间段合理性监控,以至于用户的互联网购物效率低,且使用质量无法满足用户需求,同时不能够对用户的数据进行展示类型确定,无法对同需求用户提供参考;
针对上述的技术缺陷,现提出一种解决方案。
发明内容
本发明的目的就在于为了解决上述提出的问题,而提出基于大数据的分布式数据处理系统,是将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量。
本发明的目的可以通过以下技术方案实现:
基于大数据的分布式数据处理系统,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;
处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控。
作为本发明的一种优选实施方式,数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
作为本发明的一种优选实施方式,数据监测端运行过程如下:
采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将其分别与非授权登录频率阈值以及连续登录次数阈值进行比较。
作为本发明的一种优选实施方式,比较过程如下:
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备。
作为本发明的一种优选实施方式,数据监测端的运行过程如下:
在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;
若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送。
作为本发明的一种优选实施方式,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象。
作为本发明的一种优选实施方式,数据监测端的运行过程如下:
采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较。
作为本发明的一种优选实施方式,比较过程如下:
若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;
若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段。
作为本发明的一种优选实施方式,将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗。
作为本发明的一种优选实施方式,数据展示控制模块的运行过程如下:
采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将其分别与变动概率阈值和数量增加量阈值进行比较:
若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;
若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;
若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示,如时间数据内用户的购买时间段,则不进行公开展示;
若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示;
进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密,如时间数据中购买时间段与文本数据中会话号进行合并展示。
作为本发明的一种优选实施方式,文本数据表示为分析主体的会话ID、会话号、授权设备信息;行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率;时间数据表示为分析主体的浏览时间段、购买时间段。
基于大数据的分布式数据处理方法,具体数据处理方法步骤如下:
步骤一、将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
步骤二、对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
步骤三、将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;
步骤四、数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
与现有技术相比,本发明的有益效果是:
1、本发明中,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,引起用户的使用质量降低,同时用户的实时购物质量降低;对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接,同时不能够根据行为数据挖掘准确进行物品推送,导致用户的产品推送合格率降低,影响用户购物效率降低了网购的使用质量;对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低,增加了用户关闭推送的风险,以至于降低了用户的购物质量同时影响了商品的销售稳定性,不利于电子商务平台的运营;
2、本发明中,在分析主体网购过程中,通过分布式数据处理进行分析主体安全性监控、推送商品准确性监控以及推送时间段合理性监控,同时将分析主体的采集数据一同发送至数据集,在各个终端数据处理高强度时可进行数据集跨终端访问,即非上传终端可进行上传终端的上传数据访问;大大降低了互联网数据的同步处理压力同时保证了数据处理的及时性;
3、本发明中,将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明基于大数据的分布式数据处理系统的原理框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参阅图1所示,基于大数据的分布式数据处理系统,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;
在互联网电子商务平台内存在海量数据,因此通过分布式数据处理则能够保证用户在网购过程中的安全性和购物便捷性,本系统从用户购物的多个阶段进行数据采集并将处理。
实施例一
处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,引起用户的使用质量降低,同时用户的实时购物质量降低;
将用户标记为分析主体,并将分析主体设置标号i,i为大于1的自然数,对分析主体进行文本数据采集,其文本数据表示为分析主体的会话ID、会话号、授权设备信息等数据,即文本数据则为分析主体的身份信息;并在完成文本数据采集后将其发送至数据集;同时采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数分别与非授权登录频率阈值以及连续登录次数阈值进行比较:
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接,同时不能够根据行为数据挖掘准确进行物品推送,导致用户的产品推送合格率降低,影响用户购物效率降低了网购的使用质量;
将分析主体进行行为数据采集,行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率等数据,并将行为数据发送至数据集进行存储;同时对分析主体进行行为数据分析,根据分析主体的行为数据中反复浏览同一商品后购买概率将分析主体划分为纠结购买类型和直接购买类型两种,在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送;反之,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象,其中,同相似度商品表示为两种商品为同类型商品,且商品销量偏差以及对应商品所属商铺评分偏差均未超过对应阈值;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低,增加了用户关闭推送的风险,以至于降低了用户的购物质量同时影响了商品的销售稳定性,不利于电子商务平台的运营;
将分析主体进行时间数据采集,时间数据表示为分析主体的浏览时间段、购买时间段;并将时间数据发送至数据集同时对分析主体的时间数据进行分析,采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较:
若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段;
将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗;
在分析主体网购过程中,通过分布式数据处理进行分析主体安全性监控、推送商品准确性监控以及推送时间段合理性监控,同时将分析主体的采集数据一同发送至数据集,在各个终端数据处理高强度时可进行数据集跨终端访问,即非上传终端可进行上传终端的上传数据访问;大大降低了互联网数据的同步处理压力同时保证了数据处理的及时性;
实施例二
数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量;
将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;进行数据单一展示时,采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量分别与变动概率阈值和数量增加量阈值进行比较:
若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;如行为数据中用户浏览商品添加购物车的概率,则对添加购物车对应商品以及对应添加概率进行展示并商品添加时间或者次数进行展示;若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;如文本数据中用户授权设备,可将用户授权设备种类或者对应设备型号进行展示,但对设备型号的具体编号进行设限,仅用户或者用户授权的终端可访问;若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示,如时间数据内用户的购买时间段,则不进行公开展示;若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示,如文本数据中的会话号;本申请中数据公开展示均在电商平台内通过安全认证的终端进行公开展示,未通过安全认证均为私密展示,且该私密展示的授权途径即为电商平台安全认证,如实名认证等;
进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密,如时间数据中购买时间段与文本数据中会话号进行合并展示,即展示为xx时间段内对应会话号进行购买,而不是对应会话号的购买时间段为xx时间段;
基于大数据的分布式数据处理方法,具体数据处理方法步骤如下:
步骤一、将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
步骤二、对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
步骤三、将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;
步骤四、数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
本发明在使用时,通过数据挖掘端将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;通过数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;通过数据监测端将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (9)

1.基于大数据的分布式数据处理系统,其特征在于,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;
处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;文本数据表示为分析主体的会话ID、会话号、授权设备信息;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率;
处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;时间数据表示为分析主体的浏览时间段、购买时间段。
2.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
3.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端运行过程如下:
采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将其分别与非授权登录频率阈值以及连续登录次数阈值进行比较。
4.根据权利要求3所述的基于大数据的分布式数据处理系统,其特征在于,比较过程如下:
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;
若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备。
5.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端的运行过程如下:
在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;
若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送。
6.根据权利要求5所述的基于大数据的分布式数据处理系统,其特征在于,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象。
7.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端的运行过程如下:
采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较。
8.根据权利要求7所述的基于大数据的分布式数据处理系统,其特征在于,比较过程如下:
若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;
若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段;
将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗。
9.根据权利要求2所述的基于大数据的分布式数据处理系统,其特征在于,数据展示控制模块的运行过程如下:
采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将其分别与变动概率阈值和数量增加量阈值进行比较:
若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;
若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;
若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示;
若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示;
进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密。
CN202310294841.7A 2023-03-24 2023-03-24 基于大数据的分布式数据处理系统 Active CN116012036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310294841.7A CN116012036B (zh) 2023-03-24 2023-03-24 基于大数据的分布式数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310294841.7A CN116012036B (zh) 2023-03-24 2023-03-24 基于大数据的分布式数据处理系统

Publications (2)

Publication Number Publication Date
CN116012036A CN116012036A (zh) 2023-04-25
CN116012036B true CN116012036B (zh) 2023-06-16

Family

ID=86033912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310294841.7A Active CN116012036B (zh) 2023-03-24 2023-03-24 基于大数据的分布式数据处理系统

Country Status (1)

Country Link
CN (1) CN116012036B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117033159B (zh) * 2023-10-09 2024-02-02 成都市蓉通数智信息技术有限公司 基于大数据的数字政务数据看板系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202516A (zh) * 2016-07-24 2016-12-07 广东聚联电子商务股份有限公司 一种根据时间节点的电子商务平台商品展示方法
CN115018594A (zh) * 2022-07-06 2022-09-06 李鑫 基于大数据的电子商务平台商品智能推荐系统及方法
CN115496566A (zh) * 2022-11-16 2022-12-20 九州好礼(山东)电商科技有限公司 基于大数据的地区特产推荐方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017188031A (ja) * 2016-04-08 2017-10-12 ソフトバンク・テクノロジー株式会社 行動データ及び感情データに基づくリマーケティングシステム及びその運用方法
CN105956883A (zh) * 2016-05-10 2016-09-21 镇江硅谷信息科技有限公司 电子商务数据处理系统
CN109064227A (zh) * 2018-07-30 2018-12-21 广州新趋士网络科技有限公司 一种基于大数据的客户分析系统
CN113709407A (zh) * 2020-05-09 2021-11-26 无锡京阳智能科技中心 一种基于互联网的实时监控安全系统
CN111709051A (zh) * 2020-05-28 2020-09-25 腾讯科技(深圳)有限公司 数据处理方法、装置、系统、计算机存储介质及电子设备
WO2022021391A1 (zh) * 2020-07-31 2022-02-03 深圳齐心集团股份有限公司 一种电子商务信息推送监控系统
WO2022021392A1 (zh) * 2020-07-31 2022-02-03 深圳齐心集团股份有限公司 一种电子商务信息推送监测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202516A (zh) * 2016-07-24 2016-12-07 广东聚联电子商务股份有限公司 一种根据时间节点的电子商务平台商品展示方法
CN115018594A (zh) * 2022-07-06 2022-09-06 李鑫 基于大数据的电子商务平台商品智能推荐系统及方法
CN115496566A (zh) * 2022-11-16 2022-12-20 九州好礼(山东)电商科技有限公司 基于大数据的地区特产推荐方法及系统

Also Published As

Publication number Publication date
CN116012036A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN116012036B (zh) 基于大数据的分布式数据处理系统
CN108076018A (zh) 身份认证系统、方法、装置及账号认证方法
CN108629322A (zh) 可疑人员的监控方法、装置及计算机可读存储介质
CN107368718A (zh) 一种用户浏览行为认证方法及系统
CN109191197A (zh) 基于区块链技术的视频客流统计分析
CN108345865A (zh) 一种行为人异常行为的监控方法、装置和用户终端
CN105956469A (zh) 文件安全性识别方法和装置
CN114430503B (zh) 一种基于短视频大数据叠加推荐方法
CN115545826A (zh) 一种电子商务平台的运营系统
CN108133373A (zh) 探寻涉机器行为的风险账户的方法及装置
CN106779692B (zh) 一种车载支付方法及装置
CN110675219B (zh) 页面及订单生成方法、系统、计算机设备及存储介质
CN114124460B (zh) 工控系统入侵检测方法、装置、计算机设备及存储介质
CN108737138A (zh) 服务提供方法及服务平台
CN108074122A (zh) 产品试用推荐方法、装置及服务器
CN110570189B (zh) 账户风险防控方法和系统
CN112508621A (zh) 一种交易分析方法及装置
CN107045688A (zh) 一种精确识别目标终端的控制方法及装置
CN116159310A (zh) 数据处理方法、装置、电子设备以及存储介质
CN107590653B (zh) 支付方法、终端和系统
CN115187026A (zh) 一种产业风险监控方法、系统和可读存储介质
CN115563100A (zh) 一种智能业务库的管理方法、管理装置及存储介质
CN111914187B (zh) 一种商品推荐及推荐关系链跟踪的方法
CN110060060B (zh) 安全控制方法、装置、电子设备及计算机可读存储介质
CN113269614A (zh) 商家快速注册接单方法及装置、电子设备及可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230828

Address after: 518000 Building 116, Hualian Garden 1B, Nanxin Road, Beitou Community, Nanshan Street, Nanshan District, Shenzhen, Guangdong Province

Patentee after: Suan Xiaozhang (Shenzhen) Network Technology Co.,Ltd.

Address before: 518000 first floor, building 1b, Hualian garden, No. 1109, Nanshan Avenue, Nanshan street, Nanshan District, Shenzhen, Guangdong

Patentee before: Zhongke yunce (Shenzhen) scientific and technological achievement transformation information technology Co.,Ltd.

TR01 Transfer of patent right