CN114116725A - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114116725A CN114116725A CN202111447887.5A CN202111447887A CN114116725A CN 114116725 A CN114116725 A CN 114116725A CN 202111447887 A CN202111447887 A CN 202111447887A CN 114116725 A CN114116725 A CN 114116725A
- Authority
- CN
- China
- Prior art keywords
- data
- real
- operation data
- time
- target operation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000010223 real-time analysis Methods 0.000 claims abstract description 38
- 238000013486 operation strategy Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 20
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 17
- 238000007405 data analysis Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 17
- 230000015654 memory Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000003111 delayed effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Educational Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开提供了一种数据处理方法,可以应用于计算机技术领域和数据分析领域。该数据处理方法应用于数据处理平台,该方法包括:获取由边缘节点发送的实时生成的操作数据,其中,上述操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向上述边缘节点发送的;根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据;对上述目标操作数据进行实时分析,得到实时分析结果;以及根据上述实时分析结果调整运营策略。本公开还提供了一种数据处理装置、设备、存储介质和程序产品。
Description
技术领域
本公开涉及计算机领域和数据分析领域,更具体地涉及一种数据处理方法、装置、设备、介质和程序产品。
背景技术
目前,大数据技术已经渗透到社会的各个方面,例如线上教育。对教育来说,大数据技术不仅是一种新工具、新方法,还代表着一种新思维。随着当今科学技术的不断发展,大数据、人工智能与教育领域相结合形成一种新的教育形式,教研人员可以借助大数据技术对学员的行为进行分析,从而作出调整决策,实现智慧教育。
在实现本公开发明构思的过程中,发明人发现相关技术中至少存在以下问题:相关技术中一般利用数据进行离线分析,无法及时作出调整决策,导致对运营的干预和调整存在延迟。
发明内容
鉴于上述问题,本公开提供了一种数据处理方法、装置、设备、介质和程序产品。
本公开的第一个方面,提供了一种数据处理方法,应用于数据处理平台包括:
获取由边缘节点发送的实时生成的操作数据,其中,上述操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向上述边缘节点发送的;
根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据;
对上述目标操作数据进行实时分析,得到实时分析结果;以及
根据上述实时分析结果调整运营策略。
根据本公开的实施例,上述根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据包括:
实时对上述操作数据创建数据索引;
根据上述预设条件以及与上述数据索引对应的索引规则,获取与上述预设条件对应的上述操作数据,得到上述目标操作数据。
根据本公开的实施例,上述数据处理方法还包括:
实时监测用于存储上述操作数据的实时数据仓库内的数据容量;
在上述数据容量与上述实时数据仓库容量的比例达到预设阈值的情况下,自动对上述实时数据仓库进行扩容。
根据本公开的实施例,对上述目标操作数据进行实时分析,得到实时分析结果包括:
对上述目标操作数据进行实时聚类分析,得到多个聚类类别;
从多个上述聚类类别中确定运营指标。
根据本公开的实施例,上述操作数据是由上述边缘节点中的读取器对上述操作数据进行预处理之后向上述数据处理平台发送的。
根据本公开的实施例,在上述读取器的读取量达到预设上限时,停止读取上述边缘节点中的上述操作数据。
本公开的第二方面提供了一种数据处理方法,包括:
实时获取用户的目标操作;
将用户的上述目标操作转化为预设格式,得到操作数据;
实时向边缘节点发送上述操作数据,以便于上述边缘节点向数据处理平台发送上述操作数据,以使得上述数据处理平台根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据,并对上述目标操作数据进行实时分析,得到实时分析结果,以及根据上述实时分析结果调整运营策略。
根据本公开的实施例,上述将上述用户的目标操作转化为预设格式,得到操作数据包括:
根据预设规则对用户的上述目标操作进行分类,得到多种类型的上述目标操作;
将上述目标操作转化为与上述目标操作的类型相对应的预设格式,得到上述操作数据。
本公开的第三方面提供了一种数据处理装置,应用于数据处理平台,包括:
第一获取模块,用于获取由边缘节点发送的实时生成的操作数据,其中,上述操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向上述边缘节点发送的;
确定模块,用于根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据;
分析模块,用于对上述目标操作数据进行实时分析,得到实时分析结果;以及
调整模块,用于根据上述实时分析结果调整运营策略。
本公开的第四方面提供了一种数据处理装置,应用于客户端,包括:
第二获取模块,用于实时获取用户的目标操作;
转化模块,用于将用户的上述目标操作转化为预设格式,得到操作数据;
发送模块,用于实时向边缘节点发送上述操作数据,以便于上述边缘节点向数据处理平台发送上述操作数据,以使得上述数据处理平台根据预设条件,从上述操作数据中确定满足上述预设条件的目标操作数据,并对上述目标操作数据进行实时分析,得到实时分析结果,以及根据上述实时分析结果调整运营策略。
本公开的第五方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述数据处理方法。
本公开的第六方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述数据处理方法。
本公开的第七方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述数据处理方法。
根据本公开的实施例,获取由客户端中的触发器将用户的目标操作转化为预设格式后向边缘节点发送的实时生成的操作数据,然后根据预设条件从操作数据中确定满足预设条件的目标操作数据;之后对目标操作数据进行实时分析,得到实时分析结果;之后根据实时分析结果调整运营策略,至少部分解决了相关技术中无法及时作出调整决策,导致对运营的干预和调整存在延迟的技术问题。
另外,通过将操作数据发送至边缘节点,使得边缘节点能够对操作数据进行初步处理,增加向数据处理平台的传输速度。另一方面,相对于客户端直接访问数据处理平台而言,客户端访问边缘节点时有更好的响应能力和连接速度,以便于提高操作数据的传输速度,达到实时分析的目的。
此外,本公开提供的数据处理方法,能使用户操作的收集过程自动进行,并完整覆盖各种学习终端上的操作数据的生成与采集,此过程高度自动化与通用化,适应多种终端与后续的扩展采集需求。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的数据处理方法、装置、设备、介质和程序产品的应用场景图;
图2示意性示出了根据本公开实施例的方法的流程图;
图3示意性示出了根据本公开另一实施例的数据处理方法的流程图;
图4示意性示出了其中一个实施例的触发生成操作数据的方法流程图;
图5示意性示出了根据本公开另一实施例的数据处理方法的流程图;
图6示意性示出了根据本公开实施例的数据处理装置的结构框图;
图7示意性示出了其中一个实施例的数据处理装置的结构框图;
图8示意性示出了根据本公开另一实施例的数据处理装置的结构框图;以及
图9示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
与大数据技术相结合的线上教育将是教育创新的一个重要特征。对教育来说,大数据技术不仅是一种新工具、新方法,还代表着一种新思维。智慧教育是随着当今科学技术的不断发展,大数据、人工智能与教育领域相结合的一种新的教育形式,教研人员可以借助大数据技术对学员的行为进行分析,从而作出调整决策,实现智慧教育。
在实现本公开发明构思的过程中,发明人发现相关技术中至少存在以下问题:相关技术中一般利用数据进行离线分析,例如,使用前一段时间(例如前一周或前一天)的数据进行离线分析,无法及时作出调整决策,导致对运营的干预和调整存在延迟。
有鉴于此,本公开针对以上技术问题,在客户端部署触发器,自动将各类终端里的用户操作转化成预设格式的操作数据并上传至边缘节点,操作数据在边缘节点进行预处理之后存入实时数据仓库,然后在该实时数据仓库中对原始的用户操作数据按需进行各类实时的数据统计与聚合分析,得出需要的教研指标,进而对教学进行实时的数据运营与业务指导。从而解决了相关技术中无法及时作出调整决策,导致对运营的干预和调整存在延迟的技术问题。
具体地,本公开的实施例提供了一种数据处理方法,应用于数据处理平台,包括获取由边缘节点发送的实时生成的操作数据,其中,操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向边缘节点发送的;根据预设条件,从操作数据中确定满足预设条件的目标操作数据;对目标操作数据进行实时分析,得到实时分析结果;以及根据实时分析结果调整运营策略。
需要说明的是,本公开实施例确定的数据处理方法和装置可用于计算机领域或数据分析领域。本公开实施例确定的数据处理方法和装置也可用于除计算机领域和数据分析领域之外的任意领域,例如线上教育技术领域。本公开实施例确定的数据处理方法和装置的应用领域不做限定。
在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
图1示意性示出了根据本公开实施例的数据处理方法、装置、设备、介质和程序产品的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括边缘节点、终端设备和服务器。终端设备101、102可以通过网络与边缘节点105交互,以便于终端设备101、102向边缘节点105发送数据。边缘节点105可以通过网络与服务器107交互,以便于边缘节点105向服务器107发送数据。
终端设备103、104可以通过网络与边缘节点106交互,以便于终端设备103、104向边缘节点106发送数据。边缘节点106可以通过网络与服务器107交互,以便于边缘节点106向服务器107发送数据。
网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103、104上可以安装有各种通讯客户端应用,例如学习类应用,购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103、104可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器107可以是提供各种服务的服务器,例如对边缘节点105、106发送的数据进行分析等处理。
需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器107执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器107中。本公开实施例所提供的数据处理方法也可以由不同于服务器107且能够与终端设备101、102、103、104和/或服务器107通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器107且能够与终端设备101、102、103、104和/或服务器107通信的服务器或服务器集群中。
应该理解,图1中的终端设备、边缘节点和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、边缘节点和服务器。
以下将基于图1描述的场景,通过图2~图5对公开实施例的数据处理方法进行详细描述。
图2示意性示出了根据本公开实施例的数据处理方法的流程图。
如图2所示,该实施例的数据处理方法包括操作S210~操作S240,该数据处理方法可以由服务器执行。
在操作S210,获取由边缘节点发送的实时生成的操作数据,其中,操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向边缘节点发送的。
根据本公开的实施例,客户端例如可以包括任何可以进行学习操作的终端,例如可以包括学习类网站、学习类APP、公众号、小程序等。
根据本公开的实施例,用户的目标操作例如可以包括预先定义的行为操作,例如,登陆学习界面的操作、快进操作、评论操作等。
根据本公开的实施例,预设格式例如可以包括能够将同一类型的目标操作采用统一方式记录的格式。预设格式可以预先对目标操作进行归纳、分类,然后对每一类的目标操作预设统一的记录格式。例如,针对评论类的操作,将在直播中进行的评论、在资讯中进行的评论、在图书中进行的评论等均归纳为评论类操作,采用同一种记录格式进行记录。
例如,针对评论类的操作,采用与评论类对应的预设格式进行记录;与评论类对应的预设格式例如可以记录进行评论操作的用户标识、评论的时间、评论的内容、通过哪种类型的终端进行的评论等。
根据本公开的实施例,操作数据是由边缘节点中的读取器对操作数据进行预处理之后向数据处理平台发送的。
根据本公开的实施例,预处理例如可以包括对操作数据进行初步处理,例如对操作数据进行清洗、转换、汇总等操作。
根据本公开的实施例,对操作数据进行预处理之后向数据处理平台发送,一方面经过预处理的操作数据的容量较小,能够提高向数据处理平台发送的速度,保证操作数据能够实时分析;另一方面,读取器在边缘节点完成必要的数据清洗与处理,能显著降低数据处理平台中计算节点的计算压力,降低数据处理拥塞概率,确保实时性。
根据本公开的实施例,读取器被分发部署至各个边缘节点,实时读取新增的操作数据发送给数据处理平台,并记录读取进度与位置,当有新的操作数据产生后,再从上次记录的读取位置开始向后读取,以此来避免重复读取。
根据本公开的实施例,在读取器的读取量达到预设上限时,停止读取边缘节点中的操作数据。
根据本公开的实施例,读取器在读取边缘节点中的数据时对网络、cpu等具有较大的使用量,此时对读取器的读取量设置上限,避免影响用户进行正常的操作。例如,设置预设上限为读取器的读取量占用系统资源的比例为20%,当读取器的读取量占用系统的资源达到20%时,停止读取数据,当低于20%时,可继续读取。
根据本公开的实施例,用户操作数据的收集与处理一般作为旁路应用,一方面在运行过程中不能影响主学习流程;另一方面,因要达到实时的数据收集与处理能力,所以在实现中要同时具备高性能与隔离性。为达到实时的数据收集与处理效果,读取器用高性能编程语言来实现,同时,通过使用资源隔离技术(例如cgroup(control groups)),限制读取器对边缘节点各项资源的最大使用量,即使面对海量操作数据,其资源使用量也能控制在一个预先设定的水平,不影响主流程业务稳定性。
在操作S220,根据预设条件,从操作数据中确定满足预设条件的目标操作数据。
根据本公开的实施例,预设条件例如可以包括根据实际的分析需求进行设置。例如,实际分析需求包括需要了解在一定时间段内用户登陆A类学习客户端的人数,则预设条件可以设置为一定时间段和在该时间段内登陆A类学习客户端的用户,满足预设条件的目标操作数据可以包括在一定时间段内针对A类学习客户端的所有登陆操作数据。
再如,实际分析需求包括针对上万人的直播课程,需要了解评论区的主要评论内容,则预设条件可以设置为参加此次直播课程的用户和所有针对此次直播课程的评论操作数据。
在操作S230,对目标操作数据进行实时分析,得到实时分析结果。
根据本公开的实施例,对目标操作数据进行实时分析,得到实时分析结果包括:对目标操作数据进行实时聚类分析,得到多个聚类类别;从多个聚类类别中确定运营指标。
根据本公开的实施例,聚类类别例如可以包括用户的来源渠道、用户的学习时间、用户的考试情况、参加学习的用户数量、用户学习的课程类型等等。根据聚类类别的分析结果进行运营指标的调整。
在操作S240,根据实时分析结果调整运营策略。
根据本公开的实施例,根据预设条件,从操作数据中确定满足预设条件的目标操作数据包括:实时对操作数据创建数据索引;根据预设条件以及与数据索引对应的索引规则,获取与预设条件对应的操作数据,得到目标操作数据。
根据本公开的实施例,数据索引例如可以包括任何利于快速查找数据的索引,例如,采用跳表技术创建的索引等,跳表不仅能提高搜索性能,同时也可以提高插入和删除操作的性能。
索引规则例如可以包括与数据索引对应的查找数据的方法,例如,对于采用跳表技术建立的数据索引,则与其对应的索引规则可以包括采用二分查找的方式查找数据。
例如,采用跳表技术创建数据索引时,操作数据按照直播的评论进行顺序存储,在需要获取的目标操作数据为直播中的评论数据,则直接查找直播中的第一条评论操作数据和最后一条评论操作数据,第一条评论数据和最后一条评论数据之间的所有操作数据即为目标操作数据,从而实现快速获得目标操作数据的目的,以便于对目标数据进行实时分析。
根据本公开的实施例,通过获取由客户端中的触发器将用户的目标操作转化为预设格式后向边缘节点发送的实时生成的操作数据,然后根据预设条件从操作数据中确定满足预设条件的目标操作数据;之后对目标操作数据进行实时分析,得到实时分析结果;之后根据实时分析结果调整运营策略,至少部分解决了相关技术中无法及时作出调整决策,导致对运营的干预和调整存在延迟的技术问题。
另外,通过将数据发送至边缘节点,使得边缘节点能够对操作数据进行初步处理,增加向数据处理平台的传输速度。另一方面,相对于客户端直接访问数据处理平台而言,客户端用户访问边缘节点时有更好的响应能力和连接速度,以便于提高数据的传输速度,达到实时分析的目的。
此外,本公开提供数据处理方法,能使用户操作收集过程自动化,并完整覆盖各种学习终端上的操作数据的生成与采集,此过程高度自动化与通用化,适应多种终端与后续的扩展采集需求。
根据本公开的实施例,数据处理方法还包括:实时监测用于存储操作数据的实时数据仓库内的数据容量;在数据容量与实时数据仓库容量的比例达到预设阈值的情况下,自动对实时数据仓库进行扩容。
根据本公开的实施例,通过对实时数据仓库进行自动扩容,使得实时数据仓库具备自动化的可伸缩能力,从而能够满足大量操作数据的写入。
根据本公开的实施例,例如设定预设阈值为80%,当数据容量与实施数据仓库容量的比例到达80%的情况下,实时数据仓库可以在短时间内自动扩容,以满足不断写入的操作数据。此外,本公开提供的实时数据仓库可以实现无限次扩容,例如,实时数据仓库的容量为A,当数据容量与实施数据仓库容量A的比例达到80%时,实时数据仓库的容量由A自动扩容至B;当数据容量与实施数据仓库容量B的比例达到80%时,实时数据仓库的容量由B自动扩容至C,以此无限次扩容。
根据本公开的实施例,本公开提供的实时数据仓库基于原始的操作数据进行指标计算,通过存储介质性能、索引技术、cpu向量计算引擎技术来提升指标计算性能,达到基于大量原始学习行为数据快速生成业务指标的能力。
根据本公开的实施例,本公开的实时数据仓库采用业界标准的文件格式存储操作数据,例如,csv格式(Comma-Separated Values)、json格式(java Script ObjectNotation)等,以便于与其他系统之间进行数据传输和数据解析。
图3示意性示出了根据本公开另一实施例的数据处理方法的流程图。
如图3所示,该实施例的数据处理方法包括操作S310~操作S330。
在操作S310,实时获取用户的目标操作。
根据本公开的实施例,用户的目标操作例如可以包括预先定义的行为操作。例如可以包括登陆操作、快进操作、评论操作等。
在操作S320,将用户的目标操作转化为预设格式,得到操作数据。
在操作S330,实时向边缘节点发送操作数据,以便于边缘节点向数据处理平台发送操作数据,以使得数据处理平台根据预设条件,从操作数据中确定满足预设条件的目标操作数据,并对目标操作数据进行实时分析,得到实时分析结果,以及根据实时分析结果调整运营策略。
根据本公开的实施例,将用户的目标操作转化为预设格式,得到操作数据包括:根据预设规则对用户的目标操作进行分类,得到多种类型的目标操作;将目标操作转化为与目标操作的类型相对应的预设格式,得到操作数据。
根据本公开的实施例,多种类型的目标操作例如可以包括评论类操作、转发类操作、登陆类操作等。其中,每一种类型的目标操作对应一种预设格式。
图4示意性示出了其中一个实施例的触发生成操作数据的方法流程图。
如图4所示,该方法包括操作S410~操作S430。
在操作S410,定义目标操作对应的预设格式。
在操作S420,获取用户触发的目标操作。
在操作S430,将目标操作按照与其对应的预设格式进行转换,生成操作数据。
例如,以目标操作为评论类操作为例,获取用户触发的评论类操作后,将评论类操作按照与评论类对应的预设格式进行记录,从而形成操作数据。具体地,评论类的操作对应的预设格式例如可以依次记录发布评论的用户标识、评论时间、评论地点、评论内容等。
图5示意性示出了根据本公开另一实施例的数据处理方法的流程图。
如图5所示,该方法包括操作S510~S580。
在操作S510,触发器实时获取学员触发的目标操作。
在操作S520,将目标操作转化为预设格式,得到操作数据。
在操作S530,实时向边缘节点发送操作数据。
在操作S540,部署在边缘节点的读取器实时读取边缘节点中的操作数据。
在操作S550,读取器对读取的操作数据进行清洗、转换、汇总等预处理后发送至实时数据仓库。
在操作S560,实时数据仓库根据预设条件,从操作数据中确定满足预设条件的目标操作数据。
在操作S570,实时数据仓库对目标操作进行实时聚类分析,得到多个聚类类别,并从多个聚类类别中确定运营指标。
在操作S580,根据多个运营指标绘制学习情况实时驾驶舱,以便于对学习资源进行配置和优化。
本公开实施例提供的数据处理方法能自动化的在各学习终端上根据学员触发的目标操作生成相应的操作数据,然后把大量的操作数据发送至边缘节点进行预处理后发送至实时数据仓库,然后对实时数据仓库内的原始操作数据按需进行各类实时的数据统计与聚类分析,得出需要的运营指标,进而对教学进行实时的数据运营与业务指导,达到实时的数据驱动教学的目标。至少部分解决了相关技术中无法及时作出调整决策,导致对运营的干预和调整存在延迟的技术问题。
基于数据处理方法,本公开还提供了一种数据处理装置。以下将结合图6对该装置进行详细描述。
图6示意性示出了根据本公开实施例的数据处理装置的结构框图。
如图6所示,该实施例的数据处理装置600包括第一获取模块610、确定模块620、分析模块630和调整模块640。
第一获取模块610用于获取由边缘节点发送的实时生成的操作数据,其中,操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向边缘节点发送的。在一实施例中,第一获取模块610可以用于执行前文描述的操作S210,在此不再赘述。
确定模块620用于根据预设条件,从操作数据中确定满足预设条件的目标操作数据。在一实施例中,确定模块620可以用于执行前文描述的操作S220,在此不再赘述。
分析模块630用于对目标操作数据进行实时分析,得到实时分析结果。在一实施例中,分析模块630可以用于执行前文描述的操作S230,在此不再赘述。
调整模块640用于根据实时分析结果调整运营策略。在一实施例中,调整模块640可以用于执行前文描述的操作S240,在此不再赘述。
根据本公开的实施例,确定模块包括创建单元和获取单元。
创建单元,用于实时对操作数据创建数据索引。
获取单元,用于根据预设条件以及与数据索引对应的索引规则,获取与预设条件对应的操作数据,得到目标操作数据。
图7示意性示出了其中一个实施例的数据处理装置的结构框图。
如图7所示,该实施例的数据处理装置600除了包括第一获取模块610、确定模块620、分析模块630和调整模块640之外,还包括监测模块650和扩容模块660。
监测模块650,用于实时监测用于存储操作数据的实时数据仓库内的数据容量。
扩容模块660,用于在数据容量与实时数据仓库容量的比例达到预设阈值的情况下,自动对实时数据仓库进行扩容。
根据本公开的实施例,分析模块包括分析单元和确定单元。
分析单元,用于对目标操作数据进行实时聚类分析,得到多个聚类类别。
确定单元,用于从多个聚类类别中确定运营指标。
根据本公开的实施例,操作数据是由边缘节点中的读取器对操作数据进行预处理之后向数据处理平台发送的。
根据本公开的实施例,在读取器的读取量达到预设上限时,停止读取边缘节点中的操作数据。
根据本公开的实施例,第一获取模块610、确定模块620、分析模块630、调整模块640、监测模块650和扩容模块660中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块610、确定模块620、分析模块630、调整模块640、监测模块650和扩容模块660中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块610、确定模块620、分析模块630、调整模块640、监测模块650和扩容模块660中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中数据处理装置部分与本公开的实施例中数据处理方法部分是相对应的,数据处理装置部分的描述具体参考数据处理方法部分,在此不再赘述。
图8示意性示出了根据本公开另一实施例的数据处理装置的结构框图。
如图8所示,该实施例的数据处理装置800包括第二获取模块810、转化模块820和发送模块830。
第二获取模块810用于实时获取用户的目标操作。在一实施例中,第二获取模块810可以用于执行前文描述的操作S310,在此不再赘述。
转化模块820用于将用户的目标操作转化为预设格式,得到操作数据。在一实施例中,转化模块820可以用于执行前文描述的操作S320,在此不再赘述。
发送模块830用于实时向边缘节点发送操作数据,以便于边缘节点向数据处理平台发送操作数据,以使得数据处理平台根据预设条件,从操作数据中确定满足预设条件的目标操作数据,并对目标操作数据进行实时分析,得到实时分析结果,以及根据实时分析结果调整运营策略。在一实施例中,发送模块830可以用于执行前文描述的操作S330,在此不再赘述。
根据本公开的实施例,转化模块包括分类单元和转化单元。
分类单元,用于根据预设规则对用户的目标操作进行分类,得到多种类型的目标操作。
转化单元,用于将目标操作转化为与目标操作的类型相对应的预设格式,得到操作数据。
根据本公开的实施例,第二获取模块810、转化模块820和发送模块830中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第二获取模块810、转化模块820和发送模块830中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第二获取模块810、转化模块820和发送模块830中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中数据处理装置部分与本公开的实施例中数据处理方法部分是相对应的,数据处理装置部分的描述具体参考数据处理方法部分,在此不再赘述。
图9示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。
如图9所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、ROM902以及RAM 903通过总线904彼此相连。处理器901通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM902和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备900还可以包括输入/输出(I/O)接口905,输入/输出(I/O)接口905也连接至总线904。电子设备900还可以包括连接至I/O接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。计算机可读存储介质承载有一个或者多个程序,当一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM902和/或RAM 903和/或ROM 902和RAM 903以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的物品推荐方法。
在该计算机程序被处理器901执行时执行本公开实施例的系统/装置中限定的功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分909被下载和安装,和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (13)
1.一种数据处理方法,应用于数据处理平台,包括:
获取由边缘节点发送的实时生成的操作数据,其中,所述操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向所述边缘节点发送的;
根据预设条件,从所述操作数据中确定满足所述预设条件的目标操作数据;
对所述目标操作数据进行实时分析,得到实时分析结果;以及
根据所述实时分析结果调整运营策略。
2.根据权利要求1所述的方法,所述根据预设条件,从所述操作数据中确定满足所述预设条件的目标操作数据包括:
实时对所述操作数据创建数据索引;
根据所述预设条件以及与所述数据索引对应的索引规则,获取与所述预设条件对应的所述操作数据,得到所述目标操作数据。
3.根据权利要求1所述的方法,还包括:
实时监测用于存储所述操作数据的实时数据仓库内的数据容量;
在所述数据容量与所述实时数据仓库容量的比例达到预设阈值的情况下,自动对所述实时数据仓库进行扩容。
4.根据权利要求1所述的方法,其中,对所述目标操作数据进行实时分析,得到实时分析结果包括:
对所述目标操作数据进行实时聚类分析,得到多个聚类类别;
从多个所述聚类类别中确定运营指标。
5.根据权利要求1所述的方法,其中,所述操作数据是由所述边缘节点中的读取器对所述操作数据进行预处理之后向所述数据处理平台发送的。
6.根据权利要求5所述的方法,其中,在所述读取器的读取量达到预设上限时,停止读取所述边缘节点中的所述操作数据。
7.一种数据处理方法,包括:
实时获取用户的目标操作;
将用户的所述目标操作转化为预设格式,得到操作数据;
实时向边缘节点发送所述操作数据,以便于所述边缘节点向数据处理平台发送所述操作数据,以使得所述数据处理平台根据预设条件,从所述操作数据中确定满足所述预设条件的目标操作数据,并对所述目标操作数据进行实时分析,得到实时分析结果,以及根据所述实时分析结果调整运营策略。
8.根据权利要求7所述的方法,所述将所述用户的目标操作转化为预设格式,得到操作数据包括:
根据预设规则对用户的所述目标操作进行分类,得到多种类型的所述目标操作;
将所述目标操作转化为与所述目标操作的类型相对应的预设格式,得到所述操作数据。
9.一种数据处理装置,应用于数据处理平台,包括:
第一获取模块,用于获取由边缘节点发送的实时生成的操作数据,其中,所述操作数据是由客户端中的触发器将用户的目标操作转化为预设格式后向所述边缘节点发送的;
确定模块,用于根据预设条件,从所述操作数据中确定满足所述预设条件的目标操作数据;
分析模块,用于对所述目标操作数据进行实时分析,得到实时分析结果;以及
调整模块,用于根据所述实时分析结果调整运营策略。
10.一种数据处理装置,应用于客户端,包括:
第二获取模块,用于实时获取用户的目标操作;
转化模块,用于将用户的所述目标操作转化为预设格式,得到操作数据;
发送模块,用于实时向边缘节点发送所述操作数据,以便于所述边缘节点向数据处理平台发送所述操作数据,以使得所述数据处理平台根据预设条件,从所述操作数据中确定满足所述预设条件的目标操作数据,并对所述目标操作数据进行实时分析,得到实时分析结果,以及根据所述实时分析结果调整运营策略。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~8中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111447887.5A CN114116725A (zh) | 2021-11-30 | 2021-11-30 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111447887.5A CN114116725A (zh) | 2021-11-30 | 2021-11-30 | 数据处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114116725A true CN114116725A (zh) | 2022-03-01 |
Family
ID=80369191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111447887.5A Pending CN114116725A (zh) | 2021-11-30 | 2021-11-30 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114116725A (zh) |
-
2021
- 2021-11-30 CN CN202111447887.5A patent/CN114116725A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11106877B2 (en) | Dynamic text generation for social media posts | |
US10841323B2 (en) | Detecting robotic internet activity across domains utilizing one-class and domain adaptation machine-learning models | |
US10002185B2 (en) | Context-aware cognitive processing | |
US9923860B2 (en) | Annotating content with contextually relevant comments | |
US10437610B2 (en) | System for utilizing one or more data sources to generate a customized interface | |
US10733247B2 (en) | Methods and systems for tag expansion by handling website object variations and automatic tag suggestions in dynamic tag management | |
US20200125671A1 (en) | Altering content based on machine-learned topics of interest | |
US20220269736A1 (en) | Identifying web elements based on user browsing activity and machine learning | |
CN112085087B (zh) | 业务规则生成的方法、装置、计算机设备及存储介质 | |
US11501655B2 (en) | Automated skill tagging, knowledge graph, and customized assessment and exercise generation | |
US20200068243A1 (en) | Intelligent updating of media data in a computing environment | |
US10762438B1 (en) | Extracting questions and answers | |
US9830533B2 (en) | Analyzing and exploring images posted on social media | |
US11494564B2 (en) | Unsupervised aspect-based multi-document abstractive summarization | |
US11095953B2 (en) | Hierarchical video concept tagging and indexing system for learning content orchestration | |
CN110909768B (zh) | 一种标注数据获取方法及装置 | |
CN116720489B (zh) | 页面填充方法及装置、电子设备和计算机可读存储介质 | |
US20190139432A1 (en) | Methods and systems for animated walkthroughs in an online educational platform | |
US20230244996A1 (en) | Auto adapting deep learning models on edge devices for audio and video | |
US20200175455A1 (en) | Classification of skills | |
US20190251146A1 (en) | Device for rendering markup language with structured data | |
US11113081B2 (en) | Generating a video for an interactive session on a user interface | |
CN114116725A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114139059A (zh) | 资源推荐模型的训练方法、资源推荐方法及装置 | |
US10938881B2 (en) | Data engagement for online content and social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |