CN115658421A - 数据采集方法、装置、计算机设备和存储介质 - Google Patents

数据采集方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115658421A
CN115658421A CN202211173366.XA CN202211173366A CN115658421A CN 115658421 A CN115658421 A CN 115658421A CN 202211173366 A CN202211173366 A CN 202211173366A CN 115658421 A CN115658421 A CN 115658421A
Authority
CN
China
Prior art keywords
event
preset
data
type
attribute data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211173366.XA
Other languages
English (en)
Inventor
陈瑶
李霁伦
吴先入
杨耀勇
常雪昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202211173366.XA priority Critical patent/CN115658421A/zh
Publication of CN115658421A publication Critical patent/CN115658421A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种数据采集方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;将所述行为属性数据按照所述事件类型存入预设的事件数据库中。采用本方法能够利用采集到的数据更为准确有效地对平台组件的情况进行分析。

Description

数据采集方法、装置、计算机设备和存储介质
技术领域
本公开涉及数据处理技术领域,特别是涉及一种数据采集方法、装置、计算机设备和存储介质。
背景技术
数据分析处理场景中,在对平台运营情况等进行分析时,需要平台中的账户数据提供数据支撑。传统技术中,通常为获取账户的本身的数据和账户操作行为产生的数据,人工填写与需求相对应的数据之间的映射关系,并由专业人员进行视图配置。
然而,通过这种方法获取数据,无法根据获取到的数据准确地对平台运营组件的情况进行分析。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确清晰地对平台情况进行分析的数据采集方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本公开实施例提供了一种数据采集方法。所述方法包括:
响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
在其中一个实施例中,所述事件类型包括页面数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的页面;
从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
在其中一个实施例中,所述事件类型包括组件数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的组件;
从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
在其中一个实施例中,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定方式包括:
获取预设历史时段内的账户的操作指令对应的事件数据;
根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
将所述多个事件属性类型存入预设的事件属性数据库中。
在其中一个实施例中,所述将所述行为属性数据按照所述事件类型存入预设的事件数据库中,包括:
利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
在其中一个实施例中,所述响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据,包括:
响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
在其中一个实施例中,所述预设属性数据类型的获取方式,包括:
从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
第二方面,本公开实施例还提供了一种数据采集装置。所述装置包括:
获取模块,用于响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
确定模块,用于根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
存入模块,用于将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
在其中一个实施例中,所述事件类型包括页面数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的页面;
第二确定子模块,用于从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
在其中一个实施例中,所述事件类型包括组件数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的组件;
第二确定子模块,用于从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
在其中一个实施例中,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定模块包括:
获取模块,用于获取预设历史时段内的账户的操作指令对应的事件数据;
划分模块,用于根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
存入模块,用于将所述多个事件属性类型存入预设的事件属性数据库中。
在其中一个实施例中,所述存入模块,包括:
处理模块,用于利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
存入子模块,用于将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
在其中一个实施例中,所述获取模块,包括:
获取子模块,用于响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
确定模块,用于确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
在其中一个实施例中,所述预设属性数据类型的获取模块,包括:
确定模块,用于从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
第三方面,本公开实施例还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本公开实施例中任一项所述的方法的步骤。
第四方面,本公开实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。
第五方面,本公开实施例还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。
本公开实施例,账户在平台组件上进行操作时,根据账户对平台组件的操作指令,获取和预设属性数据类型相对应的账户的行为属性数据,并根据行为属性数据确定和该操作指令相匹配的事件类型,将行为属性数据按照事件类型存入预设的事件数据库中,从而能够实现采集到的账户行为数据对应有预设的属性数据类型及事件类型,有利于后续进行分析处理;且通过对属性数据类型的划分,以及对事件类型的划分,能够采集得到多个维度的账户行为数据,对应于不同维度的账户行为数据进行分析处理,能够更为准确有效地对平台组件的运营情况进行分析,有利于后续平台的维护和更新迭代,提升了用户的体验感。
附图说明
图1为一个实施例中数据采集方法的应用环境图;
图2为一个实施例中数据采集方法的流程示意图;
图3为一个实施例中数据采集方法的流程示意图;
图4为一个实施例中数据采集方法的流程示意图;
图5为一个实施例中数据采集方法的流程示意图;
图6为一个实施例中数据采集方法的流程示意图;
图7为一个实施例中数据采集装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本公开实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开实施例,并不用于限定本公开实施例。
本公开实施例实施例提供的数据采集方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种数据采集方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S210,响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
本公开实施例中,用户在平台上执行操作,账户发送对平台上对应组件的操作指令,响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的账户的行为属性数据。其中,对应的行为属性数据与账户此次的操作指令相对应。在一个示例中,预设属性数据类型可以为从预设的属性数据类型数据库中获取,还可以为根据实际应用场景确定得到。在一个示例中,预设属性数据类型可以包括但不限于基础属性、页面属性、账户属性、组件属性、场景属性。其中,行为属性数据与预设属性数据类型相对应。在一个示例中,行为属性数据还包括事件属性数据,其中,可以对事件主体进行划分,得到几类事件要素,每一类要素根据自己的特征绑定特定的事件。在一个示例中,可以将事件要素划分为四类要素,如表1所示,包括页面要素、运营组件要素、DOM(文档对象模型)要素及原生要素。
表1
Figure BDA0003864282430000061
步骤S220,根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
本公开实施例中,获取行为属性数据之后,根据行为属性数据从预设的事件类型数据库中确定与操作指令相匹配的事件类型。其中,与操作指令相匹配的事件类型可以为一个或多个。预设的事件类型数据库通常为事先根据实际应用场景设置得到,预设的事件类型数据库中存储有一个或多个事件类型,可以包括但不限于组件数据类型、页面数据类型、事件属性类型。在一个示例中,每个事件类型对应有一个或多个具体的事件类型。在一个示例中,操作指令与具体的事件类型之间存在对应关系。在一个示例中,行为属性数据与具体的事件类型之间的关联关系也存储于预设的事件类型数据库中。预设的时间类型数据库可以为预设的元数据库,其中存储有对应有多重事件类型的事件模型表。
步骤S230,将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
本公开实施例中,将获取到的行为属性数据按照对应的事件类型存入预设的事件数据库中,其中,行为属性数据可以对应有多个事件类型。在一个示例中,预设属性数据类型可以包括账户行为属性数据类型和事件要素数据类型,根据预设属性数据类型形成要素事件配置矩阵。获取到的行为属性数据对要素事件配置矩阵进行填充,并存入预设的时间数据库中。
本公开实施例,账户在平台组件上进行操作时,根据账户对平台组件的操作指令,获取和预设属性数据类型相对应的账户的行为属性数据,并根据行为属性数据确定和该操作指令相匹配的事件类型,将行为属性数据按照事件类型存入预设的事件数据库中,从而能够实现采集到的账户行为数据对应有预设的属性数据类型及事件类型,有利于后续进行分析处理;且通过对属性数据类型的划分,以及对事件类型的划分,能够采集得到多个维度的账户行为数据,对应于不同维度的账户行为数据进行分析处理,能够更为准确有效地对平台组件的运营情况进行分析,有利于后续平台的维护和更新迭代,提升了用户的体验感。
在一个实施例中,所述事件类型包括页面数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的页面;
从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
本公开实施例中,事件类型包括页面数据类型。获取到行为属性数据后,根据行为属性数据确定操作指令对应的页面。其中,行为属性数据包括操作指令对应的页面数据,对应的页面数据可以包括但不限于页面标识等数据。根据行为属性数据就能够确定操作指令对应的页面。从预设的页面数据库中确定与页面对应的页面数据类型。其中,预设的页面数据库为页面数据类型对应的预设的事件类型数据库。在一个示例中,页面数据库通常为事先根据实际应用场景确定得到,可以通过页面及对应的页面属性确定。在一个示例中,可以根据平台对应的页面对页面进行划分和属性的确定,从而得到不同的页面数据类型,其中,页面数据类型中可以包括页面属性,将不同的页面数据类型存入对应的预设的页面数据库中。在一个示例中,可以通过site-map流水线插件在编译时将页面元数据,即页面数据类型,同步至页面数据库,其中,页面数据库可以存储于总的元数据库中。
本公开实施例,根据页面及对应的页面属性,得到页面数据库,并根据行为属性数据和页面数据库确定操作指令对应的页面数据类型,能够在采集数据的时候对采集到的账户行为属性数据进行页面类型的划分,从而在后续分析处理的时候能够从页面角度获取采集到的数据,有利于后续的分析处理,能够更为精准有针对性的进行数据的分析和处理,得到平台的运营分析的情况,有利于后续的维护和更新迭代,提升了用户的体验感。
在一个实施例中,所述事件类型包括组件数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的组件;
从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
本公开实施例中,事件类型包括组件数据类型。获取到行为属性数据后,根据行为属性数据确定操作指令对应的组件。其中,行为属性数据包括操作指令对应的组件数据,对应的组件数据可以包括但不限于组件标识等数据。根据行为属性数据就能够确定操作指令对应的组件。从预设的组件数据库中确定与组件对应的组件数据类型。其中,预设的组件数据库为组件数据类型对应的预设的事件类型数据库。在一个示例中,组件数据库通常为事先根据实际应用场景确定得到,可以通过组件及对应的组件属性确定。在一个示例中,可以根据平台对应的组件对组件进行划分和属性的确定,从而得到不同的组件数据类型,其中,组件数据类型中可以包括组件属性,将不同的组件数据类型存入对应的预设的组件数据库中。在一个示例中,因事件本身数据在编译时无法获取,可以在数据上送到kafka后,通过flink将元数据处理后生成事件唯一ID、并通过渠道+项目+页面路由+要素名称+事件类型的方式,形成语义明确的名称落到元数据库中事件模型表,可供业务分析人员在管理端查看事件数量并选用对应事件进行行为指标分析。
本公开实施例,根据组件及对应的组件属性,得到组件数据库,并根据行为属性数据和组件数据库确定操作指令对应的组件数据类型,能够在采集数据的时候对采集到的账户行为属性数据进行组件类型的划分,从而在后续分析处理的时候能够从组件角度获取采集到的数据,有利于后续的分析处理,能够更为精准有针对性的进行数据的分析和处理,得到平台的运营分析的情况,有利于后续的维护和更新迭代,提升了用户的体验感。
在一个实施例中,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定方式包括:
获取预设历史时段内的账户的操作指令对应的事件数据;
根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
将所述多个事件属性类型存入预设的事件属性数据库中。
本公开实施例中,事件类型包括事件属性类型,预设的事件类型数据库包括事件属性数据库。其中,事件属性数据库的获取方式为,首先获取预设历史时段内的账户的操作指令对应的事件数据,预设历史时段可以为事先根据实际应用场景确定得到。根据事件数据对应的事件属性数据对事件数据进行划分,得到多个事件属性类型。在一个示例中,划分事件属性类型时,可以为根据事件数据中的具体事件属性数据进行划分。将划分得到的多个事件属性类型存储在预设的事件属性数据库中。
本公开实施例,通过对历史事件数据进行分析处理,得到事件属性数据库,从而能够在进行数据采集时对账户的行为属性数据的事件属性类型进行区分,有利于后续从事件属性维度对平台及运营情况进行分析处理,更为准确地根据获取到的数据对平台情况进行分析,无需人工对采集到的数据进行再加工,提升了效率,有利于后续平台维护和迭代更新,提升了用户的体验感。
在一个实施例中,如图3所示,所述将所述行为属性数据按照所述事件类型存入预设的事件数据库中,包括:
步骤S231,利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
步骤S232,将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
本公开实施例中,获取到行为属性数据和对应的事件类型后,利用预设的图表生成模型对行为属性数据进行处理,得到对应的账户行为图表数据。其中,预设的图表生成模型通常可以根据实际应用场景选择合适的模型,在一个示例中,通过组件插件自动上送组件关键信息(组件key和栏位key),自动化获取目标分析模型起点定位。从组件配置页进入,携带组件关键信息,可实现组件PV、UV、CTR及漏斗模型配置查看,实现运营组件多维度报表视图的自动计算呈现。将行为属性数据、账户行为图表数据按照事件类型存入预设的事件数据库中。在一个示例中,行为属性数据和账户行为图表数据之间存在对应关系。在一个示例中,还可以根据多个账户的多个行为属性数据或一个账户的多个行为属性数据利用图表生成模型生成对应的行为属性图表数据。
本公开实施例,通过预设的图表生成模型得到行为属性数据对应的账户行为图表数据,实现了图表的自动生成,有利于后续的分析处理,提升了平台情况分析的效率和准确性,有利于后续平台的维护和更新迭代;且能够自动生成视图配置,无需人工生成,减少了人工工作量。
在一个实施例中,如图4所示,所述响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据,包括:
步骤S211,响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
步骤S212,确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
本公开实施例中,平台的交互页面通常具有对应的视图要素树,即视图树。接收账户对平台组件的操作指令,视图树上发生对应的操作事件。获取与该操作指令对应的视图树上的操作事件。根据该操作事件确定其对应的账户的行为属性数据。通常情况下,视图树中包括交互页面对应的信息等属性信息,根据视图树上的操作事件能够确定对应的账户的行为属性数据。其中,本实施例中,获取的行为属性数据与预设属性数据类型相对应。
本公开实施例,从平台对应的视图树中获取操作事件,从而确定账户的行为属性数据,实现了更为快捷准确地获取账户的行为属性数据,提高了数据获取的效率和精确度,从而有利于后续的数据分析;基于视图树获取账户的行为属性数据,有利于后续分析处理过程中基于页面或基于组件进行综合评判,进而提升了后续维护和更新迭代的精确性。
在一个实施例中,所述预设属性数据类型的获取方式,包括:
从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
本公开实施例中,预设属性数据类型为从预设的属性数据类型库中确定,其中,确定得到的预设属性数据类型与平台相对应。在一个示例中,预设的属性数据类型库为事先根据实际应用场景确定得到,可以应用到一个或多个平台上。当需要进行数据采集时,可以根据待采集的平台属性、采集数据的目的等情况从预设的属性数据类型库中确定预设属性数据类型。其中,预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。在一个示例中,预设的属性数据类型库中将属性划分为几个域,包括基础域、页面域、用户域、组件域、营销场景域及物品域,其中,基础域用于上送用户行为中的基础属性及存在定义上跨领域存在的公共属性;页面域用于上送用户行为与页面生命周期相关的属性;组件域在运营组件场景下,上送组件生命周期相关属性;营销场景域用于上送营销线索、AB实验相关关键属性;物品域用于上送资源交互类产品、非资源交互类产品通用物品属性。在一个示例中,预设的基础域对应的属性如表2所示。
表2
属性名 属性ID
设备品牌 basic_brand
设备机型 basic_device_model
操作系统 basic_os
操作系统版本 basic_os_version
设备当前IP地址 basic_ip
设备MAC basic_mac
浏览器名称 basic_browser_name
浏览器语言 basic_browser_lang
浏览器版本 basic_browser_version
网络类型 basic_network
事件时间 basic_timestamp
事件类型 basic_event
经度 basic_latitude
纬度 basic_longitude
唯一标识 basic_imei
渠道 basic_channel
子渠道 basic_sub_channel
曝光时长 basic_expose_time
元素名称 basic_dom_name
元素内容 basic_dom_content
元素路径 basic_tag_xpath
事件名称 basic_event_name
报错信息 basic_error_message
在一个示例中,预设的页面域对应的属性如表3所示。
表3
属性名 属性ID
页面url page_tag
页面名称 page_view
页面所属项目 page_project
页面运维追踪id page_trace_id
页而路由栈 page_routemap
在一个示例中,预设的用户域对应的属性如表4所示。
表4
属性名 属性ID
客户号 user_master_id
客户操作会话 user_session
用户号 user_user_id
登录状态 user_login_status
在一个示例中,预设的组件域对应的属性如表5所示。
表5
属性名 属性ID
栏位唯一标识 bcm_slot_key
栏位名称 bcm_slot_name
组件唯一标识 bcm_component_key
组件名称 bcm_component_name
组件类别 bcm_component_type
在一个示例中,预设的营销场景域对应的属性如表6所示。
表6
Figure BDA0003864282430000131
在一个示例中,预设的物品域对应的属性如表7所示。
表7
属性名 属性ID
物品类型 item_type
物品子类型 item_sub_type
资源交互类产品ID item_product_id
资源交互类产品名称 item_3roduct_name
资源交互类产品推荐人工号 item_product_recommeid_id
资源交互类产品产品类型 item_product_type
资源交互类产品期限 item_product_limit
资源交互类产品风险等级 item_product_risk
资源交互类产品购买金额 item_product_amount
资源交互类产品购买结果 item_product_trade_result
资源交互类产品购买失败原因 item_product_trade_errormsg
本公开实施例,通过从预设的属性数据类型库中确定预设属性数据类型,实现了根据不同应用场景获取不同属性数据类型的数据的目的,且预设的属性数据类型库中包括从多个维度设置的属性,能够在采集数据时对属性进行更为细致精确的划分,有利于后续对行为属性数据的事件类型的划分,进而能够实现对平台运营情况的精确的分析判断,有利于后续平台的运维和迭代调整,提升了用户的体验感。
图5为根据一示例性实施例示出的一种数据采集方法的流程示意图,参考图5所示,通过结合在SDK(软件工具开发包)启动时宿主项目中对于用户事件、用户要素的配置和通用配置,形成要素事件配置矩阵;数据采集过程中用户在视图要素树上发生操作事件,其中,操作事件可以包括但不限于点击事件、输入事件等;树目录更新订阅观察,执行订阅事件后,上送通用要素和组件要素。在一个示例中,树目录可以为事先设置好的事件数据类型目录,在应用过程中,可以根据实际应用场景对树目录进行更新调整。
图6为根据一示例性实施例示出的一种数据采集方法的流程示意图,参考图6所示,在平台开发过程中,页面组件开发人员根据平台的页面及组件利用预设的插件得到页面元数据,其中,预设的插件可以包括但不限于site-map ci插件,并将得到的页面元数据存入元数据库中。其中,元数据可以理解为数据类型,页面元数据可以理解为页面数据类型,元数据库中可以存储有一种或多种元数据,例如,页面元数据、组件元数据等。在数据采集过程中,通过埋点利用足迹采集采集账户的行为属性数据并上传至事件平台,同时通过埋点获取与元数据库中的元数据相对应的埋点元数据,埋点元数据与页面元数据共同存入元数据库,用于运营产品人员进行查询等操作。埋点获得的数据存入预设的事件数据库中,可以利用预设的图表生成或视图生成模块对事件数据库中的数据进行处理,实现视图配置的自动化。在一个示例中,还可以通过漏斗模型、用户分析、事件分析、分布分析、归因分析等分析方式或分析模型对事件数据库中的数据进行分析,针对分析后的数据进行视图配置,便于运营产品人员的进一步处理。在一个示例中,还可以接入其他分析平台,对数据进行采集分析,从而能够适用于更多应用场景。
本公开实施例,通过分域及元数据多方采集形成元数据流转视角,分域模型更清晰区分用户行为属性的各个模块内容,支持线上化流转流程;支持结合组件配置的自动化分析报表视图生成。从用户行为数据物理模型改造出发,单独划分运营组件信息领域,结合组件元数据,实现运营组件的配置、效果展示一体化。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的数据采集方法的数据采集装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据采集装置实施例中的具体限定可以参见上文中对于数据采集方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种数据采集装置700,包括:
获取模块710,用于响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
确定模块720,用于根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
存入模块730,用于将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
在一个实施例中,所述事件类型包括页面数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的页面;
第二确定子模块,用于从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
在一个实施例中,所述事件类型包括组件数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的组件;
第二确定子模块,用于从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
在一个实施例中,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定模块包括:
获取模块,用于获取预设历史时段内的账户的操作指令对应的事件数据;
划分模块,用于根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
存入模块,用于将所述多个事件属性类型存入预设的事件属性数据库中。
在一个实施例中,所述存入模块,包括:
处理模块,用于利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
存入子模块,用于将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
在一个实施例中,所述获取模块,包括:
获取子模块,用于响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
确定模块,用于确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
在一个实施例中,所述预设属性数据类型的获取模块,包括:
确定模块,用于从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
上述数据采集装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储账户的行为属性数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据采集方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本公开实施例方案相关的部分结构的框图,并不构成对本公开实施例方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本公开实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开实施例所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本公开实施例所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开实施例所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开实施例的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开实施例专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开实施例构思的前提下,还可以做出若干变形和改进,这些都属于本公开实施例的保护范围。因此,本公开实施例的保护范围应以所附权利要求为准。

Claims (17)

1.一种数据采集方法,其特征在于,所述方法包括:
响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
2.根据权利要求1所述的方法,其特征在于,所述事件类型包括页面数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的页面;
从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
3.根据权利要求1所述的方法,其特征在于,所述事件类型包括组件数据类型,所述根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型,包括:
根据所述行为属性数据确定所述操作指令对应的组件;
从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
4.根据权利要求1所述的方法,其特征在于,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定方式包括:
获取预设历史时段内的账户的操作指令对应的事件数据;
根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
将所述多个事件属性类型存入预设的事件属性数据库中。
5.根据权利要求1所述的方法,其特征在于,所述将所述行为属性数据按照所述事件类型存入预设的事件数据库中,包括:
利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
6.根据权利要求1所述的方法,其特征在于,所述响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据,包括:
响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
7.根据权利要求1所述的方法,其特征在于,所述预设属性数据类型的获取方式,包括:
从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
8.一种数据采集装置,其特征在于,所述装置包括:
获取模块,用于响应于账户对平台组件的操作指令,获取与预设属性数据类型相对应的所述账户的行为属性数据;
确定模块,用于根据所述行为属性数据,从预设的事件类型数据库中确定与所述操作指令相匹配的事件类型;
存入模块,用于将所述行为属性数据按照所述事件类型存入预设的事件数据库中。
9.根据权利要求8所述的装置,其特征在于,所述事件类型包括页面数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的页面;
第二确定子模块,用于从预设的页面数据库中确定与所述页面对应的页面数据类型,其中,所述预设的页面数据库为根据页面及对应的页面属性确定得到。
10.根据权利要求8所述的装置,其特征在于,所述事件类型包括组件数据类型,所述确定模块,包括:
第一确定子模块,用于根据所述行为属性数据确定所述操作指令对应的组件;
第二确定子模块,用于从预设的组件数据库中确定与所述组件对应的组件数据类型,其中,所述预设的组件数据库为根据组件及对应的组件属性确定得到。
11.根据权利要求8所述的装置,其特征在于,所述事件类型包括事件属性类型,所述预设的事件类型数据库包括事件属性数据库,所述事件属性数据库的确定模块包括:
获取模块,用于获取预设历史时段内的账户的操作指令对应的事件数据;
划分模块,用于根据所述事件数据对应的事件属性数据对所述事件数据进行划分,得到多个事件属性类型;
存入模块,用于将所述多个事件属性类型存入预设的事件属性数据库中。
12.根据权利要求8所述的装置,其特征在于,所述存入模块,包括:
处理模块,用于利用预设的图表生成模型对所述行为属性数据进行处理,得到与所述行为属性数据对应的账户行为图表数据;
存入子模块,用于将所述行为属性数据、所述账户行为图表数据按照所述事件类型存入预设的事件数据库中。
13.根据权利要求8所述的装置,其特征在于,所述获取模块,包括:
获取子模块,用于响应于账户对平台组件的操作指令,获取与所述操作指令对应的视图树上的操作事件;
确定模块,用于确定所述操作事件对应的所述账户的行为属性数据,其中,所述行为属性数据与预设属性数据类型相对应。
14.根据权利要求8所述的装置,其特征在于,所述预设属性数据类型的获取模块,包括:
确定模块,用于从预设的属性数据类型库中确定与所述平台相对应的预设属性数据类型,其中,所述预设的属性数据类型库中包括基础属性、页面属性、账户属性、组件属性、场景属性中的至少一种。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的数据采集方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的数据采集方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的数据采集方法的步骤。
CN202211173366.XA 2022-09-26 2022-09-26 数据采集方法、装置、计算机设备和存储介质 Pending CN115658421A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211173366.XA CN115658421A (zh) 2022-09-26 2022-09-26 数据采集方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211173366.XA CN115658421A (zh) 2022-09-26 2022-09-26 数据采集方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN115658421A true CN115658421A (zh) 2023-01-31

Family

ID=84986468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211173366.XA Pending CN115658421A (zh) 2022-09-26 2022-09-26 数据采集方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115658421A (zh)

Similar Documents

Publication Publication Date Title
US20220318486A1 (en) Deployable tag management in computer data networks
CN110688598B (zh) 业务参数采集方法、装置、计算机设备和存储介质
US11768908B2 (en) System and method for collection of a website in a past state and retroactive analysis thereof
US11354318B2 (en) Real-time collection and distribution of event stream data
CN113220657B (zh) 数据处理方法、装置及计算机设备
CN110019116B (zh) 数据追溯方法、装置、数据处理设备及计算机存储介质
US10210234B2 (en) Linking discrete dimensions to enhance dimensional analysis
CN107391528B (zh) 前端组件依赖信息搜索方法及设备
CN111858278A (zh) 基于大数据处理的日志分析方法、系统及可读存储装置
CN113885860A (zh) 一种自动配置管理页面生成接口服务的方法及设备
CN116644250B (zh) 页面检测方法、装置、计算机设备和存储介质
CN114238085A (zh) 接口测试方法、装置、计算机设备、存储介质
TW202222056A (zh) 用於實時分析虛擬伺服器記錄的電腦實施系統以及方法
CN117312657A (zh) 金融应用的异常功能定位方法、装置、计算机设备和介质
CN116155597A (zh) 访问请求的处理方法、装置及计算机设备
CN115658421A (zh) 数据采集方法、装置、计算机设备和存储介质
CN113220530B (zh) 数据质量监控方法及平台
CN111127057A (zh) 一种多维用户画像恢复方法
US10331693B1 (en) Filters and event schema for categorizing and processing streaming event data
CN115658680A (zh) 数据存储方法、数据查询方法和相关装置
KR102349495B1 (ko) 가상 서버들로부터 대용량 로그 파일들을 프로세싱하는 컴퓨터 시스템 및 방법.
CN110796505A (zh) 一种业务对象推荐方法以及装置
US11630817B2 (en) Method and system for data indexing and reporting
Bhuvaneswari et al. A comparative study of different log analyzer tools to analyze user behaviors
US20140143019A1 (en) Managing modeled audience extension information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination