CN112818041A - 一种用于大数据业务分析的业务信息处理方法及服务器 - Google Patents

一种用于大数据业务分析的业务信息处理方法及服务器 Download PDF

Info

Publication number
CN112818041A
CN112818041A CN202110251543.0A CN202110251543A CN112818041A CN 112818041 A CN112818041 A CN 112818041A CN 202110251543 A CN202110251543 A CN 202110251543A CN 112818041 A CN112818041 A CN 112818041A
Authority
CN
China
Prior art keywords
event
page
page operation
service
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110251543.0A
Other languages
English (en)
Inventor
裴炳坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110251543.0A priority Critical patent/CN112818041A/zh
Publication of CN112818041A publication Critical patent/CN112818041A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开的用于大数据业务分析的业务信息处理方法及服务器,通过分类目标事件的方式对第一页面操作业务信息序列进行业务操作事件分类处理,可以在服务器中确定该第二页面操作业务信息序列时,减少页面操作业务信息所占用的系统资源。通过分类目标事件的方式可以从每个分类结果中提取出具有区分度的页面操作业务事件作为目标页面操作业务事件,可以在根据这些目标页面操作业务事件进行业务操作事件分析处理的过程中,能够尽可能地确保该第二页面操作业务信息序列中的任意相匹配两个目标页面操作业务事件之间的事件行为校验可信度,通过相匹配两个目标页面操作业务事件之间的操作行为停留时长,还可以提高页面操作业务信息的操作行为校验效率。

Description

一种用于大数据业务分析的业务信息处理方法及服务器
技术领域
本公开涉及大数据及业务信息处理技术领域,特别涉及一种用于大数据业务分析的业务信息处理方法及服务器。
背景技术
随着大数据(big data)以及互联网(internet)的大力发展,为了改善人们的生活水平并提高企业面向用户的服务效率,市场上涌现了大量的针对各种业务场景的业务处理系统,通过业务处理系统能够快速地对接用户需求,并进行对应的业务处理。
现目前,大数据业务涉及人们生产生活的方方面面,诸如可视化界面交互、电子商务、在线办公、在线教育、政企云服务、云游戏服务、智慧物联网、智慧城市和智慧医疗等。大数据业务正在逐渐改变着社会的发展模式。
然而在大数据业务的实际应用的过程中,利用业务处理系统进行业务处理时,由于业务处理系统可能对接多个用户终端,为了确保用户终端的信息安全性,需要对用户终端的各类操作行为进行安全性校验,然而相关的操作行为校验技术存在校验可信度差且校验效率低下的问题。
发明内容
为改善相关技术中存在的技术问题,本公开提供了一种用于大数据业务分析的业务信息处理方法及服务器。
第一方面,本发明提供了一种用于大数据业务分析的业务信息处理方法,所述方法包括:对第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到第一页面操作业务信息序列相关联的分类结果,在所述分类结果中获取目标页面操作业务事件;所述目标页面操作业务事件的数量与所述分类结果的数量相同;基于所述目标页面操作业务事件确定第二页面操作业务信息序列;根据所述目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长;基于所述相匹配两个目标页面操作业务事件之间的操作行为停留时长对所述第二页面操作业务信息序列进行操作行为校验。
第二方面,本发明还提供了一种业务信息处理服务器,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果。
本公开提供了一种用于大数据业务分析的业务信息处理方法及服务器,通过分类目标事件的方式对第一页面操作业务信息序列进行业务操作事件分类处理,可以有效地确保业务操作事件分类处理后所得到的第二页面操作业务信息序列中的页面操作业务事件的数量少于所述第一页面操作业务信息序列中的页面操作业务事件的数量,从而可以在服务器中确定该第二页面操作业务信息序列时,减少页面操作业务信息所占用的系统资源;另外,通过分类目标事件的方式可以从每个分类结果中提取出具有区分度的页面操作业务事件作为目标页面操作业务事件,从而可以在根据这些目标页面操作业务事件进行业务操作事件分析处理的过程中,能够尽可能地确保该第二页面操作业务信息序列中的任意相匹配两个目标页面操作业务事件之间的事件行为校验可信度;另外,通过相匹配两个目标页面操作业务事件之间的操作行为停留时长,还可以有效地调整每个页面操作业务事件的操作行为触发时长,进而可以提高页面操作业务信息的操作行为校验效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种用于大数据业务分析的业务信息处理系统的结构示意图。
图2是本发明实施例提供的一种用于大数据业务分析的业务信息处理方法的流程示意图。
图3是本发明实施例提供的一种用于大数据业务分析的业务信息处理装置的框图。
图4是本发明实施例提供的一种业务信息处理服务器的硬件结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
请参见图1,是本申请实施例提供的一种用于大数据业务分析的业务信息处理系统的结构示意图。如图1所示,所述用于大数据业务分析的业务信息处理系统可以包括业务信息处理服务器200和业务操作设备集群,所述业务操作设备集群可以包括多个业务操作设备,如图1所示,具体可以包括业务操作设备310、业务操作设备320、业务操作设备330等。如图1所示,业务操作设备310、业务操作设备320、业务操作设备330等可以分别与所述业务信息处理服务器200进行通信连接,以便于每个业务操作设备可以通过该通信连接与业务信息处理服务器200之间进行数据交互。
为便于理解,本申请实施例可以在图1所示的多个业务操作设备中选择一个业务操作设备作为目标业务操作设备,该目标业务操作设备可以包括:智能手机、平板电脑、台式电脑等包括业务操作处理功能(例如,页面操作行为功能)的智能终端。对于业务信息处理服务器200而言,该业务信息处理服务器200中可以集成有具备相关业务操作处理功能。在该业务信息处理服务器200中所加载和进行操作的页面操作业务信息序列可以包含第一页面操作业务信息序列、第二页面操作业务信息序列。其中,所述第二页面操作业务信息序列可以为业务信息处理服务器200通过设定分类算法对所述第一页面操作业务信息序列进行业务操作事件分析处理后所得到的页面操作业务信息序列。
可以理解的是,本申请实施例中所描述的通过设定分类算法实现业务操作事件分析的方案,可以适用于所有在网页或者应用客户端(即前述目标页面交互服务)中使用页面操作业务事件序列实现的页面操作事件信息的应用场景中。其中,当具有业务操作处理功能的目标页面交互服务运行在业务信息处理服务器200中时,该业务信息处理服务器200所获取到的第一页面操作业务信息序列可以包含提前内置在该目标页面交互服务中的页面操作事件信息,还可以包含当前通过网络从目标业务操作设备中搜索的页面操作事件信息。
应当理解,本申请实施例可以将提前内置在该目标页面交互服务中的页面操作事件信息和当前搜索的页面操作事件信息统称为需要进行业务操作事件分析处理的页面操作业务信息(即第一页面操作业务信息序列)。由此可见,本申请实施例可以在网页或者目标页面交互服务运行期间,对该第一页面操作业务信息序列进行业务操作事件分析处理,以得到前述第二页面操作业务信息序列,从而可以在网页或者应用客户端中确定第二页面操作业务信息序列时,提高页面操作业务信息的准确性,并减少页面操作业务信息对系统资源的占用,同时,通过确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长,并进行所述第二页面操作业务信息序列的操作行为校验,能够快速、可靠地判断第二页面操作业务信息是否存在异常操作行为,这样可以基于操作行为的停留时长实现相关操作行为的校验。
其中,可选的,本申请实施例还可以在业务信息处理服务器200运行目标页面交互服务之前,对获取到的第一页面操作业务信息序列进行业务操作事件分析处理,以得到前述第二页面操作业务信息序列,从而可以在该目标业务操作设备运行该目标页面交互服务时,直接加载和使用该第二页面操作业务信息序列,以在该目标页面交互服务运行期间减少业务信息处理服务器200的相关资源损耗(比如,可以在该目标业务操作设备中减少页面操作业务信息对系统资源的占用)。
其中,本申请实施例所描述的页面操作事件信息可以包含点击操作信息、拖拽操作信息、滑动操作信息等。通俗而言,该页面操作事件信息中可以包含一个或者多个具有实际页面操作行为的操作事件。例如,以上述目标页面交互服务为电子银行交互服务为例,该业务信息处理服务器200可以通过该电子银行交互服务加载并确定这些相关事件序列所形成的页面操作事件信息,并可以在该电子银行交互服务中将所对应的页面操作事件信息统称为页面操作业务信息。
其中,为便于理解,进一步的,以下示例是本申请实施例提供的一种获取目标页面操作业务事件的示例。第一页面操作业务信息序列可以为包含多个页面操作业务事件,具体可以包含n个页面操作业务事件,n可以为大于1的正整数,这n个页面操作业务事件可以包括:页面操作业务事件100a,页面操作业务事件100b,页面操作业务事件100c,页面操作业务事件100d,页面操作业务事件100e,…,页面操作业务事件100n。其中,可以理解的是,在该业务信息处理服务器200的业务性能较为一般(即业务信息处理服务器200的行为校验性能较为一般)的前提下,为避免业务信息处理服务器200在直接加载第一页面操作业务信息序列所引起的操作行为校验效率较低的现象,可以在该业务信息处理服务器200中的网页或者服务应用客户端中通过设定分类算法对该第一页面操作业务信息序列进行业务操作事件分析处理,以得到与第一页面操作业务信息序列相关联的k个目标事件,k可以为大于1且小于n的正整数。
应当理解,通过设定分类算法可以计算该第一页面操作业务信息序列中的页面操作业务事件之间的关联度,从而可以基于所计算得到的页面操作业务事件之间的关联度划分该第一页面操作业务信息序列中的页面操作业务事件所属的分类结果。比如,可以得到k个分类结果,从而可以在这k个分类结果中分别提取出具有业务事件热度信息对应的最大热度值的页面操作业务事件作为目标页面操作业务事件。其中,这k个分类结果可以统称为分类结果,且这k个分类结果具体可以包含以下的分类结果00200a,分类结果00200b,分类结果00200c,分类结果00200d,…,分类结果00200k。其中,可以理解的是,上述的k个分类结果中每个分类结果中均可以包含至少一个页面操作业务事件。比如,分类结果00200a中可以包含页面操作业务事件100a,页面操作业务事件100b,页面操作业务事件100c;分类结果00200b中可以包含页面操作业务事件100d和页面操作业务事件100e;分类结果00200c中可以包含页面操作业务事件100f;分类结果00200d中可以包含页面操作业务事件100g,…,分类结果00200k中可以包含页面操作业务事件100(n-1),页面操作业务事件100n。由此可见,通过上述的第一页面操作业务信息序列中的页面操作业务事件进行分类处理,可以得到与第一页面操作业务信息序列相关联的多个分类结果,从而可以在每个分类结果中将具有业务事件热度信息对应的最大热度值的页面操作业务事件称之为目标页面操作业务事件,从而可以基于这些目标页面操作业务事件实现对第一页面操作业务信息序列进行业务操作事件分析处理,进而可以在业务操作事件分析处理后将由这些目标页面操作业务事件所构成的页面操作业务信息序列称之为第二页面操作业务信息序列。比如,该第二页面操作业务信息序列中的页面操作业务事件可以包含对第一页面操作业务事件进行业务操作事件分析处理后所得到的k个目标页面操作业务事件,这k个目标页面操作业务事件中的每个目标页面操作业务事件均为从相应分类结果中所提取出的页面操作业务事件。比如,可以将分类结果00200a中具有业务事件热度信息对应的最大热度值的页面操作业务事件100a称之为分类结果00200a对应的目标页面操作业务事件,同理,可以将分类结果00200b中具有业务事件热度信息对应的最大热度值的页面操作业务事件100e称之为分类结果00200b对应的目标页面操作业务事件。同理,可以将分类结果00200c中具有业务事件热度信息对应的最大热度值的页面操作业务事件100f称之为分类结果00200c对应的目标页面操作业务事件。同理,可以将分类结果00200d中具有业务事件热度信息对应的最大热度值的页面操作业务事件100g称之为分类结果00200d对应的目标页面操作业务事件。同理,可以将分类结果00200k中具有业务事件热度信息对应的最大热度值的页面操作业务事件100n称之为分类结果00200k对应的目标页面操作业务事件。进一步的,业务信息处理服务器200在网页或者目标页面交互服务中加载第二页面操作业务信息序列时,需要调整页面操作业务信息的事件分配情况,比如,可以根据这k个目标页面操作业务事件中的每个目标页面操作业务事件在第一页面操作业务信息序列中的操作行为时间点(即操作行为对应的停留时间信息)来确定第二页面操作业务信息序列,从而可以有效地调整第二页面操作业务信息序列中的每个目标页面操作业务事件的操作行为触发时长。
其中,在使用设定分类算法对第一页面操作业务信息序列进行分类时,可以得到与该第一页面操作业务信息相关联的k个分类,其中,k可以为大于1的正整数,一个分类可以称之为一个分类结果,且一个分类结果中可以包含至少一个页面操作业务事件。其中,可以理解的是,在这k个分类中,对于包含多个页面操作业务事件的任意一个分类而言,同一分类(即分类结果)中的任意两个页面操作业务事件之间是相似的,在一些需要提高操作行为校验灵敏度的应用场景下,为避免这些具有相似特征的不同页面操作业务事件在操作行为页面操作业务信息时占用系统的行为校验资源,可以对该页面操作业务事件所占用的系统资源进行适当调整处理,即可以对包含该页面操作业务事件的第一页面操作业务信息序列进行分类处理,以便于可以在分类所得到的每个分类结果中分别提取出一个具有业务事件热度信息对应的最大热度值的页面操作业务事件作为目标页面操作业务事件,进而可以基于这些目标页面操作业务事件实现对该第一页面操作业务信息序列的业务操作事件分析处理,以降低页面操作业务事件(例如,滑动操作信息)在网页或者目标页面交互服务中的性能损耗。其中,应当理解,这n个分类中的任意两个分类之间是不相似的,通过提取每个分类中的目标页面操作业务事件,可以确保业务操作事件分析处理后所得到的第二页面操作业务信息序列中的每个目标页面操作业务事件均具有较强的区分度,从而可以在网页或者目标页面交互服务中确定该第二页面操作业务信息时,确保该页面操作业务事件对应的页面操作业务信息的操作行为校验效率。
通俗而言,通过对第一页面操作业务事件进行业务操作事件分析处理,可以在网页或者目标页面交互服务中加载第二页面操作业务信息序列时,有效地减少页面操作业务信息所占用的系统资源。另外,通过记录每个目标页面操作业务事件在在第一页面操作业务信息序列中的操作行为对应的停留时间信息,还可以快速地确定出第二页面操作业务信息序列中的任意相匹配两个页面操作业务事件之间的操作行为停留时长,由于第二页面操作业务信息序列中的每个页面操作业务事件(即目标页面操作业务事件)均为对第一页面操作业务信息序列进行分类处理后所得到的页面操作业务事件,所以,该第二页面操作业务信息序列中的相匹配两个页面操作业务事件之间的操作行为停留时长可以不完全相同,比如,第二页面操作业务事件序列中的相匹配两个页面操作业务事件之间的操作行为停留时长可以为stay1,也可以为stay2,其中,操作行为停留时长stay1可以与操作行为停留时长stay2相同,也可以与操作行为停留时长stay2不同,从而可以在确定第二页面操作业务信息序列时实现对页面操作业务信息所占用系统资源的优化,以提高页面操作业务信息的操作行为校验效率。
其中,所述目标业务操作设备获取第一页面操作业务信息序列相关联的分类结果、从分类结果中获取目标页面操作业务事件以及确定第二页面操作业务信息序列的具体实现方式可以参见如下对应的实施例。
进一步地,请参见图2,是本申请实施例提供的一种用于大数据业务分析的业务信息处理方法的流程示意图。如图2所示,所述方法至少包括:
S101,对第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到第一页面操作业务信息序列相关联的分类结果,在所述分类结果中获取目标页面操作业务事件;
具体地,业务信息处理服务器200可以在获取到第一页面操作业务信息序列时,将该第一页面操作业务信息序列中的页面操作业务事件相关联的原始页面事件内容转化成目标页面事件内容,从而可以在所述目标页面事件内容中,进一步对所述第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到与所述第一页面操作业务信息序列相关联的分类结果;进一步地,该业务信息处理服务器200可以在所述分类结果中将与目标事件获取条件相匹配的页面操作业务事件作为目标页面操作业务事件。通俗而言,该业务信息处理服务器200可以通过设定分类算法将该第一页面操作业务信息序列划分为多个分类结果,从而可以从每个分类结果中筛选出符合目标事件获取条件的页面操作业务事件作为目标页面操作业务事件。其中,所述目标事件获取条件即为该业务信息处理服务器200在一个分类结果的每个页面操作业务事件所对应的业务事件热度信息中所筛选出的具有业务事件热度信息对应的最大热度值的页面操作业务事件。
可以理解的是,为确保该应用场景中的页面操作事件信息的操作行为校验效率,可以在该应用场景中通过设定分类算法对第一页面操作业务信息序列中的页面操作业务事件进行业务操作事件分析处理,以降低该应用场景中的页面操作业务信息所占用的系统资源。其中,所述应用场景可以包含网页中的点击操作信息、拖拽操作信息等,这里将不逐一地进行举例。另外,本申请实施例可以在这些应用场景中,将具有实际页面操作行为的事件行为所属的页面操作业务信息统称为第一页面操作业务信息序列。
其中,该第一页面操作业务信息序列中可以存在包含该操作行为事件(例如,事件caseA)的页面操作业务事件,还可以存在不包含该操作行为事件的页面操作业务事件。比如,对于包含该操作行为事件(即事件caseA)的第一页面操作业务信息序列中的每个页面操作业务事件而言,可以计算该第一页面操作业务信息序列中的每个页面操作业务事件之间的关联度,从而可以基于这些页面操作业务事件之间的关联度对该第一页面操作业务信息序列进行分类,以得到与该第一页面操作业务信息序列相关联的多个分类结果。比如,对于包含该事件caseA的每个页面操作业务事件而言,可以计算这些包含该事件caseA之间的每个页面操作业务事件之间的关联度,从而可以在该第一页面操作业务信息序列中,将存在较高关联度的页面操作业务事件划分在同一分类结果中,即在同一分类结果中的每个页面操作业务事件之间会存在较高的关联度,比如,在确定该第一页面操作业务信息序列中的第i1个页面操作业务事件分别与第i2个页面操作业务事件和第i3个页面操作业务事件之间存在较高的关联度时,可以将这3个页面操作业务事件划分在同一分类结果中。在该业务信息处理服务器200中,为避免一并加载这些具有较高关联度的多个页面操作业务事件所造成的服务器运行压力过大等现象,可以在网页或者应用客户端中获取到该第一页面操作业务信息序列时对该第一页面操作业务信息序列进行业务操作事件分析处理,以减少具有较高关联度的页面操作业务事件所占用的系统资源。通俗而言,可以对前述3个具有较高关联度的页面操作业务事件进行业务操作事件分析处理,以在该网页或者应用客户端中优化这3个页面操作业务事件中页面操作业务事件所占用的系统资源。
例如,在确定第一页面操作业务信息序列中的两个页面操作业务事件之间的关联度的过程中,为了能够更加符合用户对页面事件的实际操作习惯,可以先将该第一页面操作业务信息序列中的页面操作业务事件所属的页面事件内容从原始页面事件内容转化成目标页面事件内容,从而可以在该目标页面事件内容中通过事件优先执行的方式(即逐一事件分类的方式)依次得到参与确定的两个页面操作业务事件之间的页面事件访问记录,进而可以将这两个页面事件访问记录之间的事件类型关联度统称为这两个页面操作业务事件之间的关联度,在本申请实施例中,也可以将这两个页面操作业务事件之间的关联度称之为这两个页面操作业务事件之间的事件类型关联度。
例如,考虑到通过设定分类算法对第一页面操作业务信息序列中的页面操作业务事件所属的分类结果进行划分的过程中,每个分类(即分类结果)均会对应一个分类参考信息(可以简称为参考信息),因此,本申请实施例可以将参与分析的两个页面操作业务事件中的一个页面操作业务事件称之为第一页面操作业务事件,并将另一个页面操作业务事件称之为第二页面操作业务事件。其中,该第一页面操作业务事件可以理解为该第一页面操作业务信息序列中能够用作分类参考信息的页面操作业务事件,在选定了该第一页面操作业务事件之后,可以在该第一页面操作业务信息序列中通过事件执行优先级依次获取第二页面操作业务事件,从而可以分析出这两个页面操作业务事件分别对应的页面事件访问记录之间的事件类型关联度,并可以用分析得到的两个页面事件访问记录之间的事件类型关联度来描述这两个页面操作业务事件之间的关联度。
由此可见,本申请实施例在通过设定分类算法对该第一页面操作业务信息序列中的页面操作业务事件进行关联度分类之前,可以先把该第一页面操作业务信息序列中的页面操作业务事件所属的页面事件内容由原始页面事件内容转化成目标页面事件内容,以在该目标页面事件内容中,确定该第一页面操作业务信息序列中的每个页面操作业务事件之间的关联度(即事件类型关联度),以根据这些页面操作业务事件之间的事件类型关联度划分该第一页面操作业务信息序列的分类结果。
为便于理解,进一步地,请参见以下示例,是本申请实施例提供的一种划分第一页面操作业务信息序列相关联的分类结果的示例。第一页面操作业务信息序列可以包含多个页面操作业务事件,所述多个页面操作业务事件可以为页面操作业务事件100a、页面操作业务事件200a、页面操作业务事件300a、页面操作业务事件400a、页面操作业务事件500a。其中,可以理解的是,第一页面操作业务信息序列中的页面操作业务事件所属的页面事件内容为上述目标页面事件内容。即在该目标页面事件内容中,该集成有相关数据信息处理装置的业务信息处理服务器200可以对上述第一页面操作业务信息序列中的页面操作业务事件进行分类处理,以得到与所述第一页面操作业务信息序列相关联的分类结果。具体的,该业务信息处理服务器200可以在第一页面操作业务信息序列中,将该第一页面操作业务信息序列中的首个页面操作业务事件称之为能够用于作为分类参考信息的第一页面操作业务事件,并可以在该第一页面操作业务信息序列中将除第一页面操作业务事件外的页面操作业务事件确定为第二页面操作业务事件,并可以基于事件执行优先级依次获取所述第二页面操作业务事件。比如,业务信息处理服务器200可以在确定出第一页面操作业务事件时,进一步基于第一页面操作业务信息序列中每个页面操作业务事件的事件标签依次将页面操作业务事件200a,页面操作业务事件300a,页面操作业务事件400a,页面操作业务事件500a统称为第二页面操作业务事件,以依次确定出第一页面操作业务事件与第二页面操作业务事件之间的事件类型关联度。
例如,在页面操作业务事件100a作为第一页面操作业务事件时,可以首先确定该页面操作业务事件100a所属的分类结果。通俗而言,该业务信息处理服务器200可以在页面操作业务事件100a作为分类参考信息001时,开始第一轮的关联度计算,即可以计算页面操作业务事件100a(即第一页面操作业务事件)与页面操作业务事件200a(即第二页面操作业务事件)之间的事件类型关联度(即在第一轮的关联度计算的过程中可以得到关联度001),从而可以判断这两个页面操作业务事件之间的事件类型关联度(即关联度001)是否小于预设分类阈值,并可以在关联度001大于(或者等于)预设分类阈值时,将关联度001大于预设分类阈值的页面操作业务事件200a划分到第一页面操作业务事件(即页面操作业务事件100a)所属的分类结果(即分类结果001)中,通俗而言,本申请实施例可以将所述事件类型关联度大于或者等于预设分类阈值的第二页面操作业务事件划分到所述第一页面操作业务事件所属的分类结果。
此外,由于页面操作业务事件300为页面操作业务事件200的下一页面操作业务事件,因此,该业务信息处理服务器200仍然可以在页面操作业务事件100a作为分类参考信息001时,继续进行第二轮的关联度计算,该业务信息处理服务器200可以继续计算页面操作业务事件100a(即第一页面操作业务事件)与页面操作业务事件300a(即新的第二页面操作业务事件)之间的事件类型关联度(即在第二轮的关联度计算的过程中可以得到关联度002),从而可以判断这两个页面操作业务事件之间的事件类型关联度(即关联度002)是否小于预设分类阈值,并可以在关联度002小于预设分类阈值时,根据页面操作业务事件300a调整第一页面操作业务事件,即本申请实施例可以将事件类型关联度小于预设分类阈值的第二页面操作业务事件(即第一页面操作业务信息序列中的页面操作业务事件300a)作为新的分类参考信息,该新的分类参考信息可以为分类参考信息002,本申请实施例可以为该页面操作业务事件300a确定新的分类结果,该新的分类结果可以为分类结果002。此时,由于页面操作业务事件100a与页面操作业务事件300a之间的事件类型关联度是小于预设分类阈值的,因此,本申请实施例可以不用继续将该页面操作业务事件100a与上述未匹配的第二页面操作业务事件(即页面操作业务事件400a和页面操作业务事件500a)进行事件类型关联度匹配。
在另外实施过程中,本申请实施例在确定新的分类参考信息(即分类参考信息002)时,可以得到新的第一页面操作业务事件(页面操作业务事件300a),此时,该页面操作业务事件300a所属的分类结果可以为分类结果002,然后,该业务信息处理服务器200依然可以基于上述事件执行优先级依次获取第二页面操作业务事件,即可以继续从上述未匹配的第二页面操作业务事件(即页面操作业务事件400a和页面操作业务事件500a)中获取第二页面操作业务事件。进一步地,该业务信息处理服务器200可以在页面操作业务事件300a作为分类参考信息002时,重新开始第一轮的关联度计算,即可以计算页面操作业务事件300a(即新的第一页面操作业务事件)与页面操作业务事件400a(即第二页面操作业务事件)之间的事件类型关联度(即在新的第一轮的关联度计算的过程中可以得到关联度003),从而可以判断这两个页面操作业务事件之间的事件类型关联度(即关联度003)是否小于预设分类阈值,并可以在关联度003小于预设分类阈值时,根据页面操作业务事件400a调整该新的第一页面操作业务事件,即本申请实施例可以将事件类型关联度小于预设分类阈值的第二页面操作业务事件(即第一页面操作业务信息序列中的页面操作业务事件400a)作为另一新的分类参考信息,该另一新的分类参考信息可以作为分类参考信息003,本申请实施例可以为该页面操作业务事件400a确定新的分类结果,该新的分类结果可以为分类结果003。此时,由于页面操作业务事件300a与页面操作业务事件400a之间的事件类型关联度是小于预设分类阈值的,因此,本申请实施例可以不用继续将该页面操作业务事件300a与新的未匹配的第二页面操作业务事件(即页面操作业务事件500a)进行事件类型关联度匹配。
应当理解,本申请实施例在确定另一新的分类参考信息(即分类参考信息003)时,可以得到该另一新的第一页面操作业务事件(即页面操作业务事件400a),此时,该页面操作业务事件400a所属的分类结果可以为分类结果003,然后,该业务信息处理服务器200依然可以基于上述事件执行优先级获取第二页面操作业务事件,即可以继续从上述未匹配的第二页面操作业务事件(即页面操作业务事件500a)中获取第二页面操作业务事件。进一步地,该目标业务操作设备可以在页面操作业务事件400a作为分类参考信息003时,重新开始第一轮的关联度计算,即可以计算页面操作业务事件400a(即另一新的第一页面操作业务事件)与页面操作业务事件500a(即第二页面操作业务事件)之间的事件类型关联度,从而可以基于参与计算的这两个页面操作业务事件之间的事件类型关联度(例如,关联度004)划分页面操作业务事件500a所属的分类结果。比如,若该关联度004大于或者等于预设分类阈值,则可以将该页面操作业务事件500a(即事件类型关联度大于或者等于预设分类阈值的第二页面操作业务事件)划分到前述页面操作业务事件400a所属的分类结果(即分类结果003)中,此时,通过页面操作业务事件之间的事件类型关联度所确定出的与该第一页面操作业务信息序列相关联的分类结果可以包含分类结果001,分类结果002以及分类结果003。可选地,若该关联度004小于预设分类阈值,则可以将该页面操作业务事件500a(即事件类型关联度大于或者等于所述分类阈值的第二页面操作业务事件)划分到新的分类结果,即该业务信息处理服务器200可以为该页面操作业务事件500a确定新的分类结果(例如,分类结果004)。此时,通过页面操作业务事件之间的事件类型关联度所确定出的与该第一页面操作业务事件相关联的分类结果可以包含分类结果001,分类结果002,分类结果003,还可以包含前述分类结果004。
由此可见,本申请实施例可以在确定第一页面操作业务事件所属的分类结果时,在目标页面事件内容中将第一页面操作业务事件与第二页面操作业务事件进行事件类型关联度匹配;若匹配到第一页面操作业务事件与第二页面操作业务事件之间的事件类型关联度大于或者等于分类阈值,则将事件类型关联度大于或者等于分类阈值的第二页面操作业务事件划分到第一页面操作业务事件所属的分类结果;可选地,若匹配到第一页面操作业务事件与第二页面操作业务事件之间的事件类型关联度小于所述分类阈值,则基于事件类型关联度小于分类阈值的第二页面操作业务事件调整第一页面操作业务事件,并确定调整后的第一页面操作业务事件所属的分类结果,并将调整后的第一页面操作业务事件依次与未匹配的第二页面操作业务事件进行事件类型关联度匹配,直到第一页面操作业务信息序列中的页面操作业务事件均完成事件类型关联度匹配时,即直到第一页面操作业务信息序列中的每个第二页面操作业务事件均完成事件类型关联度匹配时,可以输出第一页面操作业务信息序列中的页面操作业务事件所属的分类结果。此外,本申请实施例在目标页面事件内容中将所述第一页面操作业务事件与所述第二页面操作业务事件进行事件类型关联度匹配的具体过程还可以描述为:该业务信息处理服务器200可以将所述第一页面操作业务事件在所述目标页面事件内容中的页面事件访问记录确定为第一访问记录,并将所述第二页面操作业务事件在所述目标页面事件内容中的页面事件访问记录确定为第二访问记录;所述目标页面事件内容包含多个页面事件分布信息;进一步地,该业务信息处理服务器200可以基于所述第一访问记录中的每个页面事件分布信息相关联的访问频率值、所述第二访问记录中的每个页面事件分布信息相关联的访问频率值,确定所述第一访问记录和第二访问记录之间的关联度;进一步地,该业务信息处理服务器200可以将所述第一访问记录和第二访问记录之间的关联度确定为第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度。
相关实施例中,应当理解,本申请实施例在确定了与该第一页面操作业务信息序列相关联的多个分类结果之后,可以从每个分类结果中获取一个具有区分度的页面操作业务事件作为目标页面操作业务事件。即本申请实施例可以在每个分类结果中筛选出满足目标事件获取条件的页面操作业务事件,并可以将满足目标事件获取条件的页面操作业务事件统称为目标页面操作业务事件,以便于进一步执行S102。
S102,基于所述目标页面操作业务事件确定第二页面操作业务信息序列。为便于理解,进一步地,是本申请实施例提供的一种确定第二页面操作业务信息序列的示例。其中,在上述第一页面操作业务信息序列中的页面操作业务事件100a作为分类参考信息(即分类参考信息001)时,在分类结果001中的页面操作业务事件可以包含页面操作业务事件100a和页面操作业务事件200a;另外,在上述的第一页面操作业务信息序列中的页面操作业务事件300a作为新的分类参考信息(即分类参考信息002)时,在分类结果002中的页面操作业务事件可以包含页面操作业务事件300a;另外,在上述的第一页面操作业务信息序列中的页面操作业务事件400a作为另一新的分类参考信息(即分类参考信息003)时,在分类结果003中的页面操作业务事件可以包含页面操作业务事件400a和页面操作业务事件500a。本申请实施例可以将分类结果001、分类结果002、分类结果003统称为分类结果,然后,该业务信息处理服务器200可以在目标页面事件内容中,基于分类结果中的页面操作业务事件所包括的每个页面事件分布信息分别对应的累计访问频率值,确定所述分类结果中的页面操作业务事件对应的业务事件热度信息;进一步地,该业务信息处理服务器200可以在所述分类结果中的页面操作业务事件对应的业务事件热度信息中查找具有业务事件热度信息对应的最大热度值的页面操作业务事件,业务信息处理服务器200可以从分类结果001中将具有业务事件热度信息对应的最大热度值的页面操作业务事件100a称之为满足目标事件获取条件的目标页面操作业务事件001;同理,该业务信息处理服务器200可以从分类结果002中将具有业务事件热度信息对应的最大热度值的页面操作业务事件300a称之为满足目标事件获取条件的目标页面操作业务事件002,同理,业务信息处理服务器200可以分类结果003中将具有业务事件热度信息对应的最大热度值的页面操作业务事件300a称之为满足目标事件获取条件的目标页面操作业务事件003。通俗而言,本申请实施例可以将将查找到的具有业务事件热度信息对应的最大热度值的页面操作业务事件统称为从分类结果中所获取到的目标页面操作业务事件。进一步地,业务信息处理服务器200可以根据以上3个目标页面操作业务事件构成一个新的页面操作业务信息序列,并可以将该新的页面操作业务信息序列称之为上述的第二页面操作业务信息序列,从而可以实现对第一页面操作业务信息序列的业务操作事件分析处理。可以理解的是,该第二页面操作业务信息序列中的页面操作业务事件可以包含上述目标页面操作业务事件001(即在分类结果001中具有业务事件热度信息对应的最大热度值的页面操作业务事件100a)、上述的目标页面操作业务事件002(即在分类结果002中具有业务事件热度信息对应的最大热度值的页面操作业务事件300a)、上述的目标页面操作业务事件003(即在分类结果003中具有业务事件热度信息对应的最大热度值的页面操作业务事件400a)。
其中,本申请实施例在所述目标页面事件内容中,基于所述分类结果中的页面操作业务事件所包括的每个页面事件分布信息分别对应的累计访问频率值,确定所述分类结果中的页面操作业务事件对应的业务事件热度信息的具体过程可以描述为:获取所述目标页面事件内容中的每个页面事件分布信息的页面点击路径信息;获取所述分类结果中的页面操作业务事件在所述每个页面事件分布信息的页面点击路径信息上的访问频率值,并对所述每个页面事件分布信息的页面点击路径信息上的访问频率值进行累计,得到所述每个页面事件分布信息分别对应的累计访问频率值;基于所述每个页面事件分布信息对应的累计访问频率值和相应页面事件分布信息对应的事件互动频次,确定所述分类结果中的页面操作业务事件的业务事件热度信息。
S103,根据所述目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长。
其中,在第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件可以包含第一目标页面操作业务事件和第二目标页面操作业务事件,通过记录相匹配的两个目标页面操作业务事件分别在第一页面操作业务信息序列中的操作行为对应的停留时间信息,可以得到这两个目标页面操作业务事件之间的操作行为停留时长,从而可以在操作行为停留时长内操作行为第一目标页面操作业务事件,以进一步执行S104。
S104,基于所述相匹配两个目标页面操作业务事件之间的操作行为停留时长对所述第二页面操作业务信息序列进行操作行为校验。
具体地,该目标业务操作设备可以基于所述第一目标页面操作业务事件和第二目标页面操作业务事件之间的操作行为停留时长调整所述第一目标页面操作业务事件的操作行为触发时长(即页面交互响应时长);从而可以在该第一目标页面操作业务事件的操作行为触发时长(即页面交互响应时长)内对所述第一目标页面操作业务事件进行操作行为,直到所述第二页面操作业务信息序列的业务操作进度达到所述第二目标页面操作业务事件的操作行为对应的停留时间信息的时间节点时,对所述第二页面操作业务信息序列进行操作行为校验。
为便于理解,进一步地,以下是本申请实施例提供的一种确定第二页面操作业务信息序列的示例,业务信息处理服务器200可以在确定出相匹配两个目标页面操作业务事件之间的操作行为停留时长(即第一目标页面操作业务事件与第二目标页面操作业务事件之间的操作行为停留时长)时,基于这两个目标页面操作业务事件之间的操作行为停留时长调整第一目标页面操作业务事件的操作行为触发时长。其中,第二页面操作业务信息序列中的目标页面操作业务事件001可以为第一页面操作业务信息序列中的页面操作业务事件100a,第二页面操作业务信息序列中的目标页面操作业务事件002可以为第一页面操作业务信息序列中的页面操作业务事件300a,第二页面操作业务信息序列中的目标页面操作业务事件003可以为第一页面操作业务信息序列中的页面操作业务事件400a。该目标页面操作业务事件001在第一页面操作业务信息序列中的操作行为对应的停留时间信息可以为停留时间信息stay1,即在第一页面操作业务信息序列中,当业务操作进度达到该停留时间信息stay1时,则可以操作行为该第一页面操作业务信息序列中的页面操作业务事件100a;同理,该目标页面操作业务事件002在第一页面操作业务信息序列中的操作行为对应的停留时间信息可以为停留时间信息stay3,即在第一页面操作业务信息序列中,当业务操作进度达到该停留时间信息stay3时,则可以操作行为该第一页面操作业务信息序列中的页面操作业务事件300a;同理,该目标页面操作业务事件003在第一页面操作业务信息序列中的操作行为对应的停留时间信息可以为停留时间信息stay4,即在第一页面操作业务信息序列中,当业务操作进度达到该停留时间信息stay4时,则可以操作行为该第一页面操作业务信息序列中的页面操作业务事件400a。另外,为确保业务操作事件分析处理后的每个目标页面操作业务事件的操作行为检测可信度,需要调整该第二页面操作业务信息序列中的每个目标页面操作业务事件的事件分配情况。比如,该业务信息处理服务器200可以在对分类结果中的页面操作业务事件进行业务操作事件分析处理时,同步标记每个分类结果中的目标页面操作业务事件在第一页面操作业务信息序列中的时间点(即前述停留时间信息stay1,前述停留时间信息stay3,前述停留时间信息stay4),从而可以根据根据每个目标页面操作业务事件对应的时间点来确定该第二页面操作业务信息序列。通俗而言,本申请实施例可以在确定第二页面操作业务信息序列时,基于每个目标页面操作业务事件对应的时间点来校验每个目标页面操作业务事件。
可选地,本申请实施例还可以在确定每个目标页面操作业务事件的操作行为对应的停留时间信息(即时间点)时,进一步确定相匹配两个目标页面操作业务事件(即第一目标页面操作业务事件与第二目标页面操作业务事件)之间的操作行为停留时长,从而可以通过相匹配两个目标页面操作业务事件之间的操作行为停留时长调整这两个目标页面操作业务事件中的第一目标页面操作业务事件的页面交互响应时长,以进一步调整该第二页面操作业务信息序列中的每个目标页面操作业务事件的事件分配情况。比如,对于第二页面操作业务信息序列中的三个目标页面操作业务事件而言,可以将目标页面操作业务事件001与目标页面操作业务事件002称之为相匹配两个目标页面操作业务事件,同理,本申请实施例也可以将目标页面操作业务事件002与目标页面操作业务事件003称之为相匹配两个目标页面操作业务事件。其中,目标页面操作业务事件001与目标页面操作业务事件002之间的操作行为停留时长可以为上述页面操作业务事件100a对应的停留时间信息stay1与上述页面操作业务事件300a对应的停留时间信息stay2之间的操作行为停留时长,通过该相匹配两个目标页面操作业务事件之间的操作行为停留时长可以得到页面交互响应时长001,从而可以在页面交互响应时长001内校验目标页面操作业务事件001,以调整目标页面操作业务事件001(即第一目标页面操作业务事件)的操作行为触发时长,并可以在该第二页面操作业务信息序列的业务操作进度达到目标页面操作业务事件002的操作行为停留时长(即前述停留时间信息stay3)时,校验该目标页面操作业务事件002(即第二目标页面操作业务事件)。
同理,目标页面操作业务事件002与目标页面操作业务事件003之间的操作行为停留时长可以为上述页面操作业务事件300a对应的停留时间信息stay3与上述页面操作业务事件400a对应的停留时间信息stay4之间的操作行为停留时长,通过该相匹配两个目标页面操作业务事件之间的操作行为停留时长可以得到页面交互响应时长002,从而可以在页面交互响应时长002内校验目标页面操作业务事件001,以调整目标页面操作业务事件002(即新的第一目标页面操作业务事件)的操作行为触发时长,并可以在该第二页面操作业务信息序列的业务操作进度达到目标页面操作业务事件003的操作行为停留时长(即前述停留时间信息stay4)时,校验该目标页面操作业务事件003(即新的第二目标页面操作业务事件),直到该第二页面操作业务信息序列的操作行为触发时长达到上述第一页面操作业务信息序列的操作行为触发时长时,停止对该第二页面操作业务信息序列的操作行为校验。
本申请实施例中通过分类目标事件的方式对第一页面操作业务信息序列进行业务操作事件分析处理,可以有效地确保业务操作事件分析处理后所得到的第二页面操作业务信息序列中的页面操作业务事件的数量少于所述第一页面操作业务信息序列中的页面操作业务事件的数量,从而可以在确定该第二页面操作业务信息序列时,减少页面操作业务信息所占用的系统资源;另外,通过分类目标事件的方式可以从每个分类结果中提取出具有区分度的页面操作业务事件作为目标页面操作业务事件,从而可以在根据这些目标页面操作业务事件进行业务操作事件分析处理的过程中,能够尽可能地确保该第二页面操作业务信息序列中的任意相匹配两个目标页面操作业务事件之间的事件行为校验可信度;另外,通过相匹配两个目标页面操作业务事件之间的操作行为停留时长,还可以有效地调整每个页面操作业务事件的操作行为触发时长,进而可以提高页面操作业务信息的操作行为校验效率。
进一步地,以下示例是本申请实施例提供的另一种用于大数据业务分析的业务信息处理方法的实施方式,所述方法可以包含以下步骤。
S201,获取第一页面操作业务信息序列,并将所述第一页面操作业务信息序列中的页面操作业务事件相关联的原始页面事件内容转化成目标页面事件内容;其中,业务信息处理服务器200将第一页面操作业务信息序列中的页面操作业务事件相关联的原始页面事件内容转化成目标页面事件内容的具体实现方式可以参见上述图2所对应实施例中对目标页面事件内容的描述,这里将不再继续进行赘述。
S202,在所述目标页面事件内容中,对所述第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到与所述第一页面操作业务信息序列相关联的分类结果;具体地,目标业务操作设备可以从所述第一页面操作业务信息序列中获取用于作为分类参考信息的第一页面操作业务事件;进一步地,目标业务操作设备可以在所述第一页面操作业务信息序列中将除所述第一页面操作业务事件之外的页面操作业务事件确定为第二页面操作业务事件,并基于事件执行优先级依次获取所述第二页面操作业务事件;进一步地,目标业务操作设备可以在所述目标页面事件内容中,根据所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度,划分所述第一页面操作业务信息序列中的页面操作业务事件所属的分类结果。
其中,可以理解的是,目标业务操作设备在该目标页面事件内容中,可以对该第一页面操作业务信息序列中的两个页面操作业务事件进行逐一事件分类,且在逐一事件分类的过程中主要是通过两个页面操作业务事件之间的事件类型关联度来进行分类。其中,该第一页面操作业务信息序列中的两个页面操作业务事件可以包含第一页面操作业务事件和第二页面操作业务事件。其中,本申请实施例可以将这两个页面操作业务事件中的一个页面操作业务事件(即第一页面操作业务事件)可以称之为分类参考信息,并可以将这两个页面操作业务事件中的另一页面操作业务事件称之为待与该分类参考信息进行事件类型关联度匹配的第二页面操作业务事件。
其中,可以理解的是,对于上述的第一页面操作业务信息序列而言,可以将该第一页面操作业务信息序列中的首个页面操作业务事件(即页面操作业务事件100a)称之为分类参考信息001,此时,本申请实施例可以将该分类参考信息001统称为两个页面操作业务事件中的第一页面操作业务事件,并可以在第一页面操作业务信息序列中将除该分类参考信息001之外的页面操作业务事件称之为第二页面操作业务事件,此时,这些第二页面操作业务事件均为待与该分类参考信息001进行事件类型关联度匹配的第二页面操作业务事件。进一步的,本申请实施例可以根据前述逐一事件分类的规则,在该第一页面操作业务信息序列中通过轮序机制依次获取待与该第一页面操作业务事件进行事件类型关联度匹配的第二页面操作业务事件,此时,这些待与分类参考信息001进行事件类型关联度匹配的第二页面操作业务事件(例如,上述的页面操作业务事件200a,页面操作业务事件300a,页面操作业务事件400a,页面操作业务事件500a)可以统称为待匹配的第二页面操作业务事件。所以,可以根据前述事件执行优先级在上述的第一页面操作业务信息序列中优先将与页面操作业务事件100a相匹配的页面操作业务事件200a确定为待匹配的第二页面操作业务事件,以计算页面操作业务事件100a(即第一页面操作业务事件)与页面操作业务事件200a之间的事件类型关联度。
其中,可以理解的是,本申请实施例在计算第一页面操作业务信息序列中的两个页面操作业务事件(即页面操作业务事件100a与页面操作业务事件200a)之间的关联度(即事件类型关联度)时,可以先分别计算这两个页面操作业务事件的页面事件访问记录之间的相似性,即本申请实施例可以将第一页面操作业务事件(即前述页面操作业务事件300a)在该目标页面事件内容中的页面事件访问记录称之为第一访问记录,并将第二页面操作业务事件(即页面操作业务事件200a)在该目标页面事件内容中的页面事件访问记录称之为第二访问记录。
其中,可以理解的是,当该目标业务操作设备在得到该页面事件内容中的三个分布信息分别对应的最小累计访问频率值时,可以根据这三个页面事件分布信息分别对应的最小累计访问频率值确定出两个页面操作业务事件的第一访问记录和第二访问记录之间的关联度,以间接确定出页面操作业务事件100a与页面操作业务事件200a之间的事件类型关联度。
由此可见,本申请实施例在比较两个页面操作业务事件之间的关联度的过程中,可以比较这两个页面操作业务事件的页面事件访问记录之间的相似性,即可以比较这两个页面操作业务事件的页面事件访问记录中的三个页面事件分布信息之间的相似性,通俗而言,本申请实施例可以在得到这3个页面事件分布信息分别对应的最小累计访问频率值之后,可以获取每个页面事件分布信息对应的权重,从而可以根据每个页面事件分布信息分别对应的最小累计访问频率值和相应页面事件分布信息分别对应的权重进行相乘之后再进行求和处理,以计算得到这两个页面操作业务事件的第一访问记录与第二访问记录之间的关联度,并可以进一步将这两个页面操作业务事件的第一访问记录与第二访问记录之间的关联度统称为第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度,以便于后续可以根据这两个页面操作业务事件的事件类型关联度(即关联度),划分上述的第一页面操作业务信息序列中的页面操作业务事件200a所属的分类结果。比如,若匹配到第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度大于或者等于分类阈值,则可以将所述事件类型关联度大于或者等于所述分类阈值的第二页面操作业务事件(例如,页面操作业务事件200a)划分到所述第一页面操作业务事件所属的分类结果(例如,上述的分类结果001)。可选的,若匹配到所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度小于所述分类阈值,则可以基于所述事件类型关联度小于所述分类阈值的第二页面操作业务事件(例如,上述的页面操作业务事件300a)调整所述第一页面操作业务事件(例如,页面操作业务事件100a),并确定调整后的第一页面操作业务事件所属的分类结果(即上述页面操作业务事件300a所属的分类结果002),并将所述调整后的第一页面操作业务事件(即页面操作业务事件300a)依次与未匹配的第二页面操作业务事件进行事件类型关联度匹配,直到所述第一页面操作业务信息序列中的页面操作业务事件均完成事件类型关联度匹配时,可以输出第一页面操作业务信息序列中的页面操作业务事件所属的分类结果,具体的,可以一并参见上述对应实施例中对各分类结果的描述,这里将不再继续进行赘述。
S203,在所述分类结果中将与目标事件获取条件相匹配的页面操作业务事件作为目标页面操作业务事件;具体地,目标业务操作设备可以在所述目标页面事件内容中,基于所述分类结果中的页面操作业务事件所包括的每个页面事件分布信息分别对应的累计访问频率值,确定所述分类结果中的页面操作业务事件对应的业务事件热度信息;进一步的,目标业务操作设备可以在所述分类结果中的页面操作业务事件对应的业务事件热度信息中查找具有业务事件热度信息对应的最大热度值的页面操作业务事件;进一步地,目标业务操作设备可以将查找到的具有业务事件热度信息对应的最大热度值的页面操作业务事件作为从所述分类结果中所获取到的目标页面操作业务事件。
S204,基于所述目标页面操作业务事件确定第二页面操作业务信息序列;
S205,根据所述目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长;
其中,可以理解的是,本申请实施例所描述的第一页面操作业务信息序列中的每个页面操作业务事件的操作行为对应的停留时间信息可以为进行操作行为校验时的停留时间信息,即可以在操作行为校验该第一页面操作业务信息序列时由操作行为对应的停留时间信息最小的停留时间信息对应的时刻开始进行操作行为校验,直到该第一页面操作业务信息序列的业务操作进度达到该第一页面操作业务信息序列的终点对应的停留时间信息。此时,在该第二页面操作业务信息序列中的首个目标页面操作业务事件的操作行为对应的停留时间信息也就具有最小的停留时间信息。可选的,本申请实施例还可以对该第一页面操作业务信息序列进行间隔型的操作行为校验,即可以在按照设定时长校验该第一页面操作业务信息序列时由操作行为对应的停留时间信息最大的停留时间信息开始进行,直到该第一页面操作业务信息序列的业务操作进度达到该第一页面操作业务信息序列的起点对应的停留时间信息。此时,在该第二页面操作业务信息序列中的首个目标页面操作业务事件的操作行为对应的停留时间信息也就具有最大的停留时间信息。为便于理解,本申请实施例仅以进行操作行为校验该第一页面操作业务信息序列为例,以进一步根据每个目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,在该第二页面操作业务信息序列中确定相匹配两个目标页面操作业务事件之间的操作行为停留时长。其中,所述相匹配两个目标页面操作业务事件包含第一目标页面操作业务事件和第二目标页面操作业务事件;
S206,基于所述第一目标页面操作业务事件和第二目标页面操作业务事件之间的操作行为停留时长调整所述第一目标页面操作业务事件的操作行为触发时长;
S207,基于所述第一目标页面操作业务事件的操作行为触发时长对所述第一目标页面操作业务事件进行操作行为,直到所述第二页面操作业务信息序列的业务操作进度达到所述第二目标页面操作业务事件的操作行为对应的停留时间信息的时间节点时,对所述第二页面操作业务信息序列进行操作行为校验。其中,所述S204-S207的具体实现方式可以参见上述图2所对应实施例中对S102-S104的描述,这里将不再继续进行赘述。
在一些可选择的实施例中,S207所描述的对所述第二页面操作业务信息序列进行操作行为校验,进一步可以包括以下内容:获取连续两组第二页面操作业务信息序列的页面关键信息,其中,所述页面关键信息包括页面访问交互数据的访问权限数据和操作指引指示的操作指引路径数据;利用信息分析线程对所述页面关键信息进行处理,分别得到所述连续两组操作指引路径数据的详细指引服务内容、所述连续两组操作指引路径数据的初始划分路径标记及所述连续两组操作指引路径数据的有效页面路径数据;构建目标数据解析模型,利用所述访问权限数据、所述连续两组操作指引路径数据的详细指引服务内容及所述连续两组操作指引路径数据的有效页面路径数据确定所述目标数据解析模型中的初始目标操作行为;构建行为校验模型,利用所述连续两组操作指引路径数据的初始划分路径标记及所述目标数据解析模型中的初始目标操作行为对所述行为校验模型中目标划分路径标记和目标操作行为进行校验处理,使所述行为校验模型迭代校验所述目标划分路径标记和所述目标操作行为,得到实时的目标操作行为校验结果。如此设计,能够在提高操作行为校验的时效性的前提下确保操作行为校验的可信度,从而确保操作行为校验的效率。
在上述内容的基础上,所述构建目标数据解析模型,利用所述访问权限数据、所述连续两组操作指引路径数据的详细指引服务内容及所述连续两组操作指引路径数据的有效页面路径数据确定所述目标数据解析模型中的初始目标操作行为的步骤,包括:获取所述访问权限数据的访问权限等级对应的路径特征访问权限等级及页面访问交互数据的详细指引服务内容;利用所述连续两组操作指引路径数据的有效页面路径数据及所述访问权限数据的访问权限等级对应的路径特征访问权限等级确定所述连续两组访问权限数据的路径特征访问权限等级的对应关系;整合所述操作指引路径数据的详细指引服务内容和所述页面访问交互数据的详细指引服务内容,得到服务内容整合结果;构建所述目标数据解析模型,利用所述连续两组访问权限数据的路径特征访问权限等级的对应关系及所述服务内容整合结果确定所述目标数据解析模型的配置参数;利用所述目标数据解析模型配置参数的配置结构信息,确定所述初始目标操作行为。这样一来,可以将路径特征访问权限等级考虑在内,从而在确定初始目标操作行为时结合目标数据解析模型配置参数的配置结构信息确保目标操作行为的可信度。在上述内容的基础上,所述获取所述访问权限数据的访问权限等级对应的路径特征访问权限等级及页面访问交互数据的详细指引服务内容的步骤,包括:基于所述操作指引指示和所述页面访问交互数据之间的关联响应信息,将所述访问权限数据在所述页面访问交互数据的访问权限等级状态下的访问权限等级转换为在所述操作指引指示的访问权限等级状态下的访问权限等级;基于所述操作指引指示的关联请求信息,由所述访问权限数据在所述操作指引指示的访问权限等级状态下的访问权限等级获取所述访问权限数据对应的路径特征访问权限等级及页面访问交互数据的详细指引服务内容。这样,可以确保路径特征访问权限等级的精准性以及页面访问交互数据的详细指引服务内容的完整性。进一步地,上述步骤“整合所述操作指引路径数据的详细指引服务内容和所述页面访问交互数据的详细指引服务内容,得到服务内容整合结果”,可以包括:对所述操作指引路径数据的详细指引服务内容及所述页面访问交互数据的详细指引服务内容进行内容合法性校验,判断校验是否通过;若是,则将所述页面访问交互数据的详细指引服务内容作为服务内容整合结果。
在其他的实施例中,上述步骤“利用信息分析线程对所述页面关键信息进行处理,分别得到所述连续两组操作指引路径数据的详细指引服务内容、所述连续两组操作指引路径数据的初始划分路径标记及所述连续两组操作指引路径数据的有效页面路径数据”,包括:将所述页面关键信息输入内容提取网络,分别得到所述连续两组操作指引路径数据的详细指引服务内容;将所述页面关键信息输入页面划分网络,分别得到所述连续两组操作指引路径数据目标的初始划分路径标记;将所述页面关键信息输入有效页面检测网络,得到所述连续两组操作指引路径数据的有效页面路径数据。
综上,本申请实施例中通过分类目标事件的方式对第一页面操作业务信息序列进行业务操作事件分类处理,可以有效地确保业务操作事件分类处理后所得到的第二页面操作业务信息序列中的页面操作业务事件的数量少于所述第一页面操作业务信息序列中的页面操作业务事件的数量,从而可以在服务器中确定该第二页面操作业务信息序列时,减少页面操作业务信息所占用的系统资源;另外,通过分类目标事件的方式可以从每个分类结果中提取出具有区分度的页面操作业务事件作为目标页面操作业务事件,从而可以在根据这些目标页面操作业务事件进行业务操作事件分析处理的过程中,能够尽可能地确保该第二页面操作业务信息序列中的任意相匹配两个目标页面操作业务事件之间的事件行为校验可信度;另外,通过相匹配两个目标页面操作业务事件之间的操作行为停留时长,还可以有效地调整每个页面操作业务事件的操作行为触发时长,进而可以提高页面操作业务信息的操作行为校验效率。
在上述基础上,请结合图3,本发明还提供了一种用于大数据业务分析的业务信息处理装置400框图,所述装置包括以下功能模块。
事件分类处理模块410,用于对第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到第一页面操作业务信息序列相关联的分类结果,在所述分类结果中获取目标页面操作业务事件;所述目标页面操作业务事件的数量与所述分类结果的数量相同;
操作业务确定模块420,用于基于所述目标页面操作业务事件确定第二页面操作业务信息序列;
停留时长确定模块430,用于根据所述目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长;
操作行为校验模块440,用于基于所述相匹配两个目标页面操作业务事件之间的操作行为停留时长对所述第二页面操作业务信息序列进行操作行为校验。
在上述基础上,请结合图4,还提供了一种业务信息处理服务器200的硬件结构框图,该业务信息处理服务器200可以包括互相之间通信的处理器210和存储器220,所述处理器210通过从所述存储器220中调取计算机程序并运行以实现上述的方法。进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种用于大数据业务分析的业务信息处理方法,其特征在于,所述方法包括:
对第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到第一页面操作业务信息序列相关联的分类结果,在所述分类结果中获取目标页面操作业务事件;所述目标页面操作业务事件的数量与所述分类结果的数量相同;
基于所述目标页面操作业务事件确定第二页面操作业务信息序列;
根据所述目标页面操作业务事件在所述第一页面操作业务信息序列中的操作行为对应的停留时间信息,确定所述第二页面操作业务信息序列中的相匹配两个目标页面操作业务事件之间的操作行为停留时长;
基于所述相匹配两个目标页面操作业务事件之间的操作行为停留时长对所述第二页面操作业务信息序列进行操作行为校验。
2.根据权利要求1所述的方法,其特征在于,所述对第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到第一页面操作业务信息序列相关联的分类结果,在所述分类结果中获取目标页面操作业务事件;所述目标页面操作业务事件的数量与所述分类结果的数量相同,包括:
获取第一页面操作业务信息序列,并将所述第一页面操作业务信息序列中的页面操作业务事件相关联的原始页面事件内容转化成目标页面事件内容;
在所述目标页面事件内容中,对所述第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到与所述第一页面操作业务信息序列相关联的分类结果;
在所述分类结果中将与目标事件获取条件相匹配的页面操作业务事件作为目标页面操作业务事件。
3.根据权利要求2所述的方法,其特征在于,所述在所述目标页面事件内容中,对所述第一页面操作业务信息序列中的页面操作业务事件进行分类处理,得到与所述第一页面操作业务信息序列相关联的分类结果,包括:
从所述第一页面操作业务信息序列中获取用于作为分类参考信息的第一页面操作业务事件;
在所述第一页面操作业务信息序列中将除所述第一页面操作业务事件之外的页面操作业务事件确定为第二页面操作业务事件,并基于事件执行优先级依次获取所述第二页面操作业务事件;
在所述目标页面事件内容中,根据所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度,划分所述第一页面操作业务信息序列中的页面操作业务事件所属的分类结果。
4.根据权利要求3所述的方法,其特征在于,所述在所述目标页面事件内容中,根据所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度,划分所述第一页面操作业务信息序列中的页面操作业务事件所属的分类结果,包括:
确定所述第一页面操作业务事件所属的分类结果;
在所述目标页面事件内容中将所述第一页面操作业务事件与所述第二页面操作业务事件进行事件类型关联度匹配;
若匹配到所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度大于或者等于分类阈值,则将所述事件类型关联度大于或者等于所述分类阈值的第二页面操作业务事件划分到所述第一页面操作业务事件所属的分类结果;
若匹配到所述第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度小于所述分类阈值,则基于所述事件类型关联度小于所述分类阈值的第二页面操作业务事件调整所述第一页面操作业务事件,并确定调整后的第一页面操作业务事件所属的分类结果,并将所述调整后的第一页面操作业务事件依次与未匹配的第二页面操作业务事件进行事件类型关联度匹配,直到所述第一页面操作业务信息序列中的页面操作业务事件均完成事件类型关联度匹配时,输出所述第一页面操作业务信息序列中的页面操作业务事件所属的分类结果。
5.根据权利要求4所述的方法,其特征在于,所述在所述目标页面事件内容中将所述第一页面操作业务事件与所述第二页面操作业务事件进行事件类型关联度匹配,包括:
将所述第一页面操作业务事件在所述目标页面事件内容中的页面事件访问记录确定为第一访问记录,并将所述第二页面操作业务事件在所述目标页面事件内容中的页面事件访问记录确定为第二访问记录;所述目标页面事件内容包含多个页面事件分布信息;
基于所述第一访问记录中的每个页面事件分布信息相关联的访问频率值、所述第二访问记录中的每个页面事件分布信息相关联的访问频率值,确定所述第一访问记录和第二访问记录之间的关联度;
将所述第一访问记录和第二访问记录之间的关联度确定为第一页面操作业务事件与所述第二页面操作业务事件之间的事件类型关联度。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一访问记录中的每个页面事件分布信息相关联的访问频率值、所述第二访问记录中的每个页面事件分布信息相关联的访问频率值,确定所述第一访问记录和第二访问记录之间的关联度,包括:
从所述第一访问记录中的每个页面事件分布信息中获取目标页面事件分布信息;所述目标页面事件分布信息是由所述目标页面事件内容中的多个页面点击路径信息共同表示的;
在所述第一访问记录中将所述目标页面事件分布信息在每个页面点击路径信息上的访问频率值分别确定为所述每个页面点击路径信息相关联的第一访问频率值,并在所述第二访问记录中将所述目标页面事件分布信息在所述每个页面点击路径信息上的访问频率值分别确定为所述每个页面点击路径信息相关联的第二访问频率值;
将所述每个页面点击路径信息相关联的第一访问频率值与相同页面点击路径信息相关联的第二访问频率值进行数值比较,并根据数值比较结果确定所述每个页面点击路径信息分别对应的最小频率访问值;基于所述每个页面点击路径信息分别对应的最小频率访问值,确定所述目标页面事件分布信息对应的最小累计访问频率值,并基于所述目标页面事件分布信息对应的最小累计访问频率值确定所述第一访问记录和第二访问记录之间的关联度。
7.根据权利要求2所述的方法,其特征在于,所述在所述分类结果中将与目标事件获取条件相匹配的页面操作业务事件作为目标页面操作业务事件,包括:
在所述目标页面事件内容中,基于所述分类结果中的页面操作业务事件所包括的每个页面事件分布信息分别对应的累计访问频率值,确定所述分类结果中的页面操作业务事件对应的业务事件热度信息;
在所述分类结果中的页面操作业务事件对应的业务事件热度信息中查找具有业务事件热度信息对应的最大热度值的页面操作业务事件;
将查找到的具有业务事件热度信息对应的最大热度值的页面操作业务事件作为从所述分类结果中所获取到的目标页面操作业务事件。
8.根据权利要求7所述的方法,其特征在于,所述在所述目标页面事件内容中,基于所述分类结果中的页面操作业务事件所包括的每个页面事件分布信息分别对应的累计访问频率值,确定所述分类结果中的页面操作业务事件的业务事件热度信息,包括:
获取所述目标页面事件内容中的每个页面事件分布信息的页面点击路径信息;
获取所述分类结果中的页面操作业务事件在所述每个页面事件分布信息的页面点击路径信息上的访问频率值,并对所述每个页面事件分布信息的页面点击路径信息上的访问频率值进行累计,得到所述每个页面事件分布信息分别对应的累计访问频率值;
基于所述每个页面事件分布信息对应的累计访问频率值和相应页面事件分布信息对应的事件互动频次,确定所述分类结果中的页面操作业务事件的业务事件热度信息。
9.根据权利要求1所述的方法,其特征在于,所述相匹配两个目标页面操作业务事件包含第一目标页面操作业务事件和第二目标页面操作业务事件;所述基于所述相匹配两个目标页面操作业务事件之间的操作行为停留时长对所述第二页面操作业务信息序列进行操作行为校验,包括:
基于所述第一目标页面操作业务事件和第二目标页面操作业务事件之间的操作行为停留时长调整所述第一目标页面操作业务事件的操作行为触发时长;
基于所述第一目标页面操作业务事件的操作行为触发时长对所述第一目标页面操作业务事件进行操作行为校验,直到所述第二页面操作业务信息序列的业务操作进度达到所述第二目标页面操作业务事件的操作行为对应的停留时间信息的时间节点时,对所述第二页面操作业务信息序列进行操作行为校验。
10.一种业务信息处理服务器,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述权利要求1-9任一项所述的方法。
CN202110251543.0A 2021-03-08 2021-03-08 一种用于大数据业务分析的业务信息处理方法及服务器 Withdrawn CN112818041A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110251543.0A CN112818041A (zh) 2021-03-08 2021-03-08 一种用于大数据业务分析的业务信息处理方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110251543.0A CN112818041A (zh) 2021-03-08 2021-03-08 一种用于大数据业务分析的业务信息处理方法及服务器

Publications (1)

Publication Number Publication Date
CN112818041A true CN112818041A (zh) 2021-05-18

Family

ID=75863001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110251543.0A Withdrawn CN112818041A (zh) 2021-03-08 2021-03-08 一种用于大数据业务分析的业务信息处理方法及服务器

Country Status (1)

Country Link
CN (1) CN112818041A (zh)

Similar Documents

Publication Publication Date Title
CN111914569B (zh) 基于融合图谱的预测方法、装置、电子设备及存储介质
US10152479B1 (en) Selecting representative media items based on match information
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN109949154B (zh) 客户信息分类方法、装置、计算机设备和存储介质
CN110674144A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN111163072B (zh) 机器学习模型中特征值的确定方法、装置及电子设备
CN109885597B (zh) 基于机器学习的用户分群处理方法、装置及电子终端
CN110855648B (zh) 一种网络攻击的预警控制方法及装置
CN111159413A (zh) 日志聚类方法、装置、设备及存储介质
CN115862088A (zh) 一种身份识别方法及装置
CN113949577A (zh) 一种应用于云服务的数据攻击分析方法及服务器
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
CN112765362B (zh) 基于改进自编码器的知识图谱实体对齐方法及相关设备
CN113468520A (zh) 应用于区块链业务的数据入侵检测方法及大数据服务器
WO2020140624A1 (zh) 从日志中提取数据的方法和相关设备
CN111586695A (zh) 短信识别方法及相关设备
CN112363814A (zh) 任务调度方法、装置、计算机设备及存储介质
CN111444362A (zh) 恶意图片拦截方法、装置、设备和存储介质
CN113312258B (zh) 一种接口测试方法、装置、设备及存储介质
CN112613072B (zh) 基于档案大数据的信息管理方法、管理系统及管理云平台
CN114356712A (zh) 数据处理方法、装置、设备、可读存储介质及程序产品
CN113886821A (zh) 基于孪生网络的恶意进程识别方法、装置、电子设备及存储介质
US8463725B2 (en) Method for analyzing a multimedia content, corresponding computer program product and analysis device
CN112966756A (zh) 一种可视化的准入规则的生成方法、装置、机器可读介质及设备
CN115809466B (zh) 基于stride模型的安全需求生成方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210518

WW01 Invention patent application withdrawn after publication