CN113409016A - 应用于大数据云办公的信息处理方法、服务器及介质 - Google Patents

应用于大数据云办公的信息处理方法、服务器及介质 Download PDF

Info

Publication number
CN113409016A
CN113409016A CN202110708148.0A CN202110708148A CN113409016A CN 113409016 A CN113409016 A CN 113409016A CN 202110708148 A CN202110708148 A CN 202110708148A CN 113409016 A CN113409016 A CN 113409016A
Authority
CN
China
Prior art keywords
office
visual
operation behavior
behavior data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110708148.0A
Other languages
English (en)
Inventor
蔡瑶乐
彭永建
陈文科
许炳生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Meike Education Technology Co ltd
Original Assignee
Dongguan Meike Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Meike Education Technology Co ltd filed Critical Dongguan Meike Education Technology Co ltd
Priority to CN202110708148.0A priority Critical patent/CN113409016A/zh
Publication of CN113409016A publication Critical patent/CN113409016A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种应用于大数据云办公的信息处理方法、服务器及介质,通过异常办公记录类型识别的异常办公记录识别网络对待处理可视化办公信息进行关键描述挖掘,得到待处理可视化办公信息的多个可视化办公信息节点对应的关键描述内容,基于关键描述内容确定各可视化办公信息节点与各异常办公记录类型的相关性系数,并基于相关性系数从多个可视化办公信息节点中挑选异常办公可视化信息,无需设置异常办公记录参考信息集也能自动化、智能化地识别并挖掘出异常办公可视化信息,从而改善了相关方案中在异常办公可视化信息挖掘时通过主动设置和调整异常办公记录参考信息集所带来的具有信息分析延时的缺陷,提高了异常办公可视化信息挖掘的时效性。

Description

应用于大数据云办公的信息处理方法、服务器及介质
技术领域
本申请涉及大数据及云办公技术领域,特别涉及一种应用于大数据云办公的信息处理方法、服务器及介质。
背景技术
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
随着大数据时代的到来,信息资源不断膨胀,仅从网上简单地搜索浏览或者是从资料库中直接获取,已远远无法满足企业的需要。鉴于此,企业需要充分利用大数据技术,在云办公系统中建立强大的数据中心,对各种信息进行采集、分析、整理,最终汇总成为对企业有价值的资讯,为企业领导的决策提供参考。而对云办公信息进行采集、分析、整理,最终汇总等这一系列处理过程中,需要考虑云办公环境的安全性。为实现这一目的,通常需要进行异常办公信息的挖掘以执行对应的信息防护措施。然而相关的异常办公信息挖掘技术存在智能化程度低下且时效性差的技术问题。
发明内容
为改善相关技术中存在的技术问题,本申请提供了一种应用于大数据云办公的信息处理方法、服务器及介质。
本申请一方面提供了一种应用于大数据云办公的信息处理方法,应用于云办公服务器,所述方法包括:通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容;其中,所述异常办公记录识别网络,用于对待处理可视化办公信息进行多个异常办公记录类型的识别;通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数;从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
本申请另一方面提供了一种云办公服务器,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述所述的方法。
本申请在一方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述权所述的方法。
附图说明
图1是本申请实施例提供的一种云办公服务器的硬件结构示意图。
图2是本申请实施例提供的一种应用于大数据云办公的信息处理方法的流程示意图。
具体实施方式
本申请实施例所提供的方法实施例可以在云办公服务器、计算机设备或者类似的运算装置中执行。以运行在云办公服务器上为例,图1是本申请实施例的实施一种应用于大数据云办公的信息处理方法的云办公服务器的硬件结构框图。如图1所示,云办公服务器10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述云办公服务器10还可以包括用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述云办公服务器10的结构造成限定。例如,云办公服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
将结合本申请实施例提供的云办公服务器的示例性应用和实施,说明本申请实施例提供的一种应用于大数据云办公的信息处理方法。请参见图2,图2是本申请实施例提供的一种应用于大数据云办公的信息处理方法的一个可选的流程示意图,将结合图2示出的步骤进行说明。
步骤101,云办公服务器通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容。
在具体实施时,所述异常办公记录识别网络,用于对待处理可视化办公信息进行多个异常办公记录类型的识别。待处理可视化办公信息可以为相关办公用户传入的,还可以是云办公服务器根据相关指示获取的。
在一种可示性实施例中,基于图2,在步骤101所描述的技术方案之前,该方法还可以包括以下所描述的技术内容。
云办公服务器从目标协同办公事项中获取所述目标协同办公事项的事项信息;对所述事项信息进行可视化办公信息的挖掘,将挖掘得到的可视化办公信息作为所述待处理可视化办公信息。
在实际应用过程中,云办公服务器首先从目标协同办公事项中获取事项信息,从事项信息中挖掘出对应的可视化协同办公信息,并将挖掘到的可视化协同办公信息作为待处理可视化办公信息。例如:目标协同办公事项可以为任意信息类型的协同办公信息。
其中,异常办公记录识别网络可以采用卷积神经网络(Convolutional NeuralNetworks,CNN),例如可以是TextCNN、BertCNN或DPCNN等神经网络模型,但不限于此。异常办公记录识别网络用于识别的异常办公记录类型可以为设定数目的类型,例如可以用于两个异常办公记录类型的识别,还可以用于两个以上的异常办公记录类型的识别。在本申请实施例中,异常办公记录类型可以从异常办公记录阶段进行识别,例如设置为第一风险程度的异常办公记录、第二风险程度的异常办公记录、第三风险程度的异常办公记录和不存在风险的异常办公记录等四个阶段(对于风险程度而言,第一风险程度高于第二风险程度,第二风险程度高于第三风险程度)。另外,异常办公记录类型还可以基于异常办公记录类型进行识别,例如数据窃取类型、信息非法访问类型等,本申请实施例不对异常办公记录类型的具体数目和类型作限定。
在实际应用过程中,在另一些示例中。云办公服务器将待处理可视化办公信息导入至异常办公记录识别网络,通过异常办公记录识别网络的关键描述挖掘单元,对待处理可视化办公信息进行关键描述挖掘,得到多个可视化办公信息节点的关键描述内容。可以理解的是,关键描述挖掘单元首先对待处理可视化办公信息进行特征提取,得到待处理可视化办公信息特征,并基于待处理可视化办公信息特征进行关键描述挖掘。在本申请实施例中,关键描述挖掘单元通过结合注意力机制的特征提取方式对待处理可视化办公信息进行关键描述特征提取。
在一种可示性实施例中,所述关键描述挖掘单元包括多个关键描述挖掘线程,每个所述关键描述挖掘线程对应一个所述可视化办公信息节点。对于本申请实施例提供的一种应用于大数据云办公的信息处理方法的一个可选的实施例而言,步骤101所描述的通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容,具体还可以包括以下步骤1011所描述的内容。
步骤1011,云办公服务器分别基于各所述关键描述挖掘线程进行如下处理:通过所述关键描述挖掘线程,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到相应的可视化办公信息节点的关键描述内容。
可选的,本申请实施例提供的异常办公可视化信息的挖掘过程的一个实现方式如下。在实际应用过程中,一个关键描述挖掘线程用于挖掘一个可视化办公信息节点对应的关键描述内容,应当理解的是,从待处理可视化办公信息节点中挖掘出的可视化办公信息节点的数目则为关键描述挖掘线程的数目。在实际应用过程中,关键描述挖掘单元的关键描述挖掘线程的数目可以作为异常办公记录识别网络的相关配置参量在网络搭建时设置,关键描述挖掘线程的数目可以根据实际需要设置为合适的数值。
本申请实施例中,云办公服务器可以将异常办公记录识别网络的关键描述挖掘单元的配置参量设置可以基于卷积核的数目、卷积核的尺度、特征维度实现。可以理解的是,在本申请实施例中,每一个卷积核可以理解为可视化办公信息的一个关键描述挖掘线程,用于挖掘出与卷积核尺度相对应的可视化办公信息节点和可视化办公信息节点对应的关键描述内容。
在一种可示性实施例中,步骤1011所描述的通过所述关键描述挖掘线程,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到相应的可视化办公信息节点的关键描述内容,具体还可以通过如下步骤10111-步骤10113所描述的内容实现。
步骤10111,云办公服务器分别基于各所述关键描述挖掘线程进行如下处理:云办公服务器通过所述关键描述挖掘线程,将所述待处理可视化办公信息转化为多个候选可视化办公信息节点;
步骤10112,分别对各所述候选可视化办公信息节点进行关键描述挖掘,得到每一个所述候选可视化办公信息节点对应的关键描述内容;
步骤10113,从所述多个候选可视化办公信息节点中,挑选关键描述内容对应的描述值最大的候选可视化办公信息节点,并将挑选的候选可视化办公信息节点的关键描述内容作为与所述关键描述挖掘线程对应的可视化办公信息节点的关键描述内容。
在实际应用过程中,云办公服务器针对每一个关键描述挖掘线程进行如下处理:通过关键描述挖掘线程将待处理可视化办公信息转化为多个与该关键描述挖掘线程的大小相对应的候选可视化办公信息节点。可以理解的是,关键描述挖掘线程,也即是卷积核的尺度表示可提前的可视化办公信息的信息量(比如Mb或者Gb),在本申请实施例中,可视化办公信息的信息量单位为办公资料报表的个数。示例性地,若卷积核的尺度被设置为3,则该卷积核用于挖掘三个办公资料报表组成的可视化办公信息节点。卷积核对待处理可视化办公信息进行多次卷积后,得到多个候选可视化办公信息节点及候选可视化办公信息节点对应的关键描述内容,然后云办公服务器对多个候选可视化办公信息节点对应的关键描述内容进行比较,将关键描述内容对应的描述值最大的候选可视化办公信息节点作为该卷积核挖掘的可视化办公信息节点,并获得该可视化办公信息节点对应的关键描述内容。
在一种可示性实施例中,当所述关键描述挖掘线程用于对目标信息量的可视化办公信息节点进行关键描述挖掘时,步骤10111所描述的将所述待处理可视化办公信息转化为多个候选可视化办公信息节点,具体还可以通过如下步骤实现。
云办公服务器对所述待处理可视化办公信息中的办公资料报表进行逐一查阅(遍历),并针对逐一查阅到的每个办公资料报表进行如下处理:将逐一查阅到的办公资料报表作为初始办公资料报表,从所述待处理可视化办公信息中挖掘所述目标信息量的候选可视化办公信息节点。
在实际应用过程中,云办公服务器在对待处理可视化办公信息进行候选可视化办公信息节点的转化时,具体为根据可视化办公信息处理次序对待处理可视化办公信息中的办公资料报表进行调整。在本申请实施例中,可视化办公信息处理次序可以事先设置。示例性地,云办公服务器以按照时间正序的顺序逐一查阅待处理可视化办公信息中的办公资料报表,在逐一查阅到第一个办公资料报表时,以按照时间正序的顺序挑选目标信息量的可视化办公信息节点,作为候选可视化办公信息节点。示例性地,若卷积核的尺度为3,目标信息量则为3个办公资料报表,云办公服务器则在逐一查阅到第一个办公资料报表时,挑选以第一个办公资料报表为初始办公资料报表的3个办公资料报表作为第一个挖掘到的候选可视化办公信息节点,当逐一查阅到的办公资料报表至待处理可视化办公信息的最后一个办公资料报表之间的信息量差异等于目标信息量时,终止遍历。
在实际应用过程中,云办公服务器在获得多个可视化办公信息节点对应的关键描述内容后,将各关键描述内容拼接成一个特征,作为待处理可视化办公信息的关键描述特征。应当理解的是,每一个关键描述内容对应关键描述特征中的一个要素。若可视化办公信息节点的数目为200,则拼接后的关键描述特征则可以为一个1×200的一维特征。
步骤102,通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数。
在实际应用过程中,云办公服务器通过异常办公记录识别网络的关键描述挖掘单元挖掘到待处理可视化办公信息的多个可视化办公信息节点对应的关键描述内容后,将多个关键描述内容导入至异常办公记录识别网络的相关性分析单元。在本申请实施例中,相关性分析单元包括各关键描述挖掘线程分别对应的各个异常办公记录类型的重要性系数。示例性地,若关键描述挖掘线程的数目为24个,异常办公记录类型的数目为3个,则相关性分析单元包括一个24×4的重要性系数特征,该重要性系数特征的每一列对应一个异常办公记录类型,该重要性系数特征中的某一列中的任意一个要素对应一个关键描述挖掘线程。
在一种可示性实施例中,对于本申请实施例提供的一种应用于大数据云办公的信息处理方法的一个可选的实施例而言,步骤102所描述的通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数,还可以通过以下步骤实现。
云办公服务器分别针对各所述可视化办公信息节点进行如下处理:获取各所述异常办公记录类型的重要性系数;通过所述异常办公记录识别网络的相关性分析单元,基于所述可视化办公信息节点对应的关键描述内容和各所述异常办公记录类型的重要性系数,分别确定所述可视化办公信息节点与各所述异常办公记录类型的相关性系数。
在实际应用过程中,云办公服务器获取各异常办公记录类型的重要性系数特征,在本申请实施例中,重要性系数特征的要素数目对应关键描述挖掘线程的数目,也即对应可视化办公信息节点的数目。进一步地,云办公服务器将待处理可视化办公信息的关键描述特征和相应异常办公记录类型的权值特征进行融合处理,得到每一个可视化办公信息特征对应的关键描述内容与相应类型的融合处理结果,将该融合处理结果作为该可视化办公信息节点与相应异常办公记录类型的相关性系数。
步骤103,从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
在实际应用过程中,云办公服务器可以针对每一个异常办公记录类型挑选相同数目的异常办公可视化信息,还可以针对不同异常办公记录类型挑选不同数目的异常办公可视化信息。例如,若异常办公记录类型为第一风险程度的异常办公记录、第二风险程度的异常办公记录、第三风险程度的异常办公记录和不存在风险的异常办公记录等四个阶段类型,云办公服务器可以针对每一个异常办公记录类型均挑选10个异常办公可视化信息,还可以针对第一风险程度的异常办公记录及第二风险程度的异常办公记录挑选10个异常办公可视化信息,而针对第三风险程度的异常办公记录和不存在风险的异常办公记录挑选5个异常办公可视化信息等。
在一种可示性实施例中,步骤103所描述的从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,具体可以通过如下内容实现。
云办公服务器分别针对各所述异常办公记录类型进行如下处理:基于各所述可视化办公信息节点与所述异常办公记录类型的相关性系数,对各所述可视化办公信息节点进行整理,得到可视化办公信息节点序目;按照所述相关性系数的降序方式,从所述可视化办公信息节点序目中,挑选目标数目的可视化办公信息节点,将挑选的可视化办公信息节点作为与所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
在实际应用过程中,云办公服务器针对各异常办公记录类型中的一个异常办公记录类型,基于该异常办公记录类型对应的各可视化办公信息节点的相关性系数从大到小的顺序,对各可视化办公信息节点进行整理,得到可视化办公信息节点序目。在本申请实施例中,相关性系数越高,表示该可视化办公信息节点与该异常办公记录类型越相关。
进一步地,云办公服务器根据可视化办公信息序目的整理,挑选整理在前的目标数目的可视化办公信息节点,挑选的可视化办公信息节点则为与该异常办公记录类型相关程度排序靠前的可视化办公信息节点,云办公服务器则将挑选的这些可视化办公信息节点作为从待处理可视化办公信息中挖掘出的异常办公可视化信息,完成对异常办公可视化信息的挖掘。通过排序的方式,从待处理可视化办公信息中挑选异常办公可视化信息,能够将待处理可视化办公信息中与各异常办公记录识别相关性最高的可视化办公信息节点进行挖掘。
在一种可示性实施例中,步骤103所描述的从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,具体还可以通过如下内容实现。
云办公服务器分别针对各所述异常办公记录类型进行如下处理:获取与所述异常办公记录类型相对应的预设相关性系数;从所述多个可视化办公信息节点中,挑选与所述异常办公记录类型的相关性系数达到预设相关性系数的可视化办公信息节点,将挑选的可视化办公信息节点作为与所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
在实际应用过程中,预设相关性系数可以事先设置。当可视化办公信息节点与对应异常办公记录类型的相关性系数达到预设相关性系数时,则将该可视化办公信息节点作为该异常办公记录类型的异常办公可视化信息。可以理解,对于某一异常办公记录类型,若所有可视化办公信息节点与该异常办公记录类型的相关性系数均为达到预设相关性系数,则云办公服务器未对该异常办公记录类型异常办公可视化信息进行挖掘,也即表示待处理可视化办公信息与该异常办公记录类型的相关度相对较低。通过比较预设相关性系数的方式进行异常办公可视化信息的挖掘,能够对实际与异常办公记录类型相关性较高的异常办公可视化信息进行挖掘,避免挖掘出相关性相对较低的可视化办公信息节点,从而节省云办公服务器的资源开销。
本申请实施例中,通过一个用于异常办公记录类型识别的异常办公记录识别网络对待处理可视化办公信息进行关键描述挖掘,得到待处理可视化办公信息的多个可视化办公信息节点对应的关键描述内容,然后基于关键描述内容确定各可视化办公信息节点与各异常办公记录类型的相关性系数,并基于相关性系数从多个可视化办公信息节点中挑选异常办公可视化信息,无需设置异常办公记录参考信息集也能自动化、智能化地识别并挖掘出异常办公可视化信息,从而改善了相关方案中在异常办公可视化信息挖掘时通过主动设置和调整异常办公记录参考信息集所带来的低效率和具有信息分析延时的缺陷,提高了异常办公可视化信息挖掘的效率和时效性。
在一种可示性实施例中,在步骤103所描述的将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息之后,该方法还可以包括以下描述内容:云办公服务器基于所述异常办公可视化信息生成相应的异常办公警示信息;发送所述异常办公警示信息。
本申请实施例中,待处理可视化办公信息为从目标协同办公事项中获取得到,在实际应用场景中,云办公服务器可以响应于办公用户激活的对目标协同办公事项的处理操作,激活对目标协同办公事项的异常办公记录识别,从目标协同办公事项中获取待处理可视化办公信息,并从待处理可视化办公信息中挖掘出异常办公可视化信息,进而根据异常办公可视化信息生成异常办公警示信息,将该警示信息进行发送。在本申请实施例中,异常办公警示信息用于提示办公用户所参与的目标协同办公事项中存在异常办公可视化信息。异常办公警示信息可以通过任意展现形式展现,例如通过悬浮的形式展现在当前页面的最前端等等,本申请实施例不对异常办公警示信息的展现形式作具体限定。
对于本申请实施例提供的一种应用于大数据云办公的信息处理方法的一个可选的实施例而言,基于步骤101所描述的通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘之前,该方法还可以包括以下步骤201-步骤204所描述的内容。
步骤201,云办公服务器通过所述异常办公记录识别网络的关键描述挖掘单元,对包含多个基准可视化办公信息节点的基准可视化办公信息进行关键描述挖掘,得到每一个所述基准可视化办公信息节点对应的关键描述内容。
在具体实施时,所述基准可视化办公信息绑定有指示所述基准可视化办公信息所对应的异常办公记录类型的异常办公记录识别标识。
步骤202,通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述基准可视化办公信息节点对应的关键描述内容,确定相应的所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数。
步骤203,通过所述异常办公记录识别网络的相关性分析单元,基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,对所述基准可视化办公信息的异常办公记录类型进行相关性分析,得到关联异常办公类型。
步骤204,基于所述关联异常办公类型与所述异常办公记录识别标识之间的比较结果,对所述关键描述挖掘单元的配置参量及所述相关性分析单元的配置参量进行调整。
在实际应用过程中,对于本申请实施例提供的异常办公记录识别网络的分类预测过程的一个实施例。云办公服务器将基准可视化办公信息导入至异常办公记录识别网络中,通过异常办公记录识别网络的关键描述挖掘单元对基准可视化办公信息进行基准可视化办公信息节点的关键描述内容的挖掘,将挖掘的多个基准可视化办公信息节点的关键描述内容导入至相关性分析单元。在本申请实施例中,相关性分析单元包括第一局部相关性分析单元和第二局部相关性分析单元,云办公服务器获取各异常办公记录类型对应的重要性系数特征,通过第一相关性分析单元基于各异常办公记录类型的重要性系数特征和多个基准可视化办公信息节点的关键描述内容,确定各基准可视化办公信息节点与对应异常办公记录类型的相关性系数,并基于各基准可视化办公信息节点与对应异常办公记录类型的相关性系数进行异常办公记录类型的相关性分析。
示例性地,对于本申请实施例提供的异常办公记录识别网络的分类预测过程的一个可选的实施例而言。对于“ABCDEFG”这一基准可视化办公信息,它由七个办公资料报表组成。一些示例性的异常办公记录识别网络的关键描述挖掘单元包括六个卷积核,包括两个尺度为4的卷积核、两个尺度为3的卷积核和两个尺度为2的卷积核。其中,尺度为4的卷积核对该基准可视化办公信息进行关键描述挖掘之后,得到4个候选基准可视化办公信息节点和对应的关键描述内容,然后云办公服务器从这4个候选基准可视化办公信息节点中挑选关键描述内容对应的描述值最大的候选基准可视化办公信息节点作为该卷积核挖掘得到的基准可视化办公信息节点。
可以理解,两个尺度为3的卷积核对该基准可视化办公信息进行关键描述挖掘后,将得到5个候选基准可视化办公信息节点及对应的关键描述内容,而尺度为2的卷积核对该基准可视化办公信息进行关键描述挖掘后,将得到6个候选基准可视化办公信息节点及对应的关键描述内容。
各卷积核分别挑选关键描述内容对应的描述值最大的候选基准可视化办公信息节点作为该卷积核挖掘的基准可视化办公信息节点。云办公服务器将各卷积核挖掘的基准可视化办公信息节点对应的关键描述内容导入至异常办公记录识别网络的相关性分析单元,通过相关性分析单元基于各基准可视化办公信息节点的关键描述内容和相应异常办公记录类型的重要性系数特征,得到各基准可视化办公信息节点与各异常办公记录类型的相关性系数,将各可视化办公信息节点与相应异常办公记录类型的相关性系数拼接得到该异常办公记录类型的相关性系数特征,基于各异常办公记录类型的相关性系数特征,确定基准可视化办公信息对应于各异常办公记录类型的可能性,基于基准可视化办公信息对应于各异常办公记录类型的可能性,确定基准可视化办公信息所所对应的异常办公记录类型,并将确定的异常办公记录类型作为关联异常办公类型。
上述示出的异常办公记录识别网络为一个二分类网络,包括第一异常办公记录类型和第二异常办公记录类型,在一种可示性实施例中,还可以设置为异常办公记录识别。
在实际应用过程中,云办公服务器在得到基准可视化办公信息的关联异常办公类型后,基于关联异常办公类型与基准可视化办公信息上标记的识别标识之间的比较结果,对异常办公记录识别网络的网络配置参量进行调整。在本申请实施例中,云办公服务器通过计算异常办公记录识别网络的网络评估数据来确定关联异常办公类型与识别标识之间的比较结果。当网络评估数据的值达到比较结果阈值时,云办公服务器基于网络评估数据确定相应的偏差信息,并从异常办公记录识别网络的输出层开始,将偏差信息在异常办公记录识别网络中反馈,并在反馈的过程中调整异常办公记录识别网络的网络配置参量。
在本申请实施例中对反馈进行说明,将训练样本传入到神经网络的输入层,经过隐藏层,最后达到输出层并输出结果,这是神经网络的前向反馈过程,由于神经网络的输出结果与实际结果有误差,则计算输出结果与实际值之间的误差,并将该误差从输出层向隐藏层反馈,直至反馈到输入层,在反馈的过程中,根据误差调整网络配置参量的值;不断迭代上述过程,直至处于收敛状态。
以上述的网络评估数据为例,云办公服务器基于网络评估数据确定偏差信息,偏差信息从异常办公记录识别网络的输出层反馈,逐层反馈偏差信息,在偏差信息到达每一层时,结合传导的偏差信息来求解梯度(也可以理解为网络评估数据对该层配置参量的偏导数),将该层的配置参量调整对应的梯度值。
在一种可示性实施例中,所述基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,对所述基准可视化办公信息的异常办公记录类型进行相关性分析,得到关联异常办公类型,还可以通过如下方式实现。
云办公服务器基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,分别确定所述基准可视化办公信息对应于各所述异常办公记录类型的可能性;基于所述基准可视化办公信息对应于各所述异常办公记录类型的可能性,确定所述基准可视化办公信息所对应的异常办公记录类型,并将确定的异常办公记录类型作为所述关联异常办公类型。
在实际应用过程中,云办公服务器基于各基准可视化办公信息节点与对应异常办公记录类型的相关性系数确定基准可视化办公信息对应于相应异常办公记录类型的可能性,并基于基准可视化办公信息对应于各异常办公记录类型的可能性,确定基准可视化办公信息所所对应的异常办公记录类型,并将确定的异常办公记录类型作为异常办公记录识别网络相关性分析的关联异常办公类型。
本申请实施例中,仅需主动对基准可视化办公信息进行标记,而本申请实施例的异常办公可视化信息为基准可视化办公信息中的一个或多个可视化办公信息节点,在本申请实施例中,将基准可视化办公信息定义为持续性可视化办公信息,将异常办公可视化信息定义为间歇性可视化办公信息,可以理解,本申请实施例为基于主动标记的持续性可视化办公信息对异常办公记录识别网络进行有监督训练,然后基于持续性可视化办公信息有监督训练得到的异常办公记录识别网络进行间歇性可视化办公信息的挖掘,由于相较于标记间歇性可视化办公信息,对持续性可视化办公信息进行标记的项目量更少,从而减少了主动标记项目负荷,避免了需主动标记间歇性可视化办公信息进行间歇性可视化办公信息识别的工作量大的缺陷,同时也保障了异常办公记录识别网络的准确性。
接下来继续对本申请实施例提供的一种应用于大数据云办公的信息处理方法进行介绍,对于一些可选的实施例,本申请实施例提供的一种应用于大数据云办公的信息处理方法由在线办公设备和云办公服务器协同实施。
步骤301,在线办公设备响应于针对目标协同办公事项的处理操作,生成针对目标协同办公事项的参与请求。
步骤302,在线办公设备发送参与请求至云办公服务器。
步骤303,云办公服务器响应于所述参与请求,获取所述目标协同办公事项的事项信息,对所述事项信息进行可视化办公信息的挖掘,将挖掘得到的可视化办公信息作为待处理可视化办公信息。
可以理解的是,云办公服务器在接收到参与请求后,可以访问目标协同办公事项并将访问获取的事项信息返回至在线办公设备进行发送,并同时激活对目标协同办公事项的异常办公记录分析,执行获取目标协同办公事项的事项信息的操作。在一种可示性实施例中,云办公服务器在接收到参与请求后,还可以首先中断对目标协同办公事项的访问进程,并激活对目标协同办公事项的异常办公记录分析,在异常办公记录分析通过后,继续访问目标协同办公事项并返回事项信息至在线办公设备,当异常办公记录分析未通过时,返回异常办公警示信息。
步骤304,云办公服务器通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容。
步骤305,云办公服务器通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数。
步骤306,云办公服务器从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
步骤307,云办公服务器根据异常办公可视化信息生成异常办公警示信息。
步骤308,云办公服务器发送异常办公警示信息至在线办公设备。
步骤309,在线办公设备发送异常办公警示信息。
可以理解的是,当多个可视化办公信息节点中存在符合相关性分析条件的可视化办公信息节点时,云办公服务器则将符合相关性分析条件的所有可视化办公信息节点作为异常办公可视化信息,根据异常办公可视化信息生成对应的异常办公警示信息。在本申请实施例中,云办公服务器可以根据异常办公可视化信息的个数和各异常办公可视化信息所对应的异常办公记录级别生成对应内容的异常办公警示信息,或者执行相应的异常办公记录阻止操作,例如阻止对目标协同办公事项的参与。而当所有可视化办公信息节点中均不存在符合相关性分析条件的可视化办公信息节点时,云办公服务器则生成异常办公记录分析通过的警示信息至云办公服务器,或者云办公服务器直接参与目标协同办公事项获得事项信息,并将事项信息返回至在线办公设备,以使在线办公设备直接展现事项信息。
在线办公设备在接收到异常办公警示信息后,用户可以基于异常办公警示信息对目标协同办公事项进行相应的防护操作。
本申请实施例中,在线办公设备响应于针对目标协同办公事项的处理操作,生成参与请求发送至云办公服务器,云办公服务器则响应于该参与请求激活对目标协同办公事项的异常办公记录分析,通过一个用于异常办公记录类型识别的异常办公记录识别网络对待处理可视化办公信息进行关键描述挖掘,得到待处理可视化办公信息的多个可视化办公信息节点对应的关键描述内容,然后基于关键描述内容确定各可视化办公信息节点与各异常办公记录类型的相关性系数,并基于相关性系数从多个可视化办公信息节点中挑选异常办公可视化信息,无需设置异常办公记录参考信息集也能自动化、智能化地识别并挖掘出异常办公可视化信息,从而提高了异常办公可视化信息挖掘的时效性,也保障了在线办公设备访问目标协同办公事项时的安全性。
综上所述,执行上述方案,通过一个用于异常办公记录类型识别的异常办公记录识别网络对待处理可视化办公信息进行关键描述挖掘,得到待处理可视化办公信息的多个可视化办公信息节点对应的关键描述内容,然后基于关键描述内容确定各可视化办公信息节点与各异常办公记录类型的相关性系数,并基于相关性系数从多个可视化办公信息节点中挑选异常办公可视化信息,无需设置异常办公记录参考信息集也能自动化、智能化地识别并挖掘出异常办公可视化信息,从而改善了相关方案中在异常办公可视化信息挖掘时通过主动设置和调整异常办公记录参考信息集所带来的具有信息分析延时的缺陷,提高了异常办公可视化信息挖掘的时效性。
在一些选择性的且可独立实施的实施例中,在上述步骤所描述的将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息之后,该方法还可以包括以下内容:在检测出所述异常办公可视化信息存在异常风险标识时,对获取到的操作行为数据进行分析,以进行行为风险检测。
在一些选择性的且可独立实施的实施例中,对获取到的操作行为数据进行分析,以进行行为风险检测,可以包括以下内容:根据不同操作行为数据操作行为活跃度,确定用于生成行为风险检测信息的操作路径变化度。
在一些选择性的且可独立实施的实施例中,根据不同操作行为数据操作行为活跃度,确定用于生成行为风险检测信息的操作路径变化度,可以包括以下内容:获取操作行为数据轨迹中各操作行为数据的操作行为活跃度;根据所述各操作行为数据的操作行为活跃度从所述操作行为数据轨迹中汇总出认证操作行为数据集;基于所述认证操作行为数据集,确定所述操作行为数据轨迹中的安全操作行为数据及安全操作行为数据的操作路径变化度;根据所述操作行为数据轨迹中除所述安全操作行为数据之外的操作行为数据及所述操作行为数据之间的路径传递关系,获得所述操作行为数据轨迹中的待校验操作行为数据集;基于所述待校验操作行为数据集和所述安全操作行为数据,确定所述待校验操作行为数据集中各操作行为数据的操作路径变化度;其中,确定的所述操作路径变化度用于生成与相应操作行为数据对应的行为风险检测信息。
关于上述可独立实施的实施例而言,相关描述如下。
S301,获取操作行为数据轨迹中各操作行为数据的操作行为活跃度。
例如,数据轨迹是一种对操作行为数据之间的行为关系进行整合的内容,数据轨迹包括一系列操作行为数据和用于连接操作行为数据的路径传递关系,操作行为数据又可以称为数据轨迹节点。两个操作行为数据之间存在路径传递关系,表示该两个操作行为数据之间存在关联。两个操作行为数据之间的路径传递关系可以有权重。
在本申请实施例中,操作行为数据可以是云办公行为数据,例如文件上传、文件下载、文件存储、会议视频接入等。相应的,后续的业务操作、业务行为同样可以理解为云办公操作或者云办公行为,在此不作限定。
此外,操作行为数据的操作行为活跃度是指与该操作行为数据存在关联的关联操作行为数据的操作行为关联度,关联操作行为数据是指与该操作行为数据具有路径传递关系的操作行为数据。
另外,操作行为数据轨迹是根据基于互联网的业务操作行为数据生成的数据轨迹。其中,业务操作行为数据例如可以是业务执行触发流程数据等等,相应的操作行为数据轨迹例如可以是业务执行数据轨迹等等。
可以理解的是,为了实现对复杂网络环境中有价值的信息的分析,云办公服务器可以基于该网络环境中大量的业务交互数据生成操作行为数据轨迹,并获取操作行为数据轨迹中各操作行为数据的操作行为活跃度,从而根据该操作行为数据轨迹和其中各操作行为数据的操作行为活跃度实现对该操作行为数据轨迹的数据轨迹分析。数据轨迹分析是指采用一些算法从数据轨迹中分析出潜在的有价值信息的过程,数据轨迹分析可以包括对操作行为数据进行行为风险识别、操作行为数据集分析等等。
本申请实施例中,主要是对该操作行为数据轨迹中各操作行为数据的操作路径变化度进行分析,得到各操作行为数据的操作路径变化度后,不仅可以从操作行为数据轨迹中寻找出符合指定操作路径变化度的操作行为数据的集合,还可以根据各操作行为数据的操作路径变化度生成相应的行为风险检测信息,作为其他机器学习算法的输入。
在一个实施例中,操作行为数据轨迹可以是业务执行数据轨迹,业务执行数据轨迹的生成步骤包括:获取与云业务对象信息对应的业务执行记录;根据业务执行记录获得各云业务对象信息之间的业务执行触发流程数据;根据业务执行触发流程数据生成业务执行数据轨迹;其中,业务执行数据轨迹的操作行为数据表示云业务对象信息,业务执行数据轨迹中两个操作行为数据之间的路径传递关系表示相应的两个云业务对象信息之间存在业务执行触发流程内容。
其中,业务执行触发流程内容是业务测试、业务培训、业务启动、业务咨询等业务开始启动流程中的至少一种。本实施例中,一个云业务对象信息是一个操作行为数据,若两个云业务对象信息之间存在业务执行触发流程内容,则该两个云业务对象信息之间会形成一条路径传递关系。例如,云业务对象T1对云业务对象T2进行业务测试,则云业务对象T1与云业务对象T2之间形成一条路径传递关系。可以理解,当云业务对象群体对应的操作行为关联度较大时,则这些云业务对象信息之间形成的路径传递关系的操作行为关联度是大规模的,从而,生成的业务执行网络拓扑图是大规模的。例如,在相关业务执行场景中,操作行为数据的操作行为关联度可达几千万,这几千万操作行为数据之间形成的路径传递关系数量可以达到百亿的大规模。
在一个实施例中,操作行为数据轨迹可以是云业务对象在执行业务的过程中所形成的操作行为数据轨迹,云业务对象在执行业务的过程中所形成的操作行为数据轨迹的生成步骤包括:获取云业务对象信息的历史订阅数据;根据历史订阅数据生成云业务对象在执行业务的过程中所形成的操作行为数据轨迹;其中,云业务对象在执行业务的过程中所形成的操作行为数据轨迹的操作行为数据表示云业务对象信息,云业务对象在执行业务的过程中所形成的操作行为数据轨迹中两个操作行为数据之间的路径传递关系表示相应的两个云业务对象信息之间存在历史订阅行为。
本实施例中,一个云业务对象信息对应一个操作行为数据。若两个云业务对象信息之间存在历史订阅行为,则该两个云业务对象信息之间会形成一条路径传递关系。在另一个实施例中,若两个云业务对象信息之间相互形成匹配关系,这该两个云业务对象信息之间形成一条路径传递关系。同样地,当云业务对象信息对应的操作行为关联度量较大时,云业务对象在执行业务的过程中所形成的操作行为数据轨迹也是非常复杂的。
在一个实施例中,获取操作行为数据轨迹中各操作行为数据的操作行为活跃度,包括:获取操作行为数据轨迹;确定操作行为数据轨迹中各操作行为数据的关联操作行为数据的操作行为关联度;将关联操作行为数据的操作行为关联度作为相应操作行为数据的操作行为活跃度。
数据轨迹可以用图数据或轨迹列表来表示。云办公服务器可以获取操作行为数据轨迹对应的轨迹列表或图数据,从轨迹列表或图数据中遍历该操作行为数据轨迹中各个操作行为数据的邻接操作行为数据的操作行为关联度,关联操作行为数据的操作行为关联度可作为相应操作行为数据的操作行为活跃度。
在业务执行场景中,业务执行数据轨迹中某个操作行为数据的操作行为活跃度,可以理解为与该操作行为数据有执行行为的操作行为数据的操作行为关联度。在相关场景中,云业务对象在执行业务的过程中所形成的操作行为数据轨迹中某个操作行为数据的操作行为活跃度,可以理解为与该操作行为数据存在历史订阅行为的操作行为数据的操作行为关联度。
S302,根据各操作行为数据的操作行为活跃度从操作行为数据轨迹中汇总出认证操作行为数据集。
本实施例中,主要是对操作行为数据轨迹中各操作行为数据的操作路径变化度进行分析。操作路径变化度(Degree of variation)是用来判断操作行为数据在整个操作行为数据轨迹中的重要性的指标之一。一个数据轨迹的K组操作行为数据集,是指从该数据轨迹中反复去除操作行为活跃度小于或等于K的操作行为数据后,所候选的操作行为数据集,换言之将数据轨迹L中操作行为活跃度小于K的数据轨迹节点全部删除,得到操作行为数据集M;将数据轨迹M中操作行为活跃度小于K的数据轨迹节点全部删除,得到新操作行为数据集Mt,…,以此类推,直至候选操作行为数据集中每个操作行为数据的操作行为活跃度都大于K时终止,得到该数据轨迹L的K组操作行为数据集。操作行为数据的操作路径变化度,定义为该操作行为数据对应的最大组操作行为数据集,即若一个操作行为数据存在于y组操作行为数据集中,而在(y+1)组操作行为数据集中被删除,那么该操作行为数据的操作路径变化度为y。
例如,2组操作行为数据集就是先从数据轨迹中去掉所有操作行为活跃度小于2的操作行为数据,然后再从剩下的数据轨迹中去掉操作行为活跃度小于2的操作行为数据,依次类推,直到不能去掉为止,得到2组操作行为数据集;3组就是先从数据轨迹中去掉所有操作行为活跃度小于3的操作行为数据,然后再从剩下的数据轨迹中去掉操作行为活跃度小于3的操作行为数据,依次类推,直到不能去掉为止,得到该数据轨迹的3组操作行为数据集。若一个操作行为数据最多在5组操作行为数据集而不在6组操作行为数据集中,那么该操作行为数据的操作路径变化度为5。
根据上面的分析可知,操作路径变化度大于K的操作行为数据该操作行为数据的操作行为活跃度必然大于K。因此,在本申请实施例中,云办公服务器通过设置一个相关阈值,根据各操作行为数据的操作行为活跃度和该相关阈值将原本的操作行为数据轨迹汇总为认证操作行为数据集和待校验操作行为数据集两部分,然后依次分析出其中各操作行为数据的操作路径变化度。通过相关阈值从操作行为数据轨迹中汇总出认证操作行为数据集,能够直接对认证操作行为数据集进行分析,避免在操作路径变化度小于相关阈值的非重点关注的操作行为数据上花费较多的循环时间和业务处理计算资源,这对于大规模网络的操作路径变化度分析是非常重要的。可以理解的是,认证操作行为数据集中各操作行为数据的操作行为活跃度必然是大于该相关阈值的,但操作行为数据轨迹中操作行为活跃度大于该相关阈值的操作行为数据并不一定必然存在于该认证操作行为数据集中。
其中,预设的相关阈值,可以根据实际需要进行设置。可选地,可以根据具体业务场景需要来确定预设的相关阈值,比如根据以往经验操作路径变化度大于300的操作行为数据在操作行为数据轨迹中发挥的作用比较大,那么云办公服务器可以将预设的相关阈值设置为300。
可选地,还可以根据业务处理计算资源的限制来确定预设的相关阈值,因为相关阈值设置越小,从操作行为数据轨迹中汇总出的认证操作行为数据集所包括的操作行为数据的操作行为关联度越大,认证操作行为数据集越大,所需业务处理计算资源也越多,反之相关阈值设置的越大,从操作行为数据轨迹中汇总出的认证操作行为数据集越小,所需的业务处理计算资源也就越少。
可选地,还可以根据该操作行为数据轨迹中各操作行为数据操作行为活跃度的分布来设置相关阈值的大小,例如,若操作行为数据轨迹中大多数操作行为数据的操作行为活跃度均小于某个值,那么可以将该相关阈值设置成该值。
在一个实施例中,根据各操作行为数据的操作行为活跃度和预设的相关阈值从操作行为数据轨迹中汇总出认证操作行为数据集,包括:获取预设的相关阈值;从操作行为数据轨迹中删除操作行为活跃度小于或等于相关阈值的操作行为数据及操作行为数据对应的路径传递关系,根据操作行为数据轨迹中候选操作行为数据及候选操作行为数据之间的路径传递关系获得认证操作行为数据集。
在一些示例中,根据预设的相关阈值,云办公服务器从历史操作行为数据轨迹中过滤掉操作行为活跃度小于该相关阈值及等于该相关阈值的操作行为数据,即得到认证操作行为数据集,获得的该认证操作行为数据集中所有操作行为数据的操作行为活跃度都大于该相关阈值。可见,相关阈值设置的越大,得到的认证操作行为数据集越小,所需要的业务处理计算资源也更少。
例如,分别对操作行为数据轨迹按数据挖掘分解和按相关阈值汇总的的实施方式可以如下:按照数据挖掘算法,按K=1,K=2,K=3…,依次按照设定顺序分析出操作行为数据轨迹中各操作行为数据的操作路径变化度,即从K=1开始,反复去除操作行为活跃度小于或等于K的操作行为数据,对于K=1,云办公服务器需要循环2次,对于K=2,云办公服务器需要循环2次,对于K=3,云办公服务器需要循环2次,K=4,云办公服务器需要循环2次,由于不存在操作行为活跃度大于5的操作行为数据,所以对于K=5,云办公服务器需要循环1次,换言之说,云办公服务器一共需要循环9次,才能确定该数据轨迹中各操作行为数据的操作路径变化度,得到相同操作路径变化度的操作行为数据构成的操作行为数据集。
又例如,还可以直接从历史操作行为数据轨迹中循环去除操作行为活跃度小于预设的相关阈值的操作行为数据,以相关阈值为2将历史操作行为数据轨迹汇总为认证操作行为数据集和待校验操作行为数据集举例来说,云办公服务器循环地过滤掉操作行为活跃度小于2的操作行为数据及等于2的操作行为数据,一共只需要循环2次,就可以从历史的操作行为数据轨迹中确定认证操作行为数据集和待校验操作行为数据集,由于循环确定的待校验性,后续循环过程中很多操作行为数据的操作路径变化度被确定后就不再被优化。
S303,基于认证操作行为数据集,确定操作行为数据轨迹中的安全操作行为数据及安全操作行为数据的操作路径变化度。
其中,安全操作行为数据是从认证操作行为数据集中分析出的操作路径变化度大于预设的相关阈值的操作行为数据。云办公服务器从操作行为数据轨迹中汇总出认证操作行为数据集后,先对认证操作行为数据集进行分析,确定其中的安全操作行为数据及安全操作行为数据的操作路径变化度,以实现拆分处理和分布式处理分析的第一步。
在一些示例中,由于待校验操作行为数据集中各操作行为数据的操作行为活跃度是小于预设的相关阈值的,所以待校验操作行为数据集中各操作行为数据不会对认证操作行为数据集中各操作行为数据的操作路径变化度产生影响,那么,云办公服务器可以直接关注认证操作行为数据集,对认证操作行为数据集进行分析,根据认证操作行为数据集中各操作行为数据的操作行为活跃度确定各操作行为数据的操作路径变化度,将操作路径变化度大于预设的相关阈值的操作行为数据作为操作行为数据轨迹中的安全操作行为数据。
在一个实施例中,云办公服务器可以采用数据挖掘算法,直接对认证操作行为数据集进行数据挖掘分析,从认证操作行为数据集中分析出操作路径变化度大于预设的相关阈值的安全操作行为数据。在一些示例中,按照K=1,K=2,…,K处等于预设的相关阈值,从该认证操作行为数据集中反复去除操作行为活跃度小于或等于K的操作行为数据,得到K组操作行为数据集,从而确定认证操作行为数据集中各操作行为数据所在最大操作路径变化度的操作行为数据集,从而确定各操作行为数据的操作路径变化度,将其中操作路径变化度大于预设的相关阈值的操作行为数据作为安全操作行为数据。
在一个实施例中,云办公服务器可以在对认证操作行为数据集进行循环时,在当次循环过程中,利用操作行为数据前次循环后各关联操作行为数据的显性反馈系数优化相应操作行为数据的当次循环过程的操作路径变化度。并且,由于一个操作行为数据不会影响操作路径变化度大于该操作行为数据的其他操作行为数据的操作路径变化度的确定,因此,在当次循环优化各操作行为数据的操作路径变化度后,云办公服务器还可以将优化后操作路径变化度大于预设的相关阈值的操作行为数据继续参与下次循环,优化后操作路径变化度小于或等于预设的相关阈值的操作行为数据不再参与下次循环,这样就可以分析出认证操作行为数据集中操作路径变化度大于预设的相关阈值的操作行为数据。
在一个实施例中,操作行为数据的所有关联操作行为数据的显性反馈系数,可以是x系数,一个操作行为数据的x系数如果是x,就说明这个操作行为数据至少有x个关联操作行为数据,并且这x个关联操作行为数据的操作行为活跃度都不小于x。换言之说,若操作行为数据满足关联操作行为数据中存在x个关联操作行为数据的当前操作路径变化度大于或等于x,且不满足存在x+1个关联操作行为数据的当前操作路径变化度大于或等于x+1时,则确定操作行为数据对应的显性反馈系数为x,其中x为正整数。
在一个实施例中,基于认证操作行为数据集,确定操作行为数据轨迹中的安全操作行为数据及安全操作行为数据的操作路径变化度,可以包括以下内容。
S401,根据各操作行为数据在认证操作行为数据集中关联操作行为数据的操作行为关联度,获得各操作行为数据在认证操作行为数据集的操作行为活跃度,将在认证操作行为数据集中的操作行为活跃度作为相应操作行为数据初始的当前操作路径变化度。
在一些示例中,云办公服务器在对认证操作行为数据集进行分析时,可以利用认证操作行为数据集中各操作行为数据在该认证操作行为数据集中的操作行为活跃度来重置各操作行为数据的操作路径变化度,作为最初的当前操作路径变化度。
可以理解的是,本实施例中的“当前操作路径变化度”是动态变化的,指的是前次循环后各操作行为数据被优化的操作路径变化度,“前次循环过程”、“当次循环过程”也是动态变化的,在下一次循环时,“当次循环过程”成为了“前次循环过程”,而下一次循环变成了“当次循环过程”。
S402,循环地执行对于认证操作行为数据集中的每个操作行为数据,根据操作行为数据在认证操作行为数据集中的关联操作行为数据的当前操作路径变化度,确定操作行为数据对应的显性反馈系数;当显性反馈系数小于或等于预设的相关阈值时,从认证操作行为数据集中删除操作行为数据;当显性反馈系数大于相关阈值且小于操作行为数据的当前操作路径变化度时,则根据操作行为数据的显性反馈系数优化操作行为数据的当前操作路径变化度的步骤,直至当次循环过程中认证操作行为数据集中各操作行为数据的当前操作路径变化度均未被优化时终止循环。
在一些示例中,在每次循环过程中,云办公服务器都需要对认证操作行为数据集中的每个操作行为数据都需要进行处理。对认证操作行为数据集中的每个操作行为数据,根据其关联操作行为数据的当前操作路径变化度,即上一轮循环过程后所有关联操作行为数据的操作路径变化度,确定该操作行为数据对应的显性反馈系数,若操作行为数据的显性反馈系数小于或等于预设的相关阈值,则该操作行为数据不会影响操作路径变化度大于该操作行为数据的其他操作行为数据的操作路径变化度的确定,则该操作行为数据无需参与后续的循环过程,可以从认证操作行为数据集中删除该操作行为数据;若操作行为数据的显性反馈系数大于预设的相关阈值且小于操作行为数据的当前操作路径变化度,则利用该显性反馈系数优化该操作行为数据的当前操作路径变化度,并且该操作行为数据还需要继续参与后续的循环过程。
由于每个操作行为数据在当次循环过程的操作路径变化度是根据该操作行为数据所有相同在前次循环过程的操作路径变化度确定的,具有局部扩展性,可以很容易扩展成分布式并行计算的逻辑,从而加快整个数据分析过程。
循环终止条件,是当次循环过程中,认证操作行为数据集中剩下的所有操作行为数据的当前操作路径变化度均未发生变化。换言之说,根据操作行为数据的关联操作行为数据在前次循环的操作路径变化度确定得到的显性反馈系数与该操作行为数据的当前操作路径变化度一致时,则该操作行为数据的操作路径变化度不会被优化,若认证操作行为数据集中剩下的所有操作行为数据的当前操作路径变化度在当次循环过程中均未被优化,则终止循环。
可以理解的是,由于每次循环过程中会删除认证操作行为数据集中显性反馈系数小于或等于预设的相关阈值的操作行为数据,因此循环过程中认证操作行为数据集也是动态变化的,从而认证操作行为数据集中每个操作行为数据的关联操作行为数据也是不断变化的,所以在根据每个操作行为数据的关联操作行为数据的当前操作路径变化度确定其显性反馈系数时,应当根据该操作行为数据在当前的认证操作行为数据集中的关联操作行为数据的当前操作路径变化度来确定,而非根据该操作行为数据在最初的认证操作行为数据集中的关联操作行为数据的当前操作路径变化度来确定,可以进一步减少计算负荷。
在一个实施例中,当次循环后若计算得到操作行为数据的显性反馈系数小于获等于预设的相关阈值,则云办公服务器可以将该操作行为数据汇总为安全异常状态,那么被汇总为安全异常状态的操作行为数据将不再参与下次循环过程。
在一个实施例中,上述方法还包括:在当次循环结束后,记录当次循环过程中当前操作路径变化度被优化的操作行为数据;记录的操作行为数据用于指示在下次循环开始时,将记录的操作行为数据在认证操作行为数据集中的关联操作行为数据,作为下次循环过程中需要重新确定显性反馈系数的目标操作行为数据;对于认证操作行为数据集中的每个操作行为数据,根据操作行为数据在认证操作行为数据集中的关联操作行为数据的当前操作路径变化度,确定操作行为数据对应的显性反馈系数,包括:对于认证操作行为数据集中的目标操作行为数据,根据目标操作行为数据在认证操作行为数据集中的关联操作行为数据的当前操作路径变化度,确定目标操作行为数据对应的显性反馈系数。
本实施例中,通过记录当次循环过程中当前操作路径变化度被优化的操作行为数据,就可以直接确定下次循环过程中需要重新确定操作路径变化度的操作行为数据。当某一个操作行为数据的操作路径变化度被优化后,该操作行为数据将会影响其关联操作行为数据的操作路径变化度的确定,因此,当次循环过程结束后,记录这些操作路径变化度被优化的操作行为数据,在下次循环开始时,从认证操作行为数据集中候选的操作行为数据中遍历出这些操作行为数据的关联操作行为数据,作为下次循环过程需要重新确定操作路径变化度的操作行为数据,可以避免对认证操作行为数据集中所有操作行为数据重新确定操作路径变化度,提升分析效率。可以理解的是,这些当前操作路径变化度被优化的操作行为数据的关联操作行为数据不包括已经从认证操作行为数据集中删除的操作行为数据。
在一个实施例中,上述方法还包括:在当次循环过程开始时,重置操作行为数据的优化次数为零,操作行为数据的优化次数用于记录当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度;统计当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度;根据操作行为关联度优化操作行为数据的优化次数;在当次循环过程结束的前提下,操作行为数据的优化次数为非零,则继续下一次循环过程;在当次循环过程结束的前提下,操作行为数据的优化次数为零,则终止循环。
在本实施例中,在分析认证操作行为数据集的过程中,可以利用一个标记,来记录当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度。云办公服务器可以设置一个用于记录每轮循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度,在当次循环过程开始时,将这个标记置为0,对于参与当次循环的操作行为数据,每当一个操作行为数据的操作路径变化度被优化了,则该标记+1,那么,当次循环结束后,若该标记不为0,说明当次循环过程中存在操作路径变化度被优化的操作行为数据,则需要继续循环,若该标记为0,说明当次循环的整个过程中都不存在操作路径变化度被优化的操作行为数据,整个循环过程结束。
S403,将终止循环时获得的认证操作行为数据集中的操作行为数据作为安全操作行为数据,并将终止循环时安全操作行为数据的当前操作路径变化度作为安全操作行为数据对应的操作路径变化度。
由于循环结束后认证操作行为数据集中候选的操作行为数据的操作路径变化度都是大于预设的相关阈值的,因此可以将这些操作行为数据称为安全操作行为数据。安全操作行为数据的操作路径变化度即为该操作行为数据在整个历史的操作行为数据轨迹中的操作路径变化度。
在一个可能的实施例中,确定认证操作行为数据集中各操作行为数据的操作路径变化度的过程如下:
1)、根据认证操作行为数据集中各操作行为数据在该认证操作行为数据集中关联操作行为数据的操作行为关联度,确定认证操作行为数据集中各操作行为数据的操作行为活跃度,用操作行为活跃度来重置各操作行为数据的当前操作路径变化度;
2)、用零重置numRelationalDegree,numRelationalDegree表示每轮循环中操作路径变化度被优化的操作行为数据的操作行为关联度;
3)、对认证操作行为数据集中的每个操作行为数据,根据其关联操作行为数据的当前操作路径变化度确定显性反馈系数,该操作行为数据的关联操作行为数据是该操作行为数据在认证操作行为数据集中的且已过滤掉非活跃状态的操作行为数据。当显性反馈系数小于等于预设的相关阈值时,将该操作行为数据汇总结果为非活跃状态;当显性反馈系数大于预设的相关阈值且小于操作行为数据当前操作路径变化度时,根据显性反馈系数优化该操作行为数据的当前操作路径变化度,且numRelationalDegree+1;
4)、当numRelationalDegree不为0时,重复第2)-3)步;否则结束循环,此时认证操作行为数据集中状态没有被汇总为非活跃的操作行为数据的当前操作路径变化度即为该操作行为数据在整个历史的操作行为数据轨迹中的操作路径变化度,没有被汇总为非活跃的操作行为数据为该操作行为数据轨迹中的安全操作行为数据。
在本实施例中,基于显性反馈系数对认证操作行为数据集中各操作行为数据的操作路径变化度进行确定,并对每次循环确定得到的操作路径变化度与预设的相关阈值进行比较,只有当循环确定的操作路径变化度大于相关阈值时,该操作行为数据才继续进行循环,反之则不再参与后续循环,能够提升对认证操作行为数据集的分析效率。
S304,根据操作行为数据轨迹中除安全操作行为数据之外的操作行为数据及操作行为数据之间的路径传递关系,获得操作行为数据轨迹中的待校验操作行为数据集。
在一些示例中,云办公服务器确定了操作行为数据轨迹中的安全操作行为数据后,操作行为数据轨迹中除安全操作行为数据之外的候选操作行为数据的操作路径变化度是小于或等于预设的相关阈值的,将这些操作行为数据及其之间构成的路径传递关系称为待校验操作行为数据集。
在一个实施例中,根据操作行为数据轨迹中除安全操作行为数据之外的操作行为数据及操作行为数据之间的路径传递关系,获得操作行为数据轨迹中的待校验操作行为数据集,包括:从操作行为数据轨迹中删除安全操作行为数据;根据删除安全操作行为数据后候选操作行为数据及候选操作行为数据之间的路径传递关系,获得待校验操作行为数据集。
基于上述所描述的内容,数据轨迹可以以图数据或轨迹列表的形式进行存储,云办公服务器确定了操作行为数据轨迹中的安全操作行为数据之后,可以从图数据或轨迹列表进行遍历,从中删除安全操作行为数据后,得到候选的操作行为数据及候选操作行为数据之间的传递关系,获得待校验操作行为数据集。
S305,基于待校验操作行为数据集和安全操作行为数据,确定待校验操作行为数据集中各操作行为数据的操作路径变化度。
待校验操作行为数据集中各操作行为数据对应的操作路径变化度的确定同样遵循上述显性反馈系数循环的方法,但由于安全操作行为数据会对待校验操作行为数据集中各操作行为数据的操作路径变化度的确定产生影响,所以在循环过程中还需要考虑安全操作行为数据对待校验操作行为数据集中操作行为数据的操作路径变化度的变化值大小。云办公服务器在获得操作行为数据轨迹中的待校验操作行为数据集和安全操作行为数据后,可以基于该待校验操作行为数据集和安全操作行为数据确定该待校验操作行为数据集中各操作行为数据的操作路径变化度,以实现拆分处理和分布式处理分析的第二步。
在一个实施例中,云办公服务器可以采用数据挖掘算法,对待校验操作行为数据集进行数据挖掘分析,从待校验操作行为数据集中分析出各操作行为数据的操作路径变化度。在一些示例中,按照K=1,K=2,…,K处等于预设的相关阈值,从该待校验操作行为数据集中反复去除操作行为活跃度小于或等于K的操作行为数据,得到K组操作行为数据集,从而确定待校验操作行为数据集中各操作行为数据所在最大操作路径变化度的操作行为数据集,从而确定各操作行为数据的操作路径变化度。
在一个实施例中,云办公服务器还可以在对待校验操作行为数据集进行循环时,在当次循环过程中,利用操作行为数据前次循环后,该操作行为数据在操作行为数据轨迹中各关联操作行为数据的显性反馈系数优化相应操作行为数据的当次循环过程的操作路径变化度。
在一个实施例中,操作行为数据的所有关联操作行为数据的显性反馈系数,可以是x系数,一个操作行为数据的x系数如果是x,就说明这个操作行为数据至少有x个关联操作行为数据,并且这x个关联操作行为数据的操作行为活跃度都不小于x。换言之说,若操作行为数据满足关联操作行为数据中存在x个关联操作行为数据的当前操作路径变化度大于或等于x,且不满足存在x+1个关联操作行为数据的当前操作路径变化度大于或等于x+1时,则确定操作行为数据对应的显性反馈系数为x,其中x为正整数。
在一个实施例中,基于待校验操作行为数据集和安全操作行为数据,确定待校验操作行为数据集中各操作行为数据的操作路径变化度,可以包括以下内容。
S501,根据待校验操作行为数据集中各操作行为数据在历史的操作行为数据轨迹中关联操作行为数据的操作行为关联度,重置待校验操作行为数据集中各操作行为数据的当前操作路径变化度。
在一些示例中,云办公服务器在对待校验操作行为数据集进行分析时,可以利用待校验操作行为数据集中各操作行为数据在历史的操作行为数据轨迹中的操作行为活跃度来重置各操作行为数据的操作路径变化度,作为最初的当前操作路径变化度。
换言之说,在确定待校验操作行为数据集中各操作行为数据的操作路径变化度时,每次循环过程中,不仅要考虑待校验操作行为数据集中的操作行为数据对其的影响,还需要考虑安全操作行为数据对其的影响,所以需要考虑安全操作行为数据对其操作行为活跃度的变化值大小,换言之将操作行为数据在待校验操作行为数据集中的操作行为活跃度与该操作行为数据与安全操作行为数据相连的操作行为关联度之和来重置该操作行为数据的当前操作路径变化度,实际上换言之该操作行为数据在历史的操作行为数据轨迹中的操作行为活跃度。
在一个实施例中,根据前面的步骤,安全操作行为数据的操作路径变化度已经确定,安全操作行为数据的操作路径变化度都是大于预设的相关阈值的,而待校验操作行为数据集中各操作行为数据的操作路径变化度都是小于或等于预设的相关阈值的,所以,在确定待校验操作行为数据集中各操作行为数据的操作路径变化度时,若需要用到安全操作行为数据的操作路径变化度,为了减小资源占用,可以将安全操作行为数据的操作路径变化度均设置为预设的相关阈值,也可以设置为任意大于预设的相关阈值的值,还可以直接使用按前述步骤所确定的安全操作行为数据的操作路径变化度,上述不同方式的设置不会影响对待校验操作行为数据集中各操作行为数据的操作路径变化度的确定结果。
S502,循环地执行对于待校验操作行为数据集中的每个操作行为数据,根据操作行为数据在操作行为数据轨迹中的关联操作行为数据的当前操作路径变化度,确定操作行为数据对应的显性反馈系数;当显性反馈系数小于操作行为数据的当前操作路径变化度时,则根据操作行为数据的显性反馈系数优化操作行为数据的当前操作路径变化度的步骤,直至当次循环过程中待校验操作行为数据集中各操作行为数据的当前操作路径变化度均未被优化时终止循环。
在一些示例中,在每次循环过程中,云办公服务器都需要对待校验操作行为数据集中的每个操作行为数据都需要进行处理。对待校验操作行为数据集中的每个操作行为数据,根据其在操作行为数据轨迹中的关联操作行为数据的当前操作路径变化度,即上一轮循环过程后所有关联操作行为数据的操作路径变化度,确定该操作行为数据对应的显性反馈系数。可以理解的是,若关联操作行为数据包括安全操作行为数据,安全操作行为数据的操作路径变化度在前述步骤已经确定,所以在待校验操作行为数据集的循环过程中,安全操作行为数据的操作路径变化度都不用参与优化。若操作行为数据的显性反馈系数小于操作行为数据的当前操作路径变化度,则利用该显性反馈系数优化该操作行为数据的当前操作路径变化度。由于每个操作行为数据在当次循环过程的操作路径变化度是根据该操作行为数据所有关联操作行为数据在前次循环过程的操作路径变化度确定的,具有局部扩展性,可以很容易扩展成分布式并行计算的逻辑,从而加快整个分析过程。
循环终止条件,是当次循环过程中,待校验操作行为数据集中所有操作行为数据的当前操作路径变化度均未发生变化。换言之说,根据操作行为数据的关联操作行为数据在前次循环的操作路径变化度确定得到的显性反馈系数与该操作行为数据当前操作路径变化度一致时,则该操作行为数据的操作路径变化度不会被优化,若待校验操作行为数据集中所有操作行为数据的当前操作路径变化度在当次循环过程中均未被优化,则终止循环。
在一个实施例中,上述方法还包括:在当次循环结束后,记录当次循环过程中当前操作路径变化度被优化的操作行为数据;记录的操作行为数据用于指示在下次循环开始时,将记录的操作行为数据在待校验操作行为数据集中的关联操作行为数据,作为下次循环过程中需要重新确定显性反馈系数的目标操作行为数据;对于待校验操作行为数据集中的每个操作行为数据,根据操作行为数据在操作行为数据轨迹中的关联操作行为数据的当前操作路径变化度,确定操作行为数据对应的显性反馈系数,包括:对于待校验操作行为数据集中的目标操作行为数据,根据目标操作行为数据在操作行为数据轨迹中的关联操作行为数据的当前操作路径变化度,确定目标操作行为数据对应的显性反馈系数。
本实施例中,通过记录当次循环过程中当前操作路径变化度被优化的操作行为数据,就可以直接确定下次循环过程中需要重新确定操作路径变化度的操作行为数据。当某一个操作行为数据的操作路径变化度被优化后,该操作行为数据将会影响其关联操作行为数据的操作路径变化度的确定,因此,当次循环过程结束后,记录这些操作路径变化度被优化的操作行为数据,在下次循环开始时,从待校验操作行为数据集中遍历出这些操作行为数据的关联操作行为数据,作为下次循环过程需要重新确定操作路径变化度的操作行为数据,可以避免对待校验操作行为数据集中所有操作行为数据重新确定操作路径变化度,提升分析效率。可以理解的是,确定当前操作路径变化度被优化的操作行为数据的关联操作行为数据后,关联操作行为数据中若包括安全操作行为数据,则安全操作行为数据不需要重新确定操作路径变化度。
在一个实施例中,上述方法还包括:在当次循环过程开始时,重置操作行为数据的优化次数为零,操作行为数据的优化次数用于记录当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度;统计当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度;根据操作行为关联度优化操作行为数据的优化次数;在当次循环过程结束的前提下,操作行为数据的优化次数为非零,则继续下一次循环过程;在当次循环过程结束的前提下,操作行为数据的优化次数为零,则终止循环。
在本实施例中,在分析待校验操作行为数据集的过程中,可以利用一个标记,来记录当次循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度。云办公服务器可以设置一个用于记录每轮循环过程中当前操作路径变化度被优化的操作行为数据的操作行为关联度,在当次循环过程开始时,将这个标记置为0,对于参与当次循环的操作行为数据,每当一个操作行为数据的操作路径变化度被优化了,则该标记+1,那么,当次循环结束后,若该标记不为0,说明当次循环过程中存在操作路径变化度被优化的操作行为数据,则需要继续循环,若该标记为0,说明当次循环的整个过程中都不存在操作路径变化度被优化的操作行为数据,整个循环过程结束。
S503,将终止循环时操作行为数据的当前操作路径变化度作为操作行为数据对应的操作路径变化度。
循环结束后,待校验操作行为数据集中各操作行为数据的操作路径变化度即为该操作行为数据在整个历史的操作行为数据轨迹中的操作路径变化度。
在一个可能的实施例中,确定待校验操作行为数据集中各操作行为数据的操作路径变化度的过程如下:
A1、确定待校验操作行为数据集中各操作行为数据的操作行为活跃度;
A2、对待校验操作行为数据集中的各操作行为数据,统计其与安全操作行为数据相连的个数q,用q值与其操作行为活跃度之和重置该操作行为数据的当前操作路径变化度;
A3、用零重置numRelationalDegree,numRelationalDegree表示每轮循环中操作路径变化度被优化的操作行为数据的操作行为关联度;
A4、对待校验操作行为数据集中的每个操作行为数据,根据其关联操作行为数据的当前操作路径变化度确定显性反馈系数。这里的关联集合指的是操作行为数据在历史的操作行为数据轨迹的关联操作行为数据,换言之说,关联操作行为数据不仅包括待校验操作行为数据集中的操作行为数据,也可能包括安全操作行为数据。当显性反馈系数小于操作行为数据的当前操作路径变化度时,根据显性反馈系数优化该操作行为数据的当前操作路径变化度,且numRelationalDegree+1。
A5、当numRelationalDegree不为0时,重复第A3-A4;否则结束循环,此时待校验操作行为数据集中各操作行为数据的操作路径变化度即为各操作行为数据在整个历史的操作行为数据轨迹中的操作路径变化度。
上述针对云计算环境的信息安全处理方法中,在获取了操作行为数据轨迹中各操作行为数据的操作行为活跃度之后,基于拆分处理和分布式处理思想,对操作行为数据轨迹进行拆分处理和分布式处理分析,从而可以支持大规模网络的操作行为数据集分析。换言之,根据各操作行为数据的操作行为活跃度将完整的操作行为数据轨迹分为认证操作行为数据集和待校验操作行为数据集,进而分成两部分进行分析,极大提高了数据分析处理过程中的资源利用率,减少了整体层面的资源占用,并且可以直接关注认证操作行为数据集,避免在非重点关注的操作行为数据上花费较多的循环时间和业务处理计算资源,提升了针对操作行为数据的分析效率和分析准确率等能力。
由于待校验操作行为数据集中的各操作行为数据不会对认证操作行为数据集中的操作行为数据产生影响,因此针对认证操作行为数据集,直接确定其中的安全操作行为数据及安全操作行为数据对应的操作路径变化度,接着将操作行为数据轨迹中除该安全操作行为数据及安全操作行为数据之间的路径传递关系外候选的部分构成待校验操作行为数据集,考虑到认证操作行为数据集中的安全操作行为数据会对其中的操作行为数据产生影响,因此针对该待校验操作行为数据集,需要根据待校验操作行为数据集本身及认证操作行为数据集中的安全操作行为数据来确定该待校验操作行为数据集中各操作行为数据的操作路径变化度。分析出操作行为数据轨迹中各操作行为数据的操作路径变化度之后,操作路径变化度可作为相应操作行为数据的特征生成相应的行为风险检测信息用于其他的业务处理分析。
在一个实施例中,操作行为数据的操作路径变化度可以用于根据操作路径变化度生成与操作行为数据对应的行为风险检测信息,行为风险检测信息用于根据行为风险检测信息对操作行为数据进行行为风险识别。在一些示例中,操作行为数据的操作路径变化度可以作为特征输入到机器学习算法中,实现对操作行为数据的行为风险识别。
在一个实施例中,操作行为数据轨迹为业务执行数据轨迹,业务执行数据轨迹中的操作行为数据表示云业务对象信息,业务执行数据轨迹中两个操作行为数据之间的路径传递关系表示相应的两个云业务对象信息之间存在业务执行触发流程内容,上述方法还包括:根据业务执行数据轨迹中各操作行为数据的操作路径变化度,生成操作行为数据表示的云业务对象信息所对应的行为风险检测信息;通过预先训练的行为风险识别模型,基于行为风险检测信息识别云业务对象信息对应的信息安全风险类别。
在一个具体的应用场景中,云办公服务器可以获取与云业务对象信息对应的业务执行记录;根据业务执行记录获得各云业务对象信息之间的业务执行触发流程数据;根据业务执行触发流程数据生成业务执行数据轨迹,并采用本申请实施例提供的针对云计算环境的信息安全处理方法对该业务执行数据轨迹进行处理,获得各操作行为数据的操作路径变化度,根据各操作行为数据的操作路径变化度生成对应的行为风险检测信息,利用基于机器学习的行为风险识别算法对各操作行为数据进行行为风险识别,以识别各操作行为数据是否存在数据入侵风险。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种应用于大数据云办公的信息处理方法,其特征在于,应用于云办公服务器,所述方法包括:
通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容;其中,所述异常办公记录识别网络,用于对待处理可视化办公信息进行多个异常办公记录类型的识别;
通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数;
从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,并将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息。
2.根据权利要求1所述的方法,其特征在于,所述关键描述挖掘单元包括多个关键描述挖掘线程,每个所述关键描述挖掘线程对应一个所述可视化办公信息节点;
所述通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到每一个所述可视化办公信息节点对应的关键描述内容,包括:
分别基于各所述关键描述挖掘线程进行如下处理:
通过所述关键描述挖掘线程,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到相应的可视化办公信息节点的关键描述内容;
相应的,所述通过所述关键描述挖掘线程,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘,得到相应的可视化办公信息节点的关键描述内容,包括:
通过所述关键描述挖掘线程,将所述待处理可视化办公信息转化为多个候选可视化办公信息节点;
分别对各所述候选可视化办公信息节点进行关键描述挖掘,得到每一个所述候选可视化办公信息节点对应的关键描述内容;
从所述多个候选可视化办公信息节点中,挑选关键描述内容对应的描述值最大的候选可视化办公信息节点,并将挑选的候选可视化办公信息节点的关键描述内容作为与所述关键描述挖掘线程对应的可视化办公信息节点的关键描述内容;
相应的,当所述关键描述挖掘线程用于对目标信息量的可视化办公信息节点进行关键描述挖掘时,所述将所述待处理可视化办公信息转化为多个候选可视化办公信息节点,包括:
对所述待处理可视化办公信息中的办公资料报表进行逐一查阅,并针对逐一查阅到的每个办公资料报表进行如下处理:
将逐一查阅到的办公资料报表作为初始办公资料报表,从所述待处理可视化办公信息中挖掘所述目标信息量的候选可视化办公信息节点。
3.根据权利要求1所述的方法,其特征在于,所述通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述可视化办公信息节点对应的关键描述内容,确定相应的所述可视化办公信息节点与各所述异常办公记录类型的相关性系数,包括:
分别针对各所述可视化办公信息节点进行如下处理:
获取各所述异常办公记录类型的重要性系数;
通过所述异常办公记录识别网络的相关性分析单元,基于所述可视化办公信息节点对应的关键描述内容和各所述异常办公记录类型的重要性系数,分别确定所述可视化办公信息节点与各所述异常办公记录类型的相关性系数。
4.根据权利要求1所述的方法,其特征在于,所述从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,包括:
分别针对各所述异常办公记录类型进行如下处理:
基于各所述可视化办公信息节点与所述异常办公记录类型的相关性系数,对各所述可视化办公信息节点进行整理,得到可视化办公信息节点序目;
按照所述相关性系数的降序方式,从所述可视化办公信息节点序目中,挑选目标数目的可视化办公信息节点,将挑选的可视化办公信息节点作为与所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点。
5.根据权利要求1所述的方法,其特征在于,所述从所述多个可视化办公信息节点中,分别挑选与各所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点,包括:
分别针对各所述异常办公记录类型进行如下处理:
获取与所述异常办公记录类型相对应的预设相关性系数;
从所述多个可视化办公信息节点中,挑选与所述异常办公记录类型的相关性系数达到预设相关性系数的可视化办公信息节点,将挑选的可视化办公信息节点作为与所述异常办公记录类型的相关性系数符合相关性分析条件的可视化办公信息节点。
6.根据权利要求1所述的方法,其特征在于,所述通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘之前,所述方法还包括:
从目标协同办公事项中获取所述目标协同办公事项的事项信息;
对所述事项信息进行可视化办公信息的挖掘,将挖掘得到的可视化办公信息作为所述待处理可视化办公信息。
7.根据权利要求1所述的方法,其特征在于,所述将挑选的可视化办公信息节点作为从所述待处理可视化办公信息中挖掘的异常办公可视化信息之后,所述方法还包括:
基于所述异常办公可视化信息生成相应的异常办公警示信息;
发送所述异常办公警示信息。
8.根据权利要求1所述的方法,其特征在于,所述通过异常办公记录识别网络的关键描述挖掘单元,对包含多个可视化办公信息节点的待处理可视化办公信息进行关键描述挖掘之前,所述方法还包括:
通过所述异常办公记录识别网络的关键描述挖掘单元,对包含多个基准可视化办公信息节点的基准可视化办公信息进行关键描述挖掘,得到每一个所述基准可视化办公信息节点对应的关键描述内容;其中,所述基准可视化办公信息绑定有指示所述基准可视化办公信息所对应的异常办公记录类型的异常办公记录识别标识;
通过所述异常办公记录识别网络的相关性分析单元,分别基于各所述基准可视化办公信息节点对应的关键描述内容,确定相应的所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数;
通过所述异常办公记录识别网络的相关性分析单元,基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,对所述基准可视化办公信息的异常办公记录类型进行相关性分析,得到关联异常办公类型;
基于所述关联异常办公类型与所述异常办公记录识别标识之间的比较结果,对所述关键描述挖掘单元的配置参量及所述相关性分析单元的配置参量进行调整;
相应的,所述基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,对所述基准可视化办公信息的异常办公记录类型进行相关性分析,得到关联异常办公类型,包括:
基于各所述基准可视化办公信息节点与各所述异常办公记录类型的相关性系数,分别确定所述基准可视化办公信息对应于各所述异常办公记录类型的可能性;
基于所述基准可视化办公信息对应于各所述异常办公记录类型的可能性,确定所述基准可视化办公信息所对应的异常办公记录类型,并将确定的异常办公记录类型作为所述关联异常办公类型。
9.一种云办公服务器,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时实现上述权利要求1-8任一项所述的方法。
CN202110708148.0A 2021-06-25 2021-06-25 应用于大数据云办公的信息处理方法、服务器及介质 Withdrawn CN113409016A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110708148.0A CN113409016A (zh) 2021-06-25 2021-06-25 应用于大数据云办公的信息处理方法、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110708148.0A CN113409016A (zh) 2021-06-25 2021-06-25 应用于大数据云办公的信息处理方法、服务器及介质

Publications (1)

Publication Number Publication Date
CN113409016A true CN113409016A (zh) 2021-09-17

Family

ID=77683109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110708148.0A Withdrawn CN113409016A (zh) 2021-06-25 2021-06-25 应用于大数据云办公的信息处理方法、服务器及介质

Country Status (1)

Country Link
CN (1) CN113409016A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641994A (zh) * 2021-10-13 2021-11-12 杭银消费金融股份有限公司 基于图数据的数据处理方法及系统
CN114567505A (zh) * 2022-03-07 2022-05-31 滕州市启迪智国计算机有限公司 一种应用于数字办公的异常会话大数据处理方法及服务器
CN116611799A (zh) * 2023-07-22 2023-08-18 太仓市律点信息技术有限公司 基于云办公的数据处理方法、ai云办公服务器及介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641994A (zh) * 2021-10-13 2021-11-12 杭银消费金融股份有限公司 基于图数据的数据处理方法及系统
CN113641994B (zh) * 2021-10-13 2022-02-08 杭银消费金融股份有限公司 基于图数据的数据处理方法及系统
CN114567505A (zh) * 2022-03-07 2022-05-31 滕州市启迪智国计算机有限公司 一种应用于数字办公的异常会话大数据处理方法及服务器
CN116611799A (zh) * 2023-07-22 2023-08-18 太仓市律点信息技术有限公司 基于云办公的数据处理方法、ai云办公服务器及介质
CN116611799B (zh) * 2023-07-22 2023-09-26 太仓市律点信息技术有限公司 基于云办公的数据处理方法、ai云办公服务器及介质

Similar Documents

Publication Publication Date Title
US20180322283A1 (en) Event anomaly analysis and prediction
Qu et al. A new dependency and correlation analysis for features
CN113409016A (zh) 应用于大数据云办公的信息处理方法、服务器及介质
CN109889538B (zh) 用户异常行为检测方法及系统
US20160314484A1 (en) Method and system for mining churn factor causing user churn for network application
CN111581092A (zh) 仿真测试数据的生成方法、计算机设备及存储介质
CN111859047A (zh) 一种故障解决方法及装置
CN113221535B (zh) 情报处理方法、装置、计算机设备和存储介质
US20230156043A1 (en) System and method of supporting decision-making for security management
Xiaolong et al. RFC: a feature selection algorithm for software defect prediction
Zhao et al. A survey of deep anomaly detection for system logs
Bhati et al. A new ensemble based approach for intrusion detection system using voting
CN117220920A (zh) 基于人工智能的防火墙策略管理方法
CN116707859A (zh) 特征规则提取方法和装置、网络入侵检测方法和装置
CN107920067B (zh) 一种主动对象存储系统上的入侵检测方法
CN116661954B (zh) 虚拟机异常预测方法、装置、通信设备及存储介质
CN112434831A (zh) 故障排查方法、装置、存储介质及计算机设备
Mandagondi Anomaly detection in log files using machine learning techniques
Elmasry et al. Enhancing the Intrusion Detection Efficiency using a Partitioning-based Recursive Feature Elimination in Big Cloud Environment
Tyagi et al. Twitter bot detection using machine learning models
Du et al. Feature-grouping-based two steps feature selection algorithm in software defect prediction
CN116707834B (zh) 一种基于云存储的分布式大数据取证与分析平台
Cui et al. User Behavior Auditing in Electric Management Information System based on Graph Clustering
Fernandes et al. Impact of Non-Fitting Cases for Remaining Time Prediction in a Multi-Attribute Process-Aware Method.
Leal et al. Towards adaptive and transparent tourism recommendations: A survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210917