CN115906160A - 一种基于人工智能分析的信息处理方法及系统 - Google Patents

一种基于人工智能分析的信息处理方法及系统 Download PDF

Info

Publication number
CN115906160A
CN115906160A CN202211433623.9A CN202211433623A CN115906160A CN 115906160 A CN115906160 A CN 115906160A CN 202211433623 A CN202211433623 A CN 202211433623A CN 115906160 A CN115906160 A CN 115906160A
Authority
CN
China
Prior art keywords
item
access
behavior sequence
frequent
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211433623.9A
Other languages
English (en)
Other versions
CN115906160B (zh
Inventor
栗志超
柳阳
冯雪
宋秋
曹君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bringspring Technology Co ltd
Original Assignee
Bringspring Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bringspring Technology Co ltd filed Critical Bringspring Technology Co ltd
Priority to CN202211433623.9A priority Critical patent/CN115906160B/zh
Publication of CN115906160A publication Critical patent/CN115906160A/zh
Application granted granted Critical
Publication of CN115906160B publication Critical patent/CN115906160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于人工智能分析的信息处理方法及系统,涉及数据智能处理技术领域,采集第一访问日志数据,进行频繁项挖掘生成第一访问基线行为序列和离散访问行为序列,进行数据二次划分获取第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型,获取第二访问日志数据进行模型分析,输出第一用户异常访问行为识别结果并发送至协同办公平台后台管理端,解决了现有技术中由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险的技术问题,基于用户可靠性行为序列建模进行用户异常行为的智能化识别,针对用户进行个性化检测,在提高检出效率的基础上保障协同办公平台的安全性。

Description

一种基于人工智能分析的信息处理方法及系统
技术领域
本发明涉及数据智能处理技术领域,具体涉及一种基于人工智能分析的信息处理方法及系统。
背景技术
协同办公平台作为协同办公的核心部分,将多个分支机构与单位连接起来,以进行统一管理,由于平台覆盖的宽泛性,使得其管控数据较为繁杂,同时,进行线上办公时,主要通过信息通信来完成信息交互,由于当前系统还不够完善,使得进行数据交互时存在一定的安全性风险,相关隐私信息无法得到有效保障,现如今,主要是通过设定用户访问规则,将超出规则限制的访问则视为异常用户行为,但是随着技术的不断发展,恶意访问逐渐呈现多层次,难识别的特征,当前的检测方式无法满足信息处理需求。
现有技术中,进行日志数据分析时,由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险。
发明内容
本申请提供了一种基于人工智能分析的信息处理方法及系统,用于针对解决现有技术中存在的进行日志数据分析时,由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险的技术问题。
鉴于上述问题,本申请提供了一种基于人工智能分析的信息处理方法及系统。
第一方面,本申请提供了一种基于人工智能分析的信息处理方法,所述方法包括:
根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
判断所述离散访问行为序列是否属于可靠性行为序列;
若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
第二方面,本申请提供了一种基于人工智能分析的信息处理系统,所述系统包括:
数据采集模块,所述数据采集模块用于根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
序列生成模块,所述序列生成模块用于遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
序列判断模块,所述序列判断模块用于判断所述离散访问行为序列是否属于可靠性行为序列;
序列添加模块,所述序列添加模块用于若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
模型构建模块,所述模型构建模块用于根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
结果输出模块,所述结果输出模块用于获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
结果发送模块,所述结果发送模块用于将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的一种基于人工智能分析的信息处理方法,根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;判断所述离散访问行为序列是否属于可靠性行为序列;若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端,解决了现有技术中存在的进行日志数据分析时,由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险的技术问题,基于用户可靠性行为序列建模进行用户异常行为的智能化识别,针对用户进行个性化检测,在提高检出效率的基础上保障协同办公平台的安全性。
附图说明
图1为本申请提供了一种基于人工智能分析的信息处理方法流程示意图;
图2为本申请提供了一种基于人工智能分析的信息处理方法中第一访问基线行为序列和离散访问行为序列获取流程示意图;
图3为本申请提供了一种基于人工智能分析的信息处理方法中第一用户行为异常检测模型构建流程示意图;
图4为本申请提供了一种基于人工智能分析的信息处理系统结构示意图。
附图标记说明:数据采集模块11,序列生成模块12,序列判断模块13,序列添加模块14,模型构建模块15,结果输出模块16,结果发送模块17。
具体实施方式
本申请通过提供一种基于人工智能分析的信息处理方法及系统,采集第一访问日志数据,进行频繁项挖掘生成第一访问基线行为序列和离散访问行为序列,将离散访问行为序列中可靠性序列与第一访问基线行为序列作为第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型,获取第二访问日志数据进行模型分析,输出第一用户异常访问行为识别结果并发送至协同办公平台后台管理端,用于解决现有技术中存在的进行日志数据分析时,由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险的技术问题。
实施例一
如图1所示,本申请提供了一种基于人工智能分析的信息处理方法,应用于协同办公平台,所述方法包括:
步骤S100:根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
具体而言,协同办公平台作为多机构单位统一管理的核心部分,对于平台的数据处理能力与平台安全性要求越来越高,当前平台的数据处理方式还无法满足多样化的线上信息交互,无法保障信息处理的精准度,本申请提供的一种基于人工智能分析的信息处理方法应用于所述协同办公平台,所述协同办公平台为进行线上办公管理的总控平台,通过对用户的访问日志进行分析汇总,基于有效信息数据进行建模,以保障信息识别分析的客观性于准确性,进一步将待检测信息输入模型进行异常检测判定,首先,设定所述第一时间粒度,即进行日志数据采集的时间区间,基于所述协同办公平台,对所述第一用户于所述第一时间粒度内的访问日志数据进行采集,包括多条日志数据,所述第一用户为待进行办公行为分析的目标用户,基于时间序列对所述多条日志数据进行整合处理,生成所述第一访问日志数据,将所述第一访问日志数据作为数据源进行用户行为分析。
步骤S200:遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
具体而言,通过对所述第一用户进行日志数据采集,生成所述第一访问日志数据,确定进行数据异常行为识别的多个有效特征,将其作为第一请求项、第二请求项直至所述第i请求项,一条完整的访问日志行为序列包含多个请求项,基于单项请求项频率判定阈值确定一频繁项阈值,基于双关联请求项频率判定阈值确定二频繁项阈值,依次类推确定k频繁项阈值,基于上述频繁项阈值对访问日志行为序列进行逐层判定划分,将大于等于频繁项阈值的作为频繁项集合,基于时序对其进行整合处理,即频繁项的序列对应,生成所述第一访问极限行为序列,将小于频繁项阈值的作为非频繁项集合,进而进行非频繁项集合的调整生成所述离散访问行为序列,将其作为所述第一访问日志数据的初步判定结果,在此基础上可进行进一步的分析评定提高数据划分精度。
进一步而言,如图2所示,所述遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列,本申请步骤S200还包括:
步骤S210:对所述第一访问日志数据进行模式化清洗,生成第一访问行为序列,其中,所述第一访问行为序列具有第一请求项、第二请求项直到第i请求项;
步骤S220:构建一频繁项阈值、二频繁项阈值直到k频繁项阈值;
步骤S230:根据所述一频繁项阈值、所述二频繁项阈值直到所述k频繁项阈值对所述第一请求项、所述第二请求项直到所述第i请求项进行多层级频繁项剪枝,生成频繁项集合与非频繁项集合;
步骤S240:按照时序对所述频繁项集合进行调整,生成所述第一访问基线行为序列;
步骤S250:按照时序对所述非频繁项集合进行调整,生成所述离散访问行为序列。
具体而言,采集所述第一用户的所述第一访问日志数据,由于所述第一访问日志数据包含的数据量过大,为提高后续数据分析效率,确定所述第一访问日志数据中进行异常行为识别的有效特征,对相关联信息进行提取,例如,发起请求方、请求类型、被请求方、请求时间、请求内容等,分别将其作为所述第一请求项、所述第二请求项直至所述第i请求项,基于时序性对其进行顺序性排列,生成一条访问行为序列,通过对所述第一访问日志数据基于上述清洗模式进行数据处理,将获取的多条访问行为序列作为所述第一访问行为序列。
进一步的,确定单项请求项进行频繁项判定的频率临界值,作为所述一频繁项阈值,将关联的两项请求项进行频繁项判定的频率临界值作为所述二项频繁项阈值,直至获取所述k频繁项阈值,基于所述一项频繁项阈值、所述二项频繁项阈值直至所述k项频繁项阈值分别对所述第一访问行为序列进行的多个请求项的多层级阈值判定,通过进行逐层阈值判定,对不小于阈值频率的频繁项进行剪枝,添加进所述非频繁项集合,将大于等于阈值的添加进所述频繁项集合,基于时序对所述频繁项集合进行整合,其中可能存在多条行为序列,一条行为序列可能存在多层级子序列,为单项或多项,进行汇总整合生成所述第一访问基线行为序列;同理,对所述非频繁项集合进行整合,生成所述离散访问行为序列,通过进行所述第一访问行为序列的多层级划分,可有效提高数据划分的精准度,避免异常信息造成最终的信息处理偏差。
按照时序对所述非频繁项集合,生成所述离散访问行为序列
进一步而言,所述根据所述一频繁项阈值、所述二频繁项阈值直到所述k频繁项阈值对所述第一请求项、所述第二请求项直到所述第i请求项进行多层级频繁项剪枝,生成频繁项集合与非频繁项集合,本申请步骤S230还包括:
步骤S231:根据所述一频繁项阈值遍历所述第一请求项、所述第二请求项直到所述第i请求项进行非频繁项剪枝,生成一项频繁集与一项非频繁集;
步骤S232:根据所述二频繁项阈值遍历所述一项频繁集进行非频繁项剪枝,生成二项频繁集与二项非频繁集;
步骤S233:根据所述k频繁项阈值遍历k-1项频繁项集进行非频繁项剪枝,生成k项频繁集与k项非频繁集;
步骤S234:将所述一项频繁集、所述二项频繁集直到所述k项频繁集,添加进所述频繁项集合;
步骤S235:将所述一项非频繁集、所述二项非频繁集直到所述k项非频繁集,添加进所述非频繁项集合。
具体而言,所述一频繁项阈值为进行单项请求项判定的频率临界值,基于所述一频繁项阈值对所述第一请求项、所述第二请求项直至所述第i请求项分别进行阈值判定,对不满足所述一频繁项阈值的单项请求项进行剪枝作为所述一项非频繁集,将其余请求项作为所述一项频繁集,所述一项频繁项可能为单项或多项;进一步基于所述二频繁项阈值对所述一项频繁集进行进一步判定,对所述一项频繁集进行双关联频繁项阈值判定,将所述一项频繁项中不满足所述二频繁项阈值的双关联频繁项进行剪枝,作为所述二项非频繁集,将其余作为所述二项频繁集,基于上述频繁项分析剪枝原理,重复多次,直至完成所述k频繁项阈值的判定,遍历所述k-1项频繁项确定所述k项频繁集与所述k项非频繁集,进一步将所述一项频繁集、所述二项频繁集直至所述k项频繁集添加进所述频繁项集合,将所述一项非频繁集、所述二项非频繁集直至所述k项非频繁集添加进所述非频繁项集合,进行频繁项判定过程中,由于某个行为虽然单独是无害的,多项关联可能有害,需进行多项判断,通过进行多层级频繁项分析,完成对单项频繁项、多项关联频繁项的多重判定,以保障最终确定的所述频繁项集合的准确性与信息完备性。
进一步而言,所述据所述一频繁项阈值遍历所述第一请求项、所述第二请求项直到所述第i请求项进行非频繁项剪枝,生成一项频繁集与一项非频繁集,本申请步骤S231还包括:
步骤S2311:根据所述第一请求项、所述第二请求项直到所述第i请求项,获取第一出现频率、第二出现频率直到第i出现频率;
步骤S2312:将所述第一出现频率、所述第二出现频率直到所述第i出现频率小于所述一频繁项阈值的所述第一请求项、所述第二请求项直到所述第i请求项,添加进所述一项非频繁集;
步骤S2313:将所述一项非频繁集从所述第一请求项、所述第二请求项直到所述第i请求项中筛除,生成所述一项频繁集。
具体而言,获取所述一频繁项阈值,即进行单项请求项出现频率判定的临界值,例如10次,基于所述第一访问请求序列对所述第一请求项、所述第二请求项直至所述第i请求项进行出现频次汇总,确定所述第一出现频率、所述第二出现频率直至所述第i出现频率,进一步基于所述一频繁项阈值进行频率判定,当出现频率小于所述一频繁项阈值时,将对应的请求项判定为非频繁项,对所述第一出现频率、所述第二出现频率直至所述第i出现频率中小于所述一频繁项阈值的请求项添加进所述一项非频繁集中,所述非频繁集为偶然性行为信息,不具有行为代表性,将所述一项非频繁集从所述第一请求项、所述第二请求项直至所述第i请求项中进行剔除,将其余请求项作为所述一项频繁集,其中,所述一项频繁集为将一个或多个单项非频繁项减去后所得,可能为单项或多项,通过进行多层级非频繁项的判定剪枝,确定所述频繁项集合。
步骤S300:判断所述离散访问行为序列是否属于可靠性行为序列;
步骤S400:若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
具体而言,对所述离散访问行为序列进行二次判定,确定所述第一用户的用户部门信息与用户岗位信息,以此为基准进行同类型用户访问信息提取,确定多组访问行为序列,将其作为参考信息,对所述离散访问行为序列中各个序列分别进行集中值与离散值评估,通过对各个行为序列进行集中值与离散值的综合评定,进一步设定集中值阈值与离散值阈值,其中,所述离散访问行为序列中各个序列分别对应一集中值评价结果与离散值评价结果,进一步设定集中值阈值与离散值阈值,即序列可靠性判定的判据临界值,对所述离散访问行为序列分别进行阈值判定,当上述判据皆满足时,即大于等于集中值阈值,小于离散值阈值,将该序列判定为可靠性行为序列,进一步将所述离散访问行为序列中的可靠性行为序列与所述第一访问基线行为序列进行汇总整合,生成所述第二访问基线行为序列,所述第二访问行为序列为所述第一用户的有效行为序列,对其进行精准识别判定可有效提高后续第一用户数据分析的准确度。
进一步而言,所述判断所述离散访问行为序列是否属于可靠性行为序列,本申请步骤S300还包括:
步骤S310:根据所述第一用户,获取用户部门信息和用户岗位信息;
步骤S320:根据所述用户部门信息和所述用户岗位信息,采集第二用户的第二访问行为序列、第三用户的第三访问行为序列直到第N用户的第N访问行为序列;
步骤S330:基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行集中值评价,生成集中值评价结果;
步骤S340:基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行离散值评估,生成离散值评价结果;
步骤S350:根据所述集中值评价结果和所述离散值评价结果,判断所述离散访问行为序列是否属于所述可靠性行为序列。
进一步而言,所述根据所述集中值评价结果和所述离散值评价结果,判断所述离散访问行为序列是否属于可靠性行为序列,本申请步骤S350还包括:
步骤S351:当所述集中值评价结果大于或等于集中值阈值,且所述离散值评价结果小于或等于离散值阈值,将所述离散访问行为序列添加进所述可靠性行为序列。
具体而言,对所述离散访问行为序列进行进一步判定,确定是否存在行为普适性,可通过大数据调研进行综合评定,对所述第一用户所在的部门信息与岗位信息进行采集,以此为基准对同部门、同岗位的用户进行调研,获取所述第二用户的第二访问行为序列、所述第三用户的第三访问行为序列直至所述第N用户的第N访问行为序列,以保障采集的调研分析信息与所述第一用户的适配性,进一步对所述第二访问行为序列、所述第三访问行为序列直至所述第N访问行为序列。
遍历所述第一用户的离散访问行为序列,提取所述离散访问行为序列中任一行为序列,分别于所述第二访问行为序列、所述第三访问行为序列直至所述第N访问行为序列进行出现频率识别,获取多个频率识别结果并进行均值计算,将均值计算结果作为该离散行为序列的集中值评价结果,分别对所述离散访问行为序列中各个序列分别进行集中值分析,将分析结果添加进所述集中值评价结果在中;确定所述离散访问行为序列中任一序列在在多个用户中的出现频率,设定预设频率值,即进行行为存在性判定的频率临界值,若频率过小可适当进行忽略,对小于所述预设频率值的用户进行总用户占比计算,生成所述离散值评价结果,即若该行为只出现在少数用户身上,表明离散值越高,行为异常可能性越大,对所述离散访问行为序列中各个序列分别进行离散值分析,将分析结果添加进所述离散值评价结果。
进一步的,设定所述集中值阈值与所述离散值阈值,即进行行为可靠性判定的判据临界值,当所述离散访问行为序列中各个序列对应的所述集中值评价结果大于等于所述集中值阈值,所述离散值评价结果小于等于所述离散值阈值,上述条件同时满足,将对应的离散访问行为序列判定为可靠性行为序列,通过对所述离散值访问行为序列基于数据调研进行二次判定,以提高所述第一用户的行为判定精准度。
步骤S500:根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
步骤S600:获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
步骤S700:将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
具体而言,通过对所述第一用户的访问日志数据进行数据处理与划分,生成所述第二访问基线行为序列,即所述第一用户的可靠性行为汇总,基于预定时间周期对所述第一用户的访问日志数据集合进行采集,基于所述第二访问基线行为序列对所述访问日志数据集合进行数据识别,确定可靠性数据进行标识,将标识结果作为样本数据,基于长短时记忆神经网络构建所述第一用户行为异常检测模型构架,将所述样本数据输入其中进行模型训练,获取构建完成的所述第一用户行为异常检测模型,通过构建辅助性数据检测工具,可有效提高数据分析效率与分析准确度。
进一步的,对所述第一用户进行所述第二访问日志数据采集,即待进行分析检测的日志数据,将所述第二访问日志数据输入所述第一用户行为异常检测模型中,基于数据识别层对所述第二访问日志数据进行数据模式化识别判定,将判定结果输入所述分析输出层中,所述分析输出层包括多个判定节点,包括单项请求项与多请求项,将其传输至对应的判定节点中进行数据分析标识,将数据标识结果作为输出数据进行模型输出,获取所述第一用户异常访问行为识别结果,进一步将所述第一用户异常访问行为识别结果发送至所述协同办公平台中,即办公管理的总控平台,基于所述协同办公平台进行访问数据的存储与管理,以实现用户访问数据的智能化识别管控。
进一步而言,如图3所示,所述根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型,本申请步骤S500还包括:
步骤S510:根据所述协同办公平台、所述用户部门信息和所述用户岗位信息,采集用户访问日志数据集合;
步骤S520:根据所述第二访问基线行为序列对所述用户访问日志数据集合进行可靠性标识,生成可靠访问日志标识信息和非可靠访问日志标识信息;
步骤S530:根据所述用户访问日志数据、所述可靠访问日志标识信息和所述非可靠访问日志标识信息,基于长短时记忆神经网络进行有监督训练,生成所述第一用户行为异常检测模型。
具体而言,设定预定时间周期,基于所述预定时间周期,依据所述协同办公平台、所述用户部门信息与所述用户岗位信息对所述第一用户进行访问日志数据采集,生成所述用户访问日志数据集合,将所述第二访问基线行为序列作为数据判定依据,对所述用户访问日志数据集合进行行为序列识别,将与其相适配的数据进行可靠性标识,便于进行数据识别区分,生成所述可靠访问日志标识信息与所述非可靠访问日志标识信息,进一步将所述用户访问日志数据、所述可靠访问日志数据与所述非可靠访问日志数据作为样本数据,由于进行后步行为异常判定时需考虑上步判定结果,基于长短时记忆神经网络构建模型架构,将样本数据输入其中,通过进行监督训练生成所述第一用户行为异常检测模型,优选的,可进行样本数据划分,以进行模型的训练与验证,保障模型的输出精度达到预定标准,示例性的,所述第一用户行为异常检测模型可以是多层级网络层,将多个请求项作为一级节点,将可靠性标识结果作为二级节点,构建数据识别层、分析输出层,完成所述第一用户行为异常检测模型的构建,所述第一用户行为异常检测模型为进行用户访问数据检测的辅助性工具,可有效保障数据检测的客观性与准确性。
本申请实施例提供的一种基于人工智能分析的信息处理方法,具有如下技术效果:
1、根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;判断所述离散访问行为序列是否属于可靠性行为序列;若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端,解决了现有技术中由于传统的数据处理方式智能度不足,对于异常用户行为的检出率较低,存在一定的安全性风险的技术问题。
2、通过对用户进行行为序列进行多层级频繁项挖掘挖掘,得到较为可靠的访问行为序列,基于此构建识别用户异常行为的智能化模型,得以智能化识别用户的异常行为,智能化程度高,且基于每个用户个性化检测,异常行为检出效率较高,极大的保障了协同办公平台的安全性。
实施例二
基于与前述实施例中一种基于人工智能分析的信息处理方法相同的发明构思,如图4所示,本申请提供了一种基于人工智能分析的信息处理系统,所述系统包括:
数据采集模块11,所述数据采集模块11用于根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
序列生成模块12,所述序列生成模块12用于遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
序列判断模块13,所述序列判断模块13用于判断所述离散访问行为序列是否属于可靠性行为序列;
序列添加模块14,所述序列添加模块14用于若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
模型构建模块15,所述模型构建模块15用于根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
结果输出模块16,所述结果输出模块16用于获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
结果发送模块17,所述结果发送模块17用于将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
进一步而言,所述系统还包括:
数据清洗模块,所述数据清洗模块用于对所述第一访问日志数据进行模式化清洗,生成第一访问行为序列,其中,所述第一访问行为序列具有第一请求项、第二请求项直到第i请求项;
阈值构建模块,所述阈值构建模块用于构建一频繁项阈值、二频繁项阈值直到k频繁项阈值;
频繁项剪枝模块,所述频繁项剪枝模块用于根据所述一频繁项阈值、所述二频繁项阈值直到所述k频繁项阈值对所述第一请求项、所述第二请求项直到所述第i请求项进行多层级频繁项剪枝,生成频繁项集合与非频繁项集合;
频繁项调整模块,所述频繁项调整模块用于按照时序对所述频繁项集合进行调整,生成所述第一访问基线行为序列;
离散序列生成模块,所述离散序列生成模块用于按照时序对所述非频繁项集合进行调整,生成所述离散访问行为序列。
进一步而言,所述系统还包括:
一项数据生成模块,所述一项数据生成模块用于根据所述一频繁项阈值遍历所述第一请求项、所述第二请求项直到所述第i请求项进行非频繁项剪枝,生成一项频繁集与一项非频繁集;
二项数据生成模块,所述二项数据生成模块用于根据所述二频繁项阈值遍历所述一项频繁集进行非频繁项剪枝,生成二项频繁集与二项非频繁集;
k项数据生成模块,所述k项数据生成模块用于根据所述k频繁项阈值遍历k-1项频繁项集进行非频繁项剪枝,生成k项频繁集与k项非频繁集;
频繁集添加模块,所述频繁集添加模块用于将所述一项频繁集、所述二项频繁集直到所述k项频繁集,添加进所述频繁项集合;
非频繁集添加模块,所述非频繁集添加模块用于将所述一项非频繁集、所述二项非频繁集直到所述k项非频繁集,添加进所述非频繁项集合。
进一步而言,所述系统还包括:
频率获取模块,所述频率获取模块用于根据所述第一请求项、所述第二请求项直到所述第i请求项,获取第一出现频率、第二出现频率直到第i出现频率;
请求项添加模块,所述请求项添加模块用于将所述第一出现频率、所述第二出现频率直到所述第i出现频率小于所述一频繁项阈值的所述第一请求项、所述第二请求项直到所述第i请求项,添加进所述一项非频繁集;
频繁集生成模块,所述频繁集生成模块用于将所述一项非频繁集从所述第一请求项、所述第二请求项直到所述第i请求项中筛除,生成所述一项频繁集。
进一步而言,所述系统还包括:
信息获取模块,所述信息获取模块用于根据所述第一用户,获取用户部门信息和用户岗位信息;
序列采集模块,所述序列采集模块用于根据所述用户部门信息和所述用户岗位信息,采集第二用户的第二访问行为序列、第三用户的第三访问行为序列直到第N用户的第N访问行为序列;
集中值评价模块,所述集中值评价模块用于基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行集中值评价,生成集中值评价结果;
离散值评价模块,所述离散值评价模块用于基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行离散值评估,生成离散值评价结果;
可靠性判断模块,所述可靠性判断模块用于根据所述集中值评价结果和所述离散值评价结果,判断所述离散访问行为序列是否属于所述可靠性行为序列。
进一步而言,所述系统还包括:
离散序列添加模块,所述离散序列添加模块用于当所述集中值评价结果大于或等于集中值阈值,且所述离散值评价结果小于或等于离散值阈值,将所述离散访问行为序列添加进所述可靠性行为序列。
进一步而言,所述系统还包括:
日志数据采集模块,所述日志数据采集模块用于根据所述协同办公平台、所述用户部门信息和所述用户岗位信息,采集用户访问日志数据集合;
数据标识模块,所述数据标识模块用于根据所述第二访问基线行为序列对所述用户访问日志数据集合进行可靠性标识,生成可靠访问日志标识信息和非可靠访问日志标识信息;
模型生成模块,所述模型生成模块用于根据所述用户访问日志数据、所述可靠访问日志标识信息和所述非可靠访问日志标识信息,基于长短时记忆神经网络进行有监督训练,生成所述第一用户行为异常检测模型。
本说明书通过前述对一种基于人工智能分析的信息处理方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于人工智能分析的信息处理方法及系统,对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于人工智能分析的信息处理方法,其特征在于,应用于协同办公平台,包括:
根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
判断所述离散访问行为序列是否属于可靠性行为序列;
若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
2.如权利要求1所述的方法,其特征在于,所述遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列,包括:
对所述第一访问日志数据进行模式化清洗,生成第一访问行为序列,其中,所述第一访问行为序列具有第一请求项、第二请求项直到第i请求项;
构建一频繁项阈值、二频繁项阈值直到k频繁项阈值;
根据所述一频繁项阈值、所述二频繁项阈值直到所述k频繁项阈值对所述第一请求项、所述第二请求项直到所述第i请求项进行多层级频繁项剪枝,生成频繁项集合与非频繁项集合;
按照时序对所述频繁项集合进行调整,生成所述第一访问基线行为序列;
按照时序对所述非频繁项集合进行调整,生成所述离散访问行为序列。
3.如权利要求2所述的方法,其特征在于,所述根据所述一频繁项阈值、所述二频繁项阈值直到所述k频繁项阈值对所述第一请求项、所述第二请求项直到所述第i请求项进行多层级频繁项剪枝,生成频繁项集合与非频繁项集合,包括:
根据所述一频繁项阈值遍历所述第一请求项、所述第二请求项直到所述第i请求项进行非频繁项剪枝,生成一项频繁集与一项非频繁集;
根据所述二频繁项阈值遍历所述一项频繁集进行非频繁项剪枝,生成二项频繁集与二项非频繁集;
根据所述k频繁项阈值遍历k-1项频繁项集进行非频繁项剪枝,生成k项频繁集与k项非频繁集;
将所述一项频繁集、所述二项频繁集直到所述k项频繁集,添加进所述频繁项集合;
将所述一项非频繁集、所述二项非频繁集直到所述k项非频繁集,添加进所述非频繁项集合。
4.如权利要求3所述的方法,其特征在于,所述据所述一频繁项阈值遍历所述第一请求项、所述第二请求项直到所述第i请求项进行非频繁项剪枝,生成一项频繁集与一项非频繁集,包括:
根据所述第一请求项、所述第二请求项直到所述第i请求项,获取第一出现频率、第二出现频率直到第i出现频率;
将所述第一出现频率、所述第二出现频率直到所述第i出现频率小于所述一频繁项阈值的所述第一请求项、所述第二请求项直到所述第i请求项,添加进所述一项非频繁集;
将所述一项非频繁集从所述第一请求项、所述第二请求项直到所述第i请求项中筛除,生成所述一项频繁集。
5.如权利要求1所述的方法,其特征在于,所述判断所述离散访问行为序列是否属于可靠性行为序列,包括:
根据所述第一用户,获取用户部门信息和用户岗位信息;
根据所述用户部门信息和所述用户岗位信息,采集第二用户的第二访问行为序列、第三用户的第三访问行为序列直到第N用户的第N访问行为序列;
基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行集中值评价,生成集中值评价结果;
基于所述第二访问行为序列、所述第三访问行为序列直到所述第N访问行为序列,遍历所述离散访问行为序列进行离散值评估,生成离散值评价结果;
根据所述集中值评价结果和所述离散值评价结果,判断所述离散访问行为序列是否属于所述可靠性行为序列。
6.如权利要求5所述的方法,其特征在于,所述根据所述集中值评价结果和所述离散值评价结果,判断所述离散访问行为序列是否属于可靠性行为序列,包括:
当所述集中值评价结果大于或等于集中值阈值,且所述离散值评价结果小于或等于离散值阈值,将所述离散访问行为序列添加进所述可靠性行为序列。
7.如权利要求1所述的方法,其特征在于,所述根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型,包括:
根据所述协同办公平台、所述用户部门信息和所述用户岗位信息,采集用户访问日志数据集合;
根据所述第二访问基线行为序列对所述用户访问日志数据集合进行可靠性标识,生成可靠访问日志标识信息和非可靠访问日志标识信息;
根据所述用户访问日志数据、所述可靠访问日志标识信息和所述非可靠访问日志标识信息,基于长短时记忆神经网络进行有监督训练,生成所述第一用户行为异常检测模型。
8.一种基于人工智能分析的信息处理系统,其特征在于,所述系统包括:
数据采集模块,所述数据采集模块用于根据协同办公平台,采集第一时间粒度内第一用户的第一访问日志数据;
序列生成模块,所述序列生成模块用于遍历所述第一访问日志数据进行频繁项挖掘,生成第一访问基线行为序列和离散访问行为序列;
序列判断模块,所述序列判断模块用于判断所述离散访问行为序列是否属于可靠性行为序列;
序列添加模块,所述序列添加模块用于若属于,将所述离散访问行为序列添加进所述第一访问基线行为序列,生成第二访问基线行为序列;
模型构建模块,所述模型构建模块用于根据所述第二访问基线行为序列,基于长短时记忆神经网络,构建第一用户行为异常检测模型;
结果输出模块,所述结果输出模块用于获取所述第一用户的第二访问日志数据输入所述第一用户行为异常检测模型,输出第一用户异常访问行为识别结果;
结果发送模块,所述结果发送模块用于将所述第一用户异常访问行为识别结果发送至协同办公平台后台管理端。
CN202211433623.9A 2022-11-16 2022-11-16 一种基于人工智能分析的信息处理方法及系统 Active CN115906160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211433623.9A CN115906160B (zh) 2022-11-16 2022-11-16 一种基于人工智能分析的信息处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211433623.9A CN115906160B (zh) 2022-11-16 2022-11-16 一种基于人工智能分析的信息处理方法及系统

Publications (2)

Publication Number Publication Date
CN115906160A true CN115906160A (zh) 2023-04-04
CN115906160B CN115906160B (zh) 2023-07-18

Family

ID=86487331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211433623.9A Active CN115906160B (zh) 2022-11-16 2022-11-16 一种基于人工智能分析的信息处理方法及系统

Country Status (1)

Country Link
CN (1) CN115906160B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644484A (zh) * 2023-07-20 2023-08-25 江苏华存电子科技有限公司 一种计算机存储安全评估方法及系统
CN117439826A (zh) * 2023-12-21 2024-01-23 江苏禾冠信息技术有限公司 基于多模态验证的网络安全识别方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298914B1 (en) * 2013-12-03 2016-03-29 Symantec Corporation Enterprise data access anomaly detection and flow tracking
CN105681312B (zh) * 2016-01-28 2019-03-05 李青山 一种基于频繁项集挖掘的移动互联网异常用户检测方法
CN108334646A (zh) * 2018-04-11 2018-07-27 焦点科技股份有限公司 一种基于频繁浏览序列的网站结构优化方法
CN112804196A (zh) * 2020-12-25 2021-05-14 北京明朝万达科技股份有限公司 日志数据的处理方法及装置
CN113259398B (zh) * 2021-07-07 2021-10-15 杭州大乘智能科技有限公司 一种基于邮件日志数据的账号安全检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644484A (zh) * 2023-07-20 2023-08-25 江苏华存电子科技有限公司 一种计算机存储安全评估方法及系统
CN116644484B (zh) * 2023-07-20 2023-12-22 江苏华存电子科技有限公司 一种计算机存储安全评估方法及系统
CN117439826A (zh) * 2023-12-21 2024-01-23 江苏禾冠信息技术有限公司 基于多模态验证的网络安全识别方法及系统
CN117439826B (zh) * 2023-12-21 2024-03-01 江苏禾冠信息技术有限公司 基于多模态验证的网络安全识别方法及系统

Also Published As

Publication number Publication date
CN115906160B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN115906160A (zh) 一种基于人工智能分析的信息处理方法及系统
CN108763319B (zh) 融合用户行为和文本信息的社交机器人检测方法和系统
CN107992968B (zh) 基于集成时间序列分析技术的电能表计量误差预测方法
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN111898831B (zh) 一种实时洪水概率预报实用化方法
CN112367273B (zh) 基于知识蒸馏的深度神经网络模型的流量分类方法及装置
CN115330268B (zh) 一种应对矿山灾难的综合性应急指挥方法及系统
WO2021098384A1 (zh) 一种数据异常检测方法及装置
CN116112292B (zh) 基于网络流量大数据的异常行为检测方法、系统和介质
CN113328867B (zh) 一种基于区块链的会议纪要存储系统
CN110011990A (zh) 内网安全威胁智能分析方法
CN116976318A (zh) 基于深度学习和模型推理的电网倒闸操作票智能审核系统
CN110175696B (zh) 一种基于多元回归的渔港船舶进出港动态预测方法及系统
WO2018036402A1 (zh) 模型中关键变量的探测方法及装置
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
CN113538063A (zh) 基于决策树的电费异常数据分析方法、装置、设备及介质
CN116126807A (zh) 一种日志分析方法及相关装置
CN116170200A (zh) 电力监控系统时间序列异常检测方法、系统、设备及存储介质
CN113572792A (zh) 一种基于物联网的工程测量智慧管理平台
CN116993307B (zh) 一种具有人工智能学习能力的协同办公方法及系统
CN111654853A (zh) 一种基于用户信息的数据分析方法
CN117540372B (zh) 智能学习的数据库入侵检测与响应系统
CN116861204B (zh) 基于数字孪生的智能制造设备数据管理系统
CN117057777A (zh) 一种配电网运维综合管理方法
CN116796894A (zh) 一种高效深度学习气象预测模型的构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant