CN113157540A - 一种用户行为分析方法和系统 - Google Patents
一种用户行为分析方法和系统 Download PDFInfo
- Publication number
- CN113157540A CN113157540A CN202110348169.6A CN202110348169A CN113157540A CN 113157540 A CN113157540 A CN 113157540A CN 202110348169 A CN202110348169 A CN 202110348169A CN 113157540 A CN113157540 A CN 113157540A
- Authority
- CN
- China
- Prior art keywords
- data
- entries
- user behavior
- behavior
- domain name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 51
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims description 99
- 238000007405 data analysis Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提出了一种用户行为分析方法和系统。所述用户行为分析方法,包括以下步骤:从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;通过该HTML文件建立对应的平台词条;根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。本发明的用户行为分析方法和系统设计新颖,实用性强。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种用户行为分析方法和系统。
背景技术
随着互联网的发展,我国网民数量逐年增加,从移动日志中对用户行为进行分析,有助于研究分析市场,对相关产品进行进一步定位和开发,从而能更好地为用户提供服务。
现有的一种分析技术,如基于logistic回归统计的机器学习,需要对数据进行数据变换等清洗操作,利用密度图、散点图等方法建立一定规律,再对数据进行多重共性检验,最终建立对应的行为分析模型。这种方法会损失大量日志数据,对最终的行为分析结果会产生较大的偏差。
发明内容
本发明针对上述技术问题,提出了一种用户行为分析方法和系统。
本发明提出以下技术方案:
本发明提出了一种用户行为分析方法,包括以下步骤:
步骤S1、从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;通过该HTML文件建立对应的平台词条;
步骤S2、根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
步骤S3、整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
本发明上述的用户行为分析方法中,步骤S1还包括:过滤网络日志中的无效数据,并将其中有效重点数据进行拆分并分别保存。
本发明上述的用户行为分析方法中,有效重点数据包括URI数据和端口协议。
本发明上述的用户行为分析方法中,步骤S2还包括:
利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
本发明提出了一种用户行为分析系统,包括:
数据接入模块,用于获取网络日志;
数据分析模块,用于从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;并通过该HTML文件建立对应的平台词条;
数据分析模块,还用于根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
数据分析模块,还用于整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
本发明上述的用户行为分析系统中,数据分析模块,还用于过滤网络日志中的无效数据,并将其中有效重点数据进行拆分;
用户行为分析系统还包括:
数据存储模块,用于保存有效重点数据。
本发明上述的用户行为分析系统中,有效重点数据包括URI数据和端口协议。
本发明上述的用户行为分析系统中,数据分析模块,还用于利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
本发明提出了一种用户行为分析方法及系统,利用了dpi在URL等网络协议解析上的应用,将移动日志解析提取关键词等操作,将日志数据建立起相应的行为词库,根据行为词库,对用户行为与网络日志相关联,进而分析移动日志代表的用户行为。
附图说明
下面结合附图对本发明进一步说明:
图1示出了本发明优选实施例的用户行为分析方法的流程图;
图2示出了本发明优选实施例的用户行为分析系统的功能模块图;
图3示出了图1所示的用户行为分析方法的具体项目中的主要数据结构图;
图4示出了图3所示的具体项目的网络拓扑图。
具体实施方式
本发明所要解决的技术问题为:现有的一种分析技术,如基于logistic回归统计的机器学习,需要对数据进行数据变换等清洗操作,这种方法会损失大量日志数据,对最终的行为分析结果会产生较大的偏差。本发明就解决该技术问题而提出的技术思路是:互联网中的网络请求协议具有一定的规则与意义,能够从网络抓包的日志数据中解析出各种信息,例如:主体网站域名、所在IP与服务器、所提供的服务等。利用这些所分析出的信息,根据含义相近或不同的关键词,建立相关的分析词库,便可以根据词库分析出用户在各种网络请求中的行为方式。
为了使得发明的技术方案、技术目的以及技术效果更为清楚,以使得本领域技术人员能够理解和实施本发明,下面将结合附图及具体实施例对本发明做进一步详细的描述。
如图1所示,图1示出了本发明优选实施例的用户行为分析方法的流程图。具体地,本发明提出了一种用户行为分析方法,包括以下步骤:
步骤S1、从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;并通过该HTML文件建立对应的平台词条;
在这里,网络日志是指主体运行过程中记录下来的系统日志,包括时间戳、IP数据、TCP或UDP源和目标端口或者ICMP类型和代号、描述性文本解释、匹配流量的规则号以及执行的动作。
其中,时间戳是指典型情况下包括日期以及以秒或一秒的若干分之一为单位的时间,它表示事件发生的时间或者将事件记录到网络日志中的时间。
IP数据包括源地址、目标地址和IP协议(TCP、UDP、ICMP)等。
执行的动作包括接受、丢弃或者拒绝连接。
主体域名数据包括主体的域名及其域名后缀。
进一步地,HTML的英文全称是Hyper Text Markup Language,即超文本标记语言。使用HTML,将所需要表达的信息按某种规则写成HTML文件,通过专用的浏览器来识别,并将这些HTML文件“翻译”成可以识别的信息,即通常所见到的网页。
通过定期快照,可以根据主体域名数据,获取对应的HTML文件。
进一步地,HTML文件中具有head、title、describe等标签,通过这些标签,可以建立相应的平台词条。
进一步地,步骤S1还包括:过滤网络日志中的无效数据,并将其中有效重点数据进行拆分并分别保存。
过滤无效数据的步骤,根据网络日志中请求状态、重复请求数据等相关条件进行。
有效重点数据包括URI数据和端口协议。
步骤S2、根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
在本步骤中,主体可以是网站或者APP。
DPI,即深度包检测;传统的IP数据包检测仅分析IP包的OSI L2~L4的内容,包括源地址、目的地址、源端口、目的端口以及协议类型,而DPI技术是在此基础上增加了对应用层数据的应用协议识别。
关于行为属性词条,行为属性词条包括关键词、对应的同义词以及关键词单位时间内出现的频次。
进一步地,步骤S2还包括:
利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
在这里,解码后得到的字段有时还会送入算法引擎以进行进一步解析,从而得到关键词。部分特征基于编码前的定义,尽量在避免性能损耗的情况下,对原字段进行解析。
通过所建立的平台词条、行为词条以及行为属性词条,建立字典树形的词库。在词库的构建过程中,会从前到后遍历整个字符串,检索是否已存在词条节点,若已建成,则跳过,验证下一词条,若在词库下未发现当前校验词条的节点,则需要建立一个新节点表示该词条,然后遍历其他词条。重复上述操作。
进一步地,步骤S2还包括:
将网络日志的解析结果与词库进行匹配,与平台进行关联,获取平台属性,与对应划分的二级词库中行为属性词条进行比对,若匹配则提升该行为属性词条在词库中的权重,若不匹配,则在一级词库中建立新的行为词条。
步骤S3、整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
本发明提出了一种用户行为分析方法,利用了dpi在URL等网络协议解析上的应用,将移动日志解析提取关键词等操作,将日志数据建立起相应的行为词库,根据行为词库,对用户行为与网络日志相关联,进而分析移动日志代表的用户行为。
进一步地,如图2所示,图2示出了本发明优选实施例的用户行为分析系统的功能模块图。本发明还提出了一种用户行为分析系统,包括:
数据接入模块100,用于获取网络日志;
数据分析模块200,用于从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;并通过该HTML文件建立对应的平台词条;
在这里,网络日志是指主体运行过程中记录下来的系统日志,包括时间戳、IP数据、TCP或UDP源和目标端口或者ICMP类型和代号、描述性文本解释、匹配流量的规则号以及执行的动作。
其中,时间戳是指典型情况下包括日期以及以秒或一秒的若干分之一为单位的时间,它表示事件发生的时间或者将事件记录到网络日志中的时间。
IP数据包括源地址、目标地址和IP协议(TCP、UDP、ICMP)等。
执行的动作包括接受、丢弃或者拒绝连接。
主体域名数据包括主体的域名及其域名后缀。
进一步地,HTML的英文全称是Hyper Text Markup Language,即超文本标记语言。使用HTML,将所需要表达的信息按某种规则写成HTML文件,通过专用的浏览器来识别,并将这些HTML文件“翻译”成可以识别的信息,即通常所见到的网页。
通过定期快照,可以根据主体域名数据,获取对应的HTML文件。
进一步地,HTML文件中具有head、title、describe等标签,通过这些标签,可以建立相应的平台词条。
进一步地,数据分析模块200,还用于过滤网络日志中的无效数据,并将其中有效重点数据进行拆分;
数据存储模块300,用于保存有效重点数据。
过滤无效数据的过程是根据网络日志中请求状态、重复请求数据等相关条件进行。
有效重点数据包括URI数据和端口协议。
数据分析模块200,还用于根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
在这里,主体可以是网站或者APP。
DPI,即深度包检测;传统的IP数据包检测仅分析IP包的OSI L2~L4的内容,包括源地址、目的地址、源端口、目的端口以及协议类型,而DPI技术是在此基础上增加了对应用层数据的应用协议识别。
进一步地,数据分析模块200,还用于利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
在这里,解码后得到的字段有时还会送入算法引擎以进行进一步解析,从而得到关键词。部分特征基于编码前的定义,尽量在避免性能损耗的情况下,对原字段进行解析。
通过所建立的平台词条、行为词条以及行为属性词条,建立字典树形的词库。在词库的构建过程中,会从前到后遍历整个字符串,检索是否已存在词条节点,若已建成,则跳过,验证下一词条,若在词库下未发现当前校验词条的节点,则需要建立一个新节点表示该词条,然后遍历其他词条。重复上述操作。
进一步地,数据分析模块200,还用于将网络日志的解析结果与词库进行匹配,与平台进行关联,获取平台属性,与对应划分的二级词库中行为属性词条进行比对,若匹配则提升该行为属性词条在词库中的权重,若不匹配,则在一级词库中建立新的行为词条。
数据分析模块200,还用于整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
数据统计模块400,用于对所建立的平台词条、行为词条以及行为属性词条进行统计;
可视化展示模块500,用于将所建立的平台词条、行为词条、行为属性词条以及所判断出的用户行为进行可视化展示。
用户行为分析方法是对移动流量数据的完成分析过程。在用户行为分析系统中,数据接入模块在专网接收了原始的移动日志数据后,通过数据存储模块存储在了内网数据库服务器中。同时,通过防火墙,在互联上采集了大量的数据包,并通过数据分析模型构建了数据分析模块。在存储的数据通过数据分析模块后,完成了数据的行为分析工作,进而对后面数据统计及可视化展示提供了重要数据。
其中,数据构建了行为规则表,该规则表是作为数据分析模型的核心,包含了数据分析过程中的主要数据字段,对该数据字段进行了规则定义,同时还有正负关键词、排除词等其他字段,保证数据分析的准确性,从而可以在移动日志金融行为分析中起着至关重要的作用,如图3和图4所示。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种用户行为分析方法,其特征在于,包括以下步骤:
步骤S1、从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;通过该HTML文件建立对应的平台词条;
步骤S2、根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
步骤S3、整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
2.根据权利要求1所述的用户行为分析方法,其特征在于,步骤S1还包括:过滤网络日志中的无效数据,并将其中有效重点数据进行拆分并分别保存。
3.根据权利要求2所述的用户行为分析方法,其特征在于,有效重点数据包括URI数据和端口协议。
4.根据权利要求1所述的用户行为分析方法,其特征在于,步骤S2还包括:
利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
5.一种用户行为分析系统,其特征在于,包括:
数据接入模块(100),用于获取网络日志;
数据分析模块(200),用于从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;并通过该HTML文件建立对应的平台词条;
数据分析模块(200),还用于根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;
对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;
数据分析模块(200),还用于整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。
6.根据权利要求5所述的用户行为分析系统,其特征在于,数据分析模块(200),还用于过滤网络日志中的无效数据,并将其中有效重点数据进行拆分;
用户行为分析系统还包括:
数据存储模块(300),用于保存有效重点数据。
7.根据权利要求6所述的用户行为分析系统,其特征在于,有效重点数据包括URI数据和端口协议。
8.根据权利要求5所述的用户行为分析系统,其特征在于,数据分析模块(200),还用于利用协议解析器对所述拆解后得到的数据中的URL进行解码,再将解码后得到的字段提取出来,从而得到关键词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110348169.6A CN113157540A (zh) | 2021-03-31 | 2021-03-31 | 一种用户行为分析方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110348169.6A CN113157540A (zh) | 2021-03-31 | 2021-03-31 | 一种用户行为分析方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113157540A true CN113157540A (zh) | 2021-07-23 |
Family
ID=76885736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110348169.6A Pending CN113157540A (zh) | 2021-03-31 | 2021-03-31 | 一种用户行为分析方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113157540A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103188104A (zh) * | 2011-12-31 | 2013-07-03 | 中国移动通信集团浙江有限公司 | 一种用户行为分析的方法及装置 |
CN104573021A (zh) * | 2015-01-12 | 2015-04-29 | 浪潮软件集团有限公司 | 一种针对互联网行为进行分析的方法 |
CN106940705A (zh) * | 2016-12-20 | 2017-07-11 | 上海掌门科技有限公司 | 一种用于构建用户画像的方法与设备 |
CN107832333A (zh) * | 2017-09-29 | 2018-03-23 | 北京邮电大学 | 基于分布式处理和dpi数据构建用户网络数据指纹的方法和系统 |
WO2019107646A1 (ko) * | 2017-12-01 | 2019-06-06 | 상명대학교산학협력단 | 웹 콘텐츠의 소비 행태 분석 장치 및 그 방법 |
US20200014768A1 (en) * | 2018-07-03 | 2020-01-09 | Naver Corporation | Apparatus for analysing online user behavior and method for the same |
CN111030893A (zh) * | 2019-12-31 | 2020-04-17 | 上海途鸽数据科技有限公司 | 云通讯应用场景下分析用户行为的方法和装置 |
CN112564991A (zh) * | 2019-09-10 | 2021-03-26 | 华为技术有限公司 | 应用识别方法、装置及存储介质 |
-
2021
- 2021-03-31 CN CN202110348169.6A patent/CN113157540A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103188104A (zh) * | 2011-12-31 | 2013-07-03 | 中国移动通信集团浙江有限公司 | 一种用户行为分析的方法及装置 |
CN104573021A (zh) * | 2015-01-12 | 2015-04-29 | 浪潮软件集团有限公司 | 一种针对互联网行为进行分析的方法 |
CN106940705A (zh) * | 2016-12-20 | 2017-07-11 | 上海掌门科技有限公司 | 一种用于构建用户画像的方法与设备 |
CN107832333A (zh) * | 2017-09-29 | 2018-03-23 | 北京邮电大学 | 基于分布式处理和dpi数据构建用户网络数据指纹的方法和系统 |
WO2019107646A1 (ko) * | 2017-12-01 | 2019-06-06 | 상명대학교산학협력단 | 웹 콘텐츠의 소비 행태 분석 장치 및 그 방법 |
US20200014768A1 (en) * | 2018-07-03 | 2020-01-09 | Naver Corporation | Apparatus for analysing online user behavior and method for the same |
CN112564991A (zh) * | 2019-09-10 | 2021-03-26 | 华为技术有限公司 | 应用识别方法、装置及存储介质 |
CN111030893A (zh) * | 2019-12-31 | 2020-04-17 | 上海途鸽数据科技有限公司 | 云通讯应用场景下分析用户行为的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8326817B2 (en) | Computer-implemented system and method for analyzing search queries | |
CN103544255B (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN103559235B (zh) | 一种在线社交网络恶意网页检测识别方法 | |
US8655648B2 (en) | Identifying topically-related phrases in a browsing sequence | |
CN106844640B (zh) | 一种网页数据分析处理方法 | |
CN106095979B (zh) | Url合并处理方法和装置 | |
Reddy et al. | An effective data preprocessing method for Web Usage Mining | |
WO2008014702A1 (fr) | Procédé et système d'extraction de mots nouveaux | |
CN114826671B (zh) | 一种基于指纹的分层匹配的网络资产识别方法及装置 | |
Sukumar et al. | Review on modern Data Preprocessing techniques in Web usage mining (WUM) | |
JP2002245061A (ja) | キーワード抽出 | |
CN101895517B (zh) | 一种脚本语义提取方法和提取装置 | |
KR20120003567A (ko) | 로그 관리 시스템과 이의 로그 처리방법 및 이의 로그 처리방법을 저장하는 기록매체 | |
Ali et al. | An integrated framework for web data preprocessing towards modeling user behavior | |
KR101556714B1 (ko) | 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
KR101476225B1 (ko) | 자연어 및 수식 색인화 방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체 | |
CN113157540A (zh) | 一种用户行为分析方法和系统 | |
KR101005871B1 (ko) | 대용량 웹로그마이닝 및 공격탐지를 위한 비트리인덱스벡터기반 웹로그 복구방법 | |
CN112347333A (zh) | 一种数据库的事件关联方法与审计系统 | |
KR20100027841A (ko) | 대용량 웹로그마이닝 및 공격탐지를 위한 비트리인덱스벡터기반 웹로그 고속검색방법 및 비-트리기반인덱싱로그 프로세서 | |
CN111581950A (zh) | 同义名称词的确定方法和同义名称词的知识库的建立方法 | |
JP5163379B2 (ja) | 文書群検出方法及び文書群検出装置 | |
CN116150541B (zh) | 后台系统的识别方法、装置、设备及存储介质 | |
CN112818278B (zh) | 互联网托管网站的排查方法及排查系统 | |
CN118210732B (zh) | 一种web应用敏感路径识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210723 |
|
RJ01 | Rejection of invention patent application after publication |