CN111752727A - 一种基于日志分析的数据库三层关联的识别方法 - Google Patents
一种基于日志分析的数据库三层关联的识别方法 Download PDFInfo
- Publication number
- CN111752727A CN111752727A CN202010611005.3A CN202010611005A CN111752727A CN 111752727 A CN111752727 A CN 111752727A CN 202010611005 A CN202010611005 A CN 202010611005A CN 111752727 A CN111752727 A CN 111752727A
- Authority
- CN
- China
- Prior art keywords
- log
- request
- sql
- main body
- body object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/542—Event management; Broadcasting; Multicasting; Notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于日志分析的数据库三层关联的识别方法,通过对request日志和sql日志进行筛选和处理,通过时间窗口特征获得主体对象的相关率,并结合参数相关值确定三层关联关系。本发明提供的基于日志分析的数据库三层关联的识别方法的优点在于:仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,成本较低,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高;通过参数的相关值和主体对象的相关率综合考虑关联性排序,识别结果准确。
Description
技术领域
本发明涉及数据安全技术领域,尤其涉及一种基于日志分析的数据库三层关联的识别方法。
背景技术
数据库的三层关联主要是指前台访问日志和数据库记录日志的关系。构建起有效的三层关系,可以对应用操作进行有效的溯源,可以找出数据泄露的前台页面等等。所以如何精准的识别三层关联成为数据库安全审计的重要任务;现有的技术大多数是基于HOOK技术(钩子函数)实现三层关联的识别的,即通过对系统进行改造,在访问页面的日志中留下水印,在数据库日志中也留下相关的水印,通过水印对比,识别出三层关联。使用此类方法,的确可以提高识别的精准度,但是对系统进行改造工作非常耗时,尤其是一些并发性强的系统,改造难度大,而且实现起来还对生产系统产生负面效果。
公开号为CN110990168A的发明专利申请请求公开一种三层关联信息的生成方法,其根据目标API将线程ID及对应的WEB访问数据包、数据库访问数据包和协议类型相关联,实现三层关联信息,但是其只能针对已经存在的数据查找关联,无法对新数据预测识别,而且基于ID进行关联的方式局限性较大,识别精度不高。
发明内容
本发明所要解决的技术问题在于提供一种无须对系统进行改造,基于日志分析即可精确识别三层关联关系的识别方法。
本发明是通过以下技术方案解决上述技术问题的:一种基于日志分析的数据库三层关联识别方法,包括以下步骤:
步骤1:提取总时长为t总的时间段内的前台操作日志request日志和数据库操作日志sql日志,定义表K为空表;
步骤2:基于操作请求的类别剔除无关操作请求;
步骤3:将request日志和sql日志中的参数移除,提取去参后的request日志主体对象和sql日志主体对象;
步骤4:以固定的时间间隔将时长为t总的日志数据划分为连续的时间段,统计request日志主体对象和sql日志主体对象在每个时间段的操作次数得到表T;
步骤5:计算request日志主体对象与sql日志主体对象的相关率;
步骤6:重复步骤4-5,以多种预设的时间间隔划分时间轴,获取不同时间间隔下的每一个request日志主体对象与每一个sql日志主体对象的相关率,保留相关率最大值,记录总时长t总,得到表G;
步骤7:如果表K为空表,则令表K=表G;执行步骤8,否则直接执行步骤8;
步骤8:根据表G和表K的内容更新每个request日志主体对象与每个sql日志主体对象的相关率,并将结果更新到表K中;;
步骤9:在待预测数据的request日志中,解析传递参数,提取请求内容中符合“=*”匹配的参数;在sql日志中,提取sql语句中符合“=*”匹配的参数;
步骤10:基于步骤9提取的参数,计算参数相关值;
步骤11:对每一个sql日志,按照参数相关值和相关率对request日志进行排序,取排名最高的前N个request日志主体对象作为与该sql日志主体对象可能有关系的对象;即得到数据库的三层关联。
本发明仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高。
优选的,步骤1中所述的request日志包括请求、请求内容、时间戳;sql日志包括sql语句和操作时间。
优选的,步骤2中剔除无关操作请求的方法为:对request日志,剔除掉后缀为css,js,jpg,gif,ico,png的请求;对sql操作日志,剔除掉commit记录。
优选的,步骤3中将request日志的请求的参数替换成符号?,将请求内容中的参数替换成?,将替换后的请求和请求内容合并得到request日志主体对象。
优选的,步骤3中将sql日志中的参数替换成符号?,替换后的sql语句为sql日志主体对象。
优选的,步骤4中统计每个时间段主体对象的操作次数得到表T,表T的内容如下:
T(request):request日志主体对象、第一个时间段t1的操作次数R1、第二个时间段t2的操作次数R2、······、第i个时间段ti的操作次数Ri;其中i∈[1,n],n为总的时间段数;
T(sql):sql日志主体对象,第一个时间段t1的操作次数S1、第二个时间段t2的操作次数S2、······、第i个时间段ti的操作次数Si。
优选的,步骤5所述的计算相关率η的方法为:
步骤6中预设的时间间隔分别为3s、5s和7s,分别计算获得不同时间间隔下request日志主体对象和sql日志主体对象的相关率。
优选的,步骤8所述的更新相关率η的方法为:
其中,ηK表示表K中的相关率,ηG表示表G中的相关率;Kt和Gt分别表示表K总时长和表G的总时长。
优选的,步骤10所述的相关值为request参数集合中与sql参数集合相同的参数数量。
本发明提供的基于日志分析的数据库三层关联的识别方法的优点在于:仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,成本较低,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高;通过参数的相关值和主体对象的相关率综合考虑关联性排序,识别结果准确。
附图说明
图1为本发明的实施例提供的基于日志分析的数据库三层关联的识别方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
如图1所示,本实施例提供了一种基于日志分析的数据库三层关联的识别方法,包括以下步骤:
步骤1:提取总时长为t总的时间段内的前台操作日志request日志和数据库操作日志sql日志,定义表K为空表;
所述的request日志包括请求、请求内容、时间戳;sql日志包括sql语句和操作时间。
本实施例提取日志为:
request日志(id,request,request-body,time)
1,http://192.168.0.1:8888/login?user=james&pwd=123456,,2020年6月9日14:51:18
2,http://192.168.0.1:8888/login?user=kobe&pwd=123456,,2020年6月9日14:51:22
3,http://192.168.0.1:8888/login?user=kobe&pwd=123456,edituser=true,2020年6月9日14:51:24
sql日志(id,sql,时间)
1,select*from user where user='james'and pwd='123456',2020年6月9日14:51:18
2,select*from user where user='kobe'and pwd='123456',2020年6月9日14:51:22
3,update user where user='kobe'and pwd='123456',2020年6月9日14:51:24
步骤2:基于操作请求的类别剔除无关操作请求;
具体的无关操作请求的定义根据数据库和用户的不同进行定义,本实施例中对于request日志,剔除掉后缀为css,js,jpg,gif,ico,png的请求;对sql操作日志,剔除掉commit(提交)记录。
步骤3:将request日志和sql日志中的参数移除,提取去参后的request日志主体对象和sql日志主体对象;
移除参数的方法为:将request日志的请求的参数替换成符号?,将请求内容中的参数替换成?,将替换后的请求和请求内容合并得到request日志主体对象;将sql日志中的参数替换成符号?,sql日志中的参数表现形式为“=‘字符’”或者“=数字”,将这两种表现形式均替换为“=?”;替换后的sql语句即为sql日志主体对象。
本实施例中以将参数替换为符号?来进行说明,实际使用中可替换为任意符号,但request日志和sql日志替换所用的符号需要分别统一;
对提取的request日志进行去参,其中1、2条日志对应的主体对象为:
http://192.168.0.1:8888/login?user=?&pwd=?
第3条日志对应的主体对象为:
http://192.168.0.1:8888/login?user=?&pwd=?edituser=?
对sql日志进行去参,其中1、2条日志对应的主体对象为:
select*from user where user=?and pwd=?
第3条日志对应的主体对象为:
update user where user=?and pwd=?
步骤4:以固定的时间间隔将时长为t总的日志数据划分为连续的时间段,记录每个request日志主体对象和每个sql日志主体对象在每个时间段的操作次数,统计得到表T,内容如下:
T(request):request日志主体对象、第一个时间段t1的操作次数R1、第二个时间段t2的操作次数R2、······、第i个时间段ti的操作次数Ri;其中i∈[1,n],n为总的时间段数;
T(sql):sql日志主体对象,第一个时间段t1的操作次数S1、第二个时间段t2的操作次数S2、······、第i个时间段ti的操作次数Si。
本实施例总共提取了200s的日志数据,上面展示的三条request日志和sql日志为前3s的日志数据,在以3s为时间间隔划分所有日志数据的情况下,本实施例得到的表T内容如下:
步骤5:计算request日志主体对象与sql日志主体对象的相关率η;
步骤6:重复步骤4-5,以多种预设的时间间隔划分时间轴,获取不同时间间隔下的每一个request日志主体对象与每一个sql日志主体对象的相关率,保留相关率最大值,记录总时长t总,得到表G;本实施例中预设的时间间隔分别取3s、5s和7s;在使用本实施例提供的方法时可根据需要设置时长;最终得到的表G是一个表征request日志主体对象和sql日志主体对象相关率的二维表格;本实施例以200s的数据得到的表G如下:
在总时长不同的情况下,相关率一般会发生变化,因此在确定三层关联时需要考虑数据的时长。
步骤7:如果表K为空表,则令表K=表G;执行步骤8,否则直接执行步骤8;
步骤8:根据表G和表K的内容更新每个request日志主体对象与每个sql日志主体对象的相关率,并将结果更新到表K中;更新相关率η的方法为:
其中,ηK表示表K中的相关率,ηG表示表G中的相关率;Kt和Gt分别表示表K的总时长和表G的总时长。
由此可以确定表K能够用来表征request日志主体对象与sql日志主体对象的三层关联,在得到表K后即可对其他数据进行三层关联的识别,其中包括对新的日志数据进行三层关联的预测。
步骤9:在待预测数据的request日志中,解析传递参数,提取请求内容中符合“=*”匹配的参数;在sql日志中,提取sql语句中符合“=*”匹配的参数;其中*表示通配符。
本实施例提取的参数如下:
request日志(id,request,参数列表)
1,http://192.168.0.1:8888/login?user=james&pwd=123456,['james','123456']
2,http://192.168.0.1:8888/login?user=kobe&pwd=123456,['kobe','123456']
3,http://192.168.0.1:8888/login?user=kobe&pwd=123456,edituser=true,['kobe','123456',true]
sql日志(id,request,参数列表)
1,select*from user where user='james'and pwd='123456',['james','123456']
2,select*from user where user='kobe'and pwd='123456',['kobe','123456']
3,update user where user='kobe'and pwd='123456',['kobe','123456']
步骤10:基于步骤9提取的参数,计算参数相关值;所述相关值为request参数集合中与sql参数集合相同的参数数量;
本实施例中的参数相关值如下:
步骤11:对每一个sql日志,按照参数相关值和相关率对request日志进行排序,取排名最高的前N个request日志主体对象作为与该sql日志主体对象可能有关系的对象;即得到数据库的三层关联。
对于sql日志:select*from user where user='james'and pwd='123456',['james','123456'],按照参数相关值和主体对象相关率进行排序得到的结果如下:
id,request,排序
1,http://192.168.0.1:8888/login?user=james&pwd=123456,1
2,http://192.168.0.1:8888/login?user=kobe&pwd=123456,2
3,http://192.168.0.1:8888/login?user=kobe&pwd=123456,3
由此得到该sql日志的三层关联关系。
Claims (9)
1.一种基于日志分析的数据库三层关联识别方法,其特征在于:包括以下步骤:
步骤1:提取总时长为t总的时间段内的前台操作日志request日志和数据库操作日志sql日志,定义表K为空表;
步骤2:基于操作请求的类别剔除无关操作请求;
步骤3:将request日志和sql日志中的参数移除,提取去参后的request日志主体对象和sql日志主体对象;
步骤4:以固定的时间间隔将时长为t总的日志数据划分为连续的时间段,统计request日志主体对象和sql日志主体对象在每个时间段的操作次数得到表T;
步骤5:计算request日志主体对象与sql日志主体对象的相关率;
步骤6:重复步骤4-5,以多种预设的时间间隔划分时间轴,获取不同时间间隔下的每一个request日志主体对象与每一个sql日志主体对象的相关率,保留相关率最大值,记录总时长t总,得到表G;
步骤7:如果表K为空表,则令表K=表G;执行步骤8,否则直接执行步骤8;
步骤8:根据表G和表K的内容更新每个request日志主体对象与每个sql日志主体对象的相关率,并将结果更新到表K中;;
步骤9:在待预测数据的request日志中,解析传递参数,提取请求内容中符合“=*”匹配的参数;在sql日志中,提取sql语句中符合“=*”匹配的参数;
步骤10:基于步骤9提取的参数,计算参数相关值;
步骤11:对每一个sql日志,按照参数相关值和相关率对request日志进行排序,取排名最高的前N个request日志主体对象作为与该sql日志主体对象可能有关系的对象;即得到数据库的三层关联。
2.根据权利要求1所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤1中所述的request日志包括请求、请求内容、时间戳;sql日志包括sql语句和操作时间。
3.根据权利要求2所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤2中剔除无关操作请求的方法为:对request日志,剔除掉后缀为css,js,jpg,gif,ico,png的请求;对sql操作日志,剔除掉commit记录。
4.根据权利要求1所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤3中将request日志的请求的参数替换成符号?,将请求内容中的参数替换成?,将替换后的请求和请求内容合并得到request日志主体对象。
5.根据权利要求4所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤3中将sql日志中的参数替换成符号?,替换后的sql语句为sql日志主体对象。
6.根据权利要求1所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤4中统计每个时间段主体对象的操作次数得到表T,表T的内容如下:
T(request):request日志主体对象、第一个时间段t1的操作次数R1、第二个时间段t2的操作次数R2、······、第i个时间段ti的操作次数Ri;其中i∈[1,n],n为总的时间段数;
T(sql):sql日志主体对象,第一个时间段t1的操作次数S1、第二个时间段t2的操作次数S2、······、第i个时间段ti的操作次数Si。
9.根据权利要求1所述的一种基于日志分析的数据库三层关联识别方法,其特征在于:步骤10所述的相关值为request参数集合中与sql参数集合相同的参数数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611005.3A CN111752727B (zh) | 2020-06-30 | 2020-06-30 | 一种基于日志分析的数据库三层关联的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611005.3A CN111752727B (zh) | 2020-06-30 | 2020-06-30 | 一种基于日志分析的数据库三层关联的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111752727A true CN111752727A (zh) | 2020-10-09 |
CN111752727B CN111752727B (zh) | 2023-06-20 |
Family
ID=72678299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010611005.3A Active CN111752727B (zh) | 2020-06-30 | 2020-06-30 | 一种基于日志分析的数据库三层关联的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111752727B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113902015A (zh) * | 2021-10-11 | 2022-01-07 | 全知科技(杭州)有限责任公司 | 一种基于事件响应相似度匹配的前后台三层关联方法 |
CN114357439A (zh) * | 2022-01-07 | 2022-04-15 | 全知科技(杭州)有限责任公司 | 一种基于事件模版相似度推荐的三层关联方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003048973A1 (fr) * | 2001-12-06 | 2003-06-12 | C-Live, Inc. | Procédé d'analyse et analyseur de journal d'accès |
KR20040000697A (ko) * | 2002-06-25 | 2004-01-07 | 주식회사 케이티 | 웹 서비스의 멀티쓰레드 운용 시스템 및 방법 |
US20070112864A1 (en) * | 2005-11-04 | 2007-05-17 | Ron Ben-Natan | Methods and apparatus for tracking and reconciling database commands |
CN103294966A (zh) * | 2013-03-12 | 2013-09-11 | 中国工商银行股份有限公司 | 一种数据库的安全访问控制方法以及系统 |
CN104484474A (zh) * | 2014-12-31 | 2015-04-01 | 南京盾垒网络科技有限公司 | 数据库安全审计方法 |
CN110708339A (zh) * | 2019-11-06 | 2020-01-17 | 四川长虹电器股份有限公司 | 一种基于web日志的关联分析方法 |
CN110990168A (zh) * | 2019-11-27 | 2020-04-10 | 深信服科技股份有限公司 | 三层关联信息的生成方法、系统、电子设备及存储介质 |
CN111078978A (zh) * | 2019-11-29 | 2020-04-28 | 上海观安信息技术股份有限公司 | 一种基于网站文本内容的网贷网站实体识别方法及系统 |
-
2020
- 2020-06-30 CN CN202010611005.3A patent/CN111752727B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003048973A1 (fr) * | 2001-12-06 | 2003-06-12 | C-Live, Inc. | Procédé d'analyse et analyseur de journal d'accès |
KR20040000697A (ko) * | 2002-06-25 | 2004-01-07 | 주식회사 케이티 | 웹 서비스의 멀티쓰레드 운용 시스템 및 방법 |
US20070112864A1 (en) * | 2005-11-04 | 2007-05-17 | Ron Ben-Natan | Methods and apparatus for tracking and reconciling database commands |
CN103294966A (zh) * | 2013-03-12 | 2013-09-11 | 中国工商银行股份有限公司 | 一种数据库的安全访问控制方法以及系统 |
CN104484474A (zh) * | 2014-12-31 | 2015-04-01 | 南京盾垒网络科技有限公司 | 数据库安全审计方法 |
CN110708339A (zh) * | 2019-11-06 | 2020-01-17 | 四川长虹电器股份有限公司 | 一种基于web日志的关联分析方法 |
CN110990168A (zh) * | 2019-11-27 | 2020-04-10 | 深信服科技股份有限公司 | 三层关联信息的生成方法、系统、电子设备及存储介质 |
CN111078978A (zh) * | 2019-11-29 | 2020-04-28 | 上海观安信息技术股份有限公司 | 一种基于网站文本内容的网贷网站实体识别方法及系统 |
Non-Patent Citations (3)
Title |
---|
KUMAR ,R ET AL: "WASM-A Metric for Securing a Web Application", 《JOURNAL OF RESEARCH AND PRACTICE IN INFORMATION TECHNOLOGY》 * |
杨文等: "大型知识共享web系统的软件设计与实现", 《现代电子技术》 * |
陆杰等: "分布式系统中的日志分析及应用", 《高技术通讯》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113902015A (zh) * | 2021-10-11 | 2022-01-07 | 全知科技(杭州)有限责任公司 | 一种基于事件响应相似度匹配的前后台三层关联方法 |
CN114357439A (zh) * | 2022-01-07 | 2022-04-15 | 全知科技(杭州)有限责任公司 | 一种基于事件模版相似度推荐的三层关联方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111752727B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107577688B (zh) | 基于媒体信息采集的原创文章影响力分析系统 | |
US20130226940A1 (en) | Generating Composite Key Relationships Between Database Objects Based on Sampling | |
KR102345410B1 (ko) | 빅데이터 지능형 수집 방법 및 장치 | |
CN102915335A (zh) | 基于用户操作记录和资源内容的信息关联方法 | |
CN111752727A (zh) | 一种基于日志分析的数据库三层关联的识别方法 | |
CN113342976A (zh) | 一种自动采集处理数据的方法、装置、存储介质及设备 | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
CN103425748B (zh) | 一种文档资源建议词的挖掘方法和装置 | |
US20240126770A1 (en) | Systems and Methods for Intelligent Automatic Filing of Documents in a Content Management System | |
CN113010884B (zh) | 一种入侵检测系统中的实时特征过滤方法 | |
CN113449077A (zh) | 新闻热度计算方法、设备及存储介质 | |
CN111488263A (zh) | 一种解析MySQL数据库中日志的方法和装置 | |
CN116401434A (zh) | 一种网络数据信息智能提取系统 | |
Varun et al. | An efficient technique for feature selection to predict customer churn in telecom industry | |
CN115859932A (zh) | 一种日志模板提取方法、装置、电子设备及存储介质 | |
CN114331740A (zh) | 产业图谱大数据分析及扫描的数字化投资价值管理方法 | |
CN108776707B (zh) | 针对探索性查询的抽样方法 | |
CN112711651A (zh) | 一种舆情监测方法及系统 | |
CN112100670A (zh) | 一种基于大数据的隐私数据分级保护方法 | |
US20050198059A1 (en) | Database and database management system | |
CN117786182B (zh) | 基于erp系统的业务数据存储系统及方法 | |
CN109446239A (zh) | 线下文本挖掘方法、装置及计算机可读存储介质 | |
US20180121502A1 (en) | User Search Query Processing | |
US20240273130A1 (en) | Data extraction system and data extraction method | |
CN117909556B (zh) | 档案数据的处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |