CN117786732B - 一种基于大数据信息脱敏方法的智慧机关数据存储系统 - Google Patents

一种基于大数据信息脱敏方法的智慧机关数据存储系统 Download PDF

Info

Publication number
CN117786732B
CN117786732B CN202310495219.2A CN202310495219A CN117786732B CN 117786732 B CN117786732 B CN 117786732B CN 202310495219 A CN202310495219 A CN 202310495219A CN 117786732 B CN117786732 B CN 117786732B
Authority
CN
China
Prior art keywords
data
storage
module
classification
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310495219.2A
Other languages
English (en)
Other versions
CN117786732A (zh
Inventor
王蒙湘
曾毅
靳宗振
王巧慧
刘琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Institute of Standardization
Original Assignee
China National Institute of Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Institute of Standardization filed Critical China National Institute of Standardization
Priority to CN202310495219.2A priority Critical patent/CN117786732B/zh
Publication of CN117786732A publication Critical patent/CN117786732A/zh
Application granted granted Critical
Publication of CN117786732B publication Critical patent/CN117786732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据信息脱敏方法的智慧机关数据存储系统,涉及数据存储系统技术领域。本发明至少包括以下内容,通过CA统一身份认证模块作为连接认证的应用模块和系统的登录端;通过将数据输入端与数据抓取模块连接,以数据抓取模块作为搭建平台的底层逻辑,完成对大数据导入信息的敏感词抓取;在数据抓取模块的顶端架设K‑Anonymity、L‑Diversity和T—Closeness,通过对半标识列进行数据变形处理。本发明通过在大数据信息脱敏的模块基础上搭建了数据存储的框架,从而便于通过该种系统的搭建方式,既便于形成对关键数据的筛选提出脱敏以及对应的分离关键词存储,提高了整体的存储便捷性和存储的应用效果。

Description

一种基于大数据信息脱敏方法的智慧机关数据存储系统
技术领域
本发明涉及数据存储系统技术领域,具体为一种基于大数据信息脱敏方法的智慧机关数据存储系统。
背景技术
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号等个人信息都需要进行数据脱敏。数据安全技术之一,数据库安全技术主要包括:数据库漏扫、数据库加密、数据库防火墙、数据脱敏和数据库安全审计系统。数据库安全风险包括:拖库、刷库和撞库;
存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统;
但是现有的智慧机关在对录入的信息进行过程中,往往仅仅有单独的数据录入,既不便于实现对数据的分类喜欢,也不便于将存储入数据的内容进行脱敏应用,因此需要对以上问题提出一种新的解决方案。
发明内容
本发明的目的在于提供一种基于大数据信息脱敏方法的智慧机关数据存储系统,以解决现有的问题:现有的智慧机关在对录入的信息进行过程中,往往仅仅有单独的数据录入,既不便于实现对数据的分类喜欢,也不便于将存储入数据的内容进行脱敏应用。
为实现上述目的,本发明提供如下技术方案:一种基于大数据信息脱敏方法的智慧机关数据存储系统,至少包括以下内容:
通过CA统一身份认证模块作为连接认证的应用模块和系统的登录端;
通过将数据输入端与数据抓取模块连接,以数据抓取模块作为搭建平台的底层逻辑,完成对大数据导入信息的敏感词抓取;
在数据抓取模块的顶端架设K-Anonymity、L-Diversity和T—Closeness,通过对半标识列进行数据变形处理;
由抽检算法模块与数据抓取模块复合构成的导入复审模块,通过对变形处理后的数据进行;
通过在独立的计算机中以分布式关系型大数据存储平台建立模型,配合提供有序遍历方法,并采用Raft协议,构成基础存储系统;
在后台故障检测系统中搭载接入分类引擎,通过设置分类引擎中的连续的分类设计,提供给存储分类和查询分类为基础,进而大幅度的减少分类存储的效果;
采用大数据批式任务计算平台技术,通过SQL语言对分类存储中的数据进行高效批量统计的能力;
将数据保存在RocksDB中,采用RocksDB进行数据落地;
准备多个存储数据的主机,将分布式关系型大数据存储平台导入主机内,并将保存的数据同步存于多个主机内,在保存过程中利用Raft来做数据复制;
并在主机内建立Hadoop的框架,并在框架中增加HBase信息存储模块,提供可靠高性能的实时读写可伸缩的分布式存储数据库。
优选的,所述CA统一身份认证模块支持单点登录功能,提供基于WEB的统一访问入口,支持统一登录,统一认证,支持Usbkey数字签名登录,支持与安保系统进行对接。
优选的,所述抽检算法模块的每次都随机在[0,N-1]之间抽取一个数,并与之前的数相比较,当与前面生成的随机数相同,则继续随机生成,直至生成一个与之前所有生成数不同的数,当不相同时,则将该随机数添加到结果集中,并继续随机抽取,直至结果集中的数为M个,其中N为抽检的个数,M为最终抽检数量。
优选的,所述数据抓取模块包括以下内容:
第一级的关键词检索分类,按照输入内容关键词、相关关键词和应用关键词进行分类存放和精准查找提取;
第二级的图片、录像、录音和文件的检索分类,将不同源的输入内容按照不同的输入格式进行大方向分类,便于后续的查找提取;
第三级的数字排列检索分类,按照特殊数字排列进行提取;
第四级的重复内容筛选分类,通过将多个字符重复的内容进行对比筛选,确保存储应用的内容均为实用内容。
优选的,通过在HBase信息存储模块处至少通过LLVM技术和向量化执行技术进行加速。
优选的,所述分布式关系型大数据存储平台将整个录入的数据进行分段,每段数据采用StartKey到EndKey左闭右开区间来描述。
与现有技术相比,本发明的有益效果是:
本发明通过在大数据信息脱敏的模块基础上搭建了数据存储的框架,从而便于通过该种系统的搭建方式,既便于形成对关键数据的筛选提出脱敏以及对应的分离关键词存储,提高了整体的存储便捷性和存储的应用效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明整体的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
请参阅图1,一种基于大数据信息脱敏方法的智慧机关数据存储系统,至少包括以下内容:
通过CA(CertificationAuthority,证书颁发机构)统一身份认证模块作为连接认证的应用模块和系统的登录端;
也就是说,CA统一身份认证模块之前,可以设置连接认证和登录认证,其中,连接认证是用于确定来自外部设备的连接请求的适当性的过程。而登录认证是指用户通过登录的方式确认登录的过程。
通过将数据输入端与数据抓取模块连接,以数据抓取模块作为搭建平台的底层逻辑,完成对大数据导入信息的敏感词抓取;
在数据抓取模块的顶端架设K-Anonymity、L-Diversity和T-Closeness,通过对半标识列进行数据变形处理;
通过K-Anonymity将可标识列进行一次泛化脱敏,使得攻击者无法直接标识用户,由于攻击者还是有可能通过多个半标识列的属性值识别个人,攻击者可能通过社工,知道某个人的姓名,邮编,生日,性别或是其他包含个人信息的以开放数据库获得特定个人的半标识列属性值,并与大数据平台数据进行匹配,从而得到特定个人的敏感信息;
通过L-Diversity进行二次脱敏,用来衡量相等集的不同属性值数量,并没有衡量不同属性值的分布;
通过T-Closeness进行三次脱敏,约束限定了半标识列属性与敏感信息的全局分布之间的联系,减弱了半标识列属性与特定敏感信息的联系,减少攻击者通过敏感信息的分布信息进行属性泄露攻击的可能性;
这三种脱敏方式可以同时进行,也可以具有先后顺序,这里对具体的先后顺序不做具体限定。
由抽检算法模块与数据抓取模块复合构成的导入复审模块,对变形处理后的数据进行复审;
通过在独立的计算机中以分布式关系型大数据存储平台建立模型,构成基础存储系统;
建立导出传递模块,将变形处理的内容导入基础存储系统;这里的基础存储系统包括存储端,如在图1中,共设置有n个存储端,分别是存储端1、存储端2、存储端3、存储端4和存储端n等。
这里不同的存储端可以实现不同数据的存储,n个存储端可以基于数据的不同分别实现不同类型数据的存储。当然,这里的存储端也可以设置为其他数量,如三个或者五个等。
在后台故障检测系统中搭载接入分类引擎,通过设置分类引擎中的连续的分类设计,提供给存储分类和查询分类为基础,进而大幅度的减少分类存储的效果;
采用大数据批式任务计算平台技术,通过SQL语言对分类存储中的数据进行高效批量统计的能力;
将数据保存在RocksDB中,采用RocksDB进行数据落地;
准备多个存储数据的主机,将分布式关系型大数据存储平台导入主机内,并将保存的数据同步存于多个主机内,在保存过程中利用Raft来做数据复制;
并在主机内建立Hadoop的框架,并在框架中增加HBase信息存储模块,提供可靠高性能的实时读写可伸缩的分布式存储数据库。
可选地,CA统一身份认证模块支持单点登录功能,提供基于WEB的统一访问入口,支持统一登录,统一认证,支持Usbkey数字签名登录,支持与安保系统进行对接。其中,单点登录是一种统一认证和授权机制,指访问同一服务器不同应用中的受保护资源的同一用户,只需要登录一次,即通过一个应用中的安全验证后,再访问其他应用中的受保护资源时,不再需要重新登录验证。这里的CA统一身份认证模块可以选择上面所提到的多种方式中的一种实现。
可选地,抽检算法模块的每次都随机在[0,N-1]之间抽取一个数,并与之前的数相比较,当与前面生成的随机数相同,则继续随机生成,直至生成一个与之前所有生成数不同的数,当不相同时,则将该随机数添加到结果集中,并继续随机抽取,直至结果集中的数为M个,其中N为抽检的个数,M为最终抽检数量。这里的N为大于3的正整数。
可选地,数据抓取模块包括以下内容第一级的关键词检索分类,按照输入内容关键词、相关关键词和应用关键词进行分类存放和精准查找提取;第二级的图片、录像、录音和文件的检索分类,将不同源的输入内容按照不同的输入格式进行大方向分类,便于后续的查找提取;第三级的数字排列检索分类,按照特殊数字排列进行提取;第四级的重复内容筛选分类,通过将多个字符重复的内容进行对比筛选,确保存储应用的内容均为实用内容;通过多级检索,从而获得更好的检索应用效果,既避免了数据抓取重复,也可以提供多种不同的关键点检索提取和录入。
在向量空间模型中,文本泛指各种机器可读的记录,用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1<=k<=N,例如输入的内容中有a、b、c、d四个特征项,那么输入的内容就可以表示为D(a,b,c,d)。对含有n个特征项的文本而言,通常会给每个特征项赋予一定的权重表示其重要程度。即D=D(T1,W1;T2,W2;…,Tn,Wn),简记为D=D(W1,W2,…,Wn),我们把它叫做文本D的向量表示。其中Wk是Tk的权重,1<=k<=N。在上面那个例子中,假设a、b、c、d的权重分别为30,20,20,10,那么该文本的向量表示为D(30,20,20,10)。在向量空间模型中,两个文本D1和D2之间的内容相关度Sim(D1,D2)常用向量之间夹角的余弦值表示,其中,W1k、W2k分别表示文本D1和D2第K个特征项的权值,1<=k<=N。在自动归类中,利用类似的方法来计算待归类文档和某类目的相关度,例如输入内容中D1的特征项为品牌,代码b,代码c,修复方式,权值分别为30,20,20,10,类目C1的特征项为a,c,d,e,权值分别为40,30,20,10,则D1的向量表示为D1(30,20,20,10,0),C1的向量表示为C1(40,0,30,20,10),则根据上式计算出来的文本D1与类目C1相关度是0.86,如此进行多级分类直至获取最终分类。
通过在HBase信息存储模块处至少通过LLVM技术和向量化执行技术进行加速;提高了更好的存储信息的速度。
分布式关系型大数据存储平台将整个录入的数据进行分段,每段数据采用StartKey到EndKey左闭右开区间来描述。利用分布式关系型大数据存储平台将整个录入的数据分成很多段,每一段是一系列连续的Key,形成Region,每一个Regio采用StartKey到EndKey左闭右开区间来描述。
通过这种设置方式,可以避免了两个数据录入的过程中被信息相互干扰,形成独立的分区存储应用,进而大大提高了使用效果。
这里的分布式存储数据库,具有实时读写和可伸缩的特点,可以对数据进行分布处理。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (4)

1.一种基于大数据信息脱敏方法的智慧机关数据存储系统,其特征在于:包括:
通过CA统一身份认证模块作为连接认证的应用模块和系统的登录端;
通过将数据输入端与数据抓取模块连接,以数据抓取模块作为搭建平台的底层逻辑,完成对大数据导入信息的敏感词抓取;
在数据抓取模块的顶端架设K-Anonymity、L-Diversity和T-Closeness,通过对半标识列进行数据变形处理;
由抽检算法模块与数据抓取模块复合构成的导入复审模块,对变形处理后的数据进行复审;
通过在独立的计算机中以分布式关系型大数据存储平台建立模型,构成基础存储系统;
建立导出传递模块,将变形处理的内容导入基础存储系统;
在后台故障检测系统中搭载接入分类引擎,通过设置分类引擎中的连续的分类设计,提供给存储分类和查询分类为基础,进而大幅度的减少分类存储的效果;
采用大数据批式任务计算平台技术,通过SQL语言对分类存储中的数据进行高效批量统计的能力;
将数据保存在RocksDB中,采用RocksDB进行数据落地;
准备多个存储数据的主机,将分布式关系型大数据存储平台导入主机内,并将保存的数据同步存于多个主机内,在保存过程中利用Raft来做数据复制;
并在主机内建立Hadoop的框架,并在框架中增加HBase信息存储模块,提供可靠高性能的实时读写可伸缩的分布式存储数据库;
所述抽检算法模块每次都随机在[0,N-1]之间抽取一个数,并与之前的数相比较,当与前面生成的随机数相同,则继续随机生成,直至生成一个与之前所有生成数不同的数,当不相同时,则将该随机数添加到结果集中,并继续随机抽取,直至结果集中的数为M个,其中N为抽检的个数,M为最终抽检数量;
所述数据抓取模块包括以下内容:
第一级的关键词检索分类,按照输入内容关键词、相关关键词和应用关键词进行分类存放和精准查找提取;
第二级的图片、录像、录音和文件的检索分类,将不同源的输入内容按照不同的输入格式进行大方向分类,便于后续的查找提取;
第三级的数字排列检索分类,按照特殊数字排列进行提取;
第四级的重复内容筛选分类,通过将多个字符重复的内容进行对比筛选,确保存储应用的内容均为实用内容。
2.根据权利要求1所述的一种基于大数据信息脱敏方法的智慧机关数据存储系统,其特征在于:所述CA统一身份认证模块支持单点登录功能,提供基于WEB的统一访问入口,支持统一登录,统一认证,支持Usbkey数字签名登录,支持与安保系统进行对接。
3.根据权利要求1所述的一种基于大数据信息脱敏方法的智慧机关数据存储系统,其特征在于:通过在HBase信息存储模块处至少通过LLVM技术和向量化执行技术进行加速。
4.根据权利要求1所述的一种基于大数据信息脱敏方法的智慧机关数据存储系统,其特征在于:所述分布式关系型大数据存储平台将整个录入的数据进行分段,每段数据采用StartKey到EndKey左闭右开区间来描述。
CN202310495219.2A 2023-05-05 2023-05-05 一种基于大数据信息脱敏方法的智慧机关数据存储系统 Active CN117786732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310495219.2A CN117786732B (zh) 2023-05-05 2023-05-05 一种基于大数据信息脱敏方法的智慧机关数据存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310495219.2A CN117786732B (zh) 2023-05-05 2023-05-05 一种基于大数据信息脱敏方法的智慧机关数据存储系统

Publications (2)

Publication Number Publication Date
CN117786732A CN117786732A (zh) 2024-03-29
CN117786732B true CN117786732B (zh) 2024-05-31

Family

ID=90398770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310495219.2A Active CN117786732B (zh) 2023-05-05 2023-05-05 一种基于大数据信息脱敏方法的智慧机关数据存储系统

Country Status (1)

Country Link
CN (1) CN117786732B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105471856A (zh) * 2015-11-19 2016-04-06 中国电子科技网络信息安全有限公司 用于大数据中心平台加密文件的检索和共享的系统及方法
CN105653981A (zh) * 2015-12-31 2016-06-08 中国电子科技网络信息安全有限公司 大数据平台的数据流通与交易的敏感数据保护系统及方法
CN106649587A (zh) * 2016-11-17 2017-05-10 国家电网公司 一种基于大数据信息系统的高安全性脱敏方法
CN109871708A (zh) * 2018-12-15 2019-06-11 平安科技(深圳)有限公司 数据传输方法、装置、电子设备及存储介质
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质
US10459990B1 (en) * 2018-12-27 2019-10-29 Silver Rocket Data Technology (Shanghai) Co., Ltd Data processing method and device, medium and terminal thereof
CN110704861A (zh) * 2019-08-07 2020-01-17 荣邦科技有限公司 一种基于开放接口实时脱敏的方法、装置及系统
CN111813808A (zh) * 2020-06-10 2020-10-23 云南电网有限责任公司 一种大数据快速脱敏的方法及装置
CN112116973A (zh) * 2020-09-17 2020-12-22 山东健康医疗大数据有限公司 一种对个人健康医疗数据的系统化脱敏方法
CN112364377A (zh) * 2020-11-11 2021-02-12 国网山东省电力公司电力科学研究院 一种适应于电力行业的数据分类分级安全防护系统
CN112651039A (zh) * 2020-11-18 2021-04-13 国网江苏省电力有限公司营销服务中心 一种融合业务场景的电力数据差异化脱敏方法及装置
CN114254112A (zh) * 2021-12-21 2022-03-29 支付宝(杭州)信息技术有限公司 用于敏感信息预分类的方法、系统、装置和介质
CN114860850A (zh) * 2022-04-14 2022-08-05 深圳新闻网传媒股份有限公司 一种分布式关系型大数据存储平台技术的方法
CN115545452A (zh) * 2022-09-28 2022-12-30 深圳市海葵信息技术有限公司 运维方法、运维系统、设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105471856A (zh) * 2015-11-19 2016-04-06 中国电子科技网络信息安全有限公司 用于大数据中心平台加密文件的检索和共享的系统及方法
CN105653981A (zh) * 2015-12-31 2016-06-08 中国电子科技网络信息安全有限公司 大数据平台的数据流通与交易的敏感数据保护系统及方法
CN106649587A (zh) * 2016-11-17 2017-05-10 国家电网公司 一种基于大数据信息系统的高安全性脱敏方法
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质
CN109871708A (zh) * 2018-12-15 2019-06-11 平安科技(深圳)有限公司 数据传输方法、装置、电子设备及存储介质
US10459990B1 (en) * 2018-12-27 2019-10-29 Silver Rocket Data Technology (Shanghai) Co., Ltd Data processing method and device, medium and terminal thereof
CN110704861A (zh) * 2019-08-07 2020-01-17 荣邦科技有限公司 一种基于开放接口实时脱敏的方法、装置及系统
CN111813808A (zh) * 2020-06-10 2020-10-23 云南电网有限责任公司 一种大数据快速脱敏的方法及装置
CN112116973A (zh) * 2020-09-17 2020-12-22 山东健康医疗大数据有限公司 一种对个人健康医疗数据的系统化脱敏方法
CN112364377A (zh) * 2020-11-11 2021-02-12 国网山东省电力公司电力科学研究院 一种适应于电力行业的数据分类分级安全防护系统
CN112651039A (zh) * 2020-11-18 2021-04-13 国网江苏省电力有限公司营销服务中心 一种融合业务场景的电力数据差异化脱敏方法及装置
CN114254112A (zh) * 2021-12-21 2022-03-29 支付宝(杭州)信息技术有限公司 用于敏感信息预分类的方法、系统、装置和介质
CN114860850A (zh) * 2022-04-14 2022-08-05 深圳新闻网传媒股份有限公司 一种分布式关系型大数据存储平台技术的方法
CN115545452A (zh) * 2022-09-28 2022-12-30 深圳市海葵信息技术有限公司 运维方法、运维系统、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多业务场景的大数据脱敏技术研究及其在电力用户隐私信息保护中的应用;吕军 等;电力大数据;20180721;第21卷(第07期);第29-35页 *
电力大数据的脱敏评估及系统实现;叶水勇;黑龙江电力;20200815;第42卷(第04期);第366-371页 *

Also Published As

Publication number Publication date
CN117786732A (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
Cuzzocrea et al. Big data: a research agenda
Sukumar et al. Network intrusion detection using improved genetic k-means algorithm
McMinn et al. Building a large-scale corpus for evaluating event detection on twitter
US20140279774A1 (en) Classifying Resources Using a Deep Network
Liu et al. Web intrusion detection system combined with feature analysis and SVM optimization
Yin et al. Facto: a fact lookup engine based on web tables
CN111125460A (zh) 信息推荐方法及装置
CN108090351A (zh) 用于处理请求消息的方法和装置
WO2020135247A1 (zh) 法律文书解析方法及装置
CN111339784B (zh) 一种新话题的自动挖掘方法和系统
CN112132238A (zh) 一种识别隐私数据的方法、装置、设备和可读介质
Pan et al. Network intrusion detection model based on PCA+ ADASYN and XGBoost
Xing et al. HMBI: a new hybrid deep model based on behavior information for fake news detection
Lakhani et al. Detecting sql injection attack using natural language processing
CN117786732B (zh) 一种基于大数据信息脱敏方法的智慧机关数据存储系统
CN113010771A (zh) 搜索引擎中的个性化语义向量模型的训练方法及装置
CN112966086A (zh) 一种基于位置敏感哈希函数的可验证模糊搜索方法
Yao et al. Topic-based rank search with verifiable social data outsourcing
Dourado et al. Event prediction based on unsupervised graph-based rank-fusion models
CN115982388A (zh) 案件质控图谱建立、案件文书质检方法、设备及存储介质
Liu et al. An illegal billboard advertisement detection framework based on machine learning
CN108519983A (zh) 一种基于潜层语义分析的安全的文档相似性计算方法和系统
Wang et al. A novel method for network intrusion detection
Ahmed et al. Locality sensitive hashing based space partitioning approach for indexing multidimensional feature vectors of fingerprint image data
Zhang et al. Research on case preprocessing based on deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant