CN106372184A - 防止中文关键字过滤逃逸的网络设备及方法 - Google Patents
防止中文关键字过滤逃逸的网络设备及方法 Download PDFInfo
- Publication number
- CN106372184A CN106372184A CN201610789035.7A CN201610789035A CN106372184A CN 106372184 A CN106372184 A CN 106372184A CN 201610789035 A CN201610789035 A CN 201610789035A CN 106372184 A CN106372184 A CN 106372184A
- Authority
- CN
- China
- Prior art keywords
- module
- chinese
- message
- keyword
- dpi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明涉及数据通信技术。本发明解决了现有网络设备的关键字过滤和审计功能容易被绕过导致过滤或审计不准确的问题,提供了一种防止中文关键字过滤逃逸的网络设备及方法,其技术方案可概括为:防止中文关键字过滤逃逸的网络设备,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,报文转发模块与HTTP解码器模块连接,HTTP解码器模块与符号分析模块连接,符号分析模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接。本发明的有益效果是:可以防止终端用户逃逸中文关键字过滤,适用于网络设备。
Description
技术领域
本发明涉及数据通信技术,特别涉及数据通信中使用DPI(Deep Packet Inpect,深度包检测技术)技术时进行内容安全防护或审计的技术。
背景技术
内容安全技术旨在为政府、军队、企业客户提供基于内容的过滤、审计功能,以防止危害政治或者公共安全、违反法律或者企业隐私的内容在网络上传播。绝大多数安全厂商的网络设备都为客户提供了基于关键字的过滤或者审计功能。
由于中文(汉语)的特殊性,在过滤或者审计时,有多种逃逸手段,例如在简体汉字中穿插繁体字或拆解(例如写成“弓虽”)或夹杂特殊符号(例如中*国)等,其原文的语义仍然能够被理解,这样,现有网络设备的关键字过滤和审计功能就会被绕过,使得过滤或审计不准确。
发明内容
本发明的目的就是克服目前网络设备的关键字过滤和审计功能容易被绕过导致过滤或审计不准确的缺点,提供一种防止中文关键字过滤逃逸的网络设备及方法。
本发明解决其技术问题,采用的技术方案是,防止中文关键字过滤逃逸的网络设备,其特征在于,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,所述报文转发模块与HTTP解码器模块连接,HTTP解码器模块与符号分析模块连接,符号分析模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,
所述报文转发模块,用于接收输入的报文,将其传输给HTTP解码器模块,接收并转发DPI检测引擎模块输出的报文;
所述HTTP解码器模块,用于识别出报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给符号分析模块;
所述符号分析模块,用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到DPI检测引擎模块;
所述中文拆解词库模块,用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;
所述DPI检测引擎模块,用于针对符号处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
具体的,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
进一步的,所述简体中文是指编码为GB2312的简体中文字符集。
防止中文关键字过滤逃逸的网络设备,其特征在于,包括:报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,所述报文转发模块与符号分析模块连接,符号分析模块与HTTP解码器模块连接,HTTP解码器模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,
所述报文转发模块,用于接收输入的报文,将其传输给符号分析模块,接收并转发DPI检测引擎模块输出的报文;
所述符号分析模块,用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到HTTP解码器模块;
所述HTTP解码器模块,用于识别出接收到的报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给DPI检测引擎模块;
所述中文拆解词库模块,用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;
所述DPI检测引擎模块,用于针对处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
具体的,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
进一步的,所述简体中文是指编码为GB2312的简体中文字符集。
防止中文关键字过滤逃逸的方法,其特征在于,包括以下步骤:
步骤1、设置至少一个关键字,并对所设置的关键字进行拆解,得到各关键字的拆解字组合,将其作为其他关键字;
步骤2、针对待转发报文,识别其报文内容中的中文字符集、编码方式及标点符号,对于识别出的非简体中文的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,并删除报文内容中不符合预设规则的符号,得到处理后的报文;
步骤3、采用关键字及其他关键字对处理后的报文进行过滤,得到检测后的报文并转发。
具体的,步骤1中,所述关键字为中文词语或中文单字。
进一步的,步骤2中,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
具体的,步骤2中,所述简体中文是指编码为GB2312的简体中文字符集。
本发明的有益效果是,通过上述防止中文关键字过滤逃逸的网络设备及方法,可以防止终端用户逃逸中文关键字过滤,且网络管理员并不需要增加额外的配置负担。
附图说明
图1是本发明实施例中防止中文关键字过滤逃逸的网络设备的系统框图;
图2是本发明又一实施例中防止中文关键字过滤逃逸的网络设备的系统框图。
具体实施方式
下面结合实施例及附图,详细描述本发明的技术方案。
本发明的防止中文关键字过滤逃逸的网络设备,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,报文转发模块与HTTP解码器模块连接,HTTP解码器模块与符号分析模块连接,符号分析模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,其中,报文转发模块用于接收输入的报文,将其传输给HTTP解码器模块,接收并转发DPI检测引擎模块输出的报文;HTTP解码器模块用于识别出报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给符号分析模块;符号分析模块用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到DPI检测引擎模块;中文拆解词库模块用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;DPI检测引擎模块用于针对符号处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
本发明的另一种防止中文关键字过滤逃逸的网络设备包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,报文转发模块与符号分析模块连接,符号分析模块与HTTP解码器模块连接,HTTP解码器模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,其中,报文转发模块用于接收输入的报文,将其传输给符号分析模块,接收并转发DPI检测引擎模块输出的报文;符号分析模块用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到HTTP解码器模块;HTTP解码器模块用于识别出接收到的报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给DPI检测引擎模块;中文拆解词库模块用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;DPI检测引擎模块用于针对处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
本发明防止中文关键字过滤逃逸的方法,首先设置至少一个关键字,并对所设置的关键字进行拆解,得到各关键字的拆解字组合,将其作为其他关键字,然后针对待转发报文,识别其报文内容中的中文字符集、编码方式及标点符号,对于识别出的非简体中文的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,并删除报文内容中不符合预设规则的符号,得到处理后的报文,最后采用关键字及其他关键字对处理后的报文进行过滤,得到检测后的报文并转发。
实施例
本发明实施例中防止中文关键字过滤逃逸的网络设备的系统框图参见图1,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,报文转发模块与HTTP解码器模块连接,HTTP解码器模块与符号分析模块连接,符号分析模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,其中,报文转发模块用于接收输入的报文,将其传输给HTTP解码器模块,接收并转发DPI检测引擎模块输出的报文;HTTP解码器模块用于识别出报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给符号分析模块;符号分析模块用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到DPI检测引擎模块;中文拆解词库模块用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;DPI检测引擎模块用于针对符号处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
本发明又一实施例中防止中文关键字过滤逃逸的网络设备的系统框图参见图2,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,报文转发模块与符号分析模块连接,符号分析模块与HTTP解码器模块连接,HTTP解码器模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,其中,报文转发模块用于接收输入的报文,将其传输给符号分析模块,接收并转发DPI检测引擎模块输出的报文;符号分析模块用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到HTTP解码器模块;HTTP解码器模块用于识别出接收到的报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给DPI检测引擎模块;中文拆解词库模块用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;DPI检测引擎模块用于针对处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
上述两个实施例之间的区别在于报文是先进入HTTP解码器模块还是先进入符号分析模块,其先后顺序并不影响本发明所能够达到的技术效果。
针对上述两种实施例中的查阅字符集转换表,其所查阅的字符集转换表均可以为预设的字符集转换表或通过网络查询获取的字符集转换表,而简体中文可以指定为编码为GB2312的简体中文字符集。
针对中文拆解词库模块用于对预设的关键字进行拆解,得到各关键字的拆解字组合的方法,举例如下:当前预设的关键字为“法轮功”时,中文拆解词库模块会将“法”字拆解成“氵去”、“轮”字拆解成“车仑”、“功”字拆解成“工力”,则此时得到的各关键字的拆解字组合为“氵去轮功”、“法车仑功”、“法轮工力”、“氵去车仑功”、“法车仑工力”、“氵去轮工力”、“氵去车仑工力”,将这些拆解字组合都作为其他关键字。
另外,针对预设规则的符号,预设规则可以采用当前Office中针对标点符号的规则,也可以由网络管理人员提前预设,例如:1)逗号:句(至少1个中文字符后)末尾单独出现,或者作为千分制数字的间隔;2)感叹号:句末单独出现,或者在数字末尾作为数字的阶乘;3)冒号:非句首使用一个单独冒号,或者用做“时分秒”的间隔;4)书名号:对称出现的左右书名号,中间有1-64个汉字,且没有“-”以外的其他符号;5)点号:英文句末出现,或者两段数字中间的点号(小数点);6)顿号:连续出现而且其中至少两个中文字符间隔的顿号;等等。例如“九.评.共产党”会被认为点号使用不合规,再例如,使用“法、轮、功”会被认为顿号有使用不合规,将这些符号去掉以后再送入检测引擎,检测引擎就能发现试图逃逸的关键字特征,也不会引起误报。
具体的使用时,处理步骤如下:
步骤1、设置至少一个关键字,并对所设置的关键字进行拆解,得到各关键字的拆解字组合,将其作为其他关键字。
本步骤中,关键字可以为中文词语或中文单字。
步骤2、针对待转发报文,识别其报文内容中的中文字符集、编码方式及标点符号,对于识别出的非简体中文的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,并删除报文内容中不符合预设规则的符号,得到处理后的报文。
本步骤中,查阅字符集转换表中,所查阅的字符集转换表可以为预设的字符集转换表或通过网络查询获取的字符集转换表;简体中文可以是指编码为GB2312的简体中文字符集。
步骤3、采用关键字及其他关键字对处理后的报文进行过滤,得到检测后的报文并转发。
根据上述处理步骤可见,其可以应用在上述两种防止中文关键字过滤逃逸的网络设备。
Claims (10)
1.防止中文关键字过滤逃逸的网络设备,其特征在于,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,所述报文转发模块与HTTP解码器模块连接,HTTP解码器模块与符号分析模块连接,符号分析模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,
所述报文转发模块,用于接收输入的报文,将其传输给HTTP解码器模块,接收并转发DPI检测引擎模块输出的报文;
所述HTTP解码器模块,用于识别出报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给符号分析模块;
所述符号分析模块,用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到DPI检测引擎模块;
所述中文拆解词库模块,用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;
所述DPI检测引擎模块,用于针对符号处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
2.如权利要求1所述的防止中文关键字过滤逃逸的网络设备,其特征在于,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
3.如权利要求1或2所述的防止中文关键字过滤逃逸的网络设备,其特征在于,所述简体中文是指编码为GB2312的简体中文字符集。
4.防止中文关键字过滤逃逸的网络设备,其特征在于,包括报文转发模块、DPI检测引擎模块、HTTP解码器模块、中文拆解词库模块及符号分析模块,所述报文转发模块与符号分析模块连接,符号分析模块与HTTP解码器模块连接,HTTP解码器模块与DPI检测引擎模块连接,DPI检测引擎模块分别与中文拆解词库模块及报文转发模块连接,
所述报文转发模块,用于接收输入的报文,将其传输给符号分析模块,接收并转发DPI检测引擎模块输出的报文;
所述符号分析模块,用于识别接收到的报文中报文内容的标点符号,删除其中不符合预设规则的符号,得到符号处理后的报文,将其传输到HTTP解码器模块;
所述HTTP解码器模块,用于识别出接收到的报文中报文内容的中文字符集及编码方式,若发现其中有简体中文以外的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,得到处理后的报文,并将处理后的报文传输给DPI检测引擎模块;
所述中文拆解词库模块,用于对预设的关键字进行拆解,得到各关键字的拆解字组合,将各拆解字组合作为其他关键字传输给DPI检测引擎模块;
所述DPI检测引擎模块,用于针对处理后的报文采用预设的关键字及其他关键字进行过滤,得到检测后的报文,将检测后的报文传输给报文转发模块进行转发。
5.如权利要求4所述的防止中文关键字过滤逃逸的网络设备,其特征在于,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
6.如权利要求4或5所述的防止中文关键字过滤逃逸的网络设备,其特征在于,所述简体中文是指编码为GB2312的简体中文字符集。
7.防止中文关键字过滤逃逸的方法,其特征在于,包括以下步骤:
步骤1、设置至少一个关键字,并对所设置的关键字进行拆解,得到各关键字的拆解字组合,将其作为其他关键字;
步骤2、针对待转发报文,识别其报文内容中的中文字符集、编码方式及标点符号,对于识别出的非简体中文的中文字符,查阅字符集转换表进行字符集转换,将其转换为简体中文,并删除报文内容中不符合预设规则的符号,得到处理后的报文;
步骤3、采用关键字及其他关键字对处理后的报文进行过滤,得到检测后的报文并转发。
8.如权利要求7所述的防止中文关键字过滤逃逸的方法,其特征在于,步骤1中,所述关键字为中文词语或中文单字。
9.如权利要求7所述的防止中文关键字过滤逃逸的方法,其特征在于,步骤2中,所述查阅字符集转换表中,所查阅的字符集转换表为预设的字符集转换表或通过网络查询获取的字符集转换表。
10.如权利要求7-9任一项所述的防止中文关键字过滤逃逸的方法,其特征在于,步骤2中,所述简体中文是指编码为GB2312的简体中文字符集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610789035.7A CN106372184A (zh) | 2016-08-31 | 2016-08-31 | 防止中文关键字过滤逃逸的网络设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610789035.7A CN106372184A (zh) | 2016-08-31 | 2016-08-31 | 防止中文关键字过滤逃逸的网络设备及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106372184A true CN106372184A (zh) | 2017-02-01 |
Family
ID=57898709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610789035.7A Pending CN106372184A (zh) | 2016-08-31 | 2016-08-31 | 防止中文关键字过滤逃逸的网络设备及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106372184A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
US20150227634A1 (en) * | 2011-02-04 | 2015-08-13 | Kodak Alaris Inc. | Identifying particular images from a collection |
CN105574090A (zh) * | 2015-12-10 | 2016-05-11 | 北京中科汇联科技股份有限公司 | 一种敏感词过滤方法及系统 |
-
2016
- 2016-08-31 CN CN201610789035.7A patent/CN106372184A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150227634A1 (en) * | 2011-02-04 | 2015-08-13 | Kodak Alaris Inc. | Identifying particular images from a collection |
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
CN105574090A (zh) * | 2015-12-10 | 2016-05-11 | 北京中科汇联科技股份有限公司 | 一种敏感词过滤方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9760548B2 (en) | System, process and method for the detection of common content in multiple documents in an electronic system | |
CN102801859B (zh) | 垃圾短信的识别方法、装置和具有该装置的移动通信终端 | |
US20180060314A1 (en) | Multibyte heterogeneous log preprocessing | |
CN103399700B (zh) | 阅后即焚信息的呈现方法及通信终端 | |
CN105956180A (zh) | 一种敏感词过滤方法 | |
CN105704685B (zh) | 一种短信安全处理方法及装置 | |
Lee et al. | CATBERT: Context-aware tiny BERT for detecting social engineering emails | |
CN106874448B (zh) | 一种从微博中挖掘地震主题词的方法和装置 | |
Takuro et al. | Codewords detection in microblogs focusing on differences in word use between two corpora | |
CN109857869A (zh) | 一种基于Ap增量聚类和网络基元的热点话题预测方法 | |
CN107391684A (zh) | 一种威胁情报生成的方法及系统 | |
CN103927367A (zh) | 基于事件的微博采集系统及方法 | |
CN106372184A (zh) | 防止中文关键字过滤逃逸的网络设备及方法 | |
Valmari et al. | Stubborn set intuition explained | |
McCue et al. | Connecting the dots: Data mining and predictive analytics in law enforcement and intelligence analysis | |
CN109791563B (zh) | 信息收集系统、信息收集方法和记录介质 | |
Ansari et al. | The spread of misinformation on social media: An insightful countermeasure to restrict | |
CN114186029A (zh) | 信息泄露行为的分析方法、相关装置及计算机存储介质 | |
Maiya et al. | Mining measured information from text | |
CN106528711B (zh) | 一种表外文件数据的求交集方法及系统 | |
Greenwald et al. | India among top targets of spying by NSA | |
Zhang et al. | The research on approaches for botnet detection | |
Burmeister | Ethics in information and communications technology | |
Rashid et al. | Phishing URL detection generalisation using Unsupervised Domain Adaptation | |
TWI486796B (zh) | Text filtering method and text filtering system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170201 |