CN110727766A

CN110727766A - 敏感词的检测方法

Info

Publication number: CN110727766A
Application number: CN201910991407.8A
Authority: CN
Inventors: 徐钟豪; 孟雷; 谢忱
Original assignee: Shanghai Elephant Mdt Infotech Ltd
Current assignee: Shanghai Elephant Mdt Infotech Ltd
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2020-01-24
Anticipated expiration: 2039-10-18
Also published as: CN110727766B

Abstract

本发明涉及一种敏感词的检测方法，包括以下步骤：建立敏感词数据库，分为强敏感词数据库和弱敏感词数据库；建立训练模型，训练模型包括预判模型和弱敏感词的检测模型；进行检测，载入训练模型的系统定时爬取待检测网页内容，预判模型判断待检测文本中的词语是否属于敏感词数据库中，并判断其敏感类型；若待检测文本中的词语为强敏感词数据库中的强敏感词，则直接反馈待检测文本所属的强敏感词数据库的类型；若待检测文本中的词语为弱敏感词数据库中的弱敏感词，则将待检测文本输入弱敏感词的检测模型进行检测，由弱敏感词的检测模型判断其敏感可疑度分值并反馈。本发明通过设置预判和检测模型进行判断和检测，提高了敏感词检测的准确性和灵活性。

Description

敏感词的检测方法

技术领域

本发明涉及网络安全技术领域，特别涉及一种敏感词的检测方法。

背景技术

为了维护网络的健康环境，凡是涉及到网站的内容发布、评论发布等都需要先进行敏感词检测，防止有不合适的词语出现，这些词语可能包括淫秽类、博彩类以及反动类等。除了传统的网站更新和评论更新外，网站也可能被恶意攻击者入侵，在网页上植入一些非法的暗链、广告以及标语等。往往这些恶意植入都会包含大量敏感信息内容，对于网站管理者通常会选用的检测手段就是敏感词检测。

传统敏感词检测方式多是基于名单机制的正则匹配，而对于具有多种语义级别的敏感词则无法准确检出，此种方法仅针对单个敏感词做检测，会造成误判。例如“黄色”在色情网站中属于淫秽词语，但在正常网站也会经常出现，比如“黄色的花朵”；例如“小姐”在一些色情广告中属于敏感词语，但在一些正常文章中也会出现，比如“小姐姐”；再例如本身就属于敏感词语的，但若是前面跟着否定类词语，在语境上就不应识别为敏感词。此外目前仅有少部分现有技术中提到使用语义识别概念，但使用的是传统机器学算法对全部敏感词做模型训练，此种方式没有区分敏感词的类型，所有的敏感词检测都采用同一种方式，不能针对不同的敏感词采用不同的检测方式，增大了检测开销，且检测准确度较低。

因此，有必要提供一种新的敏感词的检测方法，提供训练模型以提高敏感词检测的准确性和灵活性。

发明内容

本发明的目的在于提供一种新的敏感词的检测方法，提供训练模型以提高敏感词检测的准确性和灵活性

为了解决现有技术中存在的问题，本发明提供了一种敏感词的检测方法，包括以下步骤：

建立敏感词数据库，所述敏感词数据库根据敏感类型分为强敏感词数据库和弱敏感词数据库；

建立训练模型，所述训练模型包括预判模型和弱敏感词的检测模型，其中，所述预判模型用于判断待检测文本的敏感类型；设立所述弱敏感词的检测模型包括：根据所述弱敏感词数据库中的弱敏感词进行检索得到敏感词网页，获取敏感词网页中包含有弱敏感词的文本信息；对所述文本信息进行打标，采用打标后的文本信息建立弱敏感词的检测模型；

进行检测，载入所述训练模型的系统定时爬取待检测的网页内容，所述预判模型判断待检测网页内待检测文本中的词语是否属于敏感词数据库中，并判断其敏感类型；若待检测文本中的词语为强敏感词数据库中的强敏感词，则直接反馈待检测文本所属的强敏感词数据库的类型；若待检测文本中的词语为弱敏感词数据库中的弱敏感词，则将待检测文本输入弱敏感词的检测模型进行检测，由弱敏感词的检测模型判断其敏感可疑度分值并反馈。

可选的，在所述敏感词的检测方法中，所述强敏感词数据库中的强敏感词为在任何前后文语义下都敏感的词语，所述强敏感词数据库中的种类包括淫秽强敏感词库、博彩强敏感词库以及商广强敏感词库；

所述弱敏感词数据库中的弱敏感词为在不同语义下具有不同解释，且具有至少一种解释导致敏感，也具有至少一种解释导致不敏感的词语，所述弱敏感词数据库中的种类包括淫秽弱敏感词库、博彩弱敏感词库以及商广弱敏感词库。

可选的，在所述敏感词的检测方法中，获取包含有弱敏感词的文本信息包括以下步骤：

以弱敏感词为中心词做前后文本均匀扩展，以标点符号为停止扩展信号。

可选的，在所述敏感词的检测方法中，打标包括以下步骤：

判断所述文本信息是否敏感，将敏感和不敏感的文本信息分别标记。

可选的，在所述敏感词的检测方法中，建立弱敏感词的检测模型之前，还包括以下步骤：

将打标后的文本信息进行拆分和过滤，以得到每条文本信息中具有语义的所有词语。

可选的，在所述敏感词的检测方法中，建立弱敏感词的检测模型包括以下步骤：

将各条文本信息中具有语义的所有词语归属于各自的训练文本单元中，根据弱敏感词数据库的种类对每条训练文本单元进行分类；

分别将属于各个种类的弱敏感词库的训练文本单元进行向量化；

采用LSTM网络根据向量化后的训练文本单元建立弱敏感词的检测模型。

可选的，在所述敏感词的检测方法中，建立所述预判模型包括建立多模式匹配算法，建立多模式匹配算法包括以下步骤：

预设数组长度：取所述每个种类强敏感词库中存储数据的最大容量值，设为第一预设值a，取所述强敏感词库的种类数量的最大值，设为第二预设值x，取所述每个种类弱敏感词库中存储数据的最大容量值，设为第三预设值b，取所述弱敏感词库的种类数量的最大值，设为第四预设值y，数组长度 L＝max(a,b)*(x+y)；

建立数组：将所有种类的强敏感词库中的数据以及所有种类的弱敏感词库中的数据依次导入数组中，并将依次导入的数据按照种类分段，并将每段的名称确定为其对应的种类名称。

可选的，在所述敏感词的检测方法中，进行检测过程中，所述预判模型判断待检测网页内待检测文本中的词语的敏感类型包括以下步骤：

输入待检测网页内的待检测文本，根据多模式匹配算法中数组检索得到索引下标z；

计算得到索引下标z的所属段的方式为：计算z/max(a,b)，对计算结果向上取整；

根据计算得到的所属段匹配对应的敏感词库的种类名称，即判断出待检测文本中的词语的敏感类型。

可选的，在所述敏感词的检测方法中，进行检测过程中，将待检测文本输入弱敏感词的检测模型进行检测包括以下步骤：

将待检测文本进行拆分和过滤，得到待检测文本单元；

将待检测文本单元进行向量化；

将向量化后的待检测文本单元输入弱敏感词的检测模型，由所述弱敏感词的检测模型输出敏感可疑度分值；

若敏感可疑度分值大于预设阈值，则反馈待检测文本所属的弱敏感词数据库的类型和敏感可疑度分值，若敏感可疑度分值小于预设阈值，则反馈待检测文本不包含敏感词。

可选的，在所述敏感词的检测方法中，所述敏感词的检测方法还包括误报处理，所述误报处理包括以下步骤：

用户反馈出现误报；

复核误报是否真实，若误报真实，则将误报词语采用建立训练模型的步骤进行二次训练；若误报不真实，则不再进行训练，结束误报处理。

在本发明所提供的敏感词的检测方法中，通过建立训练模型中的预判模型，对待检测文本实现最初步的判断，判断待检测文本所包含的词语是否属于敏感词数据库，判断其属于强敏感词数据库还是弱敏感词数据库，并且还能判断其属于强敏感词数据库或弱敏感词数据库中的哪一种类；进一步通过建立弱敏感词的检测模型，将预判为包含弱敏感词的待检测文本进行进一步的检测和辨别，从词语或语句的语义上进行检测判断，从而实现了在不同语义下具有不同解释的词语的检测，增加了检测的准确性和灵活性，降低了误判。

附图说明

图1为本发明实施例提供的建立弱敏感词的检测模型的流程图。

图2为本发明实施例提供的检测流程图。

具体实施方式

下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述，本发明的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比例，仅用以方便、明晰地辅助说明本发明实施例的目的。

在下文中，如果本文所述的方法包括一系列步骤，本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序，且一些所述的步骤可被省略和/ 或一些本文未描述的其他步骤可被添加到该方法。

传统敏感词检测方式多是基于名单机制的正则匹配，而对于具有多种语义级别的敏感词则无法准确检出，此种方法仅针对单个敏感词做检测，会造成误判。此外目前仅有少部分现有技术中提到使用语义识别概念，但使用的是传统机器学算法对全部敏感词做模型训练，此种方式没有区分敏感词的类型，所有的敏感词检测都采用同一种方式，不能针对不同的敏感词采用不同的检测方式，增大了检测开销，且检测准确度较低。

因此有必要提供一种敏感词的检测方法，包括以下步骤：

本发明通过建立训练模型中的预判模型，对待检测文本实现最初步的判断，判断待检测文本所包含的词语是否属于敏感词数据库，判断其属于强敏感词数据库还是弱敏感词数据库，并且还能判断其属于强敏感词数据库或弱敏感词数据库中的哪一种类；进一步通过建立弱敏感词的检测模型，将预判为包含弱敏感词的待检测文本进行进一步的检测和辨别，从词语或语句的语义上进行检测判断，从而实现了在不同语义下具有不同解释的词语的检测，增加了检测的准确性和灵活性，降低了误判。

具体的，所述强敏感词数据库中的强敏感词为在任何前后文语义下都敏感的词语，例如，可以将长度大于4个字符的词语定义为强敏感词，也可以将词语导入搜索引擎进行查询(如百度搜索引擎等，这类搜索引擎对非法词语做了过滤)，无法搜索到内容的词语定义为强敏感词，还可以人工根据具体情况自定义强敏感词。所述强敏感词数据库中的种类可以根据安全专家经验和业务需求等设立，例如包括淫秽强敏感词库、博彩强敏感词库以及商广强敏感词库，若有需要，还可以再定义更多其他种类的敏感词库。

所述弱敏感词数据库中的弱敏感词为在不同语义下具有不同解释，且具有至少一种解释导致敏感，也具有至少一种解释导致不敏感的词语，例如背景技术中所举例的“黄色”，“小姐”等词语，均是在不同语义下具有不同解释，一般来说，敏感词中除去强敏感词就都是弱敏感词。所述弱敏感词数据库中的种类可以根据安全专家经验和业务需求等设立，例如包括淫秽弱敏感词库、博彩弱敏感词库以及商广弱敏感词库，若有需要，还可以再定义更多其他种类的敏感词库。

进一步的，建立所述预判模型包括建立多模式匹配算法，建立多模式匹配算法包括以下步骤：

接着建立弱敏感词的检测模型，如图1所示，图1为本发明实施例提供的建立弱敏感词的检测模型的流程图，包括以下步骤：

根据所述弱敏感词数据库中的弱敏感词进行检索得到敏感词网页，可以采用谷歌等不会对敏感词做限制的搜索引擎，以获取敏感词网页中包含有弱敏感词的文本信息；对所述文本信息进行打标，采用打标后的文本信息建立弱敏感词的检测模型。

其中，获取包含有弱敏感词的文本信息包括以下步骤：以弱敏感词为中心词做前后文本均匀扩展，以标点符号为停止扩展信号，例如可以提取以逗号、句号、分号、问号或感叹号结尾的完整一句话为一条文本信息，以最大限度的保留训练所用的文本信息。优选的，所述文本信息的长度大于10个字符，小于 200个字符，大于200个字符的部分进行截断。

进一步的，打标包括以下步骤：判断所述文本信息是否敏感，将敏感和不敏感的文本信息分别标记，例如打标为1代表此文本信息是真实敏感词，打标为0代表此文本信息是非敏感词，在一个实施例中，针对淫秽弱敏感词库的淫秽弱敏感词“乳房”，对于文本信息“下面告诉你怎样抚摸女性乳房的步骤”，应标注为1，对于文本信息“X线照相技术是当前最有效的乳房癌症显影技术”，应标注为0。并且，建立弱敏感词的检测模型之前，还需要将打标后的文本信息进行拆分和过滤，过滤掉噪音词或停用词等无实际语义的词语，以得到每条文本信息中具有语义的所有词语。

优选的，建立弱敏感词的检测模型包括以下步骤：

首先，将各条文本信息中具有语义的所有词语归属于各自的训练文本单元中，根据弱敏感词数据库的种类对每条训练文本单元进行分类，如分为淫秽弱敏感词训练文本单元、博彩弱敏感词训练文本单元以及商广弱敏感词训练文本单元，每个种类的弱敏感词库训练文本单元中包括多条训练文本单元；

其次，分别将属于各个种类的弱敏感词库的训练文本单元进行向量化，例如可以采用word2vec模型将训练文本单元转为dm维度词向量；

最后，采用LSTM网络根据向量化后的训练文本单元建立弱敏感词的检测模型，具体方式可以如下：将向量化后的训练文本单元连接到LSTM网络，将 LSTM网络层输出加上位置编码后进行attention操作，然后，attention之后的输出进行池化操作，并且连接到普通的全连接前反馈神经网络层，全连接层的输出连接一个sigmoid层实现二分类的概率输出，从而建立弱敏感词的检测模型。

在本发明所提供的敏感词的检测方法中，检测流程如图2所示，图2为本发明实施例提供的检测流程图，首先进行预判，所述预判模型判断待检测网页内待检测文本中的词语的敏感类型包括以下步骤：

采用网络爬虫定时爬取待检测的网页内容，获取待检测网页内的待检测文本，定时爬取以确保定时多次执行敏感词的检测。

输入待检测文本，根据多模式匹配算法中数组检索得到索引下标z；

根据计算得到的所属段匹配对应的敏感词库的种类名称，即判断出待检测文本中的词语的敏感类型，例如根据所属段得知对应的敏感词库为淫秽强敏感词库、博彩强敏感词库或商广强敏感词库，即可知道待检测文本中的词语属于强敏感词数据库，且敏感种类为淫秽强敏感词库、博彩强敏感词库或商广强敏感词库。若属于强敏感词数据库，则可以直接将检测结果返回到前端界面展示。例如根据所属段得知对应的敏感词库为淫秽弱敏感词库、博彩弱敏感词库或商广弱敏感词库，即可知道待检测文本中的词语属于弱敏感词数据库，且敏感种类为淫秽弱敏感词库、博彩弱敏感词库或商广弱敏感词库。若属于弱敏感词数据库，则进行弱敏感词的进一步检测。

进一步的，若待检测文本属于弱敏感词数据库，则将待检测文本输入弱敏感词的检测模型进行检测，包括以下步骤：

将待检测文本进行拆分和过滤，用于过滤掉噪音词或停用词等无实际语义的词语，以得到每条待检测文本中具有语义的所有词语，从而得到待检测文本单元；

将待检测文本单元进行向量化，例如可以采用word2vec模型将待检测文本单元转为dm维度词向量；

定义一个预设阈值，所述预设阈值可以是根据安全专家经验预设的，若敏感可疑度分值大于预设阈值，则反馈待检测文本所属的弱敏感词数据库的类型和敏感可疑度分值，若敏感可疑度分值小于预设阈值，则反馈待检测文本不包含敏感词。

优选的，所述敏感词的检测方法还包括误报处理，所述误报处理包括以下步骤：

用户反馈出现误报；

综上，在本发明所提供的敏感词的检测方法中，通过建立训练模型中的预判模型，对待检测文本实现最初步的判断，判断待检测文本所包含的词语是否属于敏感词数据库，判断其属于强敏感词数据库还是弱敏感词数据库，并且还能判断其属于强敏感词数据库或弱敏感词数据库中的哪一种类；进一步通过建立弱敏感词的检测模型，将预判为包含弱敏感词的待检测文本进行进一步的检测和辨别，从词语或语句的语义上进行检测判断，从而实现了在不同语义下具有不同解释的词语的检测，增加了检测的准确性和灵活性，降低了误判。

上述仅为本发明的优选实施例而已，并不对本发明起到任何限制作用。任何所属技术领域的技术人员，在不脱离本发明的技术方案的范围内，对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动，均属未脱离本发明的技术方案的内容，仍属于本发明的保护范围之内。

Claims

1.一种敏感词的检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的敏感词的检测方法，其特征在于，所述强敏感词数据库中的强敏感词为在任何前后文语义下都敏感的词语，所述强敏感词数据库中的种类包括淫秽强敏感词库、博彩强敏感词库以及商广强敏感词库；

3.如权利要求1所述的敏感词的检测方法，其特征在于，获取包含有弱敏感词的文本信息包括以下步骤：

4.如权利要求1所述的敏感词的检测方法，其特征在于，打标包括以下步骤：

5.如权利要求2所述的敏感词的检测方法，其特征在于，打标之后，建立弱敏感词的检测模型之前，还包括以下步骤：

6.如权利要求5所述的敏感词的检测方法，其特征在于，建立弱敏感词的检测模型包括以下步骤：

7.如权利要求2所述的敏感词的检测方法，其特征在于，建立所述预判模型包括建立多模式匹配算法，建立多模式匹配算法包括以下步骤：

预设数组长度：取所述每个种类强敏感词库中存储数据的最大容量值，设为第一预设值a，取所述强敏感词库的种类数量的最大值，设为第二预设值x，取所述每个种类弱敏感词库中存储数据的最大容量值，设为第三预设值b，取所述弱敏感词库的种类数量的最大值，设为第四预设值y，数组长度L＝max(a,b)*(x+y)；

8.如权利要求7所述的敏感词的检测方法，其特征在于，进行检测过程中，所述预判模型判断待检测网页内待检测文本中的词语的敏感类型包括以下步骤：

9.如权利要求2所述的敏感词的检测方法，其特征在于，进行检测过程中，将待检测文本输入弱敏感词的检测模型进行检测包括以下步骤：

将待检测文本进行拆分和过滤，得到待检测文本单元；

将待检测文本单元进行向量化；

10.如权利要求1所述的敏感词的检测方法，其特征在于，所述敏感词的检测方法还包括误报处理，所述误报处理包括以下步骤：

用户反馈出现误报；