CN110765302A

CN110765302A - 一种对海量用户生产内容进行自动内容管控的方法

Info

Publication number: CN110765302A
Application number: CN201910894929.6A
Authority: CN
Inventors: 李森和
Original assignee: GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Current assignee: GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Priority date: 2019-09-20
Filing date: 2019-09-20
Publication date: 2020-02-07

Abstract

本发明提供了一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：步骤1）用户输入内容，点击发送至客户端，客户端提示包含敏感词的窗口命令，是否进行确认修改；步骤2）客户端根据其内设置的本地敏感词库验证，查看是否存在敏感词；如过包含敏感词，返回至步骤1），如果不包含敏感词进入下一步骤；步骤3）客户端将用户ID以及发送的内容推送至服务器端；步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统判断风险，步骤5）依据步骤4）的结果判断是否存在高风险，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

Description

一种对海量用户生产内容进行自动内容管控的方法

技术领域

本发明提供了计算机技术领域，涉及一种内容发布管控技术，尤其涉及一种对海量用户生产内容进行自动内容管控的方法。

背景技术

“内容”一词，源于出版媒体业，书报杂志、唱片影带里的创作，叫做内容，所以早期的内容管理CM(Content Management)，偏向出版产品的管理，以储存、流程、元数据(Metadata)为要件来制作系统。内容管理是指对组织机构内部多种格式和媒体类型的信息资源（通常称为信息资产）的组织、分类、管理等有序化过程，常常作为数字图书馆或企业知识管理的一个组成部分。

随着网络的普遍使用，内容管理呈现大数据管理的趋势，现有的内容管理仅是对发布的内容进行关键敏感词进行过滤，关键敏感词进行过滤不能完全的过滤一些例如谐音字、藏头字等，也不能进行语义分析，获取内容中的风险因素。

发明内容

有鉴于此，本发明提供了一种对海量用户生产内容进行自动内容管控的方法。

本发明采用的技术方案为：

一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：

步骤1）用户输入内容，点击发送至客户端，客户端提示包含敏感词的窗口命令，是否进行确认修改；

步骤2）客户端根据其内设置的本地敏感词库验证，查看是否存在敏感词；如过包含敏感词，返回至步骤1），如果不包含敏感词进入下一步骤；

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统以及大数据语义分析判断风险，具体包括：

在风险判断之前，先将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端；

一：通过敏感词系统判断风险，包括

服务器设置一扫描窗口模块，扫描窗口模块用于识别可读格式的图片的边界，在扫描窗口模块内嵌入一驱动模块，该驱动模块驱动滑动模板在扫描窗口模块识别的边界内滑动，识别可读格式的图片上的文字信息，并对识别的文字信息与服务器设置的敏感词库进行比对，查看是否存在敏感词，并遍历整个边界，判断并汇总敏感词风险结果；

二：大数据语义分析判断风险，包括

服务器设置一扫描窗口模块，扫描窗口模块用于识别可读格式的图片的边界，在扫描窗口模块内嵌入一驱动模块，该驱动模块驱动一浮动窗口模块在扫描窗口模块识别的边界内滑动，浮动窗口模块依据识别的特殊字段进行断句，并将获取的断句发送至语义分析模块，语义分析模块对断句进行处理，记录语句表达的情绪等级，并遍历整个边界，判断并汇总语句表达的情绪等级风险结果；

步骤5）依据步骤4）的结果判断是否存在高风险，如果存在高风险，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理；如果不存在高风险，根据用户ID下的历史数据等级判断用户的风险等级并记录，若用户的风险等级超过设定的阈值，则服务器发送至人工审查客户端进行人工审查，若用户的风险等级未超过设定的阈值，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

在步骤5）中，若人工审查存在高风险，人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理；若人工审查未存在高风险，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

在步骤5）中，判断频道风险等级，若频道风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。

在步骤5）中，判断文章风险等级，若文章风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。

本发明的有益效果为：

与传统的技术相比，通过敏感词进行扫描，将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端，扫描窗口模块用于识别可读格式的图片的边界，扫描窗口模块识别的边界内滑动，识别可读格式的图片上的文字信息，并对识别的文字信息与服务器设置的敏感词库进行比对，查看是否存在敏感词，并遍历整个边界，判断并汇总敏感词风险结果；该扫描窗口模块可以在识别的边界内进行横向、纵向以及按照某一角度斜向滑动，因此其可以对整个内容进行全方位的敏感词查看。

与传统的技术相比，通过大数据语义分析判断风险，将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端，浮动窗口模块在扫描窗口模块识别的边界内滑动，浮动窗口模块依据识别的特殊字段进行断句，并将获取的断句发送至语义分析模块，语义分析模块对断句进行处理，记录语句表达的情绪等级，并遍历整个边界，判断并汇总语句表达的情绪等级风险结果；语句表达的情绪等级包括是否包含愤怒情绪，是否包含谐音词汇语句等。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图。

具体实施例

下面将结合附图以及具体实施例来详细说明本发明，在此本发明的示意性实施例以及说明用来解释本发明，但并不作为对本发明的限定。

实施例1

参照图1，一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统判断风险，具体包括：

实施例2

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

以上对本发明实施例所公开的技术方案进行了详细介绍，本文中应用了具体实施例对本发明实施例的原理以及实施方式进行了阐述，以上实施例的说明只适用于帮助理解本发明实施例的原理；同时，对于本领域的一般技术人员，依据本发明实施例，在具体实施方式以及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种对海量用户生产内容进行自动内容管控的方法，其特征在于，包括如下的步骤：

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

一：通过敏感词系统判断风险，包括

二：大数据语义分析判断风险，包括

2.根据权利要求1所述的对海量用户生产内容进行自动内容管控的方法，其特征在于，在步骤5）中，若人工审查存在高风险，人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理；若人工审查未存在高风险，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

3.根据权利要求1或2所述的对海量用户生产内容进行自动内容管控的方法，其特征在于，在步骤5）中，判断频道风险等级，若频道风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。

4.根据权利要求1或2所述的对海量用户生产内容进行自动内容管控的方法，其特征在于，在步骤5）中，判断文章风险等级，若文章风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。