CN115618844A

CN115618844A - 一种基于人工智能的内容审核系统及方法

Info

Publication number: CN115618844A
Application number: CN202211638108.4A
Authority: CN
Inventors: 孙迎军; 陈明杰; 张锐; 陈磊; 黄月霞
Original assignee: Jiangsu Longhuwang Information Technology Co ltd
Current assignee: Jiangsu Longhuwang Information Technology Co ltd
Priority date: 2022-12-20
Filing date: 2022-12-20
Publication date: 2023-01-17
Anticipated expiration: 2042-12-20
Also published as: CN115618844B

Abstract

本发明公开了一种基于人工智能的内容审核系统及方法，包括：审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块，通过审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据，通过数据管理中心存储并管理采集到的全部数据，通过内容审核管理模块利用神经网络模型对新闻内容进行审核，并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中，通过内容修改管理模块匹配审核出的错误信息，对相似的错误信息统一进行修改信息标记，通过审核预警模块预判当前内容能否按时发布并进行预警，加快了内容审核、修改以及发布的整体进度，降低了内容发布延迟的概率。

Description

一种基于人工智能的内容审核系统及方法

技术领域

本发明涉及人工智能技术领域，具体为一种基于人工智能的内容审核系统及方法。

背景技术

在人工智能技术驱动下，为加快使用传统媒体和新兴媒体融合发展的需求，急需开展前沿技术嵌入，为解决传统内容审核完全依靠人工处理导致审核效率无法提高的问题，采用人工智能技术对新闻内容进行智能化审核是媒体行业的发展趋势；

然而，现有的内容审核方式仍然存在以下问题：首先，在对内容审核完成后需要对错误或不当内容进行修改，利用人工智能技术对内容进行审核，在审核处错误或者不当的内容时，无法提供建议修改信息，从而导致无法在进行审核的同时兼顾加快内容审核、修改以及发布的整体进度；其次，部分新闻内容从审核到发布是有限制时间的，现有技术在对内容进行审核时无法提前对内容是否能够准时发布进行预判，相关人员依旧按照平常进度进行审核、修改，容易导致内容发布出现延迟现象。

所以，人们需要一种基于人工智能的内容审核系统及方法来解决上述问题。

发明内容

本发明的目的在于提供一种基于人工智能的内容审核系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种基于人工智能的内容审核系统，所述系统包括：审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块；

所述审核信息采集模块的输出端连接所述数据管理中心的输入端，所述数据管理中心的输出端连接所述内容审核管理模块的输入端，所述内容审核管理模块的输出端连接所述内容修改管理模块的输入端，所述内容修改管理模块的输出端连接所述审核预警模块的输入端；

通过所述审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据，将采集到的全部数据传输到所述数据管理中心；

通过所述数据管理中心存储并管理采集到的全部数据；

通过所述内容审核管理模块利用神经网络模型对新闻内容进行审核，并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中；

通过所述内容修改管理模块匹配审核出的错误内容所表达的信息，对相似的错误信息统一进行修改信息标记；

通过所述审核预警模块预测当前审核和修改需要花费的时间，在判断出当前内容不能按时发布时发出预警信号。

进一步的，所述审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元；

所述修改信息采集单元、审核时间采集单元和修改时间采集单元的输出端连接所述数据管理中心的输入端；

所述修改信息采集单元用于采集已审核出的错误内容以及错误内容对应的修改信息；

所述审核时间采集单元用于采集已审核完成内容的审核花费的时间和审核数据量；

所述修改时间采集单元用于采集对已审核出的错误内容进行修改需要的时间数据。

进一步的，所述内容审核管理模块包括修改信息输入单元和人工智能审核单元；

所述修改信息输入单元的输入端连接所述数据管理中心的输出端，所述修改信息输入单元的输出端连接所述人工智能审核单元的输入端；

所述修改信息输入单元用于将错误内容及其对应的修改信息输入到文本检测模型中进行存储，所述文本检测模型由神经网络模型训练形成；

所述人工智能审核单元用于将当前待审核的内容输入到文本检测模型中，利用文本检测模型对内容进行审核：将当前待审核的内容与错误内容进行文本匹配，若匹配成功，说明当前待审核的内容为错误内容，在错误内容所在位置进行标记；若匹配失败，利用人工审核方式对当前待审核的内容进行二次审核。

进一步的，所述内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元；

所述修改内容匹配单元的输入端连接所述人工智能审核单元的输出端，所述修改内容匹配单元的输出端连接所述修改定位单元的输入端，所述修改定位单元的输出端连接所述集中标记单元的输入端；

所述修改内容匹配单元用于在利用神经网络模型审核出错误内容后，将审核出的错误内容所表达的信息进行文本匹配，获取匹配到的相似错误信息；

所述修改定位单元用于确认相似错误信息的修改位置；

所述集中标记单元用于在标记错误内容的同时标记修改信息，在相似错误信息的修改位置处对相同的修改信息进行标记，所述相同的修改信息从文本检测模型中选取。

进一步的，所述审核预警模块包括按时发布预测单元和延时预警单元；

所述按时发布预测单元的输入端连接所述数据管理中心的输出端，所述按时发布预测单元的输出端连接所述延时预警单元的输入端；

所述按时发布预测单元用于获取当前待审核内容的数据量和修改位置数量，调取并分析以往审核并修改不同内容时花费的时间，并对审核并修改当前内容需要的时间进行预测，判断内容是否能够按时发布；

所述延时预警单元用于若预测到当前内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度。

一种基于人工智能的内容审核方法，包括以下步骤：

Z1：采集新闻内容的历史审核数据以及对以往审核出的错误内容进行修改的信息；

Z2：对当前新闻内容进行审核，获取审核出的错误内容及其对应的修改信息；

Z3：对审核出的错误内容表达的信息进行匹配，对相似的错误内容表达的信息统一进行修改信息标记。

进一步的，在步骤Z1中：采集到已审核完成的新闻内容数据量集合为B={B1，B2，…，Bn}，采集到审核对应新闻内容时花费的时间集合为t={t1，t2，…，tn}，修改对应新闻内容花费的时间集合为T={T1，T2，…，Tn}，其中，n表示已完成的审核次数；

在步骤Z2中：将当前待审核的内容输入到文本检测模型中进行检测：将文本检测模型中的错误内容与当前待审核的内容进行匹配，判断当前待审核的内容中是否存在与文本检测模型中相同的错误内容：若存在，表示匹配成功，对错误内容进行标记；若不存在，表示匹配失败，利用人工审核方式对当前待审核的内容进行二次审核。

进一步的，在步骤Z3中：将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中，若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容，在标记当前错误内容的同时在当前错误内容处标记对应的修改信息，获取到共有m处错误内容需要修改，当前错误内容表达的信息集合为W={W1，W2，…，Wm}，将错误内容表达的信息转化为字符串，得到字符串集合为s={s1，s2，…，sm}，获取到字符串长度集合为length（s）={ length（s1），length（s2），…，length（sm）}，获取到随机两处错误信息转化为字符串后，两个字符串中相同字符个数为c（si，sj），根据下列公式计算随机两处错误信息的综合相似度Au：

；

其中，

表示描述随机两处错误信息共性需要的信息量，

表示完整描述随机两处错误信息需要的信息量，length（si）和length（sj）表示将对应两处错误信息转化为字符串后，对应两个字符串长度，Wi和Wj表示当前随机两处错误内容表达的信息，si和sj表示将对应两处错误内容表达的信息转化后得到的字符串，根据相同计算方式得到错误信息两两间的综合相似度集合为A={A1，A2，…，Au，…，Aq}，其中，q表示综合相似度项数，

，设置综合相似度阈值为A^’，比较综合相似度和阈值：对超出阈值的综合相似度对应的错误信息进行统一标记：在对应错误信息处标记相同的修改信息，将标记完成的内容发送给相关人员供参考修改，在审核出错误内容后，标记错误内容的同时提供建议的修改信息，有利于在审核内容的同时兼顾加快内容审核、修改以及发布的整体进度，分析一篇新闻稿件中审核出的错误信息的综合相似度的目的在于筛选出相似错误信息，对这些错误信息进行一并修改，有利于进一步加快内容的修改速度，推动内容发布，在进行综合相似度分析时，不单独从信息间存在的相同字符占总体字符的比例这一方面进行分析，而是利用信息论中两者包含的描述共性的信息量占总信息量的比例进行结合分析，有利于提高分析结果的准确性。

进一步的，该方法还包括以下内容：调取并分析以往审核并修改不同内容时花费的时间，预测审核并修改当前新闻内容需要花费的时间：建立线性回归预测模型：y=E*x+b，其中，E表示权重参数，b表示偏置，通过求解E和b得到预测模型，根据调取的数据获取得到训练数据集为{（B1，t1+T1），（B2，t2+T2），…，（Bn，tn+Tn）}，根据下列公式分别求解E和b：

；

；

其中，Bi表示随机一个已审核完成的新闻内容数据量，ti表示审核对应已审核完成的新闻内容花费的时间，Ti表示修改对应新闻内容花费的时间，采集到当前新闻内容数据量为B^’，将B^’代入到线性回归预测模型中，预测得到审核并修改当前新闻内容需要花费的时间为V：V=E* B^’+b。

进一步的，判断当前新闻内容是否能够按时发布：获取到当前审核内容的发布截止时间为T_截，审核开始的时间为T_起，比较V和T_截-T_起：若V≤T_截-T_起，判断当前新闻内容能够按时发布；若V>T_截-T_起，判断当前新闻内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度，在对内容进行审核时提前对内容是否能够准时发布进行预判，有利于帮助相关人员及时调整审核、修改的进度，降低了内容发布延迟的概率，利用线性回归预测模型预测当前内容是否能够按时发布，内容数据量的多少将直接影响到审核和修改需要的时间长短，在进行线性回归预测时一并预测了审核和修改需要花费的总时间，有利于简单快速地得到预测结果。

与现有技术相比，本发明所达到的有益效果是：

本发明利用人工智能技术对内容进行审核，提高了传统只依靠人工处理的方式进行内容审核的效率，结合人工智能和人工审核两种方式进行内容审核，提高了审核的严谨度以及发布内容的质量；在审核出错误内容后对错误信息进行标记，同时标记了修改信息供相关人员参考，在审核的同时兼顾加快了内容审核、修改以及发布的整体进度，筛选出相似错误信息，对这些错误信息进行一并修改，进一步地加快了内容的修改速度以推动内容发布，在对内容进行审核时提前对内容是否能够准时发布进行预判，帮助相关人员及时调整审核、修改的进度，有效解决了内容发布容易出现延迟现象的问题。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明一种基于人工智能的内容审核系统的结构图；

图2是本发明一种基于人工智能的内容审核方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参阅图1-图2，本发明提供技术方案：一种基于人工智能的内容审核系统，系统包括：审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块；

审核信息采集模块的输出端连接数据管理中心的输入端，数据管理中心的输出端连接内容审核管理模块的输入端，内容审核管理模块的输出端连接内容修改管理模块的输入端，内容修改管理模块的输出端连接审核预警模块的输入端；

通过审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据，将采集到的全部数据传输到数据管理中心；

通过数据管理中心存储并管理采集到的全部数据；

通过内容审核管理模块利用神经网络模型对新闻内容进行审核，并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中；

通过内容修改管理模块匹配审核出的错误内容所表达的信息，对相似的错误信息统一进行修改信息标记；

通过审核预警模块预测当前审核和修改需要花费的时间，在判断出当前内容不能按时发布时发出预警信号。

审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元；

修改信息采集单元、审核时间采集单元和修改时间采集单元的输出端连接数据管理中心的输入端；

修改信息采集单元用于采集已审核出的错误内容以及错误内容对应的修改信息；

审核时间采集单元用于采集已审核完成内容的审核花费的时间和审核数据量；

修改时间采集单元用于采集对已审核出的错误内容进行修改需要的时间数据。

内容审核管理模块包括修改信息输入单元和人工智能审核单元；

修改信息输入单元的输入端连接数据管理中心的输出端，修改信息输入单元的输出端连接人工智能审核单元的输入端；

修改信息输入单元用于将错误内容及其对应的修改信息输入到文本检测模型中进行存储，文本检测模型由神经网络模型训练形成；

人工智能审核单元用于将当前待审核的内容输入到文本检测模型中，利用文本检测模型对内容进行审核：将当前待审核的内容与错误内容进行文本匹配，若匹配成功，说明当前待审核的内容为错误内容，在错误内容所在位置进行标记；若匹配失败，利用人工审核方式对当前待审核的内容进行二次审核。

内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元；

修改内容匹配单元的输入端连接人工智能审核单元的输出端，修改内容匹配单元的输出端连接修改定位单元的输入端，修改定位单元的输出端连接集中标记单元的输入端；

修改内容匹配单元用于在利用神经网络模型审核出错误内容后，将审核出的错误内容所表达的信息进行文本匹配，获取匹配到的相似错误信息；

修改定位单元用于确认相似错误信息的修改位置；

集中标记单元用于在标记错误内容的同时标记修改信息，在相似错误信息的修改位置处对相同的修改信息进行标记，相同的修改信息从文本检测模型中选取。

审核预警模块包括按时发布预测单元和延时预警单元；

按时发布预测单元的输入端连接数据管理中心的输出端，按时发布预测单元的输出端连接延时预警单元的输入端；

按时发布预测单元用于获取当前待审核内容的数据量和修改位置数量，调取并分析以往审核并修改不同内容时花费的时间，并对审核并修改当前内容需要的时间进行预测，判断内容是否能够按时发布；

延时预警单元用于若预测到当前内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度。

一种基于人工智能的内容审核方法，包括以下步骤：

在步骤Z1中：采集到已审核完成的新闻内容数据量集合为B={B1，B2，…，Bn}，采集到审核对应新闻内容时花费的时间集合为t={t1，t2，…，tn}，修改对应新闻内容花费的时间集合为T={T1，T2，…，Tn}，其中，n表示已完成的审核次数；

在步骤Z3中：将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中，若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容，在标记当前错误内容的同时在当前错误内容处标记对应的修改信息，获取到共有m处错误内容需要修改，当前错误内容表达的信息集合为W={W1，W2，…，Wm}，将错误内容表达的信息转化为字符串，得到字符串集合为s={s1，s2，…，sm}，获取到字符串长度集合为length（s）={length（s1），length（s2），…，length（sm）}，获取到随机两处错误信息转化为字符串后，两个字符串中相同字符个数为c（si，sj），根据下列公式计算随机两处错误信息的综合相似度Au：

；

其中，

表示描述随机两处错误信息共性需要的信息量，

，设置综合相似度阈值为A^’，比较综合相似度和阈值：对超出阈值的综合相似度对应的错误信息进行统一标记：在对应错误信息处标记相同的修改信息，将标记完成的内容发送给相关人员供参考修改，提高了综合相似度分析结果的准确性，在审核内容的同时兼顾加快了内容审核、修改以及发布的整体进度。

方法还包括以下内容：调取并分析以往审核并修改不同内容时花费的时间，预测审核并修改当前新闻内容需要花费的时间：建立线性回归预测模型：y=E*x+b，其中，E表示权重参数，b表示偏置，通过求解E和b得到预测模型，根据调取的数据获取得到训练数据集为{（B1，t1+T1），（B2，t2+T2），…，（Bn，tn+Tn）}，根据下列公式分别求解E和b：

；

；

判断当前新闻内容是否能够按时发布：获取到当前审核内容的发布截止时间为T_截，审核开始的时间为T_起，比较V和T_截-T_起：若V≤T_截-T_起，判断当前新闻内容能够按时发布；若V>T_截-T_起，判断当前新闻内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度，在对内容进行审核时提前对内容是否能够准时发布进行预判，帮助相关人员及时调整审核、修改的进度，降低了内容发布延迟的概率。

实施例一：在监测到当前待审核的内容中存在与文本检测模型中相同的错误内容时，在标记当前错误内容的同时在当前错误内容处标记对应的修改信息，获取到共有m=3处错误内容需要修改，当前错误内容表达的信息集合为W={W1，W2，W3}，将错误内容表达的信息转化为字符串，得到字符串集合为s={s1，s2，s3}，获取到字符串长度集合为length（s）= { length（s1），length（s2），length（s3）}={15，22，10}，获取到随机两处错误信息转化为字符串后，两个字符串中相同字符个数为c（s1，s2）=10，获取到描述对应两处错误信息共性需要的信息量为20，完整描述对应两处错误信息需要的信息量为：25，单位为：比特，根据公式

计算对应两处错误信息的综合相似度A1≈0.67，根据相同计算方式得到错误信息两两间的综合相似度集合为A={A1，A2，A3}={0.67，0.92，0.85}，设置综合相似度阈值为A^’=0.9，比较综合相似度和阈值：A1<A^’，A2>A^’，A3<A^’，对错误信息W1和W3进行统一标记：在对应错误信息处标记相同的修改信息，将标记完成的内容发送给相关人员供参考修改；

实施例二：采集到已审核完成的新闻内容数据量集合为B={B1，B2，B3}={1.3，2， 1.5}，单位为：KB，采集到审核对应新闻内容时花费的时间集合为t={t1，t2，t3}={1.5，3， 5}，修改对应新闻内容花费的时间集合为T={T1，T2，T3}={1，2，3}，单位为：天，建立线性回归预测模型：y=E*x+b，通过求解E和b得到预测模型，根据调取的数据获取得到训练数据集为{（B1，t1+T1），（B2，t2+T2），（Bn，t3+T3）}={（1.3，2.5），（2，5），（1.5，8）}，根据公式

和

分别求解E 和b，得到E=0.57，b≈4.3，采集到当前新闻内容数据量为B^’=2.4，将B^’=2.4代入到线性回归预测模型中，预测得到审核并修改当前新闻内容需要花费的时间为V：V=E* B^’+b≈6，获取到当前审核内容的发布截止时间为T_截：3月5日，审核开始的时间为T_起：3月1日，比较V和T_截- T_起：V=6>T_截-T_起=5，判断当前新闻内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度。

最后应说明的是：以上所述仅为本发明的优选实例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的内容审核系统，其特征在于：所述系统包括：审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块；

通过所述数据管理中心存储并管理采集到的全部数据；

2.根据权利要求1所述的一种基于人工智能的内容审核系统，其特征在于：所述审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元；

3.根据权利要求1所述的一种基于人工智能的内容审核系统，其特征在于：所述内容审核管理模块包括修改信息输入单元和人工智能审核单元；

4.根据权利要求3所述的一种基于人工智能的内容审核系统，其特征在于：所述内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元；

所述修改定位单元用于确认相似错误信息的修改位置；

5.根据权利要求1所述的一种基于人工智能的内容审核系统，其特征在于：所述审核预警模块包括按时发布预测单元和延时预警单元；

6.一种基于人工智能的内容审核方法，其特征在于：包括以下步骤：

7.根据权利要求6所述的一种基于人工智能的内容审核方法，其特征在于：在步骤Z1中：采集到已审核完成的新闻内容数据量集合为B={B1，B2，…，Bn}，采集到审核对应新闻内容时花费的时间集合为t={t1，t2，…，tn}，修改对应新闻内容花费的时间集合为T={T1，T2，…，Tn}，其中，n表示已完成的审核次数；

8.根据权利要求7所述的一种基于人工智能的内容审核方法，其特征在于：在步骤Z3中：将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中，若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容，在标记当前错误内容的同时在当前错误内容处标记对应的修改信息，获取到共有m处错误内容需要修改，当前错误内容表达的信息集合为W={W1，W2，…，Wm}，将错误内容表达的信息转化为字符串，得到字符串集合为s={s1，s2，…，sm}，获取到字符串长度集合为length（s）={ length（s1），length（s2），…，length（sm）}，获取到随机两处错误信息转化为字符串后，两个字符串中相同字符个数为c（si，sj），根据下列公式计算随机两处错误信息的综合相似度Au：

；

其中，

表示描述随机两处错误信息共性需要的信息量，

，设置综合相似度阈值为A^’，比较综合相似度和阈值：对超出阈值的综合相似度对应的错误信息进行统一标记：在对应错误信息处标记相同的修改信息，将标记完成的内容发送给相关人员供参考修改。

9.根据权利要求7所述的一种基于人工智能的内容审核方法，其特征在于：该方法还包括以下内容：调取并分析以往审核并修改不同内容时花费的时间，预测审核并修改当前新闻内容需要花费的时间：建立线性回归预测模型：y=E*x+b，其中，E表示权重参数，b表示偏置，通过求解E和b得到预测模型，根据调取的数据获取得到训练数据集为{（B1，t1+T1），（B2，t2+T2），…，（Bn，tn+Tn）}，根据下列公式分别求解E和b：

；

；

10.根据权利要求9所述的一种基于人工智能的内容审核方法，其特征在于：判断当前新闻内容是否能够按时发布：获取到当前审核内容的发布截止时间为T_截，审核开始的时间为T_起，比较V和T_截-T_起：若V≤T_截-T_起，判断当前新闻内容能够按时发布；若V>T_截-T_起，判断当前新闻内容无法按时发布，发出延时预警信号，提醒相关人员加快审核和修改进度。