CN115618844A - 一种基于人工智能的内容审核系统及方法 - Google Patents

一种基于人工智能的内容审核系统及方法 Download PDF

Info

Publication number
CN115618844A
CN115618844A CN202211638108.4A CN202211638108A CN115618844A CN 115618844 A CN115618844 A CN 115618844A CN 202211638108 A CN202211638108 A CN 202211638108A CN 115618844 A CN115618844 A CN 115618844A
Authority
CN
China
Prior art keywords
content
error
information
modification
auditing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211638108.4A
Other languages
English (en)
Other versions
CN115618844B (zh
Inventor
孙迎军
陈明杰
张锐
陈磊
黄月霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Longhuwang Information Technology Co ltd
Original Assignee
Jiangsu Longhuwang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Longhuwang Information Technology Co ltd filed Critical Jiangsu Longhuwang Information Technology Co ltd
Priority to CN202211638108.4A priority Critical patent/CN115618844B/zh
Publication of CN115618844A publication Critical patent/CN115618844A/zh
Application granted granted Critical
Publication of CN115618844B publication Critical patent/CN115618844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于人工智能的内容审核系统及方法,包括:审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块,通过审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据,通过数据管理中心存储并管理采集到的全部数据,通过内容审核管理模块利用神经网络模型对新闻内容进行审核,并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中,通过内容修改管理模块匹配审核出的错误信息,对相似的错误信息统一进行修改信息标记,通过审核预警模块预判当前内容能否按时发布并进行预警,加快了内容审核、修改以及发布的整体进度,降低了内容发布延迟的概率。

Description

一种基于人工智能的内容审核系统及方法
技术领域
本发明涉及人工智能技术领域,具体为一种基于人工智能的内容审核系统及方法。
背景技术
在人工智能技术驱动下,为加快使用传统媒体和新兴媒体融合发展的需求,急需开展前沿技术嵌入,为解决传统内容审核完全依靠人工处理导致审核效率无法提高的问题,采用人工智能技术对新闻内容进行智能化审核是媒体行业的发展趋势;
然而,现有的内容审核方式仍然存在以下问题:首先,在对内容审核完成后需要对错误或不当内容进行修改,利用人工智能技术对内容进行审核,在审核处错误或者不当的内容时,无法提供建议修改信息,从而导致无法在进行审核的同时兼顾加快内容审核、修改以及发布的整体进度;其次,部分新闻内容从审核到发布是有限制时间的,现有技术在对内容进行审核时无法提前对内容是否能够准时发布进行预判,相关人员依旧按照平常进度进行审核、修改,容易导致内容发布出现延迟现象。
所以,人们需要一种基于人工智能的内容审核系统及方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于人工智能的内容审核系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于人工智能的内容审核系统,所述系统包括:审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块;
所述审核信息采集模块的输出端连接所述数据管理中心的输入端,所述数据管理中心的输出端连接所述内容审核管理模块的输入端,所述内容审核管理模块的输出端连接所述内容修改管理模块的输入端,所述内容修改管理模块的输出端连接所述审核预警模块的输入端;
通过所述审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据,将采集到的全部数据传输到所述数据管理中心;
通过所述数据管理中心存储并管理采集到的全部数据;
通过所述内容审核管理模块利用神经网络模型对新闻内容进行审核,并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中;
通过所述内容修改管理模块匹配审核出的错误内容所表达的信息,对相似的错误信息统一进行修改信息标记;
通过所述审核预警模块预测当前审核和修改需要花费的时间,在判断出当前内容不能按时发布时发出预警信号。
进一步的,所述审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元;
所述修改信息采集单元、审核时间采集单元和修改时间采集单元的输出端连接所述数据管理中心的输入端;
所述修改信息采集单元用于采集已审核出的错误内容以及错误内容对应的修改信息;
所述审核时间采集单元用于采集已审核完成内容的审核花费的时间和审核数据量;
所述修改时间采集单元用于采集对已审核出的错误内容进行修改需要的时间数据。
进一步的,所述内容审核管理模块包括修改信息输入单元和人工智能审核单元;
所述修改信息输入单元的输入端连接所述数据管理中心的输出端,所述修改信息输入单元的输出端连接所述人工智能审核单元的输入端;
所述修改信息输入单元用于将错误内容及其对应的修改信息输入到文本检测模型中进行存储,所述文本检测模型由神经网络模型训练形成;
所述人工智能审核单元用于将当前待审核的内容输入到文本检测模型中,利用文本检测模型对内容进行审核:将当前待审核的内容与错误内容进行文本匹配,若匹配成功,说明当前待审核的内容为错误内容,在错误内容所在位置进行标记;若匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
进一步的,所述内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元;
所述修改内容匹配单元的输入端连接所述人工智能审核单元的输出端,所述修改内容匹配单元的输出端连接所述修改定位单元的输入端,所述修改定位单元的输出端连接所述集中标记单元的输入端;
所述修改内容匹配单元用于在利用神经网络模型审核出错误内容后,将审核出的错误内容所表达的信息进行文本匹配,获取匹配到的相似错误信息;
所述修改定位单元用于确认相似错误信息的修改位置;
所述集中标记单元用于在标记错误内容的同时标记修改信息,在相似错误信息的修改位置处对相同的修改信息进行标记,所述相同的修改信息从文本检测模型中选取。
进一步的,所述审核预警模块包括按时发布预测单元和延时预警单元;
所述按时发布预测单元的输入端连接所述数据管理中心的输出端,所述按时发布预测单元的输出端连接所述延时预警单元的输入端;
所述按时发布预测单元用于获取当前待审核内容的数据量和修改位置数量,调取并分析以往审核并修改不同内容时花费的时间,并对审核并修改当前内容需要的时间进行预测,判断内容是否能够按时发布;
所述延时预警单元用于若预测到当前内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度。
一种基于人工智能的内容审核方法,包括以下步骤:
Z1:采集新闻内容的历史审核数据以及对以往审核出的错误内容进行修改的信息;
Z2:对当前新闻内容进行审核,获取审核出的错误内容及其对应的修改信息;
Z3:对审核出的错误内容表达的信息进行匹配,对相似的错误内容表达的信息统一进行修改信息标记。
进一步的,在步骤Z1中:采集到已审核完成的新闻内容数据量集合为B={B1,B2,…,Bn},采集到审核对应新闻内容时花费的时间集合为t={t1,t2,…,tn},修改对应新闻内容花费的时间集合为T={T1,T2,…,Tn},其中,n表示已完成的审核次数;
在步骤Z2中:将当前待审核的内容输入到文本检测模型中进行检测:将文本检测模型中的错误内容与当前待审核的内容进行匹配,判断当前待审核的内容中是否存在与文本检测模型中相同的错误内容:若存在,表示匹配成功,对错误内容进行标记;若不存在,表示匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
进一步的,在步骤Z3中:将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中,若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容,在标记当前错误内容的同时在当前错误内容处标记对应的修改信息,获取到共有m处错误内容需要修改,当前错误内容表达的信息集合为W={W1,W2,…,Wm},将错误内容表达的信息转化为字符串,得到字符串集合为s={s1,s2,…,sm},获取到字符串长度集合为length(s)={ length(s1),length(s2),…,length(sm)},获取到随机两处错误信息转化为字符串后,两个字符串中相同字符个数为c(si,sj),根据下列公式计算随机两处错误信息的综合相似度Au:
Figure 673916DEST_PATH_IMAGE001
其中,
Figure 100002_DEST_PATH_IMAGE002
表示描述随机两处错误信息共性需要的信息量,
Figure 691551DEST_PATH_IMAGE003
表示完整描述随机两处错误信息需要的信息量,length(si)和length(sj) 表示将对应两处错误信息转化为字符串后,对应两个字符串长度,Wi和Wj表示当前随机两 处错误内容表达的信息,si和sj表示将对应两处错误内容表达的信息转化后得到的字符 串,根据相同计算方式得到错误信息两两间的综合相似度集合为A={A1,A2,…,Au,…,Aq}, 其中,q表示综合相似度项数,
Figure 100002_DEST_PATH_IMAGE004
,设置综合相似度阈值为A,比较综合相似度和阈值: 对超出阈值的综合相似度对应的错误信息进行统一标记:在对应错误信息处标记相同的修 改信息,将标记完成的内容发送给相关人员供参考修改,在审核出错误内容后,标记错误内 容的同时提供建议的修改信息,有利于在审核内容的同时兼顾加快内容审核、修改以及发 布的整体进度,分析一篇新闻稿件中审核出的错误信息的综合相似度的目的在于筛选出相 似错误信息,对这些错误信息进行一并修改,有利于进一步加快内容的修改速度,推动内容 发布,在进行综合相似度分析时,不单独从信息间存在的相同字符占总体字符的比例这一 方面进行分析,而是利用信息论中两者包含的描述共性的信息量占总信息量的比例进行结 合分析,有利于提高分析结果的准确性。
进一步的,该方法还包括以下内容:调取并分析以往审核并修改不同内容时花费的时间,预测审核并修改当前新闻内容需要花费的时间:建立线性回归预测模型:y=E*x+b,其中,E表示权重参数,b表示偏置,通过求解E和b得到预测模型,根据调取的数据获取得到训练数据集为{(B1,t1+T1),(B2,t2+T2),…,(Bn,tn+Tn)},根据下列公式分别求解E和b:
Figure 779592DEST_PATH_IMAGE005
Figure 100002_DEST_PATH_IMAGE006
其中,Bi表示随机一个已审核完成的新闻内容数据量,ti表示审核对应已审核完成的新闻内容花费的时间,Ti表示修改对应新闻内容花费的时间,采集到当前新闻内容数据量为B,将B代入到线性回归预测模型中,预测得到审核并修改当前新闻内容需要花费的时间为V:V=E* B+b。
进一步的,判断当前新闻内容是否能够按时发布:获取到当前审核内容的发布截止时间为T,审核开始的时间为T,比较V和T-T:若V≤T-T,判断当前新闻内容能够按时发布;若V>T-T,判断当前新闻内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度,在对内容进行审核时提前对内容是否能够准时发布进行预判,有利于帮助相关人员及时调整审核、修改的进度,降低了内容发布延迟的概率,利用线性回归预测模型预测当前内容是否能够按时发布,内容数据量的多少将直接影响到审核和修改需要的时间长短,在进行线性回归预测时一并预测了审核和修改需要花费的总时间,有利于简单快速地得到预测结果。
与现有技术相比,本发明所达到的有益效果是:
本发明利用人工智能技术对内容进行审核,提高了传统只依靠人工处理的方式进行内容审核的效率,结合人工智能和人工审核两种方式进行内容审核,提高了审核的严谨度以及发布内容的质量;在审核出错误内容后对错误信息进行标记,同时标记了修改信息供相关人员参考,在审核的同时兼顾加快了内容审核、修改以及发布的整体进度,筛选出相似错误信息,对这些错误信息进行一并修改,进一步地加快了内容的修改速度以推动内容发布,在对内容进行审核时提前对内容是否能够准时发布进行预判,帮助相关人员及时调整审核、修改的进度,有效解决了内容发布容易出现延迟现象的问题。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于人工智能的内容审核系统的结构图;
图2是本发明一种基于人工智能的内容审核方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1-图2,本发明提供技术方案:一种基于人工智能的内容审核系统,系统包括:审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块;
审核信息采集模块的输出端连接数据管理中心的输入端,数据管理中心的输出端连接内容审核管理模块的输入端,内容审核管理模块的输出端连接内容修改管理模块的输入端,内容修改管理模块的输出端连接审核预警模块的输入端;
通过审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据,将采集到的全部数据传输到数据管理中心;
通过数据管理中心存储并管理采集到的全部数据;
通过内容审核管理模块利用神经网络模型对新闻内容进行审核,并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中;
通过内容修改管理模块匹配审核出的错误内容所表达的信息,对相似的错误信息统一进行修改信息标记;
通过审核预警模块预测当前审核和修改需要花费的时间,在判断出当前内容不能按时发布时发出预警信号。
审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元;
修改信息采集单元、审核时间采集单元和修改时间采集单元的输出端连接数据管理中心的输入端;
修改信息采集单元用于采集已审核出的错误内容以及错误内容对应的修改信息;
审核时间采集单元用于采集已审核完成内容的审核花费的时间和审核数据量;
修改时间采集单元用于采集对已审核出的错误内容进行修改需要的时间数据。
内容审核管理模块包括修改信息输入单元和人工智能审核单元;
修改信息输入单元的输入端连接数据管理中心的输出端,修改信息输入单元的输出端连接人工智能审核单元的输入端;
修改信息输入单元用于将错误内容及其对应的修改信息输入到文本检测模型中进行存储,文本检测模型由神经网络模型训练形成;
人工智能审核单元用于将当前待审核的内容输入到文本检测模型中,利用文本检测模型对内容进行审核:将当前待审核的内容与错误内容进行文本匹配,若匹配成功,说明当前待审核的内容为错误内容,在错误内容所在位置进行标记;若匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元;
修改内容匹配单元的输入端连接人工智能审核单元的输出端,修改内容匹配单元的输出端连接修改定位单元的输入端,修改定位单元的输出端连接集中标记单元的输入端;
修改内容匹配单元用于在利用神经网络模型审核出错误内容后,将审核出的错误内容所表达的信息进行文本匹配,获取匹配到的相似错误信息;
修改定位单元用于确认相似错误信息的修改位置;
集中标记单元用于在标记错误内容的同时标记修改信息,在相似错误信息的修改位置处对相同的修改信息进行标记,相同的修改信息从文本检测模型中选取。
审核预警模块包括按时发布预测单元和延时预警单元;
按时发布预测单元的输入端连接数据管理中心的输出端,按时发布预测单元的输出端连接延时预警单元的输入端;
按时发布预测单元用于获取当前待审核内容的数据量和修改位置数量,调取并分析以往审核并修改不同内容时花费的时间,并对审核并修改当前内容需要的时间进行预测,判断内容是否能够按时发布;
延时预警单元用于若预测到当前内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度。
一种基于人工智能的内容审核方法,包括以下步骤:
Z1:采集新闻内容的历史审核数据以及对以往审核出的错误内容进行修改的信息;
Z2:对当前新闻内容进行审核,获取审核出的错误内容及其对应的修改信息;
Z3:对审核出的错误内容表达的信息进行匹配,对相似的错误内容表达的信息统一进行修改信息标记。
在步骤Z1中:采集到已审核完成的新闻内容数据量集合为B={B1,B2,…,Bn},采集到审核对应新闻内容时花费的时间集合为t={t1,t2,…,tn},修改对应新闻内容花费的时间集合为T={T1,T2,…,Tn},其中,n表示已完成的审核次数;
在步骤Z2中:将当前待审核的内容输入到文本检测模型中进行检测:将文本检测模型中的错误内容与当前待审核的内容进行匹配,判断当前待审核的内容中是否存在与文本检测模型中相同的错误内容:若存在,表示匹配成功,对错误内容进行标记;若不存在,表示匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
在步骤Z3中:将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中,若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容,在标记当前错误内容的同时在当前错误内容处标记对应的修改信息,获取到共有m处错误内容需要修改,当前错误内容表达的信息集合为W={W1,W2,…,Wm},将错误内容表达的信息转化为字符串,得到字符串集合为s={s1,s2,…,sm},获取到字符串长度集合为length(s)={length(s1),length(s2),…,length(sm)},获取到随机两处错误信息转化为字符串后,两个字符串中相同字符个数为c(si,sj),根据下列公式计算随机两处错误信息的综合相似度Au:
Figure 233576DEST_PATH_IMAGE001
其中,
Figure 104580DEST_PATH_IMAGE002
表示描述随机两处错误信息共性需要的信息量,
Figure 304618DEST_PATH_IMAGE003
表示完整描述随机两处错误信息需要的信息量,length(si)和length(sj) 表示将对应两处错误信息转化为字符串后,对应两个字符串长度,Wi和Wj表示当前随机两 处错误内容表达的信息,si和sj表示将对应两处错误内容表达的信息转化后得到的字符 串,根据相同计算方式得到错误信息两两间的综合相似度集合为A={A1,A2,…,Au,…,Aq}, 其中,q表示综合相似度项数,
Figure 484932DEST_PATH_IMAGE004
,设置综合相似度阈值为A,比较综合相似度和阈值: 对超出阈值的综合相似度对应的错误信息进行统一标记:在对应错误信息处标记相同的修 改信息,将标记完成的内容发送给相关人员供参考修改,提高了综合相似度分析结果的准 确性,在审核内容的同时兼顾加快了内容审核、修改以及发布的整体进度。
方法还包括以下内容:调取并分析以往审核并修改不同内容时花费的时间,预测审核并修改当前新闻内容需要花费的时间:建立线性回归预测模型:y=E*x+b,其中,E表示权重参数,b表示偏置,通过求解E和b得到预测模型,根据调取的数据获取得到训练数据集为{(B1,t1+T1),(B2,t2+T2),…,(Bn,tn+Tn)},根据下列公式分别求解E和b:
Figure 645786DEST_PATH_IMAGE005
Figure 648377DEST_PATH_IMAGE006
其中,Bi表示随机一个已审核完成的新闻内容数据量,ti表示审核对应已审核完成的新闻内容花费的时间,Ti表示修改对应新闻内容花费的时间,采集到当前新闻内容数据量为B,将B代入到线性回归预测模型中,预测得到审核并修改当前新闻内容需要花费的时间为V:V=E* B+b。
判断当前新闻内容是否能够按时发布:获取到当前审核内容的发布截止时间为T,审核开始的时间为T,比较V和T-T:若V≤T-T,判断当前新闻内容能够按时发布;若V>T-T,判断当前新闻内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度,在对内容进行审核时提前对内容是否能够准时发布进行预判,帮助相关人员及时调整审核、修改的进度,降低了内容发布延迟的概率。
实施例一:在监测到当前待审核的内容中存在与文本检测模型中相同的错误内容 时,在标记当前错误内容的同时在当前错误内容处标记对应的修改信息,获取到共有m=3处 错误内容需要修改,当前错误内容表达的信息集合为W={W1,W2,W3},将错误内容表达的信 息转化为字符串,得到字符串集合为s={s1,s2,s3},获取到字符串长度集合为length(s)= { length(s1),length(s2),length(s3)}={15,22,10},获取到随机两处错误信息转化为字 符串后,两个字符串中相同字符个数为c(s1,s2)=10,获取到描述对应两处错误信息共性需 要的信息量为20,完整描述对应两处错误信息需要的信息量为:25,单位为:比特,根据公式
Figure 93134DEST_PATH_IMAGE001
计算对应两处 错误信息的综合相似度A1≈0.67,根据相同计算方式得到错误信息两两间的综合相似度集 合为A={A1,A2,A3}={0.67,0.92,0.85},设置综合相似度阈值为A=0.9,比较综合相似度和 阈值:A1<A,A2>A,A3<A,对错误信息W1和W3进行统一标记:在对应错误信息处标记相同的 修改信息,将标记完成的内容发送给相关人员供参考修改;
实施例二:采集到已审核完成的新闻内容数据量集合为B={B1,B2,B3}={1.3,2, 1.5},单位为:KB,采集到审核对应新闻内容时花费的时间集合为t={t1,t2,t3}={1.5,3, 5},修改对应新闻内容花费的时间集合为T={T1,T2,T3}={1,2,3},单位为:天,建立线性回 归预测模型:y=E*x+b,通过求解E和b得到预测模型,根据调取的数据获取得到训练数据集 为{(B1,t1+T1),(B2,t2+T2),(Bn,t3+T3)}={(1.3,2.5),(2,5),(1.5,8)},根据公式
Figure 54137DEST_PATH_IMAGE005
Figure 702287DEST_PATH_IMAGE006
分别求解E 和b,得到E=0.57,b≈4.3,采集到当前新闻内容数据量为B=2.4,将B=2.4代入到线性回归 预测模型中,预测得到审核并修改当前新闻内容需要花费的时间为V:V=E* B+b≈6,获取 到当前审核内容的发布截止时间为T:3月5日,审核开始的时间为T:3月1日,比较V和T- T:V=6>T-T=5,判断当前新闻内容无法按时发布,发出延时预警信号,提醒相关人员加快 审核和修改进度。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的内容审核系统,其特征在于:所述系统包括:审核信息采集模块、数据管理中心、内容审核管理模块、内容修改管理模块和审核预警模块;
所述审核信息采集模块的输出端连接所述数据管理中心的输入端,所述数据管理中心的输出端连接所述内容审核管理模块的输入端,所述内容审核管理模块的输出端连接所述内容修改管理模块的输入端,所述内容修改管理模块的输出端连接所述审核预警模块的输入端;
通过所述审核信息采集模块采集历史审核完成的新闻内容数据和审核并修改花费的时间数据,将采集到的全部数据传输到所述数据管理中心;
通过所述数据管理中心存储并管理采集到的全部数据;
通过所述内容审核管理模块利用神经网络模型对新闻内容进行审核,并在审核前预先将以往审核出的错误内容对应的修改信息存储到神经网络模型中;
通过所述内容修改管理模块匹配审核出的错误内容所表达的信息,对相似的错误信息统一进行修改信息标记;
通过所述审核预警模块预测当前审核和修改需要花费的时间,在判断出当前内容不能按时发布时发出预警信号。
2.根据权利要求1所述的一种基于人工智能的内容审核系统,其特征在于:所述审核信息采集模块包括修改信息采集单元、审核时间采集单元和修改时间采集单元;
所述修改信息采集单元、审核时间采集单元和修改时间采集单元的输出端连接所述数据管理中心的输入端;
所述修改信息采集单元用于采集已审核出的错误内容以及错误内容对应的修改信息;
所述审核时间采集单元用于采集已审核完成内容的审核花费的时间和审核数据量;
所述修改时间采集单元用于采集对已审核出的错误内容进行修改需要的时间数据。
3.根据权利要求1所述的一种基于人工智能的内容审核系统,其特征在于:所述内容审核管理模块包括修改信息输入单元和人工智能审核单元;
所述修改信息输入单元的输入端连接所述数据管理中心的输出端,所述修改信息输入单元的输出端连接所述人工智能审核单元的输入端;
所述修改信息输入单元用于将错误内容及其对应的修改信息输入到文本检测模型中进行存储,所述文本检测模型由神经网络模型训练形成;
所述人工智能审核单元用于将当前待审核的内容输入到文本检测模型中,利用文本检测模型对内容进行审核:将当前待审核的内容与错误内容进行文本匹配,若匹配成功,说明当前待审核的内容为错误内容,在错误内容所在位置进行标记;若匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
4.根据权利要求3所述的一种基于人工智能的内容审核系统,其特征在于:所述内容修改管理模块包括修改内容匹配单元、修改定位单元和集中标记单元;
所述修改内容匹配单元的输入端连接所述人工智能审核单元的输出端,所述修改内容匹配单元的输出端连接所述修改定位单元的输入端,所述修改定位单元的输出端连接所述集中标记单元的输入端;
所述修改内容匹配单元用于在利用神经网络模型审核出错误内容后,将审核出的错误内容所表达的信息进行文本匹配,获取匹配到的相似错误信息;
所述修改定位单元用于确认相似错误信息的修改位置;
所述集中标记单元用于在标记错误内容的同时标记修改信息,在相似错误信息的修改位置处对相同的修改信息进行标记,所述相同的修改信息从文本检测模型中选取。
5.根据权利要求1所述的一种基于人工智能的内容审核系统,其特征在于:所述审核预警模块包括按时发布预测单元和延时预警单元;
所述按时发布预测单元的输入端连接所述数据管理中心的输出端,所述按时发布预测单元的输出端连接所述延时预警单元的输入端;
所述按时发布预测单元用于获取当前待审核内容的数据量和修改位置数量,调取并分析以往审核并修改不同内容时花费的时间,并对审核并修改当前内容需要的时间进行预测,判断内容是否能够按时发布;
所述延时预警单元用于若预测到当前内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度。
6.一种基于人工智能的内容审核方法,其特征在于:包括以下步骤:
Z1:采集新闻内容的历史审核数据以及对以往审核出的错误内容进行修改的信息;
Z2:对当前新闻内容进行审核,获取审核出的错误内容及其对应的修改信息;
Z3:对审核出的错误内容表达的信息进行匹配,对相似的错误内容表达的信息统一进行修改信息标记。
7.根据权利要求6所述的一种基于人工智能的内容审核方法,其特征在于:在步骤Z1中:采集到已审核完成的新闻内容数据量集合为B={B1,B2,…,Bn},采集到审核对应新闻内容时花费的时间集合为t={t1,t2,…,tn},修改对应新闻内容花费的时间集合为T={T1,T2,…,Tn},其中,n表示已完成的审核次数;
在步骤Z2中:将当前待审核的内容输入到文本检测模型中进行检测:将文本检测模型中的错误内容与当前待审核的内容进行匹配,判断当前待审核的内容中是否存在与文本检测模型中相同的错误内容:若存在,表示匹配成功,对错误内容进行标记;若不存在,表示匹配失败,利用人工审核方式对当前待审核的内容进行二次审核。
8.根据权利要求7所述的一种基于人工智能的内容审核方法,其特征在于:在步骤Z3中:将已审核完成且存在错误的新闻内容及其对应的修改信息输入到文本检测模型中,若监测到当前待审核的内容中存在与文本检测模型中相同的错误内容,在标记当前错误内容的同时在当前错误内容处标记对应的修改信息,获取到共有m处错误内容需要修改,当前错误内容表达的信息集合为W={W1,W2,…,Wm},将错误内容表达的信息转化为字符串,得到字符串集合为s={s1,s2,…,sm},获取到字符串长度集合为length(s)={ length(s1),length(s2),…,length(sm)},获取到随机两处错误信息转化为字符串后,两个字符串中相同字符个数为c(si,sj),根据下列公式计算随机两处错误信息的综合相似度Au:
Figure 207607DEST_PATH_IMAGE001
其中,
Figure DEST_PATH_IMAGE002
表示描述随机两处错误信息共性需要的信息量,
Figure 311699DEST_PATH_IMAGE003
表示完整描述随机两处错误信息需要的信息量,length(si)和length(sj)表示将对应两处 错误信息转化为字符串后,对应两个字符串长度,Wi和Wj表示当前随机两处错误内容表达 的信息,si和sj表示将对应两处错误内容表达的信息转化后得到的字符串,根据相同计算 方式得到错误信息两两间的综合相似度集合为A={A1,A2,…,Au,…,Aq},其中,q表示综合 相似度项数,
Figure DEST_PATH_IMAGE004
,设置综合相似度阈值为A,比较综合相似度和阈值:对超出阈值的综 合相似度对应的错误信息进行统一标记:在对应错误信息处标记相同的修改信息,将标记 完成的内容发送给相关人员供参考修改。
9.根据权利要求7所述的一种基于人工智能的内容审核方法,其特征在于:该方法还包括以下内容:调取并分析以往审核并修改不同内容时花费的时间,预测审核并修改当前新闻内容需要花费的时间:建立线性回归预测模型:y=E*x+b,其中,E表示权重参数,b表示偏置,通过求解E和b得到预测模型,根据调取的数据获取得到训练数据集为{(B1,t1+T1),(B2,t2+T2),…,(Bn,tn+Tn)},根据下列公式分别求解E和b:
Figure 29119DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
其中,Bi表示随机一个已审核完成的新闻内容数据量,ti表示审核对应已审核完成的新闻内容花费的时间,Ti表示修改对应新闻内容花费的时间,采集到当前新闻内容数据量为B,将B代入到线性回归预测模型中,预测得到审核并修改当前新闻内容需要花费的时间为V:V=E* B+b。
10.根据权利要求9所述的一种基于人工智能的内容审核方法,其特征在于:判断当前新闻内容是否能够按时发布:获取到当前审核内容的发布截止时间为T,审核开始的时间为T,比较V和T-T:若V≤T-T,判断当前新闻内容能够按时发布;若V>T-T,判断当前新闻内容无法按时发布,发出延时预警信号,提醒相关人员加快审核和修改进度。
CN202211638108.4A 2022-12-20 2022-12-20 一种基于人工智能的内容审核系统及方法 Active CN115618844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211638108.4A CN115618844B (zh) 2022-12-20 2022-12-20 一种基于人工智能的内容审核系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211638108.4A CN115618844B (zh) 2022-12-20 2022-12-20 一种基于人工智能的内容审核系统及方法

Publications (2)

Publication Number Publication Date
CN115618844A true CN115618844A (zh) 2023-01-17
CN115618844B CN115618844B (zh) 2023-03-07

Family

ID=84880674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211638108.4A Active CN115618844B (zh) 2022-12-20 2022-12-20 一种基于人工智能的内容审核系统及方法

Country Status (1)

Country Link
CN (1) CN115618844B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117035692A (zh) * 2023-09-28 2023-11-10 江苏龙虎网信息科技股份有限公司 一种基于多维度数据的智能评议管理系统及方法
CN117494231A (zh) * 2023-11-15 2024-02-02 山东农业大学 一种基于大数据的分布式数据管理监测系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753090A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档审核方法、装置、设备及介质
CN113887933A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 基于人工智能的数据处理方法、装置、设备及存储介质
CN114254617A (zh) * 2021-12-20 2022-03-29 科大讯飞股份有限公司 一种修订条款的方法、装置、计算设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753090A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档审核方法、装置、设备及介质
CN113887933A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 基于人工智能的数据处理方法、装置、设备及存储介质
CN114254617A (zh) * 2021-12-20 2022-03-29 科大讯飞股份有限公司 一种修订条款的方法、装置、计算设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117035692A (zh) * 2023-09-28 2023-11-10 江苏龙虎网信息科技股份有限公司 一种基于多维度数据的智能评议管理系统及方法
CN117035692B (zh) * 2023-09-28 2023-12-08 江苏龙虎网信息科技股份有限公司 一种基于多维度数据的智能评议管理系统及方法
CN117494231A (zh) * 2023-11-15 2024-02-02 山东农业大学 一种基于大数据的分布式数据管理监测系统

Also Published As

Publication number Publication date
CN115618844B (zh) 2023-03-07

Similar Documents

Publication Publication Date Title
CN115618844B (zh) 一种基于人工智能的内容审核系统及方法
US20210342251A1 (en) Review process for evaluating changes to target code for a software-based product
US7197542B2 (en) System and method for signaling quality and integrity of data content
AU2001270268A1 (en) System and method for signaling quality of data content
CN113657747B (zh) 一种企业安全生产标准化级别智能评定系统
CN110797020B (zh) 一种桥梁巡检系统及方法
CN112381526A (zh) 一种基于自动校验的数据标注系统及方法
CN117094665B (zh) 一种数字化企业管理系统及方法
CN117592871B (zh) 一种基于大数据的混凝土质量安全溯源追踪管理系统
CN116882968B (zh) 一种故障缺陷全过程处理的设计和实现方法
CN117892701B (zh) 一种云制造业务协同系统
CN111222834A (zh) 企业现场应急工作数据分析方法及系统
CN117726300B (zh) 用于招标代理业务资料校验的自动化智能处理系统
CN113283760B (zh) 案件流程分析报告生成方法及系统
CN114926154B (zh) 一种多场景数据识别的保护切换方法及系统
CN101706891A (zh) 政务公开电子监察的方法及系统
Li et al. Application of bridge maintenance and management system with BIM technology
CN117911179A (zh) 一种财税数据审核方法及系统
CN114611627A (zh) 一种企业分类方法和系统
CN116777531A (zh) 客服服务质量监控方法、装置、设备及存储介质
CN116610674A (zh) 信息处理方法、装置、设备及存储介质
CN117132254A (zh) 邮件数据核查方法及装置
CN117952552A (zh) 一种街道工程建设的项目管理方法、系统、设备及介质
CN118035468A (zh) 基于深度学习的等保测评结果记录知识图谱抽取方法
CN113190805A (zh) 一种代码资产管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant