CN117172245A - 控制方法及控制系统 - Google Patents

控制方法及控制系统 Download PDF

Info

Publication number
CN117172245A
CN117172245A CN202310610786.8A CN202310610786A CN117172245A CN 117172245 A CN117172245 A CN 117172245A CN 202310610786 A CN202310610786 A CN 202310610786A CN 117172245 A CN117172245 A CN 117172245A
Authority
CN
China
Prior art keywords
target
article
drainage
title
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310610786.8A
Other languages
English (en)
Inventor
艾政阳
时磊
李鹏霄
佟玲玲
王红兵
侯炜
翟羽佳
马宏远
余翠玲
鲁睿
任博雅
井雅琪
吕东
秦佳伟
张维庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center filed Critical National Computer Network and Information Security Management Center
Priority to CN202310610786.8A priority Critical patent/CN117172245A/zh
Publication of CN117172245A publication Critical patent/CN117172245A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例涉及一种控制方法及控制系统,所述方法包括:当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;根据所述评分结果对所述目标账号进行控制。由此,可以实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。

Description

控制方法及控制系统
技术领域
本发明实施例涉及检测技术领域,尤其涉及一种控制方法及控制系统。
背景技术
个性化推荐技术是帮助人们发现有用信息的一种技术工具,更是信息流个性化推荐产品的核心技术。个性化推荐平台一方面建立自己的内容创作生态,鼓励更多的作者在平台上发布内容,另一方面利用用户的信息和行为进行高效的内容分发。个性化推荐算法可以大概分为基于内容的推荐、基于协同过滤的推荐和混合推荐。实际上信息流推荐平台的推荐系统往往由上百个召回队列和算法生成推荐备选集,系统整体具有一套分发流量的分配机制,控制各召回队列的下发比例,以达到业务指标最大化。在个性化推荐系统中,有一类特殊的资源称之为“标题党”的引流标题,其以抓人眼球的标题表达方式吸引点击,以获得更大的分发流量,为作者获取更多利益。然而“标题党”内容本身存在着质量低下、骗取流量、题文不符等诸多问题,已经成为一种典型的算法乱象。
“标题党”问题作为一种算法乱象,本身可以细分为纯标题问题和题文不符两种类型,其中纯标题问题又包含信息表达含糊、故意使用吸引人的表达等问题,甚至会形成谣言等不良引导。“标题党”作为引流标题本身会为作者带来更高的流量收益,但对于平台是一种破坏生态行为,标题党的增多不仅会打击认真创作的作者,同时也会影响平台受众的内容体验,造成不良内容的传播风气。
发明内容
鉴于此,为解决上述标题党乱象的技术问题,本发明实施例提供一种控制方法及控制系统。
第一方面,本发明实施例提供一种控制方法,包括:
当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;
在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;
根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;
根据所述评分结果对所述目标账号进行控制。
在一个可能的实施方式中,所述对所述目标文章进行引流标题的先验检测,得到先验检测结果,包括:
对所述目标文章的目标标题进行引流标题的先验检测,得到对应的第一先验检测结果;
对所述目标文章的目标标题和文章正文进行引流标题的先验检测,得到对应的第二先验检测结果。
在一个可能的实施方式中,所述对所述目标文章的目标标题进行引流标题的先验检测,得到对应的第一先验检测结果,包括:
将所述目标标题输入至文本分类FastText模型中,以从所述目标标题中提取标题向量;
创建目标数据库对应标点信息和词汇信息的检测范式;
利用所述检测范式对所述目标标题进行检测,得到频率特征数据;
根据所述标题向量和所述频率特征数据进行支持向量机分类识别,得到识别结果;
当所述识别结果为引流标题类别时,得到所述第一先验检测结果对应的目标文章为引流标题文章;
当所述识别结果为非引流标题类别时,得到所述第一先验检测结果对应的目标文章为非引流标题文章;
当所述识别结果为疑似引流标题类别时,得到所述第一先验检测结果对应的目标文章为疑似引流标题文章。
在一个可能的实施方式中,所述对所述目标文章的目标标题和文章正文进行引流标题的先验检测,得到对应的第二先验检测结果,包括:
对所述文章正文进行词频-逆文档频率TF-IDF处理,以提取所述文章正文对应的关键词;
将所述关键词输入至FastText模型中,以提取所述关键词对应的关键词向量,以及将所述目标标题输入至所述FastText模型中,以提取所述目标标题对应的标题向量;
根据所述关键词向量和所述标题向量进行余弦相似度运算,得到所述目标文章的相似度结果;
当所述相似度结果小于设定的第二阈值时,得到所述第二先验检测结果对应的目标文章为引流标题文章;
当所述相似度结果大于设定的第三阈值时,得到所述第二先验检测结果对应的目标文章为非引流标题文章,所述第二阈值小于所述第三阈值;
当所述相似度结果大于所述第二阈值且小于所述第三阈值时,得到所述第二先验检测结果对应的目标文章为疑似引流标题文章。
在一个可能的实施方式中,所述在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果,包括:
在所述先验检测结果对应的目标文章为疑似引流标题文章时,获取所述目标文章的后验数据,所述后验数据携带有所述目标文章的点击率、播放率、传播速率、分发时间和实时热度的数据;
将所述后验数据输入至梯度提升XGBoost模型中进行分类,输出所述疑似引流标题文章的分类结果;
当所述分类结果为非引流标题文章时,得到所述后验检测结果对应的目标文章为非引流标题文章;
当所述分类结果为引流标题文章时,得到所述后验检测结果对应的目标文章为引流标题文章。
在一个可能的实施方式中,所述根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果,包括:
根据所述先验检测结果和所述后验检测结果对所述目标账号进行引流标题信息采集,得到对应的引流标题信息数据;
对所述引流标题信息数据进行特征提取,得到特征数据;
将所述特征数据输入评分模型中,以使所述评分模型输出所述目标账号的评分结果。
在一个可能的实施方式中,所述根据所述评分结果对所述目标账号进行控制之前,所述方法,还包括:
根据所述评分结果对所述目标账号进行划分等级;
当所述评分结果大于设定的第四阈值时,确定所述目标账号的等级为第一等级账号;
当所述评分结果小于所述第四阈值且大于设定的第五阈值时,确定所述目标账号的等级为第二等级账号,所述第四阈值大于所述第五阈值;
当所述评分结果小于所述第五阈值时,确定所述目标账号的等级为第三等级账号。
在一个可能的实施方式中,所述根据所述评分结果对所述目标账号进行控制,包括:
对所述第一等级账号执行流量放开控制;
或,
对所述第二等级账号按照设定的流量阈值执行限流控制;
或,
对所述第三等级账号执行流量关闭控制。
在一个可能的实施方式中,所述方法,还包括:
当所述目标文章为非引流标题文章时,放开对所述目标文章的流量控制;
或,
当所述目标文章为疑似引流标题文章时,根据设定的第二流量阈值对所述目标文章执行限流控制;
或,
当所述目标文章为引流标题文章时,对所述目标文章执行关闭流量的控制。
第二方面,本发明实施例提供一种控制装置,包括:
先验检测模块,用于当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;
后验检测模块,用于在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;
评估模块,用于根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;
控制模块,用于根据所述评分结果对所述目标账号进行控制。
本发明实施例提供的控制方案,通过当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;根据所述评分结果对所述目标账号进行控制。通过首先对目标账号新发布的目标文章进行引流标题的先验检测,确定先验检测结果,当先验检测结果满足条件时,对目标文章再次进行引流标题的后验检测,得到后验检测结果;通过评分模型对先验检测结果和后验检测结果进行评分处理,判定目标文章的评估分数,再根据评分结果表征当前目标账号的评论等级,对比目标账号的历史等级对目标账号进行控制;由本方案,可以实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1为本发明实施例提供的一种控制方法的流程示意图;
图2为本发明实施例提供的另一种控制方法的流程示意图;
图3为本发明实施例提供的又一种控制方法的流程示意图;
图4为本发明实施例提供的一种控制系统的结构示意图;
图5为本发明实施例提供的一种控制设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中的用语“包括”和“具有”用以表示开放式的包括在内的意思,并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。此外,附图中的不同元件和区域只是示意性示出,因此本发明不限于附图中示出的尺寸或距离。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
文本分类FastText模型有三层:输入层、隐含层、输出层(HierarchicalSoftmax),输入都是多个经向量表示的单词,输出都是一个特定的target类别,隐含层都是对多个词向量的叠加平均。细节采用softmax去计算概率分布。
图1为本发明实施例提供的一种控制方法的流程示意图。本发明的执行主体为目标账号所在平台系统。根据图1提供的示图,控制方法具体包括:
S101、当检测到目标账号存在新发布的目标文章时,对目标文章进行引流标题的先验检测,得到先验检测结果,引流标题表征目标文章的文章类别。
本申请实施例应用于标题党类别的引流标题的账号的检测和管理。在检测到发布新目标文章时,首先利用先验检测对目标文章是否为引流标题文章进行检测;得到三类文章类型,即引流标题文章、非引流标题文章和疑似引流标题文章。再通过后验检测对疑似引流标题文章进行进一步的检测,判断目标文章是否为引流标题文章或非引流标题文章;结合先验检测结果和后验检测结果对目标文章所在的目标账号进行分数评估,分析目标账号包含的全部文章引流标题文章数量以及历史控制记录等数据,进行综合打分,得到评分结果;再根据评分结果表征当前目标账号的评论等级,对比目标账号的历史账号等级对目标账号的流量进行不同的管控处理。
这里说的目标账号可以理解为公共发布平台上正规注册的标识码,包括ID号和用户昵称等信息。这里说的目标文章可以理解为目标账号按照时间顺序发布的最新的一篇文章。这类说的先验检测可以理解为通过对标题或正文分别进行引流标题检测的方法。这里说的先验检测结果可以理解为针对目标文章是否为引流标题文章类型进行判断的结果。
进一步地,在通过实时账户动态检测设备检测到目标账号存在发布新的目标文章时,开启对目标文章是否为引流标题文章的检测,通过对目标文章进行引流标题的先验检测,得到先验检测结果,确定先验检测处理后的目标文章的类型,为下一步处理目标账号提供参考依据。
S102、在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果。
这里说的预设条件可以理解为先验检测结果满足再次检测的条件。这里说的后验检测可以理解为在以先验检测结果为依据的基础上再次对目标文章进行引流标题检测的放法。这里说的后验检测结果可以理解为判定目标文章是否为引流标题文章的分类结果。
进一步地,在先验检测处理后对目标文章做了初步筛选,在对一些存在不确定因素类型的目标文章进行后验检测,对目标文章进行更深一步的检测,判定目标文章的类型。
S103、根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果。
这里说的分数评估可以理解为通过收集数据,进行统计得到的综合评分。这里说的评分结果可以理解为得到的分数数值或百分比。
进一步地,通过先验检测和后验检测将目标文章的类型检测出来,再通过统计分析目标文章所在的目标账号的历史更新文章的类型和流量管控记录,对目标账号的引流标题文章的发布率、点击率、目标账号的更新频率等数据进行评分得到综合分值,表征目标账号的综合评价,为下一步对目标账号的流量限制和等级调控做准备。
S104、根据评分结果对目标账号进行控制。
这里说的控制可以理解为对目标账号的等级调控措施和目标文章的流量限制的处理策略。
进一步地,得到目标账号的综合评分后,根据评分的多少对目标账号进行管控;历史发布的被识别为引流标题的文章和新发布的被识别为引流标题的目标文章,不受目标账号的等级影响,将引流标题文章流量清零,永不放开。历史发布被识别为的非引流标题的文章和新发布被识别为非引流标题的目标文章,受到目标账号的等级影响,目标账号的等级为高档的情况,对目标账号包含的非引流标题文章进行放开流量限制;目标账号的等级为中档的情况,对目标账号包含的非引流标题文章进行限制流量;目标账号的等级为低档的情况,对目标账号包含的非引流标题文章进行流量清零。
本发明实施例提供的控制方法,在当检测到目标账号存在新发布的目标文章时,对目标文章进行引流标题的先验检测,得到先验检测结果,引流标题表征目标文章的文章类别;在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果;根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果;根据评分结果对目标账号进行控制。通过首先对目标账号新发布的目标文章进行引流标题的先验检测,确定先验检测结果,当先验检测结果满足条件时,对目标文章再次进行引流标题的后验检测,得到后验检测结果;通过评分模型对先验检测结果和后验检测结果进行评分处理,判定目标文章的评估分数,再根据评分结果表征当前目标账号的评论等级,对比目标账号的历史账号等级和包含的非引流标题文章对目标账号的流量进行不同的管控处理;由本方案,可以实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
图2为本发明实施例提供的另一种控制方法的流程示意图。本发明的执行主体为目标账号所在平台系统。图2是在上一种实施例的基础上进行介绍的。根据图2提供的示图,控制方法具体还包括:
S201、当检测到目标账号存在新发布的目标文章时,对目标文章的目标标题进行引流标题的先验检测,得到对应的第一先验检测结果。
本申请实施例应用于引流标题的账号的检测和管理。在检测到发布新目标文章时,首先利用先验检测对目标文章是否为引流标题文章进行检测;得到三类文章类型,即引流标题文章、非引流标题文章和疑似引流标题文章。再通过后验检测对疑似引流标题文章进行进一步的检测,判断目标文章是否为引流标题文章或非引流标题文章;结合先验检测结果和后验检测结果对目标文章所在的目标账号进行分数评估,分析目标账号包含的全部文章引流标题文章数量以及历史控制记录等数据,进行综合打分,得到评分结果;再根据评分结果表征当前目标账号的评论等级,对比目标账号的历史账号等级和包含的非引流标题文章对目标账号的流量进行不同的管控处理。
进一步地,在通过实时账户动态检测设备检测到目标账号存在发布新的目标文章时,开启对目标文章是否为引流标题文章的检测,通过对目标文章的目标标题进行引流标题的先验检测,得到表征目标标题是否为引流标题的第一先验检测结果。
S202、对目标文章的目标标题和文章正文进行引流标题的先验检测,得到对应的第二先验检测结果。
进一步地,在通过实时账户动态检测设备检测到目标账号存在发布新的目标文章时,开启对目标文章是否为引流标题文章的检测,通过对目标文章的目标标题和文章正文进行题文比对的处理方法,得到第二先验检测结果。
S203、在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果。
进一步地,通过先验检测和后验检测将目标文章的类型检测出来,再通过统计分析目标文章所在的目标账号的历史更新文章的类型和流量管控记录,对目标账号的引流标题文章的发布率、点击率、目标账号的更新频率等数据进行评分得到综合分值,表征目标账号的综合评价,为下一步对目标账号的流量限制和等级调控做准备。
S204、根据先验检测结果和后验检测结果对目标账号进行引流标题信息采集,得到对应的引流标题信息数据。
S205、对引流标题信息数据进行特征提取,得到特征数据。
S206、将特征数据输入评分模型中,以使评分模型输出目标账号的评分结果。
这里说的引流标题信息数据可以理解为目标账号中的引流标题文章的发布数量、引流标题文章的负面评价数量、目标账号的等级或目标账号发布的文章总数等数据信息。这里说的特征数据可以理解为目标账号的引流标题文章的发布频率、引流标题文章的负面评价率、引流标题文章的历史处理数据。这里说的评分模型可以理解为根据引流标题信息数据创建的训练模型,用于计算综合分数的算法模型。这里说的评分结果可以理解为根据引流标题信息数据得到的综合分数。
进一步地,在先验检测和后验检测结束后,对目标账号的引流标题信息数据进行采集,在提取引流标题信息数据的特征数据输入到创建的评分模型中进行统计计算,将得到的评分结果作为模型输出结果,完成目标账号的评分处理,为下一步对目标账号进行管控做准备。
S207、根据评分结果对目标账号进行划分等级。
S208、当评分结果大于设定的第四阈值时,确定目标账号的等级为第一等级账号。
S209、当评分结果小于第四阈值且大于设定的第五阈值时,确定目标账号的等级为第二等级账号,第四阈值大于第五阈值。
S210、当评分结果小于第五阈值时,确定目标账号的等级为第三等级账号。
这里说的等级可以理解为表征目标账号的整体包含引流标题文章的情况。这里说的第一等级账号可以理解为评估分数最高档范围的账号。这里说的第二等级账号可以理解为包含引流标题文章数量中等层次的账号。这里说的第三等级账号可以理解为评估分数最低范围的账号。
进一步地,根据得到的评估结果对当前目标账号进行等级划分,按照设定的划分范围设置一个区间,区间的最小边界值为第四阈值,最大边界值为第五阈值,在目标账号的评估结果对应的评估分数大于最大小边界值时,认为目标账号包含的引流标题文章最少,将综合得分最高的目标账号划分为第一等级账号;在目标账号的评估结果对应的评估分数大于最小大边界值且小于最大边界值时,认为目标账号包含的引流标题文章数量中等,将综合得分中等的目标账号划分为第二等级账号;在目标账号的评估结果对应的评估分数小于最小边界值时,认为目标账号包含的引流标题文章数量最多,将综合得分最低的当前目标账号划分为第三等级账号。
在一种可能的实例场景中,得到账号M1的评分结果为85分,账号M2的评分结果为60分,账号M3的评分结果为30分;设定账号等级划分范围为【50,80】,通过匹配,得到账号M1划分为第一等级账号,账号M2划分为第二等级账号,账号M3划分为第三等级账号。
可选地,目标账号的等级划分还可以细化成多个等级,例如按照:优、良、中、差四个等级划分,或者按照A等级、B等级、C等级、D等级进行划分。
S211、对第一等级账号执行流量放开控制。
S212、对第二等级账号按照设定的流量阈值执行限流控制;
S213、对第三等级账号执行流量关闭控制。
这里说的限流控制可以理解为设定流量上限值进行限流。
进一步地,根据评分结果进行等级划分,历史发布的被识别为引流标题的文章和新发布的被识别为引流标题的目标文章,不受目标账号的等级影响,将引流标题文章流量清零,永不放开。历史发布被识别为的非引流标题的文章和新发布被识别为非引流标题的目标文章,受到目标账号的等级影响,目标账号的等级为高评分结果对应的第一等级的情况,判定目标账号为优良创作者,对目标账号包含的非引流标题文章进行放开流量限制;目标账号的等级为中等评分结果对应的第二等级的情况,判定目标账号为一般创作者,对目标账号包含的非引流标题文章进行限制流量;目标账号的等级为低评分结果对应的第三等级的情况,判定目标账号为哗众取宠的低级创作者,对目标账号包含的非引流标题文章进行流量清零。
在一种可能的实例场景中,设定三个等级划分制度,当检测到账号M发布了一篇文章后进行检测以及分数评估,当账号M最新发布的文章为引流标题文章类别时,无论账号M的账号等级如何,对账号M中的引流标题文章流量清零,永不放开。当账号M最新发布的文章为非引流标题文章时,对账号M的流量控制受账号等级的影响;在账号的评述评估中得到账号M的评分结果为90分,划分为第一等级账号,对账号M发布的全部文章中的非引流标题文章开放流量的控制;在账号的评述评估中检测到账号M的评分结果为60分,划分为第二等级账号,对账号M发布的全部文章中的非引流标题文章限制1000次曝光次数的控制;在账号的评述评估中检测到账号M的评分结果为30分,划分为第三等级账号,对账号M发布的全部文章流量清零控制,同时禁止账号M发布任何文章。
进一步地,按照引流标题检测方法对目标账号的全部文章进行评估,或者对目标账号的设定周期内的每一篇内容进行流量控制,提升内容质量,减少引流标题乱象。
可选地,当账号M最新发布的文章为非引流标题文章时,在账号的评述评估中目标账号的等级为第二等级时,对比目标账号的历史账号等级,执行降级控制;例如,当目标账号的等级为第二等级时,对比上一次评估等级为第一等级时,执行降级处理,将目标账号从第一等级降级到第二等级,同时对目标账号包含的全部文章中的非引流标题文章进行限流处理;或者在目标账号上一次评估等级为第二等级时,执行将目标账号从第二等级降到第三等级的处理,同时对目标账号包含的全部文章中非引流标题文章进行限流处理。
可选地,当账号M最新发布的文章为引流标题文章时,并且目标账号为第三等级的最低等级时,执行将目标账号封号或设定时间内停号处理,同时对目标账号包含的全部文章流量清零处理。
本发明实施例提供的另一种控制方法,通过目标账号的目标文章先后进行先验检测和后验检测得到先验检测结果和后验检测结果,在对目标账号进行数据采集和特征提取,得到目标账号的评分结果,按照设定规则进行等级划分,不同的等级进行不同的流量控制,实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
图3为本发明实施例提供的又一种控制方法的流程示意图。本发明的执行主体为目标账号所在平台系统。图3是在第一种实施例的基础上进行介绍的。根据图3提供的示图,控制方法具体还包括:
S301、当检测到目标账号存在新发布的目标文章时,将目标标题输入至文本分类FastText模型中,以从目标标题中提取标题向量。
S302、创建目标数据库对应标点信息和词汇信息的检测范式。
S303、利用检测范式对目标标题进行检测,得到频率特征数据。
S304、根据标题向量和频率特征数据进行支持向量机分类识别,得到识别结果。
这里说的目标数据库可以理解为公开的引流标题数据库。
进一步地,对于内容哗众取宠的引流标题文章,通过FastText模型获取标题向量,通过构造引流标题标点、词汇库形成检测范式,将统计命中词库的频率特征与标题内容向量拼接,通过支持向量机算法进行分类判别,得到对应的识别结果,实现目标标题的引流标题的先验检测过程。
S305、当识别结果为引流标题类别时,得到第一先验检测结果对应的目标文章为引流标题文章。
S306、当识别结果为非引流标题类别时,得到第一先验检测结果对应的目标文章为非引流标题文章。
S307、当识别结果为疑似引流标题类别时,得到第一先验检测结果对应的目标文章为疑似引流标题文章。
进一步地,根据识别结果得到目标文章的类别,将目标文章划分为三类文章,即引流标题文章、非引流标题文章和疑似引流标题文章,为下一步后验检测做准备。
可选地,关于目标标题中的纯标题检验,对于标题内容过短表述不清类型的引流标题,通过实体词提取方法对标题进行处理,对实体词过少的内容识别为一类标题党文章,提高识别效率。例如,针对标题过短类的引流标题,将标题使用jieba分词工具进行分析,并提取实体词,如果所含实体词少于2个,则认为表述内容不清。如标题只包含“前程似锦”四个字。
S308、对文章正文进行词频-逆文档频率TF-IDF处理,以提取文章正文对应的关键词。
S309、将关键词输入至FastText模型中,以提取关键词对应的关键词向量,以及将目标标题输入至FastText模型中,以提取目标标题对应的标题向量。
S310、根据关键词向量和标题向量进行余弦相似度运算,得到目标文章的相似度结果。
针对目标文章中的题文不符检验,利用TF-IDF对正文关键词进行提取,并通过FastText进行标题和正文关键词编码获取标题向量和关键词向量表达,计算获取标题向量和关键词向量之间的余弦相似度判断目标标题与正文的关系,结合文本内容的不同类目计算类目下的引流标题判断阈值,例如0.5,分类目的识别是否为引流标题,得到相似度结果。
S311、当相似度结果小于设定的第二阈值时,得到第二先验检测结果对应的目标文章为引流标题文章。
S312、当相似度结果大于设定的第三阈值时,得到第二先验检测结果对应的目标文章为非引流标题文章,第二阈值小于第三阈值。
S313、当相似度结果大于第二阈值且小于第三阈值时,得到第二先验检测结果对应的目标文章为疑似引流标题文章。
按照相似度结果的大小划分目标文章的类别,当相似度结果小于设定的第二阈值时,得到引流标题文章;当相似度结果大于设定的第三阈值时,得到非引流标题文章;当相似度结果大于第二阈值且小于第三阈值时,得到疑似引流标题文章。
可选地,按照需求设定多个相似度结果,例如,引流标题文章、非引流标题文章、低阶疑似引流标题文章、高阶疑似引流标题文章等。
在一种可能的实例场景中,当目标文章为非引流标题文章时,放开对目标文章的流量控制。
当目标文章为疑似引流标题文章时,根据设定的第二流量阈值对目标文章执行限流控制。
当目标文章为引流标题文章时,对目标文章执行关闭流量的控制。
进一步地,得到目标账号的综合评分后,根据目标文章的类别对目标账号进行管控。针对引流标题文章和疑似引流标题文章建立分级流控的分发机制,对于确认引流标题文章进行系统过滤;对于疑似引流标题文章在发布后会控制在1000次展现曝光内,并利用实时后验数据进一步判断是否为引流标题;对于引流标题文章进一步过滤;对于非引流标题文章则放开流量限制;该方法可以实时调控推荐系统内引流标题内容获取的流量。对于系统内库存的展现量已经超过1000次的内容,也可以采用后验引流标题分类模型进行巡检,及时进行流量限制。
S314、在先验检测结果对应的目标文章为疑似引流标题文章时,获取目标文章的后验数据,后验数据携带有目标文章的点击率、播放率、传播速率、分发时间和实时热度的数据。
S315、将后验数据输入至梯度提升XGBoost模型中进行分类,输出疑似引流标题文章的分类结果。
利用实时后验检测对疑似引流标题文章进行建模识别。对于处于模糊地带的疑似引流标题文章,采用试探分发的方案累积后验数据建模判断。通过实际分发的后验数据,判断疑似引流标题文章具有较高的点击率、较低的完整播放率或阅读率、较高的负面评价率(负向评论和点踩),利用这些实时后验数据结合分发时间、传播速率、实时热度等特征数据建立XGBoost分类模型,对疑似引流标题文章进行二次判断和识别。
S316、当分类结果为非引流标题文章时,得到后验检测结果对应的目标文章为非引流标题文章。
S317、当分类结果为引流标题文章时,得到后验检测结果对应的目标文章为引流标题文章。
根据后验检测对疑似引流标题文章进行分类,得到引流标题文章或非引流标题文章,实现对目标文章是否为引流标题文章做进一步检测,提高检测率。
S318、根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果。
进一步地,通过先验检测和后验检测将目标文章的类型检测出来,再通过统计分析目标文章所在的目标账号的历史更新文章的类型和流量管控记录,对目标账号的引流标题文章的发布率、点击率、目标账号的更新频率等数据进行评分得到综合分值,表征目标账号的综合评价,为下一步对目标账号的流量限制和等级调控做准备。
S319、根据评分结果对目标账号进行控制。
进一步地,得到目标账号的综合评分后,根据评分的多少对目标账号进行管控。历史发布的被识别为引流标题的文章和新发布的被识别为引流标题的目标文章,不受目标账号的等级影响,将引流标题文章流量清零,永不放开。历史发布被识别为的非引流标题的文章和新发布被识别为非引流标题的目标文章,受到目标账号的等级影响,目标账号的等级为高档的情况,对目标账号包含的非引流标题文章进行放开流量限制;目标账号的等级为中档的情况,对目标账号包含的非引流标题文章进行限制流量;目标账号的等级为低档的情况,对目标账号包含的非引流标题文章进行流量清零。
本发明实施例提供的又一种控制方法,通过目标账号的目标文章先后进行先验检测和后验检测得到先验检测结果和后验检测结果,在对目标账号进行数据采集和特征提取,得到目标账号的评分结果,按照设定规则进行等级划分,不同的等级进行不同的流量控制,实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
图4为本发明实施例提供的一种控制系统的结构示意图。根据图4提供的示图,控制系统具体包括:
先验检测模块41,用于当检测到目标账号存在新发布的目标文章时,对目标文章进行引流标题的先验检测,得到先验检测结果,引流标题表征目标文章的文章类别;
后验检测模块42,用于在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果;
评估模块43,用于根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果;
控制模块44,用于根据评分结果对目标账号进行控制。
本实施例提供的控制系统可以是如图4中所示的控制系统,可执行如图1-3中控制方法的所有步骤,进而实现图1-3所示控制方法的技术效果,具体请参照图1-3相关描述,为简洁描述,在此不作赘述。
图5为本发明实施例提供的一种控制设备的结构示意图,图5所示的控制设备500包括:至少一个处理器501、存储器502、至少一个网络接口504和其他用户接口503。控制设备500中的各个组件通过总线系统505耦合在一起。可理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。
其中,用户接口503可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器 (Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器502存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5021和应用程序5022。
其中,操作系统5021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序5022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。
在本发明实施例中,通过调用存储器502存储的程序或指令,具体的,可以是应用程序5022中存储的程序或指令,处理器501用于执行各方法实施例所提供的方法步骤,例如包括:
当检测到目标账号存在新发布的目标文章时,对目标文章进行引流标题的先验检测,得到先验检测结果,引流标题表征目标文章的文章类别;在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果;根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果;根据评分结果对目标账号进行控制。
上述本发明实施例揭示的方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的控制设备可以是如图5中所示的控制设备,可执行如图1-3中控制方法的所有步骤,进而实现图1-3所示控制方法的技术效果,具体请参照图1-3相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在控制设备侧执行的控制方法。
处理器用于执行存储器中存储的控制程序,以实现以下在控制设备侧执行的控制方法的步骤:
当检测到目标账号存在新发布的目标文章时,对目标文章进行引流标题的先验检测,得到先验检测结果,引流标题表征目标文章的文章类别;在先验检测结果满足预设条件时,对目标文章进行引流标题的后验检测,得到后验检测结果;根据先验检测结果和后验检测结果对目标账号进行分数评估,得到目标账号的评分结果;根据评分结果对目标账号进行控制。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种控制方法,其特征在于,包括:
当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;
在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;
根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;
根据所述评分结果对所述目标账号进行控制。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文章进行引流标题的先验检测,得到先验检测结果,包括:
对所述目标文章的目标标题进行引流标题的先验检测,得到对应的第一先验检测结果;
对所述目标文章的目标标题和文章正文进行引流标题的先验检测,得到对应的第二先验检测结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标文章的目标标题进行引流标题的先验检测,得到对应的第一先验检测结果,包括:
将所述目标标题输入至文本分类FastText模型中,以从所述目标标题中提取标题向量;
创建目标数据库对应标点信息和词汇信息的检测范式;
利用所述检测范式对所述目标标题进行检测,得到频率特征数据;
根据所述标题向量和所述频率特征数据进行支持向量机分类识别,得到识别结果;
当所述识别结果为引流标题类别时,得到所述第一先验检测结果对应的目标文章为引流标题文章;
当所述识别结果为非引流标题类别时,得到所述第一先验检测结果对应的目标文章为非引流标题文章;
当所述识别结果为疑似引流标题类别时,得到所述第一先验检测结果对应的目标文章为疑似引流标题文章。
4.根据权利要求2所述的方法,其特征在于,所述对所述目标文章的目标标题和文章正文进行引流标题的先验检测,得到对应的第二先验检测结果,包括:
对所述文章正文进行词频-逆文档频率TF-IDF处理,以提取所述文章正文对应的关键词;
将所述关键词输入至FastText模型中,以提取所述关键词对应的关键词向量,以及将所述目标标题输入至所述FastText模型中,以提取所述目标标题对应的标题向量;
根据所述关键词向量和所述标题向量进行余弦相似度运算,得到所述目标文章的相似度结果;
当所述相似度结果小于设定的第二阈值时,得到所述第二先验检测结果对应的目标文章为引流标题文章;
当所述相似度结果大于设定的第三阈值时,得到所述第二先验检测结果对应的目标文章为非引流标题文章,所述第二阈值小于所述第三阈值;
当所述相似度结果大于所述第二阈值且小于所述第三阈值时,得到所述第二先验检测结果对应的目标文章为疑似引流标题文章。
5.根据权利要求3或4所述的方法,其特征在于,所述在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果,包括:
在所述先验检测结果对应的目标文章为疑似引流标题文章时,获取所述目标文章的后验数据,所述后验数据携带有所述目标文章的点击率、播放率、传播速率、分发时间和实时热度的数据;
将所述后验数据输入至梯度提升XGBoost模型中进行分类,输出所述疑似引流标题文章的分类结果;
当所述分类结果为非引流标题文章时,得到所述后验检测结果对应的目标文章为非引流标题文章;
当所述分类结果为引流标题文章时,得到所述后验检测结果对应的目标文章为引流标题文章。
6.根据权利要求5所述的方法,其特征在于,所述根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果,包括:
根据所述先验检测结果和所述后验检测结果对所述目标账号进行引流标题信息采集,得到对应的引流标题信息数据;
对所述引流标题信息数据进行特征提取,得到特征数据;
将所述特征数据输入评分模型中,以使所述评分模型输出所述目标账号的评分结果。
7.根据权利要求6所述的方法,其特征在于,所述根据所述评分结果对所述目标账号进行控制之前,所述方法,还包括:
根据所述评分结果对所述目标账号进行划分等级;
当所述评分结果大于设定的第四阈值时,确定所述目标账号的等级为第一等级账号;
当所述评分结果小于所述第四阈值且大于设定的第五阈值时,确定所述目标账号的等级为第二等级账号,所述第四阈值大于所述第五阈值;
当所述评分结果小于所述第五阈值时,确定所述目标账号的等级为第三等级账号。
8.根据权利要求7所述的方法,其特征在于,所述根据所述评分结果对所述目标账号进行控制,包括:
对所述第一等级账号执行流量放开控制;
或,
对所述第二等级账号按照设定的流量阈值执行限流控制;
或,
对所述第三等级账号执行流量关闭控制。
9.根据权利要求5所述的方法,其特征在于,所述方法,还包括:
当所述目标文章为非引流标题文章时,放开对所述目标文章的流量控制;
或,
当所述目标文章为疑似引流标题文章时,根据设定的第二流量阈值对所述目标文章执行限流控制;
或,
当所述目标文章为引流标题文章时,对所述目标文章执行关闭流量的控制。
10.一种控制系统,其特征在于,包括:
先验检测模块,用于当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;
后验检测模块,用于在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;
评估模块,用于根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;
控制模块,用于根据所述评分结果对所述目标账号进行控制。
CN202310610786.8A 2023-05-26 2023-05-26 控制方法及控制系统 Pending CN117172245A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310610786.8A CN117172245A (zh) 2023-05-26 2023-05-26 控制方法及控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310610786.8A CN117172245A (zh) 2023-05-26 2023-05-26 控制方法及控制系统

Publications (1)

Publication Number Publication Date
CN117172245A true CN117172245A (zh) 2023-12-05

Family

ID=88938164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310610786.8A Pending CN117172245A (zh) 2023-05-26 2023-05-26 控制方法及控制系统

Country Status (1)

Country Link
CN (1) CN117172245A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168992A (zh) * 2017-03-29 2017-09-15 北京百度网讯科技有限公司 基于人工智能的文章分类方法及装置、设备与可读介质
CN109190111A (zh) * 2018-08-07 2019-01-11 北京奇艺世纪科技有限公司 一种文档正文关键词提取方法及装置
CN109885672A (zh) * 2019-03-04 2019-06-14 中国科学院软件研究所 一种面向在线教育的问答式智能检索系统及方法
CN110008401A (zh) * 2019-02-21 2019-07-12 北京达佳互联信息技术有限公司 关键词提取方法、关键词提取装置和计算机可读存储介质
CN113011167A (zh) * 2021-02-09 2021-06-22 腾讯科技(深圳)有限公司 基于人工智能的作弊识别方法、装置、设备及存储介质
CN115065512A (zh) * 2022-05-31 2022-09-16 北京奇艺世纪科技有限公司 一种账号登录方法、系统、装置、电子设备以及存储介质
CN115099239A (zh) * 2022-06-16 2022-09-23 北京百度网讯科技有限公司 一种资源识别方法、装置、设备以及存储介质
CN115221307A (zh) * 2021-04-15 2022-10-21 腾讯科技(深圳)有限公司 一种文章识别方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168992A (zh) * 2017-03-29 2017-09-15 北京百度网讯科技有限公司 基于人工智能的文章分类方法及装置、设备与可读介质
CN109190111A (zh) * 2018-08-07 2019-01-11 北京奇艺世纪科技有限公司 一种文档正文关键词提取方法及装置
CN110008401A (zh) * 2019-02-21 2019-07-12 北京达佳互联信息技术有限公司 关键词提取方法、关键词提取装置和计算机可读存储介质
CN109885672A (zh) * 2019-03-04 2019-06-14 中国科学院软件研究所 一种面向在线教育的问答式智能检索系统及方法
CN113011167A (zh) * 2021-02-09 2021-06-22 腾讯科技(深圳)有限公司 基于人工智能的作弊识别方法、装置、设备及存储介质
CN115221307A (zh) * 2021-04-15 2022-10-21 腾讯科技(深圳)有限公司 一种文章识别方法、装置、计算机设备及存储介质
CN115065512A (zh) * 2022-05-31 2022-09-16 北京奇艺世纪科技有限公司 一种账号登录方法、系统、装置、电子设备以及存储介质
CN115099239A (zh) * 2022-06-16 2022-09-23 北京百度网讯科技有限公司 一种资源识别方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
Enayet et al. NileTMRG at SemEval-2017 task 8: Determining rumour and veracity support for rumours on Twitter.
CN107193959B (zh) 一种面向纯文本的企业实体分类方法
Iqbal et al. E-mail authorship verification for forensic investigation
Wang et al. Word clustering based on POS feature for efficient twitter sentiment analysis
US20190213488A1 (en) Systems and methods for semantic analysis based on knowledge graph
CN106611375A (zh) 一种基于文本分析的信用风险评估方法及装置
CN110909531B (zh) 信息安全的甄别方法、装置、设备及存储介质
Demilie et al. Detection of fake news and hate speech for Ethiopian languages: a systematic review of the approaches
CN112667813B (zh) 用于裁判文书的敏感身份信息的识别方法
Al-Omari et al. JUSTDeep at NLP4IF 2019 task 1: Propaganda detection using ensemble deep learning models
KR20200045657A (ko) 인공지능 기반의 팩트 체크 가이드라인을 이용한 가짜 뉴스 판별 시스템
WO2015030112A1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
Chen et al. Using fuzzy clustering with deep learning models for detection of COVID-19 disinformation
Agarwal et al. Can twitter help to predict outcome of 2019 indian general election: A deep learning based study
CN107908649B (zh) 一种文本分类的控制方法
US20170011479A1 (en) Document analysis system, document analysis method, and document analysis program
KR20220068937A (ko) 기계학습 방법론을 이용한 한국 표준 산업/직업 분류 방법
CN111950265A (zh) 一种领域词库构建方法和装置
JP5933863B1 (ja) データ分析システム、制御方法、制御プログラム、および記録媒体
CN117172245A (zh) 控制方法及控制系统
Kaothanthong et al. Headline2Vec: A CNN-based feature for Thai clickbait headlines classification
CN114297390B (zh) 一种长尾分布场景下的方面类别识别方法及系统
Rahman et al. An efficient deep learning technique for bangla fake news detection
CN115017894A (zh) 一种舆情风险识别方法及装置
CN115618297A (zh) 识别异常企业的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination