CN112069836A - 谣言识别方法、装置、设备及存储介质 - Google Patents

谣言识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112069836A
CN112069836A CN202010968143.7A CN202010968143A CN112069836A CN 112069836 A CN112069836 A CN 112069836A CN 202010968143 A CN202010968143 A CN 202010968143A CN 112069836 A CN112069836 A CN 112069836A
Authority
CN
China
Prior art keywords
rumor
information
video
result
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010968143.7A
Other languages
English (en)
Inventor
郝彦超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010968143.7A priority Critical patent/CN112069836A/zh
Publication of CN112069836A publication Critical patent/CN112069836A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了谣言识别方法及装置,至少涉及人工智能中自然语言处理技术,本申请实施例提供的谣言识别方法中,对于待识别的第一信息而言,至少从标题和文本内容两个维度分别对第一信息进行分析,以得到这两个维度分别对应的表征第一信息是否为谣言的结果。即从多维度对第一信息是否为谣言进行判断,基于这两个维度分别对应的表征第一信息是否为谣言的结果得到的最终结果更加准确。

Description

谣言识别方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术领域,更具体的说,是涉及谣言识别方法、装置、设备及存储介质。
背景技术
随着网络的发展,越来越多的用户通过分享视频(特别是短视频)、音频或文本等信息进行社交活动,用户分享的信息可能是谣言,用户分享的谣言通过网络快速且广泛的在人群中传播,可能会引起恐慌,进而影响人们正常的生活秩序。
因此,如何鉴别网络中的信息是否为谣言是本领域技术人员急需解决的技术难题。
发明内容
有鉴于此,本申请提供了一种谣言识别方法、装置、设备及存储介质,以解决如何鉴别网络中的信息是否为谣言的技术难题。
为实现上述目的,本申请提供如下技术方案:
根据本申请实施例的第一方面,提供了一种谣言识别方法,包括:获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
根据本申请实施例的第二方面,提供了一种谣言识别装置,包括:第一获取模块,用于获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;第二获取模块,用于基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;确定模块,用于基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;第三获取模块,用于基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
根据本申请实施例的第三方面,提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于执行所述程序,所述程序具体用于:获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
根据本申请实施例的第四方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述第一方面所述谣言识别方法包含的步骤。
根据本申请实施例的第五方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面的各种可能实现方式中提供的方法。
经由上述的技术方案可知,本申请实施例提供的谣言识别方法中,对于待识别的第一信息而言,至少从标题和文本内容两个维度分别对第一信息进行分析,以得到这两个维度分别对应的表征第一信息是否为谣言的结果。即从多维度对第一信息是否为谣言进行判断,基于这两个维度分别对应的表征第一信息是否为谣言的结果得到的最终结果更加准确。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的实施环境的一种实现方式的架构图;
图2为本申请实施例提供的实施环境的另一种实现方式的架构图;
图3为本申请实施例提供的谣言识别方法的流程图;
图4为本申请实施例提供的谣言识别方法的技术体系架构示意图;
图5为本申请实施例提供的谣言识别方法的另一技术体系架构的示意图;
图6为本申请实施例提供的视频中的多帧视频图像的示意图;
图7为本申请实施例提供的谣言识别装置的示意图;
图8为本申请实施例提供的电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了谣言识别方法以及装置,在介绍本申请实施例提供的技术方案之前,先对本申请实施例涉及的应用环境和实施环境进行介绍。
首先对本申请实施例涉及的应用环境进行介绍。
谣言一般指没有事实存在而捏造的信息。谣言的特点是没有相应事实基础,却被捏造出来并通过一定手段在人和人之间传播。谣言是社会心理学等领域关注的重要社会现象,近年来随着科学技术不断发展,媒体形式也从传统纸质媒体向电子媒体发展。谣言通过网络在人与人之间传播,导致人们难以从纷繁复杂的信息中甄别得到可信的信息,进而影响人们正常的生活秩序,甚至会引起恐慌或者引导非健康、非科学的生活方式,严重危害了内容生态的发展。特别是在面临突发公共事件,如自然灾害、新冠肺炎等公共卫生事件、社会政治事件、经济危机等时,广泛传播的谣言可能造成极大的破坏性。
基于此,本申请提供了谣言识别方法,通过从多维度(例如,标题和文本内容)分别对待识别第一信息进行分析,从多维度分别获得表征第一信息是否为谣言的结果,最后基于多维度分别对应的结果,确定最终结果。与仅从一个维度对第一信息进行识别相比更加准确。
其次对本申请实施例涉及的实施环境进行说明,本申请实施例涉及的实施环境有多种,本申请实施例提供但不限于以下几种。
第一种实施环境:如图1所示,为本申请实施例提供的实施环境的一种实现方式的架构图,该实施环境包括:第一服务器10、第二服务器11以及至少一个第一电子设备12。
示例性的,第一电子设备12可以通过无线网络与第一服务器10建立连接并通信。第一服务器10可以通过无线网络或有线网络与第二服务器11建立连接并通信。
示例性的,第一服务器10与第二服务器11可以为同一服务器,或,不同的服务器。
示例性的,图1仅为示例,图1中示出3个第一电子设备12,本申请实施例并不对第一电子设备12的数目进行限定,第一电子设备12的数目可以基于实际情况确定,这里不进行限定。
示例性的,第一电子设备12可以为任何一种可与用户通过键盘、触摸板、触摸屏、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、平板电脑、掌上电脑、可穿戴设备等。
示例性的,第一服务器10可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者,是一个云计算服务中心。
示例性的,第二服务器11可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者,是一个云计算服务中心。
第一电子设备12的持有者通过第一电子设备12在发布第一信息时,将第一信息发送至第一服务器10,第一服务器10可以将第一信息发送至其他第一电子设备12。示例性的,第一服务器可以为信息分发平台。
例如,若第一信息为短视频,第一服务器10可以为视频分发平台;若第一信息为文本,第一服务器10可以为文本分发平台。
示例性的,第一信息可以为视频、音频、文本中的至少一种。
本申请实施例提供的谣言识别方法可以应用于第二服务器11。第二服务器11可以从第一服务器10中获得第一信息后,识别第一信息是否为谣言。
示例性的,第二服务器11确定第一信息是谣言后,向第一服务器10发送禁止对第一信息进行转发的请求,从而使得第一服务器10不会将第一信息发送至其他第一电子设备12,从而使得其他第一电子设备12无法查看到第一信息。
示例性的,第一服务器11与第二服务器11可以为同一服务器,或不同服务器。
示例性的,第二服务器11确定的表征第一信息为谣言的最终结果,并不是100%准确的,所以可能需要人工进行进一步审核。因此公开了下述的第二种实施环境。
第二种实施环境,如图2所示,为本申请实施例提供的实施环境的另一种实现方式的架构图,该实施环境包括:第一服务器10、第二服务器11、至少一个第一电子设备12以及至少一个第二电子设备13。
针对第一服务器10、第二服务器11和第一电子设备12的说明可以参见图1,这里不再赘述。
第二服务器11确定第一信息是谣言后,可以将第一信息发送至第二电子设备13。以使得专家基于第二电子设备13人为对第一信息进行审核。
示例性的,第二电子设备13可以为任何一种可与用户通过键盘、触摸板、触摸屏、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、平板电脑、掌上电脑、可穿戴设备等。
示例性的,第二电子设备13可以通过无线网络或有线网络与第二服务器11建立连接并通信。
示例性的,第二电子设备13与第二服务器11可以为同一设备,或者,不同设备。
示例性的,第二服务器11确定的表征第一信息是否属于谣言的最终结果,与,实际中第一信息是否属于谣言的真实结果可能不同。例如,第二服务器11确定的最终结果表征第一信息是谣言,但专家审核第一信息不是谣言,即真实结果表征第一信息不是谣言;或者,第二服务器11确定的最终结果表征第一信息不是谣言,但是第一信息广泛传播后,由大量用户举报第一信息是谣言,即真实结果表征第一信息是谣言;或者,第二服务器11确定的最终结果表征第一信息不是谣言,但是第一信息广泛传播后,由大量用户举报第一信息是谣言,且进一步由专家鉴定后确定第一信息是谣言,即真实结果表征第一信息是谣言。
综上,第二服务器11确定的表征第一信息是否属于谣言的最终结果,与,实际中第一信息是否属于谣言的真实结果可能不同,可以基于此种第一信息对本申请实施例提供的谣言识别方法进行修正。
示例性的,可以由第二服务器或第一服务器或第二电子设备接收到第一信息(即真实结果与最终结果不同的第一信息),对第二服务器包含的谣言识别方法进行修正。
示例性的,可以由除第二服务器、第一服务器以及第二电子设备以外的其他电子设备对第二服务器包含的谣言识别方法进行修正。
需要说明的是,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
AI技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术,其基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。AI软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理(Nature Language Process-ing,NLP)技术以及机器学习/深度学习等几大方向。
其中,NLP技术主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。它是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。NLP技术通常包括机器翻译,顾名思义,机器翻译技术是指研究一种能以人类智能相似的进行语言翻译的智能机器的技术。其中,机器翻译系统通常是由编码器和译码器组成。除了机器翻译之外,NLP技术还包括机器人问答、文本处理、语义理解以及知识图谱等技术。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR(Optical Character Recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
语音处理技术(Speech Technology)的关键技术有自动语音识别技术(AutomaticSpeech Recognition,ASR)和语音合成技术(Text To Speech,TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例涉及人工智能领域中多个技术,具体通过如下实施例进行说明。
请参阅附图3,为本申请实施例提供的谣言识别方法的流程图,该方法在实施过程中包括以下步骤S301至步骤S304。
步骤S301:获取待识别的第一信息对应的标题以及文本内容。
所述文本内容包括直接或间接获取的表征所述第一信息的内容。具体地址,所述直接获取的表征第一信息的内容为如标题、标签等第一信息本身附带的文本内容;间接获取的表征第一信息的内容为从第一信息中转换获取的文本内容,如从音视频中通过音频转文字获取的文本内容,或从视频中通过图像识别等技术获取的字幕、弹幕等文本内容等。
下面结合举例对标题和文本内容进行说明。
第一种第一信息的媒体形态为视频。
视频特别是短视频作为越来越流行的媒体传播载体,受到了越来越多人的关注。视频这一媒体形态的发展使得大量不可靠的信息以视频谣言等多媒体谣言形式快速且广泛地在人群中传播。
若第一信息为视频,标题为视频的标题;示例性的,视频包含的视频图像可能包括人物、物体、动物、景物、字幕中的至少一种。可选的,文本内容是指表征视频图像中包含的人物图像的文本信息、表征视频图像中包含的人物行为的文本信息、表征视频图像中包含的景物的文本信息、视频图像包含的字幕信息中的至少一种。
上述获取视频对应的文本内容涉及AI领域中计算机视觉技术中的重要技术分支——图像语义理解(Image Semantic Understanding,ISU)以及视频语义理解(videosemantic understanding,VSU)。
示例性的,可以通过ISU技术获取视频对应的文本内容。示例性的,视频图像包含的文字信息可以是基于ISU技术中的OCR技术得到的。
示例性的,表征视频图像中包含的人物行为的信息可以是基于VSU技术得到的。
示例性的,若视频包括音频,可选的,可以通过AI技术中的语音处理技术将音频转化文本,上述文本内容包括音频转换成的文本。
例如,通过AI技术中语音处理技术中的ASR将音频转换成文本。
可以理解的是,若音频包括背景音乐及针对视频的配音中的至少一个。若配音为方言,或者,音频包括背景音乐,那么,由音频转换成的文本的准确度可能不高。针对于此,基于计算机视觉技术从视频包含的视频图像中的内容得到的文本(例如字幕信息),可以弥补上述缺陷。
可以理解的是,视频这一媒体形态比较复杂,若第一信息的媒体形态为视频,可以从多模态角度分别对第一信息进行分析,例如,多模态角度包括但不限于标题、视频图像的内容及音频中的至少一种。
第二种第一信息的媒体形态为音频。
可以通过AI技术中的语音处理技术将音频转化文本,上述文本内容包括音频转换成的文本。例如,通过AI技术中语音处理技术中的ASR将音频转换成文本。
第三种第一信息的媒体形态为文本。
文本内容即为文本。若该文本具有标题,文本的标题即为步骤S301提及的标题;若该文本不具有标题,那么,可以从文本中提取能够代表文本的关键词,将该关键词确定为该文本的标题。
示例性的,可以基于人工智能技术领域中NLP技术中的语义理解(Semanticunderstanding)技术从文本中提取能够代表文本的关键词。
例如,通过NLP技术中的词袋子模型one-hot技术或者TF-TDF(term frequency–inverse document frequency)技术,从文本中提取能够代表文本的关键词。
可以理解的是,无论属于哪种媒体形态的第一信息,都可能对应有简介内容,例如视频对应有简介内容,第一信息对应的简介内容用于简要描述第一信息包含的内容。即简介内容是文本内容的简要版本。示例性的,若第一信息对应有简介内容,第一信息对应的文本内容可以包括简介内容。
示例性的,由于第一信息的标题也是对第一信息的大概说明,所以若第一信息对应有简介内容,第一信息对应的标题可以包括简介内容。
示例性的,第一信息的标题和第一信息的文本内容均不包括简介内容。
示例性的,第一信息的媒体形态可以为视频、音频和文本中的至少一种。
步骤S302:基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果。
示例性的,预设的谣言标题类型的数目大于或等于1。预设的谣言标题类型的数目可以基于实际情况而定,本申请实施例对此不进行限定。
示例性的,若第一信息对应有标题以及简介内容,步骤S302可以包括:获得标题与预设的至少一个谣言标题类型的所属关系,以获得表征所述第一信息是否属于谣言的第三子结果;获取简介内容与预设的至少一个谣言简介类型的所属关系,以获得表征所述第一信息是否属于谣言的第四子结果,其中,第一结果包括第三子结果以及第四子结果。
示例性的,若第一信息未对应有标题,但是对应有简介内容,那么,可以将简介内容作为标题。
示例性的,若第一信息对应有标题以及简介内容,可以将标题和简介内容作为整体,例如,称标题以及简介内容为标题简介信息,步骤S302可以包括:获取标题简介信息与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果。
示例性的,第一信息的媒体形态不同,预设的至少一个谣言标题类型可能不同。示例性的,本申请实施例可以基于各媒体形态下的大量谣言,对各媒体形态下的谣言标题类型进行划分。
下面以媒体形态为视频为例进行说明。
谣言视频涉及人类社会生活的方方面面,话题多种多样,与非谣言视频相比,谣言视频具有比较明显的倾向性。根据谣言视频的标题,大致上可以将其划分为以下四类谣言标题类型。
政治类型,即带有明显政治斗争目或者意识形态,与政治话题比较相关的谣言视频的标题所属类型;欺诈类型,利用人们的同情心或者追求利益的心理,骗取人们大量关注或转发的谣言视频的标题所属类型;常识类型,关于扭曲自然类常识、历史类常识、生活类常识来吸引人们注意力的谣言视频的标题所属类型;社会娱乐生活类型,为关于社会各界人物的花边新闻或者娱乐圈不实新闻的视频谣言的标题所属类型。
本申请实施例提及的上述四类谣言标题类型仅为示例,并未将“预设的至少一个谣言标题类型”限定为上述四类,例如,“预设的至少一个谣言标题类型”还可以包括:标题党类型、有待考证的事件类型、历史与现实结合形成虚假类型、怪力乱神类型。
其中,标题党类型,是指各类真假难辨、危言耸听、甚至蛊惑恐吓的标题所属类型。目前为了吸引网友的眼球,标题制作底限不断被刷新,各类真假难辨、危言耸听、甚至蛊惑恐吓的标题层出不穷。例如,标题“山寨春晚融资百万或请郭德纲表演相声”、标题“刘翔或参见东亚运动会”等属于标题党类型。
有待考证的事件类型,是指事件的真相还需要去考察、研究、探讨的标题所属类型。例如,标题“真实的蛇化龙事件”属于有待考证的事件类型。
历史与现实结合形成虚假类型,是指历史信息与现在的信息相结合的标题所属类型,例如,标题“霍金曾亲口预言秦始皇只是走不出自己的墓!”、标题“古墓出土一块千年织锦,上面写了八个字,预言中国2040年将发生的事”属于历史与现实结合形成虚假类型。
怪力乱神类型,是指关于怪异、勇力、叛乱、鬼神之事的标题所属类型,例如,标题“地狱使者与鬼怪的日常”、标题“XX地区的灵异事件”、标题“真的有恶灵吗?”等等属于怪力乱神类型。
示例性的,第一信息的媒体形态不同,预设的至少一个谣言标题类型可以相同。
示例性的,若第一信息的标题属于预设的至少一个谣言标题类型中任一谣言标题类型,那么,第一结果为第一信息属于谣言,或者,第一结果为第一信息属于谣言的概率大于或等于阈值A。
示例性的,若第一信息的标题不属于预设的任一个谣言标题类型,那么,第一结果为第一信息不属于谣言,或者,第一结果为第一信息属于谣言的概率小于阈值A。
步骤S303:基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果。
示例性的,在执行图3所示的各步骤的过程中,步骤S302与步骤S303没有先后执行顺序,例如,可以先执行步骤S302再执行步骤S303,或者,先执行步骤S303再执行步骤S302,或者,同时执行步骤S302以及步骤S303。
通过步骤S302以及步骤S303可知,至少从标题和文本内容两个维度分别对第一信息进行分析,以得到这两个维度分别对应的表征第一信息是否为谣言的结果。
示例性的,若第一信息对应有简介内容,第一信息对应的文本内容可以包括简介内容。假设,文本内容包含的表征所述第一信息的内容为第一文本内容,步骤S303可以包括:基于所述简介内容确定表征所述第一信息是否属于谣言的第五子结果;基于第一文本内容确定表征所述第一信息是否属于谣言的第六子结果,其中,第二结果包括第五子结果以及第六子结果。
示例性的,若第一信息对应有简介内容,第一信息对应的文本内容可以包括简介内容。可以将第一文本内容和简介内容作为一个整体,步骤S303可以包括:基于所述简介内容以及所述第一文本内容,确定表征所述第一信息是否属于谣言的第二结果。
示例性的,若第一信息未对应有简介内容,文本内容仅包括第一文本内容。
步骤S304:基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
示例性的,若第一结果和第二结果均表征第一信息不是谣言,则最终结果表征第一信息不是谣言;示例性的,若第一结果和第二结果至少一个表征第一信息是谣言,最终结果为表征第一信息为谣言的结果。
示例性的,若第一结果为第一信息为谣言的概率是第一概率,第二结果为第一信息为谣言的概率是第二概率,可以为第一结果和第二结果分别设置权重,例如,第一结果对应权重1,第二结果对应权重2,那么,信息A(假设最终结果包括表征所述第一信息是否为谣言的信息为信息A)=权重1*第一概率+权重2*第二概率。
示例性的,若信息A大于或等于阈值B,则信息A表征第一信息为谣言,若信息A小于阈值B,则信息A表征第一信息为非谣言。
示例性的,最终结果可以包括第一结果以及第二结果,以及信息A;若信息A表征第一信息为谣言,将最终结果以及第一信息发送至第二电子设备,以使得专家结合最终结果对第一信息进行人工审核。
本申请实施例提供的谣言识别方法中,对于待识别的第一信息而言,至少从标题和文本内容两个维度分别对第一信息进行分析,以得到这两个维度分别对应的表征第一信息是否为谣言的结果。即从多维度对第一信息是否为谣言进行判断,基于这两个维度分别对应的表征第一信息是否为谣言的结果得到的最终结果更加准确。
在一可选实现方式中,若第一信息的媒体形态为视频,除了可以从标题和文本内容两个维度对第一信息进行分析,还可以从视频播放画面的特点、视频包含的音频以及视频中视频图像包含的内容这三个维度对第一信息进行分析。
通过对大量谣言视频进行分析发现,谣言视频中播放画面的特点属于预设的轮播类型的谣言视频占比很大。其中,属于轮播类型的视频的画面播放特点为一个画面停留一定时长后,才会切换至另一画面,类似于幻灯片的播放。本申请实施例中将属于轮播类型的视频称为轮播视频。
可以理解的是,轮播视频不一定是谣言视频,非轮播视频也可能是谣言视频,只是若一个视频是轮播视频,其可能是谣言的概率大一些。所以若视频属于轮播视频,并不能直接确定视频属于谣言视频还是非谣言视频,因此本申请实施例将“基于所述视频的画面变换特征,确定所述视频是否属于预设的轮播类型”称为“辅助判黑策略”。
申请人通过“谣言视频中轮播视频占比很大”这一特征,将视频是否属于轮播视频作为判断第一信息是否属于谣言的辅助信息。
在一可选实施例中,确定视频是否属于轮播视频的方法包括:基于所述视频的画面变换特征,确定所述视频是否属于轮播视频。
其中,所述画面变换特征至少包括所述视频包含的至少一个画面对应的停留时长,一个所述画面对应的停留时长是指从所述画面切换至另一画面之前所述画面的展示时长。
示例性的,若视频的画面变化特征包含的停留时长大于或等于预设时长,确定视频属于轮播视频;若视频的画面变化特征包含的停留时间小于预设时长,确定视频不属于轮播视频。
示例性的,在实际应用中,画面对应的预设时长可以通过以下方式确定,使得用户能够感知到该画面“停顿”了一下,才切换至下一画面,画面“停顿”的时长即为预设时长,或者,预设时长为大于该面“停顿”的时长的任一值。
示例性的,可以基于人工智能技术领域中计算机视觉技术中的ISU技术获得视频的画面变换特征。
上述“基于所述视频的画面变换特征,确定所述视频是否属于轮播视频”的方式有多种,本申请实施例提供但不限于以下两种。
第一种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第一种确定视频是否属于轮播视频的方法包括以下步骤A11至步骤A12。
步骤A11:将所述视频包含的多帧视频图像,或,所述视频输入至预构建的第二分类器,第二分类器用于检测所述视频是否轮播视频。
其中,第二分类器可以从多帧视频图像或视频中获得画面变换特征,以基于画面变换特征判断视频是否为轮播视频。
构建第二分类器的方法有多种,本申请实施例提供但不限于以下方法。
构建第二分类器的方法包括步骤A121至步骤A122。
步骤A121:获取多个第一样本视频。
其中,多个第一样本视频包括多个正第一样本视频以及负第一样本视频。正第一样本视频为轮播视频,负第一样本视频为非轮播视频。
步骤A122:将多个第一样本视频作为第一机器模型的输入,将多个第一样本视频分别对应的标注视频类型作为输出,训练第一机器模型以得到第二分类器。
其中,正第一样本视频对应的标注视频类型为轮播视频,负第一样本视频对应的标注视频类型为非轮播视频。
在训练第一机器模型的过程中涉及机器学习中的人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术中至少一种。
示例性的,第一机器模型可以为神经网络模型、逻辑回归模型、线性回归模型、支持向量机(SVM)、Adaboost、XGboost、Transformer-Encoder模型中任一种模型。
示例性的,神经网络模型可以为基于循环神经网络的模型、基于卷积神经网络的模型、基于Transformer-encoder的分类模型中的任一种。
示例性的,第一机器模型可以为基于循环神经网络的模型、基于卷积神经网络的模型以及基于Transformer-encoder的分类模型的深度混合模型。
示例性的,第一机器模型可以为基于注意力的深度模型、基于记忆网络的深度模型、基于深度学习的短文本分类模型中任一种。
基于深度学习的短文本分类模型为循环神经网络(RNN)或卷积神经网络(CNN)或者基于循环神经网络或卷积神经网络的变种。
示例性的,可以在已经预训练好的模型上做一些简单的领域适应性改造,以得到第一机器模型。
示例性的,“简单的领域适应性改造”包括但不限于在已经预训练好的模型上,再次利用大规模无监督领域语料进行二次预训练,和/或,通过模型蒸馏的方式对已经预训练好的模型进行模型压缩。
步骤A121至步骤A122为有监督学习。示例性的,还可以对第一机器模型进行半监督学习。半监督学习是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
步骤A12:获取所述第二分类器输出的第二预测结果,所述第二预测结果为所述视频为轮播视频,或,所述视频不是轮播视频。
第二种实现方式涉及AI领域中计算机视觉技术中的重要技术分支—图像识别技术,下面具体进行说明。
第二种确定视频是否属于轮播视频的方法包括以下步骤A21至步骤A22。
步骤A21:从所述视频中获取多帧视频图像。
步骤A22:将多帧视频图像划分成至少一组图像集合,一组图像集合包括具有的图像内容完全相同的一帧或多帧视频图像。
示例性的,可以基于图像识别技术检测多帧视频图像包含的图像内容是否相同。
步骤A23:基于至少一组图像集合分别对应的时间段,获得所述画面变换特征。
其中,一组图像集合对应的时间段是指该组图像集合包含的一帧或多帧视频图像位于视频的时刻中最晚时刻与最早时刻的差值。
例如,一组图像集合包括视频图像1、视频图像2以及视频图像3,其中,视频图像1位于视频的时刻为1分钟50秒,视频图像2位于视频的时刻为1分钟55秒,视频图像3位于视频的时刻为2分钟0秒,那么,该组图像集合对应的时间段为2分钟-1分钟50秒=10秒。
步骤A24:基于所述视频的画面变换特征,确定所述视频是否属于轮播视频。
示例性的,步骤S304为:基于所述第一结果、第二结果以及所述视频是否属于轮播视频,获得所述最终结果。
下面结合视频包含的音频维度对第一信息进行分析说明。
通过对大量谣言视频进行分析发现,谣言视频包含的音频为机器发出的声音(不是人发出的声音)的占比很大。
本申请实施例中,若视频中的音频为机器发出的声音,称视频为机器配音视频。
可以理解的是,若视频是机器配音视频,视频可能是谣言,也可能不是谣言;但是若视频为谣言,视频为机器配音视频的概率较大,即若确定视频为机器配音视频,并不能确定视频是否为谣言,因此,将判断视频是否为机器配音视频,也称为“辅助判黑策略”。
申请人通过“视频中的音频为机器发出的声音(不是人发出的声音)的占比很大”这一特征,将视频是否为机器配音视频作为判断第一信息是否属于谣言的辅助信息。
确定视频是否为机器配音视频的方式有多种,本申请实施例提供但不限于方法:基于所述声音的属性信息,确定所述视频是否为机器配音视频。
示例性的,音频的属性信息包括音调、音色、声纹、波形图中的至少一种。
示例性的,由于机器发出的声音是机械性的没有情绪波动,所以可以结合这个特点,基于所述音频的属性信息,确定所述视频是否为机器配音视频。
示例性的,可以基于AI领域中语音处理技术中的语音识别技术以及声纹识别技术获得音频的属性信息。
示例性的,步骤S304为:基于所述第一结果、第二结果以及所述视频是否为机器配音视频,获得所述最终结果。
示例性的,若视频是机器配音视频,那么,会增加最终结果表征所述第一信息是谣言的概率;若视频不是机器配音视频,那么,会减小最终结果表征第一信息是谣言的概率。
示例性的,步骤S304为:基于所述第一结果、第二结果、所述视频是否为机器配音视频以及所述视频是否属于轮播视频,获得所述最终结果。
下面结合视频中视频图像包含的内容这一维度对第一信息进行分析说明。
可以理解的是,通过对大量属于非谣言的视频的积累,以及,大量被错误判断为谣言视频但其实是非谣言视频的积累,确定出非谣言视频类型。
示例性的,非谣言视频类型包括但不限于:动漫视频类型、游戏视频类型、球类视频类型、打斗视频类型、低俗视频类型、广场舞视频类型中任一种或多种。
其中,动漫视频类型是指视频图像的内容为已有的动漫剧情的视频所属类型,或者,视频图像的内容为动漫制作视频所属类型。例如,视频图像包含的内容中有狐妖小红娘的人物图像,视频图像包含的内容中各人物的行为也是狐妖小红娘相关剧情中人物的行为,那么,可以确定视频属于动漫视频。
游戏视频类型是指视频图像包含的内容为游戏剪辑的视频所属类型,或者,视频图像包含的内容为游戏直播的视频所属类型。
球类视频类型是指视频图像包含的内容为球类运动的视频所属类型,例如,视频图像包含的内容为打羽毛球的视频,或,视频图像包含的内容为打乒乓球的视频。
打斗视频类型是指视频图像包含的内容全程包括打斗场景或包含打斗场景的视频图像占比整个视频包含的视频图像的总数目的预设比值(例如40%)以上的视频所属类型。
低俗视频类型是指视频图像包含的内容为色情低俗的视频所属类型。
广场舞视频类型是指视频图像包含的内容为广场舞场面的视频所属类型。
示例性的,若视频属于非谣言视频类型中一种或多种,说明视频属于非谣言视频,若视频不属于非谣言视频中的任一种,说明视频可能为谣言视频,因此本申请实施例中称“确定视频与预设的各非谣言视频类型的所属关系”为“直接判白策略”。
示例性的,一个视频可能同时属于一个或多个非谣言视频类型,例如,一个视频即属于动画视频,又属于打斗视频。
确定视频与预设的各非谣言视频类型的所属关系的方式有多种,本申请实施例提供但不限于以下两种。
第一种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第一种确定视频与预设的各非谣言视频类型的所属关系的方式包括以下步骤C11至步骤C13。
步骤C11:从所述视频中获取多帧视频图像。
步骤C12:将多帧视频图像或所述视频分别输入至各非谣言视频类型分别对应的预构建的第三分类器中。
每一非谣言视频类型对应的预构建的第三分类器的构建过程类似,下面以动漫视频类型对应的第三分类器的构建过程进行说明。
示例性的,若直接将视频输入分别输入至各非谣言视频类型分别对应的预构建的第三分类器中,可以没有步骤C11。
构建动漫视频类型对应的第三分类器的过程包括以下步骤C121至步骤C122。
步骤C121:获得多个第二样本视频。
其中,多个第二样本视频包括多个正样本视频以及负样本视频。正第二样本视频为动漫视频,负第二样本视频为非动漫视频,其中,非动漫视频可以为非谣言视频,也可以谣言视频。
步骤C122:将多个第二样本视频作为第二机器模型的输入,将多个第二样本视频分别对应的标注视频类型作为输出,训练机器模型以得到第三分类器。
其中,正第二样本视频对应的标注视频类型为动漫视频,负第二样本视频对应的标注视频类型为非动漫视频。
对第二机器模型的说明参见对第一机器模型的说明,这里不再赘述。
步骤C121至步骤C122为有监督学习。示例性的,还可以对第二机器模型进行半监督学习。半监督学习是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
步骤C13:基于各非谣言视频类型分别对应的第三分类器分别输出的第三预测结果,确定视频与预设的各非谣言视频类型的所属关系。
一个非谣言视频类型对应的第三分类器输出的第三预测结果为视频属于该非谣言视频类型,或,视频不属于该非谣言视频类型。
第二种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第二种确定视频与预设的各非谣言视频类型的所属关系的方式包括以下步骤C21至步骤C22。
步骤C21:将所述视频中的多帧视频图像,或,视频输入至预构建的第四分类器中。
第四分类器用于基于多帧视频图像检测视频所属的非谣言视频类型。
示例性的,第四分类器构建过程包括以下步骤C121至步骤C122。
步骤C221:获得多个第三样本视频。
其中,多个第三样本视频包括多个正样本视频以及负样本视频。多个正第三样本视频包括分别属于各非谣言视频类型的多个视频,例如,属于动漫视频类型的多个视频,属于游戏视频类型的多个视频,属于球类视频类型的多个视频,属于打斗视频类型的多个视频,属于低俗视频类型的多个视频以及属于广场舞视频类型的多个视频;负第二样本视频为不属于任一非谣言视频类型的视频。
步骤C222:将多个第三样本视频或多个第三样本视频中的多帧视频图像作为第三机器模型的输入,将多个第三样本视频分别对应的标注视频类型作为输出,训练机器模型以得到第四分类器。
其中,一个正第三样本视频对应的标注视频类型为其所属非谣言视频类型,负第三样本视频对应的标注视频类型为不属于任一非谣言视频类型。
对第三机器模型的说明参见对第一机器模型的说明,这里不再赘述。
步骤C22:基于第四分类器输出的第四预测结果,确定视频与预设的各非谣言视频类型的所属关系。
第四预测结果为视频属于至少一个非谣言视频类型中的目标非谣言视频类型,或,视频不属于任一非谣言视频类型。
示例性的,第四分类器包括各非谣言视频类型分别对应的预构建的第三分类器。
可以理解的是,第一信息可能对应有简介内容,若标题不包括简介内容且文本内容不包括简介内容,示例性的,还可以从简介内容这一维度对第一信息进行分析说明。
在一可选实现方式中,本申请实施例提供的谣言识别方法还包括:确定所述视频的简介内容与预设的至少一个谣言简介类型的所属关系。
示例性的,“确定所述视频的简介内容与预设的至少一个谣言简介类型的所属关系”,与,“获取所述标题与预设的至少一个谣言标题类型的所属关系”的过程类似,后续统一进行说明。
综上,可以从标题、文本内容、简介内容(若标题不包括简介内容且文本内容不包括简介内容)、视频播放画面的特点(若第一信息的媒体形态为视频)、视频包含的音频(若第一信息的媒体形态为视频)、视频中视频图像包含的内容(若第一信息的媒体形态为视频)六个维度中至少两个维度对第一信息进行说明。提高了最终结果包含的信息A的准确性。
示例性的,步骤S304可以包括:基于所述视频是否属于轮播视频、各所述非谣言视频类型分别对应的目标分类器输出的目标预测结果、所述视频是否为机器配音视频及所述视频的简介内容与预设的至少一个谣言简介类型的所属关系中的至少一个,以及所述第一结果和所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
本申请实施例中,在第一信息的媒体形态为视频时,可以从六个维度对第一信息进行全方位把控,六个维度构成了谣言识别方法的技术体系架构,即通过多个维度的多层级组合策略(例如,直接判白策略、辅助判黑策略等等),对视频是否为谣言进行识别。
为了本领域技术人员更加系统的理解上述谣言识别方法的技术体系架构,下面结合图4进行说明,如图4所示,为本申请实施例提供的谣言识别方法的技术体系架构示意图。
如图4所示,谣言识别方法可以从六个维度对第一信息进行分析,从而对第一信息进行全方位把控,得到的最终结果更加准确。
如图4所示,六个维度分别为:维度41(标题)、维度42(简介信息)、维度43(文本内容)、维度44(音频)、维度45(画面变换特征)以及维度46(视频中视频图像包含的内容)。
示例性的,图4仅为示例,在实际应用中,可以基于第一信息对应的内容从六个维度中确定一个或多个维度对第一信息进行分析。例如,若第一信息的媒体形态为文本,则可以选择从维度41和维度43两个角度对第一信息进行分析;若第一信息为视频,但是第一信息未对应有简介内容,那么,可以从维度41、维度43、维度44、维度45以及维度46五个角度对第一信息进行分析;若第一信息为视频,且第一信息对应有简介内容,那么,可以从上述六个维度分别对第一信息进行分析。
上述已经对维度44、维度45以及维度46进行了详细说明,下面对维度41、维度42以及维度43分别进行详细说明。
首先对维度41进行介绍。
在一可选实施例中,步骤S302的实现方式有多种,本申请实施例提供但不限于以下三种。
第一种实现方式涉及AI领域中NLP技术中语义理解技术以及文本预处理技术,下面具体进行说明。
第一种步骤S302的实现方式包括以下步骤D11至步骤D12。
步骤D11:若所述标题不符合所述至少一个谣言标题类型对应的关键词模式,获取表征所述第一信息不是谣言的第一结果。
步骤D12:若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,确定表征所述第一信息是谣言的第一结果。
示例性的,一个谣言标题类型对应的关键词模式可以为关键词集合,该关键词集合可以包括属于该谣言标题类型的多个标题分别对应的多个关键词。
示例性的,针对每一谣言标题类型,收集的属于该谣言标题类型的标题越多,得到的该谣言标题类型对应的关键词模式越全面。
示例性的,针对每一谣言标题类型,可以基于语义理解技术以及文本预处理技术从大量标题中获得该谣言标题类型对应的关键词模式。
示例性的,一个谣言标题类型对应的关键词模式可以为由至少一个关键词组成的用于描述符合所述谣言标题类型的标题的规则信息。
示例的,关键词模式可以用正则表达式表示。
第二种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第二种步骤S302的实现方式包括以下步骤D21至步骤D23。
步骤D21:若所述标题不符合所述至少一个谣言标题类型对应的关键词模式,获取表征所述第一信息不是谣言的第一结果。
示例性的,通过大量谣言的统计,每种类型的谣言标题都可以总结出相关的关键词模式。
示例性的,若标题被划分至某个谣言标题类型,该第一信息并不一定是真的谣言,但是若第一信息是真的谣言,那么,一定会被划分至各谣言标题类型中某个谣言标题类型。
综上,每个谣言标题类型对应的关键词模式对于第一信息来讲是必要不充分条件。
示例性的,本申请实施例在设置各谣言标题类型对应的关键词模式时,优先考虑召回率。下面举例对召回率进行说明。
若有1000个第一信息,其中,1000个第一信息中有100个是谣言,900个是非谣言,将1000个第一信息的标题进行分类,若有500个第一信息被划分到相应的谣言标题类型中,这500个第一信息中有90个是谣言,410个是非谣言,那么,召回率=90/100=0.9。
示例性的,本申请实施例在设置各谣言标题类型对应的关键词模式时,尽量使得召回率靠近100%,甚至等于100%,以保证不会漏掉谣言。
示例性的,在使得召回率靠近100%的情况下,尽量提升准确率。
仍以上述举例对准确率进行说明,准确率=90/500=0.18。
示例性的,可以结合召回率和准确率,确定各谣言标题类型分别对应的关键词模式。
步骤D22:若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,将所述标题输入至所述目标谣言标题类型对应的第一分类器。
所述第一分类器用于检测输入的标题是否属于所述目标谣言标题类型。
示例性的,若标题被划分至目标谣言标题类型,该第一信息并不一定是真的谣言,那么,需要进一步确定被划分至目标谣言标题类型的标题是否真的属于目标谣言标题类型。
示例性的,不同谣言标题类型对应不同的分类器,一个谣言标题类型对应的分类器是用于检测输入的标题是否属于该谣言标题类型。
示例性的,由于不同谣言标题类型的标题的特征侧重点不尽相同,所以针对每一谣言标题类型设计一个第一分类器。
不同谣言标题类型对应的第一分类器获得相应标题的特征的侧重点不同。
示例性的,每一谣言标题类型对应的第一分类器构建过程类似,下面以谣言标题类型A对应的第一分类器的构建过程为例进行说明,构建第一分类器的过程包括以下步骤D221至步骤D222。
步骤D221:获取多个样本标题。
其中,多个样本标题包括多个正样本标题以及负样本标题。正样本标题为属于谣言标题类型A的标题,负样本标题为不属于该谣言标题类型A的标题。
步骤D222:将多个样本标题作为第四机器模型的输入,将多个样本标题分别对应的标注类型作为输出,训练第四机器模型以得到第一分类器。
其中,正样本标题对应的标注类型为谣言标题类型A,负样本标题对应的标注类型为非谣言标题类型A。
对第四机器模型的说明参见对第一机器模型的说明,这里不再赘述。
步骤D221至步骤D222为有监督学习。示例性的,还可以对第四机器模型进行半监督学习。半监督学习是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
综上,通过第一分类器进一步确定标题是否真的属于目标谣言标题类型,弥补了在保证召回率的情况下,准确度较低的情况。
步骤D23:基于所述第一分类器输出的第一预测结果,获得所述第一结果,第一预测结果为标题属于目标谣言标题类型,或,第一预测结果为标题不属于目标谣言标题类型。
示例性的,若第一预测结果为标题属于所述目标谣言标题类型,那么,第一结果表征所述第一信息属于谣言;若第一预测结果为所述标题不属于所述目标谣言标题类型,那么,第一结果表征第一信息不属于谣言。
第三种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第三种步骤S302的实现方式包括以下步骤D31至步骤D32。
步骤D31:将所述标题输入至第五分类器。
第五分类器用于检测输入的标题属于多个谣言标题类型中的哪种谣言标题类型。
示例性的,第五分类器相当于包括各谣言标题类型分别对应的第一分类器。
步骤D32:基于第五分类器输出的第五预测结果,获得所述第一结果。
所述第五预测结果为所述标题属于多个谣言标题类型中目标谣言标题类型,或,所述标题不属于多个谣言标题类型中任一谣言标题类型。
示例性的,第五分类器训练的过程包括步骤D321至步骤D322。
步骤D321:获取多个样本标题。
其中,多个样本标题包括多个正样本标题以及负样本标题。将分别属于各谣言标题类型的标题称为正样本标题,将不属于各谣言标题类型中任一谣言标题类型的标题称为负样本标题。
步骤D322:将多个样本标题作为第五机器模型的输入,将多个样本标题分别对应的标注类型作为输出,训练第五机器模型以得到第五分类器。
其中,正样本标题对应的标注类型为该正样本标题所属的谣言标题类型,负样本标题对应的标注类型为不属于任一谣言标题类型。
对第五机器模型的说明参见对第一机器模型的说明,这里不再赘述。
步骤D321至步骤D322为有监督学习。示例性的,还可以对第五机器模型进行半监督学习。半监督学习是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
在一可选实现方式中,本申请实施例在设置各谣言标题类型对应的关键词模式时,优先考虑召回率,使得准确率较低,除了采用上述步骤D22至步骤D23提高准确率以外,还可以通过“拒识策略”和/或“标题事实检索策略”提高准确率。
下面首先对“拒识策略”进行说明。
上述三种步骤S302的实现方式中,即使步骤D12确定标题属于目标谣言标题类型,或者,步骤D23中第一预测结果为所述标题属于所述目标谣言标题类型,或者,步骤D32中第五预测结果为所述标题属于所述目标谣言标题类型,第一信息也有可能不是谣言,下面以目标谣言标题类型为怪力乱神类型进行说明。
可以理解的是,第一信息可能是电影或电视剧或小说或歌曲MV或综艺节目中的至少部分内容,或者,第一信息可能是电影或电视剧或小说或歌曲MV或综艺节目中相似剧情的再现。尽管第一信息的标题属于怪力乱神类型,但是第一信息也不是谣言。
基于此,基于电视剧的素材、电影的素材、动漫的素材、小说的素材以及综艺节目的素材中的一种或多种得到知识库。
其中,电视剧的素材包括但不限于电视剧名称、电视剧别名、电视剧中的各角色的姓名、电视剧的类型、电视剧的上映地区以及电视剧的上映时间中的至少一种。电影的素材包括但不限于电影名称、电影别名、电影中的各角色的姓名、电影的类型、电影上映地区以及电影上映时间中的至少一种。动漫的素材包括但不限于动漫名称、动漫别名、动漫中的各角色的姓名、动漫类型、动漫上映的地区以及动漫上映的时间中的至少一种。小说的素材包括但不限于小说名称、小说别名、小说中的各角色的姓名、小说类型以及小说发表时间中的至少一种;综艺节目的素材包括但不限于综艺的名称、综艺的别名、综艺中的人物、综艺上映地区以及综艺上映的时间中的至少一种。
示例性的,可以将电视剧的素材、电影的素材、动漫的素材、小说的素材以及综艺节目的素材分别对应一个剧情类型,即本申请实施例至少包括5种剧情类型。
示例性的,对于电视剧的素材而言,电视剧的类型不同,对应不同的剧情类型;电影、动漫、小说、综艺同理。即本申请实施例中剧情类型的数目=电视剧的类型的数目+电影的类型的数目+动漫的类型的数目+小说的类型的数目+综艺的类型的数目。
在一可选实现方式中,若步骤D12确定标题属于目标谣言标题类型,或者,步骤D23中第一预测结果为所述标题属于所述目标谣言标题类型,或者,步骤D32中第五预测结果为所述标题属于所述目标谣言标题类型,还需要确定所述标题与预设的至少一个剧情类型的所属关系。
本申请实施例中,称“确定所述标题与预设的至少一个剧情类型的所属关系”为拒识策略。
示例性的,上述三种步骤S302的实现方式中,步骤D12、步骤D23、步骤D32具体包括以下步骤E11至步骤E13。
步骤E11:若确定所述标题属于所述目标谣言标题类型,确定所述标题与预设的至少一个剧情类型的所属关系。
步骤E12:若所述标题属于所述至少一个剧情类型中的目标剧情类型,获取表征所述第一信息不是谣言的所述第一结果。
步骤E13:若所述标题不属于所述至少一个剧情类型,获取表征所述第一信息是谣言的所述第一结果。
本申请实施例中步骤E11中“确定所述标题与预设的至少一个剧情类型的所属关系”的步骤,该步骤的实现方式有多种,本申请实施例提供但不限于以下三种。
第一种实现方式涉及AI领域中NLP技术中语义理解技术以及文本预处理技术,下面具体进行说明。
第一种确定所述标题与预设的至少一个剧情类型的所属关系的方法包括以下步骤F11至步骤F12。
步骤F11:检测所述标题是否符合预设的至少一个剧情类型对应的关键词模式。
示例性的,一个剧情类型对应的关键词模式可以为关键词集合,该关键词集合可以包括属于该剧情类型的多个标题分别对应的多个关键词。
示例性的,针对每一剧情类型,可以基于语义理解技术以及文本预处理技术从大量标题中获得该剧情类型对应的关键词模式。
示例性的,针对每一剧情类型,收集的属于该剧情类型的标题越多,得到的该剧情类型对应的关键词模式越全面。
示例性的,一个剧情类型对应的关键词模式可以为由至少一个关键词组成的用于描述符合所述剧情类型的标题的规则信息。
示例的,关键词模式可以用正则表达式表示。
步骤F12:若所述标题符合至少一个剧情类型中的目标剧情类型对应的关键词模式,确定所述标题属于目标剧情类型。
假设,“至少一个剧情类型”包括:电影剧情类型、电视剧剧情类型、动漫剧情类型、小说剧情类型、综艺类型。示例性的,一个标题可以同时属于一个或多个剧情类型,例如,一个标题即属于小说剧情类型,又属于电影剧情类型。例如,电影由小说改编。
步骤F13:若所述标题不符合任一剧情类型对应的关键词模式,确定所述标题不属于任一剧情类型。
第二种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第二种确定所述标题与预设的至少一个剧情类型的所属关系的方法包括以下步骤F21至步骤F22。
步骤F21:将所述标题输入至预设的至少一个剧情类型对应的第六分类器中。
一个剧情类型对应的第六分类器用于检测输入的标题是否属于该剧情类型。不同剧情类型对应的第六分类器不同。
示例性的,构建各剧情类型分别对应的第六分类器的方式相同,下面以一个剧情类型对应的第六分类器的构建过程进行说明。
一个剧情类型A对应的第六分类器的构建过程包括步骤F211至步骤F212。
步骤F211:获取多个样本标题。
其中,多个样本标题包括多个正样本标题以及负样本标题。正样本标题为属于剧情类型A的标题,负样本标题为不属于剧情类型A的标题。
步骤F212:将多个样本标题作为第六机器模型的输入,将多个样本标题分别对应的标注类型作为输出,训练第六机器模型以得到第六分类器。
其中,正样本标题对应的标注类型为剧情类型A,负样本标题对应的标注类型为非剧情类型A。
对第六机器模型的说明参见对第一机器模型的说明,这里不再赘述。
步骤F211至步骤F212为有监督学习。示例性的,还可以对第六机器模型进行半监督学习。半监督学习是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
步骤F22:获取至少一个剧情类型对应的第六分类器输出的第六预测结果。
一个剧情类型对应的第六分类器输出的第六预测结果为标题属于该剧情类型,或,标题不属于该剧情类型。
第三种实现方式涉及AI领域中机器学习技术,下面具体进行说明。
第三种确定所述标题与预设的至少一个剧情类型的所属关系的方法包括以下步骤F31至步骤F32。
步骤F31:将所述标题输入至第七分类器。
第七分类器用于检测输入的标题属于多个剧情类型中的哪种剧情类型。
步骤F32:获取第七分类器输出的第七预测结果。
所述第七预测结果为所述标题属于多个剧情类型中目标剧情类型,或,所述标题不属于多个剧情类型中任一剧情类型。
示例性的,第七分类器训练的过程包括步骤F311至步骤F312。
步骤F311:获取多个样本标题。
其中,多个样本标题包括多个正样本标题以及负样本标题。将分别属于各剧情类型的标题称为正样本标题,将不属于各剧情类型中任一剧情类型的标题称为负样本标题。
步骤F321:将多个样本标题作为第七机器模型的输入,将多个样本标题分别对应的标注类型作为输出,训练第七机器模型以得到第七分类器。
其中,正样本标题对应的标注类型为该正样本标题所属的剧情类型,负样本标题对应的标注类型为不属于任一剧情类型。
对第七机器模型的说明参见对第一机器模型的说明,这里不再赘述。
下面对“标题事实检索策略”进行说明。
示例性的,若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,还可以执行“标题事实检索策略”,以进一步提高确定第一信息是否为谣言的准确性。
在对“标题事实检索策略”进行说明之前,先对其涉及的谣言库和/或辟谣库进行说明。
示例性的,谣言库包括多个谣言文档,可选的,谣言库包含的各谣言文档均是人为(例如专家)确认的真实属于谣言的文档。
示例性的,辟谣库包括多个非谣言文档。可选的,非谣言文档可以包括辟谣文档。辟谣文档用户阐明谣言是假的。
示例性的,谣言库可以包括各第一关键词组合分别对应的谣言文档;一第一关键词组合包括一个或多个能够表征其对应的谣言文档的关键词。
示例性的,可以基于人工智能领域中NLP技术中的语义理解(Semanticunderstanding)技术从谣言文档中提取能够代表该谣言文档的第一关键词组合。
例如,通过NLP技术中的词袋子模型one-hot方法或者TF-TDF(term frequency–inverse document frequency)方法,从谣言文档中提取能够代表该谣言文档的第一关键词组合。
上述“各第一关键词组合分别对应的谣言文档”为倒排序索引,示例性的,倒排序索引可以为ElasticSearch索引。
示例性的,辟谣库可以包括各第二关键词组合分别对应的非谣言文档;一第二关键词组合包括一个或多个能够表征其对应的非谣言文档的关键词。
上述“各第二关键词组合分别对应的非谣言文档”为倒排序索引,示例性的,倒排序索引可以为ElasticSearch索引。
在一可选实现方式中,“标题事实检索策略”实现方法包括以下步骤G11。
步骤G11:若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,获取所述标题与预先存储的各谣言文档的相关度中最大的第一相关度;和/或,获取所述标题与各非谣言文档的相关度中最大的第二相关度。
示例性的,可以通过BM25算法,计算标题和谣言文档(或非谣言文档)的相关度;或者,可以通过余弦相似度计算标题和谣言文档(或非谣言文档)的相关度。
相应的,步骤S304包括:基于第一相关度和所述第二相关度至少一个、所述第一结果以及所述第二结果,获得所述最终结果。
其次对图4所示的维度42进行介绍。
如图4所示,维度42为简介内容,对于简介内容的描述可以参见对维度41即标题的描述,将针对维度41中所有“标题”字样修改为“简介内容”,例如,将“谣言标题类型”修改为“谣言简介类型”,将“样本标题”修改为“样本简介内容”,将“标题事实检索策略”修改为“简介内容事实检索策略”。
示例性的,谣言标题类型可能与谣言简内容类型相同,也可能不同,具体基于实际情况确定。
再次对图4所示的维度43进行介绍。
可以理解的是,第一信息的媒体形态不同,步骤S303的实现方式不同。例如,若第一信息为文本,那么,文本内容即为该文本。若第一信息为音频,那么,文本内容即为音频转换成的文本;若第一信息为视频,那么,文本内容包括视频图像中包含的文字信息(后续称为第一文本内容),可选的,还可以包括音频转换成的文本(后续称为第二文本内容)。
在一可选实现方式中,步骤S303的实现方式有多种,本申请实施例提供但不限于以下两种。
第一种实现方式涉及AI领域中NLP技术中的文本预处理以及语义理解技术分支。
第一种步骤S303的实现方法包括以下步骤H11至步骤H13。
第一种实现方式涉及“标题事实检索策略”或“简介内容事实检索策略”涉及的谣言库和/或辟谣库。本申请实施例称第一种实现方式为“内容事实检索策略”。
步骤H11:获取所述第一文本内容与预先存储的各谣言文档的相关度中最大的第三相关度,获取所述第一文本内容与预先存储各非谣言文档的相关度中最大的第四相关度,获取所述第二文本内容与各所述谣言文档的相关度中最大的第五相关度,以及,获取所述第二文本内容与各所述非谣言文档的相关度中最大的第六相关度中的至少一个。
示例性的,若“内容事实检索策略”对应有谣言库,可选的,步骤H11包括:获取所述第一文本内容与预先存储的各谣言文档的相关度中最大的第三相关度;以及,获取所述第二文本内容与各所述谣言文档的相关度中最大的第五相关度中至少一个步骤。
示例性的,若“内容事实检索策略”对应有辟谣库,可选的,步骤H11包括:获取所述第一文本内容与预先存储各非谣言文档的相关度中最大的第四相关度,以及,获取所述第二文本内容与各所述非谣言文档的相关度中最大的第六相关度中至少一个步骤。
示例性的,若“内容事实检索策略”对应有谣言库以及辟谣库,步骤H11可包括上述四个步骤中至少一个步骤。
示例性的,可以通过BM25算法,计算第一文本内容和谣言文档(或非谣言文档)的相关度;或者,可以通过余弦相似度计算第一文本内容和谣言文档(或非谣言文档)的相关度。
第二文本内容谣言文档(或非谣言文档)的相关度的计算方式同理,这里不再赘述。
步骤H12:基于所述第三相关度及所述第四相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第一子结果。
步骤H13:基于所述第五相关度及所述第六相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第二子结果。
其中,第二结果包括第一子结果及第二子结果中的至少一个。
示例性的,若基于第三相关度获得第一子结果,可选的,若第三相关度大于阈值C,第一子结果表征第一信息为谣言,若第三相关度小于或等于阈值C,第一子结果表征第一信息为非谣言。
若基于第四相关度获得第一子结果,可选的,若第四相关度大于阈值D,第一子结果表征第一信息为非谣言,若第四相关度小于或等于阈值D,第一子结果表征第一信息为谣言。
若基于第三相关度以及第四相关度,获得第一子结果,可选的,若第三相关度大于阈值C,或者,第四相关度小于或等于阈值D,第一子结果表征第一信息为谣言;若第三相关度小于或等于阈值C,且第四相关度大于阈值D,第一子结果表征第一信息为非谣言。
若基于第三相关度以及第四相关度,获得第一子结果,可选的,可以为第三相关度和第四相关度分配权重,例如,为第三相关度分配权重3,为第四相关度分配权重4,那么,若第三相关度*权重3-第四相关度*权重4大于阈值E,则第一子结果表征第一信息为谣言;若第三相关度*权重3-第四相关度*权重4小于或等于阈值E,则第一子结果表征第一信息为非谣言。
第五相关度与第六相关度同理,这里不再赘述。
第二种实现方式涉及AI领域中的机器学习。
第二种步骤S303的实现方法包括以下步骤H21至步骤H23。
步骤H21:执行将第一文本内容输入至第八分类器,以及,将第二文本内容输入至第九分类器中的至少一个步骤。
其中,第八分类器用于检测输入的第一文本内容属于谣言的第三概率;第九分类器用于检测输入的第二文本内容属于非谣言的第四概率。
示例性的,第八分类器的构建过程包括以下步骤H211至步骤H212。
步骤H211:获取多个样本文档。
其中,多个样本文档包括多个正样本文档以及负样本文档。正样本文档为谣言文档,负样本文档为非谣言文档。
步骤H212:将多个样本文档作为第八机器模型的输入,将多个样本文档分别对应的标注类型作为输出,训练第八机器模型以得到第八分类器。
其中,正样本文档对应的标注类型为谣言文档,负样本文档对应的标注类型为非谣言文档。
示例性的,第九分类器的构建过程与第八分类器的构建过程类似,只是步骤H211中的正样本文档为非谣言文档,负样本文档为谣言文档。
对第八分类器和第九分类器的说明,可以参见对第一分类器的说明,这里不再赘述。
步骤H22:基于所述第八分类器输出的第八预测结果,以及,第九分类器输出的第九预测结果中至少一个,获得第一结果。
示例性的,第八预测结果为第一信息为谣言的第三概率,第九预测结果为第一信息为谣言的第四概率。
示例性的,第三概率相当于第三相关度,第四概率相当于第四相关度,关于步骤H22的说明,可以参见针对步骤H11的说明,这里不再赘述。
结合针对维度41、维度42、维度43的详细说明,下面对图4所示的谣言识别方法的技术体系架构进一步补充,得到图5所示的谣言识别方法的另一技术体系架构的示意图。
示例性的,谣言标题类型可能与谣言简介类型相同,也可能不同,具体基于实际情况确定。图5中以谣言标题类型与谣言简介类型相同为例进行说明。
针对图5中的说明可以参见图4,这里不再赘述。
可以理解的是,第一信息的媒体形态不同,步骤S301中获取第一信息的文本内容的实现方式不同。例如,若第一信息为文本,那么,该文本即为文本内容。若第一信息为音频,那么,文本即为音频转换成的文本,若第一信息为视频,步骤S301中获取第一信息的第一文本内容的实现方式包括以下步骤J11至步骤J13。
步骤J11:从所述视频中获取多帧视频图像。
示例性的,可以每隔预设时间间隔,从视频中抽取一帧视频图像,以得到多帧视频图像;示例性的,可以随机从视频中抽取多帧视频图像。示例性的,可以将视频包含的各关键帧分别作为视频图像。
步骤J12:对多帧所述视频图像进行光学字符识别,以得到至少一帧所述视频图像包含的文本信息。
上述涉及AI领域中计算机视觉技术中的OCR技术。
示例性的,一帧视频图像包含的文本信息可以包括:视频展示的画面对应的字幕信息、弹幕、展示视频的应用程序的名称中的至少一种。
下面以具体例子对步骤J11至步骤J13进行说明。
如图6所示,为本申请实施例提供的视频中的多帧视频图像的示意图。
图6中示出了4帧视频图像,分别为视频图像61、视频图像62、视频图像63以及视频图像64,且,图6所示的4帧视频图像按照时间由早到晚顺序依次排列。图6仅为示例,并不对步骤J11获得的视频图像的数目进行限定。
示例性的,多帧视频图像均包含文本信息,或者,多帧视频图像中仅部分视频图像包含文本信息。
如图6所示,视频图像61、视频图像63以及视频图像64包括文本信息,但是视频图像62不包括文本信息。
步骤J13:基于至少一帧所述视频图像包含的文本信息,获得所述第一文本内容。
示例性的,步骤J13涉及AI领域中NLP技术中的文本预处理和语义理解技术分支。
如图6所示,视频图像61中的文本信息包括:“腾讯视频”以及“两只老虎,两只老虎,跑得快,跑得快,”;视频图像63中的文本信息包括:“腾讯视频”、“一只没有眼睛,一只没有尾巴,”以及“哈哈!真好笑”;视频图像64中的文本信息包括:“腾讯视频”、“真奇怪!真奇怪!”以及“用户1:哈哈!真好笑”。
其中,视频图像61、视频图像63以及视频图像64中的“腾讯视频”是展示该视频的应用程序的名称;视频图像63以及视频图像64中的“哈哈!真好笑”是弹幕,且视频图像63和视频图像64展示的弹幕是同一个弹幕,由于视频图像64是位于视频图像63后面的视频图像,所以弹幕已经从右侧移动至左侧;视频图像61中的“两只老虎,两只老虎,跑得快,跑得快,”、视频图像62中的“一只没有眼睛,一只没有尾巴,”、视频图像63中的“真奇怪!真奇怪!”为视频展示的画面对应的字幕信息。
示例性的,不同视频图像中可以包括不同的弹幕,也可以包括相同的弹幕。
第一文本内容可以包括:“腾讯视频”、“两只老虎,两只老虎,跑得快,跑得快,”、“腾讯视频”、“一只没有眼睛,一只没有尾巴,”、“哈哈!真好笑”、“腾讯视频”、“真奇怪!真奇怪!”、“哈哈!真好笑”。
本申请实施例中步骤J12的实现方式有多种,本申请实施例提供但不限于以下两种。
第一种步骤J12的实现方式包括:将至少一帧所述视频图像包含的文本信息,按照其所在视频图像位于所述视频的时间由早到晚的顺序拼接得到所述第一文本内容。
仍以图6为例,假设视频图像61、视频图像62、视频图像63以及视频图像64按照自身位于视频的时间由早到晚顺序依次为:视频图像61、视频图像62、视频图像63以及视频图像64。
将视频图像61、视频图像62、视频图像63以及视频图像64分别包含的内容拼接得到:腾讯视频两只老虎,两只老虎,跑得快,跑得快,腾讯视频一只没有眼睛,哈哈!真好笑一只没有尾巴,腾讯视频真奇怪!真奇怪!哈哈!真好笑。
可以理解的是,时间连续的至少两帧视频图像中可能存在同一内容,例如,视频图像63和视频图像64中的弹幕,或,视频图像63以及视频图像64中的“腾讯视频”。
由于同一内容的多次重复,会影响第一文本内容包含的相应关键词的数目,导致后续计算第一文本内容与谣言文档或非谣言文档的相关度不准确。
仍以图6为例,第一文本内容中“哈哈!真好笑”出现两次,实际应用中“哈哈!真好笑”其实仅出现了一次,由于增加了“哈哈!真好笑”数目,所以可能计算得到的“哈哈!真好笑”权重值较大,导致后续计算第一文本内容与谣言文档或非谣言文档的相关度不准确。
基于此,引入第二种实现方式。
第二种步骤J12的实现方式包括以下步骤J121至步骤J122。
步骤J121:获取至少一组视频图像集合分别对应的目标文本信息。
一组所述视频图像集合包括时间相邻的至少两帧所述视频图像,一组所述视频图像集合对应的所述目标文本信息为所述视频图像集合包含的时间相邻的至少两帧所述视频图像均包含的文本信息。
示例性的,“至少两帧所述视频图像”中涉及的视频图像的数目大于或等于2,具体数目可以基于实际情况而定。
仍以图6为例,假设“至少两帧所述视频图像”中涉及的视频图像的数目等于2,图6对应有3组视频图像集合,分别为视频图像集合A1(包括视频图像61以及视频图像62)、视频图像集合A2(包括视频图像62以及视频图像63)、视频图像集合A3(包括视频图像63以及视频图像64)。
其中,由于视频图像61以及视频图像62不包括相同的文本信息,所以视频图像集合A1未对应目标文本信息;同理视频图像集合A2未对应目标文本信息。
由于视频图像63以及视频图像64包括相同的文本信息“腾讯视频”以及“哈哈!真好笑”,所以视频图像集合A3对应的目标文本信息包括“腾讯视频”以及“哈哈!真好笑”。
步骤J121中获取一组视频图像集合对应的目标文本信息的实现方式有多种,本申请实施例提供但不限于以下两种。
第一种获取一组视频图像集合对应的目标文本信息的实现方法包括以下步骤J1211至步骤J1213。
第一种实现方式涉及AI领域中计算机视觉中的图像语义理解技术中的OCR技术分支,下面具体进行说明。
步骤J1211:识别视频图像集合包含的时间相邻的至少两帧所述视频图像分别包含的至少一个位置区域承载的文本信息。
步骤J1212:若时间相邻的至少两帧所述视频图像分别包含的目标文本信息相同,获得该组视频图像集合对应的目标文本信息。
示例性的,本申请实施例中,将一个位置区域承载的信息称为文本信息,在比较至少两帧所述视频图像分别包含的文本信息时,是以一个位置区域承载的全部信息为整体进行比较的。
如图6所示的视频图像63以及视频图像64在进行文本信息比较时,会将“一只没有眼睛,一只没有尾巴,”作为一个文本信息与视频图像64中“哈哈!真好笑”、“真奇怪!真奇怪!”、“腾讯视频”分别进行比较。不会将“一只没有眼睛”单独拿出来与视频图像64中“哈哈!真好笑”、“真奇怪!真奇怪!”、“腾讯视频”分别进行比较。
第二种实现方式涉及AI领域中计算机视觉中的图像语义理解技术中的OCR技术分支,下面具体进行说明。
第二种获取一组视频图像集合对应的目标文本信息的实现方法包括以下步骤J1213至步骤J1215。
步骤J1213:确定所述视频图像集合包含时间相邻的至少两帧所述视频图像分别包含的承载有文本信息的位置区域的尺寸。
示例性的,位置区域的尺寸可以包括位置区域的形状、能够表示该位置区域的尺寸的参数,例如,若位置区域为圆形,那么,能够表示该位置区域的尺寸的参数为圆的直径或半径;若位置区域为长方形,那么,能够表示该位置区域的尺寸的参数为位置区域的长度和位置区域的宽度。
示例性的,可以基于OCR技术中的文字区域检测技术识别承载有文本信息的位置区域的尺寸。
步骤J1214:若时间相邻的至少两帧所述视频图像分别包含的位置区域中目标位置区域的尺寸相同,检测时间相邻的至少两帧所述视频图像分别包含的所述目标位置区域中的文本信息是否相同。
示例性的,可以基于OCR技术中的文字识别技术获取目标位置区域承载的文本。
示例性的,不同视频图像中同一承载文本信息的位置区域在视频图像的位置可能不同,例如弹幕,但是不同视频图像中同一承载文本信息的位置区域的尺寸相同。如图6所示的视频图像63与视频图像64包含的弹幕所在位置区域即为上述目标位置区域。
可以理解的是,不同视频图像中承载相同文本信息的位置区域的尺寸一定相同,但是不同视频图像中若包含尺寸相同的目标位置区域,不同视频图像中目标位置区域承载的文本信息不一定相同,所以还需要进一步判断。
步骤J1215:若时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息相同,将时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息为确定为所述目标文本信息。
步骤J22:从至少一帧所述视频图像包含的文本信息中,针对至少一组所述视频图像集合分别对应的目标文本信息执行去重操作,以得到所述第一文本内容。
示例性的,针对至少一组所述视频图像集合分别对应的目标文本信息执行去重操作,即保留一个目标文本信息,删除其他目标文本信息。
仍以图6为例进行说明,得到的第一文本内容包括:“腾讯视频”、“两只老虎,两只老虎,跑得快,跑得快,”、“腾讯视频”、“一只没有眼睛,一只没有尾巴,”、“哈哈!真好笑”、“真奇怪!真奇怪!”。
示例性的,针对至少一组所述视频图像集合分别对应的目标文本信息执行去重操作包括:若至少一组视频图像集合分别对应的目标文本信息中大于或等于预设数目个视频图像集合对应的第一目标文本信息均相同,将所有的第一目标文本信息删除;若至少一组视频图像集合分别对应的目标文本信息中小于预设数目个视频图像集合对应的第二目标文本信息相同,保留一个第二目标文本信息。
示例性的,预设数目可以基于步骤J11得到的多帧视频图像的数目确定。
仍以图6所示,若预设数目为3,假设视频图像62也包括视频图像,那么,能够将“腾讯视频”删除。得到的第一文本内容包括:“两只老虎,两只老虎,跑得快,跑得快,”、“一只没有眼睛,一只没有尾巴,”、“哈哈!真好笑”、“真奇怪!真奇怪!”。
示例性的,步骤J13的实现方式有多种,本申请实施例提供但不限于以下两种。
第一种J13的实现方式包括:将至少一帧所述视频图像包含的文本信息,按照其所在视频图像位于所述视频的时间由早到晚的顺序拼接得到所述第一文本内容。
以图6中第一文本内容包括:“两只老虎,两只老虎,跑得快,跑得快,”、“一只没有眼睛,一只没有尾巴,”、“哈哈!真好笑”、“真奇怪!真奇怪!”为例,拼接得到的第一文本内容为:两只老虎,两只老虎,跑得快,跑得快,一只没有眼睛,一只没有尾巴,“哈哈!真好笑真奇怪!真奇怪!。
示例性的,若视频图像包含的文本信息包含标点符号,那么得到的第一文本内容包含的语句已经由标点符号划分好了。若视频图像包含的文本信息未包含标点符号,那么,得到的第一文本内容包含的语句未划分好,基于此引入第二种实现方式。
第二种实现方式涉及AI领域中NLP技术的语义理解技术分支,下面具体进行说明。
第二种J13的实现方式包括以下步骤J131至步骤J133。
步骤J131:将至少一帧所述视频图像包含的文本信息,按照其所在视频图像位于所述视频的时间由早到晚的顺序拼接得到候选文本内容。
步骤J132:从多帧所述视频图像中确定不包含文本信息的至少一帧目标视频图像。
如图6中的视频图像62。
步骤J133:基于所述至少一帧目标视频图像位于所述视频的时刻,将所述候选文本内容进行语句的划分,以得到所述第一文本内容。
示例性的,由于目标视频图像未包含文本信息,说明在目标视频图像位于视频的时刻,是一个停顿,所以可以基于这个特点对候选文本内容进行语句的划分。
示例性的,还可以基于NLP中的语义理解技术以及所述至少一帧目标视频图像位于所述视频的时刻,将所述候选文本内容进行语句的划分,以得到所述第一文本内容。
综上,上面对多维度的策略组合进行了介绍,各个维度的策略(例如,辅助判黑策略、直接判白策略、拒识策略、标题事实检索策略、简介内容事实检索策略、内容事实检索策略)组合起来相辅相成,共同判断第一信息是否为谣言,同时也是本申请实施例中视频谣言识别架构的主要架构部分。
可以理解的是,每个第一信息都会对应一个发布者,即用户对应的用户账号即为第一信息的发布者。建模用户账号对应的行为谣言倾向画像对于整体架构上的谣言判别也具有重要意义。即还可以从发布第一信息的用户账号层面识别第一信息是否为谣言。
本申请实施例提供的谣言识别方法还包括以下步骤K11。
步骤K11:获取发布所述第一信息的用户账号的发布谣言倾向度。
所述发布谣言倾向度用于表征所述用户账号发布的所述第一信息为谣言的概率。
示例性的,步骤K11在实施过程中包括以下步骤K111至步骤K112。
步骤K111:获取所述用户账号的行为谣言倾向画像。
所述行为谣言倾向画像包括历史转发谣言的数目、历史发布谣言的数目、距离当前时间预设时间段内转发谣言的数目、所述预设时间段内发布谣言的数目、所述用户账号的注册时间、所述用户账号的认证类型、历史发布信息的数目、历史转发信息的数目、所述用户账号有无签名,若有签名所述用户账号的签名内容、关注所述用户账号的关注者的数目、所述用户账号关注的账号对应的行为谣言倾向画像、表征所述用户账号发布的谣言的危害等级是否高于所述用户账号转发谣言的危害等级的信息中的一种或多种。
下面对行为谣言倾向画像包括的内容进行说明。
历史转发谣言的数目是指该用户账号从开始注册的时间到当前时间,转发其他用户发布的谣言的总数目。历史发布谣言的数目是指该用户账号从开始注册的时间到当前时间,自己发布的谣言的总数目。距离当前时间预设时间段内转发谣言的数目是指,在预设时间段内该用户账号转发其他用户发布的谣言的总数目。
假设,当前时间为2020年8月27日,预设时间段为1个月,那么,距离当前时间预设时间段内转发谣言的数目是指在2020年7月28日至2020年8月27日,这段时间该用户账号转发其他用户发布的谣言的总数目。
所述预设时间段内发布谣言的数目是指,在预设时间段内该用户账号自己发布的谣言的总数目。
示例性的,所述用户账号的认证类型可以是政府认证类型、企业认证类型、机构团体认证类型、媒体认证类型、个人用户认证类型、网站认证类型、个人认证类型中的一种或多种。
历史发布信息的数目是指该用户账号从开始注册的时间到当前时间,自己发布的信息(包含谣言和非谣言)的总数目。历史转发信息的数目是指该用户账号从开始注册的时间到当前时间,自己转发其他用户发布的信息(包含谣言和非谣言)的总数目。
用户账号的签名是用户对该用户填写的关于该用户账号或自身的信息。
示例性的,用户账号的签名可能能够表征用户的内心想法。
示例性的,若关注所述用户账号的关注者的数目越大,该用户账号转发或发布谣言后影响就越大。
可以理解的是,若用户想要看到某个账号发布或转发的信息,可能会关注该账号,即用户账号关注的账号一定程度上能够表征该用户想要看到的信息的类型,所以可以结合所述用户账号关注的账号对应的行为谣言倾向画像确定该用户账号对应的行为谣言倾向画像。
可以理解的是,不同谣言的危害等级不同,示例性的,可以基于谣言对社会的危害程度,对不同的谣言进行等级的划分。若所述用户账号发布的谣言的危害等级低于所述用户账号转发谣言的危害等级,说明该用户账号可能是被动发布谣言的人,例如,看到一些谣言后,自己信以为真感到恐慌,所以发布一些相关的谣言;若所述用户账号发布的谣言的危害等级高于或等于所述用户账号转发谣言的危害等级,说明该用户账号是主动制造谣言的人。
上述表征所述用户账号发布的谣言的危害等级是否高于所述用户账号转发谣言的危害等级的信息包括:所述用户账号发布的各谣言的危害等级的平均值、所述用户账号发布的各谣言的危害等级的最大值、所述用户账号发布的各谣言的危害等级的最小值、所述用户账号转发的各谣言的危害等级的平均值、所述用户账号转发的各谣言的危害等级的最大值、所述用户账号转发的各谣言的危害等级的最小值。
可以理解的是,大量发布谣言的用户,往往带有网络水军的性质。比如用户A在一段很集中的时间内发布了几十条谣言,其中大部分经人工判定为谣言,之后用户A就没有发布或转发过任何信息。可选的,可以针对这种用户建立行为谣言倾向画像。可选的,可以针对所有用户分别建立行为谣言倾向画像。
示例性的,可以利用用户的基本信息判断用户的基本可信度,再结合用户发布或转发的谣言的行为信息,来建立用户的行为谣言倾向画像,辅助判别用户所发布或转发的信息是否应该判定为谣言,增加上述谣言识别方法的最终结果的置信度。
其中,基本信息包括历史转发谣言的数目、历史发布谣言的数目、距离当前时间预设时间段内转发谣言的数目、所述预设时间段内发布谣言的数目、所述用户账号的注册时间、所述用户账号的认证类型、历史发布信息的数目、历史转发信息的数目、所述用户账号的签名内容、关注所述用户账号的关注者的数目、所述用户账号关注的账号对应的行为谣言倾向画像中的一种或多种。
其中,用户发布或转发的谣言的行为信息包括表征所述用户账号发布的谣言的危害等级是否高于所述用户账号转发谣言的危害等级的信息。
示例性的,用户的行为谣言倾向画像是随着用户自身的行为在不断动态变化的。一般来讲,用户如果在越短的时间段内发布越多的被判定为谣言的信息,则用户的行为谣言倾向画像对应的发布谣言倾向度增加越快。而如果历史发布或转发过谣言,而在近期用户没有发布过谣言,那么用户的发布谣言倾向度是在随着时间推移不断降低的。
示例性的,可以将发布谣言倾向度高于阈值F的用户账号加入至可疑用户库。示例性的,对属于可疑用户库中的用户账号发布或转发的第一信息需要进行更加严格的判定。
例如,若用户账号属于可疑用户库,步骤S304中涉及的多维度分别对应的结果中只要有一个结果表征第一信息为谣言,那么,最终结果表征第一信息为谣言。
若用户账号不属于可以用户库,步骤S304中涉及多维度分别对应的结果中至少两个结果均表征第一信息为谣言,最终结果可能表征第一信息为谣言。
步骤K112:基于所述用户账号的行为谣言倾向画像,确定所述发布谣言倾向度。
示例性的,步骤S304包括:基于所述发布谣言倾向度、所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
可以理解的是,步骤S304得到的最终结果包含的表征所述第一信息是否为谣言的信息,可能与表征第一信息是否为真正的谣言的真实信息不同,例如,最终结果包含表征所述第一信息是谣言的信息,但是真实信息表征第一信息不是谣言;或者,最终结果包含表征所述第一信息不是谣言的信息,但是真实信息表征第一信息是谣言。
由于最终结果包括的表征所述第一信息是否为谣言的信息是基于多个维度分别对应的结果得到的,如图4或图5所示,最终结果包括的表征所述第一信息是否为谣言的信息可以基于维度41对应的结果、维度42对应的结果、维度43对应的结果、维度46对应的结果中至少一个结果确定的,所以确定这些维度对应的结果中与真实结果不一样的目标维度。
若目标维度对应有分类器,将第一信息作为样本对该目标维度涉及的分类器进行再次训练。若目标维度对应有关键词模式,基于第一信息对目标维度涉及的关键词模式进行补充。若目标维度对应有谣言库或辟谣库,若第一信息为谣言,可以将第一信息补入谣言库,若第一信息为非谣言,可以将第一信息补入辟谣库。
综上,实现了对谣言识别方法的正向闭环补充。
下面对“获取表征所述第一信息是否为谣言的真实结果”的过程进行说明。“获取表征所述第一信息是否为谣言的真实结果”的方式有多种,本申请实施例提供但不限于以下两种。
第一种实现方式:在步骤S304之后,还包括以下步骤L11至步骤L12。
步骤L11:若最终结果包括表征所述第一信息是谣言的信息,将最终结果和第一信息发送至第二电子设备。
以使得专家通过第二电子设备结合最终结果对第一信息进行人工审核。
步骤L12:接收第二电子设备反馈的人工审核结果的真实结果。
第二种实现方式包括以下步骤L21至步骤L22。
步骤L21:获取所述第一信息对应的多个用户生成内容,一个所述用户生成内容为弹幕信息或评论信息。
步骤L22:若多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目大于或等于预设阈值,获得表征所述第一信息为谣言的所述真实结果。
第二种实现方式包括以下步骤L31至步骤L33。
步骤L31:获取所述第一信息对应的多个用户生成内容,一个所述用户生成内容为弹幕信息或评论信息。
步骤L32:若多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目大于或等于预设阈值,将所述第一信息发送至第二电子设备。
以使得专家通过第二电子设备对第一信息进行人工审核。
步骤L33:接收第二电子设备反馈的所述真实结果。
综上,通过UGC(User Generated Content,用户生成内容)对已经发布的确定为非谣言的第一信息进一步检测,弥补了最终结果误判的情况。
在一可选实现方式中,若图3所示的谣言识别方法中,待识别的第一信息对应有用户生成内容,那么谣言识别方法中,还可以获取所述第一信息对应的多个用户生成内容;获取多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目。
本申请实施例中称上述“获取多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目”为“用户生成内容策略”。
在步骤S304中,还可以结合该数目、第一结果以及第二结果确定最终结果。
本申请实施例中,在第一信息发布不久即第一信息的前期,可以通过本申请实施例提供的六个维度以及“用户生成内容策略”中至少一种联合判断第一信息是否为谣言后,若最终结果包含表征第一信息为谣言的信息,由于上述人工智能谣言识别方法无法保证最终结果包含的表征第一信息为谣言的信息100%正确,示例性的,需要人为(可以为专家或运营人员)结合最终结果对第一信息进行审核。
在第一信息发布一段时间后,即第一信息的后期,可以获得第一信息对应的真实结果,若真实结果表征第一信息为谣言,则可以将第一信息归纳入谣言库,若真实结果表征第一信息不是谣言,可以将第一信息归纳入辟谣库,从而不断补充谣言库、辟谣库,形成良性循环。
对于真实结果与最终结果不一致的第一信息,可以进行反溯查询原因,以训练相应的分类器,或,调节关键词模式,并对用户账号的行为谣言倾向画像进行更新,并更新其对应的发布谣言倾向度。
综上,本申请实施例中步骤S304可以基于第一信息是否属于轮播视频、第一信息与预设的各非谣言视频类型的所属关系、第一信息是否为机器配音视频、第一信息对应的简介内容与预设的至少一个谣言简介类型的所属关系、第一相关度、第二相关度、用户账号的发布谣言倾向度、第一信息对应的多个用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目中的至少一种,以及,第一结果、第二结果获得最终结果。
示例性的,最终结果包括上述10个参数至少第一结果和第二结果两个参数以及表征所述第一信息是否为谣言的信息。
示例性的,可以为上述10个参数分别设置权重。
示例性的,若第一信息属于轮播视频,第一信息为谣言的概率为概率1,若第一信息不属于轮播视频,第一信息为谣言的概率为概率2;若第一信息不属于任一非谣言视频类型,第一信息为谣言的概率为概率3;若第一信息属于某一非谣言视频类型,第一信息为谣言的概率为概率4;若第一信息是机器配音视频,第一信息为谣言的概率为概率5;若第一信息不是机器配音视频,第一信息为谣言的概率为概率6;若第一信息对应的简介内容属于至少一个谣言简介类型中目标谣言简介类型,第一信息为谣言的概率为概率7;若第一信息对应的简介内容不属于任一谣言简介类型,第一信息为谣言的概率为概率8;若数目大于或等于预设阈值,第一信息为谣言的概率为概率9;若数目小于预设阈值,第一信息为谣言的概率为概率10。
可以理解的是,第一相关度、第二相关度、第一结果、第二结果本身就可以用概率表示,因此无需设置其概率。
其中,概率2小于概率1;概率3小于概率4,可选的,概率3可以为0;概率5大于概率4;概率7大于概率8,可选的,概率8可以为0,概率9大于概率10。
上述概率1至概率10可以是根据各个维度的关键程度设置的,10个参数分别对应的权重,是根据各个维度的关键程度设置的。
示例性的,若各参数分别对应的概率与相应权重乘积之和大于或等于阈值G,则最终结果为第一信息是谣言,若小于阈值G,则最终结果为第一信息不是谣言。
示例性的,可以结合上述10个参数中至少两个参数(至少包括第一结果和第二结果),综合确定第一信息是否为谣言。
例如,将上述10个参数中至少两个参数(至少包括第一结果和第二结果)输入至第十分类器,以得到第十分类器的输出的第十预测结果。第十预测结果为第一信息为谣言或第一信息不是谣言。
第十分类器的构建过程包括以下步骤M11至步骤M13。
步骤M11:获取多个样本信息对应的参数集合。
一个样本信息对应的参数集合至少包括上述10个参数中的第一结果和第二结果。
多个样本信息包括正样本信息以及负样本信息,其中,正样本信息为属于谣言的信息,负样本信息为不属于谣言的信息。
步骤M12:将多个样本信息分别对应的参数集合输入至第十机器模型,将多个样本信息分别对应的真实结果作为第十机器模型的输出,训练第十机器模型,以得到第十分类器。
针对第十分类器的说明,可以参见针对第一分类器的说明,这里不再赘述。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了多种装置,下面给出具体的实施例进行详细说明。
如图7所示,为本申请实施例提供的谣言识别装置的示意图,该装置包括:第一获取模块701、第二获取模块702、确定模块703以及第三获取模块704,其中:
第一获取模块701,用于获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;
第二获取模块702,用于基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;
确定模块703,用于基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;
第三获取模块704,用于基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
在一可选实现方式中,第一信息为视频,第三获取模块包括:第一确定单元、第一获取单元、第二确定单元、第二获取单元中的至少一个以及第三确定单元,其中:第一确定单元,用于基于所述视频的画面变换特征,确定所述视频是否属于轮播视频,所述画面变换特征至少包括所述视频包含的至少一个画面对应的停留时长;第一获取单元,用于基于所述视频包含的音频的属性信息,确定所述视频是否为机器配音视频;第二确定单元,用于将所述视频分别输入至各非谣言视频类型对应的第三分类器,获取各所述非谣言视频类型分别对应的第三分类器输出的第三预测结果,一个所述非谣言视频类型对应的第三分类器输出的第三预测结果为所述视频属于所述非谣言视频类型或所述视频不属于所述非谣言视频类型;,第二获取单元,用于确定所述视频的简介内容与预设的至少一个谣言简介类型的所属关系;第三确定单元,用于基于所述视频是否属于轮播视频、各所述非谣言视频类型分别对应的目标分类器输出的目标预测结果、所述视频是否为机器配音视频及所述视频的简介内容与预设的至少一个谣言简介类型的所属关系中的至少一个,以及所述第一结果和所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
在一可选实现方式中,第二获取模块包括:第三获取单元、第一输入单元以及第四获取单元,其中:
第三获取单元,用于若所述标题不符合所述至少一个谣言标题类型对应的关键词模式,获取表征所述第一信息不是谣言的第一结果;一个所述谣言标题类型对应的关键词模式是由至少一个关键词组成的用于描述符合所述谣言标题类型的标题的规则信息;
第一输入单元,用于若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,将所述标题输入至所述目标谣言标题类型对应的第一分类器,所述第一分类器用于检测输入的标题是否属于所述目标谣言标题类型;
第四获取单元,用于基于所述第一分类器输出的第一预测结果,获得所述第一结果,所述第一预测结果为所述标题属于所述目标谣言标题类型,或,所述标题不属于所述目标谣言标题类型。
在一可选实现方式中,第四获取单元包括:第一确定子单元、第一获取子单元以及第二获取子单元,其中:
第一确定子单元,用于若所述第一预测结果为所述标题属于所述目标谣言标题类型,确定所述标题与预设的至少一个剧情类型的所属关系;
第一获取子单元,用于若所述标题属于所述至少一个剧情类型中的目标剧情类型,获取表征所述第一信息不是谣言的所述第一结果;
第二获取子单元,用于若所述标题不属于所述至少一个剧情类型,获取表征所述第一信息是谣言的所述第一结果。
在一可选实现方式中,谣言识别装置还包括:第四获取模块,用于若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,获取所述标题与预先存储的各谣言文档的相关度中最大的第一相关度;和/或,获取所述标题与各非谣言文档的相关度中最大的第二相关度;相应的第三获取模块具体用于:基于第一相关度和所述第二相关度至少一个、所述第一结果以及所述第二结果,获得所述最终结果。
在一可选实现方式中,所述文本内容包括第一文本内容,所述第一信息为视频,第一获取模块包括:第五获取单元、第六获取单元以及第七获取单元,其中:
第五获取单元,用于从所述视频中获取多帧视频图像;
第六获取单元,用于对多帧所述视频图像进行光学字符识别,以得到至少一帧所述视频图像包含的文本信息;
第七获取单元,用于基于至少一帧所述视频图像包含的文本信息,获得所述第一文本内容。
在一可选实现方式中,第六获取单元包括:第三获取子单元以及第四获取子单元,其中:
第三获取子单元,用于获取至少一组视频图像集合分别对应的目标文本信息,一组所述视频图像集合包括时间相邻的至少两帧所述视频图像,一组所述视频图像集合对应的所述目标文本信息为所述视频图像集合包含的时间相邻的至少两帧所述视频图像均包含的文本信息;
第四获取子单元,用于从至少一帧所述视频图像包含的文本信息中,针对至少一组所述视频图像集合分别对应的目标文本信息执行去重操作,以得到所述第一文本内容。
在一可选实现方式中,第三获取子单元中确定一组视频图像集合对应的所述目标文本信息包括:第一获取子模块、检测子模块以及确定子模块,其中:
第一获取子模块,用于获取所述视频图像集合包含时间相邻的至少两帧所述视频图像分别包含的承载有文本信息的位置区域的尺寸;
检测子模块,用于若时间相邻的至少两帧所述视频图像分别包含的位置区域中目标位置区域的尺寸相同,检测时间相邻的至少两帧所述视频图像分别包含的所述目标位置区域中的文本信息是否相同;
确定子模块,用于若时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息相同,将时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息为确定为所述目标文本信息。
在一可选实现方式中,第七获取单元具体用于:将至少一帧所述视频图像包含的文本信息,按照其所在视频图像位于所述视频的时间由早到晚的顺序拼接得到所述第一文本内容。
在一可选实现方式中,第七获取单元包括:排序子单元、第二确定子单元以及划分语句子单元,其中:
排序子单元,用于将至少一帧所述视频图像包含的文本信息,按照其所在视频图像位于所述视频的时间由早到晚的顺序拼接得到候选文本内容;
第二确定子单元,用于从多帧所述视频图像中确定不包含文本信息的至少一帧目标视频图像;
划分语句子单元,用于基于所述至少一帧目标视频图像位于所述视频的时刻,将所述候选文本内容进行语句的划分,以得到所述第一文本内容。
在一可选实现方式中,所述文本内容包括第二文本内容,第一获取模块还包括:语音识别单元,用于对所述视频包含的音频进行语音识别,以得到所述第二文本内容。
在一可选实现方式中,所述第二结果包括第一子结果及第二子结果中的至少一个,确定模块包括:第八获取单元、第九获取单元、第十获取单元以及第十一获取单元中的至少一个,以及,第十二获取单元和第十三获取单元中的至少一个,其中:
第八获取单元,用于获取所述第一文本内容与预先存储的各谣言文档的相关度中最大的第三相关度;第九获取单元,用于获取所述第一文本内容与预先存储各非谣言文档的相关度中最大的第四相关度;第十获取单元,用于获取所述第二文本内容与各所述谣言文档的相关度中最大的第五相关度;第十一获取单元,用于获取所述第二文本内容与各所述非谣言文档的相关度中最大的第六相关度;
第十二获取单元,用于基于所述第三相关度及所述第四相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第一子结果;第十三获取单元,用于基于所述第五相关度及所述第六相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第二子结果。
在一可选实现方式中,还包括:第五获取模块,用于获取发布所述第一信息的用户账号的发布谣言倾向度,所述发布谣言倾向度用于表征所述用户账号发布的所述第一信息为谣言的概率;相应的第三获取模块具体用于:基于所述发布谣言倾向度、所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
在一可选实现方式中,还包括:第六获取模块,用于获取所述第一信息对应的多个用户生成内容;第七获取模块,用于获取多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目;相应的第三获取模块具体用于:基于所述数目、所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
如图8所示,为本申请实施例提供的电子设备的结构图,该电子设备可以为第二服务器,也可以为第二服务器与第二电子设备的集成设备,该电子设备包括:
存储器801,用于存储程序;
处理器802,用于执行所述程序,所述程序具体用于:
获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;
基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;
基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;
基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
处理器802可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)。
控制设备还可以包括通信接口803以及通信总线804,其中,存储器801、处理器802以及通信接口803通过通信总线804完成相互间的通信。
本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述应用于电子设备的任一所述的谣言识别方法实施例包含的各个步骤。
本发明实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述谣言识别方法。
需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种谣言识别方法,其特征在于,包括:
获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;
基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;
基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;
基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
2.根据权利要求1所述谣言识别方法,其特征在于,所述第一信息为视频,所述基于所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果步骤包括:
基于所述视频的画面变换特征,确定所述视频是否属于轮播视频,所述画面变换特征至少包括所述视频包含的至少一个画面对应的停留时长;或,基于所述视频包含的音频的属性信息,确定所述视频是否为机器配音视频;或,将所述视频分别输入至各非谣言视频类型对应的第三分类器,获取各所述非谣言视频类型分别对应的第三分类器输出的第三预测结果,一个所述非谣言视频类型对应的第三分类器输出的第三预测结果为所述视频属于所述非谣言视频类型或所述视频不属于所述非谣言视频类型;或,确定所述视频的简介内容与预设的至少一个谣言简介类型的所属关系;
以及,
基于所述视频是否属于轮播视频、所述视频是否为机器配音视频、各所述非谣言视频类型分别对应的目标分类器输出的目标预测结果及所述视频的简介内容与预设的至少一个谣言简介类型的所属关系中的至少一个,以及所述第一结果和所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
3.根据权利要求1所述谣言识别方法,其特征在于,还包括:
获取所述第一信息对应的多个用户生成内容;
获取多个所述用户生成内容中表征举报所述第一信息为谣言的用户生成内容的数目;
所述基于所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果包括:基于所述数目、所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
4.根据权利要求1所述谣言识别方法,其特征在于,还包括:
获取发布所述第一信息的用户账号的发布谣言倾向度,所述发布谣言倾向度用于表征所述用户账号发布的所述第一信息为谣言的概率;
所述基于所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果包括:基于所述发布谣言倾向度、所述第一结果以及所述第二结果,确定表征所述第一信息是否为谣言的最终结果。
5.根据权利要求1至4任一所述谣言识别方法,其特征在于,所述基于所述标题与预设的至少一个谣言标题类型的关系,获得表征所述第一信息是否属于谣言的第一结果包括:
若所述标题不符合所述至少一个谣言标题类型对应的关键词模式,获取表征所述第一信息不是谣言的第一结果;一个所述谣言标题类型对应的关键词模式是由至少一个关键词组成的用于描述符合所述谣言标题类型的标题的规则信息;
若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,将所述标题输入至所述目标谣言标题类型对应的第一分类器;
基于所述第一分类器输出的第一预测结果,获得所述第一结果,所述第一预测结果为所述标题属于所述目标谣言标题类型,或,所述标题不属于所述目标谣言标题类型。
6.根据权利要求5所述谣言识别方法,其特征在于,所述基于所述第一分类器输出的第一预测结果,获得所述第一结果步骤包括:
若所述第一预测结果为所述标题属于所述目标谣言标题类型,确定所述标题与预设的至少一个剧情类型的所属关系;
若所述标题属于所述至少一个剧情类型中的目标剧情类型,获取表征所述第一信息不是谣言的所述第一结果;
若所述标题不属于所述至少一个剧情类型,获取表征所述第一信息是谣言的所述第一结果。
7.根据权利要求5或6所述谣言识别方法,其特征在于,还包括:
若所述标题符合所述至少一个谣言标题类型中目标谣言标题类型对应的关键词模式,获取所述标题与预先存储的各谣言文档的相关度中最大的第一相关度以及所述标题与各非谣言文档的相关度中最大的第二相关度中的至少一个;
所述基于所述第一结果以及所述第二结果,获得最终结果包括:
基于第一相关度和所述第二相关度至少一个、所述第一结果以及所述第二结果,获得所述最终结果。
8.根据权利要求1至4任一所述谣言识别方法,其特征在于,所述文本内容包括第一文本内容,所述第一信息为视频,所述获取待识别的第一信息对应的文本内容包括:
从所述视频中获取多帧视频图像;
对多帧所述视频图像进行光学字符识别,以得到至少一帧所述视频图像包含的文本信息;
基于至少一帧所述视频图像包含的文本信息,获得所述第一文本内容。
9.根据权利要求8所述谣言识别方法,其特征在于,所述对多帧所述视频图像进行光学字符识别,以得到至少一帧所述视频图像包含的文本信息步骤包括:
获取至少一组视频图像集合分别对应的目标文本信息,一组所述视频图像集合包括时间相邻的至少两帧所述视频图像,一组所述视频图像集合对应的所述目标文本信息为所述视频图像集合包含的时间相邻的至少两帧所述视频图像均包含的文本信息;
从至少一帧所述视频图像包含的文本信息中,针对至少一组所述视频图像集合分别对应的目标文本信息执行去重操作,以得到所述第一文本内容。
10.根据权利要求9所述谣言识别方法,其特征在于,确定一组所述视频图像集合对应的所述目标文本信息包括:
获取所述视频图像集合包含时间相邻的至少两帧所述视频图像分别包含的承载有文本信息的位置区域的尺寸;
若时间相邻的至少两帧所述视频图像分别包含的位置区域中目标位置区域的尺寸相同,检测时间相邻的至少两帧所述视频图像分别包含的所述目标位置区域中的文本信息是否相同;
若时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息相同,将时间相邻的至少两帧所述视频图像分别包含的目标位置区域中的文本信息为确定为所述目标文本信息。
11.根据权利要求6所述谣言识别方法,其特征在于,所述文本内容包括第二文本内容,所述获取待识别的第一信息对应的文本内容还包括:
对所述视频包含的音频进行语音识别,以得到所述第二文本内容。
12.根据权利要求11所述谣言识别方法,其特征在于,所述第二结果包括第一子结果及第二子结果中的至少一个,所述基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果包括:
获取所述第一文本内容与预先存储的各谣言文档的相关度中最大的第三相关度,获取所述第一文本内容与预先存储各非谣言文档的相关度中最大的第四相关度,获取所述第二文本内容与各所述谣言文档的相关度中最大的第五相关度,以及,获取所述第二文本内容与各所述非谣言文档的相关度中最大的第六相关度中的至少一个;
基于所述第三相关度及所述第四相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第一子结果;
基于所述第五相关度及所述第六相关度中的至少一个,获得表征所述第一信息是否属于谣言的所述第二子结果。
13.一种谣言识别装置,其特征在于,包括:
第一获取模块,用于获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;
第二获取模块,用于基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;
确定模块,用于基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;
第三获取模块,用于基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
14.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序具体用于执行权力要求1-12中任一项所述的:
获取待识别的第一信息对应的标题以及文本内容,所述文本内容包括直接或间接获取的表征所述第一信息的内容;
基于所述标题与预设的至少一个谣言标题类型的所属关系,获得表征所述第一信息是否属于谣言的第一结果;
基于所述文本内容确定表征所述第一信息是否属于谣言的第二结果;
基于所述第一结果以及所述第二结果,获得最终结果,所述最终结果包括表征所述第一信息是否为谣言的信息。
15.一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述权利要求1至12任一所述谣言识别方法包含的步骤。
CN202010968143.7A 2020-09-15 2020-09-15 谣言识别方法、装置、设备及存储介质 Pending CN112069836A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010968143.7A CN112069836A (zh) 2020-09-15 2020-09-15 谣言识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010968143.7A CN112069836A (zh) 2020-09-15 2020-09-15 谣言识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112069836A true CN112069836A (zh) 2020-12-11

Family

ID=73696339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010968143.7A Pending CN112069836A (zh) 2020-09-15 2020-09-15 谣言识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112069836A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117294526A (zh) * 2023-11-22 2023-12-26 深圳大智软件技术有限公司 一种通信信息共享方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117294526A (zh) * 2023-11-22 2023-12-26 深圳大智软件技术有限公司 一种通信信息共享方法及系统
CN117294526B (zh) * 2023-11-22 2024-03-12 深圳大智软件技术有限公司 一种通信信息共享方法及系统

Similar Documents

Publication Publication Date Title
WO2021174890A1 (zh) 数据推荐方法、装置、计算机设备以及存储介质
Baveye et al. A large video database for computational models of induced emotion
Ma et al. Learning to generate grounded visual captions without localization supervision
Somandepalli et al. Computational media intelligence: Human-centered machine analysis of media
Mohamad Nezami et al. Face-cap: Image captioning using facial expression analysis
CN113395578A (zh) 一种提取视频主题文本的方法、装置、设备及存储介质
CN112085120B (zh) 多媒体数据的处理方法、装置、电子设备及存储介质
Maybury Multimedia information extraction: Advances in video, audio, and imagery analysis for search, data mining, surveillance and authoring
Salur et al. A soft voting ensemble learning-based approach for multimodal sentiment analysis
Navarrete et al. A review on recent advances in video-based learning research: Video features, interaction, tools, and technologies
CN114661951A (zh) 一种视频处理方法、装置、计算机设备以及存储介质
Metze et al. Beyond audio and video retrieval: topic-oriented multimedia summarization
Liu et al. A multimodal approach for multiple-relation extraction in videos
CN113573128A (zh) 一种音频处理方法、装置、终端以及存储介质
CN112069836A (zh) 谣言识别方法、装置、设备及存储介质
Saleem et al. Stateful human-centered visual captioning system to aid video surveillance
CN116977992A (zh) 文本信息识别方法、装置、计算机设备和存储介质
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
Akasaki et al. Early discovery of emerging entities in microblogs
Chen et al. An investigation into feature effectiveness for multimedia hyperlinking
Chang et al. Report of 2017 NSF workshop on multimedia challenges, opportunities and research roadmaps
Gomes Jr et al. Framework for knowledge discovery in educational video repositories
Cuzco-Calle et al. An interactive system to automatically generate video summaries and perform subtitles synchronization for persons with hearing loss
Vrochidis et al. A multi-modal audience analysis system for predicting popularity of online videos
BianBian et al. Multimodal sentimental analysis based on deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination