CN110019942B - 一种视频鉴别方法及系统 - Google Patents

一种视频鉴别方法及系统 Download PDF

Info

Publication number
CN110019942B
CN110019942B CN201710812276.3A CN201710812276A CN110019942B CN 110019942 B CN110019942 B CN 110019942B CN 201710812276 A CN201710812276 A CN 201710812276A CN 110019942 B CN110019942 B CN 110019942B
Authority
CN
China
Prior art keywords
video
text information
identified
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710812276.3A
Other languages
English (en)
Other versions
CN110019942A (zh
Inventor
孟辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201710812276.3A priority Critical patent/CN110019942B/zh
Publication of CN110019942A publication Critical patent/CN110019942A/zh
Application granted granted Critical
Publication of CN110019942B publication Critical patent/CN110019942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施方式公开了一种视频鉴别方法及系统,其中,所述方法包括:获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论;确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征;将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。本申请提供的技术方案,能够提高视频鉴别的效率和精度。

Description

一种视频鉴别方法及系统
技术领域
本申请涉及互联网技术领域,特别涉及一种视频鉴别方法及系统。
背景技术
随着互联网技术的不断发展,网络中的视频内容也呈爆炸式增加。为了保证视频内容的合理性,部分网站通常会对视频内容进行鉴别,以判断视频内容中是否包含色情、暴力等不良信息。
当前,在对视频内容进行鉴别时,通常可以采用图像识别的技术对视频中的每一帧画面进行识别。具体地,可以提取每一帧画面中包含的特征,并判断提取的特征是否与不良信息的特征相似。如果相似度较高,则可以确定该帧画面中存在不良信息。
然而,按照现有技术中图像识别的技术进行视频鉴别时,由于一个视频中包含的画面帧数十分巨大,因此需要运算能力较强的处理设备处理较长的时间才能对视频完成鉴别。这就导致视频鉴别的成本较高,并且效率较低。如果为了提高视频鉴别的效率,可以从视频的画面帧中提取出部分画面帧,并对提取出的部分画面帧的内容进行识别。这样在减少运算量、提高视频鉴别效率的同时,由于丢弃了视频中的一些画面帧,会导致视频鉴别的结果不精确。
由此可见,当前亟需一种鉴别效率较高并且鉴别精度也较高的视频鉴别方法。
发明内容
本申请实施方式的目的是提供一种视频鉴别方法及系统,以提高视频鉴别的效率和精度。
为实现上述目的,本申请实施方式提供一种视频鉴别方法,所述方法包括:获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论;确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征;将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
为实现上述目的,本申请实施方式还提供一种视频鉴别系统,所述系统包括存储器和处理器,所述存储器中存储计算机程序,所述计算机程序被所述处理器执行时,实现以下功能:获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论;确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征;将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
由上可见,本申请提供的技术方案,可以基于表征用户评论的文字信息来对视频进行鉴别。具体地,由于不同的用户可以具备不同的语言习惯,相同的文字信息针对不同的用户而言,可能具备不同的含义。基于此,在对文字信息进行鉴别时,可以确定文字信息对应的特征因子,该特征因子可以用于表征发表该文字信息的用户的行为特征。该行为特征可以是用户的语言习惯或者是用户所属的人群。这样,将文字信息和对应的特征因子共同输入自然语言处理模型后,可以确定在特征因子的作用下,该文字信息所表达的真实含义。该真实含义可以体现用户对于当前的视频画面的观点,从而可以通过文字信息反映当前的视频内容的特性,进而可以得到视频鉴别结果。本申请提供的技术方案,避免了采用图像识别的技术直接对视频的画面进行鉴别,从而极大地减少了视频鉴别所需处理的数据量。同时,用户评论可以真实地反映视频的具体内容,从而可以提高视频鉴别的精度。
附图说明
为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式中视频鉴别方法流程图;
图2为本申请实施方式中视频分享网络示意图;
图3为本申请实施方式中NLP模型训练示意图;
图4为本申请实施方式中视觉提示信息示意图;
图5为本申请实施方式中两个系统协同作用示意图;
图6为本申请实施方式中视频鉴别系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。
本申请提供一种视频鉴别方法,所述方法可以应用于具备数据处理功能的终端设备中。所述终端设备例如可以是台式电脑、笔记本电脑、平板电脑、工作站等。请参阅图1,所述方法可以包括以下步骤。
S1:获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论。
在本实施方式中,所述文字信息可以是用户在观看所述待鉴别视频时发表的用户评论。所述用户评论可以包括在视频的评论区中发表的用户评论或者是在视频的播放界面中滚动播放的弹幕评论,还可以是在视频的直播界面旁跟随直播进度不断滚动的用户评论。
在本实施方式中,所述文字信息可以与待鉴别视频进行关联存储。例如,所述文字信息和所述待鉴别视频可以具备相同的主标识,所述主标识可以用于表征所述待鉴别视频的名称。所述文字信息和所述待鉴别视频还可以分别具备不同的子标识,所述子标识可以用于对所述文字信息和所述待鉴别视频进行区分。例如,所述文字信息的子标识可以为sub,而所述待鉴别视频的子标识可以是vid。在获取所述文字信息时,可以在所述文字信息和所述待鉴别视频的存储路径下,通过主标识和子标识的组合搜索得到与所述待鉴别视频关联的文字信息,从而可以读取所述文字信息。
S3:确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征。
在本实施方式中,在获取了表征用户评论的文字信息后,可以针对不同的用户群体,为文字信息确定不同的特征因子。这样处理的目的在于,对于同样的文字信息,不同的用户群体所表达的含义可能不同。例如,对于“吃鸡”这个短语,在日常语言习惯中的含义就是其字面意思,可以与食品相关联。但是对于部分游戏玩家而言,该短语表达的含义却是“胜利”。因此,为了准确地获知文字信息所表达的真实含义,可以综合考虑发表该文字信息的用户的行为特征。所述行为特征例如可以是用户经常观看的视频类型。通过用户经常观看的视频类型,从而可以确定用户所属的人群。
在本实施方式中,所述特征因子可以被划分为指定数量的数值节点。其中,所述数值节点可以与用户人群相关联。这样,对于不同的用户人群,对应的特征因子也可以不同。例如,对于游戏爱好者,对应的特征因子为0.8;而对于言情剧爱好者,对应的特征因子可以为0.7。所述特征因子的具体数值可以用于区分不同的用户群体,在实际应用中可以根据需要取不同的值。这样,在确定所述文字信息对应的特征因子时,可以先确定发表所述文字信息的用户所属的目标用户人群,然后可以将所述目标用户人群关联的目标数值节点作为所述文字信息对应的特征因子。例如,某个游戏爱好者发表了“666666”这样的文字信息,而游戏爱好者这个人群对应的特征因子为0.8,那么该“666666”的文字信息对应的特征因子便可以是0.8。
在本实施方式中,在确定文字信息的特征因子时,还可以根据用户在观看视频时的行为数据,统一地为一个人群设置统一的特征因子。具体地,可以获取发表所述文字信息的用户的行为数据,其中,所述行为数据包括视频播放数据或/和视频转发数据。所述视频播放数据可以表征用户观看了某个视频,而所述视频转发数据则可以表示用户在观看该视频之后,将该视频推荐给了其他用户。在本实施方式中,可以基于所述行为数据构建所述待鉴别视频对应的视频分享网络。具体地,在所述视频分享网络中可以包括多个网络节点,每个网络节点可以对应一个用户。在确定所述视频分享网络中的网络节点时,可以对用户的行为数据进行分析。请参阅图2,针对某个当前用户,在该当前用户观看所述待鉴别视频时,可以将所述当前用户作为网络节点加入视频分享网络。然后可以判断所述当前用户观看的所述待鉴别视频是否为其他用户转发的视频,若是,则可以将向所述当前用户转发所述待鉴别视频的用户作为所述当前用户的上一级节点加入所述视频分享网络、例如在图2中,当前用户观看的待鉴别视频是由用户A转发来的,那么从用户A到当前用户便可以构成视频分享网络中的一条链路。此外,还可以继续判断所述当前用户是否向目标用户转发所述待鉴别视频,若是,可以在所述目标用户观看所述待鉴别视频的情况下,将所述目标用户作为所述当前用户的下一级节点加入所述视频分享网络。例如,在图2中,当前用户观看完所述待鉴别视频之后,可以将该视频转发给用户B。如果用户B观看了该视频,则表明用户B与当前用户对该视频都感兴趣,针对该视频,当前用户与用户B存在共同点。因此,从当前用户到用户B又可以构成该视频分享网络中的一条链路。图2中的虚线圆也可以是当前用户分享视频的目标,只不过这些目标并没有观看该视频,因此虚线圆可以不作为视频分享网络中的节点。这样,通过对用户的行为数据进行分析,从而可以构建出该待鉴别视频的视频分享网络,该网络中的各个用户都可以视为对该视频感兴趣,因此这些用户之间具备共通点,从而可以为所述视频分享网络中的用户分配统一的特征因子。这样,在这些用户发表文字信息时,这些文字信息便可以具备相同的特征因子。
需要说明的是,针对同一个待鉴别视频,可能会同时存在多个视频分享网络,在同一个视频分享网络内,通常不会存在不与其它网络节点构成链路的单一网络节点。这样,不同的视频分享网络,便可以构成不同的用户群体,从而可以针对用户群体设定相应的特征因子。
在一个实施方式中,获取的所述文字信息中可能会存在一部分没有意义或者意义较小的无效信息。这些无效信息可以包括表情符号、广告链接、纯数字信息等。这样,在本实施方式中,在获取到文字信息之后,可以将所述文字信息中的无效信息滤除,并确定滤除无效信息后的文字信息的特征因子,从而保证文字信息的准确性。具体地,滤除无效信息的方式可以包括将所述文字信息中的表情符号、广告链接以及存数字信息去除,同时还可以匹配所述文字信息中的敏感词,并将匹配到的敏感词也一并去除。
S5:将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
在本实施方式中,可以采用机器学习的方法,建立用于对文字信息和特征因子进行判定的自然语言处理(Natural Language Processing,NLP)模型。具体地,所述NLP模型中可以包括多层训练网络,所述训练网络中可以具备传递参数。在将所述文字信息和特征因子输入所述训练网络之后,文字信息和特征因子可以与所述传递参数进行数学运算,最终可以输出用于表征鉴别结果的数值。请参阅图3,在本实施方式中,首先可以构建所述自然语言处理模型的训练网络,所述训练网络中可以包括初始传递参数。所述初始传递参数可以是根据历史的文字信息进行设定的,但由于本实施方式中引入了特征因子,因此所述初始传递参数可能无法正确地作用于输入的文字信息和特征因子上。鉴于此,在本实施方式中需要对该初始传递参数进行调整。具体地,可以预先获取训练样本集,所述训练样本集中可以包括用户评论样本,所述用户评论样本与特征因子和理论鉴别结果相关联。其中,所述理论鉴别结果可以表示用户评论样本和特征因子对应的正确的鉴别结果。这样,将所述用户评论样本以及关联的特征因子输入所述训练网络后,可以通过所述初始传递参数计算得到实际鉴别结果。由于所述初始传递参数可能不太准确,因此会导致实际鉴别结果与所述理论鉴别结果不完全一致。这样,可以基于所述实际鉴别结果与所述理论鉴别结果之间的差异值,对所述初始传递参数进行校正,以使得再次将所述用户评论样本以及关联的特征因子输入所述训练网络时,通过校正后的传递参数计算得到的实际鉴别结果与所述理论鉴别结果相匹配。
在本实施方式中,针对训练样本中的每个用户评论样本,均可以对训练网络中的传递参数进行校正。这样,通过大量数据的训练,最终可以使得所述NLP模型能够准确地对输入的文字信息和特征因子预测得到对应的视频鉴别结果。
在本实施方式中,可以将所述文字信息以及对应的所述特征因子输入经过训练的自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。具体地,所述NLP模型输出的可以是表征概率的一组数值,该组数值中可以包括不同训练结果的概率值。例如,所述NLP模型可以用于鉴定文字信息中是否包含暴力内容,那么最终的训练结果可以包括包含暴力内容和不包含暴力内容。这两个训练结果可以具备各自的概率值,其中,概率值较大的一方就可以作为最终的视频鉴别结果。例如,包含暴力内容对应的概率值为0.8,不包含暴力内容对应的概率值为0.2,那么当前得到的该文字信息对应的视频鉴别结果就可以是包含暴力内容。
在实际应用场景中,可能由于训练精度不高,导致经过训练后的NLP模型得到的视频鉴别结果还是存在错误。例如,NLP模型输出的结果是视频存在不良内容,但经过人工鉴定之后,未发现不良内容。那么此时所述视频鉴别结果与理论鉴别结果不符,那么可以利用这组数据进一步地对NLP模型进行训练。请参阅图1,具体地,若所述视频鉴别结果与理论鉴别结果不符,可以与训练过程一致,基于所述视频鉴别结果与所述理论鉴别结果之间的差异值,对所述自然语言处理模型进行校正,以使得再次将所述文字信息以及对应的所述特征因子输入校正后的自然语言处理模型后,得到的视频鉴别结果与所述理论鉴别结果相符。
在一个实施方式中,为了减少需要分析的文件信息的数据量,可以通过用户在观看视频过程中的操作行为,从所述待鉴别视频关联的文字信息中获取有可能表征不良信息的文字信息。具体地,当视频中出现不良画面时,通常可能会引起用户的共鸣,用户从而会集中发表相应的评论。鉴于此,在本实施方式中可以对文字信息出现较密集的时段进行重点分析。具体地,用户发表的文字信息同行藏可以与发表时间相关联,所述发表时间可以与视频的播放时间相对应。例如,视频在播放至10分04秒时用户发表了一个评论,那么该评论的发表时间便可以为10分04秒。
在本实施方式中,可以将所述待鉴别视频的播放时长划分为指定数量的时窗。例如,所述待鉴别视频的总播放时长为10分钟,那么可以按照1分钟的时窗,将所述待鉴别视频划分为10个时窗。然后,针对各个时窗,可以统计发表时间处于所述时窗内的文字信息的数量。例如,可以分别统计0至1分钟、1分钟至2分钟以及2分钟至3分钟等等时窗内文字信息的数量。当目标时窗内统计的所述数量大于或者等于指定数量阈值时,表明该目标时窗内的文字信息的数量较多,该目标时窗对应的视频内容可能会引发用户的共鸣,因此可以对该目标时窗内的文字信息进行重点分析。此时,可以将发表时间处于所述目标时窗内的文字信息作为所述待鉴别视频的文字信息,从而进行后续的分析过程。
此外,在本实施方式中,考虑到如果一个视频中出现不良画面,用户可能会反复多次观看这部分的画面。鉴于此,本申请可以记录用户在观看视频过程中的快进、回退等操作,从而记录用户重复观看的时段。在实际应用中,可以通过埋点的方式来记录用户的快进、回退等操作。具体地,可以在视频的播放进度条上进行埋点,一旦该播放进度条被拖动,便可以触发埋点对应的程序,该程序在被执行时可以获取播放进度条被拖动至的时间节点以及开始被拖动的时间节点。这样,便可以获知用户比较感兴趣的是哪个时段的内容。在本实施方式中,可以统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,其中,所述观看次数可以是观看该视频的所有用户的累计次数。然后可以将发表时间处于所述目标时段内的文字信息作为所述待鉴别视频的文字信息,从而可以进行重点分析。
在一个实施方式中,在视频鉴别结果表示视频中存在不良信息时,可以针对该不良信息进行可视化的提示,以使得审核人员能够同时对多个视频进行鉴定。具体地,当所述视频鉴别结果符合指定条件时,可以确定所述文字信息对应的视频画面。所述视频鉴别结果符合指定条件可以指所述视频鉴别结果表示视频中存在不良信息。在这种情况下,可以根据所述文字信息对应的发表时间,定位至该发表时间对应的视频画面。例如,所述文字信息对应的发表时间为10分04秒,那么便可以定位至该视频播放时间为10分04秒的视频画面。此时,可以为所述视频画面添加视觉提示信息。所述视觉提示信息例如可以是如图4所示的在所述视频画面周边展示的方框。在图4中,审核人员可以在一个显示屏中同时监控多个视频,那么通过所述视觉提示信息,可以明显地查看到存在不良信息的视频画面。为了能够引起审核人员的注意,所述视觉提示信息可以具备一定的持续时长。例如,所述持续时长可以为5秒钟,那么从定位至所述文字信息对应的视频画面后,可以在该视频画面上添加持续5秒钟的视觉提示信息。
请参阅图5,在一个实施方式中,通过对文字信息和用户行为特征分析得到的视频鉴别结果,可以单独作为鉴别视频内容中是否存在不良内容的依据,此外,还可以与用于分析所述待鉴别视频中画面信息的分析系统相配合,共同对所述视频进行鉴别。具体地,由于在进行画面信息的分析时,为了减少数据处理量,通常会从视频内容中提取一部分的画面信息进行分析。这样难免会导致未被提取的画面信息中可能存在不良信息的情况。基于此,可以对用户在观看视频时的行为特征进行分析,确定出用户观看次数较多的视频片段,然后再利用图像识别的方式对该观看次数较多的视频片段进行分析。具体地,可以统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将所述目标时段提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于所述目标时段内的画面进行分析。
在另一个实施方式中,在对文字信息和特征因子分析得到视频鉴别结果时,可以将该视频鉴别结果提供给画面信息分析系统以供参考。具体地,当所述视频鉴别结果满足指定条件时,可以将所述文字信息在所述待鉴别视频中所处的时间节点提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于包含所述时间节点的时间区间内的画面进行分析。其中,所述视频鉴别结果满足指定条件可以指所述视频鉴别结果表示视频内容中存在不良信息。用于分析所述待鉴别视频中画面信息的分析系统在接收到所述时间节点之后,可以确定包含该时间节点的时间区间。例如,所述时间节点为10分04秒,那么包含该时间节点的时间区间可以是从9分50秒至10分20秒的时间区间。用于分析所述待鉴别视频中画面信息的分析系统可以对该时间区间内的画面进行重点分析。
请参阅图6,本申请还提供一种视频鉴别系统,所述系统包括存储器和处理器,所述存储器中存储计算机程序,所述计算机程序被所述处理器执行时,实现以下功能。
S1:获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论。
S3:确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征。
S5:将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
在本实施方式中,所述计算机程序被所述处理器执行时,还实现以下功能:
获取发表所述文字信息的用户的行为数据,所述行为数据包括视频播放数据或/和视频转发数据;
基于所述行为数据,构建所述待鉴别视频对应的视频分享网络;
为所述视频分享网络中的用户分配统一的特征因子。
在本实施方式中,所述文字信息与发表时间相关联;相应地,所述计算机程序被所述处理器执行时,还实现以下功能:
将所述待鉴别视频的播放时长划分为指定数量的时窗,并统计发表时间处于所述时窗内的文字信息的数量;当目标时窗内统计的所述数量大于或者等于指定数量阈值时,将发表时间处于所述目标时窗内的文字信息作为所述待鉴别视频的文字信息;
或者
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将发表时间处于所述目标时段内的文字信息作为所述待鉴别视频的文字信息。
在本实施方式中,所述计算机程序被所述处理器执行时,还实现以下功能:
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将所述目标时段提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于所述目标时段内的画面进行分析。
在本实施方式中,所述计算机程序被所述处理器执行时,还实现以下功能:
当所述视频鉴别结果满足指定条件时,将所述文字信息在所述待鉴别视频中所处的时间节点提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于包含所述时间节点的时间区间内的画面进行分析。
在本实施方式中,所述存储器包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
本说明书实施方式提供的视频鉴别系统,其存储器和处理器实现的具体功能,可以与本说明书中的前述实施方式相对照解释,并能够达到前述实施方式的技术效果,这里便不再赘述。
由上可见,本申请提供的技术方案,可以基于表征用户评论的文字信息来对视频进行鉴别。具体地,由于不同的用户可以具备不同的语言习惯,相同的文字信息针对不同的用户而言,可能具备不同的含义。基于此,在对文字信息进行鉴别时,可以确定文字信息对应的特征因子,该特征因子可以用于表征发表该文字信息的用户的行为特征。该行为特征可以是用户的语言习惯或者是用户所属的人群。这样,将文字信息和对应的特征因子共同输入自然语言处理模型后,可以确定在特征因子的作用下,该文字信息所表达的真实含义。该真实含义可以体现用户对于当前的视频画面的观点,从而可以通过文字信息反映当前的视频内容的特性,进而可以得到视频鉴别结果。本申请提供的技术方案,避免了采用图像识别的技术直接对视频的画面进行鉴别,从而极大地减少了视频鉴别所需处理的数据量。同时,用户评论可以真实地反映视频的具体内容,从而可以提高视频鉴别的精度。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现视频鉴别系统以外,完全可以通过将方法步骤进行逻辑编程来使得视频鉴别系统以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种视频鉴别系统可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对视频鉴别系统的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施方式描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (16)

1.一种视频鉴别方法,其特征在于,所述方法包括:
获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论;
确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征;
将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
2.根据权利要求1所述的方法,其特征在于,确定所述文字信息对应的特征因子包括:
将所述文字信息中的无效信息滤除,并确定滤除无效信息后的文字信息的特征因子。
3.根据权利要求1或2所述的方法,其特征在于,确定所述文字信息对应的特征因子包括:
获取发表所述文字信息的用户的行为数据,所述行为数据包括视频播放数据或/和视频转发数据;
基于所述行为数据,构建所述待鉴别视频对应的视频分享网络;
为所述视频分享网络中的用户分配统一的特征因子。
4.根据权利要求3所述的方法,其特征在于,构建所述待鉴别视频对应的视频分享网络包括:
在当前用户观看所述待鉴别视频时,将所述当前用户作为网络节点加入视频分享网络;
判断所述当前用户观看的所述待鉴别视频是否为其他用户转发的视频,若是,将向所述当前用户转发所述待鉴别视频的用户作为所述当前用户的上一级节点加入所述视频分享网络;
判断所述当前用户是否向目标用户转发所述待鉴别视频,若是,在所述目标用户观看所述待鉴别视频的情况下,将所述目标用户作为所述当前用户的下一级节点加入所述视频分享网络。
5.根据权利要求1所述的方法,其特征在于,所述特征因子被划分为指定数量的数值节点,其中,所述数值节点与用户人群相关联;
相应地,确定所述文字信息对应的特征因子包括:
确定发表所述文字信息的用户所属的目标用户人群,并将所述目标用户人群关联的目标数值节点作为所述文字信息对应的特征因子。
6.根据权利要求1所述的方法,其特征在于,在确定所述文字信息对应的视频鉴别结果之后,所述方法还包括:
若所述视频鉴别结果与理论鉴别结果不符,基于所述视频鉴别结果与所述理论鉴别结果之间的差异值,对所述自然语言处理模型进行校正,以使得再次将所述文字信息以及对应的所述特征因子输入校正后的自然语言处理模型后,得到的视频鉴别结果与所述理论鉴别结果相符。
7.根据权利要求1所述的方法,其特征在于,所述自然语言处理模型按照下述方式生成:
构建所述自然语言处理模型的训练网络,所述训练网络中包括初始传递参数;
获取训练样本集,所述训练样本集中包括用户评论样本,所述用户评论样本与特征因子和理论鉴别结果相关联;
将所述用户评论样本以及关联的特征因子输入所述训练网络,以通过所述初始传递参数计算得到实际鉴别结果;
基于所述实际鉴别结果与所述理论鉴别结果之间的差异值,对所述初始传递参数进行校正,以使得再次将所述用户评论样本以及关联的特征因子输入所述训练网络时,通过校正后的传递参数计算得到的实际鉴别结果与所述理论鉴别结果相匹配。
8.根据权利要求1所述的方法,其特征在于,所述文字信息与发表时间相关联;相应地,获取待鉴别视频的文字信息包括:
将所述待鉴别视频的播放时长划分为指定数量的时窗,并统计发表时间处于所述时窗内的文字信息的数量;当目标时窗内统计的所述数量大于或者等于指定数量阈值时,将发表时间处于所述目标时窗内的文字信息作为所述待鉴别视频的文字信息;
或者
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将发表时间处于所述目标时段内的文字信息作为所述待鉴别视频的文字信息。
9.根据权利要求1所述的方法,其特征在于,在确定所述文字信息对应的视频鉴别结果之后,所述方法还包括:
当所述视频鉴别结果符合指定条件时,确定所述文字信息对应的视频画面,并为所述视频画面添加视觉提示信息。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将所述目标时段提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于所述目标时段内的画面进行分析。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述视频鉴别结果满足指定条件时,将所述文字信息在所述待鉴别视频中所处的时间节点提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于包含所述时间节点的时间区间内的画面进行分析。
12.一种视频鉴别系统,其特征在于,所述系统包括存储器和处理器,所述存储器中存储计算机程序,所述计算机程序被所述处理器执行时,实现以下功能:
获取待鉴别视频的文字信息,所述文字信息用于表征所述待鉴别视频的用户评论;
确定所述文字信息对应的特征因子,所述特征因子用于表征发表所述文字信息的用户的行为特征;
将所述文字信息以及对应的所述特征因子输入自然语言处理模型,以确定在所述特征因子的作用下,所述文字信息对应的视频鉴别结果。
13.根据权利要求12所述的系统,其特征在于,所述计算机程序被所述处理器执行时,还实现以下功能:
获取发表所述文字信息的用户的行为数据,所述行为数据包括视频播放数据或/和视频转发数据;
基于所述行为数据,构建所述待鉴别视频对应的视频分享网络;
为所述视频分享网络中的用户分配统一的特征因子。
14.根据权利要求12所述的系统,其特征在于,所述文字信息与发表时间相关联;相应地,所述计算机程序被所述处理器执行时,还实现以下功能:
将所述待鉴别视频的播放时长划分为指定数量的时窗,并统计发表时间处于所述时窗内的文字信息的数量;当目标时窗内统计的所述数量大于或者等于指定数量阈值时,将发表时间处于所述目标时窗内的文字信息作为所述待鉴别视频的文字信息;
或者
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将发表时间处于所述目标时段内的文字信息作为所述待鉴别视频的文字信息。
15.根据权利要求12所述的系统,其特征在于,所述计算机程序被所述处理器执行时,还实现以下功能:
统计所述待鉴别视频中观看次数大于或者等于指定次数阈值的目标时段,并将所述目标时段提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于所述目标时段内的画面进行分析。
16.根据权利要求12所述的系统,其特征在于,所述计算机程序被所述处理器执行时,还实现以下功能:
当所述视频鉴别结果满足指定条件时,将所述文字信息在所述待鉴别视频中所处的时间节点提供给用于分析所述待鉴别视频中画面信息的分析系统,以使得所述分析系统对所述待鉴别视频中处于包含所述时间节点的时间区间内的画面进行分析。
CN201710812276.3A 2017-09-11 2017-09-11 一种视频鉴别方法及系统 Active CN110019942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710812276.3A CN110019942B (zh) 2017-09-11 2017-09-11 一种视频鉴别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710812276.3A CN110019942B (zh) 2017-09-11 2017-09-11 一种视频鉴别方法及系统

Publications (2)

Publication Number Publication Date
CN110019942A CN110019942A (zh) 2019-07-16
CN110019942B true CN110019942B (zh) 2021-07-09

Family

ID=67186251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710812276.3A Active CN110019942B (zh) 2017-09-11 2017-09-11 一种视频鉴别方法及系统

Country Status (1)

Country Link
CN (1) CN110019942B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110401879A (zh) * 2019-08-13 2019-11-01 宇龙计算机通信科技(深圳)有限公司 一种视频播放的控制方法、装置、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041064A2 (en) * 1999-12-01 2001-06-07 Koninklijke Philips Electronics N.V. Program classification using object tracking
CN103294811A (zh) * 2013-06-05 2013-09-11 中国科学院自动化研究所 考虑特征可靠性的视频分类器构造方法
CN104486649A (zh) * 2014-12-18 2015-04-01 北京百度网讯科技有限公司 视频内容评级方法及装置
CN104536980A (zh) * 2014-12-05 2015-04-22 百度在线网络技术(北京)有限公司 一种确定候评项的质量信息的方法与装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041064A2 (en) * 1999-12-01 2001-06-07 Koninklijke Philips Electronics N.V. Program classification using object tracking
CN103294811A (zh) * 2013-06-05 2013-09-11 中国科学院自动化研究所 考虑特征可靠性的视频分类器构造方法
CN104536980A (zh) * 2014-12-05 2015-04-22 百度在线网络技术(北京)有限公司 一种确定候评项的质量信息的方法与装置
CN104486649A (zh) * 2014-12-18 2015-04-01 北京百度网讯科技有限公司 视频内容评级方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于文本描述的视频分类系统建模;艾丽丽等;《信息通信》;20130430(第4期);第63-64页 *

Also Published As

Publication number Publication date
CN110019942A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US20210397651A1 (en) Estimating social interest in time-based media
CN106331778B (zh) 视频推荐方法和装置
US9367603B2 (en) Systems and methods for behavioral segmentation of users in a social data network
CN110941738B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
CN111683274B (zh) 弹幕广告展示方法、装置、设备及计算机可读存储介质
CN110287375B (zh) 视频标签的确定方法、装置及服务器
CN111314732A (zh) 确定视频标签的方法、服务器及存储介质
JP5884740B2 (ja) 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
CN112989209A (zh) 内容推荐方法、装置和存储介质
US9830533B2 (en) Analyzing and exploring images posted on social media
CN110019942B (zh) 一种视频鉴别方法及系统
CN113472834A (zh) 一种对象推送方法及设备
CN107609094B (zh) 数据消歧方法、装置及计算机设备
US20230254552A1 (en) System and method for automatically identifying key dialogues in a media
EP3193300A1 (en) Method and system for analyzing a media signal
US20220237638A1 (en) Crowd demographic analysis
WANG Behind the Scenes: Examining Efficacy of Race Classification Models with a Focus on TV
CN113821628A (zh) 利用社交媒体短文本进行价值评估的方法和装置、程序、介质
JP2023547845A (ja) ソーシャルメディア投稿及びテキストデータからのユーザインテントの識別
CN116264625A (zh) 视频剧情的可视化方法、装置、设备及存储介质
CN116992078A (zh) 视频标签确定方法、装置、设备、存储介质及产品
CN117934886A (zh) 目标对象账户原创度检测方法、装置、设备、计算机程序
CN113343687A (zh) 事件名称的确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200512

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Applicant before: Youku network technology (Beijing) Co., Ltd

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant