CN108429920A - 一种处理标题党视频的方法和装置 - Google Patents
一种处理标题党视频的方法和装置 Download PDFInfo
- Publication number
- CN108429920A CN108429920A CN201810119348.0A CN201810119348A CN108429920A CN 108429920 A CN108429920 A CN 108429920A CN 201810119348 A CN201810119348 A CN 201810119348A CN 108429920 A CN108429920 A CN 108429920A
- Authority
- CN
- China
- Prior art keywords
- video
- title
- content
- characteristic information
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 239000003550 marker Substances 0.000 claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 25
- 208000001491 myopia Diseases 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 16
- 230000001960 triggered effect Effects 0.000 claims description 7
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 230000036651 mood Effects 0.000 abstract description 15
- 239000000463 material Substances 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 229910000906 Bronze Inorganic materials 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 239000010974 bronze Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000010408 sweeping Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/57—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种处理标题党视频的方法、装置、电子设备和计算机可读存储介质。该方法包括:从视频库中获取待处理的一个视频;判断该视频的标题与该视频的内容是否匹配;如果不匹配则将视频标记为标题党视频;根据预设策略处理标题党视频。通过本技术方案,有效的确定标题党视频,对标题党视频进行预设策略处理后,可以避免出现用户点击视频后观看到的是与标题不相符的视频内容,防止用户的反感情绪,增强用户的使用体验。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种处理标题党视频的方法、装置、电子设备和计算机可读存储介质。
背景技术
随着用户对视频应用的使用的普及,各种视频数据上传到网络用,以便用户进行分享。一般情况下,视频的标题是对视频内容的简单概括,当用户在浏览各视频时,首先会通过视频的标题对该视频进行初步的了解,再决定是否进入该视频播放页面进行浏览。也就是说,视频的标题在一定程度上可以成为吸引用户的一个因素,现如今,为了更大程度的吸引用户对视频的点击观看,以获取视频流量,会将视频的标题设定为较为吸引用户的内容,但是该标题反映的内容却是与视频的真正内容无关的,即为标题党视频,这就造成用户看到标题点击视频后,观看到的是与标题不符的另一内容,引起用户的反感情绪,降低用户的使用体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的处理标题党视频的方法、装置、电子设备和计算机可读存储介质。
根据本发明的一个方面,提供了一种处理标题党视频的方法,其中,该方法包括:
从视频库中获取待处理的一个视频;
判断该视频的标题与该视频的内容是否匹配;
如果不匹配则将视频标记为标题党视频;
根据预设策略处理标题党视频。
可选地,所述判断视频的标题与该视频的内容是否匹配包括:
提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;
判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
可选地,所述判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配包括:
将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;
根据所述神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
可选地,该方法进一步包括预先训练所述神经网络分类器的步骤,具体包括:
获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习;
获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习。
可选地,根据预设策略处理标题党视频包括:
将标题党视频从视频库中删除;
或者,为视频库中的标题党视频重新生成标题。
可选地,当所述视频库中的视频为短视频时,该方法进一步包括:
将视频库中的视频进行分类;
将属于同一类的视频拼接成一个或多个视频;
当用户请求播放一类视频时,向该用户提供拼接后的视频。
可选地,该方法进一步包括:
将视频库中的视频进行分类;
在视频提供页面上展示不同类别视频对应的控件;
当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
根据本发明的另一方面,提供了一种处理标题党视频的装置,其中,该装置包括:
获取单元,适于从视频库中获取待处理的一个视频;
判断单元,适于判断该视频的标题与该视频的内容是否匹配;
标记单元,适于如果不匹配则将视频标记为标题党视频;
处理单元,适于根据预设策略处理标题党视频。
可选地,
所述判断单元,适于提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
可选地,
所述判断单元,适于将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;根据所述神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
可选地,该装置进一步包括:
训练单元,适于预先训练所述神经网络分类器,具体适于获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习;获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习。
可选地,
所述处理单元,适于将标题党视频从视频库中删除;或者,为视频库中的标题党视频重新生成标题。
可选地,该装置进一步包括:
分类单元,适于当所述视频库中的视频为短视频时,将视频库中的视频进行分类;将属于同一类的视频拼接成一个或多个视频;当用户请求播放一类视频时,向该用户提供拼接后的视频。
可选地,该装置进一步包括:
分类单元,适于将视频库中的视频进行分类;在视频提供页面上展示不同类别视频对应的控件;当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
根据本发明的又一方面,提供了一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据前述的方法。
根据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现前述的方法。
根据本发明的技术方案,从视频库中获取待处理的一个视频;判断该视频的标题与该视频的内容是否匹配;如果不匹配则将视频标记为标题党视频;根据预设策略处理标题党视频。通过本技术方案,有效的确定标题党视频,对标题党视频进行预设策略处理后,可以避免出现用户点击视频后观看到的是与标题不相符的视频内容,防止用户的反感情绪,增强用户的使用体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的处理标题党视频的方法的流程示意图;
图2示出了根据本发明一个实施例的处理标题党视频的装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的处理标题党视频的方法的流程示意图。如图1所示,该方法包括:
步骤S110,从视频库中获取待处理的一个视频。
视频库中的视频的来源不能固定,广告商、注册用户等均可以向视频库中存储视频,这就意味着当视频上传到视频库中时,视频的标题与视频内容是否一致是无法判断的。因此,为了对视频库中的视频是否为标题党视频进行判断,需要将视频库中的视频选取出来。
步骤S120,判断该视频的标题与该视频的内容是否匹配。
步骤S130,如果不匹配则将视频标记为标题党视频。
本实施例中是将视频的标题与视频的内容进行匹配,如果视频标题与视频内容不匹配则说明该视频标题与视频的内容不相符,确定为标题党视频,并进行标记。如果匹配,则说明视频标题与视频内容相符,则该视频被确定是非标题党视频。
步骤S140,根据预设策略处理标题党视频。
本实施例中,在确定是标题党视频后,需要进行相应的处理,如直接删除,该视频不再会被用户播放,或者将视频的标题进行重新生成,以使得重新生成的标题与视频内容相符,再推荐给用户进行播放。
在一个例子中,获取的视频库中的待处理的视频,该视频标题是“韩国少女时代MV”,但是视频的内容则是自录制的关于自家宠物狗的视频,通过判断,该视频标题与视频内容不匹配,那么该视频就被标记为标题党视频,根据预设策略对该视频进行处理。
可见,通过本实施例,有效的确定标题党视频,对标题党视频进行预设策略处理后,可以避免出现用户点击视频后观看到的是与标题不相符的视频内容,防止用户的反感情绪,增强用户的使用体验。
在本发明的一个实施例中,步骤S120中的判断视频的标题与该视频的内容是否匹配包括:提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
在本实施例中,提取的视频的标题的特征信息可以是对视频的标题进行文字识别后,获得的与标题相对应的特征向量,以及提取的该视频内容的特征信息也可以是提取的与视频内容相对应的特征向量,在判断视频的标题与该视频的内容是否匹配时,可以判断提取的标题的特征向量和视频内容的特征向量。
优选地,上述的判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配包括:将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;根据神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
这里的神经网络分类器适用于区分标题与内容匹配的视频和标题与内容不匹配的视频,当将该视频的标题的特征信息和该视频的内容的特征信息输入到该神经网络分类器中后,如果匹配,就会输出匹配的结果,如果不匹配就会输出不匹配的结果,即铜鼓该神经网络分类器可以直接获取到该视频的标题与该视频的内容是否匹配。
具体的,为了获取到上述的神经网络分类器,上述的方法进一步包括预先训练神经网络分类器的步骤,具体包括:获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习,以便该神经网络分类器可以区分标题与内容匹配的视频;获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习,以便该神经网络分类器可以区分标题与内容不匹配的视频。
在本发明的一个实施例中,步骤S140中的根据预设策略处理标题党视频包括:将标题党视频从视频库中删除;或者,为视频库中的标题党视频重新生成标题。
本实施例中,当视频被标记为标题党视频后,可以进行两种方式的处理,一种是直接将其从视频库中删除,这样用户就无法从视频库中获取到该视频。另一种方式是为被标记为标题党视频再重新生成标题,该重新生成的标题是与视频内容向匹配的,这样用户再次从视频库中获取到该视频时,其首先浏览到的视频的标题就是与视频内容相符的标题,当其点击视频后也不会出现观看到与标题不相符的视频内容,避免反感情绪出现。
这里的重新生成标题可以根据视频内容生成的。例如,在识别到视频内容的特征信息后,可以通过神经网络模型,输出与视频内容特征信息相匹配的标题的特征信息,然后根据标题的特征信息生成对应的标题。
在本发明的一个实施例中,当视频库中的视频为短视频时,图1所示的方法进一步包括:将视频库中的视频进行分类;将属于同一类的视频拼接成一个或多个视频;当用户请求播放一类视频时,向该用户提供拼接后的视频。
当用户在对视频库中的一个视频进行观看时,为了可以使得用户获取到与该视频同类的视频信息,特别是对于短视频时,一段视频的播放可能会无法满足用户对该类视频的观看需求,为了满足用户的需求,进一步增强用户的使用体验。在本实施例中,当视频库中的视频是短视频时,对视频进行分类,对同类的视频进行拼接,当用户播放时,观看的是拼接后的视频,里面会包含有同类的一个或多个短视频,满足用户对该类视频的观看需求。
但是如果拼接后的视频太长,随着视频的播放。用户的观看热度反而会下降,所以,优选地,进行拼接的时候,首先预设拼接后的视频的预设时间长度,同类视频进行拼接时,根据该预设时间长度,可以拼接成一个或多个短视频。例如,预设时间长度是150秒,同类短视频中包含有5个,分别是60秒、90秒、80秒、30秒和40秒,那么就将60秒、90秒的短视频进行拼接成一个,将80秒、30秒和40秒的短视频拼接成一个。
在本发明的一个实施例中,图1所示的方法进一步包括:将视频库中的视频进行分类;在视频提供页面上展示不同类别视频对应的控件;当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
用户在不同的情绪状态下需求的视频的类型也是不同的,例如,悲伤时可能需要观看喜剧类的视频,心情烦躁时需要平缓的视频等,为了使得用户可以根据自己的需求进行不同种类的视频的观看,在本实施例中,对视频库中的视频进行分类,并提供相应的控件,用户可以通过不同类别视频对应的控件选择与自己情绪或心情相符的视频观看。例如,用户心情沮丧时,需要看一些励志类的视频,则可以点击励志类的控件,就会获得该励志类的视频。
需要说明的是,一个视频可以是多种类别,例如,关于萌宠趣事的视频,可是喜剧类的,也可以是日常生活类的,当用户点击喜剧类的控件时,该萌宠趣事的视频会被提供,当用户点击日常生活类的控件时,该萌宠趣事的视频也会被提供。
短视频类平台应用接收用户自己录制并上传的视频并保存到视频库中,同时向用户提供视频库中的视频。但用户上传的视频中包含有很多广告视频,影响了观看用户的体验。因此亟需对广告视频进行限制的手段。
在本发明的一个实施例中,图1所示的方法进一步包括:获取该视频关联的文本信息,根据文本信息判断该视频是否为广告视频,是则将该视频标记为广告视频;根据预设策略处理广告视频。
视频库中存储有待播放的视频,往往也会被存储进一些广告视频,例如,包含“扫码加微信,轻松赚金币”“加qq,教你传统武侠创新玩法”等信息的视频。为了使用户准确获取想观看的视频,需对视频库中的这些广告视频进行处理,在本实施例中,以获取视频库中的一个视频,判断是否为广告视频为例进行说明。
每一个视频都会有对应关联的文本信息,这里的文本信息是指文字信息。其中,广告视频的文本信息中会包含一些广告特征,例如,“传统武侠创新玩法”或“时尚穿衣顾问”这样的广告特征,当在文本信息中识别到上述广告特征,就判断与文本信息关联的视频为广告视频,进而用符号“△”或其他的标记手段将该视频标记为广告视频。
在上述实施例的基础上,对带标记的广告视频进行预设策略处理,需要说明的是,这里所说的预设策略处理可以是指删除广告视频或删除广告视频中的广告的内容。例如,删除“传统武侠创新玩法”这样的广告视频,或者也可以删除视频中的“时尚穿衣顾问”等广告内容。
可见,通过本实施例,可以通过与视频关联的文本信息,识别出视频库中的广告视频并进行标记,进而删除带标记的视频或删除视频中的内容。从而为用户提供无广告视频干扰的视频观看体验,用户能准确搜索到要观看视频,改善了观看视频时的画面效果,满足了用户需求,提高了用户的体验。
在本发明的一个实施例中,上述的获取该视频关联的文本信息包括:将该视频的音频转换成文本信息;和/或,识别该视频的画面中的文字,得到相应的文本信息。
在本实施例中,可以通过将视频中的音频转换为文字,判断文字中是否有广告特征,进而判断该视频是否为广告视频,例如,转换后的文字为“传统武侠创新玩法”,则确定具有广告特征,即判断该视频为广告视频。或者,也可通过OCR(光学字符识别,OpticalCharacter Recognition)技术识别视频画面中的文字,同样地判断文字中是否有广告特征,进而判断该视频是否为广告视频。例如,通过OCR识别出画面中的文字为“点击下载,领取更多福利”,即判断该视频为广告视频。
在本发明的一个实施例中,上述的根据文本信息判断该视频是否为广告视频包括:将文本信息与预设的广告特征库进行匹配;如果存在匹配项,则判断是广告视频。
在本实施例中,广告特征库是指存储有广告特征词的数据库,例如,“加QQ”、“加微信”、“点击下载,领取更多福利”、“传统武侠创新玩法”、“时尚穿衣顾问”等特征词都存储在广告特征库中。判断一个视频是否为广告视频的方法就是将该视频关联的文本信息与广告特征库中的广告特征关键词进行匹配,若匹配成功,则确定该视频为广告视频。例如,若视频关联的文本信息为“时尚穿衣顾问”,广告特征库中存储有匹配的“时尚穿衣顾问”这样的广告特征词,则判断该视频为广告视频。此外,为了识别出不同类别的广告,会对广告特征库进行实时更新。
在本发明的一个实施例中,图1所示的方法进一步包括:判断该视频的内容是否符合预设规则,是则确定该视频是广告视频,并将该视频标记为广告视频。
广告视频的广告特征除了文本信息以外,也会以图片的形式出现,因此,除了预设了广告特征库来根据关联的文本信息识别广告视频外,在本实施例中,还预设了一些规则用于识别广告视频。例如,以类似PPT形式出现的广告视频,就需要通过预设规则来判断该视频是否为广告视频。需要说明的是,本实施例中的预设规则是指将视频中的图片分解为数个帧图像,通过比较各个帧图像中的内容,来判断该视频是否为广告视频。
在本发明的一个实施例中,上述方法中判断该视频的内容是否符合预设规则,是则确定该视频是广告视频包括:判断该视频的各帧图像内容是否有变化,没有变化则确定该视频是广告视频。
在本实施例中,当从视频中采集完多帧时,每一帧都会对应一个图像,比较各帧中的图像内容,若各帧的图像内容相同,则可判断该视频为广告视频,例如,从一个视频中采集了5帧,分别为帧1、帧2、帧3、帧4和帧5,对比各帧的图像内容相同,即判断该视频为广告视频。这种类型的视频由于内容一成不变,因此即使不是广告视频,也是属于毫无意义的垃圾视频,应予以清理。
在本发明的一个实施例中,上述方法中判断该视频的内容是否符合预设规则,是则确定该视频是广告视频还包括:判断该视频的各帧图像内容是否均含有商品信息,是则确定该视频是广告视频。
在本实施例中,进行和上述实施例同样的操作,例如,从一个视频中采集了5帧(或更多帧),分别为帧1、帧2、帧3、帧4和帧5,对比各帧的图像内容,若每帧的图像内容中都包含有“促销大甩卖,棉衣九五折出售”这样的商品售卖信息,或者商品图像,即判断该视频为广告视频。
在本发明的一个实施例中,判断该视频的内容是否符合预设规则包括:对该视频进行采样,获得采样帧,判断采用帧的内容是否符合预设规则。
在判断视频的内容时,若视频很长,则需要花费大量的时间对视频进行采集和判断,因此,对于长的视频,采用本实施例中的方法,每隔一段时间,在视频中采集一帧,组成采样帧,判断采样帧中的每帧图像内容是否相同或是否包含商品信息,若是,则判定该视频为广告视频。例如,每隔5帧从视频中采集一帧,共采集到帧1、帧6、帧11、帧16、帧21……,比较各帧图像中的内容,若各帧内容相同或各帧内容均包含商品信息,则判断该视频为广告视频。采用上述方法,缩短了判断时间,提高了效率。
在本发明的一个实施例中,上述的根据预设策略处理广告视频包括:将广告视频从视频库中删除;或者,从广告视频中删除广告元素。
在本实施例中,对广告视频的处理方法是,可直接从视频库中删除该广告视频,也可以删除视频中的广告内容而保留该视频。例如,对于“点击下载,领取更多福利”的广告视频,可直接从视频库中删除该广告视频。
图2示出了根据本发明一个实施例的处理标题党视频的装置的结构示意图。如图2所示,该处理标题党视频的装置200包括:
获取单元210,适于从视频库中获取待处理的一个视频。
视频库中的视频的来源不能固定,广告商、注册用户等均可以向视频库中存储视频,这就意味着当视频上传到视频库中时,视频的标题与视频内容是否一致是无法判断的。因此,为了对视频库中的视频是否为标题党视频进行判断,需要将视频库中的视频选取出来。
判断单元220,适于判断该视频的标题与该视频的内容是否匹配。
标记单元230,适于如果不匹配则将视频标记为标题党视频。
本实施例中是将视频的标题与视频的内容进行匹配,如果视频标题与视频内容不匹配则说明该视频标题与视频的内容不相符,确定为标题党视频,并进行标记。如果匹配,则说明视频标题与视频内容相符,则该视频被确定是非标题党视频。
处理单元240,适于根据预设策略处理标题党视频。
本实施例中,在确定是标题党视频后,需要进行相应的处理,如直接删除,该视频不再会被用户播放,或者将视频的标题进行重新生成,以使得重新生成的标题与视频内容相符,再推荐给用户进行播放。
在一个例子中,获取的视频库中的待处理的视频,该视频标题是“韩国少女时代MV”,但是视频的内容则是自录制的关于自家宠物狗的视频,通过判断,该视频标题与视频内容不匹配,那么该视频就被标记为标题党视频,根据预设策略对该视频进行处理。
可见,通过本实施例,有效的确定标题党视频,对标题党视频进行预设策略处理后,可以避免出现用户点击视频后观看到的是与标题不相符的视频内容,防止用户的反感情绪,增强用户的使用体验。
在本发明的一个实施例中,判断单元220,适于提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
在本实施例中,提取的视频的标题的特征信息可以是对视频的标题进行文字识别后,获得的与标题相对应的特征向量,以及提取的该视频内容的特征信息也可以是提取的与视频内容相对应的特征向量,在判断视频的标题与该视频的内容是否匹配时,可以判断提取的标题的特征向量和视频内容的特征向量。
优选地,判断单元220,适于将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;根据神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
这里的神经网络分类器适用于区分标题与内容匹配的视频和标题与内容不匹配的视频,当将该视频的标题的特征信息和该视频的内容的特征信息输入到该神经网络分类器中后,如果匹配,就会输出匹配的结果,如果不匹配就会输出不匹配的结果,即铜鼓该神经网络分类器可以直接获取到该视频的标题与该视频的内容是否匹配。
具体的,为了获取到上述的神经网络分类器,图2所示的装置进一步包括:训练单元,适于预先训练神经网络分类器,具体适于获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习,以便该神经网络分类器可以区分标题与内容匹配的视频;获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习,以便该神经网络分类器可以区分标题与内容不匹配的视频。
在本发明的一个实施例中,处理单元240,适于将标题党视频从视频库中删除;或者,为视频库中的标题党视频重新生成标题。
本实施例中,当视频被标记为标题党视频后,可以进行两种方式的处理,一种是直接将其从视频库中删除,这样用户就无法从视频库中获取到该视频。另一种方式是为被标记为标题党视频再重新生成标题,该重新生成的标题是与视频内容向匹配的,这样用户再次从视频库中获取到该视频时,其首先浏览到的视频的标题就是与视频内容相符的标题,当其点击视频后也不会出现观看到与标题不相符的视频内容,避免反感情绪出现。
这里的重新生成标题可以根据视频内容生成的。例如,在识别到视频内容的特征信息后,可以通过神经网络模型,输出与视频内容特征信息相匹配的标题的特征信息,然后根据标题的特征信息生成对应的标题。
在本发明的一个实施例中,图2所示的装置进一步包括:分类单元,适于当视频库中的视频为短视频时,将视频库中的视频进行分类;将属于同一类的视频拼接成一个或多个视频;当用户请求播放一类视频时,向该用户提供拼接后的视频。
当用户在对视频库中的一个视频进行观看时,为了可以使得用户获取到与该视频同类的视频信息,特别是对于短视频时,一段视频的播放可能会无法满足用户对该类视频的观看需求,为了满足用户的需求,进一步增强用户的使用体验。在本实施例中,当视频库中的视频是短视频时,对视频进行分类,对同类的视频进行拼接,当用户播放时,观看的是拼接后的视频,里面会包含有同类的一个或多个短视频,满足用户对该类视频的观看需求。
但是如果拼接后的视频太长,随着视频的播放。用户的观看热度反而会下降,所以,优选地,进行拼接的时候,首先预设拼接后的视频的预设时间长度,同类视频进行拼接时,根据该预设时间长度,可以拼接成一个或多个短视频。例如,预设时间长度是150秒,同类短视频中包含有5个,分别是60秒、90秒、80秒、30秒和40秒,那么就将60秒、90秒的短视频进行拼接成一个,将80秒、30秒和40秒的短视频拼接成一个。
在本发明的一个实施例中,图2所示的装置进一步包括:分类单元,适于将视频库中的视频进行分类;在视频提供页面上展示不同类别视频对应的控件;当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
用户在不同的情绪状态下需求的视频的类型也是不同的,例如,悲伤时可能需要观看喜剧类的视频,心情烦躁时需要平缓的视频等,为了使得用户可以根据自己的需求进行不同种类的视频的观看,在本实施例中,对视频库中的视频进行分类,并提供相应的控件,用户可以通过不同类别视频对应的控件选择与自己情绪或心情相符的视频观看。例如,用户心情沮丧时,需要看一些励志类的视频,则可以点击励志类的控件,就会获得该励志类的视频。
需要说明的是,一个视频可以是多种类别,例如,关于萌宠趣事的视频,可是喜剧类的,也可以是日常生活类的,当用户点击喜剧类的控件时,该萌宠趣事的视频会被提供,当用户点击日常生活类的控件时,该萌宠趣事的视频也会被提供。
短视频类平台应用接收用户自己录制并上传的视频并保存到视频库中,同时向用户提供视频库中的视频。但用户上传的视频中包含有很多广告视频,影响了观看用户的体验。因此亟需对广告视频进行限制的手段。
在本发明的一个实施例中,图2所示的装置进一步包括:
广告标记单元,适于获取该视频关联的文本信息,根据文本信息判断该视频是否为广告视频,是则将该视频标记为广告视频。
处理单元240,适于根据预设策略处理广告视频。
视频库中存储有待播放的视频,往往也会被存储进一些广告视频,例如,包含“扫码加微信,轻松赚金币”“加qq,教你传统武侠创新玩法”等信息的视频,为了使用户准确获取想观看的视频,需对视频库中的这些广告视频进行处理,在本实施例中,以获取视频库中的一个视频,判断是否为广告视频为例进行说明。
每一个视频都会有对应关联的文本信息,这里的文本信息是指文字信息。其中,广告视频的文本信息中会包含一些广告特征,例如,“传统武侠创新玩法”或“时尚穿衣顾问”这样的广告特征,当在文本信息中识别到上述广告特征,就判断与文本信息关联的视频为广告视频,进而用符号“△”或其他的标记手段将该视频进行标记为广告视频。
在上述实施例的基础上,对带标记的广告视频进行预设策略处理,需要说明的是,这里所说的预设策略处理可以是指删除广告视频或删除广告视频中的广告的内容。例如,删除“传统武侠创新玩法”这样的广告视频,或者也可以删除视频中的“时尚穿衣顾问”等广告内容。
可见,通过本实施例,用户可以通过与视频关联的文本信息,识别出视频库中的广告视频并进行标记,进而删除带标记的视频或删除视频中的内容。从而为用户提供无广告视频干扰的视频观看体验,用户能准确搜索到要观看视频,改善了观看视频时的画面效果,满足了用户需求,提高了用户的使用体验。
在本发明的一个实施例中,广告标记单元,适于将该视频的音频转换成文本信息;和/或,适于识别该视频的画面中的文字,得到相应的文本信息。
在本实施例中,可以通过将视频中的音频转换为文字,判断文字中是否有广告特征,进而判断该视频是否为广告视频,例如,转换后的文字为“传统武侠创新玩法”,则确定具有广告特征,即判断该视频为广告视频。或者,也可通过OCR(光学字符识别,OpticalCharacter Recognition)技术识别视频画面中的文字,同样地判断文字中是否有广告特征,进而判断该视频是否为广告视频。例如,通过OCR识别出画面中的文字为“点击下载,领取更多福利”,即判断该视频为广告视频。
在本发明的一个实施例中,广告标记单元,适于将文本信息与预设的广告特征库进行匹配,如果存在匹配项,则判断是广告视频。
在本实施例中,广告特征库是指存储有广告特征词的数据库,例如,“加QQ”、“加微信”、“点击下载,领取更多福利”、“传统武侠创新玩法”和“时尚穿衣顾问”等特征词都存储在广告特征库中。判断一个视频是否为广告视频的方法就是将该视频关联的文本信息与广告特征库中的广告特征关键词进行匹配,若匹配成功,则确定该视频为广告视频。例如,若视频关联的文本信息为“时尚穿衣顾问”,广告特征库中存储有匹配的“时尚穿衣顾问”这样的广告特征词,则判断该视频为广告视频。此外,为了识别出不同类别的广告,会对广告特征库进行实时更新。
在本发明的一个实施例中,广告标记单元,进一步适于判断该视频的内容是否符合预设规则,是则确定该视频是广告视频,并将该视频标记为广告视频。
广告视频的广告特征除了以文本信息以外,也会以图片的形式出现,因此,除了预设了广告特征库来根据关联的文本信息识别广告视频外,在本实施例中,还预设了一些规则用于识别图片式的广告视频。例如,以类似PPT形式出现的广告视频,就需要通过预设规则来判断该视频是否为广告视频。需要说明的是,本实施例中的预设规则是指将视频中的图片分解为数个帧图像,通过比较各个帧图像中的内容,来判断该视频是否为广告视频。
在本发明的一个实施例中,广告标记单元,适于判断该视频的各帧图像内容是否有变化,没有变化则确定该视频是广告视频。
在本实施例中,当从视频中采集完多帧时,每一帧都会对应一个图像,比较各帧中的图像内容,若各帧的图像内容相同,则可判断该视频为广告视频,例如,从一个视频中采集了5帧,分别为帧1、帧2、帧3、帧4和帧5,对比各帧的图像内容相同,即判断该视频为广告视频。这种类型的视频由于内容一成不变,因此即使不是广告视频,也是属于毫无意义的垃圾视频,应予以清理。
在本发明的一个实施例中,广告标记单元,适于判断该视频的各帧图像内容是否均含有商品信息,是则确定该视频是广告视频。
在本实施例中,进行和上述实施例同样的操作,例如,从一个视频中采集了5帧(或更多帧),分别为帧1、帧2、帧3、帧4和帧5,对比各帧的图像内容,若每帧的图像内容中都包含有“促销大甩卖,棉衣九五折出售”这样的商品售卖信息,或者商品图像,即判断该视频为广告视频。
在本发明的一个实施例中,广告标记单元,适于对该视频进行采样,获得采样帧,判断采用帧的内容是否符合预设规则。
在判断视频的内容时,若视频很长,则需要花费大量的时间对视频进行采集和判断,因此,对于长的视频,采用本实施例中的方法,每隔一段时间,在视频中采集一帧,组成采样帧,判断采样帧中的每帧图像内容是否相同或是否包含商品信息,若是,则判定该视频为广告视频。例如,每隔5帧从视频中采集一帧,共采集到帧1、帧6、帧11、帧16和帧21……,比较各帧图像中的内容,若各帧图像内容相同或各帧内容均包含商品信息,则判断该视频为广告视频。采用上述方法,缩短了判断时间,提高了效率。
在本发明的一个实施例中,处理单元240,适于将广告视频从视频库中删除;或者,从广告视频中删除广告元素。
在本实施例中,对广告视频的处理方法是,可直接从视频库中删除该广告视频,也可以删除视频中的广告内容而保留该视频。例如,对于“点击下载,领取更多福利”的广告视频,可直接从视频库中删除该广告视频。
本发明还提供了一种电子设备,其中,该电子设备包括:
处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行根据图1所示的及其各实施例中的处理标题党视频的方法
图3示出了根据本发明一个实施例的电子设备的结构示意图。如图3所示,该电子设备300包括:
处理器310;以及被安排成存储计算机可执行指令(程序代码)的存储器320,在存储器320中,有存储程序代码的存储空间330,用于执行根据本发明的方法步骤的程序代码330存储在存储空间330中,该程序代码在被执行时使处理器310执行根据图1所示的及其各实施例中的处理标题党视频的方法。
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。如图4所示,该计算机可读存储介质400,存储一个或多个程序(程序代码)410,一个或多个程序(程序代码)410当被处理器执行时,用于执行根据本发明的方法步骤,即图1所示的以及其各实施例中的处理标题党视频的方法。
需要说明的是,图3所示的电子设备和图4所示的计算机可读存储介质的各实施例与图1所示的方法的各实施例对应相同,上文已有详细说明,在此不再赘述。
综上所述,根据本发明的技术方案,从视频库中获取待处理的一个视频;判断该视频的标题与该视频的内容是否匹配;如果不匹配则将视频标记为标题党视频;根据预设策略处理标题党视频。通过本技术方案,有效的确定标题党视频,对标题党视频进行预设策略处理后,可以避免出现用户点击视频后观看到的是与标题不相符的视频内容,防止用户的反感情绪,增强用户的使用体验。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的处理标题党视频的装置、电子设备和计算机可读存储介质中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备300传统上包括处理器310和被安排成存储计算机可执行指令(程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行图1所示的以及各实施例中的任何方法步骤的程序代码340的存储空间330。例如,用于程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个程序代码340。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质400。该计算机可读存储介质400可以具有与图3的电子设备中的存储器320类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元存储有用于执行根据本发明的方法步骤的程序代码410,即可以由诸如310之类的处理器读取的程序代码,当这些程序代码由电子设备运行时,导致该电子设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种处理标题党视频的方法,其中,该方法包括:
从视频库中获取待处理的一个视频;
判断该视频的标题与该视频的内容是否匹配;
如果不匹配则将视频标记为标题党视频;
根据预设策略处理标题党视频。
A2、如A1所述的方法,其中,所述判断视频的标题与该视频的内容是否匹配包括:
提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;
判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
A3、如A2所述的方法,其中,所述判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配包括:
将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;
根据所述神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
A4、如A3所述的方法,其中,该方法进一步包括预先训练所述神经网络分类器的步骤,具体包括:
获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习;
获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习。
A5、如A1-A4中任一项所述的方法,其中,所述根据预设策略处理标题党视频包括:
将标题党视频从视频库中删除;
或者,为视频库中的标题党视频重新生成标题。
A6、如A1-A4中任一项所述的方法,其中,当所述视频库中的视频为短视频时,该方法进一步包括:
将视频库中的视频进行分类;
将属于同一类的视频拼接成一个或多个视频;
当用户请求播放一类视频时,向该用户提供拼接后的视频。
A7、如A1-A4中任一项所述的方法,其中,该方法进一步包括:
将视频库中的视频进行分类;
在视频提供页面上展示不同类别视频对应的控件;
当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
本发明还公开了B8、一种处理标题党视频的装置,其中,该装置包括:
获取单元,适于从视频库中获取待处理的一个视频;
判断单元,适于判断该视频的标题与该视频的内容是否匹配;
标记单元,适于如果不匹配则将视频标记为标题党视频;
处理单元,适于根据预设策略处理标题党视频。
B9、如B8所述的装置,其中,
所述判断单元,适于提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
B10、如B9所述的装置,其中,
所述判断单元,适于将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;根据所述神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
B11、如B10所述的装置,其中,该装置进一步包括:
训练单元,适于预先训练所述神经网络分类器,具体适于获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习;获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习。
B12、如B8-B11中任一项所述的装置,其中,
所述处理单元,适于将标题党视频从视频库中删除;或者,为视频库中的标题党视频重新生成标题。
B13、如B8-B11中任一项所述的装置,其中,该装置进一步包括:
分类单元,适于当所述视频库中的视频为短视频时,将视频库中的视频进行分类;将属于同一类的视频拼接成一个或多个视频;当用户请求播放一类视频时,向该用户提供拼接后的视频。
B14、如B8-B11中任一项所述的装置,其中,该装置进一步包括:
分类单元,适于将视频库中的视频进行分类;在视频提供页面上展示不同类别视频对应的控件;当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
本发明还公开了C15、一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据A1~A7中任一项所述的方法。
本发明还公开了D16、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现A1~A7中任一项所述的方法。
Claims (10)
1.一种处理标题党视频的方法,其中,该方法包括:
从视频库中获取待处理的一个视频;
判断该视频的标题与该视频的内容是否匹配;
如果不匹配则将视频标记为标题党视频;
根据预设策略处理标题党视频。
2.如权利要求1所述的方法,其中,所述判断视频的标题与该视频的内容是否匹配包括:
提取该视频的标题的特征信息,以及提取该视频的内容的特征信息;
判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
3.如权利要求2所述的方法,其中,所述判断该视频的标题的特征信息和该视频的内容的特征信息是否匹配包括:
将该视频的标题的特征信息和该视频的内容的特征信息输入到用于区分标题与内容匹配的视频和标题与内容不匹配的视频的神经网络分类器;
根据所述神经网络分类器的输出结果确定该视频的标题的特征信息和该视频的内容的特征信息是否匹配。
4.如权利要求3所述的方法,其中,该方法进一步包括预先训练所述神经网络分类器的步骤,具体包括:
获取一定数量的标题与内容匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容匹配的视频后作为训练数据输入到神经网络分类器进行训练学习;
获取一定数量的标题与内容不匹配的视频,提取各视频的标题的特征信息和内容的特征信息并标记为标题与内容不匹配的视频后作为训练数据输入到神经网络分类器进行训练学习。
5.如权利要求1-4中任一项所述的方法,其中,所述根据预设策略处理标题党视频包括:
将标题党视频从视频库中删除;
或者,为视频库中的标题党视频重新生成标题。
6.如权利要求1-4中任一项所述的方法,其中,当所述视频库中的视频为短视频时,该方法进一步包括:
将视频库中的视频进行分类;
将属于同一类的视频拼接成一个或多个视频;
当用户请求播放一类视频时,向该用户提供拼接后的视频。
7.如权利要求1-4中任一项所述的方法,其中,该方法进一步包括:
将视频库中的视频进行分类;
在视频提供页面上展示不同类别视频对应的控件;
当一类视频对应的控件被触发时,向用户提供属于该类别的视频。
8.一种处理标题党视频的装置,其中,该装置包括:
获取单元,适于从视频库中获取待处理的一个视频;
判断单元,适于判断该视频的标题与该视频的内容是否匹配;
标记单元,适于如果不匹配则将视频标记为标题党视频;
处理单元,适于根据预设策略处理标题党视频。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1~7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119348.0A CN108429920A (zh) | 2018-02-06 | 2018-02-06 | 一种处理标题党视频的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119348.0A CN108429920A (zh) | 2018-02-06 | 2018-02-06 | 一种处理标题党视频的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108429920A true CN108429920A (zh) | 2018-08-21 |
Family
ID=63156705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810119348.0A Pending CN108429920A (zh) | 2018-02-06 | 2018-02-06 | 一种处理标题党视频的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108429920A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508406A (zh) * | 2018-12-12 | 2019-03-22 | 北京奇艺世纪科技有限公司 | 一种信息处理方法、装置及计算机可读存储介质 |
CN110072140A (zh) * | 2019-03-22 | 2019-07-30 | 厦门理工学院 | 一种视频信息提示方法、装置、设备及存储介质 |
CN110147814A (zh) * | 2019-04-04 | 2019-08-20 | 北京奇艺世纪科技有限公司 | 一致性检测方法、装置、终端设备及计算机可读存储介质 |
CN110516651A (zh) * | 2019-09-02 | 2019-11-29 | 卓尔智联(武汉)研究院有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN110598046A (zh) * | 2019-09-17 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的标题党识别方法和相关装置 |
CN111353070A (zh) * | 2020-02-18 | 2020-06-30 | 北京百度网讯科技有限公司 | 视频标题的处理方法、装置、电子设备及可读存储介质 |
CN111612875A (zh) * | 2020-04-23 | 2020-09-01 | 北京达佳互联信息技术有限公司 | 一种动态图像生成方法、装置、电子设备及存储介质 |
CN111726653A (zh) * | 2020-06-28 | 2020-09-29 | 北京百度网讯科技有限公司 | 视频管理方法及设备、电子设备和介质 |
CN112749297A (zh) * | 2020-03-03 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 视频推荐方法、装置、计算机设备和计算机可读存储介质 |
CN112966103A (zh) * | 2021-02-05 | 2021-06-15 | 成都信息工程大学 | 一种基于多任务学习的混合注意力机制文本标题匹配方法 |
CN114821818A (zh) * | 2022-06-29 | 2022-07-29 | 广东信聚丰科技股份有限公司 | 基于智慧体育的动作数据分析方法及系统 |
US11490168B2 (en) | 2020-01-20 | 2022-11-01 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for selecting video clip, server and medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI521959B (zh) * | 2013-12-13 | 2016-02-11 | 財團法人工業技術研究院 | 影片搜尋整理方法、系統、建立語意辭組的方法及其程式儲存媒體 |
CN106095898A (zh) * | 2016-06-07 | 2016-11-09 | 武汉斗鱼网络科技有限公司 | 一种视频标题管理方法及装置 |
CN106227793A (zh) * | 2016-07-20 | 2016-12-14 | 合网络技术(北京)有限公司 | 一种视频与视频关键词相关度的确定方法及装置 |
CN106503152A (zh) * | 2016-10-21 | 2017-03-15 | 合网络技术(北京)有限公司 | 标题处理方法和装置 |
CN107491436A (zh) * | 2017-08-21 | 2017-12-19 | 北京百度网讯科技有限公司 | 一种标题党识别方法和装置、服务器、存储介质 |
-
2018
- 2018-02-06 CN CN201810119348.0A patent/CN108429920A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI521959B (zh) * | 2013-12-13 | 2016-02-11 | 財團法人工業技術研究院 | 影片搜尋整理方法、系統、建立語意辭組的方法及其程式儲存媒體 |
CN106095898A (zh) * | 2016-06-07 | 2016-11-09 | 武汉斗鱼网络科技有限公司 | 一种视频标题管理方法及装置 |
CN106227793A (zh) * | 2016-07-20 | 2016-12-14 | 合网络技术(北京)有限公司 | 一种视频与视频关键词相关度的确定方法及装置 |
CN106503152A (zh) * | 2016-10-21 | 2017-03-15 | 合网络技术(北京)有限公司 | 标题处理方法和装置 |
CN107491436A (zh) * | 2017-08-21 | 2017-12-19 | 北京百度网讯科技有限公司 | 一种标题党识别方法和装置、服务器、存储介质 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508406B (zh) * | 2018-12-12 | 2020-11-13 | 北京奇艺世纪科技有限公司 | 一种信息处理方法、装置及计算机可读存储介质 |
CN109508406A (zh) * | 2018-12-12 | 2019-03-22 | 北京奇艺世纪科技有限公司 | 一种信息处理方法、装置及计算机可读存储介质 |
CN110072140A (zh) * | 2019-03-22 | 2019-07-30 | 厦门理工学院 | 一种视频信息提示方法、装置、设备及存储介质 |
CN110147814A (zh) * | 2019-04-04 | 2019-08-20 | 北京奇艺世纪科技有限公司 | 一致性检测方法、装置、终端设备及计算机可读存储介质 |
CN110516651A (zh) * | 2019-09-02 | 2019-11-29 | 卓尔智联(武汉)研究院有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN110598046A (zh) * | 2019-09-17 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的标题党识别方法和相关装置 |
CN110598046B (zh) * | 2019-09-17 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的标题党识别方法和相关装置 |
US11490168B2 (en) | 2020-01-20 | 2022-11-01 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for selecting video clip, server and medium |
CN111353070A (zh) * | 2020-02-18 | 2020-06-30 | 北京百度网讯科技有限公司 | 视频标题的处理方法、装置、电子设备及可读存储介质 |
CN111353070B (zh) * | 2020-02-18 | 2023-08-18 | 北京百度网讯科技有限公司 | 视频标题的处理方法、装置、电子设备及可读存储介质 |
CN112749297A (zh) * | 2020-03-03 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 视频推荐方法、装置、计算机设备和计算机可读存储介质 |
CN111612875A (zh) * | 2020-04-23 | 2020-09-01 | 北京达佳互联信息技术有限公司 | 一种动态图像生成方法、装置、电子设备及存储介质 |
CN111726653A (zh) * | 2020-06-28 | 2020-09-29 | 北京百度网讯科技有限公司 | 视频管理方法及设备、电子设备和介质 |
CN111726653B (zh) * | 2020-06-28 | 2023-07-14 | 北京百度网讯科技有限公司 | 视频管理方法及设备、电子设备和介质 |
CN112966103A (zh) * | 2021-02-05 | 2021-06-15 | 成都信息工程大学 | 一种基于多任务学习的混合注意力机制文本标题匹配方法 |
CN112966103B (zh) * | 2021-02-05 | 2022-04-19 | 成都信息工程大学 | 一种基于多任务学习的混合注意力机制文本标题匹配方法 |
CN114821818A (zh) * | 2022-06-29 | 2022-07-29 | 广东信聚丰科技股份有限公司 | 基于智慧体育的动作数据分析方法及系统 |
CN114821818B (zh) * | 2022-06-29 | 2022-09-16 | 广东信聚丰科技股份有限公司 | 基于智慧体育的动作数据分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108429920A (zh) | 一种处理标题党视频的方法和装置 | |
Prana et al. | Categorizing the content of github readme files | |
US11003421B2 (en) | Event processing system and method | |
CN108154401B (zh) | 用户画像刻画方法、装置、介质和计算设备 | |
CN108460106A (zh) | 一种识别广告视频的方法和装置 | |
US10685265B2 (en) | Cognitive analysis and classification of apparel images | |
CN108377418B (zh) | 一种视频标注处理方法和装置 | |
CN108256537A (zh) | 一种用户性别预测方法和系统 | |
CN105573966A (zh) | 电子表格中所呈现的内容的自适应修改 | |
WO2018014109A1 (en) | System and method for analyzing and searching for features associated with objects | |
CN112529663B (zh) | 商品推荐方法、装置、终端设备及存储介质 | |
US20170032417A1 (en) | Detecting and generating online behavior from a clickstream | |
CN109271594A (zh) | 电子书的推荐方法、电子设备及计算机存储介质 | |
Pineau et al. | The study of doping market: How to produce intelligence from Internet forums | |
CN112990973B (zh) | 线上店铺画像构建方法及系统 | |
CN108415935A (zh) | 一种推送推荐消息的方法、装置 | |
CN109697231A (zh) | 一种案件文书的显示方法、系统、存储介质和处理器 | |
CN113220966A (zh) | 广告创意分类展示方法、系统、设备及可读存储介质 | |
CN110490237A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN111695357A (zh) | 文本标注方法及相关产品 | |
KR20190072443A (ko) | 분리소스 방식의 동적 템플릿 연동 스티커 및 이모티콘 유통 시스템 | |
CN108595580A (zh) | 新闻推荐方法、装置、服务器及存储介质 | |
Grigorev | Machine Learning Bookcamp: Build a Portfolio of Real-life Projects | |
CN111767457A (zh) | 推荐方法及装置 | |
Graser et al. | Factors influencing the user experience of mobile augmented reality apps: an analysis of user feedback based on app store user reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180821 |