CN111274960A - 视频的处理方法、装置、存储介质和处理器 - Google Patents
视频的处理方法、装置、存储介质和处理器 Download PDFInfo
- Publication number
- CN111274960A CN111274960A CN202010065594.XA CN202010065594A CN111274960A CN 111274960 A CN111274960 A CN 111274960A CN 202010065594 A CN202010065594 A CN 202010065594A CN 111274960 A CN111274960 A CN 111274960A
- Authority
- CN
- China
- Prior art keywords
- video
- poetry
- videos
- label
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本申请提供了一种视频的处理方法、装置、存储介质和处理器,该处理方法包括:对视频库中的视频进行分类,得到多类视频;确定各类视频中的多个信息要素;采用识别方法对各视频进行识别,得到对应各信息要素的识别信息;根据识别信息确定对应的标签;记录标签在视频中出现的时间点。该方法可以使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
Description
技术领域
本申请涉及视频处理技术领域,具体而言,涉及一种视频的处理方法、装置、存储介质和处理器。
背景技术
随着视频生产制作技术的成熟,网速的快速提升,流量费用的降低等原因,我们已经从图文时代进入了视频时代,视频成为了互联网用户每天接触时间最长的一种内容形式。面对海量的视频,如何快速准确找到所需视频?如何快速获取到视频中的价值点?是视频用户面临的一个痛点。但视频的内容不同于图文,一是视频的类型不一,长短不一,内容不一,很难使用同一种办法进行分析其中的价值点;二是无论长视频还是短视频均包含图像、声音、文字等多维度信息,承载的信息量远大于图文,这些信息点很难通过标题、关键字、简介等概括性的编目准确完整的表达,导致视频在传播过程中遗失大量没有文本化的信息点,而现有视频搜索都是依靠对标题、关键字等文字的爬虫技术,因此用户经常无法快速准确的找到想要的视频;三是大量视频发布后通常只会被一次性应景性地推给用户观看,过后制作人员面对海量历史视频无法快速检索到视频中有用的信息点,致使大量视频堆积在库里,很难被高效率的重复利用,造成浪费。
在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解,因此,背景技术中可能包含某些信息,这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。
发明内容
本申请的主要目的在于提供一种视频的处理方法、装置、存储介质和处理器,以解决现有技术中无法快速准确找到想要的视频的问题。
根据本发明实施例的一个方面,提供了一种视频的处理方法,包括:对视频库中的视频进行分类,得到多类所述视频;确定各类所述视频中的多个信息要素;采用识别方法对各所述视频进行识别,得到对应各所述信息要素的识别信息;根据所述识别信息确定对应的标签;记录所述标签在所述视频中出现的时间点。
进一步地,根据所述识别信息确定对应的标签,包括:将所述识别信息与知识图谱进行比较,得到比较结果,所述知识图谱与所述信息要素对应;根据所述比较结果确定所述识别信息对应的标签。
进一步地,记录所述标签在所述视频中出现的时间点,包括:确定在所述视频的预定时间内是否出现多次的所述标签;在所述预定时间内出现多次的所述标签的情况下,记录在所述预定时间内最早出现所述标签的时间为所述时间点。
进一步地,在记录所述标签在所述视频中出现的时间点之后,所述方法还包括:将所述标签以及所述标签对应的时间点下发至前端应用产品。
进一步地,在标记所述标签在所述视频中出现的时间点之后,所述方法还包括:接收人工校对结果;根据所述人工校对结果优化所述识别方法和/或所述知识图谱。
进一步地,多类所述视频包括综艺类视频、诗词类视频以及剧集类视频,所述综艺类视频对应的信息要素包括明星,所述诗词类视频对应的信息要素包括诗词的名称以及诗人。
进一步地,所述识别方法为以下至少之一:人脸识别方法、字幕识别方法、音频识别方法、场景识别方法。
根据本发明实施例的另一方面,还提供了一种视频的处理装置,包括:分类单元;用于对视频库中的视频进行分类,得到多类所述视频;第一确定单元,用于确定各类所述视频中的多个信息要素;识别单元,用于采用识别方法对各所述视频进行识别,得到对应各所述信息要素的识别信息;第二确定单元,用于根据所述识别信息确定对应的标签;记录单元,用于记录所述标签在所述视频中出现的时间点。
根据本发明实施例的再一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行任意一种所述的方法。
根据本发明实施例的又一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的方法。
在本发明实施例中,上述视频的处理方法中,首先对视频库中的视频进行分类,得到多类视频,例如,戏曲类视频和诗词类视频,然后确定各类视频中的多个信息要素,例如,诗词类视频的信息要素为诗词名称和诗人,之后采用识别方法对各视频进行识别,得到对应各信息要素的识别信息,例如,一段诗词类视频的识别信息为出现的诗词,之后根据识别信息确定对应的标签,例如,识别信息为诗词的情况下,标签为诗词对应的诗词名称和诗人,最后记录标签在视频中出现的时间点,使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请的一种的实施例的视频的处理方法的流程图;
图2示出了根据本申请的一种的实施例的人工智能模型调度平台的逻辑图;
图3示出了根据本申请的一种的实施例的视频的处理装置的示意图;以及
图4示出了根据本申请的一种的实施例的视频的处理方法的逻辑图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
正如背景技术中所说的,现有技术中的无法快速准确找到想要的视频,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种视频的处理方法、装置、存储介质和处理器。
根据本申请的实施例,提供了一种视频的处理方法。
图1是根据本申请实施例的视频的处理方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,对视频库中的视频进行分类,得到多类上述视频;
步骤S102,确定各类上述视频中的多个信息要素;
步骤S103,采用识别方法对各上述视频进行识别,得到对应各上述信息要素的识别信息;
步骤S104,根据上述识别信息确定对应的标签;
步骤S105,记录上述标签在上述视频中出现的时间点。
上述视频的处理方法中,首先对视频库中的视频进行分类,得到多类视频,例如,戏曲类视频和诗词类视频,然后确定各类视频中的多个信息要素,例如,诗词类视频的信息要素为诗词名称和诗人,之后采用识别方法对各视频进行识别,得到对应各信息要素的识别信息,例如,一段诗词类视频的识别信息为出现的诗词,之后根据识别信息确定对应的标签,例如,识别信息为诗词的情况下,标签为诗词对应的诗词名称和诗人,最后记录标签在视频中出现的时间点,使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
需要说明的是,由于视频承载的信息量较多,现有技术中视频分析需要消耗大量的图形处理器CPU资源,上述视频的处理方法对视频进行分类,并且仅识别有限个信息要素对应的信息,大大降低了视频分析算力的需求,节省资源。
还需要说明的是,上述视频处理方法处理后的视频可以长期重复使用,例如,一个添加了诗人、诗词名称等标签的诗词类视频,便于诗词爱好者或者应试者根据诗词的相关信息(诗人、诗词名称等)进行查找,并且根据标签出现时间点找到具体的片段,避免视频检索范围窄(例如,搜索条件仅为视频名称)且难以找到诗词出现的时间点的问题,大大提高该视频反复利用率。
本申请的一种实施例中,根据上述识别信息确定对应的标签,包括:将上述识别信息与知识图谱进行比较,得到比较结果,上述知识图谱与上述信息要素对应;根据上述比较结果确定上述识别信息对应的标签。具体地,上述在视频的识别信息为人脸的情况下,将人脸与人脸知识图谱进行比对,得到的比较结果为人脸的名字、年龄、职业等,将人脸的名字、年龄、职业等作为人脸对应的标签。将在视频的识别信息为诗词的情况下,将诗词与诗词类知识图谱比对,得到的比较结果为诗句的诗名、诗人、朝代等,将诗句的诗名、诗人、朝代等作为诗词对应的标签。
为了进一步方便用户查找标签的出现的时间点,本申请的一种实施例中,记录上述标签在上述视频中出现的时间点,包括:确定在上述视频的预定时间内是否出现多次的上述标签;在上述预定时间内出现多次的上述标签的情况下,记录在上述预定时间内最早出现上述标签的时间为上述时间点。具体地,将视频分为多个预定时间的视频,并将预定时间的视频中出现多次的标签的最早出现的时间点确定为该标签出现的时间点,避免标签出现的时间点过于密集,方便用户查找选择,另外,本领域技术人员可以根据实际情况选择合适的预定时间。
本申请的一种实施例中,在记录上述标签在上述视频中出现的时间点之后,上述方法还包括:将上述标签以及上述标签对应的时间点下发至前端应用产品。具体地,前端应用产品可以为播放器和搜索装置,当然,前端应用产品不限于此,本领域技术人员根据实际情况将上述视频处理技术应用于合适的前端应用产品。
更为具体地,前端应用产品为播放器,将标签以及标签对应的时间点通过接口下发给播放器,视频就可以直接从其中的具体片段开始播放。例如,一条诗词视频中,嘉宾和选手一共有10人,相关的诗词有80首,上述方法可以将分析出的人物、诗词名称展示在视频下方,方便用户随时查看,用户点击任何一个人物或者诗词名称,视频就可以跳转到这里开始播放;另一方面,80首诗词中的每一首诗词作者、朝代、诗词全文都形成文本化的标签,用户通过“苏轼中国诗词大会”“海上明月共潮生诗词大会”等任何一个标签,都可以找到相应的视频。此外,上述方法还可以把诗歌的标签进行组合,比如,集合含有月亮和诗词标签的组成“写月亮的诗”的微聚合,更近一步方便用户查找。
需要说明的是,上述标签类型可以根据前端应用产品的形态和需求进行选择,例如,娱乐类产品对应的标签为明星等,诗词类产品对应的标签为诗词名称和诗人等。
本申请的一种实施例中,在标记上述标签在上述视频中出现的时间点之后,上述方法还包括:接收人工校对结果;根据上述人工校对结果优化上述识别方法和/或上述知识图谱。上述方法通过人工校对优化识别方法和/或知识图谱,从而识别方法的准确性和知识图谱比较结果的准确性,进而提高标签的准确性。例如,人脸识别时,某个人脸经常被识别错误,则优化这个人物的人脸知识图谱。
本申请的一种实施例中,多类上述视频包括综艺类视频、诗词类视频以及剧集类视频,上述综艺类视频对应的信息要素包括明星,上述诗词类视频对应的信息要素包括诗词的名称以及诗人。当然,视频的类别不限于此,本领域技术人员可以根据实际情况选择合适的视频的类别,例如,多类上述视频还包括新闻类视频,新闻类视频对应的信息要素包括新闻标题和新闻人物等。
需要说明的是,实际上,有些视频是多种视频剪切得到的,因此一个视频可以具有多种类别,该视频对应的信息要素包括多种类别分别对应的信息要素,例如,一个视频既属于综艺类视频,又属于诗词类视频,该视频对应的信息要素包括明星、诗词的名称以及诗人。因此,一条视频中只要包括了诗词,不管视频标题和关键字等信息中是否有诗词相关信息,用户通过诗词的标题、诗人的姓名、诗词中的任何一句诗句/词句、参加过诗词节目的人物姓名任何一个标签,都能找到对应的视频。
本申请的一种实施例中,上述识别方法为以下至少之一:人脸识别方法、字幕识别方法、音频识别方法和场景识别方法。具体地,上述识别方法采用人工智能模型技术实现人脸识别、字幕识别、音频识别和场景识别,人工智能模型采用一站式训练、测试和模型上线工作,分析人员仅需对识别结果进行人工较对,减轻分析人员的工作量。另外,训练得到的人工智能模型,同时训练效果可以为媒体内各类系统调用,提高了投入产出比。
具体地,上述人脸识别方法可以为视频语言处理技术VCA,上述字幕识别方法可以为图像文字识别技术OCR,音频识别方法可以为语音识别技术ASR或自然语言处理技术NLP,当然,上述识别方法也不限于此,本领域技术人员可以根据实际情况选择合适的识别方法。
需要说明的是,如图2所示,以上述人工智能模型为基础构建人工智能模型调度平台,并增加商业、自研、公有云、私有云各类功能,从而根据分析需求,智能选择合适的人工智能模型,该人工智能模型调度平台可以处理视频库中的视频资源,减少人工分析视频的成本,还可以设置评价机制,实现对人工智能模型的能力画像。
具体地,上述人工智能模型通过对SDK接口调用与二次开发,使其集成到人工智能模型调度平台的程序中,SDK包含公有云与私有云两种模式。其中,应急切换模块用于在SDK更新或者当前SDK效果出现突发性变化的情况下进行切换,为保障服务的不间断,人工智能模型调度平台应具设计成平滑切换的模式,使用效果数据的收集整理、集中存储、分析、使用规则定义。数据收集整理模块用于数据收集,数据收集包含两种方式,一是业务系统的反馈数据、二是平台通过爬虫、页面元素分离技术,定时测试每个已经集成的AI接口,并记录效果。分析、规则定义模块用于从准确率、时效性、成本、成长度、可用性、稳定性等维度建立模型,长期动态的评估各个厂商的具体接口,规则应用模块用于根据业务请求,平台通过使用规则调用最适合的AI接口,包含单一调用与组合调用模式。上述平台按业务分类的统一输出接口,例如,http/https、SDK模式。上述平台还具有流量统计、效果反馈、业务权限、高并发架构和传送门Portal功能。
根据本发明实施例还提供了一种视频的处理装置,需要说明的是,本发明实施例的视频的处理装置可以用于执行本发明实施例所提供的视频的处理方法。以下对本发明实施例提供的视频的处理装置进行介绍。
图3是根据本发明实施例的视频的处理装置的示意图,如图3所示,该处理装置包括:
分类单元10;用于对视频库中的视频进行分类,得到多类上述视频;
第一确定单元20,用于确定各类上述视频中的多个信息要素;
识别单元30,用于采用识别装置对各上述视频进行识别,得到对应各上述信息要素的识别信息;
第二确定单元40,用于根据上述识别信息确定对应的标签;
记录单元50,用于记录上述标签在上述视频中出现的时间点。
上述视频的处理装置中,分类单元对视频库中的视频进行分类,得到多类视频,例如,戏曲类视频和诗词类视频,确定单元确定各类视频中的多个信息要素,例如,诗词类视频的信息要素为诗词名称和诗人,识别单元采用识别装置对各视频进行识别,得到对应各信息要素的识别信息,例如,一段诗词类视频的识别信息为出现的诗词,第二确定单元根据识别信息确定对应的标签,例如,识别信息为诗词的情况下,标签为诗词对应的诗词名称和诗人,记录单元记录标签在视频中出现的时间点,使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
需要说明的是,由于视频承载的信息量较多,现有技术中视频分析需要消耗大量的图形处理器CPU资源,上述视频的处理装置对视频进行分类,并且仅识别有限个信息要素对应的信息,大大降低了视频分析算力的需求,节省资源。
还需要说明的是,上述视频处理装置处理后的视频可以长期重复使用,例如,一个添加了诗人、诗词名称等标签的诗词类视频,便于诗词爱好者或者应试者根据诗词的相关信息(诗人、诗词名称等)进行查找,并且根据标签出现时间点找到具体的片段,避免视频检索范围窄(例如,搜索条件仅为视频名称)且难以找到诗词出现的时间点的问题,大大提高该视频反复利用率。
本申请的一种实施例中,上述第二确定单元包括对比模块和第一确定模块,其中,上述对比模块用于将上述识别信息与知识图谱进行比较,得到比较结果,上述知识图谱与上述信息要素对应;上述第一确定模块用于根据上述比较结果确定上述识别信息对应的标签。具体地,上述在视频的识别信息为人脸的情况下,将人脸与人脸知识图谱进行比对,得到的比较结果为人脸的名字、年龄、职业等,将人脸的名字、年龄、职业等作为人脸对应的标签。将在视频的识别信息为诗词的情况下,将诗词与诗词类知识图谱比对,得到的比较结果为诗句的诗名、诗人、朝代等,将诗句的诗名、诗人、朝代等作为诗词对应的标签。
为了进一步方便用户查找标签的出现的时间点,本申请的一种实施例中,上述记录单元包括第二确定模块和记录模块,其中,上述第二确定模块用于确定在上述视频的预定时间内是否出现多次的上述标签;上述记录模块用于在上述预定时间内出现多次的上述标签的情况下,记录在上述预定时间内最早出现上述标签的时间为上述时间点。具体地,将视频分为多个预定时间的视频,并将预定时间的视频中出现多次的标签的最早出现的时间点确定为该标签出现的时间点,避免标签出现的时间点过于密集,方便用户查找选择,另外,本领域技术人员可以根据实际情况选择合适的预定时间。
本申请的一种实施例中,上述装置还包括发送单元,上述发送单元用于在记录上述标签在上述视频中出现的时间点之后,将上述标签以及上述标签对应的时间点下发至前端应用产品。具体地,前端应用产品可以为播放器和搜索装置,当然,前端应用产品不限于此,本领域技术人员根据实际情况将上述视频处理技术应用于合适的前端应用产品。
更为具体地,前端应用产品为播放器,将标签以及标签对应的时间点通过接口下发给播放器,视频就可以直接从其中的具体片段开始播放。例如,一条诗词视频中,嘉宾和选手一共有10人,相关的诗词有80首,上述装置可以将分析出的人物、诗词名称展示在视频下方,方便用户随时查看,用户点击任何一个人物或者诗词名称,视频就可以跳转到这里开始播放;另一方面,80首诗词中的每一首诗词作者、朝代、诗词全文都形成文本化的标签,用户通过“苏轼中国诗词大会”“海上明月共潮生诗词大会”等任何一个标签,都可以找到相应的视频。此外,上述装置还可以把诗歌的标签进行组合,比如,集合含有月亮和诗词标签的组成“写月亮的诗”的微聚合,更近一步方便用户查找。
需要说明的是,上述标签类型可以根据前端应用产品的形态和需求进行选择,例如,娱乐类产品对应的标签为明星等,诗词类产品对应的标签为诗词名称和诗人等。
本申请的一种实施例中,上述装置还包括优化单元,上述优化单元包括接收模块和优化模块,其中,上述接收模块用于在标记上述标签在上述视频中出现的时间点之后,接收人工校对结果;上述优化模块用于根据上述人工校对结果优化上述识别装置和/或上述知识图谱。上述装置通过人工校对优化识别装置和/或知识图谱,从而识别装置的准确性和知识图谱比较结果的准确性,进而提高标签的准确性。例如,人脸识别时,某个人脸经常被识别错误,则优化这个人物的人脸知识图谱。
本申请的一种实施例中,多类上述视频包括综艺类视频、诗词类视频以及剧集类视频,上述综艺类视频对应的信息要素包括明星,上述诗词类视频对应的信息要素包括诗词的名称以及诗人。当然,视频的类别不限于此,本领域技术人员可以根据实际情况选择合适的视频的类别,例如,多类上述视频还包括新闻类视频,新闻类视频对应的信息要素包括新闻标题和新闻人物等。
需要说明的是,实际上,有些视频是多种视频剪切得到的,因此一个视频可以具有多种类别,该视频对应的信息要素包括多种类别分别对应的信息要素,例如,一个视频既属于综艺类视频,又属于诗词类视频,该视频对应的信息要素包括明星、诗词的名称以及诗人。因此,一条视频中只要包括了诗词,不管视频标题和关键字等信息中是否有诗词相关信息,用户通过诗词的标题、诗人的姓名、诗词中的任何一句诗句/词句、参加过诗词节目的人物姓名任何一个标签,都能找到对应的视频。
本申请的一种实施例中,上述识别装置为以下至少之一:人脸识别装置、字幕识别装置、音频识别装置和场景识别装置。具体地,上述识别装置采用人工智能模型技术实现人脸识别、字幕识别、音频识别和场景识别,人工智能模型采用一站式训练、测试和模型上线工作,分析人员仅需对识别结果进行人工较对,减轻分析人员的工作量。另外,训练得到的人工智能模型,同时训练效果可以为媒体内各类系统调用,提高了投入产出比。
具体地,上述人脸识别装置可以为视频语言处理技术VCA,上述字幕识别装置可以为图像文字识别技术OCR,音频识别装置可以为语音识别技术ASR或自然语言处理技术NLP,当然,上述识别装置也不限于此,本领域技术人员可以根据实际情况选择合适的识别装置。
需要说明的是,如图2所示,以上述人工智能模型为基础构建人工智能模型调度平台,并增加商业、自研、公有云、私有云各类功能,从而根据分析需求,智能选择合适的人工智能模型,该人工智能模型调度平台可以处理视频库中的视频资源,减少人工分析视频的成本,还可以设置评价机制,实现对人工智能模型的能力画像。
具体地,上述人工智能模型通过对SDK接口调用与二次开发,使其集成到人工智能模型调度平台的程序中,SDK包含公有云与私有云两种模式。其中,应急切换模块用于在SDK更新或者当前SDK效果出现突发性变化的情况下进行切换,为保障服务的不间断,人工智能模型调度平台应具设计成平滑切换的模式,使用效果数据的收集整理、集中存储、分析、使用规则定义。数据收集整理模块用于数据收集,数据收集包含两种方式,一是业务系统的反馈数据、二是平台通过爬虫、页面元素分离技术,定时测试每个已经集成的AI接口,并记录效果。分析、规则定义模块用于从准确率、时效性、成本、成长度、可用性、稳定性等维度建立模型,长期动态的评估各个厂商的具体接口,规则应用模块用于根据业务请求,平台通过使用规则调用最适合的AI接口,包含单一调用与组合调用模式。上述平台按业务分类的统一输出接口,例如,http/https、SDK模式。上述平台还具有流量统计、效果反馈、业务权限、高并发架构和传送门Portal功能。
为了使得本领域技术人员能够更加清楚地了解本申请的技术方案,以下将结合具体的实施例来说明本申请的技术方案。
实施例
如图4所示,本实施例的视频的处理方法的处理过程如下:编辑梳理视频库中的视频,编辑对视频进行处理分类,梳理提炼各类视频的有价值的信息要素,通过AI视频分析技术,提取人脸、字幕、音频、场景等识别信息,根据前期编辑梳理的不同类型视频有价值的信息要素,将提取的信息与不同的知识图谱和知识库进行比对并打上标签,根据产品形态和需求,选出最终需要的标签类型,将标签对应到视频中的时间点,编辑人工核对、矫正结果,核查识别信息和标签是否正确,若不正确,优化识别方法和/或知识图谱,若正确,将标签以及标签对应的时间点下发至前端应用产品,用户通过标签精准搜索视频,并定点播放。
上述视频的处理装置包括处理器和存储器,上述分类单元、第一确定单元、识别单元、第二确定单元和记录单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来快速准确找到想要的视频。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述视频的处理方法。
本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述视频的处理方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤S101,对视频库中的视频进行分类,得到多类上述视频;
步骤S102,确定各类上述视频中的多个信息要素;
步骤S103,采用识别方法对各上述视频进行识别,得到对应各上述信息要素的识别信息;
步骤S104,根据上述识别信息确定对应的标签;
步骤S105,记录上述标签在上述视频中出现的时间点。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤S101,对视频库中的视频进行分类,得到多类上述视频;
步骤S102,确定各类上述视频中的多个信息要素;
步骤S103,采用识别方法对各上述视频进行识别,得到对应各上述信息要素的识别信息;
步骤S104,根据上述识别信息确定对应的标签;
步骤S105,记录上述标签在上述视频中出现的时间点。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的视频的处理方法中,首先对视频库中的视频进行分类,得到多类视频,例如,戏曲类视频和诗词类视频,然后确定各类视频中的多个信息要素,例如,诗词类视频的信息要素为诗词名称和诗人,之后采用识别方法对各视频进行识别,得到对应各信息要素的识别信息,例如,一段诗词类视频的识别信息为出现的诗词,之后根据识别信息确定对应的标签,例如,识别信息为诗词的情况下,标签为诗词对应的诗词名称和诗人,最后记录标签在视频中出现的时间点,使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
2)、本申请的视频的处理装置中,分类单元对视频库中的视频进行分类,得到多类视频,例如,戏曲类视频和诗词类视频,确定单元确定各类视频中的多个信息要素,例如,诗词类视频的信息要素为诗词名称和诗人,识别单元采用识别方法对各视频进行识别,得到对应各信息要素的识别信息,例如,一段诗词类视频的识别信息为出现的诗词,第二确定单元根据识别信息确定对应的标签,例如,识别信息为诗词的情况下,标签为诗词对应的诗词名称和诗人,记录单元记录标签在视频中出现的时间点,使得用户可以根据标签快速准确找到想要的视频,并直接找到视频出现标签的时间点,大大节省了用户查找视频的时间成本。并且挖掘视频中的多个信息要素,以增加得到的标签的种类和数量,使得用户采用任意一个标签进行搜索均可查找到相应的视频,从而进一步挖掘出了视频的价值,拓展了视频的使用场景、使用深度、使用频次。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种视频的处理方法,其特征在于,包括:
对视频库中的视频进行分类,得到多类所述视频;
确定各类所述视频中的多个信息要素;
采用识别方法对各所述视频进行识别,得到对应各所述信息要素的识别信息;
根据所述识别信息确定对应的标签;
记录所述标签在所述视频中出现的时间点。
2.根据权利要求1所述的方法,其特征在于,根据所述识别信息确定对应的标签,包括:
将所述识别信息与知识图谱进行比较,得到比较结果,所述知识图谱与所述信息要素对应;
根据所述比较结果确定所述识别信息对应的标签。
3.根据权利要求1所述的方法,其特征在于,记录所述标签在所述视频中出现的时间点,包括:
确定在所述视频的预定时间内是否出现多次的所述标签;
在所述预定时间内出现多次的所述标签的情况下,记录在所述预定时间内最早出现所述标签的时间为所述时间点。
4.根据权利要求1所述的方法,其特征在于,在记录所述标签在所述视频中出现的时间点之后,所述方法还包括:
将所述标签以及所述标签对应的时间点下发至前端应用产品。
5.根据权利要求2所述的方法,其特征在于,在标记所述标签在所述视频中出现的时间点之后,所述方法还包括:
接收人工校对结果;
根据所述人工校对结果优化所述识别方法和/或所述知识图谱。
6.根据权利要求1至5中任一项所述的方法,其特征在于,多类所述视频包括综艺类视频、诗词类视频以及剧集类视频,所述综艺类视频对应的信息要素包括明星,所述诗词类视频对应的信息要素包括诗词的名称以及诗人。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述识别方法为以下至少之一:人脸识别方法、字幕识别方法、音频识别方法、场景识别方法。
8.一种视频的处理装置,其特征在于,包括:
分类单元,用于对视频库中的视频进行分类,得到多类所述视频;
第一确定单元,用于确定各类所述视频中的多个信息要素;
识别单元,用于采用识别方法对各所述视频进行识别,得到对应各所述信息要素的识别信息;
第二确定单元,用于根据所述识别信息确定对应的标签;
记录单元,用于记录所述标签在所述视频中出现的时间点。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至7中任意一项所述的方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065594.XA CN111274960A (zh) | 2020-01-20 | 2020-01-20 | 视频的处理方法、装置、存储介质和处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065594.XA CN111274960A (zh) | 2020-01-20 | 2020-01-20 | 视频的处理方法、装置、存储介质和处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111274960A true CN111274960A (zh) | 2020-06-12 |
Family
ID=70999022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010065594.XA Pending CN111274960A (zh) | 2020-01-20 | 2020-01-20 | 视频的处理方法、装置、存储介质和处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111274960A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022134547A1 (zh) * | 2020-12-21 | 2022-06-30 | 深圳市前海手绘科技文化有限公司 | 一种动画视频平台视频素材记录方法与装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165316A (zh) * | 2018-09-10 | 2019-01-08 | 深圳市轱辘汽车维修技术有限公司 | 一种视频处理方法、视频索引方法、装置及终端设备 |
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
CN109922373A (zh) * | 2019-03-14 | 2019-06-21 | 上海极链网络科技有限公司 | 视频处理方法、装置及存储介质 |
CN110245259A (zh) * | 2019-05-21 | 2019-09-17 | 北京百度网讯科技有限公司 | 基于知识图谱的视频打标签方法及装置、计算机可读介质 |
-
2020
- 2020-01-20 CN CN202010065594.XA patent/CN111274960A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165316A (zh) * | 2018-09-10 | 2019-01-08 | 深圳市轱辘汽车维修技术有限公司 | 一种视频处理方法、视频索引方法、装置及终端设备 |
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
CN109922373A (zh) * | 2019-03-14 | 2019-06-21 | 上海极链网络科技有限公司 | 视频处理方法、装置及存储介质 |
CN110245259A (zh) * | 2019-05-21 | 2019-09-17 | 北京百度网讯科技有限公司 | 基于知识图谱的视频打标签方法及装置、计算机可读介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022134547A1 (zh) * | 2020-12-21 | 2022-06-30 | 深圳市前海手绘科技文化有限公司 | 一种动画视频平台视频素材记录方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107968959B (zh) | 一种教学视频的知识点分割方法 | |
US10929909B2 (en) | Media enhancement with customized add-on content | |
WO2020155750A1 (zh) | 基于人工智能的语料收集方法、装置、设备及存储介质 | |
CN114297439B (zh) | 一种短视频标签确定方法、系统、装置及存储介质 | |
CN111046225A (zh) | 音频资源处理方法、装置、设备及存储介质 | |
Dumont et al. | Automatic story segmentation for tv news video using multiple modalities | |
CN112468877B (zh) | 一种基于ai内容分析和ocr识别的智能新闻编目方法 | |
CN114254158A (zh) | 视频生成方法及其装置、神经网络的训练方法及其装置 | |
CN114547373A (zh) | 一种基于音频智能识别搜索节目的方法 | |
KR20220135901A (ko) | 맞춤형 교육 콘텐츠 제공 장치, 방법 및 프로그램 | |
CN115580758A (zh) | 视频内容生成方法及装置、电子设备、存储介质 | |
WO2024193538A1 (zh) | 视频数据处理方法、装置、设备及可读存储介质 | |
CN109344325B (zh) | 基于智能会议平板的信息的推荐方法和装置 | |
CN111274960A (zh) | 视频的处理方法、装置、存储介质和处理器 | |
CN113407775A (zh) | 视频搜索方法、装置及电子设备 | |
CN110516086B (zh) | 一种基于深度神经网络影视标签自动获取方法 | |
CN107369450A (zh) | 收录方法和收录装置 | |
Haloi et al. | Unsupervised story segmentation and indexing of broadcast news video | |
JP4755122B2 (ja) | 画像辞書生成方法及び装置及びプログラム | |
CN116628232A (zh) | 标签确定方法、装置、设备、存储介质及产品 | |
Kannao et al. | A system for semantic segmentation of TV news broadcast videos | |
CN113468377A (zh) | 一种视频与文献关联整合方法 | |
CN116704392B (zh) | 视频处理方法、装置、设备、存储介质及产品 | |
KR102720505B1 (ko) | 산업분류를 생성 및 관리하는 방법 및 서버 | |
CN115905584B (zh) | 一种视频拆分方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |