CN103544252A - 一种视频源名称处理方法及装置 - Google Patents

一种视频源名称处理方法及装置 Download PDF

Info

Publication number
CN103544252A
CN103544252A CN201310479231.0A CN201310479231A CN103544252A CN 103544252 A CN103544252 A CN 103544252A CN 201310479231 A CN201310479231 A CN 201310479231A CN 103544252 A CN103544252 A CN 103544252A
Authority
CN
China
Prior art keywords
title
video source
information
atom
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310479231.0A
Other languages
English (en)
Other versions
CN103544252B (zh
Inventor
冯鑫
王干
林赞贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU INDEO TECHNOLOGY CO., LTD.
Original Assignee
BEIJING BAOFENG TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BAOFENG TECHNOLOGY Co Ltd filed Critical BEIJING BAOFENG TECHNOLOGY Co Ltd
Priority to CN201310479231.0A priority Critical patent/CN103544252B/zh
Publication of CN103544252A publication Critical patent/CN103544252A/zh
Application granted granted Critical
Publication of CN103544252B publication Critical patent/CN103544252B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开了一种视频源名称处理方法及装置,包括:提取待处理的视频源的原始片名,将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名。本发明实施例提供的技术方案能够对不同来源影片的原始片名自动地进行合理的拆分及规范化重组,从而实现自动化整理及合并不同来源的视频源,进而减少相应处理过程中的人工成本投入。

Description

一种视频源名称处理方法及装置
技术领域
本发明涉及一种视频处理技术,尤其涉及一种视频源名称处理方法及装置。 
背景技术
随着网络技术的快速发展,通过网络传播的视频源也越来越多。为此,便出现了一些专门提供视频源信息的网站,同时,为保证网站能够为用户更为方便地提供其需要的视频源,则在网站服务器中需要对视频源进行有效的管理,其中包括对视频源的名称的统一管理等。 
目前,由于提供视频的影视聚合产品中数据来源的格式及命名的不同,导致现有影视聚合产品普遍存在数据杂乱及大量重复的问题。针对相应问题,目前,通常采用的针对视频源名称的管理方式为人工简单进行管理。这种人工针对视频名称进行管理的方式一方面无法保证数据整理的有效性,例如,仍然存在片名重复杂乱的问题等,另一方面还将导致较大的人工成本投入。 
发明内容
本发明的目的是提供一种视频源名称处理方法及装置,从而可以有效针对视频源的名称进行管理。 
本发明的目的是通过以下技术方案实现的: 
一种视频源名称处理方法,包括: 
提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则, 
将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名; 
根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
其中,所述片名属性分类信息包括:片名中缀信息、片名后缀信息和连接词中的一 项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤包括: 
解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
所述片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
可选地,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤包括: 
依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步地,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中的步骤包括: 
判断所述原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还将该视频源加入到所述视频源数据库中; 
若原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并将该视频源加入到所述视频源数据库中。 
一种视频源名称处理装置,包括: 
原始片名获取单元,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
原始片名匹配处理单元,用于将所述原始片名获取单元提取到的原始片名与视频源片名库中的片名进行匹配; 
视频加入处理单元,用于在所述原始片名匹配处理单元确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中; 
组合片名重组单元,用于在所述原始片名匹配处理单元确定视频源片名库中未存在 与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
其中,所述片名属性分类信息包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,所述组合片名重组单元中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤由以下单元实现: 
原始片名解析子单元,用于解析所述原始片名获取单元提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
片名属性分类信息确定子单元,用于将所述原始片名解析子单元解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
可选地,所述组合片名重组单元中,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤由以下单元实现: 
重组组合片名子单元,用于获取所述片名属性分类信息确定子单元确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步地,该装置还包括: 
原子片名判断处理单元,用于判断所述组合片名重组单元获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单将该视频源加入到所述视频源数据库中; 
组合片名判断处理单元,用于根据所述原子片名判断处理单元的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组 合片名更新视频源片名库中的片名,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中。 
由上述本发明提供的技术方案可以看出,本发明实施例提供的技术方案能够对不同来源影片(即视频源)的原始片名自动地进行合理的拆分及规范化重组,从而实现自动化整理及合并不同来源的视频源,进而减少相应处理过程中的人工成本投入。 
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。 
图1为本发明实施例提供的视频源名称处理方法的处理过程示意图; 
图2为本发明实施例提供的视频源名称处理方法的应用实施例的处理过程示意图; 
图3为本发明实施例提供的视频源名称处理装置的结构示意图; 
图4为本发明实施例提供的装置中的组合片名重组单元的结构示意图。 
图5为本发明实施例提供的视频源名称处理装置的结构示意图。 
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。 
下面将结合附图对本发明实施例作进一步地详细描述。 
本发明实施例提供的一种视频源名称处理方法的具体实现过程如图1所示,可以包括以下处理步骤: 
步骤101,当获取到需要处理名称的视频源后,则提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
步骤102,将提取获得的所述原始片名与视频源片名库(即影视片名库)中的片名进行匹配,若存在与所述原始片名匹配的片名,则执行步骤103,否则,执行步骤104至步骤106; 
步骤103,由于视频源片名库中已经存在与该原始片名相同的视频源片名,则表明该 原始片名符合预定的片名格式,即无需对该原始片名进行修改,此时只需要将该待处理的视频源加入视频源数据库中即可。 
步骤104,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,即从所述视频源的原始片名中提取出视频源的原子片名,相应的原子片名是指视频源本身的名称,比如,若视频源是电影,则该视频源的原子片名就是指该电影的名称,若视频源是电视剧,则该视频源的原子片名就是指该电视剧的名称; 
举例来说,假设视频源的原始片名为“美剧-傲骨贤妻-第4季-第10集”,则通过相应的提取原子片名的过程便可以将作为原子片名的“傲骨贤妻”提取出来; 
步骤105,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息; 
其中,所述片名属性分类信息可以但不限于包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,相应的参数信息可以但不限于包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
具体可以根据视频源的原始片名进行片名属性分类信息的确定,也可以根据获取到的视频源携带的其他信息确定所述片名属性分类信息,或者也可以同时根据原始片名和视频源携带的其他信息确定所述片名属性分类信息;例如,可以解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
步骤106,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名,该组合片名即为视频源的影视片名; 
若所述片名属性分类信息包含多项信息内容,则可以将多项信息按照预定的顺序(即预定的片名构造规则)与原子片名组合获得所述视频源的组合片名;例如,可以将步骤105中获得的所述片名中缀信息、片名后缀信息、连接词及原子片名按照预定的片名构造规则组合获得该视频源的组合片名; 
相应的预定的片名构造规则可以但不限于:依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名;其中,前连接词、中连接词和后连接词可以为相同的连接词,也可以为各不相同的连接词,所述连接词可以为预定的“*”、“—”或“&”等符号,也可以为特定的英文字母等;所述的连接词可以为从原始片名中提取获得,也可以预先设定; 
步骤107,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中,以便于观看视频源的用户可以通过该视频源的组合片名索引到该视频源。 
通过上述处理过程,可以方便快捷地对待加入到视频源数据库中的视频源的名称进行相应的规范化处理,从而便于针对视频源的管理。例如,若在原始片名中包括片名前缀信息及前连接词等信息,则在通过上述过程拆分原始片名后,相应的片名前缀信息只作为属性对影片进行归类以为后期的推广用而不再出现在视频源的组合片名(即新的影片片名)中,相应的片名前缀信息可以为:“预告片、特辑、片花或晚会”等描述;另外,若原始片名中包括状态词,则由于状态词为各家站点描述影片当前状态的信息,为无意义信息,因而,在重组获得的组合片名中该状态词也需要去除,同时对于多余的连接词也一并去除,使得重组获得的影视片名更加规范合理。 
为便于理解,下面将结合具体应用过程及相应的附图对本发明实施例的实现过程进行详细解释说明。 
参照图2所示,相应的视频源名称处理方法的应用过程可以包括以下步骤: 
步骤201,针对来自于不同站点的数据源(即视频源),获取视频源的原始片名,并将原始片名与本地视频源片名库中的片名进行匹配,另外,还可以将该视频源的原始片名存入mysql数据库(关联数据库)以备后续处理过程中调用; 
具体地,在该步骤中,若获取的视频源的原始片名与本地视频源片名库中的片名匹配,则表明该视频源已经存在,且表明该视频源的原始片名符合命名规范,则可以进行影片、专辑及视频等视频源的合并处理,具体的合并处理过程可以包括:将该视频源作为对应影片的专辑内容,写入专辑列表并关联到影片中去,以及根据该视频源的信息对相应影片的信息进行补充,如影片描述、导演信息、演员信息、分类信息等; 
在该步骤中,若获取的视频源的原始片名与本地视频源片名库中的片名不匹配,则创建一个新的影片,并执行后续的步骤202; 
步骤202,对于原始片名与本地视频源片名库中的片名不匹配的情况,则通过该步骤针对新创建的影片进行名称的处理,相应的处理过程具体可以包括: 
步骤2021,从mysql数据库中取出视频源的原始片名,并根据原始片名(如影片标题等)中的连接词对原始片名进行拆分,以提取出该原始片名中的片名中缀信息、片名后缀信息; 
步骤2022,根据预定的片名构造规则,重新构造(即重组)视频源的组合片名,具体根据原子片名和提取出的片名中缀信息、片名后缀信息按照预定的片名构造规则构造组合片名; 
步骤2023,将原子片名与原子片名库中的原子片名匹配,根据匹配结果: 
若在原子片名库中存在该原子片名,则判断提取出的信息中是否存在片名属性分类信息(如片名中缀信息及片名后缀信息等),若有则执行步骤2024,否则,则直接更新影视片名库(即视频源片名库)中的影片名为新的原子片名,并合并该影片到已入库影片,即将该视频源加入到所述视频源数据库中; 
若原子片名未存在于所述原子片名库中,则执行步骤2024; 
步骤2024,将组合片名与组合片名库中的组合片名匹配,根据匹配结果: 
若存在该组合片名,则判断组合片名是否己加入影视片名库(即视频源片名库,其中保存各个视频源的组合片名及原始片名,作为各个视频源的关联索引信息),若该组合片名存在于影视片名库中,则合并该影片到己入库影片(即将该视频源加入到所述视频源数据库中,进行影片、专辑及视频等视频源的合并处理),具体的合并处理方式在之前的步骤201中已经描述,在此不再赘述;若该组合片名没有存在于影视片名库中,则更新影视片名库中片名为新片名,并合并该影片到已入库影片;若组合片名存在于组合片名库中,但通过步骤2023确定原子片名未存在于原子片名库中,则在该步骤中还将原子片名加入到原子片名库中;其中,相应的新片名可以为组合片名,也可以为根据组合片名按照预定的格式规则确定的片名,例如,将“原子片名+片名中缀信息+片名后缀信息”作为相应的新片名增加到影视片名库中; 
若不存在,则将原子片名写入原子片名库,组合片名写入组合片名库,并创建与原始片名关联关系,创建的关联关系可以写入图2所示的关联片名库中,以便后期进行查询、纠错等处理。除此之外还需要根据该组合片名更新影视片名库中的片名为新片名,并合并该影片到已入库影片。 
在上述执行步骤2021的处理过程中,若无法对原始片名进行拆分,即原始片名不符合预定的规范,则可以将该原始片名存入待定片名库中,并发出人工处理指令,以通知需要由人工参预处理以完成任务后续的处流程。 
完成上述处理后,便可以将新获取的视频源以合乎规范的格式加入到影视片名库中,之后,便可以校验视频源的有效性(如:url、影片信息等),以便根据校验结果进行视频源的上线或下线的处理。通过上述过程,可以方便快捷地将从原始片名中提取的片名前缀信息、状态词及部分连接词等信息,在重组获得的组合片名中去除掉,而仅保留提取出的片名中缀信息和片名后缀信息,从而获得更加规范的影视片名。 
在上述处理过程中,在原始片名中提取出的状态词、片名前缀信息、片名中缀信 息、片名后缀信息及相应的连接词具体可以但不限于包括以下信息: 
片名前缀信息可以包括:预,预告,预告片,片花,花絮,特辑,集合,MV,PV,新PV,集锦,MTV,片段,搞笑片段,精彩片段,剪辑,无版权,特别报道,精选,序,特别节目,宣传,宣传片,片段,主题曲,剧透,片场直击,首映式,幕后特辑,制作特辑,看点,精彩看点,专题,娱乐,新闻,特别报道,特别报导,抢鲜看,抢鲜,体验版,大全,纪录片,演唱会,开幕式,闭幕式,采访,访谈,会议,选集,英文特辑,中文特辑,合集版,合集,晚会,讲述,现场视频,介绍,片头,片头曲,片尾,片尾曲,专场,视频,攻略,串烧,典礼,颁奖,颁奖晚会,颁奖典礼,吐槽版,演唱会,巡演,选播,插曲,精彩分段,分段,欣赏,直击,拍摄日志,盘点,推广曲,展映,打造中,揭秘,搞笑,精选集,高清合集,VIP,付费版,付费,付费片、独家爆料、开播大典、开播盛典、首映礼、真实记录、相关视频、明星会、特典,特摄,中文特辑,首播仪式,首播盛典,首映典礼,视频集锦,视频合集,特别节目,精彩花絮,首映礼看点,特别视频,开播典礼,开播仪式,开播秀,首发仪式,群星见面会,颁奖典礼,春节特辑,开播庆典,庆功盛宴,首播庆典,首映大典,首映特别节目,大剧揭秘,宣传片,开场片段欣赏,明星见面会,伴奏,搞笑视频动画,坑爹解说,节目开头创意短片,特效演示,演出资讯,精彩视频,测试,只用视频集ID查询,搞笑视频、网游视频,真人版视频,游戏视频,视频攻略,攻略,页游视频,过场动画、游戏动画、组装视频、教学视频,通关攻略,三星攻略,三星通关攻略,特技攻略,合辑、片场纪实,公益宣传片,开篇预告,超长独家特辑,采访及活动,幕后制作特辑,最新花絮,首播庆典,全球首演典礼,颁奖典礼,精彩回放,大揭秘,青春剧,纪录专辑,纪录专题,等等。 
片名中缀信息可以包括:0~9,第$季,第$部,第$届,第$章,上,下,中,上集,中集,下集,上下集,一~十,壹~拾,I~IX,系列$,S$,第$期,第$话,第$单元,第$卷,第$幕,第$弹,第$辑,$部曲,第$夜,上部、中部、下部、Ⅰ~Ⅻ、㈠~㈩、⑴~⑽,等等。 
片名后缀信息可以包括:国语,国语版,剧场版,影院,影院版,TV,TV版,高清,高清版,1080,1080P,1080高清,1080P高清,720,720P,720高清,720P高清,480,480P,480版,动画版,英语版,法语版,泰语版,微电影,微电影版,续集,续,DVD版,DVD,BD,BD版,BD高清,BD高清版,搞笑版,重制版,高清重制版,粤语版,粤语,泰语,英语,日语,日语版,韩语,韩语版,德语,印度,印度语,意大利,意大利语,印度 版,印地语,越南,越南版,墨西哥,墨西哥版,德语版,XX卫视版,XX卫视,央视版,央视,3D,3D版,7.1,7.1声道,5.1,5.1声道,原声版,电影版,电视剧版,动漫版,网络版,沙画版,原版,XX年版,真人版,ova,ova版,sp,sp版,特别版,oad,oad版,未删减,未删减版,未删版,未删,加长版,加长,美版,美国版,丹麦,丹麦语,国内版,浙版,番外篇,番外,号外,海外版,歌剧版,蓝光版,蓝光,未剪辑版,剪辑版,中文版,中文,性别逆转版,XX话版,XX语版,XX国版,XX文版,闽南语,大陆版,香港版,港版,台湾版,港台版,北印度语,韩版,特别篇,XXXX年版,内地版,四川方言版,四川话版,东北方言版,东北话版,陕西方言版,陕西话版,粤语配音,广东话版,上海方言版,上海话版,精华版,精简版,电视版,TVB,TVB版,无声电影,土耳其语(耳其语),川话版,XXXX版,序章,特别篇,短片,天津话版,1080P超清,720P高清,480P标清,葡萄牙语,先行版,精编版,最终章,CG电影,CG动画电影,HD重制版,卫视版,迷你特别篇,前章,后章,精编版,无字幕版,总集篇,旧剧场版,新剧场版,超高清版,新OVA,日剧,台湾原版,lite,lite版,夏季特别篇,秋季特别篇,春季特别篇,冬季特别篇,修复版,广告剧,公益广告剧,最终章,复活篇,前篇,后篇,总集篇,延续篇,前篇&后篇,特番,电影版,南斯拉夫版,配音剧,HD、音乐电影、最终章,晚间版,下午版,中午版,动画电影版,方言版,Q版剧场、Q版、微动画、微动漫,卡通版,特别加映,音乐剧,等等。 
状态词可以包括:第X集,连载中,正在更新,更新中,X集全,更新至XX,至XX,待续,未完待续,XXXX(如2013),新番,停播,已停播,XX导演版,XX演员版,XX导演,XX演员,全集,全,XX国家,完结,完,结局,完结篇,X部全,英文字幕,中文字幕,中英字幕,英文中字,日语中字,XXXXX期,XXXXX集,XXXX-XX-XX,百度影音,快播,QVOD,德语中字,中文配音,英文字幕版,英文字幕,流畅版,土豆网,优酷网,tudou,youku,百度视频,乐视出品,优酷出品,CCTV,CCTV-$,CCTV$,BBC,大结局,季播,imax,imax版,经典卡通,等等。 
连接词可以包括:(,),,(,),《,》,:,:,-,—,——,",“,”,·,[,],【,】,/,等等。 
通过上述处理过程,可以方便快捷地对视频源的原始片名进行拆分重组,从而获得拆分重组后的新的影视片名(即组合片名)。在新的影视片名中,可以有效过滤掉原始片名中重复杂乱的状态词、多余的连接词及片名前缀信息等,并以更为合理的方式为影视片植入相应的片名属性分类信息,从而便于视频服务提供商根据原子片名库及组合片 名库合并不同来源的影片,以实现对各视频资源的有效管理。 
总之,本发明实施例提供的技术方案能够使得视频源的名称更加规范化,进而使得视频产品的品质得到有效增强,而且,相应的处理过程还可以有效降低人工运营成本。 
本发明实施例还提供了一种视频源名称处理装置,其具体实现结构如图3所示,可以包括以下处理单元: 
原始片名获取单元301,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
原始片名匹配处理单元302,用于将所述原始片名获取单元301提取到的原始片名与视频源片名库中的片名进行匹配; 
视频加入处理单元303,用于在所述原始片名匹配处理单元302确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中; 
组合片名重组单元304,用于在所述原始片名匹配处理单元302确定视频源片名库中未存在与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元303根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
在该装置中,所述片名属性分类信息可以但不限于包括:片名中缀信息、片名后缀信息和连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,如图4所示,在本发明实施例提供的装置的组合片名重组单元304中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤具体可以由以下子单元实现: 
原始片名解析子单元3041,用于解析所述原始片名获取单元301提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
片名属性分类信息确定子单元3042,用于将所述原始片名解析子单元3041解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
具体地,仍参照图4所示,在本发明实施例提供的装置的组合片名重组单元304中, 将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤具体可以由重组组合片名子单元3043实现,该重组组合片名子单元3043用于获取所述片名属性分类信息确定子单元3042确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步,如图5所示,本发明实施例提供的装置还可以包括以下处理单元: 
原子片名判断处理单元305,用于判断所述组合片名重组单元304获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中; 
组合片名判断处理单元306,用于根据所述原子片名判断处理单元305的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中。 
利用上述本发明实施例提供的装置,可以方便快捷地对视频源的原始片名进行拆分重组,从而获得拆分重组后的新的影视片名。 
而且,通过本发明实施例提供的装置能够使得视频源的名称更加规范化,进而使得视频产品的品质得到有效增强,而且,相应的处理过程还可以有效降低人工运营成本。从而方便视频服务提供商对视频源的有效管理。 
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。 

Claims (10)

1.一种视频源名称处理方法,其特征在于,包括:
提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称;
将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则,
将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;
根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。
2.根据权利要求1所述的方法,其特征在于,所述片名属性分类信息包括:片名中缀信息、片名后缀信息和连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。
3.根据权利要求2所述的方法,其特征在于,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤包括:
解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词;
所述片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。
4.根据权利要求3所述的方法,其特征在于,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤包括:
依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。
5.根据权利要求1至4任一项所述的方法,其特征在于,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中的步骤包括:
判断所述原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还将该视频源加入到所述视频源数据库中;
若原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并将该视频源加入到所述视频源数据库中。
6.一种视频源名称处理装置,其特征在于,包括:
原始片名获取单元,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称;
原始片名匹配处理单元,用于将所述原始片名获取单元提取到的原始片名与视频源片名库中的片名进行匹配;
视频加入处理单元,用于在所述原始片名匹配处理单元确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中;
组合片名重组单元,用于在所述原始片名匹配处理单元确定视频源片名库中未存在与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。
7.根据权利要求6所述的装置,其特征在于,所述片名属性分类信息包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。
8.根据权利要求7所述的装置,其特征在于,所述组合片名重组单元中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤由以下单元实现:
原始片名解析子单元,用于解析所述原始片名获取单元提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词;
片名属性分类信息确定子单元,用于将所述原始片名解析子单元解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。
9.根据权利要求8所述的装置,其特征在于,所述组合片名重组单元中,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤由以下单元实现:
重组组合片名子单元,用于获取所述片名属性分类信息确定子单元确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。
10.根据权利要求6至9任一项所述的装置,其特征在于,该装置还包括:
原子片名判断处理单元,用于判断所述组合片名重组单元获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单将该视频源加入到所述视频源数据库中;
组合片名判断处理单元,用于根据所述原子片名判断处理单元的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中。
CN201310479231.0A 2013-10-14 2013-10-14 一种视频源名称处理方法及装置 Expired - Fee Related CN103544252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310479231.0A CN103544252B (zh) 2013-10-14 2013-10-14 一种视频源名称处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310479231.0A CN103544252B (zh) 2013-10-14 2013-10-14 一种视频源名称处理方法及装置

Publications (2)

Publication Number Publication Date
CN103544252A true CN103544252A (zh) 2014-01-29
CN103544252B CN103544252B (zh) 2017-11-14

Family

ID=49967704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310479231.0A Expired - Fee Related CN103544252B (zh) 2013-10-14 2013-10-14 一种视频源名称处理方法及装置

Country Status (1)

Country Link
CN (1) CN103544252B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912707A (zh) * 2016-04-27 2016-08-31 天脉聚源(北京)传媒科技有限公司 一种规范视频资源标识的方法及装置
CN106095898A (zh) * 2016-06-07 2016-11-09 武汉斗鱼网络科技有限公司 一种视频标题管理方法及装置
CN109063141A (zh) * 2018-08-06 2018-12-21 包仁妹 歌曲类型吻合度探测方法
CN111246313A (zh) * 2018-11-28 2020-06-05 北京字节跳动网络技术有限公司 一种视频关联方法、装置,服务器、终端设备及存储介质
CN111343502A (zh) * 2020-03-30 2020-06-26 招商局金融科技有限公司 视频处理方法、电子装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894129A (zh) * 2010-05-31 2010-11-24 中国科学技术大学 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法
US20120095962A1 (en) * 2008-10-14 2012-04-19 Goldman Jason D Aggregating Media Content From Multiple Clients To A Server
CN102929982A (zh) * 2012-10-17 2013-02-13 Tcl通力电子(惠州)有限公司 多媒体扫描文件索引方法及装置
CN103200293A (zh) * 2013-03-05 2013-07-10 上海斐讯数据通信技术有限公司 一种导入通讯录文件过程中自动合并重名联系人的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095962A1 (en) * 2008-10-14 2012-04-19 Goldman Jason D Aggregating Media Content From Multiple Clients To A Server
CN101894129A (zh) * 2010-05-31 2010-11-24 中国科学技术大学 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法
CN102929982A (zh) * 2012-10-17 2013-02-13 Tcl通力电子(惠州)有限公司 多媒体扫描文件索引方法及装置
CN103200293A (zh) * 2013-03-05 2013-07-10 上海斐讯数据通信技术有限公司 一种导入通讯录文件过程中自动合并重名联系人的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李蕊: "基于网络爬虫技术的多源下载系统的设计与实现", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912707A (zh) * 2016-04-27 2016-08-31 天脉聚源(北京)传媒科技有限公司 一种规范视频资源标识的方法及装置
CN105912707B (zh) * 2016-04-27 2019-06-14 天脉聚源(北京)传媒科技有限公司 一种规范视频资源标识的方法及装置
CN106095898A (zh) * 2016-06-07 2016-11-09 武汉斗鱼网络科技有限公司 一种视频标题管理方法及装置
CN109063141A (zh) * 2018-08-06 2018-12-21 包仁妹 歌曲类型吻合度探测方法
CN109063141B (zh) * 2018-08-06 2019-10-18 上海倍增智能科技有限公司 一种歌曲类型吻合度探测平台
CN111246313A (zh) * 2018-11-28 2020-06-05 北京字节跳动网络技术有限公司 一种视频关联方法、装置,服务器、终端设备及存储介质
CN111343502A (zh) * 2020-03-30 2020-06-26 招商局金融科技有限公司 视频处理方法、电子装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN103544252B (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
US9936260B2 (en) Content reproduction method and apparatus in IPTV terminal
CN101682734B (zh) 将宣传内容插入到下载的视频内容中的方法
CN103544252A (zh) 一种视频源名称处理方法及装置
CN109889882B (zh) 一种视频剪辑合成方法和系统
CN104902290B (zh) 管理多个时间源数据的显示装置及其控制方法
CN111432235A (zh) 直播视频生成方法、装置、计算机可读介质及电子设备
WO2012016975A1 (en) Method for sharing data and synchronizing broadcast data with additional information
CN102243581A (zh) 多媒体桌面背景设置方法、多媒体播放器
CN105657502A (zh) 一种自定义菜单的实现方法、装置、客户端及服务器
TW201330603A (zh) 數位內容版本交換方法及所用委託機裝置
O’Sullivan “New and improved subtitle translation”: representing translation in film paratexts
CN101674422A (zh) 一种在线节目单驱动的字幕播出列表的更新方法
KR101317079B1 (ko) 유사 컨텐츠의 채널 전환 시스템 및 그 방법
FR2917523A1 (fr) Procede de description cooperative d'objets medias
KR101749420B1 (ko) 자막 정보를 이용한 영상 콘텐츠의 대표 이미지 추출 장치 및 방법
Stephanie et al. The digitisation of Bollywood: Adapting to disruptive innovation
TWI223162B (en) Method and computer system for automatic generation of multimedia WWW news contents from broadcast news video
Tan Provincializing the Chinese Mediascape: Cantonese Digital Activism in Southern China
Anderson Old Arts in New Media: Qualified Ontologies of ‘Live’in the Age of Media Casting
Schaefer Box office and “Bollywood”: An analysis of soft power content in popular Hindi cinema 1
Popkova From Bootlegging Hollywood to Streaming Battle Rap: The Transformation of the Russian Entertainment Industry
Jang et al. A Study on Virtual Reality Contents Application in Broadcasting: Focused on KBS 3D History Documentary
KR101586924B1 (ko) 멀티플랫폼으로의 변환 시스템
Barnden Screening the Royal Shakespeare Company: A Critical History by John Wyver, and: Shakespeare on Screen: King Lear ed. by Victoria Bladen, Sarah Hatchuel and Nathalie Vienne-Guerrin, and:" Hamlet" and World Cinema by Mark Thornton Burnett
Endong A ‘Nigerianised’Film Industry? A Critical Examination of Nollywood's Perceived Cultural Imperialism on Collywood

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160427

Address after: 119 room 6, building 1480, 610000, Tianfu Road, Chengdu hi tech Zone, Sichuan

Applicant after: CHENGDU INDEO TECHNOLOGY CO., LTD.

Address before: 100191, Haidian District, Xueyuan Road, No. 51, the first to enjoy the 13 floor of science and technology building, Beijing

Applicant before: Beijing Baofeng Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171114

Termination date: 20191014

CF01 Termination of patent right due to non-payment of annual fee