CN115914674A - 智能电视影视媒资的合并方法 - Google Patents
智能电视影视媒资的合并方法 Download PDFInfo
- Publication number
- CN115914674A CN115914674A CN202211426794.9A CN202211426794A CN115914674A CN 115914674 A CN115914674 A CN 115914674A CN 202211426794 A CN202211426794 A CN 202211426794A CN 115914674 A CN115914674 A CN 115914674A
- Authority
- CN
- China
- Prior art keywords
- television
- movie
- matching
- filtering
- media assets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000001914 filtration Methods 0.000 claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 5
- 238000003491 array Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了智能电视影视媒资的合并方法,包括以下步骤:对各牌照方的影视媒资的特征进行选取;利用过滤条件和匹配条件对选取的特征进行匹配得到匹配的结果集;通过相似度算法计算匹配的结果集中各个特征的相似度并进行评分,筛选过滤获取最佳的匹配结果;本发明通过对比各牌照方资源的名称、分类、年代、导演、演员等特征,并通过相似性算法计算各个特征相识度做为评分,筛选过滤获取最佳匹配结果。
Description
技术领域
本发明涉及信息处理技术领域,特别是一种智能电视影视媒资的合并方法。
背景技术
智能电视发展至今,支持的不仅仅是广电的各个卫视的直播内容;而且还会对接各个网络平台的影视资源。现主要的网络影视牌照方主要为腾讯、爱奇艺、优酷、芒果、搜狐、西瓜等;各个牌照方除去少量独播资源,大部分为各家共有的资源;一是由于各个平台的音视资源信息各自维护,出现同一个资源特征信息不对齐;二是影视资源本身特性存在很多系列片、翻拍片等不同资源特征信息极度相似,造成影视媒资聚合困难的问题;而在电视终端给用户展示时同一资源给用户展示多个,会给用户造成困惑。
发明内容
为解决现有技术中存在的问题,本发明的目的是提供一种智能电视影视媒资的合并方法,本发明通过对比各牌照方资源的名称、分类、年代、导演、演员等特征,并通过Levenshtein Distance(编辑距离)算法计算各个特征相识度做为评分,筛选过滤获取最佳匹配结果。
为实现上述目的,本发明采用的技术方案是:一种智能电视影视媒资的合并方法,包括以下步骤:
步骤1、对各牌照方的影视媒资的特征进行选取;
步骤2、利用过滤条件和匹配条件对选取的特征进行匹配得到匹配的结果集;
步骤3、通过相似度算法计算匹配的结果集中各个特征的相似度并进行评分,筛选过滤获取最佳的匹配结果。
作为本发明的进一步改进,在步骤1中,提取的特征包括影视媒资的名称、年代、分类、导演、演员和评分。
作为本发明的进一步改进,在步骤1中,在步骤2中,不同的过滤条件之间为and关系,过滤条件与匹配条件之间为and关系,不同的匹配条件之间没有关系。
作为本发明的进一步改进,当新的影视媒资进入时,查询影视媒资是否存在,如果存在直接更新影视媒资,如果影视媒资不存在,则重复步骤1-步骤3对影视媒资进行合并。
作为本发明的进一步改进,当新的影视媒资进入,对影视媒资进行合并时,先选取特征进行过滤匹配的第一次查询,如果没有获得结果,则选取不同的特征进行过滤匹配的第二次查询,如果依然没有获得结果,则合并失败。
本发明的有益效果是:
本发明采用选取有效特征多轮匹配查询出符合条件的备选资源,然后通过编辑距离算法计算相似度评分,选择评分最高的结果合并。
附图说明
图1为本发明实施例1的流程图;
图2为本发明实施例2的流程框图。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例
如图1所示,一种智能电视影视媒资的合并方法,包括以下步骤:
1、特征选取:
影视媒资一般包含:名称、年代、分类、导演、演员、评分。
a、NAME(名称):需注意名称中各种特殊符号处理,各种系列片、翻盘片的副标题、版本信息、第*季、第*部处理。
b、YEAR(年代):影视媒资存在多种年代上映时间、上架时间等,选取相对误差较小的上映年代;同时为兼容各牌照方运营误差正负1年都算匹配成功。
c、MODEL(分类):主要分类为电影、电视剧、综艺、动漫、少儿、纪录片、体育、游戏;其中电视剧、综艺、纪录片、体育、游戏为独立分类不同分类资源基本不会相同,其中电影、动漫、少儿可能出现不同牌照方将同一资源划分在不同分类如动画电影、少儿电影等。
d、DIRECTOR(导演):需处理各种特殊符号,各牌照方不一定会精准维护该特征,多个导演可能存在排序不一致问题。
e、CAST(演员):需处理各种特殊符号,各牌照方不一定会精准维护该特征,多个演员可能存在排序不一致问题。
2、匹配算法:
创建MatchProcess处理流程,其中属性包括fi ltAspects、matchAspects、matchResul ts;fi l tAspects过滤条件,主要是避免搜索结果过大,用以缩小匹配范围,添加过滤条件,不同过滤条件之间是and关系,与匹配条件之间是and关系所有的过滤条件都会参与每个匹配条件的查询;matchAspects匹配条件,添加匹配类型,不同的匹配类型之间没有关系;matchResul ts匹配的结果集。
3、相似度算法:
Levenshtein Distance算法,又叫Edi t Distance算法,是指两个字符串之间,由一个转成另一个所需要的最小编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。
通过对比各牌照方资源的名称、分类、年代、导演、演员等特征,并通过Levenshtein Distance(编辑距离)算法计算各个特征相识度做为评分,筛选过滤获取最佳匹配结果。
当新增源进入服务流程后,先进行第一次查询采用NAME、YEAR过滤,MODEL匹配的模式,如果没有获得结果进行第二次查询采用NAME、YEAR、MODEL过滤,DIRECTOR/CAST匹配的模式,如果还没有结果合并失败,查询到的结果对每一个特征进行评分,最后选取评分最好的结果合并。
实施例2
如图2所示,一种智能电视影视媒资的合并方法,包括以下步骤:
(1)第一次查询:
已有数据通过mongodb存储,当新资源进入时,通过id查询资源是否存在,如果存在直接更新资源信息,如果资源不存在进入合并流程进行第一次查询。
第一次查询将NAME、YEAR设置为fi ltAspects,MODEL设置为matchAspects。
(2)第二次查询:
第一次查询将NAME、YEAR、MODEL设置为fi l tAspects,DIRECTOR/CAST设置为matchAspects。
构建查询语句:如果是String类型,先将String通过分隔符切分为数组strArray,数组每个元素构建为Cri teria.where(fieldName).regex(".*"+strArray.get(i)+".*"),数组不同元素通过cri teria.orOperator(cri teriaArray)构建成最终查询语句;如果是Integer类型,通过Integer,Integer-1,Integer+1三个值进行or匹配。
(3)精细化评分:
对每一个特征进行评分:NAME特征较为特殊,需处理拆分出副标题,如果两个资源都有或都没有副标题通过,否则不通过匹配;然后通过编辑距离算法计算相识度评分,评分小于0.1匹配不通过,大于0.1通过并记录得分。
(4)结果选取:
结果选取要求匹配上的特征超过两个,然后统计所有结果集评分,选择评分最高的结果匹配。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (5)
1.一种智能电视影视媒资的合并方法,其特征在于,包括以下步骤:
步骤1、对各牌照方的影视媒资的特征进行选取;
步骤2、利用过滤条件和匹配条件对选取的特征进行匹配得到匹配的结果集;
步骤3、通过相似度算法计算匹配的结果集中各个特征的相似度并进行评分,筛选过滤获取最佳的匹配结果。
2.根据权利要求1所述的智能电视影视媒资的合并方法,其特征在于,在步骤1中,提取的特征包括影视媒资的名称、年代、分类、导演、演员和评分。
3.根据权利要求1所述的智能电视影视媒资的合并方法,其特征在于,在步骤1中,在步骤2中,不同的过滤条件之间为and关系,过滤条件与匹配条件之间为and关系,不同的匹配条件之间没有关系。
4.根据权利要求3所述的智能电视影视媒资的合并方法,其特征在于,当新的影视媒资进入时,查询影视媒资是否存在,如果存在直接更新影视媒资,如果影视媒资不存在,则重复步骤1-步骤3对影视媒资进行合并。
5.根据权利要求4所述的智能电视影视媒资的合并方法,其特征在于,当新的影视媒资进入,对影视媒资进行合并时,先选取特征进行过滤匹配的第一次查询,如果没有获得结果,则选取不同的特征进行过滤匹配的第二次查询,如果依然没有获得结果,则合并失败。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211426794.9A CN115914674A (zh) | 2022-11-15 | 2022-11-15 | 智能电视影视媒资的合并方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211426794.9A CN115914674A (zh) | 2022-11-15 | 2022-11-15 | 智能电视影视媒资的合并方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115914674A true CN115914674A (zh) | 2023-04-04 |
Family
ID=86470581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211426794.9A Pending CN115914674A (zh) | 2022-11-15 | 2022-11-15 | 智能电视影视媒资的合并方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115914674A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809117A (zh) * | 2014-01-24 | 2015-07-29 | 深圳市云帆世纪科技有限公司 | 视频数据聚合处理方法、聚合系统及视频搜索平台 |
CN106354827A (zh) * | 2016-08-31 | 2017-01-25 | Tcl集团股份有限公司 | 一种媒资数据整合方法及系统 |
CN108012192A (zh) * | 2017-12-25 | 2018-05-08 | 北京奇艺世纪科技有限公司 | 一种视频资源的识别和聚合的方法及系统 |
CN111368100A (zh) * | 2020-02-28 | 2020-07-03 | 青岛聚看云科技有限公司 | 一种媒资合并方法及其装置 |
-
2022
- 2022-11-15 CN CN202211426794.9A patent/CN115914674A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809117A (zh) * | 2014-01-24 | 2015-07-29 | 深圳市云帆世纪科技有限公司 | 视频数据聚合处理方法、聚合系统及视频搜索平台 |
CN106354827A (zh) * | 2016-08-31 | 2017-01-25 | Tcl集团股份有限公司 | 一种媒资数据整合方法及系统 |
CN108012192A (zh) * | 2017-12-25 | 2018-05-08 | 北京奇艺世纪科技有限公司 | 一种视频资源的识别和聚合的方法及系统 |
CN111368100A (zh) * | 2020-02-28 | 2020-07-03 | 青岛聚看云科技有限公司 | 一种媒资合并方法及其装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11468109B2 (en) | Searching for segments based on an ontology | |
US20070078849A1 (en) | System and method for recommending items of interest to a user | |
US20190379936A1 (en) | System and methods for analyzing content engagement in conjunction with social media | |
JP4363806B2 (ja) | オーディオビジュアルプログラム管理システム及びオーディオビジュアルプログラム管理方法 | |
CN102254006B (zh) | 基于内容的互联网视频检索方法 | |
US7151852B2 (en) | Method and system for segmentation, classification, and summarization of video images | |
CN100409236C (zh) | 流式视频书签 | |
CN100372372C (zh) | 电子节目指南数据的自由文本和属性搜索 | |
CN101068324B (zh) | 信息处理设备和信息处理方法 | |
EP2051509A1 (en) | Program recommendation system, program view terminal, program view program, program view method, program recommendation server, program recommendation program, and program recommendation method | |
US20100161441A1 (en) | Method and apparatus for advertising at the sub-asset level | |
US8875186B2 (en) | Apparatus and method of providing a recommended broadcast program | |
Sen et al. | Video skimming: Taxonomy and comprehensive survey | |
CN105786857B (zh) | 一种提高视频聚合效率的方法及系统 | |
JP4332700B2 (ja) | マルチメディアの手掛かりを利用したテレビ番組をセグメント化及びインデクス化する方法及び装置 | |
CN111711855A (zh) | 视频生成方法及装置 | |
JP2004508756A (ja) | 記憶媒体上に記憶された情報信号を再生する装置 | |
JP2008067370A (ja) | 番組推薦システム、番組視聴端末、番組視聴プログラム、番組視聴方法、番組推薦サーバ、番組推薦プログラム及び番組推薦方法 | |
US20040030694A1 (en) | Search information transmitting apparatus | |
US7640563B2 (en) | Describing media content in terms of degrees | |
CN115914674A (zh) | 智能电视影视媒资的合并方法 | |
US11336930B1 (en) | System and method for automatically identifying locations in video content for inserting advertisement breaks | |
Almeida et al. | Unsupervised manifold learning for video genre retrieval | |
CN105872586A (zh) | 一种基于实时视频流采集的视频实时识别方法 | |
CN1496524A (zh) | 处理内容数据的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |