CN108200449B - 一种相关性的计算方法及装置 - Google Patents

一种相关性的计算方法及装置 Download PDF

Info

Publication number
CN108200449B
CN108200449B CN201711478751.4A CN201711478751A CN108200449B CN 108200449 B CN108200449 B CN 108200449B CN 201711478751 A CN201711478751 A CN 201711478751A CN 108200449 B CN108200449 B CN 108200449B
Authority
CN
China
Prior art keywords
advertisement
correlation
video
candidate
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711478751.4A
Other languages
English (en)
Other versions
CN108200449A (zh
Inventor
王铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201711478751.4A priority Critical patent/CN108200449B/zh
Publication of CN108200449A publication Critical patent/CN108200449A/zh
Application granted granted Critical
Publication of CN108200449B publication Critical patent/CN108200449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2668Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供一种相关性的计算方法及装置,只需要获取视频和每个广告类别之间的相关性,以及获取每个候选广告和每个广告类别之间的相关性,即可计算得到视频与每个候选广告之间的相关性,因此只需要存储视频和每个广告类别之间的相关性以及每个候选广告和每个广告类别之间的相关性。视频和广告类别之间的相关性的总数为视频的总数乘以广告类别的总数,候选广告和广告类别之间的相关性的总数为候选广告的总数乘以广告类别的总数。通常广告类别的总数通常为数百个,需要存储的数据总量为数千万乘以数百与数十万乘以数百后的和值,此和值远远小于数千万乘以数十万的值,即本申请需要存储的数据总量远远小于现有技术中存储的数据总量,节省了存储空间。

Description

一种相关性的计算方法及装置
技术领域
本发明属于多媒体技术领域,尤其涉及一种相关性的计算方法及装置。
背景技术
随着新媒体环境的不断深化,相应的信息技术也随之进步。在信息领域内,不断扩张的用户需求促进着技术、服务等业务的快速发展。在此背景下,作为互联网热门行业的网络视频领域发展迅速。由于视频网站庞大的用户群体,越来越多的广告商已经将注意力逐渐移向视频网站。
目前,视频网站播放广告的手段是基于视频和广告之间的相关性,选择与视频相关性高的广告以插播到当前播放的视频中。当在播放一个视频时,存在多个候选广告,需要在线计算当前播放的视频与每个候选广告之间的相关性,导致不能及时响应插播广告的请求。对此,现有技术采用的技术手段是离线计算每个视频和每个广告之间的相关性,并将其存储到数据库中,当接收到插播广告的请求时,直接从数据库中查找当前播放视频与多个候选广告之间的相关性,并根据查找到的相关性确定插播的广告。
但是,由于视频网站内的视频数量很大,通常为数千万个,同时广告总量也很大,通常为数十万个,因此离线分别计算出每个视频与每个广告之间的相关性后,数据库中需要存储数千万与数十万级相乘后得到的数量的相关性数据,导致占用大量的存储空间。
发明内容
有鉴于此,本发明的目的在于提供一种相关性的计算方法及装置,用于解决现有技术中占用存储空间大的问题。
技术方案如下:
本发明提供一种相关性的计算方法,包括:
在播放视频的过程中接收到在所述视频中插播广告的请求时,
根据所述视频的标识获取所述视频与每个广告类别之间的相关性;根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
优选地,所述接收在视频中插播广告的请求之前,还包括:
分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性。
优选地,所述分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个所述广告的描述文件之后,还包括:
去除每个所述广告类别的描述文件中的无效描述词。
优选地,所述根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性后,还包括:
判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性,则获取所述候选广告的描述文件;
根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性。
优选地,所述根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性后,还包括:
比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
获取与所述相关性最大值对应的候选广告;
播放所述相关性最大值对应的候选广告。
本发明还提供一种相关性的计算装置,包括:
第一获取单元,用于在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
第二获取单元,用于根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
第一计算单元,用于根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
优选地,还包括:
第三获取单元,用于分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
第二计算单元,用于根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
第三计算单元,用于根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性。
优选地,还包括:
去除单元,用于去除每个所述广告类别的描述文件中的无效描述词。
优选地,还包括:
判断单元,用于判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性时,则调用所述第三获取单元获取所述候选广告的描述文件;
并调用所述第三计算单元根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性。
优选地,还包括:
比较单元,用于比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
第四获取单元,用于获取与所述相关性最大值对应的候选广告;
播放单元,用于播放所述相关性最大值对应的候选广告。
与现有技术相比,本发明提供的上述技术方案具有如下优点:
从上述技术方案可知,本申请中只需要获取视频和每个广告类别之间的相关性,以及获取每个候选广告和每个广告类别之间的相关性,即可计算得到视频与每个候选广告之间的相关性,因此只需要存储视频和每个广告类别之间的相关性以及每个候选广告和每个广告类别之间的相关性。视频和广告类别之间的相关性的总数为视频的总数乘以广告类别的总数,候选广告和广告类别之间的相关性的总数为候选广告的总数乘以广告类别的总数。通常广告类别的总数通常为数百个,需要存储的数据总量为数千万乘以数百与数十万乘以数百后的和值,此和值远远小于数千万乘以数十万的值,因此,本申请需要存储的数据总量远远小于现有技术中存储的数据总量,节省了存储空间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种相关性的计算方法的流程图;
图2是本发明实施例提供的另一种相关性的计算方法的流程图;
图3是本发明实施例提供的一种相关性的计算装置的结构示意图;
图4是本发明实施例提供的另一种相关性的计算装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开了一种相关性的计算方法,参见图1,该实施例包括以下步骤:
S101、在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
在视频网站内的视频中,选择一个视频,并播放此视频。其中,视频网站内的视频总量为数千万个。
在播放视频的过程中,需要在特定位置处插播与当前播放的视频相关的广告。在需要在当前播放视频的特定位置处插播广告时,会产生插播广告的请求。接收在视频中插播广告的请求。
在实际应用中,针对一个视频会产生多次插播广告的请求。即针对一个视频,会接收到多个插播广告的请求。接收到每个插播广告的请求后,都执行根据所述视频的标识获取所述视频与每个广告类别之间的相关性的操作;
广告类别为按照不同的属性对广告进行分类后的结果。
视频的标识为视频入库时分配给所述视频的用于唯一标识所述视频的标识,其中,视频入库指的是将视频添加到视频网站的视频库中。用户点击视频时,通过从视频网站的视频库中查找与之对应的视频,并播放此视频。
从存储有视频与广告类别之间相关性的存储空间处,根据当前播放的视频的标识,获取此当前播放的视频与每个广告类别之间的相关性。
具体地,按照矩阵的方式存储视频与广告类别之间的相关性。行代表视频,列代表广告类别,即行向量代表一个视频与每个广告类别之间的相关性,列向量代表一个广告类别与每个视频之间的相关性。根据当前播放的视频的标识,只需要查找到当前播放的视频所在的行,直接从矩阵中提取行所在的行向量,获得的行向量即为当前播放的视频与每个广告类别之间的相关性。
S102、根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
所述候选广告的标识为将广告添加到广告库时,分配给所述广告的用于唯一标识所述广告的标识,广告库用于存储向视频网站提供的所有广告。
提供给一个视频网站的广告总量很大,通常为数十万个。针对一个插播广告的请求,会从数十万个广告中为其选择多个候选广告,然后从多个候选广告中选择一个候选广告作为插播广告。由于候选广告为从广告库中存储的广告中选取的,因此候选广告的标识与广告的标识是相同的。
本步骤中候选广告的标识与步骤S101中视频的标识的形式可以相同,也可以不同。本实施例中并不限定标识的具体形式,只要能够实现根据视频标识唯一确定一个视频,根据候选广告的标识唯一确定一个候选广告即可。
从存储有候选广告与广告类别之间相关性的存储空间处,根据候选广告的标识,分别获取每个候选广告与每个广告类别之间的相关性。其中,本步骤中存储相关性的空间与步骤S101中存储相关性的空间可以是相同的,即将视频与广告类别之间的相关性与广告类别与广告之间的相关性都存储在一个地址下,便于获取相关性。
具体地,按照矩阵的方式存储候选广告与广告类别之间的相关性。行代表广告类别,列代表候选广告,即行向量代表一个广告类别与每个候选广告之间的相关性,列向量代表一个候选广告与每个广告类别之间的相关性。根据候选广告的标识,只需要查找到候选广告所在的列,直接从矩阵中提取列所在的列向量,获得的列向量即为一个候选广告与每个广告类别之间的相关性。
针对与一个插播广告请求对应的多个候选广告中的每一个候选广告,都按照上述方式获取到每个候选广告与广告类别之间的相关性。
需要注意的是,针对一个视频生成的不同插播广告的请求,每次提供的候选广告可能相同可能不同。无论提供的候选广告是否相同,都按照上述方式分别获取每个候选广告与广告类别之间的相关性。
本步骤中广告类别与步骤S101中的广告类别相同。
获取视频与每个广告类别之间的相关性与获取每个候选广告与每个广告类别之间的相关性的执行顺序,并不限于本实施例中公开的执行顺序。
S103、根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
获取到表示当前播放的视频与每个广告类别之间相关性的行向量,且获取到表示候选广告与每个广告类别之间相关性的列向量后,计算两个向量之间的乘积,得到的乘积即为视频与候选广告之间的相关性。
例如,广告类别为c个,那么获取到的当前播放的视频与每个广告类别之间相关性的行向量为1行c列的向量。针对每个候选广告,获取到的此候选广告与每个广告类别之间相关性的列向量为c行1列的向量,由于存在多个候选广告,因此获取到多个c行1列的向量。
在利用获取到的行向量和列向量计算视频与候选广告之间的相关性时,可以计算1行c列的向量与每个c行1列的向量的乘积,得到多个1×1的矩阵,每个矩阵为视频与一个候选广告之间的相关性。还可以将多个c行1列的向量组合成c行多列的矩阵,计算1行c列的向量与c行多列的矩阵的乘积,得到1行多列的矩阵,矩阵中每个元素代表视频与一个候选广告之间的相关性。
本步骤之后,还包括:
比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
获取与所述相关性最大值对应的候选广告;
播放所述相关性最大值对应的候选广告。
在计算出视频与每个候选广告之间的相关性后,比较各个相关性,得到相关性最大值。并获取相关性最大值对应的候选广告,并响应插播广告的请求,播放相关性最大值对应的候选广告。
可以理解的是,当相关性最大值对应多个候选广告时,即多个候选广告与视频之间的相关性相同,此时可以任意选择一个候选广告进行播放。
从上述技术方案可知,本申请中由于只需要获取视频和每个广告类别之间的相关性,以及获取每个候选广告和每个广告类别之间的相关性,即可计算得到视频与每个候选广告之间的相关性,因此只需要存储视频和每个广告类别之间的相关性以及每个候选广告和每个广告类别之间的相关性。视频和广告类别之间的相关性的总数为视频的总数乘以广告类别的总数,候选广告和广告类别之间的相关性的总数为候选广告的总数乘以广告类别的总数。通常广告类别的总数通常为数百个,需要存储的数据总量为数千万乘以数百与数十万乘以数百后的和值,此和值远远小于数千万乘以数十万的值,因此,本申请需要存储的数据总量远远小于现有技术中存储的数据总量,节省了存储空间。
本发明公开了另一种相关性的计算方法,参见图2,该实施例包括以下步骤:
S201、分别获取每个视频的描述文件、每个广告类别的描述文件和每个广告的描述文件;
视频与广告之间的相关性的计算方式有两种,第一种是基于文字的匹配策略计算视频与广告之间的相关性;第二种是基于历史点击率计算视频与广告之间的相关性。
采用基于文字的匹配策略计算视频与广告之间的相关性时,需要获取视频的文字描述与广告的文字描述,对视频的文字描述和广告的文字描述进行匹配,文字匹配率越高表明视频与广告之间的相关性越高。
采用基于历史点击率计算视频与广告之间的相关性时,需要获取此视频在播放时插播广告的点击率,插播广告的点击率越大表明视频与此插播广告之间的相关性越高。
本实施例中采用基于文字的匹配策略计算视频与广告之间的相关性。但是并不限于此。在实际应用中计算视频与广告之间的相关性时,可以任意选择上述两种方式计算相关性,且甚至可以两种方式混合在一起使用。例如,对于视频与广告之间存在点击率的,则利用点击率作为视频与广告之间的相关性;对于视频与广告之间不存在点击率的,则利用基于文字的匹配策略计算视频与广告之间的相关性。
本步骤中,分别获取视频网站内包括的所有视频的描述文件,所有广告的描述文件以及所有广告类别的描述文件。其中,广告中包括针对每个插播广告请求的候选广告。
S202、根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
基于文字的匹配策略,根据每个视频的描述文件和每个广告类别的描述文件,计算每个视频和每个广告类别之间的相关性。
进行文字匹配时,将视频的描述文件中的文字与广告类别的描述文件中的文字进行匹配。在进行文字匹配时,由于视频的描述文件和广告类型的描述文件中都存在多个虚词或跟内容无关的词,例如“的”、“地”、“和”等,文字匹配的匹配率较高,进而将相关性较低的视频和广告类别认定为相关性高,导致准确性低。
对此,在获取到每个广告类别的描述文件后,去除每个描述文件中的无效描述词,其中,无效描述词包括虚词和与内容无关的词。
根据视频的描述文件和去除无效描述词后的广告类别的描述文件,计算每个视频和每个广告类别之间的相关性。
由于广告类别的描述文件中已经将无效描述词去除,因此利用视频的描述文件与广告类别的描述文件进行文字匹配时,可以避免描述文件中存在的无效描述词对相关性的准确性产生影响。
可以理解的是,视频的描述文件也可以执行去除无效描述词的操作,只是由于视频的描述文件中包括的文字较多,且视频网站内包括的视频总量很多,导致去除视频的描述文件中的无效描述词的操作异常复杂。同时,由于广告类别的描述文件中包括的用于描述广告类别的文字较少,且广告类别的总数较少,通过去除广告类别的描述文件中的无效描述词可行性较高,并且能够避免描述文件中存在的无效描述词对相关性的准确性产生的影响,因此可以仅去除广告类别的描述文件中的无效词。
在计算出每个视频和每个广告类别之间的相关性后,将其存储在预定位置处。以便于在接收到在视频中插播广告的请求时,从预定位置处获取视频和每个广告类别之间的相关性。
S203、根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性;
根据广告的描述文件和去除无效描述词后的广告类别的描述文件,计算每个广告和每个广告类别之间的相关性。
由于广告类别的描述文件中已经将无效描述词去除,因此利用广告的描述文件与广告类别的描述文件进行文字匹配时,可以避免描述文件中存在的无效描述词对相关性的准确性产生影响。
可以理解的是,广告的描述文件也可以执行去除无效描述词的操作,只是由于广告的描述文件中包括的文字较多,且广告总量很多,导致去除广告的描述文件中的无效描述词的操作异常复杂。同时,由于广告类别的描述文件中包括的用于描述广告类别的文字较少,且广告类别的总数较少,通过去除广告类别的描述文件中的无效描述词可行性较高,并且能够避免描述文件中存在的无效描述词对相关性的准确性产生的影响,因此可以仅去除广告类别的描述文件中的无效词。
在计算出每个广告和每个广告类别之间的相关性后,将其存储在预定位置处。以便于在接收到在视频中插播广告的请求时,从预定位置处获取广告和每个广告类别之间的相关性。
S204、在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
S205、根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
本实施例中步骤S204-S205的实现方式与上一实施例中步骤S101-S102的实现方式类似,此处不再赘述。
S206、判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性,则执行S207;
判断获取到所述候选广告分别与每个所述广告类别之间的相关性,则执行S209;
在实际应用中,候选广告可能是新加入的广告。由于没有计算且存储新加入的广告与每个广告类别之间的相关性,因此不能从存储有候选广告与广告类别之间相关性的存储空间处,获取新加入的广告与每个广告类别之间的相关性。
基于此,针对每一个候选广告分别判断是否获取到此候选广告分别与每个所述广告类别之间的相关性。
获取到候选广告与每个广告类别之间的相关性,则说明此候选广告不是新加入广告库中的广告,则直接进行后续的操作。
没有获取到候选广告与每个广告类别之间的相关性,则说明此候选广告是新加入广告库中的广告,需要额外计算此新加入广告库中的广告与每个广告类别之间的相关性。
S207、获取所述候选广告的描述文件;
此步骤中获取候选广告的描述文件的方式与S201中获取每个广告的描述文件的方式相同。
S208、根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性。
此步骤中计算候选广告和每个广告类别之间的相关性的实现方式与S203中计算每个广告和每个广告类别之间的相关性的实现方式相同。
计算得到新加入广告库中的广告与每个广告类别之间的相关性后,就已经可以执行计算视频和候选广告之间相关性的操作。但是,为了便于后续能够根据候选广告的标识获取到此新加入的广告与每个广告类别之间的相关性,还需要将其存储到预定位置。
本实施例中在新加入广告时,只需要基于广告的描述文件和广告类别的描述文件,计算新加入的广告和每个广告类别之间的相关性,而从存储空间中直接获取视频与每个广告类别之间的相关性,即可根据计算得到的广告和每个广告类别之间的相关性与获取到的视频与每个广告类别之间的相关性,计算得到新加入的广告与视频之间的相关性。因此,本实施例中可以及时响应新加入的广告。
而现有技术中,由于新加入的广告并没有预先离线计算出其与每个视频之间的相关性,因此不能直接从存储空间获取到此新加入的广告与视频之间的相关性,即现有技术中不能响应新加入的广告。
S209、根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
从上述技术方案可知,本实施例中将现有技术中基于文字匹配策略,直接利用视频的描述文件和广告的描述文件,计算视频和广告之间相关性的算法,基于矩阵分解,改进为分别计算视频和广告类别之间的相关性、广告类别和广告之间的相关性。仅需要离线计算并存储每个视频和每个广告类别之间的相关性,每个广告类别和每个广告之间的相关性,在接收到插播广告的请求时,获取存储的视频和每个广告类别之间的相关性、每个广告类别和每个广告之间的相关性,并在线计算两个矩阵之间的乘积,不仅大大减少了存储空间,而且由于在线仅仅是计算矩阵的乘积,因此能够快速计算得到乘积,进而能够实现及时响应插播广告的请求。同时,在离线计算每个视频和每个广告类别之间的相关性,每个广告类别和每个广告之间的相关性时,去除了广告类别描述文件中的无效描述词,避免了描述文件中无效描述词对相关性结果产生的影响,提高了相关性结果的准确性。
明显地,本实例中通过结合离线计算和在线计算的方式实现计算视频和广告之间的相关性,相较于现有技术计算视频和广告之间相关性的方式,不仅减小了数据的存储空间,而且能够及时响应插播广告的请求,同时还能快速计算得到新加入的广告与视频之间的相关性。
对应上述相关性的计算方法,本发明还提供了一种相关性的计算装置,所述计算装置的结构示意图请参阅图3所示,本实施例中计算装置包括:
第一获取单元301、第二获取单元302和第一计算单元303;
第一获取单元301,用于在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
第二获取单元302,用于根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
第一计算单元303,用于根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
从上述技术方案可知,本实施例中由于只需要获取视频和每个广告类别之间的相关性,以及获取每个候选广告和每个广告类别之间的相关性,即可计算得到视频与每个候选广告之间的相关性,因此只需要存储视频和每个广告类别之间的相关性以及每个候选广告和每个广告类别之间的相关性。视频和广告类别之间的相关性的总数为视频的总数乘以广告类别的总数,候选广告和广告类别之间的相关性的总数为候选广告的总数乘以广告类别的总数。通常广告类别的总数通常为数百个,需要存储的数据总量为数千万乘以数百与数十万乘以数百后的和值,此和值远远小于数千万乘以数十万的值,因此,本申请需要存储的数据总量远远小于现有技术中存储的数据总量,节省了存储空间。
本发明还提供了另一种相关性的计算装置,所述计算装置的结构示意图请参阅图4所示,本实施例中计算装置在图3所示计算装置的基础上,还包括:
第三获取单元401、第二计算单元402、第三计算单元403、去除单元404、判断单元405、比较单元406、第四获取单元407和播放单元408;
第三获取单元401,用于分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
第二计算单元402,用于根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
第三计算单元403,用于根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性;
去除单元404,用于去除每个所述广告类别的描述文件中的无效描述词;
判断单元405,用于判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性时,则调用第三获取单元401获取所述候选广告的描述文件;
并调用第三计算单元403根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性;
比较单元406,用于比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
第四获取单元407,用于获取与所述相关性最大值对应的候选广告;
播放单元408,用于播放所述相关性最大值对应的候选广告。
从上述技术方案可知,本实施例中将现有技术中基于文字匹配策略,直接利用视频的描述文件和广告的描述文件,计算视频和广告之间相关性的算法,基于矩阵分解,改进为分别计算视频和广告类别之间的相关性、广告类别和广告之间的相关性。仅需要离线计算并存储每个视频和每个广告类别之间的相关性,每个广告类别和每个广告之间的相关性,在接收到插播广告的请求时,获取存储的视频和每个广告类别之间的相关性、每个广告类别和每个广告之间的相关性,并在线计算两个矩阵之间的乘积,不仅大大减少了存储空间,而且由于在线仅仅是计算矩阵的乘积,因此能够快速计算得到乘积,进而能够实现及时响应插播广告的请求。同时,在离线计算每个视频和每个广告类别之间的相关性,每个广告类别和每个广告之间的相关性时,去除了广告类别描述文件中的无效描述词,避免了描述文件中无效描述词对相关性结果产生的影响,提高了相关性结果的准确性。
明显地,本实例中通过结合离线计算和在线计算的方式实现计算视频和广告之间的相关性,相较于现有技术计算视频和广告之间相关性的方式,不仅减小了数据的存储空间,而且能够及时响应插播广告的请求,同时还能快速计算得到新加入的广告与视频之间的相关性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种相关性的计算方法,其特征在于,包括:
在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
2.根据权利要求1所述的计算方法,其特征在于,所述接收到在所述视频中插播广告的请求之前,还包括:
分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性。
3.根据权利要求2所述的计算方法,其特征在于,所述分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个所述广告的描述文件之后,还包括:
去除每个所述广告类别的描述文件中的无效描述词。
4.根据权利要求1-3任一项所述的计算方法,其特征在于,所述根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性后,还包括:
判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性,则获取所述候选广告的描述文件;
根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性。
5.根据权利要求1-3任一项所述的计算方法,其特征在于,所述根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性后,还包括:
比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
获取与所述相关性最大值对应的候选广告;
播放所述相关性最大值对应的候选广告。
6.一种相关性的计算装置,其特征在于,包括:
第一获取单元,用于在播放视频的过程中接收到在所述视频中插播广告的请求时,根据所述视频的标识获取所述视频与每个广告类别之间的相关性;
第二获取单元,用于根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
第一计算单元,用于根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
7.根据权利要求6所述的计算装置,其特征在于,还包括:
第三获取单元,用于分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
第二计算单元,用于根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
第三计算单元,用于根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性。
8.根据权利要求7所述的计算装置,其特征在于,还包括:
去除单元,用于去除每个所述广告类别的描述文件中的无效描述词。
9.根据权利要求7或8所述的计算装置,其特征在于,还包括:
判断单元,用于判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
判断没有获取到所述候选广告分别与每个所述广告类别之间的相关性时,则调用所述第三获取单元获取所述候选广告的描述文件;
并调用所述第三计算单元根据所述候选广告的描述文件和所述广告类别的描述文件,分别计算并存储所述候选广告和每个所述广告类别之间的相关性。
10.根据权利要求6-8任一项所述的计算装置,其特征在于,还包括:
比较单元,用于比较所述视频与每个所述候选广告之间的相关性,获得相关性最大值;
第四获取单元,用于获取与所述相关性最大值对应的候选广告;
播放单元,用于播放所述相关性最大值对应的候选广告。
CN201711478751.4A 2017-12-29 2017-12-29 一种相关性的计算方法及装置 Active CN108200449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711478751.4A CN108200449B (zh) 2017-12-29 2017-12-29 一种相关性的计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711478751.4A CN108200449B (zh) 2017-12-29 2017-12-29 一种相关性的计算方法及装置

Publications (2)

Publication Number Publication Date
CN108200449A CN108200449A (zh) 2018-06-22
CN108200449B true CN108200449B (zh) 2020-10-23

Family

ID=62586613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711478751.4A Active CN108200449B (zh) 2017-12-29 2017-12-29 一种相关性的计算方法及装置

Country Status (1)

Country Link
CN (1) CN108200449B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581430A (zh) * 2013-10-21 2015-04-29 华为技术有限公司 视频播放中的广告插播方法和设备
CN105408928A (zh) * 2013-03-15 2016-03-16 万歌有限公司 用于确定装置的广告类别的相关性的方法和系统
CN107507046A (zh) * 2017-10-13 2017-12-22 北京奇艺世纪科技有限公司 广告召回的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9013553B2 (en) * 2011-08-31 2015-04-21 Rocks International Group Pte Ltd. Virtual advertising platform

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105408928A (zh) * 2013-03-15 2016-03-16 万歌有限公司 用于确定装置的广告类别的相关性的方法和系统
CN104581430A (zh) * 2013-10-21 2015-04-29 华为技术有限公司 视频播放中的广告插播方法和设备
CN107507046A (zh) * 2017-10-13 2017-12-22 北京奇艺世纪科技有限公司 广告召回的方法及系统

Also Published As

Publication number Publication date
CN108200449A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN106649316B (zh) 一种视频推送方法及装置
CN107657048B (zh) 用户识别方法及装置
US8209318B2 (en) Product searching system and method using search logic according to each category
CN106033415B (zh) 文本内容推荐方法及装置
JP2021122117A (ja) 自動コンテンツ認識のための広告フレームのフラッギング
CN106951571B (zh) 一种给应用标注标签的方法和装置
CN110852793A (zh) 文案推荐方法及装置、电子设备
CN107491979B (zh) 一种广告库存的分配方法和装置
CN104639958A (zh) 广告投放方法和系统
CN107291755B (zh) 一种终端推送方法及装置
CN112184290A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN111586474A (zh) 直播视频处理方法及装置
CN105630792B (zh) 一种信息显示、推送方法及装置
KR20120024772A (ko) 동영상 관련 광고를 제공하는 방법 및 그 장치
US8290925B1 (en) Locating product references in content pages
CN105373608A (zh) 一种基于输入法的场景式内容推送方法及其系统
JP5265659B2 (ja) 広告情報提供装置
CN110674345A (zh) 一种视频搜索方法、装置及服务器
CN104899306A (zh) 信息处理方法、信息显示方法及装置
CN114610951A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN106033455B (zh) 一种处理用户操作信息的方法与设备
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
CN111737517A (zh) 一种基于短视频的即时推荐方法及系统
CN108200449B (zh) 一种相关性的计算方法及装置
CN112822513A (zh) 基于视频内容的广告投放展示方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant