CN116761037B - 视频植入多媒体信息的方法、装置、设备及介质 - Google Patents
视频植入多媒体信息的方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116761037B CN116761037B CN202311064613.7A CN202311064613A CN116761037B CN 116761037 B CN116761037 B CN 116761037B CN 202311064613 A CN202311064613 A CN 202311064613A CN 116761037 B CN116761037 B CN 116761037B
- Authority
- CN
- China
- Prior art keywords
- multimedia
- target
- video frame
- target object
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000002513 implantation Methods 0.000 title claims abstract description 22
- 239000000463 material Substances 0.000 claims abstract description 485
- 238000009877 rendering Methods 0.000 claims abstract description 22
- 239000013077 target material Substances 0.000 claims description 26
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 239000012925 reference material Substances 0.000 claims description 10
- 239000010421 standard material Substances 0.000 claims description 10
- 238000004883 computer application Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 239000002453 shampoo Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000283966 Pholidota <mammal> Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44012—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44016—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及计算机应用技术领域,提供一种视频植入多媒体信息的方法、装置、设备及存储介质,该方法包括:获取多媒体素材集和视频帧画面集;针对视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别视频帧画面中是否存在至少一个目标对象;在确定视频帧画面中存在至少一个目标对象的情况下,从多媒体素材集中确定与各个目标对象相匹配的目标多媒体素材;针对各个目标对象,确定目标对象在视频帧画面中的像素区域,并基于像素区域将相应的目标多媒体素材渲染至视频帧画面。由此,针对视频帧画面智能分配多媒体素材,无需人工匹配素材,并根据视频帧画面中目标对象的位置相应展示多媒体素材,提高了多媒体素材展示过程的趣味性。
Description
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种视频植入多媒体信息的方法、装置、设备及介质。
背景技术
随着计算机、互联网等技术的日益发展,视频内容的应用也日益广泛,各类视频应用层出不穷。面对巨大的视频类应用市场,在视频内容播放时的多媒体信息(例如用于广告的图像)投入方式也应运而生。
传统视频多媒体信息的植入方法一般需要人工预先选定视频画面中的多媒体信息的植入区域,并通过人工判图筛选来匹配静态广告,实现在画面的固定区域来播放广告。但是,此类广告人工植入的方式不够智能化,并且在视频画面的固定区域展示广告,容易出现广告遮挡画面中重要信息的情况,影响观众的观看体验。
针对上述问题,目前业界暂未提出较佳的解决方案。
发明内容
本发明提供一种视频植入多媒体信息的方法、装置、终端设备及存储介质,用以至少解决现有技术中广告人工植入不够智能化且固定的广告展示区域影响用户的正常画面观看的缺陷。
本发明提供一种视频植入多媒体信息的方法,所述方法包括:获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
根据本发明实施例提供的一种视频植入多媒体信息的方法,所述基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面,包括:在确定第一视频帧画面所对应的第一像素区域与第二视频帧画面所对应的第二像素区域重合的情况下,提取所述第一像素区域的边界轮廓中的第一顶点和第二顶点,所述第一顶点和所述第二顶点为所述区域边界轮廓中相邻的顶点;所述第一视频帧画面和所述第二视频帧画面是所述视频中相邻的视频帧画面;将所述相应的目标多媒体素材在所述第一顶点处渲染至所述第一视频帧画面,以及将所述相应的目标多媒体素材在所述第二顶点处渲染至所述第二视频帧画面。
根据本发明实施例提供的一种视频植入多媒体信息的方法,所述基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面,包括:确定所述目标多媒体素材所对应的目标素材文件格式;根据预设的素材呈现关联表,确定与所述目标素材文件格式匹配的目标素材呈现方式;所述素材呈现关联表包含多个素材呈现关系,且每一所述素材呈现关系分别定义了在素材文件格式与素材呈现方式之间的关系;基于所述目标素材呈现方式和与所述目标对象匹配的所述目标多媒体素材,将所述目标多媒体素材渲染至所述视频帧画面。
根据本发明实施例提供的一种视频植入多媒体信息的方法,所述素材呈现关联表包含AR素材呈现关系和动画素材呈现关系,所述AR素材呈现关系定义了在AR素材文件格式与AR素材呈现方式之间的关系,所述动画素材呈现关系定义了在动画素材文件格式与动画素材呈现方式之间的关系,其中,所述基于所述目标素材呈现方式和与所述目标对象匹配的所述目标多媒体素材,对所述视频帧画面中的所述目标对象进行渲染,包括:当所述目标素材呈现方式为AR素材呈现方式时,根据所述目标多媒体素材生成相应的AR模型,并基于所述像素区域将所述AR模型叠加至所述视频帧画面;当所述目标素材呈现方式为动画素材文件格式时,基于所述像素区域将所述目标多媒体素材叠加至所述视频帧画面。
根据本发明实施例提供的一种视频植入多媒体信息的方法,所述根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材,包括:基于预设的素材对象属性关联表,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;所述素材对象属性关联表包含多个预设的素材对象属性关系,且每一所述素材对象属性关系分别定义了在对象属性与素材属性之间的关系。
根据本发明实施例提供的一种视频植入多媒体信息的方法,所述根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材,包括:获取各个所述多媒体素材的素材属性,并根据各个所述素材属性确定分别相对于第一目标对象的对象属性的匹配权重设置;所述第一目标对象为待评估是否进行素材植入操作的目标对象;所述素材属性包括素材场景、素材投放收益、素材风格和素材最佳呈现尺寸,以及所述对象属性分别包含所述第一目标对象所对应的画面场景、视频业务类型、对象风格和所述像素区域;以及,所述匹配权重设置包含素材场景匹配权重、素材投放收益匹配权重/>、素材风格匹配权重/>和素材最佳呈现尺寸匹配权重/>;其中,i表示各个所述多媒体素材的素材标识信息;基于预设的投放指标评估公式,确定各个所述多媒体素材相对于所述第一目标对象的投放指标评估值/>,
其中,分别表示各个所述多媒体素材的素材场景匹配权重、素材投放收益匹配权重、素材风格匹配权重和素材最佳呈现尺寸匹配权重所对应的投放占比因子;将所述各个多媒体素材中对应投放指标评估值/>的最大值的多媒体素材,确定为与所述第一目标对象的相匹配的目标多媒体素材。
根据本发明实施例提供的一种视频植入多媒体信息的方法,述确定所述素材属性针对待评估是否进行素材植入操作的第一目标对象的匹配权重设置,包括:通过以下方式来确定所述素材属性针对所述第一目标对象的素材场景匹配权重:
其中,分别表示为设定的素材业务分类、素材投放人群年龄段和素材投放人群性别对应的占比权重,/>分别表示为第i个多媒体素材相对于所述第一目标对象的素材业务影响率、参考素材业务影响率和标准素材业务影响率,/>分别表示为素材投放人群性别影响率、参考性别影响率,/>中t=0和1分别表示男和女,/>分别表示为第i个多媒体素材对应的素材投放人群年龄段影响率和参考素材投放人群年龄段影响率;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材投放收益匹配权重:
其中,分别表示为设定的素材曝光收益、素材点击收益和素材投放平台等级对应的占比权重,/>表示标准素材点击收益差值,/>分别表示为第i个多媒体素材对应的素材投放平台等级影响率、参考素材投放平台等级影响率和标准素材投放平台等级影响率;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材风格匹配权重:
其中,分别表示为设定的素材色值、素材亮度和素材色彩饱和度对应的占比权重;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材最佳呈现尺寸匹配权重:
其中,分别表示为设定的素材占用容量、素材文件格式、素材格式类型和素材展示方向。
本发明还提供一种视频植入多媒体信息的装置,所述装置包括:获取单元,用于获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;识别单元,用于针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;确定单元,用于在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;植入单元,用于针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
本发明还提供一种终端设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述任一种所述的视频植入多媒体信息的方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一种所述的视频植入多媒体信息的方法的步骤。
本发明提供的视频植入多媒体信息方法、终端设备及存储介质,在收到待植入的多媒体素材集和待处理的视频时,识别各个视频帧画面中是否存在适于植入多媒体素材的至少一个目标对象,继而通过分析目标对象的对象属性和各个素材的素材属性,以得到相匹配的目标多媒体素材,由此实现了针对视频帧画面智能分配相应的多媒体素材,无需人工匹配素材,节约了人力操作成本。进一步地,确定目标对象在视频帧画面中的像素区域,并对应此像素区域将目标多媒体素材渲染至视频帧画面中,由此依据视频帧画面中目标对象的位置和数量的不同,相应地调整所展示的多媒体素材的位置和数量,实现了在视频帧画面中对多媒体素材的动态展示,增强了多媒体素材展示效果,且针对目标对象的多媒体素材展示过程不会遮挡画面中的重要信息,且提高了多媒体素材展示过程的趣味性,使得视频能够提供较佳的用户观看体验。
附图说明
为了更清楚地说明本发明或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明实施例的视频植入多媒体信息的方法的一示例的流程图;
图2示出了根据图1中的S140的一示例的操作流程图;
图3示出了根据图1中的S140的另一示例的操作流程图;
图4示出了根据图1中的S130的一示例的操作流程图;
图5示出了根据本发明实施例的视频植入多媒体信息的装置的一示例的结构框图;
图6是本发明提供的终端设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了根据本发明实施例的视频植入多媒体信息的方法的一示例的流程图。
关于本发明实施例方法的执行主体,其可以是任意具有计算或处理能力的控制器或处理器,以实现在视频中植入多媒体信息或多媒体素材的目标。在一些示例中,其可以是通过软件、硬件或软硬件结合的方式被集成配置在终端设备中,并且终端设备的类型可以是多样化的,例如台式机、笔记本电脑、智能手机等等,在此应不加限制。
如图1所示,在步骤S110中,获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集。
这里,视频帧画面集包含至少一个视频帧画面,例如通过对待处理的视频在不同时刻的帧分别进行解析提取,以得到相应的视频帧画面集。此外,多媒体素材集包含至少一个多媒体素材,多媒体素材可以表示广告素材或其他业务素材,在此应不作限制。另外,每一多媒体素材分别具有相应的素材属性,例如素材大小、素材业务类型、素材颜色等等。
在一些实施方式中,通过与第三方素材平台进行数据交互,以得到多媒体素材集。示例性地,通过与广告素材投放平台(例如,广点通、穿山甲,等等)进行数据交互,以采集待投放的广告素材集,例如通过广告竞价方式而获得的。
在步骤S120中,针对视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别视频帧画面中是否存在至少一个目标对象。
这里,对象识别模型用于对预设对象集中各个预设对象进行识别,且每一预设对象分别具有相应的对象属性。示例性地,对象识别模型可以采用深度学习网络,以通过数据样本集完成模型训练操作,数据样本集中的各个训练样本包含图像样本和相应的标签,标签值为对应预设对象集中特定对象的对象信息。
在一些实施方式中,预设对象集中的各个预设对象可以是预先设定的不会对视频帧画面的重要信息展示产生影响的对象类型。举例来说,预设对象可以是各类商品对象,其不会对影视剧视频中的重要信息(例如,人物)造成遮挡。
在步骤S130中,在确定视频帧画面中存在至少一个目标对象的情况下,根据各个素材属性和各个对象属性,从多媒体素材集中确定与各个目标对象相匹配的目标多媒体素材。
另一方面,在识别到视频帧画面中不存在任意一个目标对象的情况下,则不向此视频帧画面添加多媒体素材,能够定向添加多媒体素材至相应的视频帧画面,实现了多媒体素材在视频中的动态呈现效果。
在一些实施方式中,将多媒体素材集中的各个多媒体素材的素材属性分别与待评估的目标对象的对象属性进行分析匹配,以保障目标对象与多媒体素材之间的高匹配度。结合业务应用场景来说,当识别到视频帧画面中存在浴缸时,可以从洗发水相关素材、汽车相关素材和数码相关素材中确定相匹配的洗发水相关素材。
在步骤S140中,针对各个目标对象,确定目标对象在视频帧画面中的像素区域,并基于像素区域将相应的目标多媒体素材渲染至视频帧画面。
在一些实施方式中,从视频帧画面中提取目标对象所对应的像素区域,例如通过调用预设的抠图工具来进行提取,继而根据像素区域在视频帧画面中的坐标位置,将目标多媒体素材按照相应的坐标位置进行渲染。结合业务应用场景来说,当识别到视频帧画面中存在浴缸时,提取视频帧画面中的浴缸区域,进而将洗发水相关素材渲染至浴缸区域,使得广告植入不会破坏原始视频画面的场景信息,实现广告素材对用户的无感知的植入,且提高了广告效果。
进一步地,视频画面帧随着播放时刻而更新,不同的目标对象会分别适配相应的多媒体素材,使得了多媒体素材在视频的不同播放时刻能够自动在所匹配的目标对象的像素区域处出现和消失,实现了所植入的多媒体素材在视频中的动态更新效果。
图2示出了根据图1中的S140的一示例的操作流程图。
如图2所示,在步骤S210中,在确定第一视频帧画面所对应的第一像素区域与第二视频帧画面所对应的第二像素区域重合的情况下,提取第一像素区域的边界轮廓中的第一顶点和第二顶点。
这里,第一顶点和第二顶点为区域边界轮廓中相邻的顶点,第一视频帧画面和第二视频帧画面是视频中相邻的视频帧画面。
在步骤S220中,将相应的目标多媒体素材在第一顶点处渲染至第一视频帧画面,以及将相应的目标多媒体素材在第二顶点处渲染至第二视频帧画面。
在本发明实施例中,将连续的多个视频帧画面中的目标对象所处的像素区域进行对比,并在识别到像素区域重合的情况下,说明目标对象在连续的视频帧画面中并未发生变化。此时,通过提取像素区域的边界轮廓中相邻的顶点位置,并依次在连续的视频帧画面中使用不同的顶点位置对目标多媒体素材进行渲染,使得多媒体素材在连续视频帧画面中能够呈现出的动态位移效果,由此相比较于静态呈现,使得用户更容易关注到多媒体素材,提高了多媒体素材的呈现效果。
在本发明实施例的一些示例中,当检测到相邻的第一视频帧画面和第二视频帧画面中针对目标对象的像素区域存在畸变时,则通过提取更多的顶点(例如,4个)来共同完成针对畸变像素区域的对齐操作。具体地,如果第一像素区域为曲面区域,则需要在曲面区域的4个顶点的内部按照一定的间隔填充变形点,通过组合这些变形点,形成与曲面区域对齐的第一像素区域。
图3示出了根据图1中的S140的另一示例的操作流程图。
如图3所示,在步骤S310中,确定目标多媒体素材所对应的目标素材文件格式。
在步骤S320中,根据预设的素材呈现关联表,确定与目标素材文件格式匹配的目标素材呈现方式。
这里,素材呈现关联表包含多个素材呈现关系,且每一素材呈现关系分别定义了在素材文件格式与素材呈现方式之间的关系。
在步骤S330中,基于目标素材呈现方式和与目标对象匹配的所述目标多媒体素材,将目标多媒体素材渲染至视频帧画面。
在本发明实施例中,在将目标素材植入至视频帧画面前,解析目标素材所对应的目标素材文件格式,确定目标素材文件格式所适用的素材呈现方式,继而按照目标素材呈现方式将目标多媒体素材渲染至视频帧画面中,由此,实现了视频所能够植入的多媒体素材的多样化类型。
在本发明实施例的一些示例中,素材呈现关联表包含AR素材呈现关系和动画素材呈现关系,AR素材呈现关系定义了在AR素材文件格式与AR素材呈现方式之间的关系,动画素材呈现关系定义了在动画素材文件格式与动画素材呈现方式之间的关系。继而,当目标素材呈现方式为AR素材呈现方式时,根据目标多媒体素材生成相应的AR模型,并基于像素区域将AR模型叠加至视频帧画面。示例性地,通过预设的AR模型构建模块对目标多媒体素材进行解析,以生成相应的AR模型。另外,当目标素材呈现方式为动画素材文件格式时,基于像素区域将目标多媒体素材叠加至视频帧画面。由此,视频素材植入系统能够支持对AR素材和普通平面素材的植入,使得视频具有较强的素材兼容性。
在一些实施方式中,AR素材是将2D素材或3D素材通过类AR的植入技术来进行呈现的。具体地,获取待处理的视频所对应的摄像机反求数据和场景重建的点位数据,其均是用于表达视频画面中各个物体的三维数据。进而,依据摄像机反求数据和场景重建的点位数据,将AR素材设置到视频帧画面中指定的空间位置,例如通过深度遮挡关系覆盖到某个对象的位置,并当通过摄像机反求数据渲染覆盖在视频帧画面中。
关于上述图1中的步骤S130,在一些实施方式中,基于预设的素材对象属性关联表,根据各个素材属性和各个对象属性,从多媒体素材集中确定与各个目标对象相匹配的目标多媒体素材。这里,素材对象属性关联表包含多个预设的素材对象属性关系,且每一素材对象属性关系分别定义了在对象属性与素材属性之间的关系。由此,通过预先设置素材属性和对象属性之间的关联性,例如“洗发水素材-浴缸对象”、“电视机素材-客厅对象”等等,有效保障了多媒体素材与对象之间的高匹配度。
应理解的是,对象属性和素材属性的类型是多样化的,导致在制定素材对象属性关系时需要花费较大的人力工作量。
鉴于此,图4示出了根据图1中的S130的一示例的操作流程图。
如图4所示,在步骤S410中,获取各个多媒体素材的素材属性,并根据各个素材属性确定分别相对于第一目标对象的对象属性的匹配权重设置。
这里,第一目标对象为待评估是否进行素材植入操作的目标对象。素材属性包括素材场景、素材投放收益、素材风格和素材最佳呈现尺寸,以及对象属性分别包含第一目标对象所对应的画面场景、视频业务类型、对象风格和像素区域;以及,匹配权重设置包含素材场景匹配权重、素材投放收益匹配权重/>、素材风格匹配权重/>和素材最佳呈现尺寸匹配权重/>;其中,i表示各个多媒体素材的素材标识信息。
在步骤S420中,基于预设的投放指标评估公式,确定各个多媒体素材相对于第一目标对象的投放指标评估值。
公式(1)
其中,分别表示各个多媒体素材的素材场景匹配权重、素材投放收益匹配权重、素材风格匹配权重和素材最佳呈现尺寸匹配权重所对应的投放占比因子。
在步骤S430中,将各个多媒体素材中对应投放指标评估值的最大值的多媒体素材,确定为与第一目标对象的相匹配的目标多媒体素材。
通过本发明实施例,基于素材属性构建针对目标对象的投放指标评估算法模型,利用此算法模型对在素材与目标对象之间在场景、投放收益、风格和呈现尺寸多个方面的匹配度进行全面综合分析,以得到各个多媒体素材分别相对于目标对象的投放指标评估值,从而筛选出最适宜进行视频植入的目标多媒体素材,由此智能筛选、匹配目标对象和多媒体素材,在保障为对象所确定的多媒体素材的高匹配度的前提下,还降低了人工制定属性关系的操作成本。
关于上述步骤S410,具体地,在本发明实施例的一些示例中,通过以下方式来确定素材属性针对第一目标对象的素材场景匹配权重:
公式(2)
其中,分别表示为设定的素材业务分类、素材投放人群年龄段和素材投放人群性别对应的占比权重,/>分别表示为第i个多媒体素材相对于第一目标对象的素材业务影响率、参考素材业务影响率和标准素材业务影响率,/>分别表示为素材投放人群性别影响率、参考性别影响率,/>中t=0和1分别表示男和女,/>分别表示为第i个多媒体素材对应的素材投放人群年龄段影响率和参考素材投放人群年龄段影响率。
这里,素材业务分类可以是根据素材的所属业务类型来确定的,例如当素材中包含玩具信息时,可以确定素材业务分类为儿童玩具。另外,素材投放人群年龄段可以表示素材所对应的投放用户群体的用户年龄段,而素材投放人群性别可以表示素材所对应的投放用户群体的用户性别。
由此,通过预设的第一权重算法模型,综合考量待投放的多媒体素材所对应的素材业务分类、素材投放人群年龄段和素材投放人群性别,保障所确定的素材场景匹配权重能够精准匹配目标对象与多媒体素材之间的场景关联关系,以确保投放素材与目标对象之间的场景信息保持一致。
通过以下方式来确定素材属性针对第一目标对象的素材投放收益匹配权重:
公式(3)
其中,分别表示为设定的素材曝光收益、素材点击收益和素材投放平台等级对应的占比权重,/>表示标准素材点击收益差值,/>分别表示为第i个多媒体素材对应的素材投放平台等级影响率、参考素材投放平台等级影响率和标准素材投放平台等级影响率。由此,通过预设的第二权重算法模型,综合考量待投放的多媒体素材所对应的素材投放平台等级影响率、参考素材投放平台等级影响率和标准素材投放平台等级影响率,保障所确定的素材投放收益匹配权重能够精准匹配目标对象与多媒体素材之间的投放收益关联关系,以确保目标素材的投放能够产生较佳的收益。
在一些实施方式中,素材投放平台等级可以是根据预设的投放平台分级表来确定的,其中投放平台分级表包含了多个投放平台标识信息和相应的素材投放平台等级。由此,在收到投放平台信息时,能够通过查询投放平台分级表,便能够确定相应的素材投放平台等级,例如对广告素材所来源的广告投放平台进行分级。
通过以下方式来确定素材属性针对第一目标对象的素材风格匹配权重:
公式(4)
其中,分别表示为设定的素材色值、素材亮度和素材色彩饱和度对应的占比权重。由此,通过预设的第三权重算法模型,综合考量待投放的多媒体素材所对应的素材色值、素材亮度和素材色彩饱和度,保障所确定的素材风格匹配权重能够精准匹配目标对象与多媒体素材之间的风格关联关系,以确保投放素材与目标对象之间的风格保持一致。
通过以下方式来确定素材属性针对第一目标对象的素材最佳呈现尺寸匹配权重:
公式(5)
其中,分别表示为设定的素材占用容量、素材文件格式、素材格式类型和素材展示方向。由此,通过预设的第四权重算法模型,综合考量待投放的多媒体素材所对应的素材占用容量、素材文件格式、素材格式类型和素材展示方向,保障所确定的素材最佳呈现尺寸匹配权重能够精准匹配目标对象与多媒体素材之间的呈现尺寸关联关系,以确保投放素材在目标对象上能够产生较佳的呈现效果。
下面对本发明提供的视频植入多媒体信息的装置进行描述,下文描述的视频植入多媒体信息的装置与上文描述的视频植入多媒体信息的方法可相互对应参照。
图5示出了根据本发明实施例的视频植入多媒体信息的装置的一示例的结构框图。
如图5所示,视频植入多媒体信息的装置500包括获取单元510、识别单元520、确定单元530和植入单元540。
获取单元510用于获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面。
识别单元520用于针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性。
确定单元530用于在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材。
植入单元540用于针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
图6示例了一种终端设备的实体结构示意图,如图6所示,该终端设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行视频植入多媒体信息的方法,该方法包括:获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的视频植入多媒体信息的方法,该方法包括:获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的视频植入多媒体信息的方法,该方法包括:获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种视频植入多媒体信息的方法,其特征在于,所述方法包括:
获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;
针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;
在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;
针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面;
所述根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材,包括:
获取各个所述多媒体素材的素材属性,并根据各个所述素材属性确定分别相对于第一目标对象的对象属性的匹配权重设置;所述第一目标对象为待评估是否进行素材植入操作的目标对象;所述素材属性包括素材场景、素材投放收益、素材风格和素材最佳呈现尺寸,以及所述对象属性分别包含所述第一目标对象所对应的画面场景、视频业务类型、对象风格和所述像素区域;以及,所述匹配权重设置包含素材场景匹配权重、素材投放收益匹配权重/>、素材风格匹配权重/>和素材最佳呈现尺寸匹配权重/>;其中,i表示各个所述多媒体素材的素材标识信息;
基于预设的投放指标评估公式,确定各个所述多媒体素材相对于所述第一目标对象的投放指标评估值,
其中,分别表示各个所述多媒体素材的素材场景匹配权重、素材投放收益匹配权重、素材风格匹配权重和素材最佳呈现尺寸匹配权重所对应的投放占比因子;
将所述各个多媒体素材中对应投放指标评估值的最大值的多媒体素材,确定为与所述第一目标对象的相匹配的目标多媒体素材。
2.根据权利要求1所述视频植入多媒体信息的方法,其特征在于,所述基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面,包括:
在确定第一视频帧画面所对应的第一像素区域与第二视频帧画面所对应的第二像素区域重合的情况下,提取所述第一像素区域的边界轮廓中的第一顶点和第二顶点,所述第一顶点和所述第二顶点为所述区域边界轮廓中相邻的顶点;所述第一视频帧画面和所述第二视频帧画面是所述视频中相邻的视频帧画面;
将所述相应的目标多媒体素材在所述第一顶点处渲染至所述第一视频帧画面,以及将所述相应的目标多媒体素材在所述第二顶点处渲染至所述第二视频帧画面。
3.根据权利要求1所述视频植入多媒体信息的方法,其特征在于,所述基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面,包括:
确定所述目标多媒体素材所对应的目标素材文件格式;
根据预设的素材呈现关联表,确定与所述目标素材文件格式匹配的目标素材呈现方式;所述素材呈现关联表包含多个素材呈现关系,且每一所述素材呈现关系分别定义了在素材文件格式与素材呈现方式之间的关系;
基于所述目标素材呈现方式和与所述目标对象匹配的所述目标多媒体素材,将所述目标多媒体素材渲染至所述视频帧画面。
4.根据权利要求3所述视频植入多媒体信息的方法,其特征在于,所述素材呈现关联表包含AR素材呈现关系和动画素材呈现关系,所述AR素材呈现关系定义了在AR素材文件格式与AR素材呈现方式之间的关系,所述动画素材呈现关系定义了在动画素材文件格式与动画素材呈现方式之间的关系,
其中,所述基于所述目标素材呈现方式和与所述目标对象匹配的所述目标多媒体素材,对所述视频帧画面中的所述目标对象进行渲染,包括:
当所述目标素材呈现方式为AR素材呈现方式时,根据所述目标多媒体素材生成相应的AR模型,并基于所述像素区域将所述AR模型叠加至所述视频帧画面;
当所述目标素材呈现方式为动画素材文件格式时,基于所述像素区域将所述目标多媒体素材叠加至所述视频帧画面。
5.根据权利要求1所述视频植入多媒体信息的方法,其特征在于,所述根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材,包括:
基于预设的素材对象属性关联表,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;所述素材对象属性关联表包含多个预设的素材对象属性关系,且每一所述素材对象属性关系分别定义了在对象属性与素材属性之间的关系。
6.根据权利要求1所述视频植入多媒体信息的方法,其特征在于,所述确定所述素材属性针对待评估是否进行素材植入操作的第一目标对象的匹配权重设置,包括:
通过以下方式来确定所述素材属性针对所述第一目标对象的素材场景匹配权重:
其中,分别表示为设定的素材业务分类、素材投放人群年龄段和素材投放人群性别对应的占比权重,/>分别表示为第i个多媒体素材相对于所述第一目标对象的素材业务影响率、参考素材业务影响率和标准素材业务影响率,/>分别表示为素材投放人群性别影响率、参考性别影响率,/>中t=0和1分别表示男和女,/>分别表示为第i个多媒体素材对应的素材投放人群年龄段影响率和参考素材投放人群年龄段影响率;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材投放收益匹配权重:
其中,分别表示为设定的素材曝光收益、素材点击收益和素材投放平台等级对应的占比权重,/>表示标准素材点击收益差值,/>分别表示为第i个多媒体素材对应的素材投放平台等级影响率、参考素材投放平台等级影响率和标准素材投放平台等级影响率;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材风格匹配权重:
其中,分别表示为设定的素材色值、素材亮度和素材色彩饱和度对应的占比权重;
通过以下方式来确定所述素材属性针对所述第一目标对象的素材最佳呈现尺寸匹配权重:
其中,分别表示为设定的素材占用容量、素材文件格式、素材格式类型和素材展示方向。
7.一种视频植入多媒体信息的装置,其特征在于,所述装置包括:
获取单元,用于获取待植入的多媒体素材集和待处理的视频所对应的视频帧画面集;所述多媒体素材集包含至少一个多媒体素材,且每一所述多媒体素材分别具有相应的素材属性;所述视频帧画面集包含至少一个视频帧画面;
识别单元,用于针对所述视频帧画面集中的各个视频帧画面,基于预设的对象识别模型识别所述视频帧画面中是否存在至少一个目标对象;所述对象识别模型用于对预设对象集中各个预设对象进行识别,且每一所述预设对象分别具有相应的对象属性;
确定单元,用于在确定所述视频帧画面中存在所述至少一个目标对象的情况下,根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材;
植入单元,用于针对各个所述目标对象,确定所述目标对象在所述视频帧画面中的像素区域,并基于所述像素区域将相应的所述目标多媒体素材渲染至所述视频帧画面;
所述根据各个所述素材属性和各个所述对象属性,从所述多媒体素材集中确定与各个所述目标对象相匹配的目标多媒体素材,包括:
获取各个所述多媒体素材的素材属性,并根据各个所述素材属性确定分别相对于第一目标对象的对象属性的匹配权重设置;所述第一目标对象为待评估是否进行素材植入操作的目标对象;所述素材属性包括素材场景、素材投放收益、素材风格和素材最佳呈现尺寸,以及所述对象属性分别包含所述第一目标对象所对应的画面场景、视频业务类型、对象风格和所述像素区域;以及,所述匹配权重设置包含素材场景匹配权重、素材投放收益匹配权重/>、素材风格匹配权重/>和素材最佳呈现尺寸匹配权重/>;其中,i表示各个所述多媒体素材的素材标识信息;
基于预设的投放指标评估公式,确定各个所述多媒体素材相对于所述第一目标对象的投放指标评估值,
其中,分别表示各个所述多媒体素材的素材场景匹配权重、素材投放收益匹配权重、素材风格匹配权重和素材最佳呈现尺寸匹配权重所对应的投放占比因子;
将所述各个多媒体素材中对应投放指标评估值的最大值的多媒体素材,确定为与所述第一目标对象的相匹配的目标多媒体素材。
8.一种终端设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述视频植入多媒体信息的方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述视频植入多媒体信息的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311064613.7A CN116761037B (zh) | 2023-08-23 | 2023-08-23 | 视频植入多媒体信息的方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311064613.7A CN116761037B (zh) | 2023-08-23 | 2023-08-23 | 视频植入多媒体信息的方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116761037A CN116761037A (zh) | 2023-09-15 |
CN116761037B true CN116761037B (zh) | 2023-11-03 |
Family
ID=87961398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311064613.7A Active CN116761037B (zh) | 2023-08-23 | 2023-08-23 | 视频植入多媒体信息的方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116761037B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116962817B (zh) * | 2023-09-21 | 2023-12-08 | 世优(北京)科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458820A (zh) * | 2019-08-06 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 一种多媒体信息植入方法、装置、设备及存储介质 |
CN111556337A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种媒体内容植入方法、模型训练方法以及相关装置 |
CN111709762A (zh) * | 2020-06-09 | 2020-09-25 | 上海极链网络科技有限公司 | 信息匹配度的评估方法、装置、设备及存储介质 |
CN112153483A (zh) * | 2019-06-28 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 信息植入区域的检测方法、装置及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9111287B2 (en) * | 2009-09-30 | 2015-08-18 | Microsoft Technology Licensing, Llc | Video content-aware advertisement placement |
US9467750B2 (en) * | 2013-05-31 | 2016-10-11 | Adobe Systems Incorporated | Placing unobtrusive overlays in video content |
CN110163640B (zh) * | 2018-02-12 | 2023-12-08 | 华为技术有限公司 | 一种在视频中植入广告的方法及计算机设备 |
CN111741327B (zh) * | 2019-03-25 | 2022-09-02 | 华为技术有限公司 | 一种媒体处理方法及媒体服务器 |
-
2023
- 2023-08-23 CN CN202311064613.7A patent/CN116761037B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112153483A (zh) * | 2019-06-28 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 信息植入区域的检测方法、装置及电子设备 |
CN110458820A (zh) * | 2019-08-06 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 一种多媒体信息植入方法、装置、设备及存储介质 |
CN111556337A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种媒体内容植入方法、模型训练方法以及相关装置 |
CN111709762A (zh) * | 2020-06-09 | 2020-09-25 | 上海极链网络科技有限公司 | 信息匹配度的评估方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116761037A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9432703B2 (en) | Method and system for inserting contents into video presentations | |
CN108322788B (zh) | 一种视频直播中的广告展示方法及装置 | |
CN107911753B (zh) | 用于在视频中添加数字水印的方法和装置 | |
CN106682632B (zh) | 用于处理人脸图像的方法和装置 | |
EP3238213B1 (en) | Method and apparatus for generating an extrapolated image based on object detection | |
CN112818737B (zh) | 视频识别方法、装置、存储介质及终端 | |
US20110050723A1 (en) | Image processing apparatus and method, and program | |
WO2021169396A1 (zh) | 一种媒体内容植入方法以及相关装置 | |
CN116761037B (zh) | 视频植入多媒体信息的方法、装置、设备及介质 | |
US10425634B2 (en) | 2D-to-3D video frame conversion | |
CN111741327B (zh) | 一种媒体处理方法及媒体服务器 | |
US11854238B2 (en) | Information insertion method, apparatus, and device, and computer storage medium | |
JP2011078077A (ja) | 画像処理装置および方法、並びにプログラム | |
CN110446093A (zh) | 一种视频进度条显示方法、装置和存储介质 | |
CN108076373A (zh) | 视频图像的处理方法、装置和电子设备 | |
CN110706196A (zh) | 基于聚类感知的无参考色调映射图像质量评价算法 | |
CN113516696A (zh) | 视频的广告植入方法、装置、电子设备及存储介质 | |
CN116308530A (zh) | 一种广告植入方法、装置、设备和可读存储介质 | |
CN114845158B (zh) | 视频封面的生成方法、视频发布方法及相关设备 | |
CN110012284A (zh) | 一种基于头戴设备的视频播放方法及装置 | |
CN111182295A (zh) | 一种视频数据处理方法、装置、设备以及可读存储介质 | |
WO2023065961A1 (zh) | 视频植入方法、装置、设备及计算机可读存储介质 | |
CN113923516B (zh) | 基于深度学习模型的视频处理方法、装置、设备以及存储介质 | |
Calagari et al. | Gradient-based 2D-to-3D conversion for soccer videos | |
WO2017066874A1 (en) | Methods and systems for processing digital video files for image insertion involving computerized detection of similar backgrounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |