CN104967885A - 一种基于视频内容感知的广告推荐方法及系统 - Google Patents

一种基于视频内容感知的广告推荐方法及系统 Download PDF

Info

Publication number
CN104967885A
CN104967885A CN201510142208.1A CN201510142208A CN104967885A CN 104967885 A CN104967885 A CN 104967885A CN 201510142208 A CN201510142208 A CN 201510142208A CN 104967885 A CN104967885 A CN 104967885A
Authority
CN
China
Prior art keywords
msub
advertisement
mrow
video
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510142208.1A
Other languages
English (en)
Other versions
CN104967885B (zh
Inventor
张海军
曹雄
黄晓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201510142208.1A priority Critical patent/CN104967885B/zh
Publication of CN104967885A publication Critical patent/CN104967885A/zh
Priority to PCT/CN2015/096033 priority patent/WO2016155345A1/zh
Priority to US15/716,487 priority patent/US10171844B2/en
Application granted granted Critical
Publication of CN104967885B publication Critical patent/CN104967885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • H04N21/23109Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion by placing content in organized collections, e.g. EPG data repository
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Neurology (AREA)
  • Genetics & Genomics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Human Computer Interaction (AREA)

Abstract

本发明涉及一种基于视频内容感知的广告推荐方法,包括:A、镜头分割步骤,利用基于聚类的方法将源视频分割为独立的场景;B、对象检测步骤,对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;C、广告图片检索步骤,利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;D、广告目标物体优化步骤,对搜索到的匹配物体的广告对象通过优化处理得到候选广告;E、广告插入位置优化步骤,优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。视频广告投放优化模型提高广告的吸引力,并降低了广告给用户带来的干扰。

Description

一种基于视频内容感知的广告推荐方法及系统
技术领域
本发明属于视频内容感知领域,尤其涉及一种互联网视频内容感知的广告推荐方法及系统。
背景技术
近年来,在互联网广告快速和持续发展的同时,网络视频得到大量普及。互联网广告市场存在着巨大商机,吸引着互联网公司开发新的多媒体广告,比如谷歌的AdSense,YouTube的植入式视频广告和雅虎视频等等。大多数企业宣称自己的产品和用户体验在线广告上获得了重大的进步,但是广告的根本目标并没有改变。它的目的在于吸引真正想购买的用户,而减少对不感兴趣的用户的干扰。在现实世界的广告系统中,这两个目标是冲突的,即提高收入和改善用户体验,所以需要权衡这两个目标,寻找出版商和用户之间的一种折衷的关键是使广告更具吸引力并且减少干扰。
从广告出版商的角度,在线广告的效果通常是广告受众对一个广告或品牌认知度的表现。最近研究发现,对用户体验的深度理解可以帮助理解在线广告所产生的本质和正、负面的影响,因此,用户体验从另一个角度反应了广告投放的效果。人们已经认识到,干扰和广告的不相关性会对用户体验造成负面影响。干扰是认知或心理过程在持续进行中受到突然的打扰,比如在激动人心的电影画面后播放与视频无关的广告。因此,有效的在线广告推荐系统的设计应该考虑到视频内容与广告的相关性并降低干扰。
随着个人计算机和移动手持设备的普及,网络视频已经成为最常用的网络服务之一。观看在线视频已经从一个很小的活动变为互联网的主流。除此之外,网络视频所占用的流量也快速增长。思科预测,全球范围内,网络视频将会在2016占据互联网流量的55%。对于在线视频网站,大部分收入来自于广告。2012年,中国在线视频市场规模达90亿人民币(约合14.7亿美元),比去年同期相比增加43.9%。在线视频网站的收入增长主要源于广告收入的增长。在线视频网站的广告形式是非常多样的,包括Flash广告,富媒体广告,关键字广告。在中国网络广告市场中,在植入式视频广告的收入的市场份额只有6.4%。相对于其所占的网络流量,这点市场份额显得太微不足道。本文认为,低市场份额可能主要是由于普遍采用在视频的开头或末尾显示广告的广告策略。在这种策略中,用户被迫观看广告,但他们通常忽略它,因为它与视频的内容无关。为了提高吸引力,降低广告对用户干扰,可以在播放视频的同时插入广告,确保广告与视频内容相关。特别地,可以让广告与视频流中出现的物体相关。例如,一个用户可能是朱莉娅·罗伯茨的粉丝。当用户观看电影《诺丁山》,他或她可能会被佩戴朱莉娅·罗伯茨裙子所吸引。此时,如果一个类似的裙子的广告弹出到屏幕上或朱莉娅·罗伯茨附近,用户可能会很乐意点击,而不是对广告感到反感。
发明内容
本发明的目的在于提供一种基于视频内容感知的广告推荐方法及系统,旨在解决上述的技术问题。
本发明是这样实现的,一种基于视频内容感知的广告推荐方法,所述广告推荐方法包括以下步骤:
A、镜头分割步骤,利用基于聚类的方法将源视频分割为独立的场景;
B、对象检测步骤,对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;
C、广告图片检索步骤,利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;
D、广告目标物体优化步骤,对搜索到的匹配物体的广告对象通过优化处理得到候选广告;
E、广告插入位置优化步骤,优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。
本发明的进一步技术方案是:所述镜头分割步骤包括以下步骤:
A1、根据视频时间计算聚类的类别数目N;
A2、根据时间随机选取N个帧作为初始中心;
A3、分别计算每帧与时间相近中心的距离并更新中心;
A4、重复步骤A3知道收敛或达到运行次数上限。
本发明的进一步技术方案是:所述对象检测步骤包括以下步骤:
B1、运用选择性地搜索在独立场景中生成与类别独立的候选区域;
B2、利用CNN网络对每个候选区域提取4096维特征向量并在倒数第二层输出;
B3、对提取的4096维特征向量的物体分类。
本发明的进一步技术方案是:所述广告图片检索步骤包括以下步骤:
C1、利用基于卷积神经网络对视频中人进行性别识别;
C2、对视频中人的人体特征提取;
C3、对提取的人体特征进行特征匹配。
本发明的进一步技术方案是:广告插入视频中是采用的无缝插入。
本发明的另一目的在于提供一种基于视频内容感知的广告推荐系统,所述广告推荐系统包括:
镜头分割模块,用于利用基于聚类的方法将源视频分割为独立的场景;
对象检测模块,用于对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;
广告图片检索模块,用于利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;
广告目标物体优化模块,用于对搜索到的匹配物体的广告对象通过优化处理得到候选广告;
广告插入位置优化模块,用于优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。
本发明的进一步技术方案是:所述镜头分割模块包括:
类别数目统计单元,用于根据视频时间计算聚类的类别数目N;
中心初始化单元,用于根据时间随机选取N个帧作为初始中心;
距离计算单元,用于分别计算每帧与时间相近中心的距离并更新中心;
反复计算单元,重复步骤A3知道收敛或达到运行次数上限。
本发明的进一步技术方案是:所述对象检测模块包括:
区域生成单元,用于运用选择性地搜索在独立场景中生成与类别独立的候选区域;
提取单元,用于利用CNN网络对每个候选区域提取4096维特征向量并在倒数第二层输出;
分类单元,用于对提取的4096维特征向量的物体分类。
本发明的进一步技术方案是:所述广告图片检索模块包括:
性别识别单元,用于利用基于卷积神经网络对视频中人进行性别识别;
特征提取单元,用于对视频中人的人体特征提取;
特征匹配单元,用于对提取的人体特征进行特征匹配。
本发明的进一步技术方案是:广告插入视频中是采用的无缝插入。
本发明的有益效果是:开发了一个视频广告推荐系统,同时考虑到内容相关性和插入广告的干扰。对于给定视频,该系统能够自动探测到出现的视频物体,并选择与该物体相关的广告,然后把所选择的广告插入在相关物体出现的位置。特别是,对于服装广告,本发明设计了一种基于深度卷积神经网络的方法识别人的性别,然后提取特征进行衣服检索。最后,对于物体级视频广告系统(Object Level Video Advertising,OLVA),本发明提出了全局的优化模型,该模型考虑了视频广告四个方面:内容的相关性,对用户的吸引度,广告展示时间的分散性,广告类别的多样性。具体来说,本发明的主要贡献有以下三点:首先,提出了OLVA的在线视频广告的框架。在此框架下,广告发行商可以自动探测由视频物体,并插入 与视频内容相关的广告,而无需使用任何其他的信息,如描述视频的文本信息。二,为了提高用户体验,提出了一个优化模型,该模型旨在提高广告的吸引力,降低对用户的干扰。本发明提出了一种启发式算法(Heuristic Algorithm,HA),来解决优化问题。本发明还采用遗传算法(Genetic Algorithm,GA),用合适的基因编码方式解决全局优化问题。在进一步的工作中,本发明对比了两种方法的实验结果。这项工作表明,遗传算法相对于启发式算法能得到更好的全局最优解,但是需要的运算时间较长。与此相反,启发式算法所需的运算时间较短,同时为视频广告的优化问题产生令人满意的解决方案。三,在所提出的框架下,对视频展示的策略进行了讨论。在视频广告的展示中,本发明提出了广告展示位置的优化模型,旨在最大限度地缩小了选择的广告和目标物体的距离,以及广告和视频中出现的物体之间的重叠区域的面积。本发明采用梯度下降法求出最优位置,然后在屏幕上的最佳位置显示广告。
附图说明
图1是本发明实施例提供的基于视频内容感知的广告推荐方法的流程图;
图2是本发明实施例提供的基于视频内容感知的广告推荐系统的结构图。
具体实施方式
图1示出了本发明提供的基于视频内容感知的广告推荐方法的流程图,其详述如下:
步骤S1,镜头分割步骤,利用基于聚类的方法将源视频分割为独立的场景;提取HOG特征值,用聚类的方法进行镜头分割,通过提取每张图片的特征值,然后进行无监督的学习,得到分割的场景;具体实施过程如下:通过提取每张图片的特征值,然后进行无监督的学习,得到分割的场景。场景聚类不同于其他聚类方法,需要考虑帧出现的时间,只有时间的帧相近才能聚在一起。具体镜头分割包含的如下步骤:(1)根据视频时间计算聚类的类别数目N;(2)根据时间随机选取N个帧作为初始中心;(3)分别计算每帧与时间相近中心的距离,更新中心。(4)重复步骤(3)直到收敛或达到运行次数上限。
步骤S2,对象检测步骤,对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;用基于区域卷积方法的探测物体对象,通过物体探测,能够得到视频中物体的类别和物体的位置,该方法对于一个输入的图片先提取候选区域,每张图片提取2000个候选区域,对于每个候选区域,进行图片大小归一化,将图片归一化到同样大小,然后使用CNN(Convolutional Neural Networks,卷积神经网络)方法对这些归一化后的区域提取特征值。最后将提取的特征值输入线性支持向量机,进行分类;在每一个场景中,使用基于区域卷积特征的物体探测方法。通过该方法处理,能够获得探测到的物体的某些信息,包括该物体类别,属于该类别的概率,该物体出现时间以及出现在屏幕中的位置。具体实施过程如下:基于区域卷积特征的物体探测系统如图2所示。对于一个输入的图片先提取候选区域,每张图片提取2000个候选区域。对于每个候选区域,进行图片 大小归一化,将图片归一化到同样大小。然后使用CNN对这些归一化后的区域提取特征值。最后将提取的特征值输入给线性支持向量机,进行分类。这样可以得到这些区域属于特点物体的概率,当概率大于阈值,就可以把区域提取出来作为该物体。这些通过物体探测所获得的信息对于后续的广告投放是非常重要的。例如,所提出的广告目标物体优化模型依赖于该物体类别,探测的准确率和物体的位置信息,以便能同时考虑广告的吸引力和干扰。与之前所提到的一样,本发明只探测五种类型的物体:人、车、瓶子、狗和自行车。具体物体探测的步骤如下:(1)候选区域产生最新的很多论文提供了用于生成与类别独立的候选区域的方法。其中有:选择性地搜索,约束参数最小割集(Constrained Parametric Min-Cuts,CPMC)。而基于区域卷积的物体探测使用选择性地搜索。(2)CNN特征提取使用Caffe实现Krizhevsky等人所提出的CNN网络,对于每个区域提取4096维特征向量,该特征向量是CNN网络中倒数第二层的输出。根据实践经验,CNN在分类任务取得较好的效果,在探测中也会取得一致的效果。根据实验,CNN的层数越深,效果越好。(3)物体的分类考虑一个二分类器探测车辆,很明显,图像区域紧紧包围一辆汽车应该是一个正例。同样,很明显,没有车辆的背景区域应该是做负例。但是对于那些覆盖到一部分的区域是否表为正例是一个不确定的问题。计算重叠部分的比例,如果该比例超过阈值,就视为正例。试验中,重叠的阈值为0.3,这是通过实验不同的阈值选取最好的结果得到的。
步骤S3,广告图片检索步骤,利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;广告图片检索,包括两种策略:衣服检索 和基于类别的检索,在衣服检索中使用人体部分对齐和人体分割来过滤背景并且提取特征,然后使用性别识别方法识别演员的性别。如果通过优化模型选择的物体是人,则进一步处理特征以便进行衣服检索。在衣服检索中,本发明采用性别识别,人体部分对齐,然后特征提取进行匹配。反之,如果所选择的物体是其他类型的,本发明使用一个简单的基于类别的检索,其工作方式是随机检索与物体属于同一类别的广告。
具体实施过程如下:
为了找到相关的衣服广告,本发明对人体做进一步处理从而提取的特征,然后通过特征匹配检索相关广告。本发明设计的衣服检索系统。该系统包含两个主要部分:人体特征提取,该部分使用到人体部分对齐和人体分割;性别识别用来识别人的性别,以便在不同性别的数据库中的检索广告。在实践中,直接提取整张图片的特征进行匹配的结果往往不够理想,因为可能会出现上衣的特征去匹配裤子的特征。对于衣服检索,人体部位对齐或人体部分探测已被证明是有效的部分匹配方式。但提取的人体部位可能仍含有一定的背景特征。特别是,广告图像的背景通常是与视频的背景不同。这些背景被视为噪音,可能会影响到随后的衣服匹配的效果。因此,通过人体分割方法以过滤掉背景,是必要的。另一方面,如果仅使用人体特征在广告数据库中检索最相关的广告,可能会发生将男演员匹配女士衣服的情况。为了避免这一点,本发明使用性别识别将人分成男性或女性。因此,如果人的性别是男/女,则将在男/女的数据库中进行特征匹配。这个简单策略背后的理由是,可以利用一些先验知识,以增加广告的吸引力。例如,如果选择的物体是狗,嵌入宠物用品广告到视频更可能会吸引观众的注意力。具体步骤如下:
(1)基于卷积神经网络的性别识别。使用卷积神经网络对人的头像训练和识别的性别。
(2)人体特征提取。提取人体特征主要包括两个步骤:人体部分对齐,其目的是让上衣特征与上衣特征进行匹配而不是裤子的;以及人体分割,这是用来过滤背景不同所带来的噪音;最后提取一些特征用于检索。经过上述两个步骤,我们可以从人体的各个部分提取特征进行匹配,与此同时背景的特征也被过滤掉。本发明提取了三种特征,包括HOG,LBP和颜色直方图。广告图片也采用类似的处理方式提取特征。通过计算一个人体的特征向量和广告图像的特征向量之间的距离,从而检索出类似的衣服。
(3)特征匹配。将提取的三种特征即HOG,LBP和颜色直方图级联为向量。假设广告图像的特征向量表示为H=[h1,h2,...,hM],而视频中人类的特征向量表示为根据文献,本文使用詹森-香农散度(JSD)来计算两个特征向量的距离:
d JSD ( H , H ′ ) = Σ m = 1 M h m log 2 h m h m + h m ′ + h m ′ log 2 h m ′ h m + h m ′
通过计算该距离,可以在数据库中找到与该目标的人体最相关的服装广告图片。
步骤S4,广告目标物体优化步骤,对搜索到的匹配物体的广告对象通过优化处理得到候选广告;考虑到广告的吸引力和对观众干扰问题,本发明在优化的过程中同时考虑时间的分散性、类别多样性、局部吸引性和干扰,采用最优化方法选取插入广告的物体;通过优化模型得到了可以插入广告的物体,通过检索得到了候选广告,候选广告即将被插入到视频流中,需要探测广告在屏幕中的位置。
具体实施过程如下:
为了确定选择哪个场景插入的广告,以及场景中的哪个物体作为插入广告的目标物体,本发明的OLVA系统考虑很多方面的因素并建立优化的模型。首先,广告在一个视频流的时间分布最好尽量分散,因为强迫用户在一段短的时间内反复观看很多的广告可能会导致用户反感。其次,我们在视频中探测到不同的物体,针对于不同类型的物体,可以插入不同类型的广告。从广告出版商的角度考虑,肯定希望插入尽可能多的类型的广告。因为多样化的广告类型,更可能引起用户的注意。因为广告的类型直接和目标物体的类型相关,所以应该选择尽量多类型的物体。第三,物体在一个场景中出现的次数是不同的。有些物体可能频繁出现,而有些物体只出现一次。本发明希望针对频繁物体插入广告,而不是很少出现的物体。一方面,频繁出现的物体通常是更为重要。另一方面,根据广告策略,针对频繁出现的物体插入广告时,广告停留在屏幕中的时间更长。因此,如果选择频繁出现的物体插入广告,相对于出现次数较少的物体,它更容易吸 引观看者的注意。第四,从一个物体出现在屏幕上的位置的方面,重要物体或聚焦的物体位于屏幕中心附近。因此,如果多个物体在同一帧中被探测到,本发明希望选择距离屏幕中心更近的物体作为目标物体。这样做,所插入的广告可能更吸引观众的注意力。第五,通过物体探测得到每个物体的置信水平必须加以考虑,因为对于以确保该物体和广告之间的相关性它是必不可少的。如果探测错误,那么插入的广告也会不相关。所以我们需要选择探测置信水平加高的物体插入广告。最后,最好在干净的场景中插入广告,也就是只包含一个或非常少的物体的场景。如果在一个场景内出现较多的物体,那么这个场景的情节和内容可能会比较复杂。如果在这样的一个场景中插入广告,所生成的视频将显得更为复杂。其结果是,对用户带来的干扰就会很大。通过考虑以上可能会对OLVA系统性能带来巨大影响的六个因素,本发明将其转换为数学优化问题,用优化方法求解,以提高了吸引力降低干扰。下面,本发明给出了该优化问题的详细定义以及具体的求解方法。
一个视频包含NS个场景,可以表示为对于每一个场景i,它包含个物体,可以表示为而一个视频中所有的物体可以表示为本发明的优化目标在于选择合适的场景以及合适的物体插入广告。
定义以下的变量 x ∈ R N s , y ∈ R Σ i = 1 N s N i o , y i ∈ R N i o , x = [ x 1 , ... , x i , ... x N s ] , x i ∈ { 0 , 1 } , 和 其中xi和yi,j分别表示场景i和场景i中的物体j是否被选中。本发明只允许同一个场景中选择一个物体。将在不同的N个场景中选择物体。每个物体都与广告相关联。本发明定义选择的场景为选择的物体为物体和场景的选择的过程。
根据前面的讨论可知,建立优化模型需要考虑很多的因素。本发明把所考虑的因素分为三类:
时间的分散性:广告在视频流中的时间分布。插入的广告最好分散在 视频流中,而不是集中在一段时间内。对于这个问题,最好的结果是对于任意两个相邻的广告,时间间隔是一致的。换句话说,广告的时间分布是均匀的,即广告的时间间隔为其中Tv表示视频的播放时长。在优化过程中,可以使用任何两个相邻的所选的场景之间的最小时间间隔作为一个变量,以反映时间分散度。显然,该值最小的时候广告的时间分布是均匀的。本发明将场景出现的顺序看做时间,最小时间间隔定义如下。
D t = arg min i , k ( g ( | k - i | · x i · x k ) ) ,
g ( a ) = ρ , a = 0 a , a ≠ 0
其中ρ是一个很大的数字。这样,对于每一对选择的场景,计算出这两个场景的时间差,然后,选择的最小差值来反映时间分散程度。
类别多样性:它代表了所选物体的类别的多样性。因为按照类别检索相关广告,所以物体的类别就意味着相关的广告类别。插入广告的类别更多样化,观众被广告吸引的概率就更大。为了使广告类型更多样化,本发明选择不同类型的物体作为目标物体。这样,类别的多样性定义为:
D c = 1 N ( N - 1 ) Σ i , j , k , l f ( ( c ij o - c kl o ) · x i · y ij · x k · y kl ) ,
f ( a ) = 0 , a = 0 1 , a ≠ 0
其中表示物体的类别。在实现中,用一个整数来表示的物体的类别。
局部吸引性和干扰:这些因素只和局部的物体和场景相关。它包含四个因素:1)探测到的物体的置信水平;2)物体的出频率;3)在物体与屏幕的中心之间的距离;4)插入广告可能带来的干扰。首先,定义场景i中的物体j的置信水平为Ad ij。第二,对于计算场景中物体出现的频率本文使用了两种策略。对于人,使用人脸聚类,将同一个人的图片归为一类。通过计算该人在场景中出现的次数来计算这个人出现的现频率。对于其他类型的物体,计算在场景中同一类别的物体出现的次数作为该物体出现的次 数。假设出现在场景i中的所有物体的个数为而物体j在场景i中出现的次数为这物体出现的频率定义为第三,通过物体探测,我们获得物体的位置信息。定义为场景i物体j的中心与视频画面的中心之间的距离。最后,定义场景i物体j插入广告的干扰为Iij,其值为广告插入时间范围内的物体数量。而广告插入的时间范围就是物体出现的时间范围。基于以上定义,局部吸引力和干扰所用的形式来定义
L = 1 N Σ i , j ( ( ξ 1 A ij d + ξ 2 F ij + ξ 3 / ( D ij s + 1 ) + ξ 4 / I ij ) · x i · y ij )
其中ξ1234=1,和ξ1,ξ2,ξ3,ξ4表示各个因素的重要性。在本发明中,设定ξ1=0.5,ξ2=0.1,ξ3=0.1,ξ4=0.3。另外,Fij和1/Iij都被归一化到(0,1]的范围内。
考虑上述因素,我们定义如下优化模型:
max h ( x , y ) = w 1 · D t + w 2 · D c + w 3 · L = w 1 · arg min i , k ( g ( | i - k | ) · x i · x k ) w 2 · 1 N ( N - 1 ) Σ i , j , k , f ( ( C ij o - C kl o ) · x i · y ij · x k · y kl ) + w 3 · 1 N Σ i , j ( ξ 1 A ij d + ξ 2 F ij + ξ 3 / ( D ij s + 1 ) + ξ 4 / I ij } · x i · y ij ) ,
满足约束条件 
∑xi=N,∑xi·yij=N,xi∈{0,1},yij∈{0,1},
其中w1,w2,w3是三个预定义的权重参数。设置w1=w2=w3=1,这表对于因素Dt,Dc,和L是一样重要的。
假设每个场景中含有相同的物体No,那么优化问题将会有个不同的解。当场景和物体的数量比较大时,搜索空间将显着增加。根据试验的经验,对于有100个场景,每个场景有10个物体的视频,用穷举搜索方法搜索最优解这将花费大约一天的时间。为了提高效率,本发明设计了一 个启发式算法(HA)来搜索最优解。其基本思想是,在每步搜索最好的物体和场景,直到找到N物体为止。虽然启发式算法容易陷入局部最小值,但是它能较快的求得较好的解。利用启发式算法,可以只用NNo(Ns-(N-1/2))步求得解。
为了便于比较,本发明采用遗传算法(GA)从全局角度求解问题。在执行遗传算法之前,将优化问题编码为一个的向量称为染色体,形式如下:
遗传算法操作这些二进制染色体的集合,称为群体,群体是随机初始化的,但是要满足Σxi=N,Σxi·yij=N,xi∈{0,1},yij∈{0,1}的条件。遗传算法使用两个操作产生新的个体:交叉,其原理是将两个染色体(称为祖先)结合在一起,形成新的染色体(称为后代);变异,其目的是将随机改变的基因引入染色体中。这是值得指出的是,本发明的遗传算法与与传统的遗传算法略有不同,因为在交叉和变异的时候需要满足约束Σxi=N,Σxi·yij=N,xi,yij∈{0,1}。在初始化的时候,随机地选择N个场景,并设置对应的xi为1,以便满足约束Σxi=N。同时,在每个选择的场景中分别选择一个物体,设置对应的y.,j为1,以满足约束Σxi·yij=N。在交叉操作的时候,我们将x,y1,y2,...,视为基本部分,这样交叉操作就与传统遗传算法的交叉操作一致。在变异操作的时候,分别处理组件x和yu (u=1,2,...,Ns)。具体而言,将这些组件中的0和1的位置随机交换。在本发明中,我们设置种群规模为200,交叉率为0.25,变异率为0.01,迭代次数为200。
步骤S5,广告插入位置优化步骤,优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。广告插入点选择,通过优化广告和目标物体的距离以及广告和所有该场景中的物体之间的重叠区域,做到和目标物体最近,但不覆盖到其他物体。利用模型去优化广告和目标物体之间的距离以及广告并与所有物体之间的重叠区域的面积。本发明认为距离和重叠面越小越好。梯度下降方法用来解决这个最优化问题。经过上述步骤后,一个带有与内容相关的广告的视频将呈现在用户面前。
具体实施过程如下:
上述优化方法使我们能确定在那是场景中的那些物体插入广告。此外,通过检索,每一个物体已经有对应的相关广告。随后的工作是如何找到广告在屏幕中的显示位置。事实上,有很多显示广告的策略和方法。具体地说,广告可以显示在:1)视频的开始或者结束;2)每个场景结束的时候;3)场景中不重要的位置;4)屏幕中目标物体的附近。第一种策略已被广泛用于在当前网络视频网站,例如YouTube的和雅虎视频。但是,这些网站通常不考虑显示广告和视频内容之间的相关性。此外,如前面提到的,文本信息是视频的仅粗略描述。所得到的相关性是不充分的,不足以弥补视频内容和广告之间的语义差距。与此相反,物体级别关联使本文的系统能够最大化视频广告的价值。第三个策略是一个简单的选择,这是类似与许多网站的弹出式Flash广告。一个不重要的地方可以是屏幕的一角。但是从观看者的角度,可能没有注意到那些角落,因为他们更可能专注于播放视频的屏幕的中心区域。从广告出版商角度,更多的观众的注意力被插入的广告所吸引,才是更有价值的广告系统。最后一个策略的目的是通过定位目标物体,围绕该物体插入一个相关的广告,以吸引观众的注意力。但是,如果当目标物体出现的帧中包含一些其它物体,所显示的广告可覆盖其他物体,从而导致对观众干扰。在本发明中,我们定义了插入位置探测的优化模型,并使用最后一种策略去插入广告。
在探测最优插入位置时考虑一下两点因素:
距离:所插入的广告和目标物体之间的距离。将广告和物体的矩形块,定义广告的中心为(xa,ya),高度的一半为ha,宽度的一半为wa。同样的,定义目标物体的中心为(xt,o,yt,o),高度的一半为ht,o,宽度的一半为wt,o。如图所示,广告和物体之间的距离可以通过以下公式表示:
D ato = ( x a - x t , o ) 2 + ( y a - y t , o ) 2 ( 1 + w a + w t , o | x a - x t , o | ) | x a - x t , o | > w a + w t , o , ( x a - x t , o ) 2 + ( y a - y t , o ) 2 ( 1 + h a + h t , o | y a - y t , o | ) | x a - x t , o | < w a + w t , o | y a - y t , o | > h a + h t , o , 0 otherwise .
重叠:是指广告和视频帧中所有物体重合的面积。在广告和物体之间的重叠区域可以定义为
Qi=Wi·Hi
其中,宽度 
W i = ( w a + x a ) - ( x i , o - w i , o ) w i , o + w a > x a - x i , o , x a > x i , o , ( w i , o + x i , o ) - ( x a - w a ) w i , o + w a > x i , o - x a , x a < x i , o , 0 w i , o + w a &le; | x i , o - x a | ,
高度
H i = ( h i , o + y i , o ) - ( h a - y a ) h i , o + h a > y a - y i , o , y i , o < y a , ( h a + y a ) - ( h i , o - y i , o ) h i , o + h a > y i , o - y a , y i , o > y a , 0 h i , o + h a &le; | y i , o - y a | .
综合考虑上述两个因素,我们可以探测广告的最佳插入位置的问题变成一个优化模型:
min ( x a , y a ) f ( x a , y a ) = &Sigma; i = 1 N o Q i + D ato
其中No在帧中探测到的物体的数目,Qi表示该广告和物体i之间的重叠区域的面积。
为了解决上述问题,本发明设计了一种基于梯度下降的方法去寻找函数f(xa,ya)对应的最优解xa和ya。梯度可以按如下公式产生:
&dtri; x a = &PartialD; f ( x a , y a ) &PartialD; x a = &Sigma; i = 1 N o &PartialD; Q i &PartialD; x a + &PartialD; D ato &PartialD; x a = &Sigma; i = 1 N o ( &PartialD; W i &PartialD; x a H i ) + &PartialD; D ato &PartialD; x a
&dtri; y a = &PartialD; f ( x a , y a ) &PartialD; y a = &Sigma; i = 1 N o &PartialD; Q i &PartialD; y a + &PartialD; D ato &PartialD; y a = &Sigma; i = 1 N o ( &PartialD; W i &PartialD; x a W i ) + &PartialD; D ato &PartialD; y a .
其中,
&PartialD; W i &PartialD; x a = x a w i , o + w a > x a - x i , o , x a > x i , o x a w i , o + w a > x i , o - x a , x a < x i , o 0 w i , o + w a &le; | x i , o - x a |
&PartialD; D ato &PartialD; x a = x a - x t , o ( x a - x t , o ) 2 ( y a - y t , o ) 2 ( 1 - w a + w t , o x a - x t , o ) + ( x a - x t , o ) 2 + ( y a - y t , o ) 2 &CenterDot; w a + w t , o x t , o - x a x a - x t , o > w a + w t , o , x a > x t , o x a - x t , o ( x a - x t , o ) 2 + ( y a - y t , o ) 2 ( 1 - w a + w t , o x t , o - x a ) + ( x a - x t , o ) 2 + ( y a - y t , o ) 2 &CenterDot; w a + w t , o x a - x t , o x t , o - x a > w a + w t , o , x a < x t , o x a - x t , o ( x a - x t , o ) 2 + ( y a - y t , o ) 2 ( 1 - h a + h t , o | y a - y t , o | ) x a - x t , o < w a - w t , o , | y a - y t , o | > h a + h t , o 0 otherwise
广告的插入位置(xa(t),ya(t))可以按照如下步骤更新:
( x a ( t + 1 ) , y a ( t + 1 ) ) = ( x a ( t ) , y a ( t ) ) + &mu; &CenterDot; ( - &dtri; x a , - &dtri; y a )
其中μ是每次迭代的学习率。然后,不停地迭代更新插入广告的位置,直到位置变化||(xa(t),ya(t))-(xa(t-1),ya(t-1))||2达到预定的阈值或迭代次数达到最大迭代次数。使用梯度下降搜索最优插入位置的过程,可以看到在大多数情况下,梯度下降能够找到一个最优位置,虽然有很多个最优位置,所需要的迭代次数并不多,10步左右的迭代就可以找到最优位置。
本发明的视频内容感知的广告推荐方法及系统,尤其涉及互联网视频内容感知的广告推荐方法及系统。本发明的主要创新的工作为以下两个部分:1)OLVA广告系统;2)视频广告投放优化模型。第一部分的有效性依赖于物体探测技术。优化模型的工作原理是同时考虑提高广告的吸引力,并降低了广告给用户带来的干扰。
图2示出了一种基于视频内容感知的广告推荐系统,所述广告推荐系统包括:
镜头分割模块,用于利用基于聚类的方法将源视频分割为独立的场景;
对象检测模块,用于对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;
广告图片检索模块,用于利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;
广告目标物体优化模块,用于对搜索到的匹配物体的广告对象通过优化处理得到候选广告;
广告插入位置优化模块,用于优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。
所述镜头分割模块包括:
类别数目统计单元,用于根据视频时间计算聚类的类别数目N;
中心初始化单元,用于根据时间随机选取N个帧作为初始中心;
距离计算单元,用于分别计算每帧与时间相近中心的距离并更新中心;
反复计算单元,重复步骤A3知道收敛或达到运行次数上限。
所述对象检测模块包括:
区域生成单元,用于运用选择性地搜索在独立场景中生成与类别独立的候选区域;
提取单元,用于利用CNN网络对每个候选区域提取4096维特征向量并在倒数第二层输出;
分类单元,用于对提取的4096维特征向量的物体分类。
所述广告图片检索模块包括:
性别识别单元,用于利用基于卷积神经网络对视频中人进行性别识别;
特征提取单元,用于对视频中人的人体特征提取;
特征匹配单元,用于对提取的人体特征进行特征匹配。
广告插入视频中是采用的无缝插入。
在镜头分割时,通过提取每张图片的特征值,然后进行无监督的学习,得到分割的场景。场景聚类不同于其他聚类方法,需要考虑帧出现的时间,只有帧的时间相近才能聚在一起。
在对象检测时,采用基于区域卷积特征的物体探测系统。对于一个输入的图片先提取候选区域,每张图片提取2000个候选区域。对于每个候选区域,进行图片大小归一化,将图片归一化到同样大小。然后使用CNN对这些归一化后的区域提取特征值。最后将提取的特征值输入给线性支持向量机,进行分类。这样,可以得到这些区域属于特定物体的概率,当概率大于阈值,就可以把区域提取出来作为该物体。
在广告图片检索时,为了找到相关的衣服广告,本发明对人体做进一步的特征提取,然后通过特征匹配检索相关广告。该系统包含两个主要部分:人体特征提取,该部分使用到人体部分对齐和人体分割;性别识别,用来识别人的性别,以便在不同性别的数据库中检索广告。对于衣服检索,人体部位对齐或人体部分探测已被证明是有效的部分匹配方式。但提取的人体部位可能仍含有一定的背景特征。特别是,广告图像的背景通常是与视频的背景不同。这些背景被视为噪音,可能会影响到随后的衣服匹配的效果。因此,通过人体分割方法以过滤掉背景,是必要的。另一方面,如果仅使用人体特征在广告数据库中检索最相关的广告,可能会发生将男演员匹配女士衣服的情况。为了避免这一点,本文使用性别识别将人分成男性或女性。因此,如果人的性别是男/女,则将在男/女的数据库中进行特征匹配。
广告目标物体优化,经过以上步骤,我们能得到每个物体对应的相关广告。由于视频中的物体很多,不能针对每个物体都插入一个广告。这样一个视频将被广告所充满,因此需要选择性的插入广告。选择物体时,需要考虑到广告的吸引力以及插入广告对用户的干扰。为了选择合适的场景以及目标物体,本发明设计一个模型对选择的结果进行优化。
广告插入位置的优化,当得到插入广告的目标物体,通过该物体找到对应的检索结果,也就得到了需要插入的广告。广告插入在目标物体出现的时间范围内,但是广告插入在屏幕中的哪个位置还没有确定。为了提高对用户的吸引,本发明希望广告距离目标物体越近越好。为了减少插入的干扰,广告应该尽量不要覆盖到其他物体。基于以上两点,本发明用梯度下降的方法求出插入位置,最终将广告插入到视频中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于视频内容感知的广告推荐方法,其特征在于,所述广告推荐方法包括以下步骤:
A、镜头分割步骤,利用基于聚类的方法将源视频分割为独立的场景;
B、对象检测步骤,对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;
C、广告图片检索步骤,利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;
D、广告目标物体优化步骤,对搜索到的匹配物体的广告对象通过优化处理得到候选广告;
E、广告插入位置优化步骤,优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。
2.根据权利要求1所述的广告推荐方法,其特征在于,所述镜头分割步骤包括以下步骤:
A1、根据视频时间计算聚类的类别数目N;
A2、根据时间随机选取N个帧作为初始中心;
A3、分别计算每帧与时间相近中心的距离并更新中心;
A4、重复步骤A3知道收敛或达到运行次数上限。
3.根据权利要求1所述的广告推荐方法,其特征在于,所述对象检测步骤包括以下步骤:
B1、运用选择性地搜索在独立场景中生成与类别独立的候选区域;
B2、利用CNN网络对每个候选区域提取4096维特征向量并在倒数第二层输出;
B3、对提取的4096维特征向量的物体分类。
4.根据权利要求1所述的广告推荐方法,其特征在于,所述广告图片检索步骤包括以下步骤:
C1、利用基于卷积神经网络对视频中人进行性别识别;
C2、对视频中人的人体特征提取;
C3、对提取的人体特征进行特征匹配。
5.根据权利要求1-4任一项所述的广告推荐方法,其特征在于,广告插入视频中是采用的无缝插入。
6.一种基于视频内容感知的广告推荐系统,其特征在于,所述广告推荐系统包括:
镜头分割模块,用于利用基于聚类的方法将源视频分割为独立的场景;
对象检测模块,用于对每个独立场景利用基于区域卷积特征探测获得视频中物体的相关信息;
广告图片检索模块,用于利用衣服检索和基于类别的策略在数据库中搜索匹配物体的广告对象;
广告目标物体优化模块,用于对搜索到的匹配物体的广告对象通过优化处理得到候选广告;
广告插入位置优化模块,用于优化广告和目标物之间的距离及广告与所有物体之间的重叠区域的面积。
7.根据权利要求6所述的广告推荐系统,其特征在于,所述镜头分割模块包括:
类别数目统计单元,用于根据视频时间计算聚类的类别数目N;
中心初始化单元,用于根据时间随机选取N个帧作为初始中心;
距离计算单元,用于分别计算每帧与时间相近中心的距离并更新中心;
反复计算单元,重复步骤A3知道收敛或达到运行次数上限。
8.根据权利要求6所述的广告推荐系统,其特征在于,所述对象检测模块包括:
区域生成单元,用于运用选择性地搜索在独立场景中生成与类别独立的候选区域;
提取单元,用于利用CNN网络对每个候选区域提取4096维特征向量并在倒数第二层输出;
分类单元,用于对提取的4096维特征向量的物体分类。
9.根据权利要求6所述的广告推荐系统,其特征在于,所述广告图片检索模块包括:
性别识别单元,用于利用基于卷积神经网络对视频中人进行性别识别;
特征提取单元,用于对视频中人的人体特征提取;
特征匹配单元,用于对提取的人体特征进行特征匹配。
10.根据权利要求6-9任一项所述的广告推荐系统,其特征在于,广告插入视频中是采用的无缝插入。
CN201510142208.1A 2015-03-27 2015-03-27 一种基于视频内容感知的广告推荐方法及系统 Active CN104967885B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510142208.1A CN104967885B (zh) 2015-03-27 2015-03-27 一种基于视频内容感知的广告推荐方法及系统
PCT/CN2015/096033 WO2016155345A1 (zh) 2015-03-27 2015-11-30 一种基于视频内容感知的广告推荐方法及系统
US15/716,487 US10171844B2 (en) 2015-03-27 2017-09-26 Method and system of advertising

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510142208.1A CN104967885B (zh) 2015-03-27 2015-03-27 一种基于视频内容感知的广告推荐方法及系统

Publications (2)

Publication Number Publication Date
CN104967885A true CN104967885A (zh) 2015-10-07
CN104967885B CN104967885B (zh) 2019-01-11

Family

ID=54221808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510142208.1A Active CN104967885B (zh) 2015-03-27 2015-03-27 一种基于视频内容感知的广告推荐方法及系统

Country Status (3)

Country Link
US (1) US10171844B2 (zh)
CN (1) CN104967885B (zh)
WO (1) WO2016155345A1 (zh)

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184646A (zh) * 2015-10-20 2015-12-23 中国民生银行股份有限公司 自助银行信息推送方法及装置
CN105630996A (zh) * 2015-12-25 2016-06-01 腾讯科技(深圳)有限公司 一种信息处理方法和服务器
CN105657446A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种视频中贴片广告的检测方法和装置
WO2016155345A1 (zh) * 2015-03-27 2016-10-06 哈尔滨工业大学深圳研究生院 一种基于视频内容感知的广告推荐方法及系统
CN106156732A (zh) * 2016-07-01 2016-11-23 合网络技术(北京)有限公司 对象识别方法和对象识别装置
CN106776949A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 数据处理方法、装置及电子设备
CN106779073A (zh) * 2016-12-27 2017-05-31 西安石油大学 基于深度神经网络的媒体信息分类方法及装置
CN106991641A (zh) * 2017-03-10 2017-07-28 北京小米移动软件有限公司 植入图片的方法及装置
CN107146096A (zh) * 2017-03-07 2017-09-08 浙江工业大学 一种智能视频广告展示方法及装置
CN107347166A (zh) * 2016-08-19 2017-11-14 北京市商汤科技开发有限公司 视频图像的处理方法、装置和终端设备
CN107403185A (zh) * 2016-05-20 2017-11-28 北京大学 人像颜色转换方法和人像颜色转换系统
CN107590442A (zh) * 2017-08-22 2018-01-16 华中科技大学 一种基于卷积神经网络的视频语义场景分割方法
WO2018048355A1 (en) * 2016-09-08 2018-03-15 Aiq Pte. Ltd. Object detection from visual search queries
CN108292419A (zh) * 2015-11-04 2018-07-17 李才圭 利用便携式通信终端第一个画面的内容物提供方法
CN109906611A (zh) * 2016-03-16 2019-06-18 尼尔森(美国)有限公司 用于内容特征图谱化的特征图谱布局
CN110225366A (zh) * 2019-06-26 2019-09-10 腾讯科技(深圳)有限公司 视频数据处理及广告位确定方法、装置、介质及电子设备
CN110348529A (zh) * 2019-07-16 2019-10-18 韶关市启之信息技术有限公司 一种智能的衣服流行风格预测方法与系统
CN110381369A (zh) * 2019-07-19 2019-10-25 腾讯科技(深圳)有限公司 推荐信息植入位置的确定方法、装置、设备及存储介质
CN110415005A (zh) * 2018-04-27 2019-11-05 华为技术有限公司 确定广告插入位置的方法、计算机设备和存储介质
CN111031366A (zh) * 2019-11-29 2020-04-17 深圳市掌众信息技术有限公司 一种在视频中植入广告的方法及系统
CN111242154A (zh) * 2019-04-01 2020-06-05 泰州市康平医疗科技有限公司 衣物柜收纳管理方法
WO2020192187A1 (zh) * 2019-03-25 2020-10-01 华为技术有限公司 一种媒体处理方法及媒体服务器
CN111754254A (zh) * 2019-03-26 2020-10-09 维布络有限公司 在多媒体中动态创建和插入沉浸式推广内容的系统和方法
CN111815340A (zh) * 2019-04-12 2020-10-23 百度在线网络技术(北京)有限公司 推广信息确定方法、装置、设备及可读存储介质
CN111885396A (zh) * 2016-06-30 2020-11-03 斯尼弗卡特公司 用于在流内容中拼接广告的系统和方法
WO2020233475A1 (zh) * 2019-05-22 2020-11-26 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算机设备和存储介质
JP2020534600A (ja) * 2017-09-22 2020-11-26 コンティネンタル・テーベス・アクチエンゲゼルシヤフト・ウント・コンパニー・オッフェネ・ハンデルスゲゼルシヤフト 車線認識方法および装置、運転支援システムならびに車両
CN112085532A (zh) * 2020-09-10 2020-12-15 网易(杭州)网络有限公司 一种插入广告的方法、装置、计算机设备和介质
CN112330371A (zh) * 2020-11-26 2021-02-05 深圳创维-Rgb电子有限公司 基于ai的智能广告推送方法及装置、系统及存储介质
CN112348566A (zh) * 2020-10-15 2021-02-09 北京捷通华声科技股份有限公司 推荐广告的确定方法、装置及存储介质
CN112567416A (zh) * 2018-07-18 2021-03-26 华为电讯对外贸易有限公司 用于处理数字视频的设备及方法
WO2021057704A1 (en) * 2019-09-23 2021-04-01 Maycas System Limited Methods and systems for incorporating advertising materials into video images
CN112805739A (zh) * 2018-10-05 2021-05-14 三星电子株式会社 电子设备及其控制方法
CN113222995A (zh) * 2020-02-06 2021-08-06 阿里巴巴集团控股有限公司 视频处理方法、视频处理装置及电子设备
US11272228B2 (en) 2016-06-30 2022-03-08 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
CN116703485A (zh) * 2023-08-04 2023-09-05 山东创亿智慧信息科技发展有限责任公司 基于大数据的广告精准营销方法及系统
CN116757748A (zh) * 2023-08-14 2023-09-15 广州钛动科技股份有限公司 基于随机梯度攻击的广告点击预测方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017037754A1 (en) * 2015-08-28 2017-03-09 Nec Corporation Analysis apparatus, analysis method, and storage medium
WO2018033137A1 (zh) * 2016-08-19 2018-02-22 北京市商汤科技开发有限公司 在视频图像中展示业务对象的方法、装置和电子设备
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
WO2018081581A1 (en) * 2016-10-28 2018-05-03 Axon Enterprise, Inc. Systems and methods for supplementing captured data
CN107277577A (zh) * 2017-07-14 2017-10-20 深圳创维-Rgb电子有限公司 广告的推送方法、装置及计算机可读存储介质
CN107493488B (zh) * 2017-08-07 2020-01-07 上海交通大学 基于Faster R-CNN模型的视频内容物智能植入的方法
CN108256100A (zh) * 2018-01-31 2018-07-06 维沃移动通信有限公司 一种信息搜索方法、移动终端及云服务器
US10154319B1 (en) 2018-02-15 2018-12-11 Rovi Guides, Inc. Systems and methods for customizing delivery of advertisements
JP6601644B1 (ja) * 2018-08-03 2019-11-06 Linne株式会社 画像情報表示装置
US10951676B2 (en) * 2018-09-25 2021-03-16 Microsoft Technology Licensing, Llc Feedback based controller for varying content item density
US20210233115A1 (en) * 2018-10-17 2021-07-29 Firefly Systems Inc. Vehicle-mounted dynamic content delivery systems
CN110060079A (zh) * 2018-11-09 2019-07-26 阿里巴巴集团控股有限公司 一种多媒体物料推送方法和装置
US10992979B2 (en) 2018-12-04 2021-04-27 International Business Machines Corporation Modification of electronic messaging spaces for enhanced presentation of content in a video broadcast
EP3680811A1 (en) * 2019-01-10 2020-07-15 Mirriad Advertising PLC Visual object insertion classification for videos
US11057652B1 (en) * 2019-04-30 2021-07-06 Amazon Technologies, Inc. Adjacent content classification and targeting
US10930011B2 (en) * 2019-07-02 2021-02-23 Billups, Inc. Digital image processing system for object location and facing
US10992968B2 (en) * 2019-07-15 2021-04-27 At&T Intellectual Property I, L.P. Method and apparatus for an enhanced data pipeline
US11082724B2 (en) 2019-08-21 2021-08-03 Dish Network L.L.C. Systems and methods for targeted advertisement insertion into a program content stream
US20220222716A1 (en) * 2021-01-13 2022-07-14 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
CN113347469A (zh) * 2021-06-01 2021-09-03 广州欢网科技有限责任公司 一种电视app广告播放方法、装置及系统
CN114979691B (zh) * 2022-05-23 2023-07-28 上海影谱科技有限公司 一种体育赛事转播权益广告统计分析方法及系统
CN116939293B (zh) * 2023-09-17 2023-11-17 世优(北京)科技有限公司 植入位置的检测方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2483858A2 (en) * 2009-09-30 2012-08-08 Microsoft Corporation Video content-aware advertisement placement
CN103440640A (zh) * 2013-07-26 2013-12-11 北京理工大学 一种视频场景聚类及浏览方法
CN103780944A (zh) * 2012-10-17 2014-05-07 三亚中兴软件有限责任公司 广告播放方法、装置、系统及匹配信息建立装置
CN103888185A (zh) * 2014-03-24 2014-06-25 深圳市云猫信息技术有限公司 一种光网络单元的检测方法及装置、系统
CN104219559A (zh) * 2013-05-31 2014-12-17 奥多比公司 在视频内容中投放不明显叠加

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106100A1 (en) * 2005-04-26 2009-04-23 Governing Dynamics Llc Method of digital good placement in a dynamic, real time environment
US20090063250A1 (en) * 2007-09-04 2009-03-05 Burgess David A Controlled Targeted Experimentation
US20090063268A1 (en) * 2007-09-04 2009-03-05 Burgess David A Targeting Using Historical Data
KR100935390B1 (ko) * 2007-09-10 2010-01-06 (주)엔써즈 동영상 데이터 클러스터를 이용한 광고 데이터 설정 및제공 방법 및 장치
US20090171787A1 (en) * 2007-12-31 2009-07-02 Microsoft Corporation Impressionative Multimedia Advertising
JP5259212B2 (ja) * 2008-02-26 2013-08-07 Kddi株式会社 音楽連動型広告配信方法、装置およびシステム
US20110179445A1 (en) * 2010-01-21 2011-07-21 William Brown Targeted advertising by context of media content
US8463756B2 (en) * 2010-04-21 2013-06-11 Haileo, Inc. Systems and methods for building a universal multimedia learner
US8620912B2 (en) * 2010-06-16 2013-12-31 Microsoft Corporation Ranking advertisement(s) based upon advertisement feature(s)
CN102685550B (zh) * 2011-04-14 2014-07-09 天脉聚源(北京)传媒科技有限公司 一种网络视频广告投放方法和系统
US9058619B2 (en) * 2011-05-19 2015-06-16 Purushottaman Nandakumar System and method for measurement, planning, monitoring, and execution of out-of-home media
US20130024286A1 (en) * 2011-07-21 2013-01-24 Microsoft Corporation Multiple slack variables for balancing ad campaign risks
US8793252B2 (en) * 2011-09-23 2014-07-29 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation using dynamically-derived topics
US9613135B2 (en) * 2011-09-23 2017-04-04 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation of information objects
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
TWI591557B (zh) * 2012-05-07 2017-07-11 財團法人工業技術研究院 配置廣告的系統與方法
US20130344468A1 (en) * 2012-06-26 2013-12-26 Robert Taaffe Lindsay Obtaining Structured Data From Freeform Textual Answers in a Research Poll
US8935393B1 (en) * 2012-08-23 2015-01-13 Google Inc. Recommendations based on usage and resource consumption data
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US10650066B2 (en) * 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US8954346B1 (en) * 2013-06-03 2015-02-10 Inadco, Inc. Serving form ads with a video
US20150032729A1 (en) * 2013-07-23 2015-01-29 Salesforce.Com, Inc. Matching snippets of search results to clusters of objects
US9584874B1 (en) * 2014-06-16 2017-02-28 Juan José Farías Portal for collection and distribution of web-based audiovisual content blocks and creation of audience statistics
CN104077577A (zh) * 2014-07-03 2014-10-01 浙江大学 一种基于卷积神经网络的商标检测方法
CN104967885B (zh) * 2015-03-27 2019-01-11 哈尔滨工业大学深圳研究生院 一种基于视频内容感知的广告推荐方法及系统
US11205103B2 (en) * 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11429989B2 (en) * 2017-02-07 2022-08-30 Amobee, Inc. Method and system for generating audience clusters

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2483858A2 (en) * 2009-09-30 2012-08-08 Microsoft Corporation Video content-aware advertisement placement
CN103780944A (zh) * 2012-10-17 2014-05-07 三亚中兴软件有限责任公司 广告播放方法、装置、系统及匹配信息建立装置
CN104219559A (zh) * 2013-05-31 2014-12-17 奥多比公司 在视频内容中投放不明显叠加
CN103440640A (zh) * 2013-07-26 2013-12-11 北京理工大学 一种视频场景聚类及浏览方法
CN103888185A (zh) * 2014-03-24 2014-06-25 深圳市云猫信息技术有限公司 一种光网络单元的检测方法及装置、系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALEX KRIZHEVSKY: "ImageNet Classification with Deep Convolutional", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 *

Cited By (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016155345A1 (zh) * 2015-03-27 2016-10-06 哈尔滨工业大学深圳研究生院 一种基于视频内容感知的广告推荐方法及系统
CN105184646B (zh) * 2015-10-20 2019-04-30 中国民生银行股份有限公司 自助银行信息推送方法及装置
CN105184646A (zh) * 2015-10-20 2015-12-23 中国民生银行股份有限公司 自助银行信息推送方法及装置
CN108292419B (zh) * 2015-11-04 2022-02-25 李才圭 利用便携式通信终端第一个画面的内容物提供方法
CN108292419A (zh) * 2015-11-04 2018-07-17 李才圭 利用便携式通信终端第一个画面的内容物提供方法
CN105630996A (zh) * 2015-12-25 2016-06-01 腾讯科技(深圳)有限公司 一种信息处理方法和服务器
CN105657446B (zh) * 2015-12-30 2018-06-22 北京奇艺世纪科技有限公司 一种视频中贴片广告的检测方法和装置
CN105657446A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种视频中贴片广告的检测方法和装置
CN109906611A (zh) * 2016-03-16 2019-06-18 尼尔森(美国)有限公司 用于内容特征图谱化的特征图谱布局
CN109906611B (zh) * 2016-03-16 2021-06-25 尼尔森(美国)有限公司 用于内容特征图谱化的特征图谱布局的服务器及介质
CN107403185A (zh) * 2016-05-20 2017-11-28 北京大学 人像颜色转换方法和人像颜色转换系统
CN111885396A (zh) * 2016-06-30 2020-11-03 斯尼弗卡特公司 用于在流内容中拼接广告的系统和方法
US11917219B2 (en) 2016-06-30 2024-02-27 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
US11528515B2 (en) 2016-06-30 2022-12-13 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
CN111885396B (zh) * 2016-06-30 2022-12-06 斯尼弗卡特公司 用于在流内容中拼接广告的系统和方法
US11272228B2 (en) 2016-06-30 2022-03-08 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
CN106156732A (zh) * 2016-07-01 2016-11-23 合网络技术(北京)有限公司 对象识别方法和对象识别装置
CN107347166B (zh) * 2016-08-19 2020-03-03 北京市商汤科技开发有限公司 视频图像的处理方法、装置和终端设备
CN107347166A (zh) * 2016-08-19 2017-11-14 北京市商汤科技开发有限公司 视频图像的处理方法、装置和终端设备
US10769444B2 (en) 2016-09-08 2020-09-08 Goh Soo Siah Object detection from visual search queries
WO2018048355A1 (en) * 2016-09-08 2018-03-15 Aiq Pte. Ltd. Object detection from visual search queries
CN106776949A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 数据处理方法、装置及电子设备
CN106779073B (zh) * 2016-12-27 2019-05-31 西安石油大学 基于深度神经网络的媒体信息分类方法及装置
CN106779073A (zh) * 2016-12-27 2017-05-31 西安石油大学 基于深度神经网络的媒体信息分类方法及装置
CN107146096B (zh) * 2017-03-07 2020-08-18 浙江工业大学 一种智能视频广告展示方法及装置
CN107146096A (zh) * 2017-03-07 2017-09-08 浙江工业大学 一种智能视频广告展示方法及装置
CN106991641A (zh) * 2017-03-10 2017-07-28 北京小米移动软件有限公司 植入图片的方法及装置
CN107590442A (zh) * 2017-08-22 2018-01-16 华中科技大学 一种基于卷积神经网络的视频语义场景分割方法
JP2020534600A (ja) * 2017-09-22 2020-11-26 コンティネンタル・テーベス・アクチエンゲゼルシヤフト・ウント・コンパニー・オッフェネ・ハンデルスゲゼルシヤフト 車線認識方法および装置、運転支援システムならびに車両
CN110415005A (zh) * 2018-04-27 2019-11-05 华为技术有限公司 确定广告插入位置的方法、计算机设备和存储介质
CN112567416A (zh) * 2018-07-18 2021-03-26 华为电讯对外贸易有限公司 用于处理数字视频的设备及方法
CN112805739A (zh) * 2018-10-05 2021-05-14 三星电子株式会社 电子设备及其控制方法
CN111741327A (zh) * 2019-03-25 2020-10-02 华为技术有限公司 一种媒体处理方法及媒体服务器
US12014545B2 (en) * 2019-03-25 2024-06-18 Huawei Technologies Co., Ltd. Media processing method and media server
CN111741327B (zh) * 2019-03-25 2022-09-02 华为技术有限公司 一种媒体处理方法及媒体服务器
WO2020192187A1 (zh) * 2019-03-25 2020-10-01 华为技术有限公司 一种媒体处理方法及媒体服务器
CN111754254A (zh) * 2019-03-26 2020-10-09 维布络有限公司 在多媒体中动态创建和插入沉浸式推广内容的系统和方法
CN111242154A (zh) * 2019-04-01 2020-06-05 泰州市康平医疗科技有限公司 衣物柜收纳管理方法
CN111815340A (zh) * 2019-04-12 2020-10-23 百度在线网络技术(北京)有限公司 推广信息确定方法、装置、设备及可读存储介质
CN111815340B (zh) * 2019-04-12 2023-09-01 百度在线网络技术(北京)有限公司 推广信息确定方法、装置、设备及可读存储介质
WO2020233475A1 (zh) * 2019-05-22 2020-11-26 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算机设备和存储介质
CN110225366A (zh) * 2019-06-26 2019-09-10 腾讯科技(深圳)有限公司 视频数据处理及广告位确定方法、装置、介质及电子设备
CN110348529B (zh) * 2019-07-16 2021-10-22 上海惟也新文化科技有限公司 一种智能的衣服流行风格预测方法与系统
CN110348529A (zh) * 2019-07-16 2019-10-18 韶关市启之信息技术有限公司 一种智能的衣服流行风格预测方法与系统
CN110381369A (zh) * 2019-07-19 2019-10-25 腾讯科技(深圳)有限公司 推荐信息植入位置的确定方法、装置、设备及存储介质
US11928863B2 (en) 2019-07-19 2024-03-12 Tencent Technology (Shenzhen) Company Limited Method, apparatus, device, and storage medium for determining implantation location of recommendation information
CN110381369B (zh) * 2019-07-19 2022-02-22 腾讯科技(深圳)有限公司 推荐信息植入位置的确定方法、装置、设备及存储介质
WO2021057704A1 (en) * 2019-09-23 2021-04-01 Maycas System Limited Methods and systems for incorporating advertising materials into video images
CN111031366B (zh) * 2019-11-29 2021-12-17 深圳市掌众信息技术有限公司 一种在视频中植入广告的方法及系统
CN111031366A (zh) * 2019-11-29 2020-04-17 深圳市掌众信息技术有限公司 一种在视频中植入广告的方法及系统
CN113222995A (zh) * 2020-02-06 2021-08-06 阿里巴巴集团控股有限公司 视频处理方法、视频处理装置及电子设备
CN112085532B (zh) * 2020-09-10 2024-03-22 网易(杭州)网络有限公司 一种插入广告的方法、装置、计算机设备和介质
CN112085532A (zh) * 2020-09-10 2020-12-15 网易(杭州)网络有限公司 一种插入广告的方法、装置、计算机设备和介质
CN112348566A (zh) * 2020-10-15 2021-02-09 北京捷通华声科技股份有限公司 推荐广告的确定方法、装置及存储介质
CN112330371A (zh) * 2020-11-26 2021-02-05 深圳创维-Rgb电子有限公司 基于ai的智能广告推送方法及装置、系统及存储介质
CN116703485A (zh) * 2023-08-04 2023-09-05 山东创亿智慧信息科技发展有限责任公司 基于大数据的广告精准营销方法及系统
CN116703485B (zh) * 2023-08-04 2023-10-20 山东创亿智慧信息科技发展有限责任公司 基于大数据的广告精准营销方法及系统
CN116757748A (zh) * 2023-08-14 2023-09-15 广州钛动科技股份有限公司 基于随机梯度攻击的广告点击预测方法
CN116757748B (zh) * 2023-08-14 2023-12-19 广州钛动科技股份有限公司 基于随机梯度攻击的广告点击预测方法

Also Published As

Publication number Publication date
US10171844B2 (en) 2019-01-01
CN104967885B (zh) 2019-01-11
WO2016155345A1 (zh) 2016-10-06
US20180020247A1 (en) 2018-01-18

Similar Documents

Publication Publication Date Title
CN104967885B (zh) 一种基于视频内容感知的广告推荐方法及系统
Zhang et al. Object-level video advertising: an optimization framework
Zhang et al. Sitcom-star-based clothing retrieval for video advertising: a deep learning framework
CN106446015A (zh) 一种基于用户行为偏好的视频内容访问预测与推荐方法
US20130336520A1 (en) System and method for displaying contextual supplemental content based on image content
US20130094756A1 (en) Method and system for personalized advertisement push based on user interest learning
Ul Haq et al. Personalized Movie Summarization Using Deep CNN‐Assisted Facial Expression Recognition
CN106547908A (zh) 一种信息推送方法和系统
CN107862241B (zh) 一种基于明星识别的衣服时尚挖掘方法及视觉感知系统
CN113010701A (zh) 以视频为中心的融媒体内容推荐方法及装置
US12051209B2 (en) Automated generation of training data for contextually generated perceptions
CN113158023A (zh) 基于混合推荐算法的公共数字生活精准分类服务方法
Zhao et al. Flexible presentation of videos based on affective content analysis
US9449231B2 (en) Computerized systems and methods for generating models for identifying thumbnail images to promote videos
Kumar et al. $ c^+ $ GAN: Complementary Fashion Item Recommendation
Ikizler-Cinbis et al. Web-based classifiers for human action recognition
Papadopoulos et al. Automatic summarization and annotation of videos with lack of metadata information
Zhan et al. DeepShoe: An improved Multi-Task View-invariant CNN for street-to-shop shoe retrieval
Harakawa et al. Extracting hierarchical structure of web video groups based on sentiment-aware signed network analysis
Sharma et al. Video face clustering with self-supervised representation learning
Amorim et al. Novelty detection in social media by fusing text and image into a single structure
Sreeja et al. A unified model for egocentric video summarization: an instance-based approach
Zhang et al. Clothescounter: a framework for star-oriented clothes mining from videos
Valle et al. Content-based filtering for video sharing social networks
CN113343029A (zh) 社交关系增强的复杂视频人物检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant