CN106507157A - 广告投放区域识别方法及装置 - Google Patents

广告投放区域识别方法及装置 Download PDF

Info

Publication number
CN106507157A
CN106507157A CN201611125649.1A CN201611125649A CN106507157A CN 106507157 A CN106507157 A CN 106507157A CN 201611125649 A CN201611125649 A CN 201611125649A CN 106507157 A CN106507157 A CN 106507157A
Authority
CN
China
Prior art keywords
value
macro block
index value
region
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611125649.1A
Other languages
English (en)
Other versions
CN106507157B (zh
Inventor
崔玉斌
宋征
赵明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumavision Technologies Co Ltd
Original Assignee
Beijing Poly Chat Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Poly Chat Network Technology Co Ltd filed Critical Beijing Poly Chat Network Technology Co Ltd
Priority to CN201611125649.1A priority Critical patent/CN106507157B/zh
Publication of CN106507157A publication Critical patent/CN106507157A/zh
Application granted granted Critical
Publication of CN106507157B publication Critical patent/CN106507157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2668Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了广告投放区域识别方法及装置,涉及视频处理技术领域,其中,该广告投放区域识别方法包括:计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,将选定区域分为多个单区域,计算每个单区域的空间频率参数、渐变参数和活跃性参数,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域,判断频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置,根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域,通过上述方法能快速获合适的广告投放区域,计算简单,便捷。

Description

广告投放区域识别方法及装置
技术领域
本发明涉及视频处理技术领域,尤其涉及广告投放区域识别方法及装置。
背景技术
在我们观看视频的时候常常会看到在视频画面中投放出的多个植入广告,有的广告会投放在视频画面的中央,让人非常反感;有的广告会投放在视频画面的字幕上,影响了人们的正常观影;而有的广告会投放在视频画面的边缘,人眼来不及看就会消失等等,上述情况的广告均不能起到很好的宣传效果。因此,如何在视频画面中合适地植入广告,并无缝地融入到视频中起到良好的宣传效果成为了业界的一个难题。
在视频文件的拍摄过程中,可能采取不同的姿势来进行拍摄,镜头可能会拉伸造成对象尺度的变化;镜头可能会移动,例如平移或转圈等,造成对象角度的变化。而对于当今的影视内容,拍摄手法多样,镜头切变剧烈,渐变丰富,另外还有及其个别的剧烈摇晃的镜头,这对视频区域的检测带来非常大的挑战。
目前,常采用视频区域检测技术,在这种技术中,首先要切分视频帧,然后分析视频帧中的对象,最后确定适合投放广告的位置,另外,业界也常用VID检测技术来对视频画面进行检测,但是,VID只针对静止的图像,无法提取视频中的动态画面。鉴于在视频处理中,只有对宏块进行分析和 操作才能准确的选出广告投放对象,但是,要达到上述目标,需要对每一帧视频都进行复杂度非常大的计算,即使目前性能突出的Faster-R-CNN的计算速度也就是198ms每帧,相当于5帧/秒fps,而一般实时最低是25~30帧/秒,50场/秒,工业摄像设备的是几百fps。因此,上述算法均难以在视频画面中有效找到适合投放广告的区域。
发明内容
有鉴于此,本发明实施例的目的在于提供了广告投放区域识别方法及装置,通过将视频画面分为多个宏块来计算合适的广告投放区域,简化了算法。
第一方面,本发明实施例提供了广告投放区域识别方法,包括:
计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,其中,索引值根据编码模式计算得来;
将选定区域分为多个单区域,计算每个单区域的空间频率参数、渐变参数和活跃性参数,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域;
判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置;
根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,计算当前视频画面中每个宏块的索引值,根据索引值构建选定区域包括:
根据权利要求1所述的广告投放区域识别方法,其特征在于,所述计算当前视频画面中每个宏块的索引值,根据所述索引值构建选定区域包括:
根据预设的编码模式得出视频画面中每个宏块的索引值;
横向选取索引值为连续的第一数值或第二数值的宏块作为第一边长;
以所述第一边长左侧的端点为顶点,纵向选取索引值为连续的第一数值或第二数值的宏块长度作为第二边长;
根据所述第一边长和所述第二边长构建选定区域。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,计算每个单区域的空间频率参数,并转换为频率区域包括:
对每个宏块进行离散余弦变换,得到变换系数Vi
将变换系数Vi进行扫描,得到扫描序号Idxi
分别计算每个宏块的空间频率参数:其中,|Vi|为变换系数Vi的绝对值,Idxi为扫描序号,CF为固定数值,n为4或8;
比较每个宏块的空间频率参数与预先设定的标准频率值的大小,当SF的值大于预先设定的标准频率值时,设置宏块的索引值为第一常数,当SF的值小于或等于预先设定的标准频率值时,设置宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到频率区域。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,计算每个单区域的渐变参数,并转换为渐变区域包括:
计算单区域内宏块的阿尔法通道值
计算每个宏块的渐变参数其中,n为单区域内宏块的个数;
将渐变参数与标准渐变值进行比对,当渐变参数大于标准渐变值时,设置宏块的索引值为第一常数,当渐变参数小于或等于标准渐变值时,设置宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到渐变区域。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方 式,其中,计算每个单区域的活跃性参数,并转换为活跃性区域包括:
提取每个宏块在X轴的运动矢量Xv和Y轴的运动矢量YV
计算每个宏块的活跃性参数其中,CT为一个常数;
比较活跃性参数与标准活跃性值的大小,当活跃性参数小于标准活跃性值时,设置宏块的索引值为第一常数,当活跃性参数大于或等于标准活跃性值时,设置宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到活跃性区域。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,判断每个单区域的频率区域、渐变区域和活跃性区域是否重合包括:
计算每个单区域的重叠系数其中,T为频率区域中宏块的索引值集合,A为渐变区域中宏块的索引值集合,P为活跃性区域中宏块的索引值集合;
判断θc是否大于预先设定的重合系数;
当上述判断为是时,判定每个单区域的频率区域、渐变区域和活跃性区域重合。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置包括:
对选定区域进行边缘检测,得到检测数值;
比较检测数值与预先设定的边缘值的大小,当检测数值大于预先设定的边缘值时,将宏块的索引值设置为0,当检测数值小于或等于预先设定的边缘值时,将宏块的索引值设置为1。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方 式,其中,对选定区域进行扫描,根据扫描的结果获取广告投放区域包括:
从选定区域的左上顶点或右下顶点计算全零游程,选取全零游程中两条最长的折线上的四个顶点,分别定义为PLB、PRT、PLT、PRB,其中,PLB和PRT确定一条线段La,PLT和PRB确定一条线段Lb
取La和Lb的交点为菱形的中心Pc,Pc与PLB形成第一边长,Pc与PRT形成第二边长,取第一边长和第二边长中较短的边长为第一菱形边长,Pc与PLT形成第三边长,Pc与PRB形成第四边长,取第三边长和第四边长中较短的边长为第二菱形边长,以第一菱形边长、第二菱形边长和Pc组建成菱形;
根据第一菱形边长、第二菱形边长和Pc计算菱形的夹角。
结合第一方面的第七种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,方法还包括:
当所述第一菱形边长、第二菱形边长和Pc无法组建成菱形时,调整所述标准频率值、标准渐变值、标准活跃性值或者重合系数的大小,使所述第一菱形边长、第二菱形边长和Pc组建成菱形。
第二方面,本发明实施例提供了广告投放区域识别装置,包括:选定区域构建模块,用于计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,其中,索引值根据编码模式计算得来;
区域划分模块,用于将选定区域分为多个单区域,计算每个单区域的空间频率参数、渐变参数和活跃性参数,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域;
重合判定模块,用于判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置;
扫描模块,用于根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域。
本发明实施例提供的广告投放区域识别方法及装置,其中,该广告投放区域识别方法包括:计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,将选定区域分为多个单区域,计算每个单区域的空间频率参数、渐变参数和活跃性参数,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域,判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置,根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域。上述算法计算简单,并能快速有效的得到准确的广告投放区域。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的广告投放区域识别方法的流程图;
图2示出了本发明实施例所提供的选定区域的示意图;
图3示出了本发明实施例所提供的对选定区域进行扫描的示意图;
图4示出了本发明实施例所提供的广告投放区域识别装置的结构连接图。
图标:1-选定区域构建模块;2-区域划分模块;3-重合判定模块;4-扫描模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在视频的拍摄过程中,常常会采取不同的姿势来进行拍摄,加上拍摄手法的多样,使得视频画面的平滑度和边缘都难以判定,如果想将广告投放在视频文件中,需要对视频区域进行极其复杂的检测。目前有VID等检测技术来对视频画面进行检测,不仅算法复杂,而且也难以准确的找到广告投放区域。
基于此,本发明实施例提供了广告投放区域识别方法及装置,下面通过实施例进行描述。
实施例1
如图1所示,本实施例提出的广告投放区域识别方法包括以下具体步骤:
步骤S101:计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,其中,索引值根据编码模式(例如,在H.264码流中,SKIP模式索引值为0,16x16模式索引值为1,场编码模式为21)计算得来,具 体包括:
(1)根据预设的编码模式得出视频画面中每个宏块的索引值,根据场编码模式得到当前视频画面的各个索引值,如图2所示,通过编码得到一个11*15的索引值表。
(2)横向选取索引值为连续的第一数值或第二数值的宏块作为第一边长,参见图2,第一数值和第二数值分别取值为0或1,在索引值表的横向方向上,在4个连续的0后有4个连续的1,之后索引值为2,故横向选取8个宏块作为第一边长。
(3)以第一边长左侧的端点为顶点,纵向选取索引值为连续的第一数值或第二数值的宏块作为第二边长,如图2所示,以左上角的索引值为0的宏块作为顶点,纵向选取索引值为连续的0或1的10个宏块作为第二边长。
(4)如图2所示,根据第一边长和第二边长构建选定区域。当以第一边长和第二边长无法构建成矩形的选定区域时,以第一边长左侧的端点为顶点,纵向选取索引值为连续的第一数值或第二数值最小的宏块长度作为第二边长,以所述第二边长的各个宏块为中心,横向向两边拓展,选取索引值为连续的第一数值或第二数值的宏块,把长度最小的作为第三边长,根据第三边长和第二边长构建选定区域。在具体实施过程中,一般会在外围设定一个一定像素宽的包围轮廓(例如16个像素宽)。
步骤S102:将选定区域分为多个单区域,一方面是为了便于计算,将上述选定区域分为多个单区域,另一方面,为了对选定区域进行细化,以更准确的计算各个参数,之后,计算每个单区域的空间频率参数、渐变参数和活跃性参数,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域,以衡量该单区域的平滑性和活跃性等参数,具体包括:
(1)计算每个单区域的空间频率参数,并转换为频率区域,具体包括:
对每个宏块进行离散余弦变换,得到变换系数Vi
将变换系数Vi进行扫描,得到扫描序号Idxi
本发明采用zigzag顺序对各个dct系数绝对值及其对应的zigzag的索引进行乘积得到空间频率,分别计算每个宏块的空间频率参数: 其中,|Vi|为变换系数Vi的绝对值,Idxi为扫描序号,CF为固定数值,优选,CF取值为(n+1)2,n为4或8;
比较每个宏块的空间频率参数与预先设定的标准频率值的大小,其中,标准频率值为根据空间频率参数得到的参考值,当SF的值大于预先设定的标准频率值时,设置宏块的索引值为第一常数,当SF的值小于或等于预先设定的标准频率值时,设置宏块的索引值为第二常数,其中,常见,第一常数为0,第二常数为1;
由上述索引值为第一常数或第二常数的宏块得到频率区域。
(2)计算每个单区域的渐变参数,并转换为渐变区域,具体包括:
计算单区域内宏块的阿尔法通道值
计算每个宏块的渐变参数其中,n为单区域内宏块的个数;
将渐变参数与标准渐变值进行比对,当渐变参数大于标准渐变值时,其中,标准渐变值为根据渐变参数得到的参考值,设置宏块的索引值为第一常数,当渐变参数小于或等于标准渐变值时,设置宏块的索引值为第二常数,其中,常见,第一常数为0,第二常数为1;
由上述索引值为第一常数或第二常数的宏块得到渐变区域。
(3)计算每个单区域的活跃性参数,并转换为活跃性区域,具体包括:
提取每个宏块在X轴的运动矢量Xv和Y轴的运动矢量YV
计算每个宏块的活跃性参数其中,CT为一个常数,优 选取值为5;
比较活跃性参数与标准活跃性值的大小,其中,标准活跃性值为根据活跃性参数得到的参考值,当活跃性参数小于标准活跃性值时,设置宏块的索引值为第一常数,当活跃性参数大于或等于标准活跃性值时,设置宏块的索引值为第二常数,其中,常见,第一常数为0,第二常数为1;
由上述索引值为第一常数或第二常数的宏块得到活跃性区域。
步骤S103:判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置,具体包括:
(1)判断每个单区域的频率区域、渐变区域和活跃性区域是否重合包括:
计算每个单区域的重叠系数其中,T为频率区域中宏块的索引值集合,A为渐变区域中宏块的索引值集合,P为活跃性区域中宏块的索引值集合;
通过上述计算,判断θc是否大于预先设定的重合系数,优选,预先设定的重合系数取值为0.8;
当上述判断为是时,判定每个单区域的频率区域、渐变区域和活跃性区域重合。
(2)对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置包括:
如图3所示,对选定区域进行Sobel边缘检测,得到检测数值,以使得到的区域不靠近视频画面的边缘;
比较检测数值与预先设定的边缘值的大小,当检测数值大于预先设定的边缘值时,将宏块的索引值设置为0,当检测数值小于或等于预先设定的边缘值时,将宏块的索引值设置为1。
步骤S104:根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域,具体包括:
(1)对选定区域进行扫描,这里,所述扫描为2次zigzag扫描,其中,一次扫描从选定区域的左上顶点开始,另一次扫描从选定区域的右下顶点开始,根据扫描的结果获取广告投放区域。
(2)从选定区域的左上顶点或右下顶点计算全零游程,选取全零游程中两条最长的折线上的四个顶点,分别定义为PLB、PRT、PLT、PRB,其中,PLB和PRT确定一条线段La,PLT和PRB确定一条线段Lb
(3)取La和Lb的交点为菱形的中心Pc,Pc与PLB形成第一边长,Pc与PRT形成第二边长,取第一边长和第二边长中较短的边长为第一菱形边长,Pc与PLT形成第三边长,Pc与PRB形成第四边长,取第三边长和第四边长中较短的边长为第二菱形边长,以第一菱形边长、第二菱形边长和Pc组建成菱形。
(4)根据第一菱形边长、第二菱形边长和Pc计算菱形的夹角。由于,视频画面在拍摄时是有一定的角度设计的,并不是贴于屏幕的平面,故计算出夹角,以方便广告的嵌入。
当根据(3)方法不能组建成菱形时,该方法还包括:
当所述第一菱形边长、第二菱形边长和Pc无法组建成菱形时,进行视频中的广告投放区域正样本采集,并按照主客观的视频复杂度进行正样本分类,计算样本的标准频率值、标准渐变值、标准活跃性值或者重合系数,按照上述样本值重复上述步骤。当所述第一菱形边长、第二菱形边长和Pc仍旧无法组建成菱形时,调整标准频率值、标准渐变值、标准活跃性值或者重合系数的大小,由于,标准频率值、标准渐变值、标准活跃性值或者重合系数都是根据计算结果算得的参考值,故可以进行数值的调整,这样通过调整后使第一菱形边长、第二菱形边长和Pc组建成菱形。
综上所述,本实施例提供的广告投放区域识别方法,包括:计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,依据索引值计算每个单区域的空间频率参数、渐变参数和活跃性参数,并将该单区域转换为频率区域、渐变区域和活跃性区域,判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,来检测视频画面的平滑度。并对选定区域进行边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置,根据索引值对选定区域进行扫描,依据扫描的结果获取广告投放区域。通过上述算法能在视频画面中,快速有效的找到适合广告投放的区域。
实施例2
如图4所示,本实施例提供了广告投放区域识别装置包括:选定区域构建模块1、区域划分模块2、重合判定模块3和扫描模块4,通过选定区域构建模块1来计算当前视频画面中每个宏块的索引值,并根据索引值构建选定区域,其中,索引值根据编码模式计算得来。
通过区域划分模块2将选定区域分为多个单区域,计算每个单区域的空间频率参数、渐变参数和活跃性参数,即通过这三个参数来分别衡量单区域的特性,并根据空间频率参数、渐变参数和活跃性参数分别将每个单区域转换为频率区域、渐变区域和活跃性区域。
由重合判定模块3判断每个单区域变换得到的频率区域、渐变区域和活跃性区域是否重合,当上述判断均为是时,对选定区域进行Sobel边缘检测,根据边缘检测的结果将选定区域内每个宏块的索引值重新进行设置,以判定当前的区域是否在视频画面的边缘位置。
扫描模块4,用于根据索引值对选定区域进行两次zigzag扫描,依据扫描的结果获取广告投放区域。
综上所述,本实施例提供的广告投放区域识别装置,通过设置上述选 定区域构建模块1、区域划分模块2、区域划分模块2和扫描模块4,使得根据视频画面中每个宏块的索引值来将每个单区域转换为频率区域、渐变区域和活跃性区域,通过比对当每个单区域变换得到的频率区域、渐变区域和活跃性区域重合时,来对视频画面的平滑度进行分析,通过对选定区域进行边缘检测使得视频画面的边缘和非边缘得以区分,并通过边缘检测的结果来对索引值重新进行设置,最后,通过扫描的结果来获取广告投放区域,通过这种算法能在视频画面中准确有效的选出适宜投放广告的区域。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.广告投放区域识别方法,其特征在于,包括:
计算当前视频画面中每个宏块的索引值,并根据所述索引值构建选定区域,其中,所述索引值根据编码模式计算得来;
将所述选定区域分为多个单区域,计算每个所述单区域的空间频率参数、渐变参数和活跃性参数,并根据所述空间频率参数、渐变参数和活跃性参数分别将每个所述单区域转换为频率区域、渐变区域和活跃性区域;
判断每个所述单区域变换得到的所述频率区域、所述渐变区域和所述活跃性区域是否重合,当上述判断均为是时,对所述选定区域进行边缘检测,根据边缘检测的结果将所述选定区域内每个宏块的所述索引值重新进行设置;
根据所述索引值对所述选定区域进行扫描,依据所述扫描的结果获取广告投放区域。
2.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述计算当前视频画面中每个宏块的索引值,根据所述索引值构建选定区域包括:
根据预设的编码模式得出视频画面中每个宏块的索引值;
横向选取索引值为连续的第一数值或第二数值的宏块作为第一边长;
以所述第一边长左侧的端点为顶点,纵向选取索引值为连续的第一数值或第二数值的宏块长度作为第二边长;
根据所述第一边长和所述第二边长构建选定区域。
3.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述计算每个所述单区域的空间频率参数,并转换为频率区域包括:
对每个所述宏块进行离散余弦变换,得到变换系数Vi
将所述变换系数Vi进行扫描,得到扫描序号Idxi
分别计算每个宏块的空间频率参数:其中,|Vi|为变换系数Vi的绝对值,Idxi为扫描序号,CF为固定数值,n为4或8;
比较每个宏块的所述空间频率参数与预先设定的标准频率值的大小,当SF的值大于预先设定的标准频率值时,设置所述宏块的索引值为第一常数,当SF的值小于或等于预先设定的标准频率值时,设置所述宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到频率区域。
4.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述计算每个所述单区域的渐变参数,并转换为渐变区域包括:
计算所述单区域内宏块的阿尔法通道值
计算每个所述宏块的渐变参数其中,n为单区域内宏块的个数;
将所述渐变参数与标准渐变值进行比对,当所述渐变参数大于标准渐变值时,设置所述宏块的索引值为第一常数,当所述渐变参数小于或等于标准渐变值时,设置所述宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到渐变区域。
5.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述计算每个所述单区域的活跃性参数,并转换为活跃性区域包括:
提取每个宏块在X轴的运动矢量Xv和Y轴的运动矢量YV
计算每个宏块的活跃性参数其中,CT为一个常数;
比较所述活跃性参数与标准活跃性值的大小,当所述活跃性参数小于标准活跃性值时,设置所述宏块的索引值为第一常数,当所述活跃性参数大于或等于标准活跃性值时,设置所述宏块的索引值为第二常数;
由上述索引值为第一常数或第二常数的宏块得到活跃性区域。
6.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述判断每个所述单区域的所述频率区域、所述渐变区域和所述活跃性区域是否重合包括:
计算每个所述单区域的重叠系数其中,T为频率区域中宏块的索引值集合,A为渐变区域中宏块的索引值集合,P为活跃性区域中宏块的索引值集合;
判断θc是否大于预先设定的重合系数;
当上述判断为是时,判定每个所述单区域的所述频率区域、所述渐变区域和所述活跃性区域重合。
7.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述对所述选定区域进行边缘检测,根据边缘检测的结果将所述选定区域内每个宏块的索引值重新进行设置包括:
对所述选定区域进行边缘检测,得到检测数值;
比较检测数值与预先设定的边缘值的大小,当检测数值大于预先设定的边缘值时,将宏块的索引值设置为0,当检测数值小于或等于预先设定的边缘值时,将宏块的索引值设置为1。
8.根据权利要求1所述的广告投放区域识别方法,其特征在于,所述对所述选定区域进行扫描,根据所述扫描的结果获取广告投放区域包括:
从所述选定区域的左上顶点或右下顶点计算全零游程,选取所述全零游程中两条最长的折线上的四个顶点,分别定义为PLB、PRT、PLT、PRB,其中,PLB和PRT确定一条线段La,PLT和PRB确定一条线段Lb
取La和Lb的交点为菱形的中心Pc,Pc与PLB形成第一边长,Pc与PRT形成第二边长,取第一边长和第二边长中较短的边长为第一菱形边长,Pc与PLT形成第三边长,Pc与PRB形成第四边长,取第三边长和第四边长中较短的边长为第二菱形边长,以第一菱形边长、第二菱形边长和Pc组建成菱形;
根据所述第一菱形边长、第二菱形边长和Pc计算所述菱形的夹角。
9.根据权利要求8所述的广告投放区域识别方法,其特征在于,所述方法还包括:
当所述第一菱形边长、第二菱形边长和Pc无法组建成菱形时,调整所述标准频率值、标准渐变值、标准活跃性值或者重合系数的大小,使所述第一菱形边长、第二菱形边长和Pc组建成菱形。
10.广告投放区域识别装置,其特征在于,包括:
选定区域构建模块,用于计算当前视频画面中每个宏块的索引值,并根据所述索引值构建选定区域,其中,所述索引值根据编码模式计算得来;
区域划分模块,用于将所述选定区域分为多个单区域,计算每个所述单区域的空间频率参数、渐变参数和活跃性参数,并根据所述空间频率参数、渐变参数和活跃性参数分别将每个所述单区域转换为频率区域、渐变区域和活跃性区域;
重合判定模块,用于判断每个所述单区域变换得到的所述频率区域、所述渐变区域和所述活跃性区域是否重合,当上述判断均为是时,对所述选定区域进行边缘检测,根据边缘检测的结果将所述选定区域内每个宏块的所述索引值重新进行设置;
扫描模块,用于根据所述索引值对所述选定区域进行扫描,依据所述扫描的结果获取广告投放区域。
CN201611125649.1A 2016-12-08 2016-12-08 广告投放区域识别方法及装置 Active CN106507157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611125649.1A CN106507157B (zh) 2016-12-08 2016-12-08 广告投放区域识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611125649.1A CN106507157B (zh) 2016-12-08 2016-12-08 广告投放区域识别方法及装置

Publications (2)

Publication Number Publication Date
CN106507157A true CN106507157A (zh) 2017-03-15
CN106507157B CN106507157B (zh) 2019-06-14

Family

ID=58330282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611125649.1A Active CN106507157B (zh) 2016-12-08 2016-12-08 广告投放区域识别方法及装置

Country Status (1)

Country Link
CN (1) CN106507157B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556336A (zh) * 2020-05-12 2020-08-18 腾讯科技(深圳)有限公司 一种多媒体文件处理方法、装置、终端设备及介质
CN112819524A (zh) * 2021-01-29 2021-05-18 卡莱特云科技股份有限公司 一种广告分区投放方法、系统及计算机设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728781A (zh) * 2004-07-30 2006-02-01 新加坡科技研究局 将附加内容插入视频的方法和装置
US20080231751A1 (en) * 2007-03-22 2008-09-25 Sony Computer Entertainment America Inc. Scheme for determining the locations and timing of advertisements and other insertions in media
CN101621636A (zh) * 2008-06-30 2010-01-06 北京大学 基于视觉注意力模型的广告标志插入和变换方法及系统
US20120137015A1 (en) * 2010-11-30 2012-05-31 General Instrument Corporation Method of targeted ad insertion using http live streaming protocol
US8578407B1 (en) * 2012-07-10 2013-11-05 Joao Redol Real time automated unobtrusive ancilliary information insertion into a video
CN103974126A (zh) * 2014-05-15 2014-08-06 北京奇艺世纪科技有限公司 一种在视频中植入广告的方法及装置
CN104574271A (zh) * 2015-01-20 2015-04-29 复旦大学 一种广告图标嵌入数字图像的方法
CN104918060A (zh) * 2015-05-29 2015-09-16 北京奇艺世纪科技有限公司 一种视频广告中插点位置的选择方法和装置
CN105635786A (zh) * 2014-11-05 2016-06-01 深圳Tcl数字技术有限公司 广告投放的方法及显示设备
CN105657446A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种视频中贴片广告的检测方法和装置
CN105684011A (zh) * 2013-06-27 2016-06-15 英特尔公司 自适应嵌入视觉广告内容到媒体内容中

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728781A (zh) * 2004-07-30 2006-02-01 新加坡科技研究局 将附加内容插入视频的方法和装置
US20080231751A1 (en) * 2007-03-22 2008-09-25 Sony Computer Entertainment America Inc. Scheme for determining the locations and timing of advertisements and other insertions in media
CN101641873A (zh) * 2007-03-22 2010-02-03 美国索尼电脑娱乐公司 用于确定媒体中的广告和其他插入物的位置和时序的方案
CN101621636A (zh) * 2008-06-30 2010-01-06 北京大学 基于视觉注意力模型的广告标志插入和变换方法及系统
US20120137015A1 (en) * 2010-11-30 2012-05-31 General Instrument Corporation Method of targeted ad insertion using http live streaming protocol
US8578407B1 (en) * 2012-07-10 2013-11-05 Joao Redol Real time automated unobtrusive ancilliary information insertion into a video
CN105684011A (zh) * 2013-06-27 2016-06-15 英特尔公司 自适应嵌入视觉广告内容到媒体内容中
CN103974126A (zh) * 2014-05-15 2014-08-06 北京奇艺世纪科技有限公司 一种在视频中植入广告的方法及装置
CN105635786A (zh) * 2014-11-05 2016-06-01 深圳Tcl数字技术有限公司 广告投放的方法及显示设备
CN104574271A (zh) * 2015-01-20 2015-04-29 复旦大学 一种广告图标嵌入数字图像的方法
CN104918060A (zh) * 2015-05-29 2015-09-16 北京奇艺世纪科技有限公司 一种视频广告中插点位置的选择方法和装置
CN105657446A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种视频中贴片广告的检测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆枫,等.: "基于细粒度标签的在线视频广告投放机制研究", 《计算机研究与发展》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556336A (zh) * 2020-05-12 2020-08-18 腾讯科技(深圳)有限公司 一种多媒体文件处理方法、装置、终端设备及介质
CN112819524A (zh) * 2021-01-29 2021-05-18 卡莱特云科技股份有限公司 一种广告分区投放方法、系统及计算机设备
CN112819524B (zh) * 2021-01-29 2024-04-02 卡莱特云科技股份有限公司 一种广告分区投放方法、系统及计算机设备

Also Published As

Publication number Publication date
CN106507157B (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN105830093B (zh) 用于产生与非均匀大小的空间区相关的元数据的系统、方法及设备
KR101104144B1 (ko) 모션 분석 시스템
KR101618814B1 (ko) 단일객체에 대한 기울기를 추정하는 영상을 감시하는 장치 및 방법
CN106464959B (zh) 半导体集成电路和具备该半导体集成电路的显示装置及控制方法
CN104239909B (zh) 一种图像的识别方法和装置
US20060132487A1 (en) Method of analyzing moving objects using a vanishing point algorithm
CN104867128B (zh) 图像模糊检测方法和装置
US20080013791A1 (en) Object velocity measuring apparatus and object velocity measuring method
KR102199094B1 (ko) 관심객체 검출을 위한 관심영역 학습장치 및 방법
CN107295230A (zh) 一种基于红外热像仪的微型目标物移动侦测装置及方法
CN106204633A (zh) 一种基于计算机视觉的学生跟踪方法和装置
CN107862713A (zh) 针对轮询会场的摄像机偏转实时检测预警方法及模块
CN103514460B (zh) 视频监控多视角车辆检测方法和装置
CN110443170A (zh) 一种人体关键点确定方法、装置及电子设备
CN106507157A (zh) 广告投放区域识别方法及装置
US20090180670A1 (en) Blocker image identification apparatus and method
JP2010152800A (ja) 画像処理装置、画像処理方法およびプログラム
US9478032B2 (en) Image monitoring apparatus for estimating size of singleton, and method therefor
CN104769486B (zh) 使用偏振差摄像机的图像处理系统
CN103618899B (zh) 基于光强信息的视频插帧篡改检测方法及装置
CN106447660B (zh) 图片检测方法和装置
JP2019027882A (ja) 物体距離検出装置
KR102107137B1 (ko) 팬틸트줌 카메라를 이용한 이벤트 감지방법 및 장치
CN104112266B (zh) 一种图像边缘虚化的检测方法和装置
CN106203266B (zh) 图像极值点的提取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180427

Address after: 100085 Haidian District, Beijing, Shanghai Information Industry Base Development Road 15, 1 buildings.

Applicant after: BEIJING SUMAVISION TECHNOLOGIES CO., LTD.

Address before: 100000, 6 floor, 1 building, No. 1, Shanghai East Road, Haidian District, Beijing, 602, -6023

Applicant before: Beijing poly chat network technology Co., Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant