CN103477349B - 标志识别 - Google Patents

标志识别 Download PDF

Info

Publication number
CN103477349B
CN103477349B CN201280011788.5A CN201280011788A CN103477349B CN 103477349 B CN103477349 B CN 103477349B CN 201280011788 A CN201280011788 A CN 201280011788A CN 103477349 B CN103477349 B CN 103477349B
Authority
CN
China
Prior art keywords
frame
template
feeding
mark
roi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280011788.5A
Other languages
English (en)
Other versions
CN103477349A (zh
Inventor
T.恰托帕德西亚
A.辛哈
A.帕尔
D.普拉丹
S.罗伊乔德胡里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN103477349A publication Critical patent/CN103477349A/zh
Application granted granted Critical
Publication of CN103477349B publication Critical patent/CN103477349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • H04N21/23892Multiplex stream processing, e.g. multiplex stream encrypting involving embedding information at multiplex stream level, e.g. embedding a watermark at packet level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark

Abstract

本文说明了一种用于识别标志的计算机化方法。该方法包括获取馈给视频的多个馈给帧,其中,该馈给视频具有嵌入在其中的标志。将来自多个馈给帧的至少一个馈给帧与多个模板中的每一个模板进行比较。针对与该馈给帧相比较的每一个模板计算相关性参数,并基于该计算识别出该标志。

Description

标志识别
技术领域
本文所说明的主题一般地涉及识别方案,并尤其涉及对频道标志的识别。
背景技术
随着技术的问世,视觉媒体,特别是电视,已经成为群众当中使用最为广泛的娱乐来源。电视网络服务供应商通过模拟传输或数字传输,使观众可使用频道。由电视网络服务供应商发射的频道由在观众端的例如电视机或机顶盒的接收系统接收。每个频道通常都具有嵌入在传输流中的标志,使得观众可辨别出他们所观看的频道。
传统的接收系统包括各种识别方案,以为不同的目的实现标志识别。在传统的接收系统中,在一个示例中,由接收系统识别标志,以确认在所发送的视频中是否存在标志。如果接收系统确认标志不存在,那么就假设传输已经由于例如一个或多个广告而被干扰。另外,与接收系统相关联的记录系统可被配置成,在所传输的视频中不存在标志的期间,中断对所传输的视频的记录。
传统使用的标识方案通常是基于模板匹配技术的,其中将所传输的视频的帧中的所有像素与多个在先存储的模板中相应的像素进行比较。在少数其它传统方案中,将处于关注区域(ROI)中的像素与多个在先存储的模板进行比较。这样的传统的标志识别方案并未考虑到在特定频道中标志的透明背景(transparent background)和非静态像素的影响。
发明内容
本发明内容被提供来用于介绍关于标志识别的概念。在下面的详细说明中进一步说明了这些概念。本发明内容既非意图确定要保护的主题的必要特征,也不意图用来确定或限制要保护的主题的范围。
在本文中所说明的主题涉及一种计算机化的方法,其用于在本文中所说明的标志识别。该方法包括获取馈给视频的多个馈给帧,其中,该馈给视频具有被嵌入在其中的标志。将来自该多个馈给帧中的至少一个馈给帧与来自多个模板的每一个模板进行比较。针对与该馈给帧比较的每一个模板,计算相关性参数,并且基于该计算来识别标志。
附图说明
参考附图提供了详细的说明。在附图中,参考编号中最左边的数字标识出了最先出现该参考编号的附图。贯穿各附图,使用相同的编号来指示相似的特征和组件。
图1示出了依据本主题的实施例的标志识别系统的示例性网络环境实现。
图2示出了依据本主题的实现,示例性的标志识别系统。
图3示出了依据本主题的实现,用于识别标志的示例性方法。
图4示出了依据本主题的实现,产生用于标志识别的模板数据库的示例性方法。
具体实施方式
本文中所说明的主题涉及标志识别。在本文中所说明的关于标志识别的系统和方法可在包括不同装置的传输或接收系统中实现,这些装置诸如机顶盒、基站收发系统(BTS)、计算装置、电视、移动电话、笔记本电脑、个人数字助理(PDA),等。
传统的标志识别方案通常是基于模板匹配技术的,其中,将视频的帧中的像素或该帧中关注区(ROI)中的像素与多个预存储的模板进行比较。例如,扫描ROI中的像素中的每一条线,以识别该模板中相似的像素或像素块。但是,在特定频道中,标志具有透明背景。在这样的情况下,所考虑的视频的ROI中的像素中的一些像素并不是静态的,而是频繁变化的。对于这样的标志,这种识别一般会出错误,这是因为传统的用于识别标志的模板匹配技术是将ROI中的所有像素与模板中的像素进行比较。
实现数字传输和接收的传统接收系统包括与所接收的数字视频信号一起嵌入的标志和与该标志相关的信息,例如,频道的电子节目指南(EPG)。然而,在模拟信号中将这样的信息包括在内是不可行的。
本文中所说明的实施例示出了例如用于模拟传输的标志识别的方法和系统。依据一实施例,生成模板数据库,该模板数据库包括模板,该模板与由电视网络服务供应商所提供的每一个频道对应,并被存储在频道文件中。在所述实施例中,频道文件中所列出的所有频道的样品视频(specimen video)都被记录约5至10秒的时长。在另一个实施例中,可记录更长持续时间,约10至15分钟,的样品视频,以降低标志识别过程中的出错。在样品视频的记录过程中,记录样品视频中的多个帧。
进一步地,在一实现中,包括静态像素的区域或者通过诸如鼠标或键盘的外围设备被手动地标记为每一个样品视频的关注区域(ROI),或者通过系统自动地识别出。将理解的是,对于样品视频所标识或标记的ROI也是该样品视频的帧中的每一个帧的ROI。在另一个实现中,在记录这些频道的样品视频的过程中,对于这些频道,样品视频中的仅仅ROI被记录。
一旦标识并标记出ROI,则实现对像素颜色的量化。颜色的量化可被理解为不同颜色的值的量化。在一个示例中,初始地以UYVY颜色格式表达的ROI中像素的颜色被转换成色调饱和度值(HSV)颜色空间,并被量化。
在一实现中,在像素的颜色的值被量化后,对ROI中静态的以及非静态的像素进行标识和注释。在所述实施中,通过随机测量技术来标识对应于某频道的一个样品视频中的静态的和非静态的像素。例如,为不同帧的ROI中的像素,计算出HSV颜色域中经量化的颜色值的色散。在所述示例中,如果像素的颜色的色散值小于色散阈值,则表示该像素的颜色随时间变化保持静态,并因此,该像素为标志的一部分。这样的像素被注释为关注像素(POI)。另一方面,如果该像素的颜色的色散值大于色散阈值,则表示该像素的颜色随时间变化,并因此,该像素可能是标志的透明背景的一部分。这样的像素被注释为“白”像素。
在一个实现中,被注释为样品视频的ROI中的POI的像素,与它们的经量化的颜色一起,以及该样品视频的ROI中的白像素,被存储在模板中。而且,该模板与发送该样品视频的频道相关联。在样品视频中标识或标记的ROI被称为模板ROI,其也可以与该样品所对应的频道的模板一起存储。在一个示例中,划定样品视频的ROI的边界的坐标作为模板ROI存储起来。
以上所提及的将像素注释成POI和ROI中的白像素是针对所有样品视频进行的,以完成模板数据库的生成,该模板数据库具有用于频道文件中所有这样的频道的模板。而且,模板数据库中的每一个模板与标志ID相关联,标志ID可进一步与被存储在该频道文件中的频道ID相关联。
在一个实施例中,模板数据库以通信的方式被耦接到在客户端/观众端的至少一个接收装置(例如机顶盒)上。在一个示例中,接收装置以模拟传输的方式工作,并接收来自传输装置的频道的射频模拟信号。而且,标志识别系统可在接收装置内实现。
在一实施例中,当接收装置开始从传输装置接收信号并在例如电视屏幕上显示馈给视频时,发起针对该馈给视频的标志识别处理。据此,由标志识别系统存储该馈给视频的多个帧,称为馈给帧。为了标志识别的目的,将来自多个馈给帧的一个馈给帧与模板数据库中的多个模板逐个地比较。
依据一方面,当模板数据库中的一个模板与馈给帧之间的比较开始时,同时在该馈给帧中标识出关注区域(ROI)。在所述实现中,基于与模板相关联的信息,例如属于模板ROI的信息,标识出馈给帧中的ROI。
而且,基于与馈给帧比较的模板,标识出馈给帧中的POI。在一个示例中,与被存储在频道的模板中的POI相同的POI被标识为馈给帧的POI。将理解的是,馈给帧的POI位于该馈给帧的ROI中。一旦标识出馈给帧的POI,则执行对该馈给帧的POI的颜色的量化。可以用与生成模板数据库的过程相同的方式完成对馈给帧的POI的颜色的量化,并存储该馈给帧的POI的经量化颜色。
在将馈给帧中的POI的颜色量化之后,将馈给帧与模板比较并进行匹配。在所述实施例中,基于馈给帧与模板数据库中的模板的匹配,为该模板计算诸如相关系数的相关性参数。在一个示例中,相关系数指示出馈给帧和模板中的相似或相同的POI的个数。
接下来,以与已说明的方式相同的方式,将馈给帧与数据库中的其它模板进行比较。依据一方面,对于馈给帧和模板数据库中的模板之间的每个比较,标识出该馈给帧中的ROI和POI,并且基于该馈给帧的POI与模板数据库中每一个模板的POI的匹配,计算出相关性参数。
在一实施例中,相关性参数的值超过阈值匹配值的所有模板都被标记为候选匹配模板。
而且,在一个实现中,将每一个候选匹配模板与馈给视频的预定个数的馈给帧匹配,并针对每一个候选匹配模板计算标志分值。在一个实施例中,标志分值是基于响应于每一个比较的相关性参数的值计算的。例如,候选匹配模板的标志分值为来自与该候选匹配模板相关的相关性参数大于阈值匹配值的8个馈给帧的馈给帧的个数。
而且,在一示例中,基于与标志分值最高的候选匹配模板相关联的标志ID识别出标志。而且,在一个实现中,基于该标志ID,根据频道文件确定匹配频道/匹配频道ID。一旦标识出匹配频道,接收装置可通过例如互联网与电视网络服务供应商的数据库连接,以获得匹配频带的电子节目指南(EPG)。
另一方面,如果所有模板的相关性参数的值都未超过阈值匹配值,则该系统推断,与该馈给视频相关的频道是新频道,或是具有新标志的老频道。在这样的情况下,该系统处理该馈给视频,以生成该馈给视频的模板,并将该模板存储在模板数据库中。
而且,当在接收装置处标志识别系统通过例如在第二馈给视频发送之前,将第一馈给视频蓝屏或黑屏来中断一段预定的较短时间间隔,标识出频道改变时,发起针对第二馈给视频的标志识别。
虽然所说明的用于标志识别的系统和方法的方面可以任意个数的不同计算系统、环境,和/或配置实现,但是实施例是以下面的示例性系统构造为背景说明的。
图1示出了依据本主题的实施例的一种实现标记识别的示例性网络环境100。在所述实施例中,网络环境包括置于广播站处的一个或多个广播站服务器102。这些广播站服务器102可被用于例如通过广播、联播,或多播传输来中继频道传输。在一个示例中,频道传输包括模拟传输。广播站服务器102可被实现成任意不同的传统计算装置,其包括例如通用计算装置、多网络服务器(被布置在集群中或布置成为服务场)、主机,等。
广播站服务器102与通信卫星104通信,以将频道传输中继至天线106。在一个实施例中,天线106为卫星天线。但是,在其它实施例中,天线106可包括其它类型的天线。在一个示例中,天线106为电视服务供应商的碟形天线,用以向不同的使用者提供电视网络连接。而且,将理解的是,网络环境100可包括多个天线106,以从不同的广播站接收频道传输。
而且,天线106通过网络108被连接至一个或多个标志识别系统110-1、110-2…110-N,其被统称为标志识别系统110,并分别地被称为标志识别系统110。例如,天线106通过发送装置(未示出)被连接至标志识别系统110。标志识别系统110包括,但不限于,机顶盒、电视调谐器卡、基站收发机系统(BTS)、计算装置、电视机、笔记本电脑、个人数字助理(PDA),等等。在一个实现中,标志识别系统110是基于模拟传输的。而且,网络108可以是以模拟传输和接收实现的有线网络。网络108可包括不同的装置,诸如中继盒和信号增强器,以将天线106连接至标志识别系统110。
标志识别系统110中的每一个系统以通信的方式进一步被耦接至一个或多个用户装置112-1、112-2,…,112-N,其统称为用户装置112,或分别地被称为用户装置112。用户装置112可实现为任意不同的传统计算装置,包括例如电视机、台式PC、笔记本或便携式计算机、工作站、主机计算机、移动计算装置、娱乐装置,以及互联网设施。而且,在另一个实施例中,标志识别系统110被实现成多端口装置(诸如中继盒),其允许将多个用户装置112连接至标志识别系统110。
而且,同样将可理解的是,虽然标志识别系统110被示出为在用户装置112的外部,但该标志识别系统110也可在用户装置112的内部集成或提供。
在一个实施例中,每一个标志识别系统110都是可通信地耦接到模板数据库(未示出)的。在一个实现中,模板数据库是通过用于实现标志识别的标志识别系统110产生并安装的。依据本主题的实施例,标志识别系统110包括标识模块114和识别模块116。
操作中,标志识别系统110标识出中继馈给视频的频道的标志。在一个示例中,可识别出标志,以标识出该频道,和提供该频道的电子节目指南(EPG)。在一实现中,标志识别系统110被配置成识别不同种类的标志,例如,不同形状和大小的不透明标志、具有不透明前景及透明背景的标志、alpha混合的标志、具有动态颜色的静态标志,以及具有确定性的动画图案的动画标志。在一个示例中,标志识别系统110被配置成使用平均帧技术来减少例如alpha混合标志、具有动态颜色的静态标志、动画标志的某些标志情况下的动态性影响。
在一个实现中,为识别出标志,标志识别系统110记录馈给视频的抽样,并将其与存储在模板数据库中的模板比较。在所述实现中,标志识别系统110用该模板生成并更新的模板数据库。在生成模板数据库的过程中,标志识别系统110记录例如由电视服务供应商在不同频道上中继并在用户装置112上显示的样品视频。在这些频道上中继的样品视频通常以不同帧的形式在用户装置112上显示。而且,标识模块114标识出在由标志识别系统110所捕捉到的每一个样品视频中的一个或多个关注区域(ROI)。在一个示例中,标识模块114通过将样品视频的一个帧中的所有像素与后续帧的所有像素比较,并通过确定这些帧中的静态像素,而标识出ROI。在另一个实现中,在每一个样品视频中,可由通过标志识别系统110被连接至用户装置112的管理员例如使用鼠标或键盘手动地注释出ROI。将理解的是,ROI可以具有任意的对称或不对称的形状和大小。在一个实施例中,标志识别系统110可在记录每一个样品视频的同时仅捕捉该样品视频的ROI。
在对ROI的标识中,标志识别系统110将样品视频所有帧的ROI中的像素的颜色进行量化并存储。应该理解的是,对于这些像素的颜色的量化包括对于这些像素的颜色的值的量化。
一旦样品视频的所有帧中的ROI中的像素都已经被量化,标识模块114从该样品视频的这些像素中标识出静态和非静态的像素。在一个实现中,为标识出这些静态和非静态的像素,标识模块114可采用随机测量技术。例如,标识模块114可计算出样品视频的一个帧中每一个像素的经量化的颜色值的色散,其与该样品视频的剩余帧中的相同像素相对应。在所述示例中,将已量化的颜色值的色散与阈值比较以标识出静态的和非静态的像素。静态像素被标记为关注像素(POI),因为它们通常是标志的一部分,并适用于标志识别,而非静态像素被标记为“白”像素,这表明它们不适用于标志识别,因为它们通常是动态视频的一部分。
在一个实现中,样品视频的ROI中的每一个像素,例如,在该ROI的第一帧中的像素,可通过以上说明的方式进行评估,以标识出该样品视频中的POI和“白”像素。而且,在一个实现中,标识模块114存储ROI中被标记为POI和“白”的像素,以及用于该样品视频的模板中的POI的经量化的值。而且,标识模块114将样品视频中的ROI作为模板ROI与模板一起存储,并将其与该模板关联起来。在一个示例中,模板ROI包括划定ROI的边界的坐标。在另一个示例中,当ROI为圆形区域时,模板ROI可包括圆心的坐标和圆的半径。而且,每一个模板可由管理员注释并与标志识别系统110的储存库(repository)中的标志ID关联起来。在一个实现中,标志ID可进一步与对应于该模板的频道文件中的频道相关联。在所述实施例中,识别模块114处理对应于不同频道的所有样品视频,以获取频道文件中每一个频道的相应的模板。
而且,在一个实施例中,当被连接至标志识别系统110的用户装置112被打开时,由标志识别系统110完成对标志识别的发起。随着用户装置112打开,在使用者所选择的频道上中继的馈给视频在用户装置112的屏幕上显示。使用者从这些广播站所发送的不同频道中选择频道。标志识别系统110记录在用户装置112的屏幕上所显示的馈给视频的多个帧。此后该馈给视频中的这些帧被称为馈给帧。
一旦将馈给帧记录下来,在一个实现中,标志识别系统110将一个馈给帧与模板数据库中的每一个模板进行比较和匹配。在所述实现中,标识模块114将模板与该馈给帧进行比较和匹配。在所述实现中,当将馈给帧与模板进行比较时,标识模块114基于与模板相关联的信息标识出馈给帧中的关注区域(ROI)。在一个示例中,标识模块114基于所存储的并与该模板相关联的模板ROI,标识出馈给帧中的ROI,从而实现两个ROI中像素的一一映射。
而且,标识模块114标识出将要与模板进行比较的馈给视频的ROI中的POI。在所述实施例中,标识模块114基于模板中的信息标识出馈给帧中的POI。在一个示例中,标识模块114提取出存储在该模板中的POI,并标识和标记出该馈给帧中相同的POI。
在对馈给帧中的POI进行标记后,量化该馈给帧中POI的颜色。在一个实现中,以与之前参考对样品视频中像素颜色进行的量化所说明的相同的方式量化POI的颜色。在所述实现中,该馈给帧的POI的经量化的颜色值被存储并可被用于识别馈给视频中的标志,正如将在后面解释的。
基于对POI的量化,识别模块116将馈给帧与模板进行匹配和比较。在实现中,识别模块116将馈给帧中所标记的POI与模板中相应的POI进行比较,以使该馈给帧与该模板匹配。在所述实现中,识别模块116基于它们经量化的颜色来比较和匹配POI。在所述实现中,识别模块116基于POI的比较计算出该模板的相关系数,其为例如该馈给帧和模板的匹配的POI的个数的测量值。然后识别模块116以与所说明的相同的方式计算模板数据库中每一个模板的相关系数。而且,识别模块116将相关系数在阈值匹配值以上的所有模板标记为候选匹配模板。
接下来,以与以上所说明的相同的方式将每一个候选匹配模板与预定个数的其它馈给帧进行比较和匹配。而且,针对候选匹配模板与馈给帧的比较,识别模块116计算出标志分值。识别模块116基于标志分值最大的候选匹配模板从频道文件中确定出标志ID。在实现中,由识别模块116从例如频道文件中进一步确定出对应于该标志ID的匹配频道。
图2示出了依据本主题的实施例的标志识别系统110的示例性组件。在所述实施例中,标志识别系统110包括一个或多个处理器202、输入和输出(I/O)接口204,以及耦接至处理器202的存储器206。
处理器202可以是单个处理单元或多个单元,所有这些单元可包括多个计算单元。处理器202可被实现成一个或多个微处理器、微计算器、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路,和/或基于操作指令来操纵信号的任意装置。在其它功能中,处理器202被配置成取出和执行存储在存储器206中的计算机可读指令和数据。
I/O接口204可包括多个软件和硬件接口,例如,用于诸如键盘、鼠标、外部存储器、打印机,等的外围装置的接口。I/O接口204可有利于在广泛不同的协议和诸如网络108的网络内进行多重通信,网络108包括例如电缆、LAN等的有线网络和例如卫星、WLAN等的无线网络。I/O接口204可包括用于将标志识别系统110连接至诸如用户装置112的另一个装置上的一个或多个端口。而且,I/O端口204可使标志识别系统110能够与诸如网页服务器和外部数据库的其它计算装置通信。
存储器206可包括本领域已知的任意的计算机可读媒介,其例如包括诸如静态随机访问存储器(SRAM)和动态随机访问存储器(DRAM)的易失性存储器,和/或,诸如只读存储器(ROM)、可擦除可编程ROM、闪存、硬盘、光盘,和磁带的非易失性存储器。存储器206还包括模块208和数据210。
除了别的以外,模块208还包括例程、程序、对象、组成、数据结构等,其执行特定任务或实现特定的抽象数据类型。模块208进一步包括,例如,标识模块114、识别模块116、记录模块212、量化模块214,和其它模块216。其它模块216可包括补充标志识别系统110的应用和功能的程序或编码指令,例如,在操作系统中的程序。
另一方面,除了别的以外,数据210还起到用于储存由一个或多个模块208所处理、接收和生成的数据的储存库的作用。数据210包括例如频道数据218、关注区域(ROI)数据220、色散数据222、馈给帧数据224、识别数据226,和其它数据228。其它数据228包括作为其它模块216中的一个或多个模块的执行结果生成的数据。
操作中,识别模块116识别出发送馈给视频的频道的标志。如前面所提及的,馈给视频通常通过网络108由电视网络供应商在频道上发送。在一个实现中,识别模块116生成频道文件,该频道文件具有被提供给用户装置112的频道的列表。在一个示例中,该频道文件包括这些频道的频道ID和网址的URL。在另一个实现中,该频道文件是由操作标志识别装置110的管理员提供和存储的。在一实施例中,频道文件被存储在频道数据218中。
对于标志识别,标志识别系统110产生并装入模板数据库,其被存储在频道数据218中。将理解的是,该模板数据库可在标志识别系统110的外部实现。为生成模板数据库,记录模块212捕捉和记录例如通过网络服务提供商向用户装置112发送的所有频道的样品视频。在用户装置112上显示的单个样品视频可对应于一个频道,并可被视为是一个接一个显示的多个帧。因此,为了记录样品视频,记录模块212捕捉该样品视频的多个帧并将它们存储在频道数据218中。在一个示例中,通过记录每一个样品视频约10至15分钟来记录每一个样品视频的约1800个帧,以避免在标志识别过程中出错。
一旦记录了这些帧,标识模块114,正如早前所提及的,可被配置成标识出每一个样品视频的一个或多个ROI。这些ROI是频道中的标志通常放置在的帧的那些区域。在一实现中,标识模块114通过将样品视频的一个帧的所有像素与后续帧的所有像素进行比较,并且确定出这些帧的静态像素,来标识出ROI。在另一个实施例中,由管理员使用诸如鼠标或键盘的外围装置针对每一个样品视频手动地划定关注区域(ROI)的界线和注释出关注区域(ROI)。而且,关于样品视频的ROI的信息,被称为模板ROI,被存储在ROI数据220中。在一个示例中,ROI数据220包括划定该样品视频的ROI界线的边界的坐标。
一旦标记了样品视频中的ROI,量化模块214实现对样品视频的帧中每一个像素的颜色的量化。为了解释的目的,这些像素的颜色可被理解成这些像素的颜色的值。在用户装置112上显示的样品视频的颜色通常以UYVY配色方案来表达。在这样的方案中,如果显示器使用三个256比特的颜色,则颜色值的总个数为约2563。在一个实现中,量化模块214实现对颜色值的量化,并以色调饱和度值(HSV)表达每一个像素的颜色。在一个示例中,当例如使用经量化的二进制指数以量化HSV方案来表达颜色时,该样品视频的ROI中的所有像素的颜色由36(0至35)组值来表达。
而且,标识模块114确定在样品视频的帧中的静态的和非静态的像素。标识模块114标识出静态的和非静态的像素,以标识出适用于标志识别的像素。例如,样品视频的帧中几乎静态的像素指示该像素为该频道静态标志的一部分。另一方面,该频道的帧中的动态像素指示该像素为正在显示的样品视频的一部分。
为了标识出样品视频中的静态和动态像素的目的,在一个实现中,标识模块114计算出从样品视频的一个帧的每一个像素到该样品视频的剩余帧中相同像素的颜色的色散。这些像素的颜色的色散可通过计算这些像素的颜色的标准偏差或方差计算出。而且,标识模块114可将这些像素的色散值存储在色散数据222中。
此外,标识模块114将针对样品视频的帧中的每一个像素计算的色散与预定的色散阈值比较,以标识出静态的和动态的像素。色散的阈值可被存储在另一个数据228中。例如,如果色散的值在阈值以下,其表示该像素是几乎静态的像素,因此为标志的一部分。标识模块114将这样的像素标记为关注像素(POI)。相反,如果色散的值在阈值以上,其表示该像素为动态的,并且为视频的一部分。这样的像素被标识模块114标记为“白”像素并被认为与标志识别无关。
进一步,POI与它们的经量化的颜色值,以及所标记的“白”像素一起被保存在模板数据库中。这些存储的“白”像素和POI及这些POI的经量化的颜色值被称为模板。在一个实现中,针对一个样品视频,即,针对一个频道,保存一个模板。如早前所提及的,这些模板中的每一个与标志ID相关联并被存储在该频道数据218中的模板数据库中。标志ID可进一步与频道数据218中的频道文件中的频道ID相关联。
此外,与以上所述一起,属于标准视频的ROI(被称为模板ROI)的信息还被提取并存储在例如ROI数据中。在一个示例中,当模板ROI具有矩形区域时,则ROI数据220包括该矩形转角中的一个转角的坐标以及该矩形的宽度和高度。在另一个示例中,当模板ROI为圆形区域时,则ROI数据220包括该圆的圆心的坐标以及圆半径。进一步,ROI数据220与频道数据218相关联,以将属于模板ROI的信息与存储在模板中的信息相关联。标志识别系统110以以上所说明的方式处理所有样品视频,以生成模板数据和将模板数据装入频道数据218中。而且,每一个样品视频的模板ROI还被存储在ROI数据220中,并与频道数据218中相应模板相关联。通过被存储在频道数据218中并与ROI数据220中相应的ROI模板相关联的每一个样品视频的模板,产生频道数据218中的模板数据库的生成。
在标志识别系统110的操作过程中,当馈给视频在一频道上被中继并在用户装置112上显示时,例如,当用户装置112的使用者打开该用户装置112以收看馈给视频时,识别模块116发起对于该频道标志的标志识别。在另一个示例中,识别模块116可在操作该标志识别系统110的管理员促动下发起标志识别。
类似于样品视频,在用户装置112上显示的馈给视频的形式为按顺序显示的多个帧。记录模块212捕捉并记录该馈给视频的多个帧并将它们存储在馈给帧数据224中。
标志识别系统110通过将馈给帧与模板数据库中的模板进行比较和匹配而识别出馈给视频中的标志。在一个实施方式中,识别模板116将来自多个馈给帧中的一个馈给帧与模板中的每一个进行比较。为了将馈给帧与模板进行比较,标识模块114首先标识出馈给帧中的关注区域(ROI)。在一个实现中,标识模块114基于与频道数据218中的模板相关联的ROI数据220标识出馈给帧的ROI。在一个示例中,标识模块114基于ROI数据中的模板ROI标识出馈给帧中的ROI。
一旦馈给帧的ROI被标识出,标识模块114标识出馈给帧中的POI。在一个实现中,基于被存储在频道数据218中的模板的POI来标识出馈给帧的POI。因此,在所述实现中,类似于模板ROI中存在的模板的POI,馈给帧的POI被标识出在该馈给帧的ROI中。
在标识出馈给帧中的POI之后,量化模块214量化POI的颜色。在一个实现中,量化模块214量化POI的颜色,该颜色最初以UYVY颜色格式表达,并且量化模块214以HSV配色方案表达POI的颜色,正如早前所揭示的。因此,在所述实现中,POI的例如红、蓝和绿色的颜色是以37组值来表达的,而不是以每一个颜色的256个值来表达的。该馈给帧的这些POI的颜色被存储在识别数据中,并由识别模块116用在标志识别中,正如随后解释的。
接下来,在一个实现中,识别模块116将馈给帧与模板进行比较和匹配。在所述实现中,识别模块116例如基于像素的经量化的颜色,将馈给帧的POI与模板中的POI进行比较和匹配。在将馈给帧与模板进行比较后,识别模块116为该模板计算相关系数。在一个示例中,相关系数指示该馈给帧和该模板中相似的POI的个数。为该模板计算的相关系数可存储在识别数据226中。
正如之前所提及的,在一个实现中,如果为该模板计算的相关系数大于阈值匹配值,则识别模块116将该模板标记为候选匹配模板。一旦为模板计算出相关系数,识别模块116就将该馈给帧与模板数据库中的后续模板进行比较和匹配。
为了将馈给帧与后续模板匹配,识别模块116以与将该馈给帧与前面的模板进行比较的方式相同的方式处理该馈给帧。识别模块116基于后续模板中的信息标识出馈给帧中的ROI和POI,并然后为该后续模板计算相关系数。
识别模块116,以与上述相同的方式,将模板数据库中的所有模板与馈给帧比较和匹配,并为每一个模板计算相关系数。而且,识别模块116将相关系数大于阈值匹配值的所有模板标记为候选匹配模板。
进一步,在一个实现中,识别模块116将所有候选模板与馈给帧数据224中的预定个数的馈给帧(例如与前面比较的馈给帧不同的8个馈给帧)相比较。在一个示例中,要与候选匹配模板比较的预定个数的馈给帧是随机选择的。针对与预定个数的馈给帧比较的每一个候选匹配模板,识别模块116计算出每一个候选匹配模板的标志分值。
在一个示例中,标志分值指示来自所述预定个数的馈给帧中与候选帧匹配的馈给帧的个数。进一步,基于标志分值最高的候选匹配模板,识别模块116从例如频道数据218确定标志ID。在实现中,识别模块116还可例如基于与频道数据218的标志ID相关联的频道ID标识出该标志所属的匹配频道。
在实现中,获得候选模板之后,识别模块116可确定该候选模板是否与单个频道相对应。如果候选模板对应于单个频道,则该频道被确定为匹配频道。如果候选匹配帧对应于一个以上的频道,则以上述方式确定匹配频道。
另一个方面,如果所有模板的相关性参数的值都没有超过阈值匹配值,则识别模块116推测关于该馈给视频的频道为新频道或具有新标志的老频道。在这样的情况下,识别模块116促使标志识别系统100基于例如在该馈给视频的帧中所标记的POI生成该馈给视频的模板,并将该模板存储在模板数据库中,并将属于该模板ROI的信息与模板数据库中的模板关联起来。
依据本主题的一方面,一旦标识出匹配频道,标志识别系统100可以为不同目的使用该频道数据218中的信息。在一个示例中,基于频道数据218,其可包括该频道的网站的URL,标志识别系统110可从该频道的网站获得关于该频道的电子节目指南(EPG)。
在另一个示例中,记录模块212可被配置成,基于用户装置112的使用者所提供的输入(诸如持续时间),记录来自频道的视频。记录模块212可使用标志识别以确定该中继频道是正在播出节目还是该节目正被广告打断。在所述示例中,记录模块212通过基于由标志识别系统110实现的标志识别而确定出标志未出现,来确定该频道正在播出广告。而且,记录模块212可被配置成,在视频中未出现标志期间,暂停对该视频的记录。
进一步,在一个实现中,当通过例如在另一个频道上发送第二馈给视频之前,将在一个频道上中继的第一馈给视频蓝屏或黑屏中断预定的较小时间间隔,而使得标志识别系统110标识出用户装置112处的频道改变时,则为第二馈给视频发起标志识别。
图3和图4示出了依据本主题的实施例的标志识别的方法。在实施例中,标志识别的方法是通过标志识别系统,诸如标志识别系统110,实现的。将理解的是,虽然本文中所说明的方法是以标志识别系统110为背景的,但是也可使用具有类似功能的其它系统。
示例性方法可在计算机可执行指令的广义背景下进行说明。大体上,计算机可执行指令可包括例程、程序、对象、组成、数据结构、规程、模块、函数等,其执行特定的函数或实现特定的抽象数据类型。该方法还可在分布式计算环境下实施,在该分布式计算环境中功能由通过通信网络链接的远程处理装置来执行。在分布式计算环境下,计算机可执行指令可被置于本地的和远程的计算机存储介质中,包括内存存储装置。
说明这些方法的顺序并不旨在构成限制,并且任意个数的所说明的方法方框可以任意的顺序组合来实现该方法,或备选方法。此外,可从该方法中删除个别方框而不背离本文所说明的主题的精神和范围。而且,这些方法可以任意适合的硬件、软件、固件或它们的组合来实现。
图3说明了依据本主题的实施例的用于标志识别的示例性方法300。参考图3,在方框302中,获得馈给视频的多个帧,此后其被称为馈给帧。在示例中,在标志识别系统110中的记录模块212记录一段预定的时间段,如10至15分钟的馈给视频。如早前所提及的,在一个示例中,当在频道上发送的馈给视频时在诸如用户装置112的用户装置上显示时,记录模块212开始记录。该馈给视频通常由广播站在频道上进行中继,并在用户装置112处以多个帧的形式被接收。在获得馈给帧之后,由例如识别模块116从多个馈给帧中选择一个馈给帧,该馈给帧被进一步用于识别标志。
在方框304处,馈给帧与模板数据库中的模板比较。在实现中,模板是由例如识别模块116随机选择的,并被获取以用于比较。在一个示例中,该模板先前通过处理在不同频道上中继、被发送且在用户装置112上显示的样品视频而被存储在频道数据218的模板数据库中。因此,该模板对应于由该广播站发送的一个频道。参考图4将能够详细地理解用于生成模板数据库的样品视频处理方法。
进一步,为了实现馈给帧与模板的比较,在馈给帧中标识出关注区域(ROI)和一个或多个关注像素(POI)。例如,由标识模块114来标识出ROI和POI。在所述示例中,标识模块114基于与频道数据218中的模板相关联的ROI数据220标识出馈给帧中的ROI。ROI数据库可包括属于模板ROI的信息,基于该模板ROI,在馈给帧中标识出完全相似的ROI。而且,在馈给帧的ROI中的POI基于存储在频道数据218中的信息而被标识出,这些信息例如是与在生成模板数据库的过程中所存储的模板的POI有关的信息。在所述示例中,该模板的POI和该馈给帧的POI根据一一映射关系而彼此映射。
进一步,在标识出馈给帧中的POI之后,实现对POI的颜色的量化。在实现中,初始以UYVY配色方案表达的POI的颜色被量化,并由HSV(色调饱和度值)配色方案来表达。在一个示例中,对馈给帧的POI的颜色的量化由量化模块214实现。
对馈给帧的POI的颜色的量化之后,将馈给帧与模板比较。在一个实现中,基于馈给帧和模板的POI的经量化的颜色,将馈给帧的POI与模板的POI进行比较。进一步,基于馈给帧和模板的匹配,为该模板计算相关系数。在一个实现中,馈给帧与模板的比较,以及后续对相关系数的计算,通过识别模块(诸如识别模块116)实现。
在方框306处,做出判断以确认系数参数的值是否大于阈值匹配值。在一个实现中,阈值匹配值是基于例如若干应用情况的场景预确定的。在一个示例中,阈值匹配值为约0.75,其指示出模板的约75%的POI与馈给帧的POI相似。
如果系数参数的值大于阈值匹配值(从方框306开始的“是”支路),则在方框308处由例如识别模块116将该模板标记为候选匹配模板。另一方面,如果系数参数的值小于阈值匹配值(从方框306开始的“否”支路),则确定在模板数据库中是否还有任意其它模板,以及剩余模块是否已经与该馈给帧进行了比较,如方框310中所示出的。
在方框310处,确认是否模板数据库中的所有模板都已经与该馈给帧进行比较。在一个实施例中,对是否所有模板都已经与该馈给进行比较的确认是通过识别模块116基于频道数据中的频道文件(诸如频道数据218)实现的。在确认并非所有模板都已经进行比较(从方框310开始的“否”支路)的情况下,则在方框304中由例如识别模块116以与所说明的相同的方式,将剩余模板与该馈给帧进行比较。进一步,针对这些模板中的每一个计算相关参数,并且将相关参数与阈值匹配值进行比较,正如在方框306处所解释的,以在方框308处标识出和标记出候选匹配模板。
另一方面,如果确认模板数据库中的所有模板都已经与该馈给帧比较过(由310开始的“是”支路),则在方框312处进一步确认是否存在任意的候选匹配模板。
在方框312处,确定这些模板中的每一个模板的相关参数的值,与该馈给帧相比,是否小于阈值匹配值。在一个实现中,在方框312处的确定由识别模块116实现。在方框312处进行确定以确认在该模板数据库中是否存在对应于该馈给帧的馈给视频的模板。
如果在方框312处做出的确定确认针对模板数据库中所有模板的相关参数的值小于阈值匹配值(从方框312开始的“是”支路),则其指示在该频道数据218中不存在中继该馈给帧的频道,或者,在该模板数据库中不存在对应于该馈给帧的标志,即,或者该频道是新的,或者该标志是新的。
接下来,在方框314处,基于馈给帧生成模板并将其存储在模板数据库中。而且,在一个实施例中,操作标志识别系统110的管理员将为查询馈给帧生成的模板与相对应的且被存储在频道数据218中(例如频道数据218的频道文件中)的标志ID和频道ID关联起来。
相反,如果在方框312处做出的确定承认,所有模板的相关参数的值不小于阈值匹配值(从方框312开始的“否”支路),则指示出存在一个或多个候选匹配模板,且该方法转移至方框316。
在方框312处确定存在一个或多个候选匹配帧之后,在方框316处确定候选匹配模板是否对应于单个频道。在一个实现中,这样的判断是使用识别模块116基于频道数据218做出的,例如,基于频道数据218中的频道列表。如果在方框316处判断候选匹配模板对应于该频道列表中的单个频道(从方框316开始的“是”支路),则该方法转移至方框318。
但是,如果判断出候选匹配模板并不对应于频道列表中的单个频道(从方框316开始的“否”支路),则在方框320处对这些候选匹配模板进行进一步的处理。
当在方框316处候选匹配帧对应于单个频道时,则在方框318处基于频道数据218判断出候选匹配模板所对应的频道,并将其选择为匹配频道。根据与该匹配频道的频道ID相关联的标志ID,从频道数据218中标识出该标志。在将模板与馈给帧进行比较之后仅获得一个候选匹配模板的情况下,则对应于该候选匹配模板的频道被选择为匹配频道,并且如以上所说明的那样标识出该匹配频道的标志。
进一步,当在方框316处候选匹配模板并不对应于单个频道时,则在方框320处,将候选匹配模板与预定个数的馈给帧进行比较。在一个示例中,将候选匹配模板与在方框302处从多个馈给帧中随机选出的8个馈给帧进行比较。因此,在所述示例中,与每一个候选模板进行比较的帧的总个数为9个。
在一个实现中,以与在方框304处所说明的相同的方式实现候选匹配模板与馈给帧的比较。基于候选匹配模板与馈给帧中的每一个进行的比较,针对每一个候选匹配模板计算出标志分值。在一个示例中,候选匹配模板的标志分值指示这9个馈给帧中相关系数大于阈值匹配值的馈给帧的个数。
进一步,在方框322处,基于标志分值最高的候选匹配模板确定出馈给视频中的标志。在一个示例中,基于累积的标志分值最高的候选匹配模板确定出该标志。在另一个示例中,将每一个候选匹配模板的标志分值进行平均,并且基于平均标志分值最高的候选匹配模板确定出该标志。在一个实现中,确定出与标志分值最高的候选匹配模板相关联的标志ID,以基于频道数据218识别标志。进一步,一旦识别出该标志,标志ID可进一步被用于标识出与频道数据218中的标志ID相关联的匹配频道。例如,使用与频道文件中的标志ID相关联的频道ID来确定出匹配频道。
在一个实现中,将该频道标识为匹配频道之后,可基于该匹配频道的频道ID获得关于该频道的电子节目指南(EPG)。在示例中,基于可包括频道列表中的频道的URL的频道数据218中的频道列表,可通过诸如互联网的网络连接到该频道的网站,获得该频道ID的EPG。
在另一个示例中,可使用标志识别来调整对频道上所发送的视频的记录。在标志识别系统110中,记录模块(诸如记录模块212)可被配置成基于由用户装置112的使用者所提供的输入(例如持续时间)来记录来自频道的视频。
依据本主题的标志识别的方法可用于确定中继频道是正在播出节目,还是节目被广告打断。在所述示例中,可通过基于依据本主题的标志识别确定出标志不存在,来实现对于该频道是否正在播出广告的确定。而且,当视频中没有标志时,可将对该视频的记录暂停一段时间。
图4示出了依据本主题的实施例,为标志识别而生成模板数据库的示例性方法400。为生成模板数据库,对来自频道列表中不同频道的样品视频进行记录。而且,对这些样品视频进行处理以获得每一个样品视频的一个或多个模板。根据处理样品视频所获得的每一个模板对应于中继该样品视频的频道。
在方框402处,获得在频道上所中继的样品视频的多个帧。通过例如记录该样品视频如10至15分钟的预定时间段,以获得该样品视频的多个帧。在一个实施例中,该模板视频的多个帧是由记录模块212获得的。
在方框404处,在该多个帧中标识出一个或多个关注区域(ROI)。在一个实施例中,ROI是由标识模块(例如标识模块114)标识出的。在实现中,标识模块114通过将样品视频的一个帧的所有像素与后续帧的所有像素进行比较,并确定出这些帧中的静态像素来标识出ROI。在另一个实施例中,关注区域(ROI)是由每一个样品视频的管理员使用例如鼠标或键盘的外围设备手动地划定和注释出的。而且,关于样品视频的ROI(被称为模板ROI)的信息被存储在ROI数据(诸如ROI数据220)中。在一个示例中,ROI数据220包括划定出该样品视频的ROI的边界的坐标。
进一步,在方框406处,将这些帧的ROI中的像素的颜色进行量化。对像素颜色的量化可被理解为对像素颜色值的量化。模板视频的像素的颜色通常是以例如UYVY配色方案的复杂配色方案来表达的。在一个实施例中,诸如量化模块214的量化模块量化像素的颜色并以简单的配色方案来表达它们。例如,以HSV(色调饱和度值)方案来量化和表达这些像素的颜色。在所述示例中,这些颜色,例如红、蓝、绿色的2563个值,被量化成以36组这些颜色的值来表达。
一旦在方框406处将像素颜色量化,在方框408处针对帧中的每一个像素计算色散的定量值。例如,通过为馈给视频的各帧中的同一个像素计算颜色的标准差和/或方差,计算出色散。而且,在所述示例中,针对ROI中的所有像素计算出遍及这些帧的颜色的色散。在一个示例中,在方框406处的计算是由标识模块114完成的,并被存储在色散数据222中。
而且在方框410处,做出判断以确认像素的颜色的色散的值是否在阈值以下。在方框410处的这样的判断有助于标识出该像素是静态的还是非静态的。正如以前所解释的,静态像素通常是该频道的标志的一部分,并与标志识别有关,而动态像素通常是该频道所中继的视频的一部分或标志的透明背景的一部分,并与标志识别无关。在实施例中,方框410处的判断是由标识模块114基于阈值实现的。在一个示例中,可基于使用情况来预先确定色散的阈值。
如果在方框410处做出的判断确认该像素的颜色的色散值在阈值值以下(从方框410开始的“否”支路),则在方框412处将该像素标记为“白”像素,以指示该像素为非静态的并与标志识别无关。
另一方面,如果该判断确认该像素的颜色的色散值在阈值以下(从方框412开始的“是”支路),则在方框414处将像素标记为关注像素(POI),以指示出该像素是静态的,并因此与标志识别有关。
将理解的是,代替色散,可使用其它的随机测量技术来标识出该像素是静态的还是非静态的。
而且,在方框416处,基于遍及不同帧的色散值,确认是否所有像素都被标记为POI或“白”像素。如果不是,则以在方框410和方框412,以及方框414中所解释的方式处理该样品视频的剩余像素。
如果所有的像素都已经被标记(从方框416开始的“是”支路),则在方框418处存储针对该帧所标识的一个或多个模板特征。在一个实现中,这些模板特征包括:POI的经量化的颜色,以及POI和白像素的参考(例如定位)。这些模板特征被保存成用于该样品视频的模板。在所述实现中,该模板被存储在频道数据218中的模板数据库中。而且,该模板与ROI数据220(例如ROI数据220中的模板ROI)相关联。正如早前所解释的,对应于频道的模板还与例如频道文件中该频道的标志ID相关联,以用于标志识别。标志ID可依次与频道ID相关联,以在一旦识别出标志之后标识出该频道。
针对由记录模块212为不同频道记录的所有样品视频重复方法400,并为每一个样品视频获取一个或多个模板。然后所有模板被存储在模板数据库中,并由标志识别系统110用于标志识别,正如参考图3所解释的。
将理解的是,虽然以上说明是参考对静态标志的识别而提供的,但是相同的概念可被扩展用于识别其它类型的标志,例如,alpha混合的标志,具有动态颜色的静态标志,以及具有确定性的动画图案的动画标志。
虽然以用于特定结构特征和/或方法的语言说明了标志识别的实施例,将理解的是,本主题不必被限制在所说明的这些特定的特征或方法中。而是,这些特定的特征和方法是作为标志识别的示例性实施例而揭示的。而且,虽然本文中参考通过标志识别的频道标识而说明了这些系统和方法,但是将理解的是,标志识别的概念可被扩展至其它应用中,而不背离本主题的精神和范围。

Claims (15)

1.一种用于识别标志的计算机化方法,该方法包括:
从显示中获取多个馈给帧,其中,来自所述多个馈给帧的每一个馈给帧具有被嵌入在其中的标志;
将来自所述多个馈给帧的一馈给帧中的至少一个关注区域(ROI)与来自多个模板的每一个模板进行比较;
基于所述比较,计算每一个模板的相关性参数,
基于所述相关性参数,标识出一个或多个候选匹配模板;
基于所述一个或多个候选匹配模板中的每一个与来自所述多个馈给帧的预定个数的馈给帧之间的比较,确定标志分值;以及
基于所述标志分值来识别所述标志。
2.如权利要求1所述的方法,其中,所述比较包括:
从用于与所述馈给帧进行比较的所述多个模板中获取模板;
基于所述模板,确定所述馈给帧中的所述关注区域(ROI);
基于所述模板的模板ROI,标识出所述ROI中的至少一个关注像素(POI);
量化所述ROI中所述POI的颜色,以及
基于所述POI的经量化的颜色,将所述馈给帧的所述ROI中的所述POI与所述模板进行比较。
3.如权利要求1所述的方法,进一步包括:
处理与多个频道中每一个频道相对应的至少一个样品视频;以及
基于所述处理获取所述多个模板,其中所述多个频道中的每一个频道与所述多个模板的至少一个相关联。
4.如权利要求1所述的方法,其中,所述识别进一步基于所述候选匹配模板与所述预定个数的馈给帧的匹配。
5.如权利要求1所述的方法,进一步包括,如果所述多个模板中的每一个模板的相关性参数都在阈值匹配值以下,则基于所述馈给帧生成模板。
6.如权利要求1所述的方法,其中,所述标志为静态标志。
7.如权利要求1所述的方法,进一步包括,基于所述标志,标识出中继所述馈给视频的频道。
8.如权利要求1所述的方法,其中所述获取包括:
获取样品视频的多个帧;
在所述多个帧中的每一个帧中标识出至少一个关注区域(ROI);
对所述多个帧中的每一个帧的所述至少一个ROI中的像素的颜色进行量化,
标识出所述多个帧中的静态像素,其中,所述静态像素与标志识别有关;以及
将所述多个帧中的每一个注释为馈给帧,用于创建模板数据库。
9.如权利要求8所述的方法,其中,标识所述静态像素包括:
计算所述多个帧中每一个像素的颜色的色散,以及
将所述每一个像素的颜色的色散与色散的阈值进行匹配,以标识所述静态像素。
10.一种标志识别系统(110),其包括:
处理器(202);和
标识模块(114),其被耦接至所述处理器并由所述处理器执行,所述标识模块被配置成处理在其中嵌入标志的多个馈给帧,以标识出所述多个馈给帧中至少一个馈给帧的至少一个关注像素(POI),其中,所述POI为静态像素;以及识别模块(116),其被耦接至所述处理器并由所述处理器执行,所述识别模块被配置成:
将来自所述多个馈给帧的至少一个馈给帧中的关注区域(ROI)与多个模板中的每一个模板进行比较,以计算相关性参数;
基于所述比较,从所述多个模板中标识出一个或多个候选匹配模板;
基于所述一个或多个候选匹配模板中的每一个与来自所述多个馈给帧的预定个数的馈给帧之间的比较,确定标志分值;以及
基于所述标志分值来识别所述标志。
11.如权利要求10所述的标志识别系统(110),其中,所述标识模块(114)进一步被配置成,基于从与所述馈给帧比较的所述多个模板中获取的模板,标识出所述多个馈给帧中所述至少一个馈给帧中的所述POI。
12.如权利要求10所述的标志识别系统(110),其中,所述标识模块(114)进一步被配置成,基于来自与所述馈给帧进行比较的所述多个模板的模板,标识出所述多个馈给帧的所述至少一个馈给帧中的至少一个关注区域(ROI)。
13.如权利要求10所述的标志识别系统(110),其中,所述标识模块(114)进一步配置成:
标识出至少一个样品视频的多个帧中的至少一个ROI;
确定所述样品视频的所述多个帧中的所述ROI中每一个所述ROI中的像素是否是POI;以及
基于所述确定生成多个模板。
14.如权利要求10所述的标志识别系统(110),进一步包括,用于捕捉馈给帧的记录模块(212),所述记录模块被耦合到所述处理器并由所述处理器执行。
15.如权利要求10所述的标志识别系统(110),进一步包括量化模块(214),其被耦合到所述处理器并由所述处理器执行,所述量化模块被配置成量化馈给视频的多个帧中每一个帧中的关注区域(ROI)中的像素的颜色。
CN201280011788.5A 2011-01-04 2012-01-03 标志识别 Active CN103477349B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IN22MU2011 2011-01-04
IN22/MUM/2011 2011-01-04
PCT/IN2012/000006 WO2012093407A2 (en) 2011-01-04 2012-01-03 Logo recognition

Publications (2)

Publication Number Publication Date
CN103477349A CN103477349A (zh) 2013-12-25
CN103477349B true CN103477349B (zh) 2017-05-31

Family

ID=45855975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280011788.5A Active CN103477349B (zh) 2011-01-04 2012-01-03 标志识别

Country Status (5)

Country Link
US (1) US9076071B2 (zh)
EP (1) EP2661720A2 (zh)
JP (1) JP5989004B2 (zh)
CN (1) CN103477349B (zh)
WO (1) WO2012093407A2 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104471951B (zh) 2012-07-16 2018-02-23 Lg电子株式会社 处理数字服务信号的方法及装置
CN103634652B (zh) * 2013-11-06 2017-06-16 小米科技有限责任公司 台标识别方法、装置、电视机和系统
US9785852B2 (en) 2013-11-06 2017-10-10 Xiaomi Inc. Method, TV set and system for recognizing TV station logo
KR102155129B1 (ko) * 2014-03-26 2020-09-11 삼성전자주식회사 디스플레이 장치, 디스플레이 장치의 제어 방법 및 디스플레이 시스템
KR20150115314A (ko) * 2014-04-03 2015-10-14 삼성전자주식회사 디스플레이 장치, 이의 제어 방법, 서버, 이의 제어 방법, 채널 정보의 위치에 대한 정보를 검출하기 위한 시스템 및 이의 제어 방법
CN104023249B (zh) * 2014-06-12 2015-10-21 腾讯科技(深圳)有限公司 电视频道识别方法和装置
CN106067006A (zh) * 2016-06-07 2016-11-02 东软集团股份有限公司 用于识别新闻栏目的方法和装置
CN106682670B (zh) * 2016-12-19 2021-05-18 Tcl科技集团股份有限公司 一种台标识别方法及系统
US11373404B2 (en) * 2018-05-18 2022-06-28 Stats Llc Machine learning for recognizing and interpreting embedded information card content
EP3951706A4 (en) * 2019-03-28 2022-05-25 Sony Group Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND PROGRAM
US11521400B2 (en) * 2019-12-06 2022-12-06 Synamedia Limited Systems and methods for detecting logos in a video stream
US11080294B1 (en) * 2021-02-03 2021-08-03 Adlumin, Inc. Systems and methods for data analytics

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005531971A (ja) * 2002-07-01 2005-10-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号処理システム
CN102063623A (zh) * 2010-12-28 2011-05-18 中南大学 一种结合自底向上和自顶向下的图像感兴趣区域提取方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020336B2 (en) * 2001-11-13 2006-03-28 Koninklijke Philips Electronics N.V. Identification and evaluation of audience exposure to logos in a broadcast event
US8175413B1 (en) * 2009-03-05 2012-05-08 Google Inc. Video identification through detection of proprietary rights logos in media
US8359616B2 (en) * 2009-09-30 2013-01-22 United Video Properties, Inc. Systems and methods for automatically generating advertisements using a media guidance application

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005531971A (ja) * 2002-07-01 2005-10-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号処理システム
CN102063623A (zh) * 2010-12-28 2011-05-18 中南大学 一种结合自底向上和自顶向下的图像感兴趣区域提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Electronic Program Guide for RF fed TV Channels;CHATTOPADHYAY T et. al;《UKSim Fourth European Modelling Symposium on Computer Modelling and Simulation》;20101117;正文第158页摘要、第7-9段,第159页第2-16段,第160页第1-6段、附图4 *

Also Published As

Publication number Publication date
US20140016864A1 (en) 2014-01-16
CN103477349A (zh) 2013-12-25
EP2661720A2 (en) 2013-11-13
JP5989004B2 (ja) 2016-09-07
WO2012093407A2 (en) 2012-07-12
WO2012093407A3 (en) 2012-09-07
US9076071B2 (en) 2015-07-07
JP2014508341A (ja) 2014-04-03

Similar Documents

Publication Publication Date Title
CN103477349B (zh) 标志识别
US10405052B2 (en) Method and apparatus for identifying television channel information
CN108352914A (zh) 媒体内容匹配及索引
CN108353201A (zh) 循序覆盖媒体内容
CN106777177A (zh) 检索方法和装置
CN108351857A (zh) 媒体内容的最高频率限定
KR102002024B1 (ko) 객체 라벨링 처리 방법 및 객체 관리 서버
JP6750103B2 (ja) コンテンツフィンガープリンティングのためのフィンガープリントレイアウト
KR101793738B1 (ko) 미디어 id 정합 기반의 방송 ar 광고 서비스 시스템 및 그 방법
CN107851103A (zh) 自动内容辨识指纹序列匹配
CN103189864A (zh) 用于确定个人的共享好友的方法、设备和计算机程序产品
US20100010900A1 (en) System and method of interactive area advertisement using multicast transmitting
CN109635211B (zh) 推广页面的实现方法及服务器
CN109120949B (zh) 视频集合的视频消息推送方法、装置、设备及存储介质
CN103686254A (zh) 广告的自动本地化
US11038955B2 (en) Method and a system for controlling multimedia file on external screen device
CN104488274A (zh) 加速广告决策解决
CN104488263A (zh) 用于统一地标记及识别植入机会位置以促进经加速决策决断的方法及系统
CN106168956A (zh) 用于智能终端的数据统计分析方法及系统
JP2017519267A (ja) 検出可能な方法で動的記号を視覚画像に組み込むシステムおよび方法
JP2014238815A (ja) 情報処理システム、情報提供方法、端末装置およびプログラム
WO2019062011A1 (zh) 目标客户群的构建方法、电子装置及存储介质
CN105718571A (zh) 信息推送方法和装置
JP2007124069A (ja) 放送番組送出装置の番組宣伝素材送出方法
CN103020847A (zh) 基于特定二维码的定向广告及信息定制服务管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant