CN106446889B - 一种台标的本地识别方法和装置 - Google Patents

一种台标的本地识别方法和装置 Download PDF

Info

Publication number
CN106446889B
CN106446889B CN201510485957.4A CN201510485957A CN106446889B CN 106446889 B CN106446889 B CN 106446889B CN 201510485957 A CN201510485957 A CN 201510485957A CN 106446889 B CN106446889 B CN 106446889B
Authority
CN
China
Prior art keywords
character
logo
image
picture
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510485957.4A
Other languages
English (en)
Other versions
CN106446889A (zh
Inventor
孙向作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Technology Group Co Ltd
Original Assignee
TCL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Corp filed Critical TCL Corp
Priority to CN201510485957.4A priority Critical patent/CN106446889B/zh
Publication of CN106446889A publication Critical patent/CN106446889A/zh
Application granted granted Critical
Publication of CN106446889B publication Critical patent/CN106446889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Abstract

本发明提供了一种台标的本地识别方法和装置,该方法包括:获取电视播放画面中包括台标字符在内的台标图像;根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。本发明由于对图像进行字符分割后提取每个字符图像中的划分的空间中满足要求的像素所占的比例,从而可以有效的提高对不同形状的字符识别的准确率,并且对于具有部分相同字符的频道,也可以有效的识别。

Description

一种台标的本地识别方法和装置
技术领域
本发明属于图像识别领域,尤其涉及一种台标的本地识别方法和装置。
背景技术
台标,是指电视台用于与其它电视台区分的标识,其一般包括图标、英文、数字和汉字中的一项或者多项。而随着安卓系统的不断发展,从手机到平板电视,从智能电视到工业医疗领域都得到了广泛的应用,在安卓系统中播放电视节目时,常常会需要通过本地设备对电视节目的台标进行识别。
现有电视台标图像中,有些电视台的台标图像LOGO会动态的变化,比如有的台标为动态变化的圆球,这种动态变化的图像会导致根据图像LOGO识别困难增加。另外有些台标图像LOGO会不定时的更新,对应的,也需要重新更新识别算法。而有些台标图像LOGO是一样,只是后面添加数字来区分。针对这些台标图像LOGO情况,目前仅通过识别台标图像LOGO的方法对上述的情景识别不准确或者识别困难,也不便于扩展识别频道数目。
发明内容
本发明的目的在于提供一种台标的本地识别方法和装置,以解决现有技术仅通过识别台标图像LOGO的方法对图标变化,或者图标相同,字符不同的情景识别不准确或者识别困难,也不便于扩展识别频道数目的问题。
第一方面,本发明实施例提供了一种台标的本地识别方法,所述方法包括:
获取电视播放画面中包括台标字符在内的台标图像;
根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;
提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;
将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
结合第一方面,在第一方面的第一种可能实现方式中,在所述根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像步骤之前,所述方法还包括:
对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像步骤包括:
通过将所述台标图像进行水平投影,确定所述台标图像的台标中字符的行数以及每一行的起始和结束位置;
通过将所述台标图像中每一行进行垂直投影,确定所述台标图像的台标中每一行中字符的个数以及每个字符的起始和结束位置。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第三种可能实现方式中,在所述提取所述分割后的单个的字符图像所对应的特征值步骤中包括数字和英文字符特征提取的步骤,所述数字和英文字符特征提取的步骤包括:
将所述字符图像横竖平分为n个网格,统计每个网络内满足预设要求的像素点的个数得到n维向量;
将所述字符图像垂直方向上平分为w个网格,统计每个网格内满足预设要求的像素点的个数得到w维向量;
将所述字符图像竖直上平分为h个网格,统计每个网格内满足预设要求的像素点的个数得到h维向量;
根据上述n维向量、w维向量、h维向量得到所述字符图像所对应的n+w+h维向量。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第四种可能实现方式中,所述提取所述分割后的单个的字符图像所对应的特征值中步骤包括汉字字符特征的提取的步骤,所述汉字字符特征的提取的步骤包括:
统计所述字符图像中的像素点属于横、竖、撇、捺四种笔画的个数,根据每种笔画的像素点的个数构成汉字图像对应的四个向量参数。
结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,所述统计所述字符图像中的像素点属于横、竖、撇、捺四种笔画的个数步骤包括:
P为二值化图像,P(i,j)为图像上的一个像素点,其中i为横坐标,j为纵坐标;
若P(i,j)=1,且P(i-1,j)=1或者P(i+1,j)=1,则P(i,j)为笔画横的像素点;
若P(i,j)=1,且P(i,j-1)=1或者P(i,j+1)=1,则P(i,j)为笔画竖的像素点;
若P(i,j)=1,且P(i-1,j+1)=1或者P(i+1,j-1)=1,则P(i,j)为笔画撇的像素点;
若P(i,j)=1,且P(i-1,j-1)=1或者P(i+1,j+1)=1,则P(i,j)为笔画捺的像素点。
结合第一方面,在第一方面的第六种可能实现方式中,所述将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称步骤包括:
根据提取的字符图像的特征值的向量,与预先存储在字符图像特征值库中的特征向量计算加权的距离;
根据计算的距离最小原则确定所述字符图像所对应的字符;
根据识别的字符确定当前台标所对应的频道名称。
结合第一方面的第六种可能实现方式,在第一方面的第七种可能实现方式中,所述将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称步骤之前,所述方法还包括:
判断当前台标图像中的字符行数是否为两行;
如果当前台标图像中的字符行数为两行,则从区别性较高的行开始进行字符图像的识别。
第二方面,本发明实施例提供了一种台标的本地识别装置,所述装置包括:
图像获取单元,用于获取电视播放画面中包括台标字符在内的台标图像;
字符分割单元,用于根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;
特征值提取单元,用于提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;
频道名称确定单元,用于将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
结合第二方面,在第二方面的第一种可能实现方式中,所述装置还包括:
灰度和二值化处理单元,用于对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理。
在本发明中,通过将包括台标字符的图像进行字符分割,得到分割后的单个字符的图像,并对每个字符图像进行特征值的提取,并根据划分的空间中满足要求的像素所占有的比例作为特征值,将提取的特征值与预设的字符图像特征库中的特征值进行比较,从而可以得到每个字符图像对应的字符,从而根据对应的字符确定电视播放画面的频道名称。本发明由于对图像进行字符分割后提取每个字符图像中的划分的空间中满足要求的像素所占的比例,从而可以有效的提高对不同形状的字符识别的准确率,并且对于具有部分相同字符的频道,也可以有效的识别。
附图说明
图1是本发明实施例提供的台标的本地识别方法的实现流程图;
图2是本发明实施例提供的数字和英文字符的特征提取的实现流程图;
图3是本发明实施例提供的汉字的特征提取的实现流程图;
图4为本发明实施例提供的台标的本地识别装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的目的在于提供一种台标的本地识别方法,以解决现有技术中,由于有些电视台的台标图像LOGO会动态的变化,比如有的台标为动态变化的圆球,这种动态变化的图像会导致根据图像LOGO识别困难增加。另外有些台标图像LOGO会不定时的更新,对应的,也需要重新更新识别算法。而有些台标图像LOGO是一样,只是后面添加数字来区分。针对这些台标图像LOGO情况,目前仅通过识别台标图像LOGO的方法对上述的情景识别不准确或者识别困难,也不便于扩展识别频道数目。
为解决该问题,本发明所述台标的本地识别方法包括:获取电视播放画面中包括台标字符在内的台标图像;根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
通过将包括台标字符的图像进行字符分割,得到分割后的单个字符的图像,并对每个字符图像进行特征值的提取,并根据划分的空间中满足要求的像素所占有的比例作为特征值,将提取的特征值与预设的字符图像特征库中的特征值进行比较,从而可以得到每个字符图像对应的字符,从而根据对应的字符确定电视播放画面的频道名称。本发明由于对图像进行字符分割后提取每个字符图像中的划分的空间中满足要求的像素所占的比例,从而可以有效的提高对不同形状的字符识别的准确率,并且对于具有部分相同字符的频道,也可以有效的识别。下面结合附图具体说明。
图1示出了本发明实施例提供的台标的本地识别方法的实现流程,详述如下:
在步骤S101中,获取电视播放画面中包括台标字符在内的台标图像。
具体的,本发明实施例中所述的电视播放画面,可以在电视节目正在播放 时截取画面,比如,可以为当电视画面为播放状态时,通过Android截屏接口获取到当前播放视频画面,并保存为图片文件。
其中,所述保存的台标图像中,包括台标的LOGO图像和台标中的字符图像。可以根据电视频道中设置的台标位置,并根据电视画面的大小所对应的比例,准确的获取到所述台标图像。
在步骤S102中,根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像。
对所述台标图像进行字符分割的目的在于,可以将台标中的字符提取出来单独进行比较判断,并且结合后续的特征提取方法,精确的确定电视节目的频道名称。
在进行字符分割前,作为本发明优选的一种实施方式,本发明还可包括对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理的步骤,具体叙述如下:
首先,对台标图像进行灰度化处理:
在步骤S101中获取的台标图像一般是彩色图像,有必要对该图像进行灰度化处理。图像的灰度化是指将彩色图像转化为灰度图像。灰度图像只含有亮度信息而不包含色彩信息。图像灰度化的目的是为了除去图像中多数无用的色彩信息,从而改善图像的画面质量,使图像显示的效果更加简单清晰。RGB图像是图像处理经常使用的一种图像格式,RGB中,R是Red,代表图像像素颜色的红色分量,G是Green,代表图像像素颜色的绿色分量,B是Blue,代表图像像素颜色的蓝色分量,若R=G=B,则由这三个分量构成的颜色在视觉上呈现灰色,表示一种灰度颜色,其中R、G、B的数值被称作该图像的灰度值,在这里用g来表示。通常在一幅彩色图像中,往往会存储大量的颜色信息,图像的每个像素都具有不同的R、G、B分量,所以需要占据的存储空间很大,而这些颜色信息在后续的图像处理中并不都能起到多少作用,相反,颜色信息的差异往往会对图像分析的结果产生反作用,且进行处理时也会浪费很多的系统资源,降低 系统的效率。
考虑到Android设备的广泛使用,以及移动设备资源和处理能力有限,有必要先减少彩色RGB图像中的颜色信息,将彩色RGB图像转变为灰度图像,以节省设备的资源,提高设备处理效率。R、G、B各个分量的取值范围是0-255,因此灰度级别是256级。本文采用加权平均值法进行灰度化处理:根据实际情况对R、G、B赋予不同的权值WR、WG、WB,再取他们的加权平均值,即 其中,权值WR、WG、WB可以先设置初始值,可根据图像处理情况及时调整。
然后,将灰度化处理后的图像进行二值化处理。当然,作为一种可能的实现方式,也可以直接将台标图像进行二值化处理。
图像二值化即将灰度图像中的各点原先的灰度值(例如0—255)置为最小0或最大255,只有这两个值,没有其他任何的中间值,从而将一副连续灰度变化的图像转换成一副黑白图像,只有黑(灰度值为0)或白(灰度值为255)。图像二值化的目的是将图像中感兴趣的目标与图像的背景进行分离,以方便后续的特征提取。经过二值化处理后的图像,边缘轮廓特别清楚,可以达到突出目标、淡化背景的作用。图像二值化的基本思想是先确定一个阈值,然后将所有像素的灰度值与这个值进行比较。若灰度大于等于阈值,则将原灰度值用255替换;反之,若灰度小于阈值,则将灰度值改为0。其中,阈值可以先设初始值,并根据图像处理情况进行再次调整。图像二值化处理使得图像中的背景和目标具有比灰度图更大的对比度,同时图像的数据量也比灰度图少,这样不仅能提高图像处理的效率,也能有效突出感兴趣目标的边缘轮廓及其大小和位置,为进一步的图像分析和处理作好基础。
在对台标图像进行灰度处理和二值化处理后,即可高效的对台标图像进行字符分割的步骤,字符分割过程包括:
通过将所述台标图像进行水平投影,确定所述台标图像的台标中字符的行 数以及每一行的起始和结束位置;
通过将所述台标图像中每一行进行垂直投影,确定所述台标图像的台标中每一行中字符的个数以及每个字符的起始和结束位置。
具体叙述如下:
在处理后的二值化台标图像中,通常像素值为255的是白色点,即图像背景,像素值为0的是黑色点,代表字符,如果某行或某列都是背景的话,那么该行或者列的投影一定是白色,由于字符间都存在间隔,因此字符与字符之间的间隔的投影也都是白色,根据这个规律,台标图像中的字符与字符之间可进行分离。
字符分割是将台标图像中的多个字符分割成多个单字符图像,目的是尽可能的去除字符边缘的背景信息,得到准确包含单个字符边缘的最小字符图像。在本文中,采用基于投影法的字符分割技术对台标图像中的字符进行字符分割。
投影法就是数字图像在某一个方向上进行像素累加,投影法应用到字符分割时通常有水平方向和垂直方向上的投影。二值化的字符图像在水平方向上的像素分布图中行与行之间有较大的空隙,这可以作为行切分的标准。行切分之后可以利用垂直投影进行字切分,原理相同。
由于部分台标图像中包含两行字符,比如CCTV-13等央视台标,其中,“CCTV-13”字符位于上面,“新闻”字符位于下面。因此本文釆用基于二维投影法(垂直投影和水平投影)的字符分割方法对字符进行精确分割。具体方法分为两步即两次切分,第一次切分是水平投影,确定台标图像中的字符行数,第二次是对第一次的切分结果即每一行进行字符切割,获取到该行中每一个字符。
具体过程如下:
第一次切分是对台标图像作水平投影,实现步骤如下:
(l)对灰度图像进行水平投影,统计每一行的像素灰度值之和,将结果存放在数组CountHorizontal[jHorizontal]中,其中jHorizontal表示图像的行。设widthHorizontal为图像的宽度,THorizontal为判断某一行是否是字符区域的阈值, THorizontal可设置初始值,并根据分割情况调整。StartHorizontal为单行字符区域的开始位置;EndHorizontal为单行字符区域的结束位置;CharacterHorizontal[NHorizontal]用于表示行数。初始化时jHorizontal=0,StartHorizontal=0,EndHorizontal=0,NHorizontal=0。
(2)jHorizontal++,若jHorizontal<widthHorizontal,则转至(3)继续执行;若jHorizontal≥widthHorizontal,则退出循环。
(3)若第jHorizontal行的像素灰度值之和满足CountHorizontal[jHorizontal]≤THorizontal,则表明此行为背景,转至(4);反之表明此行是字符区域,转至(5)。
(4)若StartHorizontal=0,表明此行不是字符区域,转至(2);若StartHorizontal≠0,表明此行为背景与字符区域的分界处,则EndHorizontal=jHorizontal-1,若EndHorizontal≠StartHorizontal转至(6),否则退出循环。
(5)若StartHorizontal=0,表明此行为字符区域的开始位置,则StartHorizontal=jHorizontal,转至(2);若StartHorizontal≠0,表明此行仍在字符区域内,转至(2)。
(6)NHorizontal++,记录第NHorizontal行。并更新开始位置StartHorizontal=EndHorizontal+NHorizontal*THorizontal。
当退出循环时候,NHorizontal即是总行数。
上述方法即通过判断一行中的像素的灰度值之和是否大于预设的灰度值阈值,如果大于,则表示该行为字符行,然后对下一行进行比较,直到对台标图像的最后行。
第二次切分是垂直投影,实现步骤如下:
(l)对上述水平投影的每一行进行垂直投影,统计每一列的像素灰度值之和,将结果存放在数组CountVertical[jVertical]中,其中jVertical表示图像的列。设widthVertical为图像的宽度。TVertical为判断某一列是否是字符区域的阈值,TVertical可设置初始值,并根据分割情况调整。StartVertical为单个字符区域的开始位置;EndVertical为单个字符区域的结束位置;MapCharacterVertical<NVertical,Map<StartVertical,EndVertical>>用于表示字符个数与其起始坐标、结束坐标对应关系,其中NVertical是第几个字符,而StartPot和EndPot分别是该字符的起始坐标与结束坐标。初始化时jVertical=0,StartVertical=0,EndVertical=0,NVertical=0。
(2)jVertical++,若jVertical<widthVertical,则转至(3)继续执行;若jVertical≥widthVertical,则退出循环。
(3)若第jVertical列的像素灰度值之和满足CountVertical[jVertical]≤TVertical,则表明此列为背景,转至(4);反之表明此列是字符区域,转至(5)。
(4)若StartVertical=0,表明此列不是字符区域,转至(2);若StartVertical≠0,表明此列为背景与字符区域的分界处,则EndVertical=jVertical-1,若EndVertical≠StartVertial转至(6),否则退出循环。
(5)若StartVertical=0,表明此列为字符区域的开始位置,则StartVertical=jVertical,转至(2);若StartVertical≠0,表明此列仍在字符区域内,转至(2)。
(6)NVertical++,记录第NVertical个字符以及其开始坐标StartPot和结束坐标EndPot,并更新开始位置StartVertical=EndVertical+NVertical*TVertical。
当退出循环时,MapCharacterVertical<NVertical,Map<StartVertical,EndVertical>>的大小就是每行字符总数,并且根据MapCharacterVertical<NVertical,Map<StartVertical,EndVertical>>get(i)可获取到第i个字符与其开始坐标和结束坐标。
同样,通过对每列的像素的灰度值的和与预定的灰度值阈值比较,如果大于预定的灰度值阈值,则表示当前列为字符区域,如果小于预定的灰度值阈值, 则说明当前为空白区域,可能为字符间的间隙或者为行的开始或者末尾。
在步骤S103中,提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例。
具体的,字符特征的提取就是从原始图像的大量信息中提取出最能凸显事物本质特征的少量信息作为字符识别的依据。在字符识别系统中,特征提取是影响字符识别率高低的决定性因素。本提案针对台标图像中字符的特性,包含英文字符、数字字符以及汉字字符的特点,分别采用不同的特征提取方法。具体如下:
首先,对数字和英文字符进行网格特征提取,方法主要是将图像平均分成n等份,把网格内黑像素数所占的比例作为特征。具体提取步骤如图2所示,具体叙述如下:
(201)首先将字符图像横竖平分成n个网格,举例如4个网格,记为{a1,a2,a3,a4},统计各网格内黑色像素点的个数,形成一个4维的向量。
(202)其次在垂直方向平分成w个网格,举例如4个网格,记为{a5,a6,a7,a8},分别统计各网格内黑色像素点个数,也形成一个4维向量。
(203)同理在水平方向平分成h个网格,举例如4个网格,记为{a9,a10,a11,a12},分别统计各网格内黑色像素点个数,也形成一个4维向量。
(204)根据上述方法,统计每个字符的n+w+h维,如上述12维像素点个数,保存到模板特征库中。其中,n、w、h可根据提取的特征值情况进行再次调整。
虽然汉字的笔画种类虽然繁多,但总结起来基本的笔画只有四种:横、竖、撇、捺,其它复杂的笔画都是由这四种基本笔画组合而成的。对二值化的图像按照四种笔画成分进行标记,通过把属于不同笔画成分的像素点归纳为不同的集合,可以标记出汉字的四种笔画,然后记录每种笔画集合的像素点个数可以得到汉字的笔画的四个向量参数。
综上,汉字除了提取网格特征,还提取横、竖、撇、捺特征,在匹配识别时候,先匹配网格n+w+h个区域(比如上述12维)的特征,再匹配横、竖、 撇、捺的特征。
设P为二值化的图像,P(i,j)为图像中的一个像素点,坐标原点位于图像的左上角,其中i为横坐标,j为纵坐标。
采用H表示横笔画像素点的集合,当前像素点为P(i,j),若P(i,j)=1,且P(i-1,j)=1或P(i+1,j)=1,则P(i,j)∈H。
采用V表示竖笔画像素点的集合。当前像素点为P(i,j),若P(i,j)=1,且P(i,j-1)=1或P(i,j+1)=1,则P(i,j)∈V。
采用P表示撇笔画像素点的集合。当前像素点为P(i,j),若P(i,j)=1,且P(i+1,j-1)=1或P(i-1,j+1)=1,则P(i,j)∈P。
采用N表示捺笔画像素点的集合。当前像素点为P(i,j),若P(i,j)=1,且P(i-1,j-1)=1或P(i+1,j+1)=1,则P(i,j)∈N。
采用CountH表示某一文字图像中横笔画的像素点个数,CountV表示某一文字图像中竖笔画的像素点的个数,CountP表示某一文字图像中撇笔画的像素点的个数,CountN表示某一文字图像中捺笔画的像素点的个数。
定义了上述集合之后,按照从上至下、从左至右的顺序扫描汉字图像P,扫描之后就可以确定某个像素点隶属于哪一种笔画或哪几种笔画,分别记录四种笔画的像素点个数,从而得到一个四维的特征向量{CountH,CountV,CountP,CountN},加上上述n+w+h维网格特征,新特征值就代表了一个汉字的特征。
在步骤S104中,将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
台标图像中字符特征为n(举例如{a1,a2,a3,a4})、w(举例如{a5,a6,a7,a8})、h(举例如{a9,a10,a11,a12})、{CountH,CountV,CountP,CountN},由于当前需要识别的台标数和台标名称是确定的,将上述n+w+h和{CountH,CountV,CountP,CountN},举例如16个特征作为待识别字符的特征量,通过计算台标列表中的每一个台标 名称中字符的特征,形成系统所用的标准模板字库。
根据上述提取出的网格特征与汉字特征,求出各个模板特征向量的加权距离,加权距离最小的即为识别结果,进行字符识别。字符识别具体步骤如图3所示,叙述如下:
301).如前所述计算字符模板网格特征一样,将待识别字符图像也分为n+w+h(举例如12)个区域。
302).如前所述计算汉字特征一样,计算待识别字符图像的横、竖、撇、捺特征。
303).将上述计算的待识别字符的n+w+h和{CountH,CountV,CountP,CountN}特征与模块的n+w+h和{CountH,CountV,CountP,CountN}进行模板匹配,求匹配差异度。举例如待识别字符与模板的{a1,a2,a3,a4}、{a5,a6,a7,a8}、{a9,a10,a11,a12}、{CountH,CountV,CountP,CountN}维特征值进行匹配。
304).对差异度求和。
305).依次提取模板的n+w+h和{CountH,CountV,CountP,CountN}(举例如16维)区域与待识别字符图像相应区域进行匹配,计算各个模板与待识别字符的累加差异度,取累加差异度最小的,所对应的模板即为识别结果。当然,也可以通过计算向量间的距离值,取距离值最小的向量对应的字符为匹配的字符。
在对字符识别后,即可根据识别后的字符进行台标的识别。本发明实施例对台标的识别过程,可以根据台标的行数,优先判断区别性较高的行,通常为第二行字符,比如中央电视台的第二行字符通常为汉字,包括如“新闻”、“戏曲”等。
台标识别的流程如下:
401.根据前文所述水平投影的方法确定当前台标图像的字符行数;
402.如果是两行,则开始识别其区别性较高的字符所在行,如果不是,则开始识别当前行的字符;
403.根据前文所述垂直投影的方法确定当前行中字符个数以及每个字符的 开始坐标与结束坐标;
404.遍历所有字符个数并开始识别,所有字符是否识别完毕,如果是跳转到405,否则跳转到406;
405.整合所有字符识别结果即为台标识别结果,退出循环;
406.获取当前行字符中第i个字符以及其开始坐标和结束坐标。其中i=1。
407.根据前文所述的字符识别方法,判断第i个字符是否识别出。如果是跳转到408,否则跳转到412;
408.遍历台标列表中所有频道名称中首字符,判断该首字符是否与上述识别出的字符相同。如果是跳转到409,否则跳转到413;
409.在台标列表所有频道名称中找到首字符是该字符的所有频道名称;
410.判断上述找到的频道名称在台标列表所有频道名称中的唯一性,如果是跳转到411,否则跳转到413;
411.得出台标识别结果,退出循环;
412.重新获取该字符特征并更新模板库,即对模板库中字符与特征值的对应关系进行更新;
413.获取下一个字符,即对下一个字符进行识别。
图4为本发明实施例提供的台标的本地识别装置的结构示意图,详述如下:
本发明实施例中所述的台标的本地识别装置,包括:
图像获取单元4001,用于获取电视播放画面中包括台标字符在内的台标图像;
字符分割单元4002,用于根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;
特征值提取单元4003,用于提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;
频道名称确定单元4004,用于将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
优选的,所述装置还包括:
灰度和二值化处理单元,用于对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理。
本发明实施例中所述的台标的本地识别装置与图1-图4中所述的台标的本地识别方法对应,在此不作重复赘述.
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储 介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种台标的本地识别方法,其特征在于,包括:
获取电视播放画面中包括台标字符在内的台标图像,包括:当电视画面为播放状态时,通过Android截屏接口获取到当前播放视频画面,并保存为图片文件,根据电视频道中设置的台标位置,并根据电视画面的大小所对应的比例,准确的获取到所述台标图像;
根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;
提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;其中,在所述提取所述分割后的单个的字符图像所对应的特征值步骤中包括数字和英文字符特征提取的步骤,所述数字和英文字符特征提取的步骤包括:
将所述字符图像横竖平分为n个网格,统计每个网格内满足预设要求的像素点的个数得到n维向量;
将所述字符图像垂直方向上平分为w个网格,统计每个网格内满足预设要求的像素点的个数得到w维向量;
将所述字符图像竖直上平分为h个网格,统计每个网格内满足预设要求的像素点的个数得到h维向量;
根据所述n维向量、w维向量、h维向量得到所述字符图像所对应的n+w+h维向量;
将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
2.根据权利要求1所述方法,其特征在于,在所述根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像步骤之前,还包括:
对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理。
3.根据权利要求1或2所述方法,其特征在于,所述根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像步骤包括:
通过将所述台标图像进行水平投影,确定所述台标图像的台标中字符的行数以及每一行的起始和结束位置;
通过将所述台标图像中每一行进行垂直投影,确定所述台标图像的台标中每一行中字符的个数以及每个字符的起始和结束位置。
4.根据权利要求1或2所述方法,其特征在于,在所述提取所述分割后的单个的字符图像所对应的特征值步骤中包括汉字字符特征的提取的步骤,所述汉字字符特征的提取的步骤包括:
统计所述字符图像中的像素点属于横、竖、撇、捺四种笔画的个数,根据每种笔画的像素点的个数构成汉字图像对应的四个向量参数。
5.根据权利要求4所述方法,其特征在于,所述统计所述字符图像中的像素点属于横、竖、撇、捺四种笔画的个数步骤包括:
P为二值化图像,P(i,j)为图像上的一个像素点,其中i为横坐标,j为纵坐标;
若P(i,j)=1,且P(i-1,j)=1或者P(i+1,j)=1,则P(i,j)为笔画横的像素点;
若P(i,j)=1,且P(i,j-1)=1或者P(i,j+1)=1,则P(i,j)为笔画竖的像素点;
若P(i,j)=1,且P(i-1,j+1)=1或者P(i+1,j-1)=1,则P(i,j)为笔画撇的像素点;
若P(i,j)=1,且P(i-1,j-1)=1或者P(i+1,j+1)=1,则P(i,j)为笔画捺的像素点。
6.根据权利要求1所述方法,其特征在于,所述将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称步骤包括:
根据提取的字符图像的特征值的向量,与预先存储在字符图像特征值库中的特征向量计算加权的距离;
根据计算的距离最小原则确定所述字符图像所对应的字符;
根据识别的字符确定当前台标所对应的频道名称。
7.根据权利要求6所述方法,其特征在于,所述将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称步骤之前,所述方法还包括:
判断当前台标图像中的字符行数是否为两行;
如果当前台标图像中的字符行数为两行,则从区别性较高的行开始进行字符图像的识别。
8.一种台标的本地识别装置,其特征在于,所述装置包括:
图像获取单元,用于获取电视播放画面中包括台标字符在内的台标图像,包括:当电视画面为播放状态时,通过Android截屏接口获取到当前播放视频画面,并保存为图片文件,根据电视频道中设置的台标位置,并根据电视画面的大小所对应的比例,准确的获取到所述台标图像;
字符分割单元,用于根据投影法对所述台标图像进行字符分割,得到分割后的单个的字符图像;
特征值提取单元,用于提取所述分割后的单个的字符图像所对应的特征值,所述特征值为根据划分的空间中满足要求的像素所占有的比例;其中,在所述提取所述分割后的单个的字符图像所对应的特征值步骤中包括数字和英文字符特征提取的步骤,所述数字和英文字符特征提取的步骤包括:
将所述字符图像横竖平分为n个网格,统计每个网格内满足预设要求的像素点的个数得到n维向量;
将所述字符图像垂直方向上平分为w个网格,统计每个网格内满足预设要求的像素点的个数得到w维向量;
将所述字符图像竖直上平分为h个网格,统计每个网格内满足预设要求的像素点的个数得到h维向量;
根据所述n维向量、w维向量、h维向量得到所述字符图像所对应的n+w+h维向量;
频道名称确定单元,用于将提取的特征值与预设的字符图像特征值库进行比较,确定当前台标所对应的频道名称。
9.根据权利要求8所述装置,其特征在于,所述装置还包括:
灰度和二值化处理单元,用于对所述台标图像进行灰度处理,并根据灰度处理后的图像进一步进行二值化处理。
CN201510485957.4A 2015-08-10 2015-08-10 一种台标的本地识别方法和装置 Active CN106446889B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510485957.4A CN106446889B (zh) 2015-08-10 2015-08-10 一种台标的本地识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510485957.4A CN106446889B (zh) 2015-08-10 2015-08-10 一种台标的本地识别方法和装置

Publications (2)

Publication Number Publication Date
CN106446889A CN106446889A (zh) 2017-02-22
CN106446889B true CN106446889B (zh) 2019-09-17

Family

ID=58093516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510485957.4A Active CN106446889B (zh) 2015-08-10 2015-08-10 一种台标的本地识别方法和装置

Country Status (1)

Country Link
CN (1) CN106446889B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958252A (zh) * 2017-11-23 2018-04-24 深圳码隆科技有限公司 一种商品识别方法和设备
CN109447074A (zh) * 2018-09-03 2019-03-08 中国平安人寿保险股份有限公司 一种车牌识别方法及终端设备
CN110968375B (zh) * 2018-09-29 2023-01-31 Tcl科技集团股份有限公司 界面控制方法、装置、智能终端及计算机可读存储介质
CN111598102B (zh) * 2020-05-28 2023-08-22 北京轨道交通路网管理有限公司 叠加字符的检测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324883A (zh) * 2008-07-31 2008-12-17 电子科技大学 一种变异关键词的提取方法
CN102446272A (zh) * 2011-09-05 2012-05-09 Tcl集团股份有限公司 一种台标分割及识别的方法、装置及电视机
CN103336954A (zh) * 2013-07-08 2013-10-02 北京捷成世纪科技股份有限公司 一种视频中的台标识别方法和装置
CN103729657A (zh) * 2014-01-26 2014-04-16 深圳创维-Rgb电子有限公司 一种台标样本库构建方法及装置和台标识别方法及装置
CN104156704A (zh) * 2014-08-04 2014-11-19 胡艳艳 一种新的车牌识别方法及系统
CN104299009A (zh) * 2014-09-23 2015-01-21 同济大学 基于多特征融合的车牌字符识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324883A (zh) * 2008-07-31 2008-12-17 电子科技大学 一种变异关键词的提取方法
CN102446272A (zh) * 2011-09-05 2012-05-09 Tcl集团股份有限公司 一种台标分割及识别的方法、装置及电视机
CN103336954A (zh) * 2013-07-08 2013-10-02 北京捷成世纪科技股份有限公司 一种视频中的台标识别方法和装置
CN103729657A (zh) * 2014-01-26 2014-04-16 深圳创维-Rgb电子有限公司 一种台标样本库构建方法及装置和台标识别方法及装置
CN104156704A (zh) * 2014-08-04 2014-11-19 胡艳艳 一种新的车牌识别方法及系统
CN104299009A (zh) * 2014-09-23 2015-01-21 同济大学 基于多特征融合的车牌字符识别方法

Also Published As

Publication number Publication date
CN106446889A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN104756491B (zh) 基于组合的深度提示从单视场图像生成深度图
US9824294B2 (en) Saliency information acquisition device and saliency information acquisition method
KR101880004B1 (ko) 텔레비전 채널 정보를 식별하기 위한 방법 및 장치
US9646202B2 (en) Image processing system for cluttered scenes and method of operation thereof
WO2017092431A1 (zh) 基于肤色的人手检测方法及装置
CN106446889B (zh) 一种台标的本地识别方法和装置
US20110050723A1 (en) Image processing apparatus and method, and program
CN107274373B (zh) 直播中打码方法及装置
KR101384627B1 (ko) 영상 내 객체 영역 자동분할 방법
CN106127799B (zh) 一种对于三维视频的视觉注意力检测方法
CN108280190A (zh) 图像分类方法、服务器及存储介质
CN104463134B (zh) 一种车牌检测方法和系统
CN110276769B (zh) 一种视频画中画架构中直播内容定位方法
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
CN106682670A (zh) 一种台标识别方法及系统
KR20100091864A (ko) 비디오 동영상의 움직이는 다중 객체 자동 분할 장치 및 방법
CN108038458B (zh) 基于特征摘要图的视频中的户外场景文本自动获取方法
CN107832359B (zh) 一种图片检索方法及系统
CN113297420A (zh) 视频图像处理方法、装置、存储介质及电子设备
US20130121575A1 (en) Image analysis apparatus using main color and method of controlling the same
CN102883170A (zh) 图像处理装置、图像处理方法及图像处理程序
CN109657083B (zh) 纺织品图片特征库的建立方法和装置
CN103942543B (zh) 一种图像识别方法及装置
KR101741761B1 (ko) 멀티 프레임 기반 건물 인식을 위한 특징점 분류 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 516006 TCL science and technology building, No. 17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province

Patentee after: TCL Technology Group Co.,Ltd.

Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District

Patentee before: TCL Corp.