CN107135402A - 一种识别电视台图标的方法及装置 - Google Patents

一种识别电视台图标的方法及装置 Download PDF

Info

Publication number
CN107135402A
CN107135402A CN201610112162.3A CN201610112162A CN107135402A CN 107135402 A CN107135402 A CN 107135402A CN 201610112162 A CN201610112162 A CN 201610112162A CN 107135402 A CN107135402 A CN 107135402A
Authority
CN
China
Prior art keywords
station
picture
belief network
icon
depth belief
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610112162.3A
Other languages
English (en)
Inventor
胡东方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Tvmining Juyuan Media Technology Co Ltd
Original Assignee
Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Tvmining Juyuan Media Technology Co Ltd filed Critical Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority to CN201610112162.3A priority Critical patent/CN107135402A/zh
Publication of CN107135402A publication Critical patent/CN107135402A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种识别电视台图标的方法及装置。所述识别电视台图标的方法,包括:根据预设的电视台图标训练样本库,训练基于深度学习的深度信念网络;测试训练后的所述基于深度学习的深度信念网络;获取待检测的电视台的画面图像;通过所述合格的基于深度学习的深度信念网络来分析所述待检测的电视台的画面图像;输出所述待检测的电视台的画面图像所对应的电视台图标。本发明可通过训练深度信念网络,使得深度信念网络具有高度识别电视台图标的能力,当用户提交待识别的电视台的画面到该训练后深度信念网络后,可以准确的识别出待识别的电视台的画面中的电视台图标。

Description

一种识别电视台图标的方法及装置
技术领域
本发明涉及图像智能分析领域,特别涉及一种识别电视台图标的方法及装置。
背景技术
电视台图标是广播视频中所特有的视觉内容之一,包含了该电视台的台名、类型、版权等重要的语义信息,是区分广播电视频道的重要标识,而且台标的识别对于广播电视的节目导向、内容分析和检索等都具有重要的意义。目前,在识别电视台图标的方面,经常会遇到电视台图标出现在复杂的背景图像中,而且背景图像在很多情况下会持续变化,复杂又持续变化的背景图像会影响到识别电视台图标的准确度。特别是目前电视台的数量非常多,据统计不少于三百个频道,其中有些电视台图标的类似度较高,增加了准确识别电视台图标的难度。因此如何解决上述问题,就成为了业界亟待解决的课题。
发明内容
本发明提供一种识别电视台图标的方法及装置,通过训练深度信念网络来模拟人类识别图像的思维模式,以达到在精确的识别电视台图标的目的。
根据本发明实施例的第一方面,提供一种识别电视台图标的方法,包括:
根据预设的电视台图标训练样本库,训练深度信念网络;
测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
获取待检测的电视台的画面图像;
通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
输出所述待检测的电视台的画面图像所对应的电视台图标。
在一个实施例中所述根据预设的电视台图标训练样本库,训练深度信念网络,包括:
在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
使用所述标准图像画面,训练所述深度信念网络。
在一个实施例中,所述测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络,包括:
选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
将所述各个电视台的m幅图像画面生成对应的标准图像画面;
通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算所述测试电视台图标的准确率;
当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络。
在一个实施例中,所述根据预设的电视台图标训练样本库,训练深度信念网络,还包括:
实时检测所述训练深度信念网络的过程中的拟合精度;
实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
在一个实施例中,所述重新开始训练所述深度信念网络,包括:
重新获取所述各个电视台的n幅图像画面;
根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
使用所述标准图像画面,重新训练所述深度信念网络。
根据本发明实施例的第二方面,提供一种识别电视台图标的装置,包括:
训练模块,用于根据预设的电视台图标训练样本库,训练深度信念网络;
测试模块,用于测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
获取模块,用于获取待检测的电视台的画面图像;
分析模块,用于通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
输出模块,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
在一个实施例中,所述训练模块,包括:
获取子模块,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块,用于使用所述标准图像画面,训练所述深度信念网络。
在一个实施例中,所述测试模块,包括:
选择子模块,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块,用于通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
输出子模块,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块,用于计算所述测试电视台图标的准确率;
确定子模块,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
第一重训子模块,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络。
在一个实施例中,所述训练模块,还包括:
监测子模块,实时监测所述训练深度信念网络的过程中的拟合精度;
判断子模块,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
在一个实施例中,所述第一重训子模块和第二重训子模块,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述深度信念网络。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一示例性实施例示出的一种识别电视台图标的方法的流程图;
图2为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S11的流程图;
图3为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S12的流程图;
图4为本发明又一示例性实施例示出的一种识别电视台图标的方法的步骤S11的流程图;
图5为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S37和步骤S43流程图;
图6为本发明一示例性实施例示出的一种识别电视台图标的装置的框图;
图7为本发明一示例性实施例示出的一种识别电视台图标的装置的训练模块61的框图;
图8为本发明一示例性实施例示出的一种识别电视台图标的装置的测试模块62的框图;
图9为本发明又一示例性实施例示出的一种识别电视台图标的装置的训练模块61框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
电视台图标是广播视频中所特有的视觉内容之一,包含了该电视台的台名、类型、版权等重要的语义信息,是区分广播电视频道的重要标识,而且台标的识别对于广播电视的节目导向、内容分析和检索等都具有重要的意义。目前,在识别电视台图标的方面,经常会遇到电视台图标出现在复杂的背景图像中,而且背景图像在很多情况下会持续变化,复杂又持续变化的背景图像会影响到识别电视台图标的精度。特别是目前电视台的数量非常多,据统计不少于三百个频道,有些电视台图标的类似度较高,更加降低了识别电视台图标的精度。因此如何解决上述问题,就成为了业界亟待解决的课题。
图1是根据一示例性实施例示出的一种识别电视台图标的方法流程图,如图1所示,该识别电视台图标的方法,包括以下步骤S11-S15:
在步骤S11中,根据预设的电视台图标训练样本库,训练深度信念网络;
深度学习(Deep Learning,简称DL)的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习研究中的一个领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
深度信念网络(Deep Belief Network,简称DBN)是一种深度的监督学习下的机器学习模型,是深度神经网络中的一种,通过训练其神经元间的权重,可以让整个神经网络按照最大概率来生成训练数据。深度信念网络的组成元件是受限玻尔兹曼机(Restricted Boltzmann Machines,简称RBM),本实施例中的深度信念网络由两层限制玻尔兹曼机构成。深度信念网络,在多层神经网络的基础上,加入特征学习的内容,用来模仿人脑对信号的分级处理的处理方式。
根据预设的电视台图标训练样本库,深度信念网络会在训练的过程中自动学习并不断完善自身的识别能力。训练的样本数量越多,该深度信念网络可能具备的分析能力就越强大。
在步骤S12中,测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
经过测试训练后的深度信念网络已经具备了一定的对电视台图标的识别能力,此时,需要使用不同于训练时使用的样本库中的样本,进行检验该训练后的深度信念网络的识别能力。
在步骤S13中,获取待检测的电视台的画面图像;
在步骤S14中,通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
通过获取待检测的电视台的画面图像的低层图像特征,根据该低层图像特征来判断其所对应的高层图像特征,进而得出通过该高层图像特征得出相应的电视台图标。该低层图像特征和该高层图形之间的层数大于三层。
在步骤S15中,输出所述待检测的电视台的画面图像所对应的电视台图标。
输出该待检测的电视台的画面图像所对应的电视台图标,同时,还可以提供相似度较高的几个相似电视台图标,以供用户参考。
本实施例中所使用的深度信念网络具有类似于人脑思考方式的多层次结构,通过识别图像中的低层图像特征,比如像素。然后逐渐升级到较高层次图像特征,比如轮廓、纹理。再逐渐升级高更高层次的图像特征。相邻的上层层次能够学习到下层的数据本身的结构。在学习到第n-1层后,将n-1层的输出作为第n层的输入,训练第n层,该n的数值大于4。
随着训练完成的样本数据量的增加,深度信念网络的识别能力也随之增强。在深度信念网络训练的过程中,是无需人工参与调节的。低层的图像特征也是无需人工指定,可以通过深度信念网络自身解决。
在一个实施例中,如图2所示,步骤S11包括如下步骤S21-S25:
在步骤S21中,在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
获取电视台的图像画面,电视台的数量可以是大于2的任意正整数。由于深度信念网络的特性,故对于每个电视台而言,提供越多的电视台的图像画面,越可以提高深度信念网络在训练后的识别能力。
在步骤S22中,根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
该预设的截取区域是根据先验知识,电视台图标总是出现在屏幕的左上角或者是右上角。故,判断出某个电视台图标出现在左上角或者右上角,不妨假设该电视台图标出现在左上角,那么对于该电视台只截取该电视台的图像画面的左上角即可。而且电视台图标的本身的尺寸大小也是有限制的,所以需要的截取区域是的大小也可以是固定的,这样可以方便对众多电视台做出统一处理。将截取出来的截取区域内的图像画面称之为截取图像画面。
在步骤S23中,将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
对截取画面的尺寸转换为统一的尺寸,该尺寸是预设的标准尺寸。可以方便后续的环节的处理。
在步骤S24中,将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
在步骤S25中,使用所述标准图像画面,训练所述深度信念网络。
本实施例中的深度信念网络是在神经网络的基础上,模仿了人脑对信号的分级处理,加入特征学习的功能,该深度信念网络可以自发的学习特征,通过多层的训练,实现对图像的低层图像特征的识别上升到图像的高层图像特征的识别。其中相邻的两层之间,下层的神经网络为上层的神经网络提供输入,上层的神经网络只接收下层的神经网络的图像特征。
通过训练大量的样本,来达到增强深度信念网络的分析能力。在选择样本方面,为了提高深度信念网络的分析能力,需要选择具有电视台的视频画面中关键帧的图像。所谓关键帧的图像是指为某个电视台准备的样本数据中,其中每个样本数据之间的差异度要大于预设的差异度阈值。
在一个实施例中,如图3所示,步骤S12包括如下步骤S31-S37:
在步骤S31中,选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
测试训练后的深度信念网络所选取的测试样本库,对于选择测试样本库是有要求的。首先,测试样本库中样本数量不能过少,一般来说不少于一半的训练样本库的样本数量;其次,测试样本库与训练样本库的交集为空集。
在步骤S32中,将所述各个电视台的m幅图像画面生成对应的标准图像画面;
对测试样本库中所有的图像画面截取图像画面,该图像画面是预设的截取区域内的图像画面;再将该图像画面转换为标准尺寸;接着再进行灰度化处理,即可完成测试样本库中的所有图像画面转换为标准图像画面。
在步骤S33中,通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
在步骤S34中,输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
在步骤S35中,计算所述测试电视台图标的准确率;
测试样本库中每个图像画面都预先记录了该图像画面来自于那个电视台,即对于测试样本数据库中的每个图像画面对应的真实电视台图标都是已知的。通过本实施例中的测试方法,可得到每个图像画面的测试电视台图标。比较每个图像画面的真实电视台图标和测试电视台图标是否是相符的。通过统计,可以得出通过本实施例的方法预测电视台图标的准确率。
在步骤S36中,当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
在步骤S37中,当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络。
重新开始训练该深度信念网络,需要选取新的电视台图标训练样本库。可以在上次训练的基础上,继续通过新的电视台图标训练样本库来训练该深度信念网络;还可以清除上次训练所产生的所有数据,使得该深度信念网络没有任何在上次训练所带来的影响,再通过新的电视台图标训练样本库来训练该深度信念网络。
在一个实施例中,如图4所示,步骤S11还包括如下步骤S41-S43:
在步骤S41中,实时检测所述训练深度信念网络的过程中的拟合精度;
在步骤S42中,实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
在步骤S43中,当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
在一个实施例中,在使用本实施例中的方法训练深度信念网络的过程中,实时监测该深度信念网络的拟合精度的变化情况。在对大数据的训练过程中,拟合精度通常是逐渐缓慢提升的。如果出现拟合精度的增长幅度是否大于预设的过拟合增长阈值的情况,那么通常是出现了过拟合的情况。对于出现了过拟合的情况,一般而言是需要重新开始训练该深度信念网络的。也可以继续训练该深度信念网络,通过测试该深度信念网络的性能,即测试电视台图标的准确度,再决定是否重新开始训练该深度信念网络。
在一个实施例中,如图5所示,步骤S37和步骤43包括如下步骤S51-S53:
在步骤S51中,重新获取所述各个电视台的n幅图像画面;
在步骤S52中,根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
在步骤S53中,使用所述标准图像画面,重新训练所述深度信念网络。
在一个实施例中,重新组建新的电视台图标训练样本库,即重新获取各个电视台的n幅图像画面。对重新获取各个电视台的n幅图像画面截取预设的截取区域内的图像画面,再将该些图像画面转换为标准尺寸,接着再进行灰度化处理,即可完成重新组建新的电视台图标训练样本库。其中,重新组建新的电视台图标训练样本库和之前的电视台图标训练样本库之间必须存在不同的样本数据,而且该不同的样本数据越多越佳。
在一个实施例中,图6是根据一示例性实施例示出的一种识别电视台图标的装置框图。如图6示,该装置包括训练模块61、测试模块62、获取模块63、分析模块64和输出模块65。
该训练模块61,用于根据预设的电视台图标训练样本库,训练深度信念网络;
测试模块62,用于测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
获取模块63,用于获取待检测的电视台的画面图像;
分析模块64,用于通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
输出模块65,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
如图7所示,该训练模块61包括获取子模块71、截取子模块72、转换子模块73、灰度化子模块74和训练子模块75。
获取子模块71,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块72,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块73,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块74,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块75,用于使用所述标准图像画面,训练所述深度信念网络。
如图8所示,该测试模块62包括选择子模块81、生成子模块82、分析子模块83、输出子模块84、计算子模块85、确定子模块86和第一重训子模块87。
该选择子模块81,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块82,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块83,用于通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
输出子模块84,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块85,用于计算所述测试电视台图标的准确率;
确定子模块86,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
第一重训子模块87,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络;
第一重训子模块87,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述深度信念网络。
如图9所示,该训练模块61还包括监测子模块91、判断子模块92和第二重训子模块93。
监测子模块91,实时监测所述训练深度信念网络的过程中的拟合精度;
判断子模块92,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块93,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
第二重训子模块93,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述深度信念网络。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种识别电视台图标的方法,其特征在于,包括:
根据预设的电视台图标训练样本库,训练深度信念网络;
测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
获取待检测的电视台的画面图像;
通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
输出所述待检测的电视台的画面图像所对应的电视台图标。
2.如权利要求1所述的方法,其特征在于,所述根据预设的电视台图标训练样本库,训练深度信念网络,包括:
在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
使用所述标准图像画面,训练所述深度信念网络。
3.如权利要求2所述的方法,其特征在于,所述测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络,包括:
选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
将所述各个电视台的m幅图像画面生成对应的标准图像画面;
通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算所述测试电视台图标的准确率;
当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络。
4.如权利要求2所述的方法,其特征在于,所述根据预设的电视台图标训练样本库,训练深度信念网络,还包括:
实时监测所述训练深度信念网络的过程中的拟合精度;
实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
5.如权利要求3、4所述的方法,其特征在于,所述重新开始训练所述深度信念网络,包括:
重新获取所述各个电视台的n幅图像画面;
根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
使用所述标准图像画面,重新训练所述深度信念网络。
6.一种识别电视台图标的装置,其特征在于,包括:
训练模块,用于根据预设的电视台图标训练样本库,训练深度信念网络;
测试模块,用于测试训练后的所述深度信念网络,将测试结果达到预设合格阈值的深度信念网络称之为合格的深度信念网络;
获取模块,用于获取待检测的电视台的画面图像;
分析模块,用于通过所述合格的深度信念网络来分析所述待检测的电视台的画面图像;
输出模块,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
7.根据权利要求6的装置,其特征在于,所述训练模块,包括:
获取子模块,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块,用于使用所述标准图像画面,训练所述深度信念网络。
8.根据权利要求7的装置,其特征在于,所述测试模块,包括:
选择子模块,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块,用于通过所述训练后的所述深度信念网络来分析所述各个电视台的m幅图像画面;
输出子模块,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块,用于计算所述测试电视台图标的准确率;
确定子模块,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述深度信念网络为合格的深度信念网络;
第一重训子模块,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述深度信念网络。
9.根据权利要求7的装置,其特征在于,所述训练模块,还包括:
监测子模块,实时监测所述训练深度信念网络的过程中的拟合精度;
判断子模块,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述深度信念网络。
10.根据权利要求8、9的装置,其特征在于,
所述第一重训子模块和第二重训子模块,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述深度信念网络。
CN201610112162.3A 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置 Pending CN107135402A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610112162.3A CN107135402A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610112162.3A CN107135402A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Publications (1)

Publication Number Publication Date
CN107135402A true CN107135402A (zh) 2017-09-05

Family

ID=59721560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610112162.3A Pending CN107135402A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Country Status (1)

Country Link
CN (1) CN107135402A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117768A (zh) * 2018-07-30 2019-01-01 上海科江电子信息技术有限公司 一种基于深度学习的台标识别方法
CN110221964A (zh) * 2019-05-06 2019-09-10 福建天晴数码有限公司 基于深度信念网络的ui自动化测试方法、存储介质
CN112183438A (zh) * 2020-10-13 2021-01-05 深圳龙岗智能视听研究院 基于小样本学习神经网络的违规行为的图像识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102264A (ja) * 2005-09-30 2007-04-19 Toshiba Corp 文字認識装置および文字認識方法
CN103336954A (zh) * 2013-07-08 2013-10-02 北京捷成世纪科技股份有限公司 一种视频中的台标识别方法和装置
CN103607603A (zh) * 2013-11-28 2014-02-26 Tcl集团股份有限公司 一种识别台标的方法及装置
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103902987A (zh) * 2014-04-17 2014-07-02 福州大学 一种基于卷积网络的台标识别方法
CN104869433A (zh) * 2015-05-20 2015-08-26 小米科技有限责任公司 电视频道的确定方法、装置及服务器
CN105095837A (zh) * 2014-05-15 2015-11-25 Tcl集团股份有限公司 一种台标识别方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102264A (ja) * 2005-09-30 2007-04-19 Toshiba Corp 文字認識装置および文字認識方法
CN103336954A (zh) * 2013-07-08 2013-10-02 北京捷成世纪科技股份有限公司 一种视频中的台标识别方法和装置
CN103607603A (zh) * 2013-11-28 2014-02-26 Tcl集团股份有限公司 一种识别台标的方法及装置
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103902987A (zh) * 2014-04-17 2014-07-02 福州大学 一种基于卷积网络的台标识别方法
CN105095837A (zh) * 2014-05-15 2015-11-25 Tcl集团股份有限公司 一种台标识别方法和系统
CN104869433A (zh) * 2015-05-20 2015-08-26 小米科技有限责任公司 电视频道的确定方法、装置及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张博洋等: "基于神经网络的静态台标识别系统设计与实现", 《计算机仿真》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117768A (zh) * 2018-07-30 2019-01-01 上海科江电子信息技术有限公司 一种基于深度学习的台标识别方法
CN110221964A (zh) * 2019-05-06 2019-09-10 福建天晴数码有限公司 基于深度信念网络的ui自动化测试方法、存储介质
CN112183438A (zh) * 2020-10-13 2021-01-05 深圳龙岗智能视听研究院 基于小样本学习神经网络的违规行为的图像识别方法

Similar Documents

Publication Publication Date Title
CN110472531B (zh) 视频处理方法、装置、电子设备及存储介质
CN108805185B (zh) 人脸识别方法、装置、存储介质及计算机设备
CN112819686B (zh) 基于人工智能的图像风格处理方法、装置及电子设备
CN107133631A (zh) 一种识别电视台图标的方法及装置
CN105590099B (zh) 一种基于改进卷积神经网络的多人行为识别方法
CA2965739A1 (en) Learning contour identification system using portable contour metrics derived from contour mappings
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN109919252B (zh) 利用少数标注图像生成分类器的方法
CN110827236B (zh) 基于神经网络的脑组织分层方法、装置、计算机设备
CN109284779A (zh) 基于深度全卷积网络的物体检测方法
CN108629772A (zh) 图像处理方法及装置、计算机设备和计算机存储介质
CN109522963A (zh) 一种单机运行的特征建筑目标检测方法和系统
CN109726746A (zh) 一种模板匹配的方法及装置
CN113435269A (zh) 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统
US11417096B2 (en) Video format classification and metadata injection using machine learning
CN115131698B (zh) 视频属性确定方法、装置、设备及存储介质
CN112231516B (zh) 视频摘要生成模型的训练方法、视频摘要生成方法及装置
CN109978074A (zh) 基于深度多任务学习的图像美感和情感联合分类方法及系统
CN110263835A (zh) 基于深度学习和贝叶斯网络的岩石类别自动识别方法
CN107135402A (zh) 一种识别电视台图标的方法及装置
CN110046279A (zh) 视频文件特征的预测方法、介质、装置和计算设备
CN110275820B (zh) 页面兼容性测试方法、系统及设备
CN116188501B (zh) 基于多尺度交叉注意力的医学图像分割方法
CN111160124A (zh) 一种基于知识重组的深度模型定制方法
CN110555384A (zh) 基于图像数据的牛肉大理石纹自动分级系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170905

RJ01 Rejection of invention patent application after publication