CN111860472A - 电视台标检测方法、系统、计算机设备及存储介质 - Google Patents
电视台标检测方法、系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111860472A CN111860472A CN202011013222.9A CN202011013222A CN111860472A CN 111860472 A CN111860472 A CN 111860472A CN 202011013222 A CN202011013222 A CN 202011013222A CN 111860472 A CN111860472 A CN 111860472A
- Authority
- CN
- China
- Prior art keywords
- station caption
- station
- detection
- television
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 124
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 9
- 238000013138 pruning Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 5
- 239000004576 sand Substances 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Television Systems (AREA)
Abstract
本发明公开了一种电视台标检测方法、系统、计算机设备及存储介质,该方法包括如下步骤:构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;对所述电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;构建台标检测模型并基于所述电视视频台标数据集进行目标检测的训练;利用训练后的所述台标检测模型进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。本发明的台标检测系统采用边缘系统,其独立于播出系统,因此完全不用占用播出系统的任何资源;但播出系统或其他系统可以通过访问台标检测系统来访问台标检测结果、报警信息及其他状态信息。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电视台标检测方法、系统、计算机设备及存储介质。
背景技术
电视视频信号中的台标对于对区分电视台有着重大意义,台标不仅仅是电视台视频播出时所携带的身份信息,更是具有在融媒体端进行区分电视视频产权归属的标志。因此,电视视频信号在播出时就必须保证所有播出的视频信号携带电视台的台标信息。播出系统需要适配不同电视台的电视视频信号的播出,在播出视频画面时,台标所在位置的背景有可能和台标的颜色相似或台标为半透明的。播出系统的计算资源被其他的任务所占用,通常情况下,增加一个台标检测算法在播出系统中会占用更多的播出系统计算资源,增加了播出系统的负担。
基于以上情况,现有的台标检测功能具有以下不足之处:
(1)现有的台标检测方法部署在播出系统上,严重占用播出系统的资源,降低了台标检测的速度同时也影响了其他任务的处理速度。
(2)播出系统需要适配不同电视台的电视信号播出,不同电视台的台标又千差万别,现有台标检测方法很难适配所有电视台的台标检测。
(3)在电视视频信号中台标背景颜色与台标颜色相似、台标透明、台标旋转等情况下更增加了台标检测的难度,现有台标检测算法没有足够的泛化能力来检测这些台标。
因此,需要设计一种台标检测方法和系统且能较好适配不同电视台的台标,具有较强的识别准确率和泛化能力的同时降低播出系统资源消耗,提高检测速度具有重要意义的。
发明内容
为了解决上述问题,本发明提出一种电视台标检测方法、系统、计算机设备及存储介质,以降低播出系统的资源占用,提高台标检测速度,同时能更好地适配不同电视台的台标,具有较强的泛化能力。
为解决上述问题,本发明采用的技术方案是:
一种电视台标检测方法,包括如下步骤:
A、构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;
B、对所述电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
C、构建台标检测模型并基于所述电视视频台标数据集进行目标检测的训练;
D、利用训练后的所述台标检测模型进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。
进一步的,先对训练后的所述台标检测模型进行压缩,降低模型存储大小,再将压缩后的所述台标检测模型用于台标检测。
进一步的,对所述台标检测模型进行压缩的方式包括:对卷积神经网络进行通道剪枝来压缩模型,相应步骤如下:
第一步,读取训练好的卷积神经网络中的BN层的缩放因子,将BN层的γ参数作为网络剪枝操作的缩放因子,对BN层的操作如下:
第二步,设定阈值θ,将γ < θ的卷积通道从卷积神经网络中移除,并将原训练好的卷积神经网络权重重新初始化新的卷积神经网络,并在原数据集上进行微调;
第三步,在测试集上对新的卷积神经网络模型进行测试;
第四步,若在测试集上测试结果满足精度要求,则提高阈值θ并重复第一~三步;若不能满足测试精度要求,则降低阈值θ并重复第一~三步,直到找到在满足精度要求的前提下的最大阈值θ;
第五步,保存最终剪枝后的卷积神经网络和权重。
进一步的,对所述台标检测模型进行压缩的方式包括:利用模型量化技术来压缩模型,将浮点数参数转换为定点数参数,转换公式如下:
其中,Q表示量化后的定点数据,R表示输入的浮点数据,S表示Scale的数值,Z表示零点的数值,根据S和Z这两个参数来确定映射关系:
其中,R max 表示输入的浮点数据中的最大值,R min 表示输入的浮点数据中的最小值,Q max 表示最大的定点值,Q min 表示最小的定点值。
进一步的,步骤A中,通过对包含台标的视频数据抽帧后得到的图像数据进行数据增强以丰富所述电视视频台标数据集,所述数据增强的方式包括随机裁切、翻转、颜色抖动、旋转和平移。
进一步的,步骤C中,通过目标检测框架来构建所述台标检测模型,所述目标检测框架使用在数据集上预训练的权重来初始化所述台标检测模型以提高检测精度。
进一步的,步骤D中,若连续检测到M帧无台标目标出现在视频画面中,则进行报警,报警信号通过声光方式、有线方式和无线方式中任意一种或多种方式发出。
一种电视台标检测系统,包括:
台标获取模块,用于构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;
台标标注模块,用于对所述电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
台标检测模块,用于构建台标检测模型,并基于所述电视视频台标数据集进行目标检测的训练,训练好后进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述电视台标检测方法的步骤。
一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述电视台标检测方法的步骤。
本发明的有益效果在于:
1、本发明提出的台标检测系统采用边缘系统,其独立于播出系统,因此完全不用占用播出系统的任何资源;但播出系统或其他系统可以通过访问台标检测系统来访问台标检测结果、报警信息及其他状态信息。
2、本发明提出的台标(目标)检测模型通过压缩(包括通道剪枝技术和模型量化技术)可以将模型压缩到小于1MB,处理速度可以达到~80fps,大大降低了台标检测系统的功耗,提高了处理速度。
3、本发明通过独立部署模型,可以适配不同电视台台标检测的需求。同时采用多种数据增强方式和持续检测台标来保证台标漏报和误报的概率,在搭建的测试数据集上可以达到99%的精度。
附图说明
图1为本发明的电视台标检测方法的流程图;
图2为本发明的视频帧接收线程和台标检测线程的流程图;
图3为本发明的电视台标检测系统的硬件接口示意图;
图4为本发明的电视台标检测系统的硬件外部连接示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现说明本发明的具体实施方式。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提供一种电视台标检测方法,包括如下步骤:
A、构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集。可选的,通过对视频数据抽帧后得到的图像数据进行数据增强,以丰富电视视频台标数据集,数据增强的方式包括随机裁切、翻转、颜色抖动、旋转和平移。
B、对电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
C、构建台标检测模型并基于电视视频台标数据集进行目标检测的训练,具体的,通过目标检测框架来构建台标检测模型,目标检测框架使用在数据集上预训练的权重来初始化台标检测模型以提高检测精度。
D、利用训练后的台标检测模型进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。优选的,先对训练后的台标检测模型进行压缩,降低模型存储大小,从而降低模型对计算资源的消耗,再将压缩后的台标检测模型用于台标检测。可选的,若连续检测到M帧无台标目标出现在视频画面中,则进行报警,报警信号通过声光方式、有线方式和无线方式中任意一种或多种方式发出。
具体的,如图1所示,在台标检测模型训练中完成对台标检测模型的训练,然后通过对台标检测模型的量化压缩,部署到台标检测系统中。在台标检测系统中实现对电视视频信号的台标检测,并实现对台标丢失情况进行报警。
相应的,本实施例提供一种电视台标检测系统,包括:
台标获取模块,用于构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;
台标标注模块,用于对电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
台标检测模块,用于构建台标检测模型,并基于电视视频台标数据集进行目标检测的训练,训练好后进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。
本实施例又提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述电视台标检测方法的步骤。
本实施例还提供一种计算机可读存储介质,存储有计算机程序,其特征在于,计算机程序被处理器执行时实现上述电视台标检测方法的步骤。
实施例2
本实施例在实施例1的基础上:
对台标检测模型进行压缩时,通过对卷积神经网络进行通道剪枝来实现,相应步骤如下:
第一步,读取训练好的卷积神经网络中的BN层的缩放因子,将BN层的γ参数作为网络剪枝操作的缩放因子,对BN层的操作如下:
第二步,设定阈值θ,将γ < θ的卷积通道从卷积神经网络中移除,并将原训练好的卷积神经网络权重重新初始化新的卷积神经网络,并在原数据集上进行微调;
第三步,在测试集上对新的卷积神经网络模型进行测试;
第四步,若在测试集上测试结果满足精度要求,则提高阈值θ并重复第一~三步;若不能满足测试精度要求,则降低阈值θ并重复第一~三步,直到找到在满足精度要求的前提下的最大阈值θ;
第五步,保存最终剪枝后的卷积神经网络和权重。
实施例3
本实施例在实施例1的基础上:
对台标检测模型进行压缩时,利用模型量化技术来实现,具体将浮点数参数转换为定点数参数,转换公式如下:
其中,Q表示量化后的定点数据,R表示输入的浮点数据,S表示Scale的数值,Z表示零点的数值,根据S和Z这两个参数来确定映射关系:
其中,R max 表示输入的浮点数据中的最大值,R min 表示输入的浮点数据中的最小值,Q max 表示最大的定点值,Q min 表示最小的定点值。
更为具体的,模型量化的具体步骤如下:
第一步:在输入的权重数据中统计出相应的最大值和最小值;
第二步:根据8位对称量化类型、权重最大值和权重最小值来计算获得量化参数S和Z;
第三步:根据定点数据对模型执行量化操作,将浮点数转换为定点数;
第四步:验证量化后的模型精度。
实施例4
本实施例在实施例1的基础上:
台标检测系统中运行两个线程:用于接收从播出系统推流得到的视频帧的视频帧接收线程,以及用于台标检测及后处理的台标检测线程,具体的:
视频帧接收线程将接收到的视频帧进行缓存,并对接收到的视频帧进行计数,当计数到N帧时发送消息到台标检测线程以触发台标检测线程进行检测。
台标检测线程接收到视频帧接收线程的消息后,在缓存中取到第N帧的图像并输入台标检测模型中进行检测。若连续M次没有检测到台标,则认为播出视频中有漏台标现象,此时应当立即将台标检测系统中的报警指示灯点亮,同时设置内部报警标志。可选的,内部报警标志可以通过以太网或者USB提供的接口协议,从其他拥有访问台标检测系统权限的设备读取或访问。
可选的,报警指示灯点亮及内部报警标志被设置后,台标检测系统可以接收来自拥有访问台标检测系统权限的设备进行重置台标检测任务。重置台标检测任务可以通过拥有通过以太网或USB访问台标检测系统的外部设备通过发送命令进行重置,也可以通过设计在台标检测系统中的手动按键进行手动重置。
更为具体的,视频帧接收线程和台标检测线程的流程如图2所示,视频帧接收线程负责接收播出系统的视频流,当接收到第N帧的视频时将该帧图像存储到缓存中,并发送台标检测请求消息,然后继续执行接收视频流的操作。在台标检测线程中,首先判断是否有台标检测请求,若没有台标检测请求则挂起等待;若有台标检测请求则进行台标检测。台标检测时,首先从缓存中读取视频帧,然后利用台标检测模型进行台标检测,再清除缓存。当判断是连续M次检测到台标时,则发起台标丢失的报警。当报警发起后,线程等待清除报警信息的指令。若接收到清除指令则回到主循环继续检测是否有台标检测的请求;若没有收到清除指令则一直处于报警状态。
实施例5
本实施例在实施例4的基础上:
电视台标检测系统的硬件接口如图3所示,其包含了用于对台标检测系统供电的电源接口,主要用于视频推流的网线接口,用于读取台标检测系统报警信息及其他状态信号的USB接口,用于在辅助情况下进行显示的HDMI接口,用于通过硬件触发和消除报警的接口,以及启动按钮、重启按钮和报警解除按钮。此外,台标检测系统中还包含台标丢失报警指示灯,用于显示台标丢失的报警信息。
电视台标检测系统的硬件外部连接示意如图4所示,播出系统通过以太网线将视频流实时推送到台标检测系统中,台标检测系统中的报警信息和其他控制信息可以通过USB进行访问和控制,台标检测系统还留出硬件控制端口通过控制信号线进行单独传输,以保证台标丢失报警及消除报警信号的及时有效。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种电视台标检测方法,其特征在于,包括如下步骤:
A、构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;
B、对所述电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
C、构建台标检测模型并基于所述电视视频台标数据集进行目标检测的训练;
D、利用训练后的所述台标检测模型进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。
2.如权利要求1所述的一种电视台标检测方法,其特征在于,先对训练后的所述台标检测模型进行压缩,降低模型存储大小,再将压缩后的所述台标检测模型用于台标检测。
3.如权利要求2所述的一种电视台标检测方法,其特征在于,对所述台标检测模型进行压缩的方式包括:对卷积神经网络进行通道剪枝来压缩模型,相应步骤如下:
第一步,读取训练好的卷积神经网络中的BN层的缩放因子,将BN层的γ参数作为网络剪枝操作的缩放因子,对BN层的操作如下:
第二步,设定阈值θ,将γ < θ的卷积通道从卷积神经网络中移除,并将原训练好的卷积神经网络权重重新初始化新的卷积神经网络,并在原数据集上进行微调;
第三步,在测试集上对新的卷积神经网络模型进行测试;
第四步,若在测试集上测试结果满足精度要求,则提高阈值θ并重复第一~三步;若不能满足测试精度要求,则降低阈值θ并重复第一~三步,直到找到在满足精度要求的前提下的最大阈值θ;
第五步,保存最终剪枝后的卷积神经网络和权重。
5.如权利要求1所述的一种电视台标检测方法,其特征在于,步骤A中,通过对包含台标的视频数据抽帧后得到的图像数据进行数据增强以丰富所述电视视频台标数据集,所述数据增强的方式包括随机裁切、翻转、颜色抖动、旋转和平移。
6.如权利要求1所述的一种电视台标检测方法,其特征在于,步骤C中,通过目标检测框架来构建所述台标检测模型,所述目标检测框架使用在数据集上预训练的权重来初始化所述台标检测模型以提高检测精度。
7.如权利要求1所述的一种电视台标检测方法,其特征在于,步骤D中,若连续检测到M帧无台标目标出现在视频画面中,则进行报警,报警信号通过声光方式、有线方式和无线方式中任意一种或多种方式发出。
8.一种电视台标检测系统,其特征在于,包括:
台标获取模块,用于构建包含台标的电视视频数据库,并将视频数据通过抽帧的方式转换为图像数据形成电视视频台标数据集;
台标标注模块,用于对所述电视视频台标数据集进行标注,标注出每帧图像中的台标所在图像的位置及台标类别;
台标检测模块,用于构建台标检测模型,并基于所述电视视频台标数据集进行目标检测的训练,训练好后进行电视视频信号的台标检测,对接收到的视频信号间隔N帧进行台标检测。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011013222.9A CN111860472A (zh) | 2020-09-24 | 2020-09-24 | 电视台标检测方法、系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011013222.9A CN111860472A (zh) | 2020-09-24 | 2020-09-24 | 电视台标检测方法、系统、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860472A true CN111860472A (zh) | 2020-10-30 |
Family
ID=72968517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011013222.9A Pending CN111860472A (zh) | 2020-09-24 | 2020-09-24 | 电视台标检测方法、系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860472A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036387A (zh) * | 2020-11-06 | 2020-12-04 | 成都索贝数码科技股份有限公司 | 基于门控卷积神经网络的新闻画面拍摄角度识别方法 |
CN113343895A (zh) * | 2021-06-24 | 2021-09-03 | 北京欧珀通信有限公司 | 目标检测方法、目标检测装置、存储介质与电子设备 |
CN114154589A (zh) * | 2021-12-13 | 2022-03-08 | 成都索贝数码科技股份有限公司 | 一种基于相似性的模块减枝方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106507188A (zh) * | 2016-11-25 | 2017-03-15 | 南京中密信息科技有限公司 | 一种基于卷积神经网络的视频台标识别装置及工作方法 |
CN108805102A (zh) * | 2018-06-28 | 2018-11-13 | 中译语通科技股份有限公司 | 一种基于深度学习的视频字幕检测与识别方法及系统 |
CN109472260A (zh) * | 2018-10-31 | 2019-03-15 | 成都索贝数码科技股份有限公司 | 一种基于深度神经网络的移除图像内台标和字幕的方法 |
CN110287888A (zh) * | 2019-06-26 | 2019-09-27 | 中科软科技股份有限公司 | 一种台标识别方法及系统 |
US20190378013A1 (en) * | 2018-06-06 | 2019-12-12 | Kneron Inc. | Self-tuning model compression methodology for reconfiguring deep neural network and electronic device |
CN110610230A (zh) * | 2019-07-31 | 2019-12-24 | 国家计算机网络与信息安全管理中心 | 一种台标检测方法、装置及可读存储介质 |
CN111179338A (zh) * | 2019-12-10 | 2020-05-19 | 同济大学 | 一种用于移动供电接收端的轻量化目标定位方法 |
CN111178546A (zh) * | 2019-12-31 | 2020-05-19 | 华为技术有限公司 | 机器学习模型的搜索方法及相关装置、设备 |
CN111368682A (zh) * | 2020-02-27 | 2020-07-03 | 上海电力大学 | 一种基于faster RCNN台标检测与识别的方法及系统 |
CN111460999A (zh) * | 2020-03-31 | 2020-07-28 | 北京工业大学 | 一种基于fpga的低空航拍影像目标跟踪的方法 |
CN111652366A (zh) * | 2020-05-09 | 2020-09-11 | 哈尔滨工业大学 | 一种基于通道剪枝和量化训练的联合神经网络模型压缩方法 |
CN111656315A (zh) * | 2019-05-05 | 2020-09-11 | 深圳市大疆创新科技有限公司 | 一种基于卷积神经网络架构的数据处理方法及装置 |
-
2020
- 2020-09-24 CN CN202011013222.9A patent/CN111860472A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106507188A (zh) * | 2016-11-25 | 2017-03-15 | 南京中密信息科技有限公司 | 一种基于卷积神经网络的视频台标识别装置及工作方法 |
US20190378013A1 (en) * | 2018-06-06 | 2019-12-12 | Kneron Inc. | Self-tuning model compression methodology for reconfiguring deep neural network and electronic device |
CN108805102A (zh) * | 2018-06-28 | 2018-11-13 | 中译语通科技股份有限公司 | 一种基于深度学习的视频字幕检测与识别方法及系统 |
CN109472260A (zh) * | 2018-10-31 | 2019-03-15 | 成都索贝数码科技股份有限公司 | 一种基于深度神经网络的移除图像内台标和字幕的方法 |
CN111656315A (zh) * | 2019-05-05 | 2020-09-11 | 深圳市大疆创新科技有限公司 | 一种基于卷积神经网络架构的数据处理方法及装置 |
CN110287888A (zh) * | 2019-06-26 | 2019-09-27 | 中科软科技股份有限公司 | 一种台标识别方法及系统 |
CN110610230A (zh) * | 2019-07-31 | 2019-12-24 | 国家计算机网络与信息安全管理中心 | 一种台标检测方法、装置及可读存储介质 |
CN111179338A (zh) * | 2019-12-10 | 2020-05-19 | 同济大学 | 一种用于移动供电接收端的轻量化目标定位方法 |
CN111178546A (zh) * | 2019-12-31 | 2020-05-19 | 华为技术有限公司 | 机器学习模型的搜索方法及相关装置、设备 |
CN111368682A (zh) * | 2020-02-27 | 2020-07-03 | 上海电力大学 | 一种基于faster RCNN台标检测与识别的方法及系统 |
CN111460999A (zh) * | 2020-03-31 | 2020-07-28 | 北京工业大学 | 一种基于fpga的低空航拍影像目标跟踪的方法 |
CN111652366A (zh) * | 2020-05-09 | 2020-09-11 | 哈尔滨工业大学 | 一种基于通道剪枝和量化训练的联合神经网络模型压缩方法 |
Non-Patent Citations (1)
Title |
---|
BENOIT JACOB 等: "Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036387A (zh) * | 2020-11-06 | 2020-12-04 | 成都索贝数码科技股份有限公司 | 基于门控卷积神经网络的新闻画面拍摄角度识别方法 |
CN113343895A (zh) * | 2021-06-24 | 2021-09-03 | 北京欧珀通信有限公司 | 目标检测方法、目标检测装置、存储介质与电子设备 |
CN113343895B (zh) * | 2021-06-24 | 2024-01-23 | 北京欧珀通信有限公司 | 目标检测方法、目标检测装置、存储介质与电子设备 |
CN114154589A (zh) * | 2021-12-13 | 2022-03-08 | 成都索贝数码科技股份有限公司 | 一种基于相似性的模块减枝方法 |
CN114154589B (zh) * | 2021-12-13 | 2023-09-29 | 成都索贝数码科技股份有限公司 | 一种基于相似性的模块减枝方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860472A (zh) | 电视台标检测方法、系统、计算机设备及存储介质 | |
KR101942808B1 (ko) | 객체 이미지 인식 dcnn 기반 cctv 영상분석장치 | |
CN109858371B (zh) | 人脸识别的方法及装置 | |
US11302104B2 (en) | Method, apparatus, device, and storage medium for predicting the number of people of dense crowd | |
US9418296B1 (en) | Detecting segments of a video program | |
CN112669344B (zh) | 一种运动物体的定位方法、装置、电子设备及存储介质 | |
WO2021031954A1 (zh) | 对象数量确定方法、装置、存储介质与电子设备 | |
EP4072147A1 (en) | Video stream processing method, apparatus and device, and medium | |
CN112396116A (zh) | 一种雷电检测方法、装置、计算机设备及可读介质 | |
CN109783658B (zh) | 图像处理方法、装置及存储介质 | |
US10936876B2 (en) | Content recognition method, system and storage medium thereof | |
CN112733690A (zh) | 一种高空抛物检测方法、装置及电子设备 | |
CN112422909B (zh) | 一种基于人工智能的视频行为分析管理系统 | |
KR101668930B1 (ko) | 비디오 분석 인코딩 | |
WO2023061082A1 (zh) | 图像安全处理方法和装置、电子设备和存储介质 | |
CN111904429A (zh) | 一种人体跌倒检测方法、装置、电子设备及存储介质 | |
CN114257757B (zh) | 视频的自动裁剪切换方法及系统、视频播放器及存储介质 | |
CN105681738B (zh) | 用于在视频流中插入图形覆盖的方法和设备 | |
CN110855932B (zh) | 基于视频数据的报警方法、装置、电子设备及存储介质 | |
CN114245032B (zh) | 视频取景的自动切换方法及系统、视频播放器及存储介质 | |
CN109740509A (zh) | 一种改良的视频人脸检测提升稳定性的方法 | |
WO2021223073A1 (en) | Fast and accurate face detection system for long-distance detection | |
CN111739098B (zh) | 测速方法及装置、电子设备及存储介质 | |
CN114449255A (zh) | 视频卡顿检测方法、装置、计算设备及介质 | |
CN113938707A (zh) | 视频处理方法、录播盒和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |
|
RJ01 | Rejection of invention patent application after publication |