CN112668411A - 基于sgan的视频流标记方法、装置、系统及存储介质 - Google Patents
基于sgan的视频流标记方法、装置、系统及存储介质 Download PDFInfo
- Publication number
- CN112668411A CN112668411A CN202011480283.6A CN202011480283A CN112668411A CN 112668411 A CN112668411 A CN 112668411A CN 202011480283 A CN202011480283 A CN 202011480283A CN 112668411 A CN112668411 A CN 112668411A
- Authority
- CN
- China
- Prior art keywords
- video stream
- sgan
- frame picture
- classification
- target frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 52
- 239000012634 fragment Substances 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 9
- 238000002372 labelling Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Abstract
本发明公开了一种基于SGAN的视频流标记方法,包括:在检测到SGAN模型训练完成后,获取新视频流,对所述新视频流进行提取处理,得到对应的目标帧图片;将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。本发明还公开了一种基于SGAN的视频流标记装置、系统及存储介质。本发明利用训练完成的SGAN模型对视频流中的帧图片进行分类,充分利用SGAN模型的特性,大大减少了标记训练数据的工作量。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及基于SGAN的视频流标记方法、装置、系统及存储介质。
背景技术
视频流在城市治理中扮演着重要的角色,随着城市治理规模的扩大,视频流的规模也越来越大,导致在视频流中查找期望信息的工作量也越来越大。由于视频流含有大量的冗余信息,因此,若对视频流进行标记,可以快速定位与查找到与视频流特定事件相关的图片,能够有效解决利用人工查找特定事件的图片费时费力的问题。
当前对视频流进行标记,通常做法是通过人工标记一部分数据,将已标记的数据作为训练数据,通过机器学习、深度学习等有监督学习的办法进行模型训练,再利用训练好的模型对后续的新视频流进行分类打标签,实现视频流的标记过程。这种有监督学习的方法需要大量的训练数据,因此,前期对训练数据进行人工标记的工作量也比较大,而且,对于不同终端产生的视频流也需要进行人工标记,进一步增大了标记训练数据的工作量。
发明内容
本发明的主要目的在于提出一种基于SGAN的视频流标记方法、装置、系统及存储介质,旨在减少标记训练数据的工作量。
为实现上述目的,本发明提供一种基于SGAN的视频流标记方法,所述方法包括如下步骤:
在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
优选地,所述对所述新视频流进行提取处理的步骤包括:
对所述新视频流进行全帧提取处理,所述全帧提取为提取所述新视频流中的全部关键帧;
或者,
对所述新视频流进行抽帧提取处理,所述抽帧提取处理为按照预设抽取比例提取所述新视频流中的部分关键帧。
优选地,所述得到所述目标帧图片对应的分类标签的步骤之后,还包括:
判断所述分类标签是否与所述SGAN模型中的预设非真类标签相同;
若相同,则确定所述目标帧图片为未知分类的帧图片;
若不相同,则确定所述目标帧图片为已知分类的帧图片。
优选地,所述确定所述目标帧图片为已知分类的帧图片的步骤之后,还包括:
获取所述目标帧图片对应的视频流名称、分类标签以及所述目标帧图片在所述视频流中的时间点,将所述视频流名称、所述分类标签和所述时间点组成对应的数据组,将所述数据组保存到预设数据库中。
优选地,所述将所述数据组保存到预设数据库中的步骤之后,还包括:
若接收到视频流信息查询指令,则根据所述视频流信息查询指令携带的目标分类标签,查找包含所述目标分类标签的目标数据组,并将所述目标数据组反馈给所述视频流信息查询指令对应的终端。
优选地,所述确定所述目标帧图片为未知分类的帧图片的步骤之后,还包括:
获取所述目标帧图片在所述新视频流中的目标时间点,以及预设提取时间间隔,并在所述新视频流中确定与所述目标时间点相差所述预设提取时间间隔的第一时间点和第二时间点;
从所述新视频流中提取所述第一时间点和所述第二时间点之间的待定帧图片,以供用户针对所述待定帧图片输入分类指令,对所述待定帧图片进行分类,得到所述待定帧图片对应的新分类标签;
将所述待定帧图片和所述新分类标签添加到SGAN模型的训练数据集中,对SGAN模型进行更新。
优选地,所述在检测到模型训练完成后的步骤之前,还包括:
获取待处理视频流,接收用户输入的分类指令,对所述待处理视频流进行分类,得到各分类特征对应的视频流片段;
根据所述分类特征对所述视频流片段进行特征提取,得到对应的特征帧图片,并接收用户针对所述特征帧图片输入的标记指令,得到对应的训练数据集;
将所述训练数据集输入预设的SGAN模型中,对所述SGAN模型进行训练。
此外,为实现上述目的,本发明还提供一种基于SGAN的视频流标记装置,所述基于SGAN的视频流标记装置包括:
提取处理模块,用于在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
分类标记模块,用于将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
优选地,所述提取处理模块还用于:
对所述新视频流进行全帧提取处理,所述全帧提取为提取所述新视频流中的全部关键帧;
或者,
对所述新视频流进行抽帧提取处理,所述抽帧提取处理为按照预设抽取比例提取所述新视频流中的部分关键帧。
优选地,所述分类标记模块还用于:
判断所述分类标签是否与所述SGAN模型中的预设非真类标签相同;
若相同,则确定所述目标帧图片为未知分类的帧图片;
若不相同,则确定所述目标帧图片为已知分类的帧图片。
优选地,所述基于SGAN的视频流标记装置还包括信息保存模块,所述信息保存模块用于:
获取所述目标帧图片对应的视频流名称、分类标签以及所述目标帧图片在所述视频流中的时间点,将所述视频流名称、所述分类标签和所述时间点组成对应的数据组,将所述数据组保存到预设数据库中。
优选地,所述基于SGAN的视频流标记装置还包括信息查询模块,所述信息查询模块用于:
若接收到视频流信息查询指令,则根据所述视频流信息查询指令携带的目标分类标签,查找包含所述目标分类标签的目标数据组,并将所述目标数据组反馈给所述视频流信息查询指令对应的终端。
优选地,所述分类标记模块还包括分类更新单元,所述分类更新单元用于:
获取所述目标帧图片在所述新视频流中的目标时间点,以及预设提取时间间隔,并在所述新视频流中确定与所述目标时间点相差所述预设提取时间间隔的第一时间点和第二时间点;
从所述新视频流中提取所述第一时间点和所述第二时间点之间的待定帧图片,以供用户针对所述待定帧图片输入分类指令,对所述待定帧图片进行分类,得到所述待定帧图片对应的新分类标签;
将所述待定帧图片和所述新分类标签添加到SGAN模型的训练数据集中,对SGAN模型进行更新。
优选地,所述基于SGAN的视频流标记装置还包括模型训练模块,所述模型训练模块还用于:
获取待处理视频流,接收用户输入的分类指令,对所述待处理视频流进行分类,得到各分类特征对应的视频流片段;
根据所述分类特征对所述视频流片段进行特征提取,得到对应的特征帧图片,并接收用户针对所述特征帧图片输入的标记指令,得到对应的训练数据集;
将所述训练数据集输入预设的SGAN模型中,对所述SGAN模型进行训练。
此外,为实现上述目的,本发明还提供一种基于SGAN的视频流标记系统,所述基于SGAN的视频流标记系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于SGAN的视频流标记程序,所述基于SGAN的视频流标记程序被所述处理器执行时实现如上所述的基于SGAN的视频流标记方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有基于SGAN的视频流标记程序,所述基于SGAN的视频流标记程序被处理器执行时实现如上所述的基于SGAN的视频流标记方法的步骤。
本发明提出的基于SGAN的视频流标记方法,在检测到SGAN模型训练完成后,获取新视频流,对新视频流进行提取处理,得到对应的目标帧图片;将目标帧图片输入SGAN模型,得到目标帧图片对应的分类标签,并根据分类标签,以完成所述目标帧图片的标记过程。本发明利用训练完成的SGAN模型对视频流中的帧图片进行分类,充分利用SGAN模型的特性,大大减少了标记训练数据的工作量。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图;
图2为本发明基于SGAN的视频流标记方法第一实施例的流程示意图;
图3为本发明基于SGAN的视频流标记方法训练数据集提取过程示意图;
图4为本发明基于SGAN的视频流标记方法SGAN数据训练示意图;
图5为本发明基于SGAN的视频流标记方法利用训练完成的SGAN模型对数据进行分类的示意图;
图6为本发明基于SGAN的视频流标记方法较佳实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图。
本发明实施例系统可以是管理服务器、云端服务器等。
如图1所示,该系统可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的系统结构并不构成对系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于SGAN的视频流标记程序。
其中,操作系统是管理和控制基于SGAN的视频流标记系统与软件资源的程序,支持网络通信模块、用户接口模块、基于SGAN的视频流标记程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图1所示的基于SGAN的视频流标记系统中,所述基于SGAN的视频流标记系统通过处理器1001调用存储器1005中存储的基于SGAN的视频流标记程序,并执行下述基于SGAN的视频流标记方法各个实施例中的操作。
基于上述硬件结构,提出本发明基于SGAN的视频流标记方法实施例。
参照图2,图2为本发明基于SGAN的视频流标记方法第一实施例的流程示意图,所述方法包括:
步骤S10,在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
本实施例基于SGAN的视频流标记方法运用于各大数据连接平台的基于SGAN的视频流标记系统中,为描述方便,基于SGAN的视频流标记系统以标记系统简称。机器学习中有监督学习的数据是有标签的,无监督学习的数据是无标签的,然而,有标签的数据是非常少的,需要进行人工标注等一些操作才能获得有标签的数据。而半监督学习就是要结合监督式和无监督式,利用少量标签数据与大量无标签数据进行训练,从而实现对无标签的数据进行分类。在生成对抗网络(GAN)中,真实数据可以被看做有标签数据集,生成器随机产生的数据则可以被看做是无标签数据集。半监督式GAN,也称为SGAN(Semi-SupervisedGenerative Adversarial Networks,半监督生成对抗网络),SGAN模型中包括生成器(Generator)和鉴别器(Discriminator),且生成器和鉴别器作为对抗对象同时训练,其中,训练生成器是为了将鉴别器犯错的概率最大化,训练鉴别器是为了将鉴别器犯错的概率最小化。采用SGAN能够同时训练生成器与半监督式分类器,最终实现一个更优的半监督式分类器,以及一个成像更高的生成模型。在传统的二分类模式基础上,SGAN变成了多分类,且分类类型数量为N+1,分别指代N个分类标签和一个“假”数据,即N个已知分类和一个未知分类。在实际过程中,鉴别器和分类器是一体的,记作D/C,共同与生成器形成一个博弈关系。
在本实施例中,在SGAN模型训练完成后,将SGAN模型部署在实际网路中,用于获取新视频流,以对新视频流进行提取处理,实时提取出对应的目标帧图片。
在本实施例开始之前,需要先确定一个SGAN训练模型,具体的,所述在检测到模型训练完成后的步骤之前,还包括:
步骤a1,获取待处理视频流,接收用户输入的分类指令,对所述待处理视频流进行分类,得到各分类特征对应的视频流片段;
在本实施例中,参照图3,图3为本发明基于SGAN的视频流标记方法训练数据集提取过程示意图,标记系统通过获取各个视频采集设备上传的具有不同分类特征的待处理视频流,并接收用户输入的分类指令,即通过人工分类的方式,对待处理视频流进行分类,得到具有不同分类特征的视频流片段,如具有特征1的视频流片段Video_1,具有特征2的视频流片段Video_2,...,具有特征n的视频流片段Video_n。
步骤a2,根据所述分类特征对所述视频流片段进行特征提取,得到对应的特征帧图片,并接收用户针对所述特征帧图片输入的标记指令,得到对应的训练数据集;
在本实施例中,对视频流片段进行特征提取,也即,对视频流片段进行特征属性帧图片提取处理,从而得到各分类特征对应的特征帧图片其中,Video_i表示某类视频流,表示第i类视频流中含有分类特征的特征帧图片,再接收用户针对特征帧图片输入的标记指令,即通过人工标记的方式,对特征帧图片进行标记,并以标记后的特征帧图片、分类标签形成训练数据集其中,Yi表示不同分类特征的已知分类,i∈{1,2,...,n},表示n个已知分类。
步骤a3,将所述训练数据集输入预设的SGAN模型中,对所述SGAN模型进行训练。
在本实施例中,参照图4,图4为本发明基于SGAN的视频流标记方法SGAN数据训练示意图,其中,Noise为随机噪声,将Noise作为生成器的输入,可生成样本数据以作为输入数据输入到SGAN模型的鉴别器中,并以{Yi,E}作为输出数据(分类标签),以此训练SGAN模型中的生成器和鉴别器,其中,为视频采集设备上传的实时视频流,即新视频流,Y1,Y2,Y3,...,Yn为已知分类的分类标签,E代表SGAN中的预设非真类标签,即未知分类的分类标签。通过实际环境中人工标记的少量训练数据集,对SGAN模型进行训练。
进一步地,所述对所述新视频流进行提取处理的步骤包括:
步骤b1,对所述新视频流进行全帧提取处理,所述全帧提取为提取所述新视频流中的全部关键帧;
或者,
步骤b2,对所述新视频流进行抽帧提取处理,所述抽帧提取处理为按照预设抽取比例提取所述新视频流中的部分关键帧。
在本实施例中,由于视频流中含有大量的冗余信息,对新视频流进行提取处理,如对新视频流进行全帧提取处理或者抽帧提取处理,可排除部分冗余信息。其中,全帧提取处理指的是提取新视频流中的全部关键帧,抽帧提取处理为按照预设抽取比例提取新视频流中的部分关键帧,如按照1/N抽取帧图片,关键帧指的是角色或者物体在运动或变化中的关键动作所处的那一帧。对新视频流进行提取处理可过滤掉非必要的帧图片,有利于减少对视频流进行标记的时间和工作量。
步骤S20,将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
在本实施例中,参照图5,图5为本发明基于SGAN的视频流标记方法利用训练完成的SGAN模型对数据进行分类的示意图,将新视频流作为鉴别器的输入数据,即可获取到对应的分类标签,从而完成目标帧图片的标记过程。
本实施例的基于SGAN的视频流标记方法,在检测到SGAN模型训练完成后,获取新视频流,对新视频流进行提取处理,得到对应的目标帧图片;将目标帧图片输入SGAN模型,得到目标帧图片对应的分类标签,并根据分类标签,以完成所述目标帧图片的标记过程。本发明利用训练完成的SGAN模型对视频流中的帧图片进行分类,充分利用SGAN模型的特性,大大减少了标记训练数据的工作量。
进一步地,基于本发明基于SGAN的视频流标记方法第一实施例,提出本发明基于SGAN的视频流标记方法第二实施例。
基于SGAN的视频流标记方法的第二实施例与基于SGAN的视频流标记方法的第一实施例的区别在于,所述得到所述目标帧图片对应的分类标签的步骤之后,还包括:
步骤c,判断所述分类标签是否与所述SGAN模型中的预设非真类标签相同;
步骤d,若相同,则确定所述目标帧图片为未知分类的帧图片;
步骤e,若不相同,则确定所述目标帧图片为已知分类的帧图片。
在本实施例中,若SGAN模型中的预设非真类标签为E,当目标帧图片输出的分类标签为Y1,Y2,Y3,...,Yn中的任一个分类标签,即该目标帧图片的分类标签不等于E,则可判断该目标帧图片属于已知分类的帧图片;若目标帧图片的分类标签等于E,则可判断该目标帧图片不属于已知分类的帧图片,即属于未知分类的帧图片。
进一步地,所述确定所述目标帧图片为未知分类的帧图片的步骤之后,还包括:
步骤f,获取所述目标帧图片在所述新视频流中的目标时间点,以及预设提取时间间隔,并在所述新视频流中确定与所述目标时间点相差所述预设提取时间间隔的第一时间点和第二时间点;
在本实施例中,若目标帧图片在SGAN模型中输出的分类标签不属于已知分类,即输出的分类标签等于未知分类的分类标签E,则该目标帧图片对应的分类标签属于新的类别,可认为是异常类,此时标记系统检测到SGAN模型上报的异常情况,并将属于异常类的目标帧图片以及与目标帧图片在邻近时间点上的其他帧图片提取出来,以供用户对其进行人工鉴别。例如,可获取预设提取时间间隔T,以及未知分类的目标帧图片在新视频中的时间点T0,并在新视频流中确定与目标时间点间隔预设提取时间间隔的第一时间点T1和第二时间点T2,如T1=T0-T,T2=T0+T,即可确定该新视频流中在T1-T2时间段内存在异常类的目标帧图片。
步骤g,从所述新视频流中提取所述第一时间点和所述第二时间点之间的待定帧图片,以供用户针对所述待定帧图片输入分类指令,对所述待定帧图片进行分类,得到所述待定帧图片对应的新分类标签;
在本实施例中,虽然是将各个终端设备上传的实时视频流输入到SGAN模型中,但由于网络抖动或网络延迟等原因,标记系统检测到异常情况时,为了确保将不属于已知分类的目标帧提取处理出来,需要将第一时间点T1和第二时间点T2之间的待定帧图片都提取出来,并接收用户针对待定帧图片输入的分类指令,即通过人工分类的方式对待定帧图片进行分类,从而确定待定帧图片所对应的新分类标签。
步骤h,将所述待定帧图片和所述新分类标签添加到SGAN模型的训练数据集中,对SGAN模型进行更新。
在本实施例中,将待定帧图片和新分类标签添加到SGAN模型的训练数据集中,也即将待定帧图片所对应的新分类标签设定为已知分类,以更新SGAN模型。例如,待定帧图片所对应的新分类标签只有一个,且该新分类标签为Yn+1,将待定帧图片和对应的新分类标签添加到SGAN模型的训练数据集中,重新对SGAN模型进行训练,以使SGAN模型输出的分类数量由原先的n+1类更新为n+2类。目前用于视频流标记的训练模型,只能分为固定的有限类别,且对于视频流中新出现的类别不能有效地进行鉴别和提醒,降低了训练模型分类识别的可扩展性,也不利于模型的动态更新,本发明基于SGAN的视频流标记方法可动态更新模型的分类精度。
进一步地,所述确定所述目标帧图片为已知分类的帧图片的步骤之后,还包括:
步骤i,获取所述目标帧图片对应的视频流名称、分类标签以及所述目标帧图片在所述视频流中的时间点,将所述视频流名称、所述分类标签和所述时间点组成对应的数据组,将所述数据组保存到预设数据库中。
在本实施例中,如果输入的目标帧图片属于已知分类的帧图片,则可获取目标帧图片对应的视频流名称、分类标签以及目标帧图片在视频流中的时间点,并将输出的分类标签,结合视频流名称、目标帧图片在视频流中的时间点,形成以{视频流名称,分类标签,时间点}这种形式存在的数据组,将帧图片在时间维度上打上分类标签,再将各个数据组存入预设的数据库中,从而完成视频流的标记过程,为后期对视频流的快速查询、快速筛选提供支持。
本实施例的基于SGAN的视频流标记方法,若目标帧图片为未知分类的帧图片,则获取该目标帧图片在视频流中前后T时间内的待定帧图片,由人工界定其分类标签,得到新分类标签,并将待定帧图片和新分类标签添加到SGAN模型的训练数据集中,动态更新模型的分类精度,保证了模型的时效性;若目标帧图片为已知分类的帧图片,则将目标帧图片对应的视频流名称、分类标签、在视频流中的时间点保存到预设数据库中,为后期对视频流的快速查询、快速筛选提供支持。
进一步地,基于本发明基于SGAN的视频流标记方法第一、第二实施例,提出本发明基于SGAN的视频流标记方法第三实施例。
基于SGAN的视频流标记方法的第三实施例与基于SGAN的视频流标记方法的第一、第二实施例的区别在于,所述将所述数据组保存到预设数据库中的步骤之后,还包括:
步骤j,若接收到视频流信息查询指令,则根据所述视频流信息查询指令携带的目标分类标签,查找包含所述目标分类标签的目标数据组,并将所述目标数据组反馈给所述视频流信息查询指令对应的终端。
在本实施例中,保存到数据库中的视频流可用于城市治理的各个领域,若接收到视频流信息查询指令,则可从预设数据库保存的数据组中查询到与视频流信息查询指令携带的目标分类标签匹配的分类标签,从而查找出包含该目标分类标签的目标数据组,并将目标数据组反馈给视频流信息查询指令对应的终端,达到快速有效地进行视频流查询的目的。例如,智慧城市的安防摄像头部署在交通路口,用于实时采集交通路口处的视频流,如果发生特定事件,如发生司机肇事逃逸事件,需要从视频流中查找出与事件相关的信息,如图像中的车辆信息、行人信息等,以查找出目标车辆与目标人物。具体的,可先确定与本事件相关的信息,如红色车辆、渣土车辆等,再从包含该类事件信息的视频流中提取出与该事件相关的帧图片,并对帧图片进行标注,再利用标注完成的数据对SGAN模型进行训练,通过提取出SGAN模型的鉴别器部分,对新的视频进行标注,以使有关部门进行快速检索。再如影视作品中可能含有暴力、恐怖、色情等需要审查的内容,若采用人工鉴定的方式,那么审查效率将大幅降低,而本发明中利用已知视频流的影视作品对SGAN模型进行训练,再利用模型对新的影视作品进行鉴别,并进行标签设定,可以给影视作品鉴定人提供初步的鉴定结果,大幅提高了鉴定效率。
本实施例的基于SGAN的视频流标记方法,若接收到视频流信息查询指令,则根据视频流信息查询指令中携带的目标分类标签,从预设数据库的数据组中查询与该目标分类标签匹配的分类标签,从而提取出对应的目标数据组,实现快速有效地进行视频流查询的目的。
本发明还提供一种基于SGAN的视频流标记装置。参照图3,本发明基于SGAN的视频流标记装置包括:
提取处理模块10,用于在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
分类标记模块20,用于将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
优选地,所述提取处理模块还用于:
对所述新视频流进行全帧提取处理,所述全帧提取为提取所述新视频流中的全部关键帧;
或者,
对所述新视频流进行抽帧提取处理,所述抽帧提取处理为按照预设抽取比例提取所述新视频流中的部分关键帧。
优选地,所述分类标记模块还用于:
判断所述分类标签是否与所述SGAN模型中的预设非真类标签相同;
若相同,则确定所述目标帧图片为未知分类的帧图片;
若不相同,则确定所述目标帧图片为已知分类的帧图片。
优选地,所述基于SGAN的视频流标记装置还包括信息保存模块,所述信息保存模块用于:
获取所述目标帧图片对应的视频流名称、分类标签以及所述目标帧图片在所述视频流中的时间点,将所述视频流名称、所述分类标签和所述时间点组成对应的数据组,将所述数据组保存到预设数据库中。
优选地,所述分类标记模块还包括分类更新单元,所述分类更新单元用于:
获取所述目标帧图片在所述新视频流中的目标时间点,以及预设提取时间间隔,并在所述新视频流中确定与所述目标时间点相差所述预设提取时间间隔的第一时间点和第二时间点;
从所述新视频流中提取所述第一时间点和所述第二时间点之间的待定帧图片,以供用户针对所述待定帧图片输入分类指令,对所述待定帧图片进行分类,得到所述待定帧图片对应的新分类标签;
将所述待定帧图片和所述新分类标签添加到SGAN模型的训练数据集中,对SGAN模型进行更新。
优选地,所述基于SGAN的视频流标记装置还包括信息查询模块,所述信息查询模块用于:
若接收到视频流信息查询指令,则根据所述视频流信息查询指令携带的目标分类标签,查找包含所述目标分类标签的目标数据组,并将所述目标数据组反馈给所述视频流信息查询指令对应的终端。
优选地,所述基于SGAN的视频流标记装置还包括模型训练模块,所述模型训练模块还用于:
获取待处理视频流,接收用户输入的分类指令,对所述待处理视频流进行分类,得到各分类特征对应的视频流片段;
根据所述分类特征对所述视频流片段进行特征提取,得到对应的特征帧图片,并接收用户针对所述特征帧图片输入的标记指令,得到对应的训练数据集;
将所述训练数据集输入预设的SGAN模型中,对所述SGAN模型进行训练。
本发明还提供一种存储介质。
本发明存储介质上存储有基于SGAN的视频流标记程序,所述基于SGAN的视频流标记程序被处理器执行时实现如上所述的基于SGAN的视频流标记方法的步骤。
其中,在所述处理器上运行的基于SGAN的视频流标记程序被执行时所实现的方法可参照本发明基于SGAN的视频流标记方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端系统(可以是手机,计算机,服务器,空调器,或者网络系统等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于SGAN半监督生成对抗网络的视频流标记方法,其特征在于,所述方法包括如下步骤:
在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
2.如权利要求1所述的基于SGAN的视频流标记方法,其特征在于,所述对所述新视频流进行提取处理的步骤包括:
对所述新视频流进行全帧提取处理,所述全帧提取为提取所述新视频流中的全部关键帧;
或者,
对所述新视频流进行抽帧提取处理,所述抽帧提取处理为按照预设抽取比例提取所述新视频流中的部分关键帧。
3.如权利要求1所述的基于SGAN的视频流标记方法,其特征在于,所述得到所述目标帧图片对应的分类标签的步骤之后,还包括:
判断所述分类标签是否与所述SGAN模型中的预设非真类标签相同;
若相同,则确定所述目标帧图片为未知分类的帧图片;
若不相同,则确定所述目标帧图片为已知分类的帧图片。
4.如权利要求3所述的基于SGAN的视频流标记方法,其特征在于,所述确定所述目标帧图片为已知分类的帧图片的步骤之后,还包括:
获取所述目标帧图片对应的视频流名称、分类标签以及所述目标帧图片在所述视频流中的时间点,将所述视频流名称、所述分类标签和所述时间点组成对应的数据组,将所述数据组保存到预设数据库中。
5.如权利要求4所述的基于SGAN的视频流标记方法,其特征在于,所述将所述数据组保存到预设数据库中的步骤之后,还包括:
若接收到视频流信息查询指令,则根据所述视频流信息查询指令携带的目标分类标签,查找包含所述目标分类标签的目标数据组,并将所述目标数据组反馈给所述视频流信息查询指令对应的终端。
6.如权利要求3所述的基于SGAN的视频流标记方法,其特征在于,所述确定所述目标帧图片为未知分类的帧图片的步骤之后,还包括:
获取所述目标帧图片在所述新视频流中的目标时间点,以及预设提取时间间隔,并在所述新视频流中确定与所述目标时间点相差所述预设提取时间间隔的第一时间点和第二时间点;
从所述新视频流中提取所述第一时间点和所述第二时间点之间的待定帧图片,以供用户针对所述待定帧图片输入分类指令,对所述待定帧图片进行分类,得到所述待定帧图片对应的新分类标签;
将所述待定帧图片和所述新分类标签添加到SGAN模型的训练数据集中,对SGAN模型进行更新。
7.如权利要求1-6任一项所述的基于SGAN的视频流标记方法,其特征在于,所述在检测到模型训练完成后的步骤之前,还包括:
获取待处理视频流,接收用户输入的分类指令,对所述待处理视频流进行分类,得到各分类特征对应的视频流片段;
根据所述分类特征对所述视频流片段进行特征提取,得到对应的特征帧图片,并接收用户针对所述特征帧图片输入的标记指令,得到对应的训练数据集;
将所述训练数据集输入预设的SGAN模型中,对所述SGAN模型进行训练。
8.一种基于SGAN的视频流标记装置,其特征在于,所述基于SGAN的视频流标记装置包括:
提取处理模块,用于在检测到SGAN模型训练完成后,获取新视频流,并对所述新视频流进行提取处理,得到对应的目标帧图片;
分类标记模块,用于将所述目标帧图片输入所述SGAN模型,得到所述目标帧图片对应的分类标签,以完成所述目标帧图片的标记过程。
9.一种基于SGAN的视频流标记系统,其特征在于,所述基于SGAN的视频流标记系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于SGAN的视频流标记程序,所述基于SGAN的视频流标记程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于SGAN的视频流标记方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于SGAN的视频流标记程序,所述基于SGAN的视频流标记程序被处理器执行时实现如权利要求1至7中任一项所述的基于SGAN的视频流标记方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011480283.6A CN112668411A (zh) | 2020-12-15 | 2020-12-15 | 基于sgan的视频流标记方法、装置、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011480283.6A CN112668411A (zh) | 2020-12-15 | 2020-12-15 | 基于sgan的视频流标记方法、装置、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668411A true CN112668411A (zh) | 2021-04-16 |
Family
ID=75404929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011480283.6A Pending CN112668411A (zh) | 2020-12-15 | 2020-12-15 | 基于sgan的视频流标记方法、装置、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668411A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114394100A (zh) * | 2022-01-12 | 2022-04-26 | 深圳力维智联技术有限公司 | 一种无人巡逻车控制系统及无人车 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100894A (zh) * | 2014-08-26 | 2015-11-25 | Tcl集团股份有限公司 | 面部自动标注方法及系统 |
CN109410184A (zh) * | 2018-10-09 | 2019-03-01 | 天格科技(杭州)有限公司 | 基于稠密对抗网络半监督学习的直播色情图像检测方法 |
CN109934106A (zh) * | 2019-01-30 | 2019-06-25 | 长视科技股份有限公司 | 一种基于视频图像深度学习的用户行为分析方法 |
US20190197368A1 (en) * | 2017-12-21 | 2019-06-27 | International Business Machines Corporation | Adapting a Generative Adversarial Network to New Data Sources for Image Classification |
CN109948447A (zh) * | 2019-02-21 | 2019-06-28 | 山东科技大学 | 基于视频图像识别的人物网络关系发现及演化呈现方法 |
CN110119757A (zh) * | 2019-03-28 | 2019-08-13 | 北京奇艺世纪科技有限公司 | 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质 |
CN110598048A (zh) * | 2018-05-25 | 2019-12-20 | 北京中科寒武纪科技有限公司 | 视频检索方法及视频检索映射关系生成方法、装置 |
CN111368140A (zh) * | 2020-02-19 | 2020-07-03 | 新华智云科技有限公司 | 一种视频标签生成方法及系统 |
-
2020
- 2020-12-15 CN CN202011480283.6A patent/CN112668411A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100894A (zh) * | 2014-08-26 | 2015-11-25 | Tcl集团股份有限公司 | 面部自动标注方法及系统 |
US20190197368A1 (en) * | 2017-12-21 | 2019-06-27 | International Business Machines Corporation | Adapting a Generative Adversarial Network to New Data Sources for Image Classification |
CN110598048A (zh) * | 2018-05-25 | 2019-12-20 | 北京中科寒武纪科技有限公司 | 视频检索方法及视频检索映射关系生成方法、装置 |
CN109410184A (zh) * | 2018-10-09 | 2019-03-01 | 天格科技(杭州)有限公司 | 基于稠密对抗网络半监督学习的直播色情图像检测方法 |
CN109934106A (zh) * | 2019-01-30 | 2019-06-25 | 长视科技股份有限公司 | 一种基于视频图像深度学习的用户行为分析方法 |
CN109948447A (zh) * | 2019-02-21 | 2019-06-28 | 山东科技大学 | 基于视频图像识别的人物网络关系发现及演化呈现方法 |
CN110119757A (zh) * | 2019-03-28 | 2019-08-13 | 北京奇艺世纪科技有限公司 | 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质 |
CN111368140A (zh) * | 2020-02-19 | 2020-07-03 | 新华智云科技有限公司 | 一种视频标签生成方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114394100A (zh) * | 2022-01-12 | 2022-04-26 | 深圳力维智联技术有限公司 | 一种无人巡逻车控制系统及无人车 |
CN114394100B (zh) * | 2022-01-12 | 2024-04-05 | 深圳力维智联技术有限公司 | 一种无人巡逻车控制系统及无人车 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169049B (zh) | 应用的标签信息生成方法及装置 | |
CN109614979B (zh) | 一种基于选择与生成的数据增广方法及图像分类方法 | |
CN110796098B (zh) | 内容审核模型的训练及审核方法、装置、设备和存储介质 | |
EP2320351A1 (en) | Recognizing image environment from image and position | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
US11615558B2 (en) | Computer-implemented method and system for generating a virtual vehicle environment | |
WO2022213540A1 (zh) | 目标检测、属性识别与跟踪方法及系统 | |
CN109063790B (zh) | 对象识别模型优化方法、装置和电子设备 | |
CN113297420A (zh) | 视频图像处理方法、装置、存储介质及电子设备 | |
CN112668411A (zh) | 基于sgan的视频流标记方法、装置、系统及存储介质 | |
CN112750128B (zh) | 图像语义分割方法、装置、终端及可读存储介质 | |
CN113139452A (zh) | 基于目标检测的使用手机行为的检测方法 | |
CN114157829A (zh) | 模型训练优化方法、装置、计算机设备及存储介质 | |
Niemeijer et al. | Domain adaptation and generalization: A low-complexity approach | |
KR20210006661A (ko) | 지능정보기술기반 애니메이션 콘텐츠 리소스 서비스 시스템 | |
CN114639084A (zh) | 一种基于ssd改进算法的路侧端车辆感知方法 | |
CN114241253A (zh) | 违规内容识别的模型训练方法、系统、服务器及存储介质 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN110674342B (zh) | 查询目标图像的方法和装置 | |
CN117194698B (zh) | 一种基于oar语义知识库的任务处理系统和方法 | |
CN112528893A (zh) | 异常状态的识别方法、装置及计算机可读存储介质 | |
CN112214639A (zh) | 视频筛选方法、视频筛选装置及终端设备 | |
CN111144454A (zh) | 一种基于图像标记特定特征的延迟多标记学习方法 | |
Ong et al. | Vehicle Classification Using Neural Networks and Image Processing | |
CN117095244B (zh) | 一种红外目标识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |