CN111310591A - 多类型样本数据制作装置及方法 - Google Patents
多类型样本数据制作装置及方法 Download PDFInfo
- Publication number
- CN111310591A CN111310591A CN202010064545.4A CN202010064545A CN111310591A CN 111310591 A CN111310591 A CN 111310591A CN 202010064545 A CN202010064545 A CN 202010064545A CN 111310591 A CN111310591 A CN 111310591A
- Authority
- CN
- China
- Prior art keywords
- frames
- sample set
- noise
- data
- preprocessed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000003860 storage Methods 0.000 claims abstract description 5
- 238000011946 reduction process Methods 0.000 claims abstract description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 235000002566 Capsicum Nutrition 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims description 2
- 235000016761 Piper aduncum Nutrition 0.000 claims description 2
- 235000017804 Piper guineense Nutrition 0.000 claims description 2
- 244000203593 Piper nigrum Species 0.000 claims description 2
- 235000008184 Piper nigrum Nutrition 0.000 claims description 2
- 150000003839 salts Chemical class 0.000 claims description 2
- 239000000654 additive Substances 0.000 abstract description 2
- 230000000996 additive effect Effects 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种多类型样本数据制作装置,其特征在于,用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据,包括:视频处理部,用于对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧;分辨率处理部,用于根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧;对比度处理部,用于对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧;噪声处理部,用于对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧;数据命名存储部,用于对图像帧进行统一命名并存储为样本数据。
Description
技术领域
本发明属于计算机视觉、图像处理技术领域,具体涉及一种实现多类型行人样本数据的数据集制作装置及方法。
背景技术
目前,在计算机视觉研究领域中,基于深度学习的算法在各个方向都有着良好的表现,其中大部分算法是根据卷积神经网络进行设计,通过采用预先准备好的数据集进行预训练,从而使得训练后的卷积神经网络能够根据训练的完成任务。
然而,基于深度学习的算法的优化及改进离不开大量的数据支持及验证。现存的大部分数据集都具有数据质量高低不等、数据标注内容不够丰富、数据场景过于单一、数据格式不统一等问题。特别是在图像数据类型上,目前已有的行人样本数据图像数据类型单一,同样的样本数据尺度单一,缺少低质量的样本数据。
而多尺度和低质量数据对算法训练和测试来说必不可少,若缺少了数据集,基于图像数据的卷积神经网络就难以发挥较好的识别效果,也难以对该卷积神经网络进行优化,从而在使用中容易产生误识别、无法识别等问题。
发明内容
为解决上述问题,提供一种能够规范地半自动化实现行人检测级行人重识别的大型数据集制作的装置及方法,本发明采用了如下技术方案:
本发明提供了一种多类型样本数据制作装置,其特征在于,用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据,包括:视频处理部,用于对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧;分辨率处理部,用于根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧;对比度处理部,用于对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧;噪声处理部,用于对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧;数据命名存储部,用于对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。
本发明提供的多类型样本数据制作装置,还可以具有这样的技术特征,其中,预处理包括:使用帧间差分法去除视频数据中模糊且无目标的帧;从处理后的视频数据中每五帧抽取一帧作为预处理帧。
本发明提供的多类型样本数据制作装置,还可以具有这样的技术特征,其中,放缩比例的取值在0.5至3间。
本发明提供的多类型样本数据制作装置,还可以具有这样的技术特征,其中,添加噪声处理为在预处理图像帧中随机增加椒盐噪声与高斯噪声。
本发明还提供了一种多类型样本数据制作方法,其特征在于,包括如下步骤:步骤S1,对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧;步骤S2,根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧;步骤S3,对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧;步骤S4,对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧;步骤S5,对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。
发明作用与效果
根据本发明的多类型样本数据制作装置及方法,由于通过帧间差分对输入的视频数据进行预处理,因此有效地去除了视频数据中无目标以及模糊的帧。同时,由于结合了多种类型的图像处理方法分别对预处理后的视频帧进行处理,生成了多种类型的样本集,从而解决了数据类型单一的问题。进一步,由于通过双线性插值方法处理得到多尺度的图像,还通过降低对比度以及模拟高斯分布将视频帧处理为低质量图像,从而有助于在利用本实施例构建的样本数据对卷积神经网络进行训练时,能够因为训练集中富含低质量图像以及多尺度图像从而最终得到稳定性及识别率更高的卷积神经网络。因此,通过本实施例的多类型样本数据制作装置及方法,能够得到格式统一、多尺度、多类型的样本数据,不仅方便了用户根据实际需要构建相应的样本数据,还方便了用户通过该样本数据构建训练数据集从而对卷积神经网络进行训练。
附图说明
图1是本发明实施例中多类型样本数据制作装置的结构框图;
图2是本发明实施例中双线性插值算法的原理示意图;以及
图3是本发明实施例中多类型样本数据制作方法的流程图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明的多类型样本数据制作装置及方法作具体阐述。
<实施例>
本发明的硬件平台采用一台计算机完成程序的运行,该计算机设一个NVIDIATITANX显卡用以GPU加速。本实施例中,采用了现有的caltech行人检测数据集以及citypersons行人检测数据集用作训练以及测试。
其中,caltech行人检测数据集是加州理工大学于2012年推出的大型公开行人数据集,使用车载相机进行拍摄,有超过350000个行人目标。Citypersons数据集是基于cityscape数据集对行人部分进行额外标注的数据集,具有更加细分的标注类别。
图1是本发明实施例中多类型样本数据制作装置的结构框图。
如图1所示,多类型样本数据制作装置100包括视频处理部1、分辨率处理部2、对比度处理部3、噪声处理部4以及数据命名存储部5、装置通信部6以及控制上述各部的装置控制部7。
其中,装置通信部6用于进行多类型样本数据制作装置100的各个构成部件之间以及多类型样本数据制作装置100与其他系统之间的数据通信。装置控制部7存储有用于对多类型样本数据制作装置100的各个构成部件的工作进行控制的计算机程序。
视频处理部1用于对需要标注的视频数据进行预处理,去处模糊、无目标物体的帧。
本实施例中,用户在需要进行样本数据的制作时,将视频数据导入多类型样本数据制作装置100即可进行对类型行人样本数据的制作过程。该视频数据可以是监控视频等针对行人拍摄的视频。
本实施例中,视频处理部1的处理对象为视频数据中的原始视频帧,视频处理部1采用帧间差分对各个原始视频帧进行预处理。具体为:
首先,对原始视频帧进行3×3中值滤波预处理,去掉图像随机噪声(用于减少以后运算的复杂度,克服噪声对图像处理结果的干扰)。
其次,根据视频序列采用帧间差分依次对视频数据中各个帧进行处理,其中,将pk(x,y)表示当前帧图像,将pk-1(x,y)表示前一帧图像,若不存在前一帧图像则表示当前帧图像为视频数据的起始,进一步将后一帧作为当前帧图像并进行处理。计算当前帧与背景帧的差得FD(x,y),从图像中提取出完整的目标,计掉当前1帧的差得FG(x,y),得到目标的变化量;求帧差FD(x,y)与FG(x,y)的交集从而得到运动目标粗糙的运动区域,并进行形态学处理。进一步,将视频数据中无目标且模糊的视频帧删去。
最后,从处理后的视频数据中每五帧抽取一帧作为预处理帧。
分辨率处理部2用于根据预设的放缩比例对预处理帧进行尺度放缩,具体利用双线性插值算法对预处理帧进行分辨率的放缩从而得到不同尺度的图像帧。这些不同尺度的图像帧即构成一个多尺度样本集。
本实施例中,双线性插值算法利用目标像素点对应原图坐标周围四个最近的像素点,完成像素值和位置转化。如图2所示,假设目标像素点在原图像上的对应点为P,P的目标像素点值则应由其相邻近的四个点Q11、Q12、Q21、Q22决定。双线性插值计算方式就是在x、y两个方向上分别进行两次插值。通过该双线性差值算法即可完成图像的尺度放缩。
另外,分辨率处理部2的放缩比例可以由用户自行设定,但是本实施例中将该放缩比例控制在0.5-3间,过大的放大倍率可能导致图像模糊失真。
对比度处理部3用于对预处理帧进行降低对比度处理从而生成多个低对比度的图像帧。
本实施例中,对于每个预处理帧,对比度处理部3会多次随机降低该预处理帧的对比度从而形成多个对应该预处理帧的低对比度的图像帧。所有低对比度的图像帧构成一个低对比度样本集。
噪声处理部4用于对预处理帧进行添加噪声处理从而得到多个被添加随机噪声的图像帧。
本实施例中,噪声处理部4对每个预处理帧进行添加噪声处理时,可增加椒盐噪声与高斯噪声两种,从而随机生成多个对应的被添加随机噪声的图像帧。所有被添加随机噪声的图像帧构成一个噪声样本集。
上述对比度处理部3以及噪声处理部4针对每个预处理帧生成的低质量图像帧(即低对比度的图像帧以及被添加随机噪声的图像帧)的数量可以由用户预先设定。本实施例中,每个预处理帧被对应生成两个低对比度的图像帧以及两个被添加随机噪声的图像帧。
数据命名存储部5用于将多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。
另外,本实施例中,多类型样本数据制作装置100还可以通过行人检测部以及数据标注部辅助用户对样本数据进行标注,从而将样本数据处理为最终用于神经网络训练的训练数据集。
行人检测部存储有预先训练好的行人检测网络,用于对样本数据中所有图像帧进行目标检测从而检测出需要标注的行人目标。
本实施例中,每个图像帧都依次通过行人检测网络,最终得到表示该图像帧中行人的行人目标。
本实施例中,采用了在Imagenet上预训练得到的vgg16网络模型在行人检测数据集上进行迁移学习,通过检测网络进行训练,得到本实例采用的行人检测网络。
数据标注部用于通过预设的标注工具显示图像帧以及相应被行人检测部识别出的行人目标,从而让用户对各个行人目标进行人为标注。本实施例中,被用户标注好的样本数据即可作为训练数据集对神经网络模型进行训练。
图3是本发明实施例中多类型样本数据制作方法的流程图。
如图3所示,多类型样本数据制作装置100的具体实施过程对应于多类型样本数据制作方法,当用户在多类型样本数据制作装置100中导入视频数据后,开始如下步骤:
步骤S1,对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧,然后进入步骤S2;
步骤S2,根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧,然后进入步骤S3;
步骤S3,对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧,然后进入步骤S4;
步骤S4,对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧,然后进入步骤S5;
步骤S5,对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储,然后进入结束状态。
实施例作用与效果
根据本实施例提供的多类型样本数据制作装置及方法,由于通过帧间差分对输入的视频数据进行预处理,因此有效地去除了视频数据中无目标以及模糊的帧。同时,由于结合了多种类型的图像处理方法分别对预处理后的视频帧进行处理,生成了多种类型的样本集,从而解决了数据类型单一的问题。进一步,由于通过双线性插值方法处理得到多尺度的图像,还通过降低对比度以及模拟高斯分布将视频帧处理为低质量图像,从而有助于在利用本实施例构建的样本数据对卷积神经网络进行训练时,能够因为训练集中富含低质量图像以及多尺度图像从而最终得到稳定性及识别率更高的卷积神经网络。因此,通过本实施例的多类型样本数据制作装置及方法,能够得到格式统一、多尺度、多类型的样本数据,不仅方便了用户根据实际需要构建相应的样本数据,还方便了用户通过该样本数据构建训练数据集从而对卷积神经网络进行训练。
上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。
例如,上述实施例中,多类型样本数据制作装置及方法用在行人检测方向,用于生成行人检测用的样本数据。然而,在本发明的其他实施例中,多类型样本数据制作装置及方法对于其他目标检测方向数据集的制作具有同样的效果和相同的操作方式。
Claims (5)
1.一种多类型样本数据制作装置,其特征在于,用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据,包括:
视频处理部,用于通过帧间差分法对所述视频数据进行预处理从而去除所述视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧;
分辨率处理部,用于根据预设的放缩比例并利用双线性差值算法对所述预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧;
对比度处理部,用于对所述预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧;
噪声处理部,用于对所述预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧;以及
数据命名存储部,用于对所述原始样本集、所述多尺度样本集、所述低对比度样本集以及所述噪声样本集中的图像帧进行统一命名并存储为所述样本数据。
2.根据权利要求1所述的多类型样本数据制作装置,其特征在于:
其中,所述预处理包括:
使用帧间差分法去除所述视频数据中模糊且无目标的帧;
从处理后的所述视频数据中每五帧抽取一帧作为所述预处理帧。
3.根据权利要求1所述的多类型样本数据制作装置,其特征在于:
其中,所述放缩比例的取值在0.5至3间。
4.根据权利要求1所述的多类型样本数据制作装置,其特征在于:
其中,所述添加噪声处理为在所述预处理图像帧中随机增加椒盐噪声与高斯噪声。
5.一种多类型样本数据制作方法,其特征在于,包括如下步骤:
步骤S1,对所述视频数据进行预处理从而去除所述视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧;
步骤S2,根据预设的放缩比例并利用双线性差值算法对所述预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧;
步骤S3,对所述预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧;
步骤S4,对所述预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧;
步骤S5,对所述原始样本集、所述多尺度样本集、所述低对比度样本集以及所述噪声样本集中的图像帧进行统一命名并存储为所述样本数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010064545.4A CN111310591A (zh) | 2020-01-20 | 2020-01-20 | 多类型样本数据制作装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010064545.4A CN111310591A (zh) | 2020-01-20 | 2020-01-20 | 多类型样本数据制作装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310591A true CN111310591A (zh) | 2020-06-19 |
Family
ID=71156411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010064545.4A Pending CN111310591A (zh) | 2020-01-20 | 2020-01-20 | 多类型样本数据制作装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310591A (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6287870B1 (en) * | 1999-08-20 | 2001-09-11 | Robert A. Levine | Method and assembly for separating formed constituents from a liquid constituent in a complex biologic fluid sample |
US20110091127A1 (en) * | 2008-06-20 | 2011-04-21 | Pavel Kisilev | Method and system for efficient video processing |
CN102073851A (zh) * | 2011-01-13 | 2011-05-25 | 北京科技大学 | 一种城市交通事故自动识别方法和系统 |
CN102113434A (zh) * | 2011-01-14 | 2011-07-06 | 江苏大学 | 一种果实振荡状况下采摘机器人的采摘方法 |
US20140327696A1 (en) * | 2013-05-03 | 2014-11-06 | Advanced Micro Devices Inc. | Variable acuity rendering using multisample anti-aliasing |
CN105512627A (zh) * | 2015-12-03 | 2016-04-20 | 腾讯科技(深圳)有限公司 | 一种关键点的定位方法及终端 |
CN106485245A (zh) * | 2015-08-24 | 2017-03-08 | 南京理工大学 | 一种基于可见光和红外图像的全天候目标实时跟踪方法 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN108229352A (zh) * | 2017-12-21 | 2018-06-29 | 上海交通大学 | 一种基于深度学习的站立检测方法 |
CN108491884A (zh) * | 2018-03-27 | 2018-09-04 | 中山大学 | 基于轻量级网络的行人再识别系统及实现方法 |
CN108510062A (zh) * | 2018-03-29 | 2018-09-07 | 东南大学 | 一种基于级联卷积神经网络的机器人非规则物体抓取位姿快速检测方法 |
CN108710875A (zh) * | 2018-09-11 | 2018-10-26 | 湖南鲲鹏智汇无人机技术有限公司 | 一种基于深度学习的航拍公路车辆计数方法及装置 |
CN108710831A (zh) * | 2018-04-24 | 2018-10-26 | 华南理工大学 | 一种基于机器视觉的小数据集人脸识别算法 |
CN109325532A (zh) * | 2018-09-18 | 2019-02-12 | 成都网阔信息技术股份有限公司 | 一种小样本下扩充数据集的图像处理方法 |
CN109815798A (zh) * | 2018-12-17 | 2019-05-28 | 广东电网有限责任公司 | 无人机图像处理方法及系统 |
-
2020
- 2020-01-20 CN CN202010064545.4A patent/CN111310591A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6287870B1 (en) * | 1999-08-20 | 2001-09-11 | Robert A. Levine | Method and assembly for separating formed constituents from a liquid constituent in a complex biologic fluid sample |
US20110091127A1 (en) * | 2008-06-20 | 2011-04-21 | Pavel Kisilev | Method and system for efficient video processing |
CN102073851A (zh) * | 2011-01-13 | 2011-05-25 | 北京科技大学 | 一种城市交通事故自动识别方法和系统 |
CN102113434A (zh) * | 2011-01-14 | 2011-07-06 | 江苏大学 | 一种果实振荡状况下采摘机器人的采摘方法 |
US20140327696A1 (en) * | 2013-05-03 | 2014-11-06 | Advanced Micro Devices Inc. | Variable acuity rendering using multisample anti-aliasing |
CN106485245A (zh) * | 2015-08-24 | 2017-03-08 | 南京理工大学 | 一种基于可见光和红外图像的全天候目标实时跟踪方法 |
CN105512627A (zh) * | 2015-12-03 | 2016-04-20 | 腾讯科技(深圳)有限公司 | 一种关键点的定位方法及终端 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN108229352A (zh) * | 2017-12-21 | 2018-06-29 | 上海交通大学 | 一种基于深度学习的站立检测方法 |
CN108491884A (zh) * | 2018-03-27 | 2018-09-04 | 中山大学 | 基于轻量级网络的行人再识别系统及实现方法 |
CN108510062A (zh) * | 2018-03-29 | 2018-09-07 | 东南大学 | 一种基于级联卷积神经网络的机器人非规则物体抓取位姿快速检测方法 |
CN108710831A (zh) * | 2018-04-24 | 2018-10-26 | 华南理工大学 | 一种基于机器视觉的小数据集人脸识别算法 |
CN108710875A (zh) * | 2018-09-11 | 2018-10-26 | 湖南鲲鹏智汇无人机技术有限公司 | 一种基于深度学习的航拍公路车辆计数方法及装置 |
CN109325532A (zh) * | 2018-09-18 | 2019-02-12 | 成都网阔信息技术股份有限公司 | 一种小样本下扩充数据集的图像处理方法 |
CN109815798A (zh) * | 2018-12-17 | 2019-05-28 | 广东电网有限责任公司 | 无人机图像处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Spatio-temporal filter adaptive network for video deblurring | |
Zhang et al. | Deep image deblurring: A survey | |
CN109859147B (zh) | 一种基于生成对抗网络噪声建模的真实图像去噪方法 | |
CN109272509B (zh) | 一种连续图像的目标检测方法、装置、设备及存储介质 | |
CN111275626A (zh) | 一种基于模糊度的视频去模糊方法、装置及设备 | |
CN111340716B (zh) | 一种改进双重判别对抗网络模型的图像去模糊方法 | |
Zhang et al. | Single image dehazing via dual-path recurrent network | |
CN111695421B (zh) | 图像识别方法、装置及电子设备 | |
CN111091503A (zh) | 基于深度学习的图像去失焦模糊方法 | |
CN113592776A (zh) | 图像处理方法及装置、电子设备、存储介质 | |
CN112906794A (zh) | 一种目标检测方法、装置、存储介质及终端 | |
CN110958469A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN114170570A (zh) | 一种适用于拥挤场景下的行人检测方法及系统 | |
CN112419191A (zh) | 基于卷积神经网络的图像运动模糊去除方法 | |
CN111062331A (zh) | 图像的马赛克检测方法、装置、电子设备及存储介质 | |
CN112509144A (zh) | 人脸图像处理方法、装置、电子设备及存储介质 | |
CN115345791A (zh) | 一种基于注意力机制残差网络模型的红外图像去模糊算法 | |
CN114821580A (zh) | 一种分阶段融入去噪模块的含噪图像分割方法 | |
CN108122209B (zh) | 一种基于对抗生成网络的车牌去模糊方法 | |
CN107945119B (zh) | 基于拜耳模式的图像内相关噪声估计方法 | |
CN113888425A (zh) | 基于多帧融合的工业质检图像文字匹配方法及系统 | |
WO2024082602A1 (zh) | 一种端到端视觉里程计方法及装置 | |
CN113496176A (zh) | 动作识别方法、装置以及电子设备 | |
CN111310591A (zh) | 多类型样本数据制作装置及方法 | |
Chen et al. | A deep motion deblurring network using channel adaptive residual module |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |