CN112419304A - 一种面向一维数据的多阶段目标检测方法及装置 - Google Patents
一种面向一维数据的多阶段目标检测方法及装置 Download PDFInfo
- Publication number
- CN112419304A CN112419304A CN202011431185.3A CN202011431185A CN112419304A CN 112419304 A CN112419304 A CN 112419304A CN 202011431185 A CN202011431185 A CN 202011431185A CN 112419304 A CN112419304 A CN 112419304A
- Authority
- CN
- China
- Prior art keywords
- candidate frame
- result
- candidate
- data
- dimensional data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 230000011218 segmentation Effects 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 22
- 238000001914 filtration Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 12
- 230000005764 inhibitory process Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 11
- 230000014759 maintenance of location Effects 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 230000002401 inhibitory effect Effects 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 9
- 239000012634 fragment Substances 0.000 description 6
- 230000001629 suppression Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种面向一维数据的多阶段目标检测方法及装置,该方法对输入的一维数据去噪预处理;然后通过粗分割模型对处理后的数据逐点进行前背景分类;再结合中值滤波和开闭操作修正异常点得到中间预测结果;对于每个中间预测结果生成若干可能候选框,并通过候选框分类及精确回归模型去除被识别为背景的候选框,修正被识别为前景的候选框边界;之后结合非极大值抑制进行筛选留下置信概率最大的候选框作为最终检测结果。本发明提出的方法可以有效检测出一维数据中长、短目标以及相距较近的难分割目标,此检测方法在不同场合下都可以得到更加完整、纯净的目标。
Description
技术领域
本发明属于深度学习技术领域,具体涉及一种面向一维数据的多阶段目标检测方法及装置。
背景技术
一维数据(例如信号)是一种十分常见的数据形式,是机器学习中一项重要的研究内容,一般对于一维数据的处理方法都是要先获取其有效的数据片段后再进行后续处理,例如在基于WIFICSI(Channel State Information,CSI)信号的动作识别中需要先截取连续采集信号中的有意义的片段。但是一维数据和二维数据以及三维数据等有着明显的差别,很多一维数据并不具有明显的可识别性,是一些比较杂乱的记录。那么对于这些一维数据中包含实际意义的有效数据片段的获取则具有相应的难度,这对后续的数据识别分类等建立在精确有效数据片段上的操作也产生了不小的影响。
现有的一维数据片段的检测方法很多都依赖于一维数据中的不同统计特征的变化情况来判断不同数据片段的起止位置,一般是针对仅有一类数据的情况。这些检测方法使用的统计特征主要有均值、方差等。在使用窗口划分的方法中,首先是对划分出的数据窗口计算特征值,然后是根据每个数据窗口的特征值的变化情况进行判断是否包含数据片段的起止并进行划分。然而这种两阶段的划分中存在一些问题,首先是窗口的划分过程中,对每个窗口计算统计特征时极易包含过多的与有效数据内容无关的背景信息,使得统计特征的数值产生无法估量的波动,从而影响特征的变化规律计算,使得划分结果偏移。同时,根据窗口划分的大小的不同,很容易出现一个完整的数据片段被划分到多个小窗口中或是某个数据片段与较多的背景数据一同处于一个较大的窗口中。其次,对于部分有实际意义的数据片段,其内部的统计特征变化可能不明显,易与背景信息混淆,在窗口划分较小时可能会被提前截断。若是采用缓冲区机制来阻止提前截断,对于仅包含一个数据片段的待检测数据是可行的,但是对于包含若干有效数据片段的长序列一维数据,则可能会因为两个数据片段间的间距太小而被缓冲区粘连在一起,使得多个数据片段被误划分为一个。
例如统计特征对无线识别中信道状态信息(Channel State Information,CSI)进行识别。CSI数据是一种多通道的信号数据,可以通过其波形获取有效信息。因为单独使用统计特征存在前文所述的问题,如果能合理的解决问题,有望从信号的特征中获得更好的分类性能。
发明内容
针对现有技术中的缺陷和不足,本发明提供了一种面向一维数据的多阶段目标检测方法及装置,克服现有方法难以精确划分数据片段边界、难以正确检测出所有有效数据片段位置和数量、在多个类别数据中难以生效等问题。
为达到上述目的,本发明采取如下的技术方案:
一种面向一维数据的多阶段目标检测方法,该方法对输入的一维数据去噪预处理;然后通过粗分割模型对预处理后的数据逐点进行前景背景分类;再结合中值滤波和开闭操作修正异常点得到中间预测结果;对于每个中间预测结果生成若干候选框,并通过候选框分类及精确回归模型去除被识别为背景的候选框,修正被识别为前景的候选框边界;之后结合非极大值抑制进行筛选留下置信概率最大的候选框作为最终检测结果。
本发明还包括如下技术特征:
具体的,该方法包括以下步骤:
步骤一,数据预处理:
对输入的一维数据进行去噪预处理以去除背景环境噪声;
步骤二,数据粗分割:
使用循环神经网络作为粗分割模型对预处理后的数据逐点分类为前景背景;
步骤三,异常值处理:
使用闭运算与中值滤波消除步骤二粗分割结果中存在的凹陷与毛刺;
步骤四,候选框生成和边界确定:
在步骤三的结果上选取种子点生成候选框,并使用全卷积神经网络对候选框进行判定,对判定为前景的候选框边界进行精确回归;
步骤五,结果输出
对经过步骤四处理后剩余的候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。
具体的,所述步骤三包括:
步骤3.1,对步骤二中粗分割后的结果进行闭运算操作消除结果中包含的凹陷;
步骤3.2,对步骤3.1得到的结果进行中值滤波操作消除步骤3.1结果中仍然存在的毛刺。
具体的,所述步骤四包括:
步骤4.1,在步骤三的结果上随机选取种子点,以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体;
步骤4.2,对于每个生成的候选框,使用全卷积神经网络对候选框进行判别和边界精确回归;计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归。
一种面向一维数据的多阶段目标检测的装置,包括:
预处理模块,用以对输入的一维数据进行去噪预处理以去除背景环境噪声;
数据粗分割模块,用以使用循环神经网络作为粗分割模型对预处理后的数据逐点分类为前景背景;
异常值处理模块,用以使用闭运算与中值滤波消除粗分割结果中存在的凹陷与毛刺;
候选框生成和边界确定模块,用以在异常值处理结果上选取种子点生成候选框,并使用全卷积神经网络对候选框进行判定,对判定为前景的候选框边界进行精确回归;
结果输出模块,用以对候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。
具体的,所述异常值处理模块中:对粗分割后的结果进行闭运算操作消除结果中包含的凹陷,对闭运算操作得到的结果进行中值滤波操作消除闭运算操作结果中仍然存在的毛刺。
具体的,所述候选框生成和边界确定模块中:在异常值处理的结果上随机选取种子点,以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体;对于每个生成的候选框,使用全卷积神经网络对候选框进行判别和边界精确回归,计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归。
本发明与现有技术相比,有益的技术效果是:
(Ⅰ)本发明通过使用循环神经网络作为粗分割模型的基础,对预处理后的一维数据进行分类分析,可以有效地计算保留多种数据类别的数据变化规律。克服了基于统计特征的划分中无法有效检测包含多种类别的一维数据的问题。
(Ⅱ)本发明通过粗分割模型对一维数据的初步分类,异常值处理和候选框技术的处理确定了所有属于前景的候选框并忽略了中间产生的背景候选框。克服了现有技术难以检测出所有有效数据片段位置和数量的问题。
(Ⅲ)本发明通过第二阶段的边界精确回归技术和之后的非极大值抑制对剩余的候选框边界进行更进一步的修正和合并。克服了滑动窗口难以精确划分数据片段边界的问题。
(IV)本发明能有效的提升在信号中检测有意义片段(目标)的查全率和精确度,可以有效改善后续下游任务的处理效果。例如:在基于WIFICSI信号的动作识别中为后续分类器更好的提取包含有意义动作的信号片段(目标)。
附图说明
图1是实施例1中原始CSI信号数据(横坐标:时间帧;纵坐标:振幅);
图2是实施例1中原始信号滤波降噪后的结果;
图3是实施例1中滤波后再缩放去除直流分量的结果;
图4是实施例1中逐点预测并消除异常值得到的行为片段初始检测结果;
图5是实施例1中生成若干候选区间的结果图;
图6是实施例1中非极大值抑制后的预测结果图;
图7是实施例1中可视化处理防粘连的结果图;
图8是实施例中整体的预测过程及结果图;
图9是本发明方法的整体流程图。
具体实施方式
以下对本发明的具体实施方式进行详细说明。应当理解的是,此处所述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
本发明希望设计一种新型的一维数据目标检测方法,动机是将包含多种类别的一维数据中的有效数据片段完整精确的检测出来,核心是借助粗分割模型、候选框生成和精确判别模型对数据进行两阶段的检测处理,其至少满足以下特性:精确检测出有效数据片段的边界、完整检测出所有的有效数据片段的数量和轴心位置、有效检测出多个不同类别的数据片段。
本发明中,粗分割模型是将预处理后的一维数据在每个点上进行模型分类计算并判定为前背景。
闭运算是通过先膨胀再腐蚀将细微相间的物体拼接,使其可以更为平滑。膨胀操作是一种形态学操作,通过卷积的方法来消除数据中存在的凹陷、镂空等缺陷。腐蚀操作也是一种形态学操作,通过卷积的方法消除数据中的毛刺、凸起等缺陷。
中值滤波是一种非线性平滑技术,它将每一采样点的取值设置为该点某邻域窗口内的所有采样点取值的中值。意在消除数据中的异常值,平滑噪声。
候选框生成模块是在处理后的粗分割结果上按照每个区间作为单位,在其中任选多个种子点并以此种子点为轴心生成候选框。
精确回归模型是对剩余的候选框进行回归计算,进行边界的细微调整以达到最优结果。
非极大值抑制是一种相似解筛选技术,用于在多候选结果的情况中保留可能性最大的结果。
如图9所示,需要进行检测的一维数据输入后,先进行数据滤波等预处理;再通过粗分割模型对数据进行第一阶段的片段划分;然后使用开闭操作和中值滤波进行结果平滑;在平滑的结果上生成多个候选框;再通过候选框判别和边界精确回归模型消除多余的候选框并调整每个剩余的候选框的边界;最后通过非极大值抑制将最终的候选框进行合并,得到的框体就是最终的预测结果。
具体的,该方法包括如下步骤:
步骤一,数据预处理:
对输入的一维数据进行预处理去除背景环境噪声等无关信息;
步骤二,数据粗分割:
使用循环神经网络作为粗分割模型对预处理后的数据进行逐点分类,将其为前景背景的概率作为判别标准;
步骤三,异常值处理:
步骤3.1,对步骤二中粗分割后的结果进行闭运算操作消除结果中包含的凹陷;
步骤3.2,对步骤3.1得到的结果进行中值滤波操作消除步骤3.1结果中仍然存在的毛刺;
步骤四,候选框生成和边界确定
步骤4.1,在步骤3.2的结果所得到的区间中,按照一定概率随机选取若干数值作为种子点并以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体。;
步骤4.2,对于每个生成的候选框,为克服候选框大小不一致的问题,使用全卷积神经网络对候选框进行判别和边界精确回归,计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归;
步骤五,结果输出
对经过步骤4.2处理后剩余的候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。
本发明还提供一种面向一维数据的多阶段目标检测的装置,包括:
粗分割模型,用于将预处理后的输入数据对每个点计算其为前景或背景的概率;
预处理模块,用以对输入的一维数据进行去噪预处理以去除背景环境噪声;
数据粗分割模块,用以使用循环神经网络作为粗分割模型对预处理后的数据逐点分类为前景背景;
异常值处理模块,用以使用闭运算与中值滤波消除粗分割结果中存在的凹陷与毛刺;异常值处理模块中:对粗分割后的结果进行闭运算操作消除结果中包含的凹陷,对闭运算操作得到的结果进行中值滤波操作消除闭运算操作结果中仍然存在的毛刺。
候选框生成和边界确定模块,用以在异常值处理结果上选取种子点生成候选框,并使用全卷积神经网络对候选框进行判定,对判定为前景的候选框边界进行精确回归;候选框生成和边界确定模块中:在异常值处理的结果上随机选取种子点,以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体;对于每个生成的候选框,使用全卷积神经网络对候选框进行判别和边界精确回归,计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归。
结果输出模块,用以对候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。非极大值抑制是一种相似解筛选技术,用于在多候选结果的情况中保留可能性最大的结果;这里用于对存在的多个候选框进行合并,筛选保留概率最大的候选框作为检测结果。
实施例1:
本实施例以无线识别中信道状态信息(Channel State Information,CSI)信号的检测为例。目标是,通过本发明为基于WIFICSI信号的动作识别算法,在连续采集的信号中提取出包含动作的有意义信号片段。具体包括如下步骤:
步骤一,数据预处理:
将采集得到的CSI数据输入,通过复数处理并取其振幅数据,选取其中的第61~90条子载波上的数据,对其进行巴特沃斯低通滤波处理,消除一些噪声数据,滤波前后的结果如图1和图2所示;其中,图1是原始CSI信号数据(横坐标:时间帧;纵坐标:振幅);图2是原始信号滤波降噪后的结果。再对滤波数据进行子载波维度的z-score缩放以去除不同通道间的直流分量差异,结果如图3滤波后再缩放去除直流分量的结果。
步骤二:数据粗分割
将预处理后的CSI数据送入粗分割模型,对每条子载波上的数据的每个点进行分类分析计算该点属于前景或是背景的概率并进行结果输出。
步骤三,异常值处理
对CSI数据粗分割结果进行闭运算操作和中值滤波消除结果中的凹陷和毛刺,如图4为逐点预测并消除异常值得到的行为片段初始检测结果;其中从上到下,第一条线是真实地人工标记的划分结果,第二条线是对每个点进行分类得到的前背景的初步预测结果,第三条线是对初步预测结果去除毛刺和异常值后的结果。
步骤四,候选框生成和边界确定
对异常值处理后的CSI检测结果中的每个区间,选取20个随机种子点并生成相应的候选框,如图5生成若干候选区间的结果图,再回归计算消除多余的候选框并修正剩余的候选框。
步骤五,结果输出
对剩余的候选框进行非极大值抑制合并,作为最终的检测结果,如图6非极大值抑制后的预测结果图。
发明在多个数据上进行了实验验证:
在可视化结果时,若检测结果中某两个数据片段相聚较近,则在可视化结果中会重合,影响观感,于是对其进行判定并上下位错位处理,结果如图7可视化处理防粘连的结果图。
实验选取自主采集的数据,共计12种不同行为48条长序列信号数据,包含1200个可检测行为片段,其中包括有两个行为片段的间隔较短的数据。由于此类长序列时序数据可以进行无限延伸,所以选取其中20%的数据进行循环神经网络的训练,以学习不同行为片段的模式,将所有的数据用于测试。
本发明提出的方法在若干连续片段的长序列信号数据上可以正确的检测出所有行为片段以及起止位置,并可以对于间隔较近的行为片段正确的分离而非粘连处理,整体运行过程及结果如图8所示。
本发明提出的方法可以学习到人工标记的模式,在具有不同标准的信号检测结果中更加符合人工标准。在此次实验所采集的数据中,本发明提出的方法在包含若干间距不等的行为片段的长序列CSI信号上的平均检测准确率定义为位置均正确的数量与实际检测数量的比值,具体数值为96.2%,比以往的方法提高了7.4%。漏检率定义为未被识别出来的数量占总数量的比值为0%。截断率定义为一个完整片段被提前结束的数量占总数量的比值,数值为3.8%。
Claims (7)
1.一种面向一维数据的多阶段目标检测方法,其特征在于,该方法对输入的一维数据去噪预处理;然后通过粗分割模型对预处理后的数据逐点进行前景背景分类;再结合中值滤波和开闭操作修正异常点得到中间预测结果;对于每个中间预测结果生成若干候选框,并通过候选框分类及精确回归模型去除被识别为背景的候选框,修正被识别为前景的候选框边界;之后结合非极大值抑制进行筛选留下置信概率最大的候选框作为最终检测结果。
2.如权利要求1所述的面向一维数据的多阶段目标检测方法,其特征在于,该方法包括以下步骤:
步骤一,数据预处理:
对输入的一维数据进行去噪预处理以去除背景环境噪声;
步骤二,数据粗分割:
使用循环神经网络作为粗分割模型对预处理后的数据逐点分类为前景背景;
步骤三,异常值处理:
使用闭运算与中值滤波消除步骤二粗分割结果中存在的凹陷与毛刺;
步骤四,候选框生成和边界确定:
在步骤三的结果上选取种子点生成候选框,并使用全卷积神经网络对候选框进行判定,对判定为前景的候选框边界进行精确回归;
步骤五,结果输出
对经过步骤四处理后剩余的候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。
3.如权利要求2所述的面向一维数据的多阶段目标检测方法,其特征在于,所述步骤三包括:
步骤3.1,对步骤二中粗分割后的结果进行闭运算操作消除结果中包含的凹陷;
步骤3.2,对步骤3.1得到的结果进行中值滤波操作消除步骤3.1结果中仍然存在的毛刺。
4.如权利要求2所述的一种面向一维数据的多阶段目标检测方法,其特征在于,所述步骤四包括:
步骤4.1,在步骤三的结果上随机选取种子点,以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体;
步骤4.2,对于每个生成的候选框,使用全卷积神经网络对候选框进行判别和边界精确回归;计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归。
5.一种面向一维数据的多阶段目标检测的装置,其特征在于,包括:
预处理模块,用以对输入的一维数据进行去噪预处理以去除背景环境噪声;
数据粗分割模块,用以使用循环神经网络作为粗分割模型对预处理后的数据逐点分类为前景背景;
异常值处理模块,用以使用闭运算与中值滤波消除粗分割结果中存在的凹陷与毛刺;
候选框生成和边界确定模块,用以在异常值处理结果上选取种子点生成候选框,并使用全卷积神经网络对候选框进行判定,对判定为前景的候选框边界进行精确回归;
结果输出模块,用以对候选框进行非极大值抑制,筛选保留概率最大的候选框作为检测结果并输出。
6.如权利要求5所述的面向一维数据的多阶段目标检测的装置,其特征在于,所述异常值处理模块中:对粗分割后的结果进行闭运算操作消除结果中包含的凹陷,对闭运算操作得到的结果进行中值滤波操作消除闭运算操作结果中仍然存在的毛刺。
7.如权利要求5所述的面向一维数据的多阶段目标检测的装置,其特征在于,所述候选框生成和边界确定模块中:在异常值处理的结果上随机选取种子点,以每个种子点作为中心点,种子点与当前区间端点较远距离为半窗长进行翻转得到候选框体;对于每个生成的候选框,使用全卷积神经网络对候选框进行判别和边界精确回归,计算其是前景或背景的概率,若是背景则舍弃当前候选框;若是前景则对候选框边界进行精确回归。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011431185.3A CN112419304B (zh) | 2020-12-07 | 2020-12-07 | 一种面向一维数据的多阶段目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011431185.3A CN112419304B (zh) | 2020-12-07 | 2020-12-07 | 一种面向一维数据的多阶段目标检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112419304A true CN112419304A (zh) | 2021-02-26 |
CN112419304B CN112419304B (zh) | 2023-09-19 |
Family
ID=74774964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011431185.3A Active CN112419304B (zh) | 2020-12-07 | 2020-12-07 | 一种面向一维数据的多阶段目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112419304B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372357A (zh) * | 2021-12-29 | 2022-04-19 | 国网天津市电力公司 | 一种基于因子隐马尔可夫模型的工业负荷分解方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006105473A2 (en) * | 2005-03-31 | 2006-10-05 | University Of Iowa Research Foundation | Automatic detection of red lesions in digital color fundus photographs |
CN106778835A (zh) * | 2016-11-29 | 2017-05-31 | 武汉大学 | 融合场景信息和深度特征的遥感图像机场目标识别方法 |
CN108154118A (zh) * | 2017-12-25 | 2018-06-12 | 北京航空航天大学 | 一种基于自适应组合滤波与多级检测的目标探测系统及方法 |
CN109961049A (zh) * | 2019-03-27 | 2019-07-02 | 东南大学 | 一种复杂场景下香烟品牌识别方法 |
WO2020173036A1 (zh) * | 2019-02-26 | 2020-09-03 | 博众精工科技股份有限公司 | 基于深度学习的定位方法和系统 |
-
2020
- 2020-12-07 CN CN202011431185.3A patent/CN112419304B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006105473A2 (en) * | 2005-03-31 | 2006-10-05 | University Of Iowa Research Foundation | Automatic detection of red lesions in digital color fundus photographs |
CN106778835A (zh) * | 2016-11-29 | 2017-05-31 | 武汉大学 | 融合场景信息和深度特征的遥感图像机场目标识别方法 |
CN108154118A (zh) * | 2017-12-25 | 2018-06-12 | 北京航空航天大学 | 一种基于自适应组合滤波与多级检测的目标探测系统及方法 |
WO2020173036A1 (zh) * | 2019-02-26 | 2020-09-03 | 博众精工科技股份有限公司 | 基于深度学习的定位方法和系统 |
CN109961049A (zh) * | 2019-03-27 | 2019-07-02 | 东南大学 | 一种复杂场景下香烟品牌识别方法 |
Non-Patent Citations (2)
Title |
---|
于兰兰等: "候选框算法在车辆检测中的应用分析", 青岛大学学报(自然科学版), no. 02 * |
李娟;强赞霞;杨关;崔春生;: "基于区域推荐和深度卷积网络的交通目标检测", 数学的实践与认识, no. 16 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372357A (zh) * | 2021-12-29 | 2022-04-19 | 国网天津市电力公司 | 一种基于因子隐马尔可夫模型的工业负荷分解方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112419304B (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115082683B (zh) | 一种基于图像处理的注塑缺陷检测方法 | |
US20230289979A1 (en) | A method for video moving object detection based on relative statistical characteristics of image pixels | |
Liang et al. | Defect detection of rail surface with deep convolutional neural networks | |
CN110890102A (zh) | 一种基于rnn声纹识别的发动机缺陷检测算法 | |
CN109658402A (zh) | 基于计算机视觉成像的工业型材几何尺寸自动检测方法 | |
CN110414367B (zh) | 一种基于gan和ssn的时序行为检测方法 | |
CN111815555A (zh) | 对抗神经网络结合局部二值的金属增材制造图像检测方法及装置 | |
CN103778609A (zh) | 基于像素连续性判断的二值化图像和灰度图像的高效去噪声法 | |
CN113064796B (zh) | 一种无监督指标异常检测方法 | |
CN114581692B (zh) | 一种基于智能图形识别的防振锤故障检测方法及系统 | |
CN112597831A (zh) | 一种基于变分自编码器和对抗网络的信号异常检测方法 | |
CN108335294A (zh) | 复杂条件下的配电房异常状态图像识别方法 | |
CN104268563B (zh) | 一种基于异常行为检测的视频摘要方法 | |
CN116308300B (zh) | 一种电力设备状态监测评价与指挥方法及系统 | |
CN111814825B (zh) | 基于遗传算法优化支持向量机的苹果检测分级方法及系统 | |
CN112818766A (zh) | 一种基于计算机视觉的高空抛物检测警报方法及系统 | |
CN108226890B (zh) | 基于时间向统计的机场异物雷达检测方法 | |
CN110988137A (zh) | 一种基于时频域特征的异音检测系统及方法 | |
CN112419304A (zh) | 一种面向一维数据的多阶段目标检测方法及装置 | |
CN108956783B (zh) | 一种基于hdp-hsmm的磨削声砂轮钝化状态检测方法 | |
CN103679183A (zh) | 一种平纹本色布疵点识别的方法 | |
CN109636794B (zh) | 一种基于机器学习的地铁高度调节阀紧固螺母定位方法 | |
Gibert et al. | Sequential score adaptation with extreme value theory for robust railway track inspection | |
CN116385953B (zh) | 铁路货车敞车车门折页折断故障图像识别方法 | |
CN107403192B (zh) | 一种基于多分类器的快速目标检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240313 Address after: 12 / F, building a, Gaoke Shangdu one Shangcheng, No.43 zhangbawu Road, zhangbajie office, high tech Zone, Xi'an City, Shaanxi Province, 710000 Patentee after: XI'AN PREPAID METER TECHNOLOGY Co.,Ltd. Country or region after: China Address before: 710069 No. 229 Taibai North Road, Shaanxi, Xi'an Patentee before: NORTHWEST University Country or region before: China |
|
TR01 | Transfer of patent right |