CN115659268A - 基于adcp测流数据的场景识别方法及其应用 - Google Patents
基于adcp测流数据的场景识别方法及其应用 Download PDFInfo
- Publication number
- CN115659268A CN115659268A CN202211688726.XA CN202211688726A CN115659268A CN 115659268 A CN115659268 A CN 115659268A CN 202211688726 A CN202211688726 A CN 202211688726A CN 115659268 A CN115659268 A CN 115659268A
- Authority
- CN
- China
- Prior art keywords
- flow measurement
- measurement data
- model
- scene
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005259 measurement Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005888 antibody-dependent cellular phagocytosis Effects 0.000 title claims description 38
- 238000012360 testing method Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000007637 random forest analysis Methods 0.000 claims abstract description 28
- 238000010276 construction Methods 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000008676 import Effects 0.000 description 7
- 238000003066 decision tree Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Abstract
本申请提出了一种基于ADCP测流数据的场景识别方法及其应用,包括以下步骤:获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证;通过将待识别的测流数据预处理后输入至模型中,输出场景识别结果。本申请可挖掘各种情形下数据的规律特征并进行有效识别及预测。
Description
技术领域
本申请涉及水流数据处理技术领域,特别是一种涉及基于ADCP测流数据的场景识别方法及其应用。
背景技术
目前,河道上船舶的识别已经由传统的目视解译过渡到了自动识别的阶段,但当前船舶自动识别主要是基于图像识别技术进行的,该方法的特点是依赖于成像系统,从图像中采集船舶的形状特征,运动特征等,进而进行船舶的识别,也有一些基于定位的方法,通过卫星定位的方式确定船舶的位置。
而且涉及更多场景识别,如大坝泄洪、河流交汇、工厂紧急排污等场景,当前也还是主要基于图像处理识别以上场景,通过光学或雷达成像设备,如遥感卫星,无人机等,对观测部位进行摄影,提取影像中的特征建模,其中的主要特征为光谱特征、纹理特征等,从而识别场景。上述方法成本较大,均需要额外设备的介入。
随着技术进步,也有通过水流信息数据来识别各种场景,但是在特定场景下,水流有不一样的规律,船舶的经过会造成水面环境的变化,影响数据质量,目前并未能够妥善处理该问题。同时为提高数据的稳定性,需要对有无船舶经过这一现象进行识别,对异常数据进行归因,进而增强测流系统的抗干扰能力,提高数据精度。因此,挖掘该情形下数据的规律特征并进行有效识别及预测,对于测流系统的智能化建设有重大的价值和意义。
为此,亟待一种能够对当前水面的实况进行识别、赋予ADCP数据实际意义、为数据分析与决策提供支持的基于ADCP测流数据的场景识别方法及其应用。
发明内容
本申请实施例提供了一种基于ADCP测流数据的场景识别方法及其应用,针对目前技术存在的成本高等问题。
本发明核心技术主要是基于决策树的一种集成学习方法-随机森林,进行数据的挖掘与探索,随机森林是一个集成多个决策树的组合分类器模型,通过该模型进行识别。
第一方面,本申请提供了一种基于ADCP测流数据的场景识别方法,所述方法包括以下步骤:
S00、获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
S10、根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;
S20、基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;
S30、通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证,使得模型的分类准确度达到设定标准;
S40、通过将待识别的测流数据预处理后输入至模型中,输出场景识别结果。
进一步地,S00步骤中,预处理至少包括数据异常值处理和数据标记,且数据异常值处理包括数据缺失补全和数据错误修正。
进一步地,S20步骤中,基于模型的AUC得分或F1得分确定模型参数的局部最优解,以实现调优。
进一步地,S20步骤中,基于AUC得分进行模型调优,具体步骤如下:
S21、模型参数选择;
S22、模型参数设置;
S23、通过训练集进行模型训练;
S24、计算模型的AUC得分;
S25、判断AUC得分是否达到设定阈值,即表示是否最优;
S26、若是,则通过测试集进行测试;若否,则重新执行S22步骤。
进一步地,AUC得分为处于对应场景的概率大于不处于对应场景的概率。
进一步地,S00步骤中,各场景的标记为1是处于对应的场景内,0是不处于对应的场景内,每次场景识别仅判断是否处于对应场景。
第二方面,本申请提供了一种基于ADCP测流数据的场景识别装置,包括:
采集模块,用于获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
模型构建模块,用于根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证,使得模型的分类准确度达到设定标准;
输入模块,用于输入待识别的测流数据并进行预处理;
输出模块,用于输出识别结果。
第三方面,本申请提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述的基于ADCP测流数据的场景识别方法。
第四方面,本申请提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据上述的基于ADCP测流数据的场景识别方法。
本发明的主要贡献和创新点如下:1、与现有技术相比,本申请通过在测流过程中不借助额外的成像设备,基于ADCP的历史数据,探索各个场景下的数据特征,进行多维度的特征构建及建模,涉及的特征主要如水的分层流速,变化速率,水压变化速率,回波强度等,从而实现场景识别,如船舶、大坝泄洪、河流交汇、工厂紧急排污等场景,从而可以根据这些场景的数据来避免干扰现象;
2、与现有技术相比,本申请通过对场景识别,可赋予ADCP数据实际意义,为数据分析与决策提供支持;而且场景识别的价值在于赋予ADCP数据以实际意义,提高后续对特定场景下测流数据进行强化处理的能力,例如过船模式下会形成干扰,可摒弃过船时间段的数据,以避免干扰;例如洪水或者开闸放水模式下,可缩短测量时间间隔以加强预警。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于ADCP测流数据的场景识别方法的流程;
图2是随机森林算法原理图;
图3是本申请一种较佳实施方式的流程图;
图4是RF-SFS特征集优选流程图;
图5是模型调优流程图;
图6是本申请实施例中导入的历史数据示意图;
图7是本申请实施例输出各特征重要度的示意图;
图8是本申请导入待识别数据的示意图;
图9是输出结果的示意图上半部分;
图10是输出结果的示意图下半部分;
图11是本申请多种应用场景的示意图;
图12是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
当前主要基于图像处理识别船舶、大坝泄洪、河流交汇、工厂紧急排污等场景,通过光学或雷达成像设备,如遥感卫星,无人机等,对观测部位进行摄影,提取影像中的特征建模,其中的主要特征为光谱特征、纹理特征等,从而识别场景。
基于此,本发明基于ADCP技术来解决现有技术存在的问题,其中ADCP基于水声信号的发射及接收,基于声波的多普勒效应计算流速,而频繁过船会引起水流流态紊乱,对流速数据产生影响,本申请以下实施例主要基于河道过船数据的自动识别。
实施例一
本申请旨在提出基于ADCP测流数据的场景识别方法,通过提供了一种基于ADCP测流数据的场景识别方法,具体地,参考图1,所述方法包括:
S00、获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
其中,S00步骤中,预处理至少包括数据异常值处理和数据标记,且数据异常值处理包括数据缺失补全和数据错误修正。
在本实施例中,历史测流数据预处理后作为数据集,应满足以下特征:
1、数据质量好,各字段数据完整;
2、清楚是否为过船数据,即携带是否为过船数据的标记;
3、尽可能地覆盖各个时间段;
而且数据集按照常见的比例划分为训练集、测试集及验证集。
S10、根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;
由于对于数据有无受船舶干扰属于分类问题,因此本申请采用的是基于决策树的一种集成学习方法-随机森林,进行数据的挖掘与探索,随机森林是一个集成多个决策树的组合分类器模型,如图2所示,在当前情景下,选择随机森林模型有以下好处:
1、削弱极端数据对模型的影响;
2、降低强势特征对模型泛化能力的影响;
3、可以得出特征的重要性排序,对后续研究有指导意义;
如在本实施例中,当前ADCP采集的业务相关数据主要包括如下的字段:
字段名备注
DATE_TIME 时间
PH 压力水位深度
PITCH 纵摇
ROLL 横摇
ZH 测深传感器水位深度
OH 外接水位深度
Cell_Number 分层数
Cell_length 厚层
Velocity_xtotal 分层流速
Velocity_xtotal 分层流速
Echo_intensity1 回波强度
Echo_intensity2 回波强度
即需在当前字段特征基础之上进行进一步的探究,构建尽可能多的特征,例如流速变化速率,回波强度变化速率,水位变化速率,流向等,并对每一组数据打上是否为过船数据的标记,例如1代表过船,0代表非过船,或者如1代表大坝泄洪,0代表大坝未泄洪等等的标记形式。
优选地,由于随机森林可以对特征进行重要性的排序,本申请采用启发式搜索(RF-SFS)中的序列前向算法来进行特征集的优选,即选择分类总体精度最高时对应的特征子集作为最优解,此时对应的特征参数个数最少、分类正确率最高,如图3-4所示。
值得一提的是,随机森林部分和特征选择是两个部分,特征选择好后通过随机森林训练,特征选择有很多方法,由于随机森林里的算法能够支持特征排序,因此采用了随机森林来进行特征选择。
S20、基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;
其中,随机森林中比较重要的参数有决策树的数量(Tree)与基于随机选择的特定数量的特征(Mtry)等,在实际执行过程中,可以基于模型的AUC得分或者F1得分来确定模型参数的局部最优解,进而优化模型。
由于是二分类,模型的评价方法可以基于AUC得分来进行,AUC得分的含义为对于给定样本,正例得分大于负例得分的概率,在当前情景中即过船数据得分大于非过船数据得分的概率,一般处于0.5-1之间,AUC越大,效果越好。
其中,如图5所示,基于AUC得分进行模型调优,具体步骤如下:
S21、模型参数选择;
S22、模型参数设置;
S23、通过训练集进行模型训练;
S24、计算模型的AUC得分;
S25、判断AUC得分是否达到设定阈值,即表示是否最优;
S26、若是,则通过测试集进行测试;若否,则重新执行S22步骤;
S30、通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证,使得模型的分类准确度达到设定标准;
在本实施例中,在构建出模型后,需要对模型进行适用性的研究,观察模型的泛化能力,一方面,在训练时,可以对样本集进行切割,部分训练,部分测试,观察模型在测试集中的表现;另一方面,可以对新的数据集进行判断,观察模型分类的准确度。
S40、通过将待识别的测流数据预处理后输入至模型中,输出场景识别结果。
如此,本申请针对河面有无船舶经过这一情境,阐述了当前船舶识别技术的现状,提出了基于ADCP测流数据,对有无过船情况进行自动识别的方法。此外阐述了过船数据识别的整体流程与思路,主要包括了特征的构建与选择,模型的训练等,为智能化测流提供一些建议。不借助额外的成像设备,基于ADCP的历史数据,探索各个场景下的数据特征,进行多维度的特征构建及建模,涉及的特征主要是水的分层流速,变化速率,水压变化速率,回波强度等,从而实现场景识别。其余场景识别的方法类似,也是同样的方式仅操作,区别仅在于获取的构建的特征不同,不同场景对应的特征不同。因此可根据实际需要的场景选择合适的特征进行模型训练即可。
优选地,以下为以是否过船为例,展示了实际操作步骤:
先进行导包操作,具体为:
#导包
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
import matplotlib.pyplot as plt
然后进行历史数据导入:
#历史数据导入
data=pd.read_csv('data.csv')
如图6所示,篇幅有限,仅展示了前5条的部分(仅为示意,里面的数据不重要)。
如此,进行预处理后特征为:
Index(E'DATE_TIME','PH','TEMP','BE','OH','VXOO1','VX002','VX003','vx004’,'VX005’,'VX006','VX007','VX008','VX009','VX010','VXOI1','VX012','VX013','VX014','VX015','VX016','VX017','VX018','VX019','VX020','VX021','VX022','VX023','VX024','VX025','VX026','VX027','VX028','VX029','VX030','positive_rate','negative_rate', 'zero_rate','target'],
dtype='object')
可见共有三十多个特征。
然后进行模型构建操作,导入:
#X,Y构建
Y=data['target']
X=data.drop(['DATE_TIME','target'],axis=1)
#测试集、训练集划分,比例为7:3
X_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.3,random_state=10)
#随机森林模型构建,参数通过实验得出
rf_model =
RandomForestClassifier(n_estimators=15,max_depth=40)
rf_model.fit(X_train,Y_train)
输出:
RandomForestClassifier(max_depth=40, n_estimators=15)
导入:
Predict =rf_model.predict(X_test)
from sklearn.metrics import accuracy_score
# 准确度
print(accuracy_score(Predict,Y_test))
0.7692307692307693
# 各类特征重要性
plt.barh(X.columns.tolist(),height=0.8,width=rf_model.feature_importances_,align="center")
输出:
经过随机森林模型的构建,对数据集进行切分,实现模的训练,当前模型的预测准确度约等于77%(0.7692307692307693),随后得出各个特征的重要性指标,如图7所示。
最后进行模型应用,导入:
# 数据采集
test_data=pd.read_csv(test_data.csv')
如图8所示,篇幅有限,仅展示了前5条的部分(仅为示意,里面的数据不重要)。
# 预处理
test_data2=test_data.drop(labels='DATE_TIME',axis=1)
# 模型预测
test_data['是否过船']=rf_model.predict(test_data2)
test_data.rename(columns={'DATE_TIME':'时间'},inplace=True)
result=test_data.loc[:,['时间','是否过船']]
# 展示前50条,1代表有船只经过,0代表无船只经过result.head(50)
输出,如图9-10所示,如此可以得出test_data.csv这个文件内的数据中过船的数据。同理调整特征也可以识别如大坝泄洪、河流交汇、工厂紧急排污等场景。不再需要成像设备的投入成本,在日常数据采集的同时,做到有无船舶经过的判断,并且有较高的可信度,为实际测流数据提供现场情况支持。如图11,本申请可应用于多种场景中,如过船时,摒弃此时的数据或进行重采样,避免干扰,如洪水时加密测量,即缩短测量时间间隔,或者其他场景进行类似的强化处理,以减少或避免干扰。
实施例二
基于相同的构思,本申请还提出了一种基于ADCP测流数据的场景识别装置,包括:
采集模块,用于获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
模型构建模块,用于根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证,使得模型的分类准确度达到设定标准;
输入模块,用于输入待识别的测流数据并进行预处理;
输出模块,用于输出识别结果。
实施例三
本实施例还提供了一种电子装置,参考图12,包括存储器404和处理器402,该存储器404中存储有计算机程序,该处理器402被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
具体地,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器404可以包括用于数据或指令的大容量存储器404。举例来说而非限制,存储器404可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器404可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器404可在数据处理装置的内部或外部。在特定实施例中,存储器404是非易失性(Non-Volatile)存储器。在特定实施例中,存储器404包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-OnlyMemory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-AccessMemory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器404(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccessMemory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamicRandom-AccessMemory,简称SDRAM)等。
存储器404可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器402所执行的可能的计算机程序指令。
处理器402通过读取并执行存储器404中存储的计算机程序指令,以实现上述实施例中的任意一种基于ADCP测流数据的场景识别方法。
可选地,上述电子装置还可以包括传输设备406以及输入输出设备408,其中,该传输设备406和上述处理器402连接,该输入输出设备408和上述处理器402连接。
传输设备406可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备406可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备408用于输入或输出信息。在本实施例中,输入的信息可以是水流信息数据或者叫水声信号等,输出的信息可以是场景识别结果等。
实施例四
本实施例还提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据实施例一的基于ADCP测流数据的场景识别方法。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如DVD及其数据变体、CD等光学介质上。物理介质是非瞬态介质。
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以作出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (9)
1.一种基于ADCP测流数据的场景识别方法,其特征在于,包括以下步骤:
S00、获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
S10、根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;
S20、基于随机森林构建模型,输入所述训练集进行训练并同步进行调优,以完成模型的构建;
S30、通过所述测试集对所述模型进行测试,通过待识别的测流数据对所述模型进行验证,使得所述模型的分类准确度达到设定标准;
S40、通过将待识别的测流数据预处理后输入至所述模型中,输出场景识别结果。
2.如权利要求1所述的一种基于ADCP测流数据的场景识别方法,其特征在于,S00步骤中,所述预处理至少包括数据异常值处理和数据标记,且所述数据异常值处理包括数据缺失补全和数据错误修正。
3.如权利要求1所述的一种基于ADCP测流数据的场景识别方法,其特征在于,S20步骤中,基于所述模型的AUC得分或F1得分确定模型参数的局部最优解,以实现调优。
4.如权利要求3所述的一种基于ADCP测流数据的场景识别方法,其特征在于,S20步骤中,基于AUC得分进行模型调优,具体步骤如下:
S21、模型参数选择;
S22、模型参数设置;
S23、通过训练集进行模型训练;
S24、计算模型的AUC得分;
S25、判断AUC得分是否达到设定阈值,即表示是否最优;
S26、若是,则通过测试集进行测试;若否,则重新执行S22步骤。
5.如权利要求4所述的一种基于ADCP测流数据的场景识别方法,其特征在于,所述AUC得分为处于对应场景的概率大于不处于对应场景的概率。
6.如权利要求1-5任意一项所述的一种基于ADCP测流数据的场景识别方法,其特征在于,S00步骤中,各场景的标记为1是处于对应的场景内,0是不处于对应的场景内,每次场景识别仅判断是否处于对应场景。
7.一种基于ADCP测流数据的场景识别装置,其特征在于,包括:
采集模块,用于获取ADCP采集的历史测流数据预处理后按比例划分作为训练集和测试集,且该历史测流数据至少携带所需识别各场景的标记;
模型构建模块,用于根据各场景进行特征构建,通过随机森林对特征进行重要性排序,并通过启发式搜索进行特征选择,选择分类总体精度最高时对应的特征子集作为最优解;基于随机森林构建模型,输入训练集进行训练并同步进行调优,以完成模型的构建;通过测试集对模型进行测试,通过待识别的测流数据对模型进行验证,使得模型的分类准确度达到设定标准;
输入模块,用于输入待识别的测流数据并进行预处理;
输出模块,用于输出识别结果。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至6任一项所述的基于ADCP测流数据的场景识别方法。
9.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1至6任一项所述的基于ADCP测流数据的场景识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211688726.XA CN115659268A (zh) | 2022-12-28 | 2022-12-28 | 基于adcp测流数据的场景识别方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211688726.XA CN115659268A (zh) | 2022-12-28 | 2022-12-28 | 基于adcp测流数据的场景识别方法及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115659268A true CN115659268A (zh) | 2023-01-31 |
Family
ID=85023412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211688726.XA Pending CN115659268A (zh) | 2022-12-28 | 2022-12-28 | 基于adcp测流数据的场景识别方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659268A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116500296A (zh) * | 2023-04-28 | 2023-07-28 | 杭州开闳流体科技有限公司 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359669A (zh) * | 2018-09-10 | 2019-02-19 | 平安科技(深圳)有限公司 | 医保报销异常检测方法、装置、计算机设备和存储介质 |
CN113406354A (zh) * | 2021-06-21 | 2021-09-17 | 湖南国天电子科技有限公司 | 一种用于adcp的数据优化方法及系统 |
CN115294404A (zh) * | 2022-08-30 | 2022-11-04 | 中国科学院海洋研究所 | 一种基于随机森林算法的底栖动物高光谱数据分类方法 |
-
2022
- 2022-12-28 CN CN202211688726.XA patent/CN115659268A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359669A (zh) * | 2018-09-10 | 2019-02-19 | 平安科技(深圳)有限公司 | 医保报销异常检测方法、装置、计算机设备和存储介质 |
CN113406354A (zh) * | 2021-06-21 | 2021-09-17 | 湖南国天电子科技有限公司 | 一种用于adcp的数据优化方法及系统 |
CN115294404A (zh) * | 2022-08-30 | 2022-11-04 | 中国科学院海洋研究所 | 一种基于随机森林算法的底栖动物高光谱数据分类方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116500296A (zh) * | 2023-04-28 | 2023-07-28 | 杭州开闳流体科技有限公司 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
CN116500296B (zh) * | 2023-04-28 | 2023-11-17 | 杭州开闳流体科技有限公司 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11851147B2 (en) | Spatio-temporal DP method based on ship trajectory characteristic point extraction | |
CN105785411B (zh) | 一种基于区域划分的异常轨迹检测方法 | |
CN110033051B (zh) | 一种基于多步聚类的拖网渔船行为判别方法 | |
CN112733800B (zh) | 基于卷积神经网络的遥感图像道路信息提取方法和装置 | |
CN115659268A (zh) | 基于adcp测流数据的场景识别方法及其应用 | |
CN109874104A (zh) | 用户位置定位方法、装置、设备及介质 | |
CN113836999A (zh) | 基于探地雷达的隧道施工风险智能识别方法及系统 | |
CN115439750A (zh) | 道路病害检测方法、装置、电子设备及存储介质 | |
CN111191696A (zh) | 一种基于深度学习算法的钢筋分层方法及系统 | |
CN113255580A (zh) | 抛洒物识别、车辆抛洒滴漏识别方法和装置 | |
CN114973659A (zh) | 一种高速公路的间接事件检测的方法、装置及系统 | |
CN115861408A (zh) | 基于激光点跟踪的无人机巡检路面坑洞方法及其应用 | |
CN110913407A (zh) | 重叠覆盖的分析方法及装置 | |
CN115171031B (zh) | 一种基于车辆参照物的路面积水检测方法、装置及应用 | |
CN116027118B (zh) | 一种应用于气象雷达站的电磁环境监测方法及系统 | |
CN116522790A (zh) | 一种确定暴雨导致滑坡链式灾害影响区域的方法和系统 | |
CN110126846A (zh) | 驾驶场景的表示方法、装置、系统和存储介质 | |
CN115630336A (zh) | 基于域自适应迁移学习的无样本库区滑坡易发性预测方法 | |
CN112243193A (zh) | 室内定位方法、装置、计算机设备和可读存储介质 | |
CN115546780B (zh) | 车牌识别方法、模型及装置 | |
CN117849908B (zh) | 一种基于模式环流场的梅雨季入梅出梅日期预测方法及装置 | |
RU2724596C1 (ru) | Способ, устройство, центральное устройство и система для распознавания сдвига распределения в распределении данных и/или признаков входных данных | |
CN115546652B (zh) | 一种多时态目标检测模型及其构建方法、装置及应用 | |
CN115238024B (zh) | 高速公路设施定位方法、装置、电子设备及存储介质 | |
CN115762155B (zh) | 一种高速公路路面异常监测方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230131 |