CN116500296A - 针对生态基流监测的智能增强测流方法、系统及其应用 - Google Patents
针对生态基流监测的智能增强测流方法、系统及其应用 Download PDFInfo
- Publication number
- CN116500296A CN116500296A CN202310479563.2A CN202310479563A CN116500296A CN 116500296 A CN116500296 A CN 116500296A CN 202310479563 A CN202310479563 A CN 202310479563A CN 116500296 A CN116500296 A CN 116500296A
- Authority
- CN
- China
- Prior art keywords
- decision tree
- flow
- bivariate
- adcp
- measurement method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 42
- 238000000691 measurement method Methods 0.000 title claims abstract description 24
- 238000003066 decision tree Methods 0.000 claims abstract description 68
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000002159 abnormal effect Effects 0.000 claims abstract description 17
- 230000005888 antibody-dependent cellular phagocytosis Effects 0.000 claims abstract 14
- 230000008569 process Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 15
- 238000005259 measurement Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 239000012530 fluid Substances 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000013138 pruning Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000007958 sleep Effects 0.000 claims description 2
- 230000002618 waking effect Effects 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000009434 installation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000010349 pulsation Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01P—MEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
- G01P5/00—Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft
- G01P5/24—Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft by measuring the direct influence of the streaming fluid on the properties of a detecting acoustical wave
- G01P5/241—Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft by measuring the direct influence of the streaming fluid on the properties of a detecting acoustical wave by using reflection of acoustical waves, i.e. Doppler-effect
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01P—MEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
- G01P13/00—Indicating or recording presence, absence, or direction, of movement
- G01P13/02—Indicating direction only, e.g. by weather vane
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01P—MEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
- G01P5/00—Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft
- G01P5/001—Full-field flow measurement, e.g. determining flow velocity and direction in a whole region at the same time, flow visualisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Aviation & Aerospace Engineering (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本申请提出了针对生态基流监测的智能增强测流方法、系统及其应用,包括以下步骤:S00、同时接入ADCP和点流速计;S10、通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;S20、对采集的数据进行异常值识别和处理,并直接向用户推送;其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。本申请可综合管理利用这些仪器设备,统一数据口径,加强数据处理能力,弥补单个设备测流能力的不足,扩大监测范围。
Description
技术领域
本申请涉及水文测量技术领域,特别是一种涉及针对生态基流监测的智能增强测流方法、系统及其应用。
背景技术
河道流域的供水、需水是一个动态平衡的过程。生态基流,是指维持河流基本形态和基本生态功能的河道内最小流量,又称最小生态流量(Minimum ecological Flow)或最小可接受流量(Minimum Acceptable Flow)。持续稳定的生态基流,在维持河道生物正常生长,促进河流水盐、水沙平衡,优化生态需水等方面均有着十分重大的意义。
不同的地区、时间、季节,河道的流量流速状态都是不同的。在实际的生态流量管控中,日常情况下河流往往保持一个正常的流速,而在流域较为干涸的时,会通过上游水库的水闸,释放持续不间断的小流量,以使得下游河道维持稳定的生态基流,因此,对河道流量的监测是至关重要的,通过河道流量的持续监控,有利于及时发现河道断流,流量减少等情况,避免生态环境问题的产生,实现流域生态的可持续发展,同时也有利于河流生态基流阈值的设定与调整,保证供水科学合理。
目前国内外的生态基流计算方法种类繁多,大多以水文学、水力学方法为主。“部分流速面积法”是传统水文流量测量最基本的理论,是目前国内外使用最为广泛的测流方法。基本思路:通过测算部分流速Vi和部分面积Ai,两者的乘积为通过该部分面积上的流量Qi,累计可求得全断面的流量Q=ΣQi。
而因为声学多普勒测流产品(ADCP)有着自动化程度高,实时性强的特点,目前被业内广泛使用,通过测量多位置多点流速,再依据相关水力学模型,推算得出河道平均流速。
ADCP从安装方式上可以分为两种,一种是垂线式,一种是岸边水平式。垂线式虽然可以准确,稳定地测量低、中、高流速,但其安装困难,成本大,也不利于日常维护。而水平式在选择合适的河道流场位置后,安装较为简单,维护方便,对于中、高流速流场,ADCP能较好地完成测量任务,但其不适合在低流速流场的场景下进行监测,一方面是由于自身设备的固有原因,其工作频率为300-1200khz。一方面是低流速下流场脉动因素影响会相对放大,造成流量流速杂乱无章,流速方向混乱,在对ADCP数据进行处理时难以确定流速方向。
因此,如何综合管理利用这些仪器设备,统一数据口径,加强数据处理能力,弥补单个设备测流能力的不足,扩大监测范围,是目前业内关注的问题。亟待针对生态基流监测的智能增强测流方法、系统及其应用,以解决现有技术存在的问题。
发明内容
本申请实施例提供了针对生态基流监测的智能增强测流方法、系统及其应用,针对目前技术存在的无法有效利用仪器设备、监测范围受限等问题。
本发明核心技术主要是采用终端控制器同时接入ADCP和点流速计,通过对流场状态的识别进行设备切换。在算法上,针对测流数据均为连续特征的特点,为增加模型训练的效率,提升流场识别准确度,我们采用了基于边界自动判定的双变量决策树算法,作为训练模型,将训练后模型植入终端控制器中,做到智能决策,实现不同流场场景下的设备自动切换;最后对采集上来的数据进行统一的异常值识别与处理,直接向用户推送,避免用户对数据进行进一步处理,减少使用难度。
第一方面,本申请提供了针对生态基流监测的智能增强测流方法,所述方法包括以下步骤:
S00、同时接入ADCP和点流速计;
S10、通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;
S20、对采集的数据进行异常值识别和处理,并直接向用户推送;
其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。
进一步地,S10步骤中,对流场状态的识别,并对ADCP和点流速计进行自动切换具体步骤为:
S11、判断是否为低流速流场;
S12、若是,则唤醒点流速计并调整ADCP的监测频率;若否,则使ADCP继续工作并使得点流速计休眠;
其中,中、高流速流场统称为非低流速流场。
进一步地,S10步骤中,通过对测试站点的ADCP数据进行收集,以训练基于边界自动判定的双变量决策树算法模型,并将该基于边界自动判定的双变量决策树算法模型存入遥测终端中,周期性判定ADCP数据是否为低流速流场。
进一步地,S10步骤中,基于边界自动判定的双变量决策树算法模型的训练步骤包括:
对ADCP数据进行降维处理;
基于Gini指数进行决策树构造;
通过阈值自动算法对ADCP数据中每一个特征的最优分割点进行计算,得到节点集合;
通过双变量划分算法组合分割点,并进行分类;
取Gini指数中的最小值作为最佳阈值。
进一步地,S10步骤中,双变量决策树构建中的双变量划分算法步骤为:
遍历节点集合组成变量对,并对每一个变量对拟合一个线性判别式;
基于判别边界进行样本划分,使用梯度下降法调整,计算Gini指数最小值,确定最优解。
进一步地,S20步骤中,通过基于预测的准确度来判定模型的优劣,并确定最佳的特征数量,同时以前剪枝的方式调整决策树的最大深度,直至准确度达到设定阈值,以完成决策树的优化。
进一步地,S30步骤中,通过箱体图法进行异常值识别和处理,并直接向用户推送。
第二方面,本申请提供了针对生态基流监测的智能增强测流系统,包括:
ADCP,用于测量流体速度分布;
点流速计,用于测量流体在特定点的流速和流向;
终端控制器,分别连接ADCP和点流速计;通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;对采集的数据进行异常值识别和处理,并直接向用户推送;
其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。
第三方面,本申请提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述的针对生态基流监测的智能增强测流方法。
第四方面,本申请提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据上述的针对生态基流监测的智能增强测流方法。
本发明的主要贡献和创新点如下:1、与现有技术相比,本申请通过智能切换ADCP和点流速计,组合测量能力互补的两个仪器设备,在终端上采用一种基于阈值自动选择的双变量决策树算法,做到对当前流场状态进行智能识别,从而下发设备工作指令,具有测量范围大(同时覆盖低、中、高流速范围内的测量需求),安装方便(基本上就是多了点流速计的安装,难度低),操作简单(自动处理,无需人工操作),数据可靠,成本低下的特点,能对需要进行生态监测的河道进行实时监测;
2、与现有技术相比,本申请针对不同流场状态下测量设备的最优选择不同的问题,采用了基于边界自动判定的双变量决策树算法来进行流场状态的识别,并实现设备的自动切换。这样可以提高流场识别准确度,提高数据的可靠性;
3、对测量数据进行异常值处理,自动处理成最终数据,提升数据质量的同时减少用户使用难度,数据可靠;组合设计的模式测量范围广,安装简单,维护方便,满足监测任务的同时成本低,可扩展性高,可以随着市场变化替换设备组合;根据当前流场状态下发哪台设备进行监测的指令,另外设备进入休眠从而节约能源。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的针对生态基流监测的智能增强测流方法的流程;
图2是本申请的场景识别技术路线图;
图3是原算法(CART算法)和本申请的阈值自动选择算法的对比图;
图4是本申请的双变量划分算法的示意图;
图5是现有技术单变量决策树的构建过程;
图6是本申请的双变量决策树的构建过程;
图7是本申请的决策树优化过程图;
图8是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
目前国内外的生态基流计算方法种类繁多,大多以水文学、水力学方法为主。“部分流速面积法”是传统水文流量测量最基本的理论,是目前国内外使用最为广泛的测流方法。而不同的流场状态下,使用的监测手段是不同的。通过对历史数据以及资料的分析,可将流场状态归类为表1:
表1
如此可认为低流速的流场需要同时满足以下两个特点,
1)流速小,一般认为小于0.2m/s。
2)流场脉动因素影响放大,流量流速的方向杂乱无章。
而目前测量流量流速等手段,基本上是ADCP或者点流速计。因此,如何综合管理利用这些仪器设备,统一数据口径,加强数据处理能力,弥补单个设备测流能力的不足,扩大监测范围,是目前业内关注的问题。
基于此,本发明基于边界自动判定的双变量决策树算法来解决现有技术存在的问题。
实施例一
本申请旨在提出一种针对生态基流监测的智能增强测流方法,具体地,参考图1,所述方法包括以下步骤:
S00、同时接入ADCP和点流速计;
S10、通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;
在本实施例中,由于负责接入ADCP和点流速计的遥测终端不适合存储太复杂的计算逻辑,因此需要一种简单高效的预测模块,而CART决策树正好满足该要求。
但是传统的CART决策树存在以下几个问题。
1)处理连续型变量的效率差。对于连续属性的特征首先进行排序,对每个节点进行计算,处理时间较长,而当前场景下测流数据均属于连续类型,因此在最优阈值的选择时,效率低下,也影响了预测的准确率。
2)忽视特征间的相关性。每个节点对应一个变量,导致树的深度较大。
因此,本申请采用一种阈值自动确认的方法实现连续型属性最佳分割点的判定,并将原有的单变量判断优化为双变量判断,考虑了特征之间的相关性,减少了树的深度的同时提高模型准确度。该模型十分适合连续型特征的分类问题,优化了阈值的选择,也大大减少了模型运行的时间,每个节点带有两个判断依据,最终通过一系列if/else的推导,实现当前环境是否为低流速流场的决策。
在该场景下使用该优化CART决策树有如下优点:
1)大大提高模型运行效率,加快决策树生成;
2)双变量决策模型提高了预测准确度;
3)计算复杂度不高,输出结果易于理解;
4)利用了特征间的相关性。
由于ADCP能较好地满足中、高流速的监测,故本申请设计时将中、高流速流场统称为非低流速流场,作为同一场景进行标记。即低流速流场标记为1,非低流速流场标记为0。
通过对测试站点的ADCP数据进行收集、训练,最终确定一个改进的决策树模型。将该模型存入遥测终端中,每间隔一定时间对ADCP数据进行识别以判断当前流场状态是否为低流速状态,若是,则激活点流速计进行流速监测(此时ADCP仍然参与监测。ADCP调整频率,隔一段时间再次采集数据,这次采集是为了再次判定是否是低流速流场,为下一次切换提供依据),否则采用ADCP,如图2所示。
具体地,本申请的决策树的训练包括以下几个步骤:
1.特征选择
ADCP数据主要为不同分层的流速数据,如果将所有分层数据全部当成特征维度(大于30个)进行训练,会造成维度过大,信息冗余。故在模型训练前,需要对原有数据进行降维处理。通过对已有数据的观察,本申请使用算法来构建出新的更具有代表性的特征来替代原有的高维特征。这样做有两个好处: 1):极大避免维度灾难问题。
2):去除一些不相关特征,针对我们的任务构建更为合适的特征。
原始特征如下:
流速:V001-V030(30维),回波强度(30维),水位。
新特征如下表2:
表2
2.决策树优化
2.1 CART决策树
决策树构造的过程,是一个递归选择最优特征的过程,根据该特征对训练数据进行划分,使得数据集得到一个最好的分类的过程。决策树中树的构造依据有多种,CART决策树的构造是基于Gini指数进行的。而Gini系数可以计算系统的混乱程度,该系数越高,数据集的混乱程度越高,即不纯度越高,建立决策树模型的过程就是不断降低Gini指数的过程,以达到好的分类效果。
Gini系数公式如下:
其中,Pi为类别i在数据集S中出现的概率,在本文中即低流速流场的样本占总样本个数的比例,以及非低流速流场的样本占总样本个数的比例。
当基于某个特征分类后,Gini系数公式为:
其中,S1、S2表示划分后的两类样本量,Gini(S1)、Gini(S2)为两类各自的Gini指数。
2.2阈值自动算法
在模型训练过程中,由于测流数据特征全是连续属性,CART算法首先要对这些连续属性进行离散化,例如:对平均流速特征的所有数据值(n个)进行升序排序,然后取相邻值的中值作为分割点,得到n-1个分割点,对每个分割点计算Gini指数,选择Gini指数最小值对应的分割点作为平均流速特征的最佳分割阈值。这样做在样本数量大,连续属性多时,模型训练的效率大大降低。
阈值选择基于平均类熵进行,用公式描述为:
min(E(A,T,S))
其中,T表示分割点,A为特征名,S为样本集,E为在特征A上划分样本集的平均类熵,也称平均信息量。该定理表明最优的阈值分割点总是处在不同类别的边界点,在分界点处样本集合的平均类熵刚好取到最小值。
故只需要计算不同类别的边界处的Gini指数就可以达到分类的效果,不需要计算所有分割点的Gini指数。因此,所属类别越少,效率提升越明显。在本文场景中,流场所属类别仅有2类,故效率可以大大提高。
熵以及平均类熵计算公式如下:
其中Pi表示样本集S中样本属于类1的概率,S1表示样本集S在特征A上取值小于等于T的子集,S2表示大于T的子集。
如图3所示,显而易见,阈值自动选择算法相比原算法更加简单高效。
其中,熵是信息论中的概念,表示一个随机变量的不确定性,可以用来衡量一个样本集合的纯度或混乱程度。平均类熵是指在给定某个特征的条件下,样本集合中每个类别出现的概率加权平均所得到的熵值,用来衡量某个特征对于样本分类的重要性。
在模型训练过程中,通过计算不同分割点对应的熵或平均类熵,可以找到最优的分割点来进行数据离散化,将连续属性转化为离散属性。这样做的目的是简化模型的计算和理解,提高模型的准确性和可解释性。同时,熵或平均类熵的值越小,说明样本集合的纯度越高,分类效果越好。
2.3双变量划分算法
如图4所示,使用阈值自动选择算法对每一个特征的最优分割点进行计算,得到节点集合,遍历节点集合组成变量对/>,对每一个变量对拟合一个线性判别式,判别边界为/>。基于判别边界进行样本划分,使用梯度下降法调整u值,计算Gini指数最小值,确定最优解。
本申请的基于阈值自动选择算法优化决策树,对单变量决策树和双变量决策树分别进行效果评估,数据集数量如下表3所示,实验成果如下表4所示,其中如图5为单变量决策树构建过程,如图6为本申请的双变量决策树构建过程,图中圆圈为分类特征,方块为分类样本。
表3
表4
可见,使用阈值自动选择算法后模型训练的效率大幅度提升,预测准确率也得到了提升,而双变量决策树算法训练耗时略高于单变量决策树,但准确率得到明显提升,综合考虑,目前优化后的双变量决策树更适合在当前流场判定的场景中使用。
3.决策树优化
如图7所示,在决策树的构造过程中,影响模型效果主要有树的最大深度,参与决策的特征数量等参数,本申请基于预测的准确度这一参数来判断模型的优劣,确定最佳的特征数量,同时以前剪枝的方式调整树的最大深度。
最终,根据历史数据集训练得到针对低流速流场场景识别的决策树模型,目前,树的最大深度为5,特征数量为4时,模型的泛化能力最好,预测准确度为95%。可以完成对当前监测位置流场状态进行识别的任务,从而对不同监测设备下达是否工作的指令。
其中,前剪枝(pre-pruning)是指在构建决策树时,在决策树生成过程中进行剪枝操作,以避免出现过拟合的情况。具体而言,前剪枝是在决策树的构建过程中,在每次对节点进行划分前,先对当前节点的子树进行估计,如果划分后无法带来预期的性能提升,就停止划分,将当前节点设为叶节点,该过程称为提前终止。前剪枝可以减少决策树的复杂度,避免决策树在训练集上过拟合,从而提高模型的泛化能力。
S20、对采集的数据进行异常值识别和处理,并直接向用户推送。
在本实施例中,为了减少用户的数据使用难度,本申请对数据进行了异常值的识别与优化处理,采用的方法为箱体图法,最后对合成数据以一定的时间间隔发送至用户端。
优选地,下面是一种通过箱体图法(现有技术)处理后直接推送给用户的具体步骤:
S21、对采集到的流速数据进行预处理,包括去除空值、异常值等处理;
S22、使用箱体图法对处理后的流速数据进行可视化,绘制出箱体图;
S23、在箱体图中,确定中位数、四分位数、最大值和最小值等统计指标,并将其展示给用户;
S24、根据箱体图的特征,判断数据分布的偏态和离散程度,以及是否存在异常值和离群点等问题,将分析结果展示给用户;
S25、根据箱体图分析的结果,提供相应的建议和措施,帮助用户进一步了解数据的情况,以及采取适当的措施来处理数据。
如此通过箱体图法处理后,可以直观地展示数据的分布情况和异常情况,帮助用户更好地了解数据,提高数据处理和分析的效率和准确性。同时,将处理结果直接推送给用户,也能够减少用户在数据处理上的工作量和难度。
实施例二
基于相同的构思,本申请还提出了针对生态基流监测的智能增强测流系统,包括:
ADCP,用于测量流体速度分布;
点流速计,用于测量流体在特定点的流速和流向;
终端控制器,分别连接ADCP和点流速计;通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;对采集的数据进行异常值识别和处理,并直接向用户推送;
其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。
实施例三
本实施例还提供了一种电子装置,参考图8,包括存储器404和处理器402,该存储器404中存储有计算机程序,该处理器402被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
具体地,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器404可以包括用于数据或指令的大容量存储器404。举例来说而非限制,存储器404可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器404可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器404可在数据处理装置的内部或外部。在特定实施例中,存储器404是非易失性(Non-Volatile)存储器。在特定实施例中,存储器404包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-OnlyMemory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-AccessMemory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器404(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccessMemory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamicRandom-AccessMemory,简称SDRAM)等。
存储器404可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器402所执行的可能的计算机程序指令。
处理器402通过读取并执行存储器404中存储的计算机程序指令,以实现上述实施例中的任意针对生态基流监测的智能增强测流方法。
可选地,上述电子装置还可以包括传输设备406以及输入输出设备408,其中,该传输设备406和上述处理器402连接,该输入输出设备408和上述处理器402连接。
传输设备406可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备406可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备408用于输入或输出信息。在本实施例中,输入的信息可以是测量指令等,输出的信息可以是处理后的数据等。
实施例四
本实施例还提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据实施例一的针对生态基流监测的智能增强测流方法。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如DVD及其数据变体、CD等光学介质上。物理介质是非瞬态介质。
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以作出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.针对生态基流监测的智能增强测流方法,其特征在于,包括以下步骤:
S00、同时接入ADCP和点流速计;
S10、通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;
S20、对采集的数据进行异常值识别和处理,并直接向用户推送;
其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。
2.如权利要求1所述的针对生态基流监测的智能增强测流方法,其特征在于,S10步骤中,对流场状态的识别,并对ADCP和点流速计进行自动切换具体步骤为:
S11、判断是否为低流速流场;
S12、若是,则唤醒所述点流速计并调整所述ADCP的监测频率;若否,则使所述ADCP继续工作并使得所述点流速计休眠;
其中,中、高流速流场统称为非低流速流场。
3.如权利要求1所述的针对生态基流监测的智能增强测流方法,其特征在于,S10步骤中,通过对测试站点的ADCP数据进行收集,以训练基于边界自动判定的双变量决策树算法模型,并将该基于边界自动判定的双变量决策树算法模型存入遥测终端中,周期性判定所述ADCP数据是否为低流速流场。
4.如权利要求3所述的针对生态基流监测的智能增强测流方法,其特征在于,S10步骤中,所述基于边界自动判定的双变量决策树算法模型的训练步骤包括:
对所述ADCP数据进行降维处理;
基于Gini指数进行决策树构造;
通过阈值自动算法对ADCP数据中每一个特征的最优分割点进行计算,得到节点集合;
通过双变量划分算法组合分割点,并进行分类;
取Gini指数中的最小值作为最佳阈值。
5.如权利要求4所述的针对生态基流监测的智能增强测流方法,其特征在于,S10步骤中,双变量决策树构建中的双变量划分算法步骤为:
遍历节点集合组成变量对,并对每一个变量对拟合一个线性判别式;
基于判别边界进行样本划分,使用梯度下降法调整,计算Gini指数最小值,确定最优解。
6.如权利要求1-5任一项所述的针对生态基流监测的智能增强测流方法,其特征在于,S20步骤中,通过基于预测的准确度来判定模型的优劣,并确定最佳的特征数量,同时以前剪枝的方式调整决策树的最大深度,直至准确度达到设定阈值,以完成决策树的优化。
7.如权利要求1-5任一项所述的针对生态基流监测的智能增强测流方法,其特征在于,S30步骤中,通过箱体图法进行异常值识别和处理,并直接向用户推送。
8.针对生态基流监测的智能增强测流系统,其特征在于,包括:
ADCP,用于测量流体速度分布;
点流速计,用于测量流体在特定点的流速和流向;
终端控制器,分别连接所述ADCP和所述点流速计;通过基于边界自动判定的双变量决策树算法模型对流场状态的识别,并对ADCP和点流速计进行自动切换;对采集的数据进行异常值识别和处理,并直接向用户推送;
其中,该基于边界自动判定的双变量决策树算法模型融合使用了阈值自动选择算法和双变量决策树构建。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7任一项所述的针对生态基流监测的智能增强测流方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1至7任一项所述的针对生态基流监测的智能增强测流方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310479563.2A CN116500296B (zh) | 2023-04-28 | 2023-04-28 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310479563.2A CN116500296B (zh) | 2023-04-28 | 2023-04-28 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116500296A true CN116500296A (zh) | 2023-07-28 |
CN116500296B CN116500296B (zh) | 2023-11-17 |
Family
ID=87326140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310479563.2A Active CN116500296B (zh) | 2023-04-28 | 2023-04-28 | 针对生态基流监测的智能增强测流方法、系统及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116500296B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117388521A (zh) * | 2023-12-13 | 2024-01-12 | 华海智汇技术有限公司 | 一种水利无人机测流方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200090285A1 (en) * | 2018-03-16 | 2020-03-19 | Dalian University Of Technology | Method for short-term generation scheduling of cascade hydropower plants coupling cluster analysis and decision tree |
CN111445080A (zh) * | 2020-04-01 | 2020-07-24 | 中电万维信息技术有限责任公司 | 一种基于随机森林的西北内陆河生态基流预测方法 |
CN113406354A (zh) * | 2021-06-21 | 2021-09-17 | 湖南国天电子科技有限公司 | 一种用于adcp的数据优化方法及系统 |
CN113468821A (zh) * | 2021-07-22 | 2021-10-01 | 郑州大学 | 一种基于决策回归算法的坡面产流产沙阈值确定方法 |
US20220128358A1 (en) * | 2020-10-26 | 2022-04-28 | Burak Ozer | Smart Sensor Based System and Method for Automatic Measurement of Water Level and Water Flow Velocity and Prediction |
CN115659268A (zh) * | 2022-12-28 | 2023-01-31 | 杭州开闳流体科技有限公司 | 基于adcp测流数据的场景识别方法及其应用 |
CN115907236A (zh) * | 2023-02-17 | 2023-04-04 | 西南石油大学 | 基于改进决策树的井下复杂情况预测方法 |
-
2023
- 2023-04-28 CN CN202310479563.2A patent/CN116500296B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200090285A1 (en) * | 2018-03-16 | 2020-03-19 | Dalian University Of Technology | Method for short-term generation scheduling of cascade hydropower plants coupling cluster analysis and decision tree |
CN111445080A (zh) * | 2020-04-01 | 2020-07-24 | 中电万维信息技术有限责任公司 | 一种基于随机森林的西北内陆河生态基流预测方法 |
US20220128358A1 (en) * | 2020-10-26 | 2022-04-28 | Burak Ozer | Smart Sensor Based System and Method for Automatic Measurement of Water Level and Water Flow Velocity and Prediction |
CN113406354A (zh) * | 2021-06-21 | 2021-09-17 | 湖南国天电子科技有限公司 | 一种用于adcp的数据优化方法及系统 |
CN113468821A (zh) * | 2021-07-22 | 2021-10-01 | 郑州大学 | 一种基于决策回归算法的坡面产流产沙阈值确定方法 |
CN115659268A (zh) * | 2022-12-28 | 2023-01-31 | 杭州开闳流体科技有限公司 | 基于adcp测流数据的场景识别方法及其应用 |
CN115907236A (zh) * | 2023-02-17 | 2023-04-04 | 西南石油大学 | 基于改进决策树的井下复杂情况预测方法 |
Non-Patent Citations (2)
Title |
---|
刘铁龙 等: "考虑径流年内均匀度的生态流量计算方法研究", 《西安理工大学学报》, vol. 36, no. 2, pages 188 - 196 * |
赵文秀 等: "基于随机森林和RBF 神经网络的长期径流预报", 《人民黄河》, vol. 37, no. 2, pages 10 - 12 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117388521A (zh) * | 2023-12-13 | 2024-01-12 | 华海智汇技术有限公司 | 一种水利无人机测流方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116500296B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | When weather matters: IoT-based electrical load forecasting for smart grid | |
CN101976842B (zh) | 基于电气分区的关键断面自动获取方法 | |
CN116500296B (zh) | 针对生态基流监测的智能增强测流方法、系统及其应用 | |
CN116646933A (zh) | 一种基于大数据的电力负荷调度方法及系统 | |
CN102945320A (zh) | 一种时间序列数据异常检测方法与装置 | |
Qin et al. | Hydrological time series anomaly pattern detection based on isolation forest | |
CN106529732A (zh) | 基于神经网络与随机前沿分析的碳排放效率预测方法 | |
CN103742901A (zh) | 一种循环流化床机组耗差分析优化目标值体系的确定方法 | |
CN117236199B (zh) | 城市水网区域河湖水质提升与水安全保障方法及系统 | |
CN116578890B (zh) | 基于数字孪生的智能工厂数据优化采集方法 | |
CN106980874B (zh) | 一种面向配网大数据的多时态维度数据融合方法 | |
CN114997044A (zh) | 一种用于中央空调的能耗优化方法及数据采集系统 | |
CN116148753A (zh) | 一种智能电能表运行误差监测系统 | |
CN111735177B (zh) | 一种基于svr算法的中央空调系统冷负荷预测方法 | |
CN116992385B (zh) | 一种物联网水表用量异常检测方法及系统 | |
CN110837933A (zh) | 基于神经网络的漏损识别方法、装置、设备及存储介质 | |
Yin et al. | Dynamic real–time abnormal energy consumption detection and energy efficiency optimization analysis considering uncertainty | |
CN109299853B (zh) | 一种基于联合概率分布的水库调度函数提取方法 | |
CN111612331A (zh) | 基于土壤水势的模糊智能植物生长监控系统及控制目标阈值获取方法 | |
CN112836860A (zh) | 确定压裂井产量递减阶段全周期内动态产量方法、系统 | |
Rahu et al. | IoT and machine learning solutions for monitoring agricultural water quality: a robust framework | |
CN103294847A (zh) | 基于水力平差的供水管网模型模糊辨识方法 | |
CN111473480A (zh) | 一种基于决策树分类的中央空调节能控制方法 | |
CN111339155A (zh) | 一种关联分析系统 | |
CN107316130A (zh) | 一种基于聚类分析的计量采集终端故障诊断和可视化定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |