CN114565065B - 一种水文序列数据异常值检测方法 - Google Patents

一种水文序列数据异常值检测方法 Download PDF

Info

Publication number
CN114565065B
CN114565065B CN202210465324.7A CN202210465324A CN114565065B CN 114565065 B CN114565065 B CN 114565065B CN 202210465324 A CN202210465324 A CN 202210465324A CN 114565065 B CN114565065 B CN 114565065B
Authority
CN
China
Prior art keywords
data
water level
monthly
abnormal
month
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210465324.7A
Other languages
English (en)
Other versions
CN114565065A (zh
Inventor
李珏
邹冰玉
陈雅莉
高露雄
阳华芳
高军
李琦
陈薇薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bureau of Hydrology Changjiang Water Resources Commission
Original Assignee
Bureau of Hydrology Changjiang Water Resources Commission
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bureau of Hydrology Changjiang Water Resources Commission filed Critical Bureau of Hydrology Changjiang Water Resources Commission
Priority to CN202210465324.7A priority Critical patent/CN114565065B/zh
Publication of CN114565065A publication Critical patent/CN114565065A/zh
Application granted granted Critical
Publication of CN114565065B publication Critical patent/CN114565065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Control Of Eletrric Generators (AREA)

Abstract

本发明提供一种水文序列数据异常值检测方法,包括构建cart决策树,异常检测与决策树更新;从海量汇交数据中,基于Cart决策树自动准确检测到数据异常,减轻数据审核人员工作量,迅速定位数据错误和发生异常水文事件的情况;提高汇交数据质量和权威性,减少数据异常和反复修改对后续分析运用造成的影响。

Description

一种水文序列数据异常值检测方法
技术领域
本发明涉及水文检测领域,尤其涉及一种水文序列数据异常值检测方法。
背景技术
随着经济社会的快速发展,水资源问题和供需矛盾越来越突出,水资源管理能力与管理目标之间存在较大差距,与生态文明建设和高质量发展的要求不相适应。为提高水资源管理能力,水文部门要求实现水位、流量数据的“日清月结”,并按月进行全国水文数据的报送汇集,为水资源管理提供必要的数据支持。逐月进行的数据报送,必须以经过审核校验为前提,以保证数据的可用性。由于每月水文数据量大,工作时间紧张,人工审核容易疲惫,出现遗漏,审核有时无法深入到数据内部质量,导致在后续数据的分析使用过程中,发现数据有误再重新校核,而此时已发布的错误数据已经无法撤回。
发明内容
本发明的目的在于针对上述现有技术的不足,提供了一种水文序列数据异常值检测方法,辅助校核人员快速定位异常数据和异常情况,对于数据错误的,进行更正,对于确实发生异常现象的,进行说明。
为实现上述目的,本发明采用了如下技术方案:
本发明提供了一种水文序列数据异常值检测方法,包括以下步骤:S1、构建cart决策树,包括:
S11、引入冗余数据的样本选择;
cart决策树构建的最终样本的选择为过往逐月报送的所有数据,以测站为单位,一个测站在一个月报送的数据为一个样本,最初报送的数据,为原始样本集;
经过后续审核、分析使用过程中,修改过的数据为标准样本集;
通过对比,标记出所述原始样本集中的异常样本;
S12、基于水文序列数据特性的特征选择;
S13、基于基尼系数的阈值选择;
S14、一站一树预剪枝;
进行基于先验知识的预剪枝,所述预剪枝用先验知识,判断采用某个特征的必要性,在阈值选择过程中,将对于单个测站而言无意的特征直接去除,不参与阈值选择,并利用预剪枝后的特征最终形成所述测站的最优决策树;
S2、异常检测与决策树更新;
形成的决策树用来进行新数据的异常检测,根据检测结果,能定位异常数据的位置,根据分类器的类型,定位数据的异常类型,以便有效辅助人工校核;
对于数据错误的,进行更正;
对于发生异常的水文情况,进行说明,便于后续数据分析。
进一步,所述S12中,所述特征包括:
水位特征:
(1)、日均水位
Figure 357356DEST_PATH_IMAGE001
Figure 735379DEST_PATH_IMAGE002
是否等于当月天数;
(2)、水位月特征值是否齐全;
(3)当月的日均水位数据是否满足
Figure 712562DEST_PATH_IMAGE003
,其中,
Figure 108908DEST_PATH_IMAGE004
为填报的月最低水位,
Figure 513345DEST_PATH_IMAGE005
为填报的月最高水位;
(4)当月的日水位数据是否满足
Figure 627931DEST_PATH_IMAGE006
,其中,
Figure 392494DEST_PATH_IMAGE007
为为当月日均水位计算的月均值,
Figure 643346DEST_PATH_IMAGE008
为填报的月均水位,
Figure 484264DEST_PATH_IMAGE009
为接受的月均水位误差范围;
(5)当月水位数据是否满足
Figure 820567DEST_PATH_IMAGE010
,其中,
Figure 405132DEST_PATH_IMAGE011
为历史同期最低水位,
Figure 510491DEST_PATH_IMAGE012
为接受的差异范围,
Figure 273042DEST_PATH_IMAGE013
(6)、当月水位数据是否满足
Figure 831062DEST_PATH_IMAGE014
,其中,
Figure 219318DEST_PATH_IMAGE015
为历史同期最高水位,
Figure 179184DEST_PATH_IMAGE016
为接受的差异范围,
Figure 96325DEST_PATH_IMAGE017
(7)、当月水位数据开头与上月水位数据的结尾,为水位数据接头处,所述水位数据接头处是否形成平滑曲线,即水位斜率的变化情况为:
设上月数据的水位日均值
Figure 919137DEST_PATH_IMAGE018
则所述水位数据接头处的数据取
Figure 845505DEST_PATH_IMAGE019
Figure 659877DEST_PATH_IMAGE020
Figure 13498DEST_PATH_IMAGE021
Figure 546111DEST_PATH_IMAGE022
Figure 276169DEST_PATH_IMAGE023
Figure 695780DEST_PATH_IMAGE024
,计算所述水位斜率的变化是否较大,则所述水位斜率的方差为:
Figure 220303DEST_PATH_IMAGE025
Figure 505791DEST_PATH_IMAGE026
Figure 773961DEST_PATH_IMAGE027
Figure 562925DEST_PATH_IMAGE028
为方差接受的范围;
流量特征:
(8)、日均流量
Figure 258349DEST_PATH_IMAGE029
Figure 14821DEST_PATH_IMAGE030
是否等于当月天数;
(9)、流量月特征值是否齐全;
(10)当月流量数据是否满足
Figure 86682DEST_PATH_IMAGE031
,其中
Figure 261312DEST_PATH_IMAGE032
为填报的月最小流量,
Figure 143948DEST_PATH_IMAGE033
为填报的月最大流量;
(11)当月流量数据是否满足
Figure 138449DEST_PATH_IMAGE034
,其中
Figure 482843DEST_PATH_IMAGE035
为当月日均流量计算的月均值,
Figure 511979DEST_PATH_IMAGE036
为填报的月均流量,
Figure 549205DEST_PATH_IMAGE037
为接受的月均流量误差范围;
(12)、当月流量数据是否满足
Figure 31002DEST_PATH_IMAGE038
,其中,
Figure 696863DEST_PATH_IMAGE039
为历史同期最小流量,
Figure 580505DEST_PATH_IMAGE040
为接受的差异范围,
Figure 788633DEST_PATH_IMAGE041
(13)、当月流程数据是否满足
Figure 757726DEST_PATH_IMAGE042
,其中,
Figure 443922DEST_PATH_IMAGE043
为历史同期最大流量,
Figure 932803DEST_PATH_IMAGE044
为接受的差异范围,
Figure 311832DEST_PATH_IMAGE045
进一步,根据所述特征的选择,所述(1)~所述(3)及所述(8)~所述(10)的判定只有是否;
如果满足,则为无异常样本;
如果不满足,则为异常样本。
进一步,根据所述特征的选择,所述(4)~所述(7)至所述(11)~所述(13)的判定,需要选择阈值判定,样本
Figure 502642DEST_PATH_IMAGE046
的基尼系数表达式为:
Figure 258108DEST_PATH_IMAGE047
其中,
Figure 850763DEST_PATH_IMAGE048
为无异常类的数量;
Figure 915540DEST_PATH_IMAGE049
为异常类的数量,
Figure 859226DEST_PATH_IMAGE050
为样本数;
特征
Figure 887224DEST_PATH_IMAGE051
Figure 599966DEST_PATH_IMAGE052
Figure 586376DEST_PATH_IMAGE053
分成
Figure 768090DEST_PATH_IMAGE054
Figure 865359DEST_PATH_IMAGE055
,则在所述特征
Figure 167027DEST_PATH_IMAGE056
的条件下;所述样本
Figure 324339DEST_PATH_IMAGE057
的基尼系数表达式为:
Figure 512392DEST_PATH_IMAGE058
其中,
Figure 882193DEST_PATH_IMAGE059
取值越大,所述样本
Figure 303947DEST_PATH_IMAGE060
的不确定性也越大,且,需要选择满足
Figure 366581DEST_PATH_IMAGE061
取最小值的
Figure 506576DEST_PATH_IMAGE062
作为阈值;
依次将
Figure 945647DEST_PATH_IMAGE063
Figure 769378DEST_PATH_IMAGE064
Figure 268492DEST_PATH_IMAGE065
Figure 895783DEST_PATH_IMAGE066
Figure 122234DEST_PATH_IMAGE067
Figure 784159DEST_PATH_IMAGE068
Figure 454175DEST_PATH_IMAGE069
带入所述特征
Figure 568761DEST_PATH_IMAGE070
,即能求出各特征的阈值,
Figure 84056DEST_PATH_IMAGE071
中,历史数据长度不超过五年的不参与阈值选择,
其中,
Figure 351221DEST_PATH_IMAGE072
最小取1,
Figure 926559DEST_PATH_IMAGE073
最小取0,最大值取当前样本能算出的最大值。
进一步,所述S14中的所述先验知识包括:
S141、新建测站无长序列历史数据,所述历史数据无法作为决策依据,即建成五年以内的测站,不需要与历史特征值有关的特征;
S142、测站只监测水位时,不需要与流量相关的所有特征;
S143、测站只监测流量时,不需要与水位相关的所有特征;
S144、测站为汛期站时,非汛期无数据,不需要做任何异常检测。
进一步,所述S2中,为辅助人工校核,根据所述异常类型和偏离程度,依照异常概率由大到小排列数据,所述异常概率由大到小依次为:
S21、当月报送数据缺失,一定异常,对应特征所述(1)、(2)、(8)、(9);
S22、当月报送数据自相矛盾,偏离值越大,异常概率越大,对应特征所述(3)、(4)、(10)、(11);
S23、当月报送数据与历史特征值相矛盾,偏离值越大,异常概率越大,对应特征所述(5)(6)、(12)、(13);
S24、所述水位数据接头处的曲线不平滑,曲率方差越大,异常概率越大,对应特征所述(7)。
进一步,设置所述
Figure 528441DEST_PATH_IMAGE074
Figure 847427DEST_PATH_IMAGE075
Figure 218366DEST_PATH_IMAGE076
Figure 482381DEST_PATH_IMAGE077
四个特征的缓冲区:
当特征值小于等于1时,判定为无异常;大于等于利用最小所述基尼系数选定阈值时,为极度异常;
当特征值大于1且小于选定阈值时,为疑似异常,所述疑似异常的部分为缓冲区。
进一步,所述月报送数据包括日均水位、日均流量、月均水位、月均流量、月最高水位、月最低水位、月最大流量、月最小流量和月径流量。
本发明的有益效果为:从海量汇交数据中,基于Cart决策树自动准确检测到数据异常,减轻数据审核人员工作量,迅速定位数据错误和发生异常水文事件的情况;
提高汇交数据质量和权威性,减少数据异常和反复修改对后续分析运用造成的影响者通过在线系统全程进行线上流程监控和线下监测监控,使整个水文监测流程可控。
附图说明
图1 为本发明cart决策树模型建模过程。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
请参阅图1,一种水文序列数据异常值检测方法,包括以下步骤:
S1、构建cart(分类与回归树)决策树,包括:
S11、引入冗余数据的样本选择;
其中,根据系统数据要送要求可知,各地重要水文站必须按月、按年将水位、流量整编数据通过系统进行报送,按月报送当月水文序列数据,包括:日均水位、日均流量、月均水位、月均流量、月最高水位、月最低水位、月最大流量、月最小流量、月径流量。同时各水文站还报送了历史特征值用于分析。
各月汇集的数据类型很多,但实质上,所有的数据均来源于日均水位和日均流量,因此一般而言,只需要汇交日均值,即可计算出其他的所有数据。但是仅汇集日均值的做法,将导致无冗余数据,一旦日均值中存在异常,没有任何数据可用于辅助检测异常,导致后续月特征值和年特征值的数据可能全部出错。因此在汇集过程中,上述数据全部要求汇交,在选择样本时,要将上述数据全部纳入,通过冗余数据进行相互检验。
cart决策树构建的最终样本的选择为过往所有报送的月任数据,以测站为单位,一个测站在一个与月报送的数据为一个样本,最初报送的数据,为原始样本集;
经过后续审核、分析使用过程中,修改过的数据为标准样本集;
通过对比,标记出所述原始样本集中的异常样本;
S12、基于水文序列数据特性的特征选择;
S13、基于基尼系数的阈值选择;
S14、一站一树预剪枝;
由于各测站的水文特征和数据状况不同,可用作数据异常检测的依据可能不同,造成这个情况的主要原因包括:水文特性是否稳定,数据序列是否足够长,是否具备全年水文监测的条件。因此,预剪枝遵循一站一树的原则。
进行基于先验知识的预剪枝,所述预剪枝用先验知识,判断采用某个特征的必要性,在阈值选择过程中,将对于单个测站而言无意的特征直接去除,不参与阈值选择,并利用预剪枝后的特征最终形成该测站的最优决策树;
其中,CART是在给定输入随机变量X的条件下输出随机变量Y的条件概率分布的学习方法,CART决策树二分每个特征,最终得到决策树,通过不断的划分,将特征空间划分为有限个单元,并在这些单元上确定预测的概率分布。
S2、异常检测与决策树更新;
形成的决策树用来进行新数据的异常检测,根据检测结果,能定位异常数据的位置,根据分类器的类型,定位数据的异常类型,以便有效辅助人工校核;
对于数据错误的,进行更正;
对于发生异常的水文情况,进行说明,便于后续数据分析。
其中,分析当前常常导致数据异常的原因,我们发现主要异常原因包括:
①数据报送中误把其他数据当成目标数据进行报送;
②数据整理过程中,偶尔将几个数据报漏了或报错了;
③月、年统计值计算错误;
④基面发生变化未及时修改基面进行数据转换;
⑤因水工程影响导致停测;
⑥发生罕见旱情或汛情。
针对上述原因,总结可用于构建决策树的所述S12中,所述特征包括:
水位特征:
(1)、日均水位
Figure 40402DEST_PATH_IMAGE078
Figure 163078DEST_PATH_IMAGE079
是否等于当月天数;
(2)、水位月特征值是否齐全;
(3)当月的日均水位数据是否满足
Figure 388523DEST_PATH_IMAGE080
,其中,
Figure 305664DEST_PATH_IMAGE081
为填报的月最低水位,
Figure 898450DEST_PATH_IMAGE082
为填报的月最高水位;
(4)当月的日水位数据是否满足
Figure 824818DEST_PATH_IMAGE083
,其中,
Figure 904769DEST_PATH_IMAGE084
为为当月日均水位计算的月均值,
Figure 38816DEST_PATH_IMAGE085
为填报的月均水位,
Figure 571429DEST_PATH_IMAGE086
为接受的月均水位误差范围;
(5)当月水位数据是否满足
Figure 35908DEST_PATH_IMAGE087
,其中,
Figure 235945DEST_PATH_IMAGE088
为历史同期最低水位,
Figure 26047DEST_PATH_IMAGE089
为接受的差异范围,
Figure 531109DEST_PATH_IMAGE090
(6)、当月水位数据是否满足
Figure 64858DEST_PATH_IMAGE091
,其中,
Figure 853823DEST_PATH_IMAGE092
为历史同期最高水位,
Figure 283667DEST_PATH_IMAGE093
为接受的差异范围,
Figure 56451DEST_PATH_IMAGE094
(7)、当月水位数据开头与上月水位数据的结尾,为水位数据接头处,所述水位数据接头处是否形成平滑曲线,即水位斜率的变化情况为:
设上月数据的水位日均值
Figure 862733DEST_PATH_IMAGE095
则所述水位数据接头处的数据取
Figure 18121DEST_PATH_IMAGE096
Figure 884446DEST_PATH_IMAGE097
Figure 878947DEST_PATH_IMAGE098
Figure 488919DEST_PATH_IMAGE099
Figure 252476DEST_PATH_IMAGE100
Figure 40435DEST_PATH_IMAGE101
,计算所述水位斜率的变化是否较大,则所述水位斜率的方差为:
Figure 522232DEST_PATH_IMAGE102
Figure 935895DEST_PATH_IMAGE103
Figure 819538DEST_PATH_IMAGE104
Figure 762086DEST_PATH_IMAGE105
为方差接受的范围;
流量特征:
(8)、日均流量
Figure 980447DEST_PATH_IMAGE106
Figure 932222DEST_PATH_IMAGE079
是否等于当月天数;
(9)、流量月特征值是否齐全;
(10)当月流量数据是否满足
Figure 404792DEST_PATH_IMAGE107
,其中
Figure 49400DEST_PATH_IMAGE108
为填报的月最小流量,
Figure 240210DEST_PATH_IMAGE109
为填报的月最大流量;
(11)当月流量数据是否满足
Figure 995676DEST_PATH_IMAGE110
,其中
Figure 339064DEST_PATH_IMAGE111
为当月日均流量计算的月均值,
Figure 888994DEST_PATH_IMAGE112
为填报的月均流量,
Figure 567100DEST_PATH_IMAGE113
为接受的月均流量误差范围;
(12)、当月流量数据是否满足
Figure 860678DEST_PATH_IMAGE114
,其中,
Figure 307840DEST_PATH_IMAGE115
为历史同期最小流量,
Figure 294250DEST_PATH_IMAGE116
为接受的差异范围,
Figure 711850DEST_PATH_IMAGE117
(13)、当月流程数据是否满足
Figure 809119DEST_PATH_IMAGE118
,其中,
Figure 173104DEST_PATH_IMAGE119
为历史同期最大流量,
Figure 815569DEST_PATH_IMAGE120
为接受的差异范围,
Figure 468267DEST_PATH_IMAGE121
根据所述特征的选择,所述(1)~所述(3)及所述(8)~所述(10)的判定只有是否;
如果满足,则为无异常样本;
如果不满足,则为异常样本。
根据所述特征的选择,所述(4)~所述(7)至所述(11)~所述(13)的判定,需要选择阈值判定,样本
Figure 103648DEST_PATH_IMAGE122
基尼系数表达式为:
Figure 525402DEST_PATH_IMAGE123
其中,
Figure 853615DEST_PATH_IMAGE124
为无异常类的数量;
Figure 728030DEST_PATH_IMAGE125
为异常类的数量,
Figure 150790DEST_PATH_IMAGE126
为样本数;
特征
Figure 692630DEST_PATH_IMAGE127
Figure 926165DEST_PATH_IMAGE128
Figure 287876DEST_PATH_IMAGE129
分成
Figure 530639DEST_PATH_IMAGE130
Figure 926985DEST_PATH_IMAGE131
,则在所述特征
Figure 347733DEST_PATH_IMAGE132
的条件下;所述样本
Figure 931161DEST_PATH_IMAGE133
的基尼系数表达式为:
Figure 977615DEST_PATH_IMAGE134
其中,
Figure 228468DEST_PATH_IMAGE135
取值越大,所述样本
Figure 69385DEST_PATH_IMAGE136
的不确定性也越大,且,需要选择满足
Figure 386447DEST_PATH_IMAGE135
取最小值的
Figure 971012DEST_PATH_IMAGE137
作为阈值;
依次将
Figure 76371DEST_PATH_IMAGE138
带入所述特征
Figure 88189DEST_PATH_IMAGE139
,即能求出各特征的阈值,
Figure 911789DEST_PATH_IMAGE140
中,历史数据长度不超过五年的不参与阈值选择,
其中,
Figure 785198DEST_PATH_IMAGE141
最小取1,
Figure 10643DEST_PATH_IMAGE142
最小取0,最大值取当前样本能算出的最大值。
其中,对于较为极端的情况,样本中暂不存在异常样本时,则直接取特征中的最大值最为阈值,待后续出现异常样本后,通过不断训练,获得当前最优阈值。
所述14中的所述先验知识包括:
S141、新建测站无长序列历史数据,所述历史数据无法作为决策依据,即建成五年以内的测站,不需要与历史特征值有关的特征;
S142、测站只监测水位时,不需要与流量相关的所有特征;
S143、测站只监测流量时,不需要与水位相关的所有特征;
S144、测站为汛期站时,非汛期无数据,不需要做任何异常检测。
所述S2中,为辅助人工校核,根据所述异常类型和偏离程度,依照异常概率由大到小排列数据,所述异常概率由大到小依次为:
S21、当月报送数据缺失,一定异常,对应特征所述(1)、(2)、(8)、(9);
S22、当月报送数据自相矛盾,偏离值越大,异常概率越大,对应特征所述(3)、(4)、(10)、(11);
S23、当月报送数据与历史特征值相矛盾,偏离值越大,异常概率越大,对应特征所述(5)(6)、(12)、(13);
S24、所述水位数据接头处的曲线不平滑,曲率方差越大,异常概率越大,对应特征所述(7)。
其中,对于S23,当
Figure 193363DEST_PATH_IMAGE143
取1时,能保证被检测为无异常的数据实际确实无异常的概率最高;
但是被检测为异常的数据实际确实异常的概率则最低,被检测为异常的数据远多于实际异常数据时,不利提高异常检测精度;
因此,对于
Figure 504258DEST_PATH_IMAGE144
,设立了缓冲区:
当特征值小于等于1时,判定为无异常,大于等于利用最小所述基尼系数选定阈值时,为极度异常;
当特征值大于1且小于选定阈值时,为疑似异常,疑似异常的部分即为缓冲区;
检测无异常但实际异常的数据一般集中在缓冲区。排序时按照极度异常、疑似异常、无异常的顺序排列,实际人工校核时,一般集中解决极度异常数据,而把疑似异常当成无异常处理。
人工校核实质上是判定检测正确性的过程,新的判定结果将生成新的学习样本。每月完成数据汇集后,可重新生训练样本,构建决策树。
其中,样本的选择为过往逐月报送的所有数据,以测站为单位,一个测站在一个月内报送的所有数据为一个样本,最初报送的数据,为原始样本集,经过后续审核、分析使用过程中,修改过的数据为标准样本集,通过对比,标记出原始样本中的异常样本的位置和类型。通过月特征值数据增加数据冗余,为异常检测提供依据。
剪枝采用基于先验知识的剪枝方法,最终每个测站的先验知识不同,将各自生成自己的决策树。
利用cart决策树进行异常检测,根据异常概率由大到小排序,辅助校核人员校核,校核结果将成为新的样本,重新进行决策树生成。
对于特征(9)至(12),设置错误检测缓冲区。
所述当月报送数据包括日均水位、日均流量、月均水位、月均流量、月最高水位、月最低水位、月最大流量、月最小流量和月径流量。
实施例一
样本选择
将2019年1月至2021年12月系统初始填报的所有测站的日均水位、月均水位、月最高水位、月最低水位以及日均流量、月均流量、月最大流量、月最小流量、月径流量作为原始样本集,以测站一个月内报送的所有数据为一个样本。利用对初始填报数据进行修改后的数据作为标准样本集,比较两个样本集的值,如果相同,则原始样本标记为无异常样本,如果不相同,则原始标记样本为异常样本;
其中,样本总数为31011个,无异常样本总数为28796个,异常样本总数为2215个。
每月完成数据汇集后,可重新生成决策树样本,根据数据量,一年重新生成一次决策树。
特征选择
将所有样本依次带入以下特征中,进行计算,当月天数为31天时,N=31。
(1)日均水位
Figure 165047DEST_PATH_IMAGE145
,
Figure 759845DEST_PATH_IMAGE146
是否等于当月天数;
(2)水位月特征值是否齐全,即包含月均水位、月最高水位、月最低水位;
(3)当月的日均水位数据是否都满足
Figure 847887DEST_PATH_IMAGE147
,其中
Figure 646079DEST_PATH_IMAGE148
为填报的月最低水位,
Figure 110558DEST_PATH_IMAGE149
为填报的月最高水位;
(4)当月的日水位数据是否满足
Figure 310595DEST_PATH_IMAGE150
,其中
Figure 569538DEST_PATH_IMAGE151
为当月日均水位计算的月均值,
Figure 605758DEST_PATH_IMAGE152
为填报的月均水位,
Figure 873929DEST_PATH_IMAGE153
为可接受的月均水位误差范围;
(5)当月水位数据是否满足
Figure 928472DEST_PATH_IMAGE154
,其中
Figure 358317DEST_PATH_IMAGE155
为历史同期最低水位,
Figure 131101DEST_PATH_IMAGE156
为可接受的误差范围,一般有
Figure 189580DEST_PATH_IMAGE157
(6)当月水位数据是否满足
Figure 98630DEST_PATH_IMAGE158
,其中
Figure 964955DEST_PATH_IMAGE159
为历史同期最高水位,
Figure 959456DEST_PATH_IMAGE160
为可接受的误差范围,一般有
Figure 569429DEST_PATH_IMAGE161
(7)当月水位数据开头与上月水位数据的结尾,为水位数据接头处,所述水位数据接头处是否形成平滑曲线,即水位斜率的变化情况。设上月数据的日均值为
Figure 83718DEST_PATH_IMAGE162
,则接头处的数据取
Figure 120944DEST_PATH_IMAGE163
Figure 602741DEST_PATH_IMAGE164
Figure 750825DEST_PATH_IMAGE165
Figure 634468DEST_PATH_IMAGE166
Figure 842595DEST_PATH_IMAGE167
Figure 60956DEST_PATH_IMAGE168
,计算斜率变化是否较大,则求斜率的方差:
Figure 12731DEST_PATH_IMAGE169
Figure 750880DEST_PATH_IMAGE170
Figure 129909DEST_PATH_IMAGE171
Figure 586298DEST_PATH_IMAGE172
为方差可接受的范围。
(8)日均流量
Figure 92497DEST_PATH_IMAGE173
,
Figure 685152DEST_PATH_IMAGE174
是否等于当月天数;
(9)流量月特征值是否齐全,即包含月均流量、月最大流量、月最小流量、月径流量;
(10)当月流量数据是否满足,其中
Figure 969503DEST_PATH_IMAGE175
为填报的月最小流量,
Figure 913188DEST_PATH_IMAGE176
为填报的月最大流量;
(11)当月流量数据是否满足
Figure 206766DEST_PATH_IMAGE177
,其中
Figure 165845DEST_PATH_IMAGE178
为当月日均流量计算的月均值,
Figure 152256DEST_PATH_IMAGE179
为填报的月均流量,
Figure 52079DEST_PATH_IMAGE180
为可接受的月均流量误差范围;
(12)当月流量数据是否满足
Figure 883769DEST_PATH_IMAGE181
,其中
Figure 716595DEST_PATH_IMAGE182
为历史同期最小流量,
Figure 608328DEST_PATH_IMAGE183
为可接受的误差范围,一般有
Figure 11759DEST_PATH_IMAGE184
(13)当月流量数据是否满足
Figure 647139DEST_PATH_IMAGE185
,其中
Figure 334473DEST_PATH_IMAGE186
为历史同期最大流量,
Figure 662686DEST_PATH_IMAGE187
为可接受的误差范围,一般有
Figure 537101DEST_PATH_IMAGE188
基于基尼系数的阈值选择
根据特征选择可知,利用cart决策树检测异常数据,选取十三个特征,其中(1)至(5)及(7)中,满足的为无异常,不满足的为异常,其余特征采用基尼系数确定阈值,选取使Gini指数最小的值作为阈值,小于阈值的为无异常,大于阈值的为异常。本方法采用基尼指数选取阈值,样本个数总共为31011,无异常样本总数为28796个,异常样本总数为2215个,依次对
Figure 225440DEST_PATH_IMAGE189
Figure 501701DEST_PATH_IMAGE190
进行取值,计算基尼系数,首次计算
Figure 735236DEST_PATH_IMAGE191
取值为1,
Figure 362526DEST_PATH_IMAGE192
取值为0。第二次计算
Figure 339710DEST_PATH_IMAGE193
取值为1.1,
Figure 486788DEST_PATH_IMAGE194
取值为0.1,以此类推类推,直到取到该特征计算出的最大值。选取使各特征的基尼系数最小的值最为各特征的最终阈值。形成初始cart决策树。
一站一树剪枝
进行基于先验知识的预剪枝,所述预剪枝用先验知识,判断采用某个特征的必要性,在阈值选择过程中,将对于单个测站而言无意的特征直接去除,不参与阈值选择,并利用预剪枝后的特征最终形成所述测站的最优决策树。先验经验包括:
新建测站无长序列历史数据,历史数据无法作为决策依据,即建成五年以内的测站,不需要与历史特征值有关的特征;
测站只监测水位时,不需要与流量相关的所有特征;
测站只监测流量时,不需要与水位相关的所有特征;
测站为汛期站时,非汛期无数据,不需要做任何异常检测。
如对于汉口站,测站拥有长序列数据,同时检测水位流量,不是汛期站,则不进行预剪枝,初始决策树即为最终决策树。对于白沙站,无五年以上长序列历史数据,只监测水位,不为汛期站,则通过剪枝后,仅剩下5个水位特征节点。
异常检测与决策树更新
形成的决策树用来进行新数据的异常检测,根据异常概率由大到小排列数据,便于人工校核。异常概率由大到小依次为:
(11)当月报送数据缺失,一定异常,对应特征(1)、(2)、(8)、(9);
(22)当月报送数据自相矛盾,偏离值越大,异常概率越大,对应特征(3)、(4)、(10)、(11);
(33)当月报送数据与历史特征值相矛盾,偏离值越大,异常概率越大,对应特征(5)(6)、(12)、(13);
(44)接头处曲线不平滑,曲率方差越大,异常概率越大,对应特征(7)。
对于异常数据,根据特征情况利用红色标记出其异常位置,对于无异常数据则不标记,但针对(33)中,存在1到阈值之间的疑似异常的缓冲区。
每月完成数据汇集后,可重新生成决策树样本,根据数据量,一年重新生成一次决策树。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求。

Claims (5)

1.一种水文序列数据异常值检测方法,其特征在于,包括以下步骤:S1、构建cart决策树,包括:
S11、引入冗余数据的样本选择;
cart决策树构建的最终样本的选择为过往逐月报送的所有数据,以测站为单位,一个测站在一个月报送的数据为一个样本,最初报送的数据,为原始样本集;
经过后续审核、分析使用过程中,修改过的数据为标准样本集;
通过对比,标记出所述原始样本集中的异常样本;
S12、基于水文序列数据特性的特征选择;
S13、基于基尼系数的阈值选择;
S14、一站一树预剪枝;
进行基于先验知识的预剪枝,所述预剪枝用先验知识,判断采用某个特征的必要性,在阈值选择过程中,将对于单个测站而言无意的特征直接去除,不参与阈值选择,并利用预剪枝后的特征最终形成所述测站的最优决策树;
S2、异常检测与决策树更新;
形成的决策树用来进行新数据的异常检测,根据检测结果,能定位异常数据的位置,根据分类器的类型,定位数据的异常类型,以便有效辅助人工校核;
对于数据错误的,进行更正;
对于发生异常的水文情况,进行说明,便于后续数据分析;
所述S12中,所述特征包括:
水位特征:
(1)、日均水位
Figure 906023DEST_PATH_IMAGE001
Figure 616490DEST_PATH_IMAGE002
是否等于当月天数;
(2)、水位月特征值是否齐全;
(3)当月的日均水位数据是否满足
Figure 626035DEST_PATH_IMAGE003
,其中,
Figure 3926DEST_PATH_IMAGE004
为填报的月最低水位,
Figure 57202DEST_PATH_IMAGE005
为填报的月最高水位;
(4)当月的日水位数据是否满足
Figure 520544DEST_PATH_IMAGE006
,其中,
Figure 68200DEST_PATH_IMAGE007
为当月日均水位计算的月均值,
Figure 300599DEST_PATH_IMAGE008
为填报的月均水位,
Figure 275508DEST_PATH_IMAGE009
为接受的月均水位误差范围;
(5)当月水位数据是否满足
Figure 226146DEST_PATH_IMAGE010
,其中,
Figure 826761DEST_PATH_IMAGE011
为历史同期最低水位,
Figure 913665DEST_PATH_IMAGE012
为接受的差异范围,
Figure 590634DEST_PATH_IMAGE013
(6)、当月水位数据是否满足
Figure 497411DEST_PATH_IMAGE014
,其中,
Figure 652448DEST_PATH_IMAGE015
为历史同期最高水位,
Figure 843127DEST_PATH_IMAGE016
为接受的差异范围,
Figure 425418DEST_PATH_IMAGE017
(7)、当月水位数据开头与上月水位数据的结尾,为水位数据接头处,所述水位数据接头处是否形成平滑曲线,即水位斜率的变化情况为:
设上月数据的水位日均值
Figure 85070DEST_PATH_IMAGE018
则所述水位数据接头处的数据取
Figure 778219DEST_PATH_IMAGE019
Figure 839716DEST_PATH_IMAGE020
Figure 592909DEST_PATH_IMAGE021
Figure 989124DEST_PATH_IMAGE022
Figure 485964DEST_PATH_IMAGE023
Figure 136388DEST_PATH_IMAGE024
,计算所述水位斜率的变化是否较大,则所述水位斜率的方差为:
Figure 326061DEST_PATH_IMAGE025
Figure 694726DEST_PATH_IMAGE026
Figure 995257DEST_PATH_IMAGE027
Figure 15034DEST_PATH_IMAGE028
为方差接受的范围;
流量特征:
(8)、日均流量
Figure 110029DEST_PATH_IMAGE029
Figure 231569DEST_PATH_IMAGE030
是否等于当月天数;
(9)、流量月特征值是否齐全;
(10)当月流量数据是否满足
Figure 804633DEST_PATH_IMAGE031
,其中
Figure 695229DEST_PATH_IMAGE032
为填报的月最小流量,
Figure 210392DEST_PATH_IMAGE033
为填报的月最大流量;
(11)当月流量数据是否满足
Figure 553649DEST_PATH_IMAGE034
,其中
Figure 195983DEST_PATH_IMAGE035
为当月日均流量计算的月均值,
Figure 941085DEST_PATH_IMAGE036
为填报的月均流量,
Figure 643462DEST_PATH_IMAGE037
为接受的月均流量误差范围;
(12)、当月流量数据是否满足
Figure 208435DEST_PATH_IMAGE038
,其中,
Figure 378429DEST_PATH_IMAGE039
为历史同期最小流量,
Figure 243617DEST_PATH_IMAGE040
为接受的差异范围,
Figure 851315DEST_PATH_IMAGE041
(13)、当月流程数据是否满足
Figure 169164DEST_PATH_IMAGE042
,其中,
Figure 887722DEST_PATH_IMAGE043
为历史同期最大流量,
Figure 856683DEST_PATH_IMAGE044
为接受的差异范围,
Figure 635284DEST_PATH_IMAGE045
根据所述特征的选择,所述(1)~所述(3)及所述(8)~所述(10)的判定只有是否;
如果满足,则为无异常样本;
如果不满足,则为异常样本;
根据所述特征的选择,所述(4)~所述(7)至所述(11)~所述(13)的判定,需要选择阈值判定,样本
Figure 440429DEST_PATH_IMAGE046
的基尼系数表达式为:
Figure 962677DEST_PATH_IMAGE047
其中,
Figure 536878DEST_PATH_IMAGE048
为无异常类的数量;
Figure 735647DEST_PATH_IMAGE049
为异常类的数量,
Figure 762508DEST_PATH_IMAGE050
为样本数;
特征
Figure 744240DEST_PATH_IMAGE051
Figure 641789DEST_PATH_IMAGE052
Figure 480301DEST_PATH_IMAGE053
分成
Figure 994458DEST_PATH_IMAGE054
Figure 858509DEST_PATH_IMAGE055
,则在所述特征
Figure 876144DEST_PATH_IMAGE056
的条件下;所述样本
Figure 698606DEST_PATH_IMAGE057
的基尼系数表达式为:
Figure 949328DEST_PATH_IMAGE058
其中,
Figure 351490DEST_PATH_IMAGE059
取值越大,所述样本
Figure 754790DEST_PATH_IMAGE060
的不确定性也越大,且,需要选择满足
Figure 482575DEST_PATH_IMAGE061
取最小值的
Figure 705746DEST_PATH_IMAGE062
作为阈值;
依次将
Figure 442757DEST_PATH_IMAGE063
Figure 684252DEST_PATH_IMAGE064
Figure 582938DEST_PATH_IMAGE065
Figure 558984DEST_PATH_IMAGE066
Figure 568528DEST_PATH_IMAGE067
Figure 680841DEST_PATH_IMAGE068
Figure 999695DEST_PATH_IMAGE069
带入所述特征
Figure 197459DEST_PATH_IMAGE070
,即能求出各特征的阈值,
Figure 10694DEST_PATH_IMAGE071
中,历史数据长度不超过五年的不参与阈值选择,
其中,
Figure 243092DEST_PATH_IMAGE072
最小取1,
Figure 483580DEST_PATH_IMAGE073
最小取0,最大值取当前样本能算出的最大值。
2.根据权利要求1所述的一种水文序列数据异常值检测方法,其特征在于,所述S14中的所述先验知识包括:
S141、新建测站无长序列历史数据,所述历史数据无法作为决策依据,即建成五年以内的测站,不需要与历史特征值有关的特征;
S142、测站只监测水位时,不需要与流量相关的所有特征;
S143、测站只监测流量时,不需要与水位相关的所有特征;
S144、测站为汛期站时,非汛期无数据,不需要做任何异常检测。
3.根据权利要求2所述的一种水文序列数据异常值检测方法,其特征在于,所述S2中,为辅助人工校核,根据所述异常类型和偏离程度,依照异常概率由大到小排列数据,所述异常概率由大到小依次为:
S21、当月报送数据缺失,一定异常,对应特征所述(1)、(2)、(8)、(9);
S22、当月报送数据自相矛盾,偏离值越大,异常概率越大,对应特征所述(3)、(4)、(10)、(11);
S23、当月报送数据与历史特征值相矛盾,偏离值越大,异常概率越大,对应特征所述(5)(6)、(12)、(13);
S24、所述水位数据接头处的曲线不平滑,曲率方差越大,异常概率越大,对应特征所述(7)。
4.根据权利要求3所述的一种水文序列数据异常值检测方法,其特征在于,设置所述
Figure 168640DEST_PATH_IMAGE074
Figure 28974DEST_PATH_IMAGE075
Figure 850300DEST_PATH_IMAGE076
Figure 261689DEST_PATH_IMAGE077
四个特征的缓冲区:
当特征值小于等于1时,判定为无异常;大于等于利用最小所述基尼系数选定阈值时,为极度异常;
当特征值大于1且小于选定阈值时,为疑似异常,所述疑似异常的部分为缓冲区。
5.根据权利要求1所述的一种水文序列数据异常值检测方法,其特征在于:月报送数据包括日均水位、日均流量、月均水位、月均流量、月最高水位、月最低水位、月最大流量、月最小流量和月径流量。
CN202210465324.7A 2022-04-29 2022-04-29 一种水文序列数据异常值检测方法 Active CN114565065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210465324.7A CN114565065B (zh) 2022-04-29 2022-04-29 一种水文序列数据异常值检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210465324.7A CN114565065B (zh) 2022-04-29 2022-04-29 一种水文序列数据异常值检测方法

Publications (2)

Publication Number Publication Date
CN114565065A CN114565065A (zh) 2022-05-31
CN114565065B true CN114565065B (zh) 2022-08-12

Family

ID=81721574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210465324.7A Active CN114565065B (zh) 2022-04-29 2022-04-29 一种水文序列数据异常值检测方法

Country Status (1)

Country Link
CN (1) CN114565065B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116500240B (zh) * 2023-06-21 2023-12-29 江西索立德环保服务有限公司 一种土壤环境质量监测方法、系统及可读存储介质
CN117793186B (zh) * 2024-02-23 2024-05-14 国能大渡河流域水电开发有限公司 数据报送的方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951680A (zh) * 2017-02-21 2017-07-14 河海大学 一种水文时间序列异常模式检测方法
CN109347853A (zh) * 2018-11-07 2019-02-15 华东师范大学 基于深度包解析的面向综合电子系统的异常检测方法
CN110532297A (zh) * 2019-08-01 2019-12-03 河海大学 一种基于层次聚类的符号化水文时间序列异常模式检测方法
CN110929946A (zh) * 2019-11-29 2020-03-27 中国农业科学院农业资源与农业区划研究所 基于地表水文过程的农业洪涝灾害监测预报系统及方法
CN112069372A (zh) * 2020-08-11 2020-12-11 李睿飞 水文数据监控方法、装置、服务器及可读存储介质
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN112926397A (zh) * 2021-01-28 2021-06-08 中国石油大学(华东) 基于两轮投票策略集成学习的sar图像海冰类型分类方法
CN113011481A (zh) * 2021-03-10 2021-06-22 广东电网有限责任公司计量中心 一种基于决策树算法的电能表功能异常评估方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104198961B (zh) * 2014-07-18 2017-06-13 中国科学院上海微系统与信息技术研究所 采用单个运算放大器的超导量子干涉器磁传感器
US20220079125A1 (en) * 2020-09-16 2022-03-17 Lishao Wang Holding Tank Monitoring System Based On Wireless Sensor Network And Monitoring Method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951680A (zh) * 2017-02-21 2017-07-14 河海大学 一种水文时间序列异常模式检测方法
CN109347853A (zh) * 2018-11-07 2019-02-15 华东师范大学 基于深度包解析的面向综合电子系统的异常检测方法
CN110532297A (zh) * 2019-08-01 2019-12-03 河海大学 一种基于层次聚类的符号化水文时间序列异常模式检测方法
CN110929946A (zh) * 2019-11-29 2020-03-27 中国农业科学院农业资源与农业区划研究所 基于地表水文过程的农业洪涝灾害监测预报系统及方法
CN112069372A (zh) * 2020-08-11 2020-12-11 李睿飞 水文数据监控方法、装置、服务器及可读存储介质
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN112926397A (zh) * 2021-01-28 2021-06-08 中国石油大学(华东) 基于两轮投票策略集成学习的sar图像海冰类型分类方法
CN113011481A (zh) * 2021-03-10 2021-06-22 广东电网有限责任公司计量中心 一种基于决策树算法的电能表功能异常评估方法及系统

Also Published As

Publication number Publication date
CN114565065A (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN114565065B (zh) 一种水文序列数据异常值检测方法
CN107463633B (zh) 一种基于eemd-神经网络的实时数据异常值检测方法
CN113407651B (zh) 一种进度信息反馈及偏差实时展示方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
CN111209274B (zh) 一种数据质量检核方法、系统、设备及可读存储介质
CN108241574A (zh) 一种基于测试管理工具qc对软件测试缺陷进行分析的方法及系统
CN112149750A (zh) 一种供水管网爆管识别数据驱动方法
CN107957929A (zh) 一种基于主题模型的软件缺陷报告修复人员分配方法
CN116432123A (zh) 一种基于cart决策树算法的电能表故障预警方法
CN101008936A (zh) 一种校正测量数据显著误差与随机误差的方法
CN114862267A (zh) 一种输油气管道报警管理体系的评价方法及系统
CN117472789B (zh) 基于集成学习的软件缺陷预测模型构建方法和装置
CN110851784A (zh) 一种现场运行电能表的预警方法
CN114819178A (zh) 一种铁路施工进度指标预测和在线更新方法
CN112307648B (zh) 一种卫星通信系统可靠性模型的评估方法
CN111950850B (zh) 一种基于证据网络的无人机系统保障能力评估方法
CN117708625A (zh) 一种乏数据背景下大坝监测历史数据填补方法
WO2020259391A1 (zh) 一种数据库脚本性能测试的方法及装置
CN116739147A (zh) 基于bim的智能能耗管理与动态碳排放计算联合方法及系统
CN115619106A (zh) 一种考虑性能退化的激光陀螺仪备件数量确定方法及系统
CN114677052A (zh) 基于tarch模型的天然气负荷波动非对称性分析方法及系统
CN115587333A (zh) 一种基于多分类模型的失效分析故障点预测方法及系统
CN112506903B (zh) 采用标本线的数据质量表示方法
CN112380132A (zh) 基于航天软件缺陷数据集类不平衡的对抗验证方法及装置
CN114154686A (zh) 一种基于集成学习的大坝变形预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant