CN111522860B - 一种基于生物行为的水质预警分析方法及其系统 - Google Patents
一种基于生物行为的水质预警分析方法及其系统 Download PDFInfo
- Publication number
- CN111522860B CN111522860B CN202010271334.8A CN202010271334A CN111522860B CN 111522860 B CN111522860 B CN 111522860B CN 202010271334 A CN202010271334 A CN 202010271334A CN 111522860 B CN111522860 B CN 111522860B
- Authority
- CN
- China
- Prior art keywords
- data
- behavior
- water quality
- biological
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 93
- 238000004458 analytical method Methods 0.000 title claims abstract description 56
- 230000004791 biological behavior Effects 0.000 title claims abstract description 44
- 230000006399 behavior Effects 0.000 claims abstract description 183
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 45
- 231100000719 pollutant Toxicity 0.000 claims abstract description 45
- 230000002159 abnormal effect Effects 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 10
- 230000002688 persistence Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 6
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000006641 stabilisation Effects 0.000 claims description 3
- 238000011105 stabilization Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 14
- 230000008859 change Effects 0.000 abstract description 6
- 230000002776 aggregation Effects 0.000 abstract description 3
- 238000004220 aggregation Methods 0.000 abstract description 3
- YKYOUMDCQGMQQO-UHFFFAOYSA-L cadmium dichloride Chemical compound Cl[Cd]Cl YKYOUMDCQGMQQO-UHFFFAOYSA-L 0.000 description 18
- 238000005311 autocorrelation function Methods 0.000 description 8
- 230000001052 transient effect Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 241000251468 Actinopterygii Species 0.000 description 4
- 241000252212 Danio rerio Species 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003950 pathogenic mechanism Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Mathematical Analysis (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于生物行为的水质预警分析方法及其系统,该方法包括:采集被监测水体内的生物个体行为数据和群体行为数据;对生物个体行为数据和群体行为数据预处理,获取生物个体行为数据和群体行为的时间序列数据;将时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;若匹配,输出水质异常检测结果和污染物种类;若不匹配,将时间序列数据输入到预测模型中,通过预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。本发明实施例可以快速检测出异常情况,对污染物在生物体内聚集效应进行判定,对应生物在污染物暴露下的行为强度变化模式,有效分析污染物种类。
Description
技术领域
本发明涉及环境污染检测技术领域,尤其涉及一种基于生物行为的水质预警分析方法及其系统。
背景技术
水是生命之源,也是人类生存的基本需求。随着工农业快速发展,越来越多的外源污染物通过直接排放、转换、迁移进入水环境,使原水污染加剧、水质下降,直接影响居民的用水安全,也加大了城市供水的风险。因生物个体具有特异性、警示性和广泛性,可以通过其行为反应出污染物在生物体内的积累作用,揭示污染物和生物行为的效应关系。因此,国内外尝试采用生物监测方法对水质进行监控预警。
现有的生物监测以鱼类为主,发光细菌、植物藻和动物蚤为辅。现有生物监测技术仅可实现水质正常和异常的判断,没有对生物的行为进行机理分析,因此也未能对水质污染种类进行判别;对突发性污染事件的应对能力非常低,无法提供实时在线的污染源信息,使得供水安全仍存在很大隐患。
发明内容
本发明的主要目的在于提出一种基于生物行为的水质预警分析方法及其系统,旨在解决现有生物监测对突发性污染事件的应对能力非常低,无法提供实时在线的污染源信息的技术问题。
本发明的技术方案思路如下:由于污染物在生物体内的变化是持续的,存在长周期的致病机理,大量研究表明生物行为强度随着污染物胁迫时间的延长而减弱,因此建立基于时间序列的生物行为和污染物效应关系模型,通过分析生物行为在时域和频域上的瞬时效应和恒偏效应,实现以下三个目的:1)反映出生物行为的异常现象,2)实现对生物行为的预测,3)实现对污染物种类的判定。
为实现上述目的,本发明还提出一种基于生物行为的水质预警分析方法,该方法包括:
采集被监测水体内的生物个体行为数据和群体行为数据;
对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;
将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
若匹配,输出水质异常检测结果和污染物种类;若不匹配,将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
进一步的,所述基于生物行为的水质预警分析方法还包括:
当所述时间序列数据与所述标准行为数据库或者高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值;
当所述时间序列数据与所述标准行为数据库或者高维行为数据库不匹配时,对所述时间序列数据进行建模、预测和评估,判断是否具有异常值。
进一步,所述对所述时间序列数据进行建模、预测和评估,判断是否具有异常值的步骤具体包括:
若无异常值则输出水质正常结果,并预估未来一定时期内的预估区间和发生污染可能性的概率值;若有异常值,则对其进行异常值后的所述时间序列数据进行滑动窗口检测,分析所述时间序列数据的时域特性和频域特性,并输出水质存疑结果,并预估未来一定时间内的预估区间和发生污染可能性的概率值。
进一步的,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤之前,所述方法包括:
预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库。
进一步的,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤具体包括:
个体行为参数匹配:将所述生物个体行为数据对应的所述时间序列数据进行单一数据序列特征值匹配,检测生物个体行为的异常值,并从所述异常值开始,采用滑动窗口的方式,按照窗口设置T1=5min,T2=30min,T3=120min三个周期进行搜索和相似度匹配;
多维行为参数匹配:将所述群体行为数据对应的所述时间序列数据进行多维数据序列特征值匹配,采用多元图可视化技术将高维数据转化为多元图后进行匹配。
进一步的,所述采用多元图可视化技术将高维数据转化为多元图后进行匹配的步骤包括:
对所述群体行为数据预处理,利用直方图的方式表示所述群体行为每一特征参数的概率分布;
对数据进行归一化处理,处理后数值在0-2之间,归一化公式如下:
对所述群体行为数据进行非线性变换,变换后数值为Zij,公式如下:
从而将所述群体行为数据多个特征参数转换为多元图。
进一步的,所述将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计的步骤包括:
列平稳性检验:根据所述多元图,对所述时间序列数据进行平稳性检验,若所述时间序列数据为非平稳时间序列则对数据进行差分,直到数据成为平稳序列,差分次数即为d;
预测模型建立和识别:对差分后所述时间序列数据进行拟合建模,采用时间序列中差分整合移动平均自回归模型ARIMA(p,d,q)进行建模;其中,p为自回归阶数,d为数据平稳化时进行差分的次数,q为移动平均的阶数;
具体的,模型中p,q参数的识别,利用所述时间序列数据计算自相关函数(ACF)和偏自相关函数(PACF),观察其拖尾和截尾特性确定p、q的阶数;
参数估计:参数估计采用极大似然估计法;
模型检验:对模型的残差序列进行显著性检验;
进行序列预测:包括区间序列预测和密度序列预测,所述区间序列预测针对未来某个时期,区间预测结果的概率值落在某个区间内;所述密度序列预测获得未来值的概率分布情况。
基于同一发明目的,本发明的另一方面,还提供了一种基于生物行为的水质预警分析系统,该系统包括:
生物行为采集传感器,用于采集被监测水体内的生物个体行为数据和群体行为数据;
数据预处理模块,用于对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;
相似度匹配模块,用于将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
预测分析模块,用于将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
进一步的,所述预测分析模块还用于预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库
进一步的,所述系统还包括数据输出模块,用于当所述时间序列数据与所述标准行为数据库或者高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值。
本发明的有益效果:
本发明实施例的基于生物行为的水质预警分析方法及其系统,采用时间序列的方法,通过生物个体行为和群体行为进行时间序列的分析和预测,1)快速检测出异常情况,2)对污染物在生物体内聚集效应进行判定,3)对应生物在污染物暴露下的行为强度变化模式,有效分析污染物种类。
附图说明
图1为本发明实施例的一种基于生物行为的水质预警分析方法流程框图;
图2为本发明实施例的一种基于生物行为的水质预警分析系统结构框图;
图3为本发明实施例的基于生物行为的水质预警分析系统原理框图;
图4为本发明实施例涉及的瞬时效应波形图;
图5为本发明实施例涉及的恒偏效应波形图;
图6为本发明实施例涉及的时域和频域分析图;
图7为本发明实施例的基于多元图的斑马鱼行为分析空白水质氯化镉(7mg/L)对比图;
图8为本发明实施例的基于多元图的斑马鱼行为分析污染水质氯化镉(7mg/L)对比图;
图9为本发明实施例的基于多元图特征参数的氯化镉(7mg/L)污染情况分析图;
图10为本发明实施例的行为异常预测流程图;
图11为本发明实施例的氯化镉7mg/l时序图;
图12为本发明实施例的氯化镉7mg/l预测值对比图;
图13为本发明实施例的氯化镉7mg/l实际值对比图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
实施例1
为实现上述目的,如图1所示,本发明实施例还提出一种基于生物行为的水质预警分析方法,该方法包括:
S101、采集被监测水体内的生物个体行为数据和群体行为数据;
S102、对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;
S103、将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
S104、若匹配,输出水质异常检测结果和污染物种类;若不匹配,将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
由于污染物在生物体内的变化是持续的,存在长周期的致病机理,大量研究表明生物行为强度随着污染物胁迫时间的延长而减弱,因此建立基于时间序列的生物行为和污染物效应关系模型,通过分析生物行为在时域和频域上的瞬时效应和恒偏效应,实现以下三个目的:1)反映出生物行为的异常现象,2)实现对生物行为的预测,3)实现对污染物种类的判定。
瞬时效应如图4所示,因生物行为受到浓度高的污染物的影响或灯光等刺激时会发生瞬时行为突变现象,称为瞬时性。
恒偏效应如图5所示,因生物行为受到污染物的影响具有累积性,因此行为数据产生了恒偏差型的异常情况,称为恒偏效应。
其中,所述基于生物行为的水质预警分析方法还包括:
当所述时间序列数据与所述标准行为数据库或者高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值;
当所述时间序列数据与所述标准行为数据库或者高维行为数据库不匹配时,对所述时间序列数据进行建模、预测和评估,判断是否具有异常值。
具体的,所述对所述时间序列数据进行建模、预测和评估,判断是否具有异常值的步骤具体包括:
若无异常值则输出水质正常结果,并预估未来一定时期内的预估区间和发生污染可能性的概率值;若有异常值,则对其进行异常值后的所述时间序列数据进行滑动窗口检测,分析所述时间序列数据的时域特性和频域特性,并输出水质存疑结果,并预估未来一定时间内的预估区间和发生污染可能性的概率值。
其中,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤之前,所述方法包括:
预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库。
时域和频域分析如图6所示,主要对历史污染物的数据中提取T1=5min,T2=30min,T3=120min三个周期中出现的波峰和波谷的频次以及峰、谷幅度值所在区间域进行标识和分类。
具体的,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤具体包括:
个体行为参数匹配:将所述生物个体行为数据对应的所述时间序列数据进行单一数据序列特征值匹配,检测生物个体行为的异常值,并从所述异常值开始,采用滑动窗口的方式,按照窗口设置T1=5min,T2=30min,T3=120min三个周期进行搜索和相似度匹配;
当检测到T1=5min,T2=30min,T3=120min三个周期中时间序列数据与数据库中的时间序列数据相似度匹配达到预设值时,给出污染物具体概率。
多维行为参数匹配:将所述群体行为数据对应的所述时间序列数据进行多维数据序列特征值匹配,采用多元图可视化技术将高维数据转化为多元图后进行匹配。
对输入的生物个体行为,进行多维数据序列特征值匹配,因检测的鱼类行为特征参数较多,对于高维数据的特征匹配的方式主要是降维处理或图像处理。本实施例采用多元图可视化描述,将高维数据转化为多元图后进行匹配,以实现高维数据的快速匹配。多元图时数据可视化技术,基本原理是将每个行为数据对应独立的单一数值轴,坐标轴呈辐射状分布在中心点周围,同一数据序列的值在不同坐标轴上的点用折线连接起来所形成的多边形,用来比较若干个数据序列指标的总体情况。
其中,所述采用多元图可视化技术将高维数据转化为多元图后进行匹配的步骤包括:
第一、对所述群体行为数据预处理,利用直方图的方式表示所述群体行为每一特征参数的概率分布;
第三、对数据进行归一化处理,处理后数值在0-2之间,归一化公式如下:
第四、对所述群体行为数据进行非线性变换,变换后数值为Zij,公式如下:
第五、从而将所述群体行为数据多个特征参数转换为多元图。
利用斑马鱼具有非常敏锐的嗅觉、味觉、视觉、侧线等感觉器官能力,能够在感受水源受到污染后,主动离开受污染区域,游向未污染区域,并表现出明显的行为,该行为可通过CCD摄像头实时拍摄,本发明采用斑马鱼作为指示生物,结合计算机视觉技术,通过实时长期监测指示生物的行为变化,获取指示生物的多项行为参数,通过相关指标的评价分析,可以实现水质突发性污染的及时预警。
如图7、8所示,分别提供了基于多元图的斑马鱼行为分析,在空白水质和污染水质中的多元图。如图9所示为基于多元图特征参数的氯化镉(7mg/L)污染情况分析,两个维度的行为匹配模式为数据分析、聚类和应用都提供了较为灵活的方式。
具体的,如图10所示,所述将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计的步骤包括:
第一、列平稳性检验:根据所述多元图,对所述时间序列数据进行平稳性检验,若所述时间序列数据为非平稳时间序列则对数据进行差分,直到数据成为平稳序列,差分次数即为d;
第二、预测模型建立和识别:对差分后所述时间序列数据进行拟合建模,采用时间序列中差分整合移动平均自回归模型ARIMA(p,d,q)进行建模;其中,p为自回归阶数,d为数据平稳化时进行差分的次数,q为移动平均的阶数;
具体的,模型中p,q参数的识别,利用所述时间序列数据计算自相关函数(ACF)和偏自相关函数(PACF),观察其拖尾和截尾特性确定p、q的阶数;
第三、参数估计:参数估计采用极大似然估计法;
第四、模型检验:对模型的残差序列进行显著性检验;
第五、进行序列预测:包括区间序列预测和密度序列预测,所述区间序列预测针对未来某个时期,区间预测结果的概率值落在某个区间内;所述密度序列预测获得未来值的概率分布情况。
下面以氯化镉7mg为例的matlab短期预测结果:
第一、对如图11中氯化镉7mg/l时序图的原始数据进行平稳性检验,得出d=1;
第二、通过计算,确定最佳模型为ARIMA(5,1,2)。进行参数估计和显著性检验。
第三、得出短期预测趋势,见下图(图12为预测图,图13位实际值图),与实际效果对比,趋势较相似,拐点也比较准确,但后期预测值比实际值略高,可进一步修正模型,短期预测效果较好。
当输入数据与标准数据库或高维数据库中的结果符合时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值和发生污染持续性的概率值,以及对应污染物的概率值;
当输入数据与标准数据库或高维数据库中的结果不符合时,对数据进行建模、预测和评估,如无异常值则输出水质正常,并预估未来一定时期内的预估区间和发生污染可能性的概率值;如有异常值,则对其进行异常值后的数据进行滑动窗口检测,分析其时域特性和频域特性,并输出水质可疑,并预估未来一定时间内的预估区间和发生污染可能性的概率值。
实施例2
基于同一发明目的,如图2、3所示,本发明实施例还提供了一种基于生物行为的水质预警分析系统200,该系统200包括:
生物行为采集传感器210,用于采集被监测水体内的生物个体行为数据和群体行为数据;
生物行为采集传感器210主要是CCD摄像头结合计算机图像处理技术,另外还可以集成多种水体环境感知传感器,如温度、酸碱度等等。
数据预处理模块220,用于对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;具体的,对采集的生物个体行为数据和群体行为数据进行预处理,对数据中缺失值、异常值、周期性进行分析,并进行数据清洗,形成生物个体行为和群体行为的时间序列。
相似度匹配模块230,用于将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
预测分析模块240,用于将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
其中,所述预测分析模块240还用于预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库。
具体的,所述预测分析模块240包括:
数据预测模型单241,用于将所述时间序列数据输入到预测模型中,建模、分析、模型修正、误差分析等等,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
数据库形成单元242,用于预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,然后通过聚类分类从而形成污染物的所述标准行为数据库和所述高维行为数据库。所述标准行为数据库和所述高维行为数据库存储到相似度匹配模块230。
生物个体行为至少包括速度、加速度、临界速度、可持续游泳时间、相对速度、爆发速度、高度、转弯次数、跳跃频率等;群体行为至少包括鱼群周长、鱼间距、分形维数等。
另外,所述系统200还包括数据输出模块250,用于当所述时间序列数据与所述标准行为数据库或者高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值。
数据输出模块250可以采用现有网络通信方式,诸如WiFi、蓝牙、GPRS等无线通信方式或者有限网络方式,传输到移动终端、上位机,采用数据列表、声光报警或者可视化等方式输出污染监测结果。上位机或者移动终端可以对预监测水体进行实时监测,并且记录预监测水体的动态污染情况。
在一些实施例中,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有水质预警分析程序,所述水质预警分析程序被处理器执行时实现上述的基于生物行为的水质预警分析方法的步骤。
本发明实施例的基于生物行为的水质预警分析方法及其系统,采用时间序列的方法,通过生物个体行为和群体行为进行时间序列的分析和预测,1)快速检测出异常情况,2)对污染物在生物体内聚集效应进行判定,3)对应生物在污染物暴露下的行为强度变化模式,有效分析污染物种类。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于生物行为的水质预警分析方法,其特征在于,所述方法包括:
采集被监测水体内的生物个体行为数据和群体行为数据;
对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;
将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
若匹配,输出水质异常检测结果和污染物种类;若不匹配,将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
2.根据权利要求1所述的基于生物行为的水质预警分析方法,其特征在于,所述方法还包括:
当所述时间序列数据与所述标准行为数据库或者所述高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值;
当所述时间序列数据与所述标准行为数据库或者高维行为数据库不匹配时,对所述时间序列数据进行建模、预测和评估,判断是否具有异常值。
3.根据权利要求2所述的基于生物行为的水质预警分析方法,其特征在于,所述对所述时间序列数据进行建模、预测和评估,判断是否具有异常值的步骤具体包括:
若无异常值则输出水质正常结果,并预估未来一定时期内的预估区间和发生污染可能性的概率值;若有异常值,则对其进行异常值后的所述时间序列数据进行滑动窗口检测,分析所述时间序列数据的时域特性和频域特性,并输出水质存疑结果,并预估未来一定时间内的预估区间和发生污染可能性的概率值。
4.根据权利要求1所述的基于生物行为的水质预警分析方法,其特征在于,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤之前,所述方法包括:
预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库。
5.根据权利要求1所述的基于生物行为的水质预警分析方法,其特征在于,所述将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配的步骤具体包括:
个体行为参数匹配:将所述生物个体行为数据对应的所述时间序列数据进行单一数据序列特征值匹配,检测生物个体行为的异常值,并从所述异常值开始,采用滑动窗口的方式,按照窗口设置T1=5min,T2=30min,T3=120min三个周期进行搜索和相似度匹配;
多维行为参数匹配:将所述群体行为数据对应的所述时间序列数据进行多维数据序列特征值匹配,采用多元图可视化技术将高维数据转化为多元图后进行匹配。
7.根据权利要求6所述的基于生物行为的水质预警分析方法,其特征在于,所述将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计的步骤包括:
列平稳性检验:根据所述多元图,对所述时间序列数据进行平稳性检验,若所述时间序列数据为非平稳时间序列则对数据进行差分,直到数据成为平稳序列,差分次数即为d;
预测模型建立和识别:对差分后所述时间序列数据进行拟合建模,采用时间序列中差分整合移动平均自回归模型ARIMA(p,d,q)进行建模;其中,p为自回归阶数,d为数据平稳化时进行差分的次数,q为移动平均的阶数;
参数估计:参数估计采用极大似然估计法;
模型检验:对模型的残差序列进行显著性检验;
进行序列预测:包括区间序列预测和密度序列预测,所述区间序列预测针对未来某个时期,区间预测结果的概率值落在某个区间内;所述密度序列预测获得未来值的概率分布情况。
8.一种基于生物行为的水质预警分析系统,其特征在于,所述系统包括:
生物行为采集传感器,用于采集被监测水体内的生物个体行为数据和群体行为数据;
数据预处理模块,用于对所述生物个体行为数据和所述群体行为数据预处理,获取所述生物个体行为数据和所述群体行为数据的时间序列数据;
相似度匹配模块,用于将所述时间序列数据与标准行为数据库、高维行为数据库进行相似度匹配;
预测分析模块,用于将所述时间序列数据输入到预测模型中,通过所述预测模型对数据趋势进行预估计;估算未来某一时间内水质污染事件发生的概率。
9.根据权利要求8所述的基于生物行为的水质预警分析系统,其特征在于,所述预测分析模块还用于预先采集被监测水体内的生物个体行为数据和群体行为数据,并对所述生物个体行为数据和所述群体行为数据进行时域分析和频域分析,获取时域和频域上的多个特征值,形成污染物的所述标准行为数据库和所述高维行为数据库。
10.根据权利要求8所述的基于生物行为的水质预警分析系统,其特征在于,所述系统还包括数据输出模块,用于当所述时间序列数据与所述标准行为数据库或者高维行为数据库匹配时,输出水质异常报警信号,同时输出其未来一定时间区间内的预估值、发生污染持续性的概率值以及对应污染物的概率值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010271334.8A CN111522860B (zh) | 2020-04-08 | 2020-04-08 | 一种基于生物行为的水质预警分析方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010271334.8A CN111522860B (zh) | 2020-04-08 | 2020-04-08 | 一种基于生物行为的水质预警分析方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111522860A CN111522860A (zh) | 2020-08-11 |
CN111522860B true CN111522860B (zh) | 2023-03-24 |
Family
ID=71902023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010271334.8A Active CN111522860B (zh) | 2020-04-08 | 2020-04-08 | 一种基于生物行为的水质预警分析方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111522860B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722972A (zh) * | 2022-06-01 | 2022-07-08 | 新华三人工智能科技有限公司 | 一种异常检测的方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012419B (zh) * | 2010-11-03 | 2013-07-24 | 浙江工业大学 | 基于视觉感知鱼类行为的生物水质监测系统 |
CN102297865B (zh) * | 2011-05-27 | 2013-02-20 | 宁波大学 | 一种鱼类行为的生物水质监测系统及其监测方法 |
CN106442908B (zh) * | 2016-09-09 | 2019-02-26 | 厦门大学 | 基于红色斑马鱼应激行为的水质异常检测与分级报警方法 |
CN106872657B (zh) * | 2017-01-05 | 2018-12-14 | 河海大学 | 一种多变量水质参数时序数据异常事件检测方法 |
-
2020
- 2020-04-08 CN CN202010271334.8A patent/CN111522860B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111522860A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116796907A (zh) | 一种基于物联网的水环境动态监测系统及其方法 | |
CN116975378B (zh) | 一种基于大数据的设备环境监测方法及系统 | |
CN108665119B (zh) | 一种供水管网异常工况预警方法 | |
CN115876258B (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN110631640A (zh) | 基于物联网的仓储烟叶霉变状态智能监测系统及方法 | |
CN117235661B (zh) | 基于ai的直饮水质量监测方法 | |
CN109541022A (zh) | 一种桥梁结构裂缝健康监测分析方法 | |
CN114023399A (zh) | 一种基于人工智能的空气颗粒物分析预警方法和装置 | |
CN111522860B (zh) | 一种基于生物行为的水质预警分析方法及其系统 | |
CN115575584B (zh) | 一种大气环境镉含量监测预警方法及系统 | |
CN118114186B (zh) | 一种基于人工智能的设备振动故障诊断方法 | |
CN117115637A (zh) | 一种基于大数据技术的水质监测预警方法及系统 | |
CN210829975U (zh) | 一种基于边缘计算和机器学习的液压系统状态监测系统 | |
CN117875573B (zh) | 一种基于生物毒性和生物有效性的水环境评价方法和系统 | |
CN117975372B (zh) | 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 | |
CN113177646A (zh) | 一种基于自适应边缘代理的配电设备在线监测方法及系统 | |
CN116128286A (zh) | 一种基于预防机制建设的数字化管理系统及方法 | |
CN118095843A (zh) | 基于物联网技术的远程监管系统及方法 | |
CN117849302A (zh) | 一种多参数水质在线监测方法 | |
CN117853055A (zh) | 一种污染溯源管控系统 | |
CN111855946B (zh) | 基于鱼类行为解析的水质分析方法 | |
CN103488087B (zh) | 最优的农药废液焚烧炉有害物排放达标控制系统及方法 | |
CN117314705B (zh) | 一种基于遥感影像的环境综合评估预测方法 | |
US12123820B1 (en) | Membrane fouling early warning method and device based on machine learning | |
CN118430216B (zh) | 一种用于充电桩的多种通信协议烟雾预警系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |