CN113711087B - 环境因子预测装置、方法、程序、学习模型及存储介质 - Google Patents

环境因子预测装置、方法、程序、学习模型及存储介质 Download PDF

Info

Publication number
CN113711087B
CN113711087B CN202080029086.4A CN202080029086A CN113711087B CN 113711087 B CN113711087 B CN 113711087B CN 202080029086 A CN202080029086 A CN 202080029086A CN 113711087 B CN113711087 B CN 113711087B
Authority
CN
China
Prior art keywords
data
predictor
water quality
environmental factor
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080029086.4A
Other languages
English (en)
Other versions
CN113711087A (zh
Inventor
伊藤研悟
菊地淳
松本朋子
朝仓大河
黑谷笃之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RIKEN Institute of Physical and Chemical Research
Original Assignee
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RIKEN Institute of Physical and Chemical Research filed Critical RIKEN Institute of Physical and Chemical Research
Publication of CN113711087A publication Critical patent/CN113711087A/zh
Application granted granted Critical
Publication of CN113711087B publication Critical patent/CN113711087B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/02Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B1/00Equipment or apparatus for, or methods of, general hydraulic engineering, e.g. protection of constructions against ice-strains

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Farming Of Fish And Shellfish (AREA)

Abstract

一种环境因子预测装置,其具备:预测器,将水质数据和气象数据作为说明变量,根据该说明变量的时序数据,输出单位时间后的该说明变量的各项目的估计值,所述水质数据包括水中的多层中的、与生物色素量或生物发光量对应的值(例如,叶绿素浓度)、水温、盐分浓度、溶解氧、浊度以及流速,所述气象数据包括气温、降水量以及日照时间;以及预测单元,反复进行将利用所述预测器得到的估计值再次作为所述预测器的输入的预测,由此预测直至N单位时间后的所述水质数据。根据本发明,能长期且高精度地预测成为赤潮/青潮/水华、鱼贝类的病害等的产生要因的环境因子。

Description

环境因子预测装置、方法、程序、学习模型及存储介质
技术领域
本发明涉及一种预测环境因子的技术,特别是涉及一种预测与赤潮/青潮/水华、鱼贝类的病害等的产生相关连的水中的环境因子的技术。
背景技术
赤潮(浮游生物、细菌的异常增殖)的产生对水产业造成很大的损害,因此一直以来尝试构建赤潮的预测法。特别是近年来,随着计算设备、模拟、人工智能(AI)、IoT(物联网)相关技术的发展,提出了各种赤潮预测方法。
就非专利文献1的方法而言,分别对在伊势湾中实时观测到的水质/气象观测数据创建环境要因适宜度指数模型,根据它们的乘积计算出栖息地适宜度指数,进行赤潮预测。虽然用该方法在1天前预测了赤潮,但一般而言,理想的是在3天多之前预测产生赤潮。此外,使用该方法时,命中率和预测率各为59.4%和69.5%,不能说是充分的。
就非专利文献2的方法而言,通过组合了线性/非线性分析的机器学习来进行赤潮生物量(biomass)的预测,暗示了能进行比以往高精度的预测。需要说明的是,在非专利文献2中,进行仅处理海洋信息的分析。此外,通常在环境因子的预测中,大多将叶绿素浓度作为预测对象,但可以推测非专利文献2的叶绿素浓度的预测精度不充分。而且,存在替代预测对象赤潮生物量与赤潮产生的关连性、定义不明确的问题点。
就非专利文献3的方法而言,在叶绿素浓度的时序数据中应用混沌循环神经网络(Chaos Recurrent Neural Network),进行未来的叶绿素浓度的预测。然而,无法得到充分的预测精度。
需要说明的是,除了赤潮以外,也期望将青潮和水华或者鱼贝类的病害等水中的环境相关的预测同样地作为对象。
现有技术文献
非专利文献
非专利文献1:田中阳二;杉本佑奈.伊势湾的使用了自动水质观测装置的浮游植物的大量产生预测系统的开发.土木学会论文集B3(海洋开发),2016,72.2:I#970-I#975.
非专利文献2:QIN,Mengjiao;LI,Zhihang;DU,Zhenhong.Red tide time seriesforecasting by combining ARIMA and deep belief network.Knowledge-BasedSystems,2017,125:39-52.
非专利文献3:原田昌佳,堂马彬史,平松和昭,丸居笃,基于混沌循环神经网络的叶绿素a时序的短期预测,平成24年度农业农村工学会大会演讲会,2012.09.
发明内容
发明所要解决的问题
本发明的目的在于,长期且高精度地预测成为赤潮/青潮/水华、鱼贝类的病害等的产生要因的环境因子。
用于解决问题的方案
本发明的一个方案的环境因子预测装置的特征在于,具备:预测器,将水质数据和气象数据作为说明变量(explanatory variable),根据该说明变量的时序数据,输出单位时间后的该说明变量的各项目的估计值,所述水质数据包括水中的多层中的、与生物色素量或生物发光量对应的值、水温、盐分浓度、溶解氧、浊度以及流速,所述气象数据包括气温、降水量以及日照时间;以及预测单元,反复进行将利用所述预测器得到的估计值再次作为所述预测器的输入的预测,由此预测直至N单位时间后(N为2以上的整数)的所述水质数据。
在本公开中,赤潮是指,由于在海水中生存的微生物、特别是浮游生物、细菌等光合微生物、化学合成微生物的异常增殖,导致水的颜色显著变化的现象,除了狭义的赤潮以外,也包括白潮、绿潮。此外,在本公开中,水华(water-bloom)是指,在淡水中生存的微生物、特别是微藻类异常增殖的现象。此外,在本公开中,青潮是指,随着大量增殖的浮游生物、细菌的尸体的分解而贫氧水体上升至水面附近的现象。此外,在本公开中,浮游生物包括浮游植物和浮游动物两方。需要说明的是,化学合成微生物包括夜光虫(Noctilucascintillans)等异养微生物。此外,在本公开中,作为鱼贝类的病害,存在弧菌等细菌、锦鲤疱疹(koi herpes)等病毒、其他原生生物等分类,是指以鱼贝类为对象可能成为病原体的病害。
作为与生物色素量、生物发光量对应的值,可列举出:浓度、吸光度或荧光光度。作为生物色素的例子,可列举出:叶绿素、胡萝卜素类、叶黄素类(xanthophyll)(叶黄素、岩藻黄素等)、藻胆素类(藻蓝蛋白、藻红蛋白等)。作为生物发光的例子,可列举出基于荧光素-荧光素酶的化学反应的发光。通过测定吸光度,能进行由DNA、RNA构成的核酸、蛋白质等生物标本(biospecimen)的定性、定量,由此能进行水中的细菌、病毒、原生生物等的总量的定性、定量的判断。生物色素量和生物发光量是成为赤潮/青潮/水华等的产生要因的环境因子的一个例子。
此外,确认到感染赤潮等的形成种的病毒(例如,HaRNAV(赤潮异弯藻病毒)、HcRNAV、HcDNAV等)参与赤潮等的终结现象,上述病毒包含于赤潮等的终结因子之一。
水质数据例如包括关于水中的上层/中层/下层3层的上述项目的数据。不过,水质数据也可以包括关于水中的2层或者4层以上的上述项目的数据。水质数据根据预测的目的,可以为海水的数据,也可以为淡水的数据。
预测器输出所输入的时序数据的各项目的单位时间后的估计值。单位时间根据系统要求适当确定即可,例如,可以设为1小时、6小时、1天(24小时)等。上述的N只要为2以上就任意,N单位时间例如可以设为成为3天以上,更优选为7天以上,进一步优选为30天以上的值。需要说明的是,在说明变量存在缺失时,可以通过进行缺失值(missing value)内插等来进行估计值的计算。
根据上述的构成,预测器对于输入的全部说明变量,输出单位时间后的各项目的估计值,因此能使估计值递归至预测器而进一步得到下一单位时间后的估计值。通过反复进行该递归预测,能长期且高精度地实现包括叶绿素浓度的环境因子的预测。
本方案中的环境因子预测装置也可以进一步具备:预报单元,基于通过所述预测单元预测的叶绿素浓度,预报赤潮/青潮/水华的产生。预报单元预报赤潮的开始期或结束期或者这两方为好。预报单元预报青潮的开始期或结束期或者这两方为好。预报单元预报水华的开始期或结束期或者这两方为好。赤潮/青潮/水华的产生和终结的判定例如使用东京都环境局那样的公共机构、水产研究/教育机构及其他大学等研究机构或者民间企业所公布的叶绿素浓度的判定基准值即可。需要说明的是,与浮游生物种、细菌种对应的判定基准值也被公布,因此在如后所述利用微生物数据进行预测的情况下,也可以使用与优势浮游生物种、优势细菌种对应的判定基准值来判定赤潮等的产生和终结。
本方案中的预测器也可以进一步接受对试样水进行采样而得到的采样数据作为说明变量,来预测单位时间后的微生物数据。采样数据的一个例子为与水中所含的微生物相关的微生物数据。作为微生物数据的例子,可列举出:利用PCR扩增技术得到的浮游生物类(18S rRNA基因区域、18S rRNA基因序列)、细菌(16S rRNA基因区域、16SrRNA基因序列)的定性/定量(比率)数据,显微镜的视觉水平下的藻类的定性/定量(个体数)数据。此外,采样数据的另一例子为利用NMR分析、ICP分析得到的水圈中的有机物/无机物的定性的或者定量的有机物数据/无机物数据。通过在采样数据中使用微生物数据,预报单元也能预报产生的赤潮、青潮或水华中的优势浮游生物种、优势细菌种。
也可以为,本方案中的预测单元基于由与所述预测器不同的模拟(simulation)得到的气象预报数据或水质预报数据,对由所述预测器得到的气象数据或水质数据的估计值进行了校正之后,作为所述预测器的输入。
此外,在本方案中,气象数据也可以包括风速。由于风速对水中的流速造成影响,因此能通过将风速也加入考虑来进行更高精度的预测。
此外,在本方案中,预测器也可以通过机器学习来进行学习。作为机器学习的例子,可列举出:Simple RNN(简单循环神经网络)、LSTM(Long Short-Term Memory:长短期记忆网络)、GRU(Gated Recurrent Unit:门控循环单元)这样的RNN(循环神经网络)。就机器学习的算法而言,只要能根据上述的说明变量的时序数据输出各项目的单位时间后的估计值,来进行作为本发明的效果所期望的环境因子的预测,其种类就不限。除循环神经网络以外,可列举出强化学习(Reinforcement Learning)等,但并不限定于此。此外,学习完毕模型也可以通过迁移学习来重建。此外,预测器也可以不为通过机器学习来进行学习的预测器,例如也可以为通常的模拟器(simulator)。
本发明还可以理解为通过计算机执行上述的处理的环境因子预测方法。即,本发明的另一方案为通过计算机执行的环境因子预测方法,所述环境因子预测方法的特征在于,包括:第一步骤,将水质数据和气象数据作为说明变量,获取该说明变量的时序数据,所述水质数据包括水中的多层中的、与生物色素量或生物发光量对应的值、水温、盐分浓度、溶解氧、浊度以及流速,所述气象数据包括气温、降水量以及日照时间;第二步骤,使用根据所述说明变量的时序数据输出单位时间后的该说明变量的各项目的估计值的预测器,获取在所述获取步骤中获取到的时序数据的单位时间后的所述说明变量的各项目的估计值;以及第三步骤,反复进行将在所述第二步骤中获取到的估计值再次作为所述预测器的输入的所述第二步骤的处理,由此预测直至N单位时间后的所述水质数据。
本发明还可以理解为用于使计算机执行上述方法的程序。本发明也可以理解为用于进行上述方法的学习完毕模型。本发明还可以理解为存储该程序或学习完毕模型的计算机可读存储介质。
发明效果
根据本发明,能长期且高精度地预测成为赤潮/青潮/水华、鱼贝类的病害等的产生要因的环境因子。
附图说明
图1是对本实施方式中的预测的概要进行说明的图。
图2是用于对预测器进行学习的学习装置的功能框图。
图3是一个实施方式的赤潮预测装置的功能框图。
图4是一个实施方式的赤潮预测装置中的赤潮预测处理的流程图。
图5是另一实施方式的赤潮预测装置的功能框图。
图6是另一实施方式的赤潮预测装置中的赤潮预测处理的流程图。
图7是对实施例的预测器的学习结果进行说明的图(分析例1)。
图8是对使用了实施例的预测器的长期预测的结果进行说明的图(分析例1)。
图9是表示实施例的预测器的学习结果和长期预测结果的另一例子的图(分析例2)。
图10是表示进行了缺失值内插的海洋采样数据的图(分析例3)。
图11是表示实施例的预测器的学习结果和长期预测结果的另一例子的图(分析例3)。
图12是表示缺失值内插方法的比较评价结果的图。
图13是对利用迁移学习而生成的预测器的预测结果进行说明的图。
图14是对也使用通过外部模拟得到的数据进行的长期预测的预测结果进行说明的图。
具体实施方式
(第一实施方式)
以下,参照附图对本具体实施方式进行说明,但本发明并不限定于此。以下说明的各实施方式的构成要素可以适当组合。此外,在以下的实施方式中,为了预测赤潮的产生,将海水数据作为对象来处理。在预测青潮的产生的情况下,也将海水数据作为对象来处理。在预测水华的产生的情况下,将淡水数据作为对象来处理即可。
作为赤潮形成种,已知属于硅藻类、针胞藻(raphidophytes)类、涡鞭毛藻类、隐藻类、纤毛虫等的浮游生物。它们均较多包含叶绿素a和叶绿素c。在本实施方式中,作为说明变量,在叶绿素中也可以选择叶绿素a和/或叶绿素c的浓度,进行赤潮的开始期或结束期的预报。
已知在硅藻类中,属于骨条藻属、海链藻属、弯角藻属、根管藻属、角毛藻属等的种等常常成为赤潮的优势种,在针胞藻类中,属于赤潮异弯藻(Heterosigma)属、卡盾藻属的种等常常成为赤潮的优势种,在涡鞭毛藻类中,属于原甲藻属、角藻属、夜光藻属(Noctiluca)、凯伦藻属等的种等常常成为赤潮的优势种,在隐藻类中,属于蓝隐藻属等的种等常常成为赤潮的优势种,在纤毛虫中,属于中缢虫属(红色中缢虫)的种等常常成为赤潮的优势种。
在本实施方式中,作为用于环境因子预测的说明变量,除了叶绿素a和/或叶绿素c的浓度等以外,作为微生物数据,可以将这些硅藻类、针胞藻类、涡鞭毛藻类和/或隐藻类等真核生物中特异性18SrRNA基因序列的定性/定量(比率)数据用作追加的说明变量,进行被预测产生的赤潮中的优势浮游生物种、优势细菌种的预报。
若蓝藻(蓝色细菌、cyanobacteria)、绿藻(小球藻、衣藻等)占优势,则产生水华。在蓝藻占优势的情况下,可认为在环境中较多包含叶绿素d、叶绿素f。因此,作为用于环境因子预测的说明变量,在叶绿素中也可以选择叶绿素d和/或叶绿素f的浓度等,进行水华的开始期或结束期的预报。
此外,除了叶绿素d的浓度、叶绿素f的浓度以外,作为微生物数据,可以将蓝色细菌(原核生物)中特异性16SrRNA基因序列的定性/定量(比率)数据用于说明变量,进行成为被预测产生的水华的原因的细菌种的预报。
需要说明的是,在蓝色细菌中,也存在如作为群体性蓝藻(Trichodesmium)而已知的束毛藻属那样引起赤潮的种类。因此,也可以选择叶绿素d和/或叶绿素f的浓度等作为说明变量,进行赤潮的开始期或结束期的预报。
此外,除了叶绿素d的浓度、叶绿素f的浓度以外,作为微生物数据,也可以通过将蓝色细菌中特异性16SrRNA基因序列的定性/定量(比率)数据用于说明变量,进行成为被预测产生的赤潮的原因的细菌种的预报。
此外,除了叶绿素d的浓度、叶绿素f的浓度以外,可以将参与感染赤潮形成种的终结现象的病毒(例如,HaRNAV(赤潮异弯藻病毒)、HcRNAV、HcDNAV等)的定量值等数据用于说明变量,进行赤潮的结束期的预报。这些病毒的定量值通过吸光度等的测定而得到,因此,符合与生物色素量或生物发光量对应的值。
<整体概要>
以下,以赤潮产生的长期预测的情况为例进行说明。对于进行赤潮产生的长期预测重要的是,不是直接预测1周后、1个月后,而是预测1天后、1小时后。其原因在于,在紧前发生的现象对接下来发生的现象产生强烈影响,因此预测的时期越远,预测精度越会下降。因此,确立精度良好地预测紧后的现象的方法是重要的,若能做到这一点,则通过反复进行将短期的预测值再次应用于预测模型、计算出下一预测值的处理,能进行精度良好的长期预测。
在本发明中,如图1所示,根据包括叶绿素a浓度的水质和气象的观测时序数据,通过使用了预测器的回归预测,来估计单位时间后的各项目的预测值。预测器例如以1天为单位,将3天的叶绿素a浓度、水温、气温等作为输入数据,求出1天后的各项目的估计值。通过将该估计值递归地输入预测器,能进行叶绿素a浓度的长期预测。并且,能根据叶绿素a浓度的长期预测进行赤潮产生的开始期、结束期的预测。
<预测器的学习>
图2表示用于对预测器进行学习的学习装置10的构成。学习装置10包括学习数据获取部11、预处理部12、学习部13作为其功能部。学习装置10为包括运算处理器、存储装置、输入装置、输出装置、通信装置等的计算机(信息处理装置),通过运算处理器执行程序来实现它们的功能。
学习数据获取部11获取用于预测器15的学习的学习数据。用作学习数据的说明变量大致分为海洋数据(水质数据)和气象数据。
海洋数据包括关于海洋中的上层/中层/下层的叶绿素a浓度、水温、盐分浓度、溶解氧量、浊度、流速。海洋数据也可以进一步包括pH。需要说明的是,在此,采用叶绿素a浓度作为叶绿素浓度,代替该叶绿素a浓度或者除此以外,也可以采用叶绿素b浓度、叶绿素c浓度、叶绿素d浓度、叶绿素e浓度、叶绿素f浓度等其他叶绿素的浓度。此外,也可以采用菌绿素(Bacteriochlorophyll)a、b、c、d、e、f、g等的浓度。叶绿素为生物色素的一个例子,也可以采用其他生物色素,例如胡萝卜素类、叶黄素类(叶黄素、岩藻黄素等)、藻胆素类(藻蓝蛋白、藻红蛋白等)的浓度。此外,也可以不将叶绿素浓度作为说明变量而将吸光度或荧光光度作为说明变量。对于其他生物色素也同样。此外,代替叶绿素浓度或者除此以外,也可以将生物发光量作为说明变量。例如,存在基于夜光虫等的荧光素-荧光素酶的化学反应的发光量。海洋数据除了可以通过对海水进行采样或向海水中投入传感器进行直接计测以外,也可以通过使用了利用人造卫星的高光谱传感器的远程计测来获取。在该情况下,相对于水流的方向是上游或是下游的水平方向距离也可以成为预测因子。
气象数据包括气温、降水量、日照时间。气象数据也可以进一步包括气压、风速、湿度、云量。
这些海洋数据和气象数据的观测值由气象厅、东京湾环境信息中心等公共机构等定期地观测而公开,因此学习数据获取部11只要获取这些观测值即可。不过,也可以使用民间企业等其他机构公开的数据、独自观测到的数据。
在学习数据中,除了上述以外,也可以追加利用使用了海洋采样的试样(海水)的实验得到的微生物数据。例如,也可以追加利用海水的PCR扩增序列技术得到的浮游生物类(18S rRNA基因区域、18S rRNA基因序列)、细菌(16SrRNA基因区域、16SrRNA基因序列的定性/定量(比率)数据。此外,也可以追加利用海水的NMR分析、ICP分析得到的海洋有机物/无机物的定性/定量数据。此外,也可以追加显微镜的视觉水平下的藻类的定性/定量(个体数)数据。
此外,也可以在海洋数据、气象数据中使用利用气象/海洋的模拟得到的预报数据。例如,也可以使用如下数据:使用全球数值预报模型(GSM)得到的、以地球整体的大气为对象的气压、风速、风量、风向、气温、湿度、降水量、云量、日射量(向下短波辐射量)、红外辐射量(向下长波辐射量)等。也可以使用如下数据:不使用全球数值预报模型,而使用中尺度数值预报模型(MSM)得到的、以预报对象地域的大气为对象的上述的各数据。此外,也可以使用如下数据:使用海洋大循环模型(例如,区域海洋模式系统(Regional Ocean ModelingSystem,ROMS)等)得到的、以地球整体的海水为对象的海流、水温、盐分浓度等。此外,也可以使用利用将大气与海洋结合而成的模型得到的预报数据。
此外,也可以使用如下数据:使用河川流入模型得到的叶绿素浓度、水温、盐分浓度、溶解氧量、浊度、流速等。
预处理部12进行离群值(outlier)处理、缺失值内插、数据集成(dataintegration)、归一化的处理。预处理部12根据需要对离群值、缺失值进行排除或者内插。在内插中,采用利用了k近邻法、MissForest、中值(median)、平均值等的值即可。缺失值内插在数据具有周期性的情况下、变动少的情况下特别有效。归一化为使最大值为1、最小值为0的处理。预处理部12也可以根据需要进行将连续数据转换为离散数据的离散化处理和数据的压缩处理(特征分解)。
学习部13进行预测器(预测模型)15的学习,该预测器15根据规定天数(例如,3天)的观测时序数据,求出输入数据所含的各说明变量的1天后的估计值。由于进行基于时序数据的预测,因此预测器15可以利用循环神经网络(RNN),具体而言,可以利用Simple RNN、长短期记忆网络(Long Short-Term Memory,LSTM)、门控循环单元(Gated Recurrent Unit,GRU)等。就机器学习的算法而言,只要能根据说明变量的时序数据输出各项目的单位时间后的估计值,来进行作为本实施方式的效果所期望的环境因子的预测,其种类就不限。除循环神经网络以外,可列举出强化学习等,但并不限定于此。此外,学习完毕模型也可以通过迁移学习来重建。此外,预测器也可以不为通过机器学习来进行学习的预测器,例如也可以为通常的模拟器。
<赤潮产生预测>
图3表示用于预测赤潮的产生的赤潮预测装置20的一个实施方式的构成。赤潮预测装置20包括:输入数据获取部21、长期预测部22、预测器23、预报部24作为其功能部。赤潮预测装置20为包括运算处理器、存储装置、输入装置、输出装置、通信装置等的计算机(信息处理装置),通过运算处理器执行程序而实现它们的功能。
图4是表示赤潮预测装置20所进行的赤潮预测处理的流程的流程图。以下,参照图3和图4,对赤潮预测装置20进行说明。需要说明的是,在本构成例中,假定预测器23基于海洋观测数据和气象观测数据进行了学习。
首先,在步骤S101中,输入数据获取部21获取进行赤潮产生预测的地点处的最近的A天(规定天数)的观测数据。在此,获取3天(A=3)的海洋观测数据25和气象观测数据26。
在循环L1中,长期预测部22反复进行将最近的A天的数据输入预测器23来预测第二天的数据,将其进一步递归至预测器23,从而预测直至第N天的数据。具体而言,设为A=3,首先根据第T-1天至第T-3天的观测数据预测第T天的数据,根据第T天的预测数据和第T-1、第T-2天的观测数据预测第T+1天的数据,根据第T+1、第T天的预测数据和第T-1天的观测数据预测第T+2天的数据。通过反复进行该过程,能进行直至第N天的数据的预测。在此,例如只要N为2以上的整数就可以为任意的值,例如可以设为N=30。
直至第N天的预测完成后,在步骤S103中,预报部24基于直至N天后的叶绿素a浓度,预测赤潮的产生开始期和结束期。在赤潮的产生和终结的判定中,例如使用利用东京都环境局那样的公共机构所公布的叶绿素a浓度得到的判定基准值即可。
图5表示另一实施方式的赤潮预测装置30的构成。图6是表示本构成例中的赤潮预测装置30所进行的赤潮预测处理的流程的流程图。对与上述相同的构成/处理标注相同的附图标记。
与上述构成(图3)的不同点在于,也使用微生物采样数据27和气象预报数据28来进行赤潮产生预测。在本构成例中,假定预测器23基于海洋观测数据、气象观测数据、微生物采样数据、气象预报数据进行了学习。
输入数据获取部21在步骤S101中获取A天的海洋观测数据25、气象观测数据26以及微生物采样数据27。此外,输入数据获取部21在步骤S201中获取直至N天后的气象预报数据。气象预报数据例如为通过全球数值预报模型(GSM)以地球整体的大气为对象的气压、风速、风量、风向、气温、湿度、降水量、云量日射量等模拟数据。
在循环L1的处理中,长期预测部22将海洋观测数据、气象观测数据以及采样数据输入预测器23来预测1天后的数据,将其进一步递归至预测器23是同样的。不过,在步骤S202中,长期预测部22基于获取到的气象预报数据对由预测器23预测的气象数据进行了校正之后,递归输入预测器23。具体的校正的方法为任意的,例如可假定取算术平均或取加权平均。如此,通过在对气象数据的预测值进行了校正之后,递归至预测器23,能进行精度更好的预测。需要说明的是,对于海洋观测数据(水质数据)25,也可以同样地通过基于模拟的预测数据,对由预测器23预测的海洋数据(水质数据)进行了校正之后,递归输入预测器23。
在直至N天后的步骤S103中,预报部24基于直至N天后的叶绿素a浓度预测赤潮的产生开始期和结束期。而且,预报部24也基于被预测产生的时期的微生物采样数据的预测值,来预测产生的赤潮中的优势浮游生物种、优势细菌种。需要说明的是,预报部24也可以使用与优势浮游生物种、优势细菌种对应的判定基准(例如在凯伦藻种为优势种的情况下,为500细胞/ml以上等)来预测赤潮的产生开始期和结束期。在本构成例中,也利用微生物采样数据,因此,这样一来能进行优势浮游生物种、优势细菌种的预测,和使用与优势浮游生物种、优势细菌种对应的判定基准来进行赤潮产生的预测。
<分析例1>
作为赤潮预测的实施例,尝试了以东京湾奥(浦安冲)为对象,预测作为赤潮产生的指标的叶绿素a浓度。就实时的气象观测数据而言,从气象厅的网站获取江户川临界的每隔1小时的日照时间和降水量,计算出每1天的平均值和总量。就实时的海洋观测数据而言,从东京湾环境信息中心的网站获取关于浦安冲的每隔1小时的叶绿素a浓度、水温、盐分浓度、溶解氧量、浊度、流量(流速)的海洋上层/中层/下层的数据和风量(风速)的数据,计算出每1天的平均值和总量。
在本实施例中使用的说明变量具体而言为以下所述的52个项目。
[海洋数据]
·叶绿素a浓度(上层/中层/下层:1天平均值)
·水温(上层/中层/下层:1天平均值)
·盐分浓度(上层/中层/下层:1天平均值)
·溶解氧量(上层/中层/下层:1天平均值)
·浊度(上层/中层/下层:1天平均值)
·流速(上层/中层/下层:关于东西南北各成分的1天平均值和1天合计值)
[气象数据]
·气温(1天平均值)
·降水量(1天平均值、1天合计值)
·日照时间(1天平均值、1天合计值)
·风速(关于东西南北各成分的1天平均值和1天合计值)
预测器将1~3天前的上述52个项目作为说明变量,将第0天的52个项目作为响应变量(response variable)。就是说,输入层和输出层的节点数设为相同的数,建立全部变量的预测模型。隐藏层设为100个节点。
就预测器的学习而言,使用循环神经网络的三种算法(Simple RNN、LSTM、GRU)来进行,其结果是,GRU示出最良好的预测。将其结果示于图7。图7的A表示观测数据中的叶绿素a浓度的变动。将其中7年的数据用作学习数据(训练数据),将1年的数据用作测试数据(验证数据)。图7的B是使利用使用GRU进行了学习的预测器得到的1天后的预测结果与观测数据重叠地示出的图。将使用了学习数据的预测和观测值进行比较,结果几乎一致,因此可知关于学习已经充分地进行。此外,平均学习误差(RMSE)成为11.97μg/L。为了进行过拟合(Overfitting)的确认和通用性的评价,将未用于学习的约1年的测试数据应用于预测模型,进行1天后的预测。预测误差成为15.29μg/L,可知预测的通用性高。
而且,向如此建立的1天后的预测模型中递归地输入预测值,进行直至30天后的长期预测。将其结果示于图8。图8的A与图7的A同样地为叶绿素a浓度的观测数据的变动,但将从2017年后半年至2018年1月中旬为止的期间放大显示。图8的B为将2017年12月末的3天的观测数据作为输入进行1天后的预测,使1天后预测值递归至预测模型,由此对直至2017年1月末为止的30天进行了预测的值。如图所示,对于直至2018年1月中旬为止的约15天,预测值与观测值示出良好的一致。如此可知本方法在长期预测中是有用的。
<分析例2>
接着,通过与分析例1的方法相同的方法,不使用风速数据地尝试了学习和预测。用于分析的数据与上述分析例1基本相同,但说明变量的数量为从上述52个项目中排除了与风速相关的8个项目后的44个项目。
图9的A是与分析例1同样地将7年的观测数据用作学习数据,将剩下的1年的数据作为测试数据,使利用通过GRU算法进行了学习的预测器得到的预测结果与观测数据重叠地示出的图。预测误差成为18.11μg/L,可知得到了虽然低于分析例1但也充分的精度。
图9的B为向建立好的1天后的预测模型中递归地输入预测值,进行了直至30天后的长期预测的结果。与分析例1(图8的B)同样,将2017年12月末的3天的观测数据作为输入进行1天后的预测,使1天后预测值递归至预测模型,由此对直至2017年1月末为止的30天进行了预测的值。如此,即使不使用风速数据,也能预测2018年1月中旬产生的叶绿素a浓度的上升。
<分析例3>
接着,在分析例1的方法中,进一步加入海水的采样数据进行了学习和预测。在此,作为采样数据,利用作为试样水所含的微生物数据的腰鞭毛藻(Karenia brevis)等7个项目;作为有机物数据的氨基酸、糖类等214个项目;作为无机物数据的氮、磷、硅等20个项目。需要说明的是,不利用海洋数据和气象数据的52个项目中的1天合计值19个项目而利用33个项目。
在本分析中,利用川崎人工岛的3年的数据来进行学习。在各数据中存在很多缺失值,进行基于KNN(K-Nearest Neighbor,k近邻法)的内插。图10的A~图10的C表示作为例子的涡鞭毛藻(海洋微生物)、甘氨酸(有机物)、硅(无机物)的观测数据和内插数据。在图中,带圆标记的为观测数据,其他为通过内插而得到的数据。如此,通过进行缺失值内插作业,将离散数据转换为连续数据(1天单位的数据),将海洋数据和气象数据与采样数据集成。
图11的A表示从2015年4月至2018年11月为止的约3年半的观测数据中的叶绿素a浓度的变动。在该观测数据中,将之前的3年数据用作学习数据(训练数据),将其余用作测试数据(验证数据)。图11的B是使利用使用GRU进行了学习的预测器得到的1天后的预测结果与观测数据重叠地示出的图。学习误差为5.93μg/L,预测误差为8.21μg/L,可知通过加入采样数据,能实现精度更好的预测。
<缺失值内插方法的研究>
在观测数据特别是采样数据中大多包含缺失值,因此进行了缺失值内插方法的比较评价。在此,对上述的72天的每1天的采样数据(微生物7个项目、代谢物214个项目、元素20个项目)进行了LOOCV(留一交叉验证)。
图12是表示通过各内插方法得到的内插值与观测值之间的误差的箱形图(boxplot)。内插方法所示的下划线之后的数值表示,在KNN中从多少个数据取得最近邻距离,或对于MatFac(Matrix Factorization:矩阵分解)、SVD、SoftImpute,对多少成分进行特征分解而生成内插模型。
在图12中,从平均误差(RMSD)小的方法开始按顺序排列表示。在作为矩阵内插系统的方法的SVD、SoftImpute中发现误差变大的项目较多,相对于此,KNN、MissForest等机器学习性内插方法在全部项目中有误差变小的倾向。因此可以说,优选采用机器学习性内插方法,进一步优选采用设为K=15或30的KNN。需要说明的是,即使是机器学习性内插方法以外的方法,若为图12所示的KNN#30至random之间的方法,则也可以进行误差少的内插。
<变形例>
在上述的说明中,使用隔1天的数据进行预测,但数据的时间间隔可以更长也可以更短。例如,也可以利用隔1小时的数据进行学习和预测。
此外,在上述的说明中,设为预测器使用3天(3单位时间)的数据来预测1天后的数据,但也可以使用更长期间的数据来预测1天后的数据。通过延长天数,能期待预测精度的提高,特别是若数据的周期性反映在学习中,则大大有助于预测精度的提高。另一方面,通过延长天数,遭遇缺失值数据的可能性也变高,因此也考虑这一点来确定天数为好。
在上述的实施例中,对作为输入数据使用海洋观测数据25和气象观测数据26这两种的例子(图3),以及使用海洋观测数据25、气象观测数据26、采样数据27以及气象预报数据28这四种的例子(图5)进行了说明。然而,作为输入数据,也可以使用海洋观测数据25、气象观测数据26以及采样数据27这三种,也可以使用海洋观测数据25、气象观测数据26以及气象预报数据28这三种。此外,采样数据27也可以包括微生物、有机物以及无机物中的仅一种或仅两种的数据。
在上述的构成中,由于算法上没有使用地域特征,因此可以利用使用某地域的学习数据(训练模型)的学习完毕模型进行其他地域的环境因子的预测。如此,通过得到不使用地域特征的学习完毕模型,能进行在任意地域的预测。需要说明的是,也可以将地形要素、地域的特征性气候等加入说明变量,在该情况下,能期待在对象地域的预测精度的提高。
在上述的说明中预测了赤潮的产生,但也可以通过相同的构成来预测青潮的产生。此外,也可以设为不进行直至赤潮、青潮的产生预测为止的处理,而进行直至叶绿素a浓度的预测为止的处理的环境因子预测方法和装置。此外,也可以通过与上述同样的构成来预测水华的产生,在该情况下,试样水不为海水而为淡水。
(第二实施方式)
本实施方式与第一实施方式基本上相同,不同之处在于:基于使用某地域的学习数据进行了学习的预测器进行迁移学习,并应用于其他地域。
第一实施方式不将地理特征用作说明变量,因此使用某地域的学习数据进行了学习的预测器也能用于其他地域。这在无需在各安装现场获取学习数据方面是有效的,但若直接应用预测器,则可能引起预测精度降低。因此,在本实施方式中,使用迁移学习来生成适合于安装现场的预测器。
在本实施方式中,首先通过第一实施方式的方法,生成能获取足够量的学习数据的地域(例如东京湾)处的预测器(学习模型)。该预测器(学习模型)也可以称为事先学习完毕的预测器(学习模型)。接着,准备应用预测器的安装现场处的学习数据。学习数据的内容本身与第一实施方式相同。使用安装现场处的学习数据,进一步进行预测器的学习。此时,也可以设为预测器的网络中接近输入的层的权重固定而仅调整接近输出的层的权重。或者,也可以设为仅调整与地理参数相关连的节点的权重,具体而言,仅调整(推定为)受地理特异性的影响大的节点的权重。例如,也可以预先使用多个场所的学习数据来进行学习,仅调整重要度根据场所而改变的节点。就权重的信息而言,在本实施方式中,通过基于随机森林(random forest)的重要度的计算来得到,但也可以使用其他机器学习算法来得到。在本实施方式中,使用通过这样的迁移学习而得到的预测器,进行在现场的预测。
图13是对将预测器A直接应用于安装现场(伊万里湾的金枪鱼养殖场)时的预测与应用预测器B时的预测进行比较的图,预测器A不使用迁移学习而使用东京湾的学习数据进行了学习,预测器B使用安装现场的学习数据进行了迁移学习。
图表1300表示安装现场中的叶绿素a浓度的实测值。图表1301表示使用了预测器A的1天后的预测值,图表1302表示使用了预测器A的3天后的预测值。为了进行比较,实测值也以细线表示。由图可知,在该例子中,预测值与实测值的误差大。需要说明的是,由于3天后的预测中误差大,因此未进行使用了预测器A的7天后的预测。
图表1311~1313分别为对使用通过迁移学习进行了学习的预测器B的1天后、3天后、7天后的预测值进行了标示的图表。可知通过进行迁移学习,预测精度提高。即使为7天后预测,也能预测叶绿素a浓度,即赤潮的产生和终结。
如此,根据本实施方式,基于预先进行了学习的预测器对学习数据多的地域进行迁移学习,因此即使安装现场处的学习数据少,也能容易地生成精度高的预测器。在第一实施方式中,未将与地理要因直接相关的参数用作说明变量,但各参数如何影响赤潮产生,可能会因地理影响而变化。各参数间的权重通过迁移学习被调整为反映在安装现场的特异性,从而预测精度提高。
此外,根据本实施方式,能提取每个安装现场的重要因子。也可以设为求出迁移学习完毕的学习模型和事先学习完毕的学习模型中的每个参数的贡献率,输出贡献率上位的参数。例如,就在东京湾中贡献率高的参数而言,在有机物/无机物中,依次为K、S、Ca、Tp、Sr、B、NH3-N、Na,在环境物理参数中,依次为叶绿素a浓度、日照时间、pH、水温、西风、东风、溶解氧量、南风。另一方面,就在伊万里湾中贡献率高的参数而言,在有机物/无机物中,为Sr、Mg、K、B、Na、S、Ca、Li,在环境物理参数中,为北风、南风、日照时间、西风、叶绿素a浓度、东风、降水量、水温。如此,根据本实施方式,能求出对安装现场重要的因子。
(第三实施方式)
本实施方式在于:在赤潮产生预测中使用气象模拟数据、海洋模拟数据、河川流入模拟数据。赤潮产生装置的构成与图5相同。
将在本实施方式中使用的通过观测得到的海洋数据和气象数据、以及通过模拟得到的数据作为说明变量,将1个时间步长(time step)后的海洋数据和气象数据作为响应变量来进行预测。
以下,海洋数据或者气象数据这样的术语是指,通过观测而得到或通过预测器23预测的数据,将通过与预测器23不同的模拟得到的数据称为模拟数据。
首先,输入数据获取部21获取最近的规定时间步长的海洋观测数据25和气象观测数据26。此外,输入数据获取部21获取最近的规定时间步长和作为长期预报的对象的时间步长的模拟数据。
预测器23将最近的规定时间步长的海洋数据、气象数据、以及最近的规定时间步长和作为长期预报的对象的时间步长的模拟数据作为输入,预测1个时间步长后的海洋数据和气象数据。长期预测部22利用预测的海洋数据和气象数据,每隔1个时间步长预测直至规定时间步长为止的海洋数据和气象数据。需要说明的是,需要说明的是,也可以将对预测器23的输入设为最近的规定时间步长的海洋数据、气象数据以及模拟数据。
需要说明的是,预测器23的学习通过与第一实施方式相同的方法进行即可。不过,不同之处在于:在学习数据中除了使用观测数据以外,也使用模拟数据。
以下,按照以东京湾为对象进行的预测的具体例子进行说明。
在本例子中,作为海洋数据,采用上层/中层/下层各自的叶绿素a浓度、水温、盐分浓度、溶解氧量(DO)、浊度、流速(东西成分、南北成分)(21个项目)。作为气象数据,采用气温、风速(东西成分、南北成分)、降水量、日照时间(5个项目)。
作为海洋模拟数据,采用浮游植物量、水温、盐分浓度、东西流速、南北流速、浮游动物量、氨态氮(ammonium nitrogen)、硝态氮(nitrate nitrogen)(8个项目)。作为气象模拟数据,采用气温(海上2m)、降水量(从该时刻起1小时的累计降水量)、向下短波辐射、向下长波辐射(4个项目)。作为河川流入模拟的数据,采用来自小丝川、小柜川、多摩川、鹤见川、荒川、隅田川、江户川、花见川的流入量(8个项目)。需要说明的是,在海洋模拟中采用ROMS,在气象模拟中采用MSM。
在本例子中,将6小时设为1个时间步长,获取每6小时的观测数据和模拟数据,预测器23根据最近6个时间步长(36小时)预测下一个时间步长的海洋数据和气象数据。在预测器23的学习中,使用CNN-QRNN(卷积神经网络-神经网络回归)算法。此外,长期预测部22重复6次利用预测器23进行的预测,来预测直至6个时间步长后(36小时后)的海洋数据和气象数据。
图14表示东京湾中的叶绿素a浓度的实测值和使用在本例子中进行了学习的预测器的预测值。图表1400表示叶绿素a浓度的实测值。图表1401~1406分别表示6、12、18、24、30、36小时后的预测值。为了进行比较,实测值也以细线表示。
(第四实施方式)
在第一~第三实施方式中,为了预测赤潮、青潮、水华的产生,而预测浮游生物、细菌等光合微生物、化学合成微生物的量。上述的技术除了用于赤潮、青潮、水华以外,也可以用于鱼贝类的病害产生预测。在该情况下,需要使海洋数据(水质数据)中包含表示成为病害的原因的病原体(causative agent)的量的参数。
作为病害的例子,可列举出弧菌病。弧菌病为以弧菌属细菌为病原体的感染症的总称。弧菌属细菌的量可以通过宿主特异性DNA序列进行计测。在病原体为原生生物的情况下,病原体的量可以通过特异性DNA序列进行计测。在病原体为病毒的情况下,病原体的量可以通过特异性RNA或DNA序列进行计测。
此外,通过吸光度的测定,能进行由DNA、RNA构成的核酸、蛋白质等生物标本的定性、定量。由此能进行水中的细菌、病毒、原生生物等的总量的定性、定量的判断。具体而言,将海水、湖水等环境水回收,利用过滤器等生成后,测定吸光度即可。通过吸光度测定得到的病毒的定性、定量值相当于本发明中的与生物色素量或生物发光量对应的值。
本实施方式也可以与第一~第三实施方式中的任意实施方式组合实施。
附图标记说明
10:学习装置;11:学习数据获取部;12:预处理部;13:学习部;20:赤潮预测装置;21:输入数据获取部;22:长期预测部;23:预测器;24:预报部。

Claims (17)

1.一种环境因子预测装置,所述环境因子是水质,所述环境因子预测装置具备:
预测器,将水质数据和气象数据作为说明变量,根据该说明变量的时序数据,输出单位时间后的该说明变量的各项目的估计值,所述水质数据是选自水中的多层中的、叶绿素浓度、水温、盐分浓度、溶解氧、浊度以及流速中的至少一种,所述气象数据是选自气温、降水量、日照时间以及风速中的至少一种;以及
预测单元,反复进行将利用所述预测器得到的估计值再次作为所述预测器的输入的预测,由此预测直至N单位时间后的所述水质数据,其中,N为2以上的整数。
2.根据权利要求1所述的环境因子预测装置,其中,
所述说明变量包括从试样水中采样的微生物、有机物以及无机物中的至少任一种的数据。
3.根据权利要求1或2所述的环境因子预测装置,其中,
所述环境因子预测装置进一步具备:预报单元,基于通过所述预测单元预测的叶绿素浓度,预报赤潮、青潮或水华的产生。
4.根据权利要求3所述的环境因子预测装置,其中,
所述预报单元预报赤潮的开始期或结束期。
5.根据权利要求3所述的环境因子预测装置,其中,
所述预报单元预报青潮的开始期或结束期。
6.根据权利要求3所述的环境因子预测装置,其中,
所述预报单元预报水华的开始期或结束期。
7.根据权利要求3所述的环境因子预测装置,其中,
所述预测器的说明变量进一步包括与水中所含的微生物相关的微生物数据,
所述预报单元也基于通过所述预测单元预测的微生物数据,预报被预测产生的赤潮、青潮或水华中的优势浮游生物种或优势细菌种。
8.根据权利要求7所述的环境因子预测装置,其中,
所述预报单元使用与所述优势浮游生物种或优势细菌种对应的判定基准值,预报赤潮、青潮或水华的产生的开始期或结束期。
9.根据权利要求1或2所述的环境因子预测装置,其中,
所述预测单元基于由与所述预测器不同的模拟得到的气象预报数据或水质预报数据,对由所述预测器得到的气象数据或水质数据的估计值进行了校正之后,作为所述预测器的输入。
10.根据权利要求1或2所述的环境因子预测装置,其中,
所述预测器通过机器学习来进行学习。
11.根据权利要求1或2所述的环境因子预测装置,其中,
所述预测器通过利用迁移学习对学习模型进行学习而得到,
所述迁移学习使用基于第二地域中的水质数据和气象数据的观测值的第二学习数据,所述学习模型使用基于第一地域中的水质数据和气象数据的观测值的第一学习数据进行了学习。
12.一种环境因子预测方法,所述环境因子是水质,所述环境因子预测方法包括:
第一步骤,将水质数据和气象数据作为说明变量,获取该说明变量的时序数据,所述水质数据是选自水中的多层中的、叶绿素浓度、水温、盐分浓度、溶解氧、浊度以及流速中的至少一种,所述气象数据是选自气温、降水量、日照时间以及风速中的至少一种;
第二步骤,使用根据所述说明变量的时序数据输出单位时间后的该说明变量的各项目的估计值的预测器,获取在所述第一步骤中获取的时序数据的单位时间后的所述说明变量的各项目的估计值;以及
第三步骤,反复进行将在所述第二步骤中获取到的估计值再次作为所述预测器的输入的所述第二步骤的处理,由此预测直至N单位时间后的所述水质数据,其中,N为2以上的整数。
13.一种学习完毕模型,其包括预测模型,
所述预测模型将水质数据和气象数据作为说明变量,根据该说明变量的时序数据输出单位时间后的该说明变量的各项目的估计值,所述水质数据是选自水中的多层中的、叶绿素浓度、水温、盐分浓度、溶解氧、浊度以及流速中的至少一种,所述气象数据是选自气温、降水量、日照时间以及风速中的至少一种,
所述学习完毕模型用于使计算机发挥功能,使得反复进行将利用所述预测模型得到的估计值再次作为所述预测模型的输入的预测,由此预测直至N单位时间后的所述水质数据,其中,N为2以上的整数。
14.一种存储介质,其存储计算机程序产品或如权利要求13所述的学习完毕模型,所述计算机程序产品中的计算机程序被处理器执行时实现如权利要求12所述的方法的各步骤。
15.一种环境因子预测装置,所述环境因子是水质,所述环境因子预测装置具备:
预测器,将水质数据和气象数据作为说明变量,根据该说明变量的时序数据输出单位时间后的该说明变量的各项目的估计值,所述水质数据是叶绿素浓度,所述气象数据是选自气温、降水量、日照时间以及风速中的至少一种;以及
预测单元,反复进行将利用所述预测器得到的估计值再次作为所述预测器的输入的预测,由此预测直至N单位时间后的所述水质数据,其中,N为2以上的整数。
16.根据权利要求15所述的环境因子预测装置,其中,
所述预测器通过利用迁移学习对学习模型进行学习而得到,
所述迁移学习使用基于第二地域中的水质数据和气象数据的观测值的第二学习数据,所述学习模型使用基于第一地域中的水质数据和气象数据的观测值的第一学习数据进行了学习,
利用所述迁移学习,对与地理参数相关的节点的权重进行调整。
17.根据权利要求15或16所述的环境因子预测装置,其中,
所述预测器根据所述水质数据、所述气象数据、以及水质和气象中的至少一方的模拟数据的时序数据,输出单位时间后的所述水质数据和所述气象数据的各项目的估计值,
所述预测单元获取直至N单位时间后的所述模拟数据,反复进行将利用所述预测器得到的所述水质数据和所述气象数据的预测值、以及获取到的模拟数据的至少一部分作为输入的预测,由此预测直至N单位时间后的所述水质数据。
CN202080029086.4A 2019-04-15 2020-04-14 环境因子预测装置、方法、程序、学习模型及存储介质 Active CN113711087B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019-077300 2019-04-15
JP2019077300 2019-04-15
PCT/JP2020/016472 WO2020213614A1 (ja) 2019-04-15 2020-04-14 環境因子予測装置、方法、プログラム、学習済モデルおよび記憶媒体

Publications (2)

Publication Number Publication Date
CN113711087A CN113711087A (zh) 2021-11-26
CN113711087B true CN113711087B (zh) 2023-11-14

Family

ID=72837894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080029086.4A Active CN113711087B (zh) 2019-04-15 2020-04-14 环境因子预测装置、方法、程序、学习模型及存储介质

Country Status (4)

Country Link
US (1) US20220198303A1 (zh)
JP (2) JP7109123B2 (zh)
CN (1) CN113711087B (zh)
WO (1) WO2020213614A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111411608A (zh) * 2020-04-01 2020-07-14 中国科学院南京地理与湖泊研究所 湖底表层污染物和藻种扫除收集与捕获内源一体化方法
CN113158762B (zh) * 2021-02-23 2024-05-28 中国科学院南京地理与湖泊研究所 大型湖库滨岸带蓝藻水华堆积风险评估方法
CN113297801B (zh) 2021-06-15 2022-10-14 哈尔滨工程大学 一种基于steof-lstm的海洋环境要素预测方法
CN114169250B (zh) * 2021-12-24 2024-04-30 中国农业大学 一种基于时空序列的溶解氧预测方法及系统
CN114527716B (zh) * 2022-02-08 2023-12-15 海斯特(青岛)泵业有限公司 一种基于注意力机制和行为克隆模型的污水处理预测控制方法
CN114239422B (zh) * 2022-02-23 2022-05-17 中国海洋大学 基于机器学习提高海洋叶绿素a浓度预报准确度的方法
US20230279462A1 (en) * 2022-03-01 2023-09-07 Spectacular Labs, Inc. Methods for detecting microorganisms
WO2023234079A1 (ja) * 2022-06-01 2023-12-07 コニカミノルタ株式会社 データ処理装置、データ処理システム、データ処理方法及びプログラム
CN114723188A (zh) * 2022-06-09 2022-07-08 广东盈峰科技有限公司 水质预测方法、装置、计算机设备和存储介质
CN114881540B (zh) * 2022-07-04 2022-09-27 广东盈峰科技有限公司 确定水源治理方案的方法和装置、电子设备和存储介质
CN114965348B (zh) * 2022-07-27 2022-11-15 浙江数翰科技有限公司 基于污水检测的光谱解析方法和系统
CN115983131B (zh) * 2023-01-09 2023-07-04 淮阴工学院 一种水产品生长含氧量调控方法及装置
CN116310543B (zh) * 2023-03-14 2023-09-22 自然资源部第一海洋研究所 Gf-1 wfv卫星赤潮深度学习探测模型、构建方法及设备
CN117009887B (zh) * 2023-07-28 2024-02-13 中科景感(厦门)生态环境科技有限公司 流域水环境质量精细化估算及分析的方法及系统
CN116822658B (zh) * 2023-08-28 2024-01-26 长江三峡集团实业发展(北京)有限公司 一种风光资源的预警方法、装置、计算机设备及存储介质
CN117131365B (zh) * 2023-10-24 2024-02-13 自然资源部第二海洋研究所 基于海气动力场数据的赤潮预测方法、系统及介质
CN117350601B (zh) * 2023-12-06 2024-04-16 北京英视睿达科技股份有限公司 水质预测方法、装置、电子设备及存储介质
CN117740690B (zh) * 2023-12-19 2024-06-28 珠江水利委员会珠江水利科学研究院 一种水表溶解氧遥感估算方法、系统及可读存储介质
CN117725345B (zh) * 2024-02-08 2024-05-31 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于绿潮生物量密度的多源遥感绿潮生长速率测量方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002045074A (ja) * 2000-07-31 2002-02-12 Taisei Corp 有害赤潮の検知方法
JP2003225650A (ja) * 2002-02-01 2003-08-12 Toshiba Corp 水処理プロセスハイブリッド水質計測装置及びこれを有する水処理システム
JP2004317504A (ja) * 2003-03-31 2004-11-11 K Mikimoto & Co Ltd 有害な水質環境の検出方法および水質環境監視システム
CN101223019A (zh) * 2005-04-25 2008-07-16 东洋制罐株式会社 拉伸成形容器及其制备方法
JP2008214942A (ja) * 2007-03-02 2008-09-18 Gunma Prefecture アオコ発生予測と発生防止法
CN101533000A (zh) * 2009-03-05 2009-09-16 重庆大学 一种构建水体富营养化风险分析模型的方法
JP3155748U (ja) * 2009-07-03 2009-12-03 国土交通省中国地方整備局長 アオコ事前検知システム
JP2011118786A (ja) * 2009-12-04 2011-06-16 Sony Corp 情報処理装置、観測値予測方法、及びプログラム
CN102135531A (zh) * 2010-12-24 2011-07-27 中国科学院南京地理与湖泊研究所 大型浅水湖泊72小时蓝藻水华预测方法
CN104899653A (zh) * 2015-06-02 2015-09-09 北京工商大学 基于专家系统及蓝藻生长机理时序模型的湖库蓝藻水华预测方法
WO2016049371A2 (en) * 2014-09-26 2016-03-31 Blue Tribe, Inc. Platform, systems, and methods for obtaining shore and near shore environmental data via crowdsourced sensor network
CN106484976A (zh) * 2016-09-28 2017-03-08 西安交通大学 赤潮监测预警系统
KR20180112277A (ko) * 2017-04-03 2018-10-12 한국외국어대학교 연구산학협력단 이미지 프로세싱을 이용한 녹조 측정 장치 및 방법
CN109002888A (zh) * 2018-06-27 2018-12-14 厦门市海洋与渔业研究所 一种赤潮预警方法
CN109460869A (zh) * 2018-11-06 2019-03-12 北京英视睿达科技有限公司 水环境预警方法和装置
CN109564211A (zh) * 2016-08-12 2019-04-02 株式会社器官再生工学 健康度测定方法、健康度判断装置以及毛发健康诊断系统
KR102190912B1 (ko) * 2019-12-20 2020-12-15 동문이엔티(주) IoT 기반 실시간 녹조 측정 시스템
CN114564883A (zh) * 2022-02-11 2022-05-31 水利部交通运输部国家能源局南京水利科学研究院 融合机理与ML的湖泊叶绿素a短期集合预报方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090228516A1 (en) * 2008-03-10 2009-09-10 The Hong Kong Polytechnic University Harmful algae indexing (HaiDex) method

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002045074A (ja) * 2000-07-31 2002-02-12 Taisei Corp 有害赤潮の検知方法
JP2003225650A (ja) * 2002-02-01 2003-08-12 Toshiba Corp 水処理プロセスハイブリッド水質計測装置及びこれを有する水処理システム
JP2004317504A (ja) * 2003-03-31 2004-11-11 K Mikimoto & Co Ltd 有害な水質環境の検出方法および水質環境監視システム
CN101223019A (zh) * 2005-04-25 2008-07-16 东洋制罐株式会社 拉伸成形容器及其制备方法
JP2008214942A (ja) * 2007-03-02 2008-09-18 Gunma Prefecture アオコ発生予測と発生防止法
CN101533000A (zh) * 2009-03-05 2009-09-16 重庆大学 一种构建水体富营养化风险分析模型的方法
JP3155748U (ja) * 2009-07-03 2009-12-03 国土交通省中国地方整備局長 アオコ事前検知システム
JP2011118786A (ja) * 2009-12-04 2011-06-16 Sony Corp 情報処理装置、観測値予測方法、及びプログラム
CN102135531A (zh) * 2010-12-24 2011-07-27 中国科学院南京地理与湖泊研究所 大型浅水湖泊72小时蓝藻水华预测方法
WO2016049371A2 (en) * 2014-09-26 2016-03-31 Blue Tribe, Inc. Platform, systems, and methods for obtaining shore and near shore environmental data via crowdsourced sensor network
CN104899653A (zh) * 2015-06-02 2015-09-09 北京工商大学 基于专家系统及蓝藻生长机理时序模型的湖库蓝藻水华预测方法
CN109564211A (zh) * 2016-08-12 2019-04-02 株式会社器官再生工学 健康度测定方法、健康度判断装置以及毛发健康诊断系统
CN106484976A (zh) * 2016-09-28 2017-03-08 西安交通大学 赤潮监测预警系统
KR20180112277A (ko) * 2017-04-03 2018-10-12 한국외국어대학교 연구산학협력단 이미지 프로세싱을 이용한 녹조 측정 장치 및 방법
CN109002888A (zh) * 2018-06-27 2018-12-14 厦门市海洋与渔业研究所 一种赤潮预警方法
CN109460869A (zh) * 2018-11-06 2019-03-12 北京英视睿达科技有限公司 水环境预警方法和装置
KR102190912B1 (ko) * 2019-12-20 2020-12-15 동문이엔티(주) IoT 기반 실시간 녹조 측정 시스템
CN114564883A (zh) * 2022-02-11 2022-05-31 水利部交通运输部国家能源局南京水利科学研究院 融合机理与ML的湖泊叶绿素a短期集合预报方法及系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Fu, Beide等."Transcriptome Analysis of Silver Carp (Hypophthalmichthys molitrix) by Paired-End RNA Sequencing".《DNA RESEARCH》.2012,第19卷(第19期),全文. *
乔方利,袁业立,朱明远,赵伟,季如宝,潘增弟,陈尚,万振文.长江口海域赤潮生态动力学模型及赤潮控制因子研究.海洋与湖沼.2000,(第01期),全文. *
庄野宏ほか."気象データを利用した機械学習・深層学習による八代海の赤潮予測".《水産海洋学会研究発表大会 講演要旨集》.2018,全文. *
杨静 ; 李海 ; 刘钦政 ; 何恩业 ; 任湘湘 ; .2006年渤海湾赤潮监控海域叶绿素-a的影响因子分析研究.海洋与湖沼.2012,(第06期),全文. *
苏新红 ; 金丰军 ; 杨奇志 ; 陈火荣 ; 俞秀霞 ; 李雪丁 ; 郭民权 ; 刘秋凤 ; 罗娟 ; .基于BP神经网络模型的福建海域赤潮预报方法研究.水产学报.2017,(第11期),全文. *
赵文喜 ; 周滨 ; 刘红磊 ; 李慧 ; 蒋定国 ; 季民 ; .基于BP神经网络的海河干流叶绿素浓度短时预测研究.水利水电技术.2017,(第11期),全文. *
長濱祐美ほか."土浦入を対象としたアオコ予測システムの構築と検証".《茨城県霞ヶ浦環境科学センター年報》.2017,13全文. *

Also Published As

Publication number Publication date
WO2020213614A1 (ja) 2020-10-22
JPWO2020213614A1 (zh) 2020-10-22
CN113711087A (zh) 2021-11-26
JP2022082681A (ja) 2022-06-02
JP7109123B2 (ja) 2022-07-29
US20220198303A1 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
CN113711087B (zh) 环境因子预测装置、方法、程序、学习模型及存储介质
Ralston et al. Modeling harmful algal blooms in a changing climate
Uyeda et al. A comprehensive study of cyanobacterial morphological and ecological evolutionary dynamics through deep geologic time
Maier et al. Use of artificial neural networks for modelling cyanobacteria Anabaena spp. in the River Murray, South Australia
Moisan et al. Modelling the effect of temperature on the maximum growth rates of phytoplankton populations
Ptacnik et al. Regional species pools control community saturation in lake phytoplankton
Andersen et al. Predicting ecosystem state changes in shallow lakes using an aquatic ecosystem model: Lake Hinge, Denmark, an example
Renken et al. Modelling the dynamics of coral reef macroalgae using a Bayesian belief network approach
Dauphin et al. Re-thinking the environment in landscape genomics
Mattei et al. A depth-resolved artificial neural network model of marine phytoplankton primary production
Alves-de-Souza et al. Does environmental heterogeneity explain temporal β diversity of small eukaryotic phytoplankton? Example from a tropical eutrophic coastal lagoon
Dai et al. Comparative performance of modelling approaches for predicting fish species richness in the Yangtze River Estuary
Peng et al. Current status and prospects of algal bloom early warning technologies: A Review
Kenitz et al. Environmental and ecological drivers of harmful algal blooms revealed by automated underwater microscopy
García-Nieto et al. Using evolutionary multivariate adaptive regression splines approach to evaluate the eutrophication in the Pozón de la Dolores lake (Northern Spain)
Abbas et al. Deep learning-based algorithms for long-term prediction of chlorophyll-a in catchment streams
Coopersmith et al. Understanding and forecasting hypoxia using machine learning algorithms
Kulaš et al. Succession of microbial community in a small water body within the alluvial aquifer of a large river
Hansen et al. Assessing the state of the Barents Sea using indicators: how, when, and where?
Hevia-Orube et al. Skeletonema species in a temperate estuary: a morphological, molecular and physiological approach
Janecki et al. The influence of biochemical parameters on primary production in the Gulf of Gdańsk region: A model study
Huang et al. A new high-resolution remote sensing monitoring method for nutrients in coastal waters
CN113155751B (zh) 富营养化湖泊poc垂向结构类型的遥感识别方法
Chen et al. Disentangling environmental effects on picophytoplankton communities in the Eastern Indian Ocean
Mellios et al. Predictive modeling of microcystin concentrations in a hypertrophic lake by means of Adaptive Neuro Fuzzy Inference System (ANFIS)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant