CN117611588B - 一种海洋环境污染早期检测和预警方法 - Google Patents

一种海洋环境污染早期检测和预警方法 Download PDF

Info

Publication number
CN117611588B
CN117611588B CN202410091595.XA CN202410091595A CN117611588B CN 117611588 B CN117611588 B CN 117611588B CN 202410091595 A CN202410091595 A CN 202410091595A CN 117611588 B CN117611588 B CN 117611588B
Authority
CN
China
Prior art keywords
comet
cell
image
model
mussel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410091595.XA
Other languages
English (en)
Other versions
CN117611588A (zh
Inventor
曲梦杰
江奕奕
邸雅楠
潘依雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Research Institute Of Zhejiang University
Original Assignee
Hainan Research Institute Of Zhejiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Research Institute Of Zhejiang University filed Critical Hainan Research Institute Of Zhejiang University
Priority to CN202410091595.XA priority Critical patent/CN117611588B/zh
Publication of CN117611588A publication Critical patent/CN117611588A/zh
Application granted granted Critical
Publication of CN117611588B publication Critical patent/CN117611588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10064Fluorescence image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioethics (AREA)
  • Quality & Reliability (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于海洋环境早期检测和预警技术领域,公开了一种海洋环境污染早期检测和预警方法。基于现有的贻贝彗星细胞图像,利用深度学习算法YOLOv8训练细胞分类模型和彗头识别模型,形成一种基于深度学习的海洋贻贝彗星检测方法。将待测海区的海洋贻贝彗星图像输入到上述方法中,可以快速、准确地得到贻贝Tail DNA%值。利用Tail DNA%值对所述贻贝细胞DNA损伤等级进行判定,根据所述损伤等级进一步对海洋环境污染做早期预警。本方法准确度高、检测通量高、标准化结果并且不依赖于人工,能对海洋环境污染早期检测,并作出准确预警。

Description

一种海洋环境污染早期检测和预警方法
技术领域
本发明属于海洋环境污染早期检测和预警方法技术领域。
背景技术
海洋环境污染早期检测和预警是为了及时发现、预测和应对海洋环境变化中的各种风险和威胁,早期检测和预警可以帮助人们及时了解海洋环境中存在的风险,有利于人们迅速采取相应措施,从而减少海洋污染对人类生存环境的影响,同时也有助于保护海洋生态系统的可持续发展。因此,对海洋环境污染早期检测,并作出准确预警,对海洋和人类都具有重要意义。
海洋环境被污染后,海洋中重金属、持久性有机污染物等污染物质大量积累,进而引起海洋初级生产力下降、生物体内毒物累积、生物种类减少、食物链被破坏等问题,从而导致生物多样性急剧下降。因此,通过检测一些海洋生物的生存或生理状态,可以一定程度上反映海洋环境好坏,进而做出预警。但由于海洋生物众多,选取哪一种生物、采用哪一种方法,能简单、快速、准确地检测海洋环境,是海洋环境早期检测和预警的难题。
申请人研究发现,以贻贝作为检测对象来对海洋环境进行检测和预警具有以下优点:作为一种模式生物,海洋贻贝具有一系列生理、生态上的优势,包括广泛分布、适应力强、运动能力弱、容易采集等,已被广泛应用于各类海洋环境监测项目中。加之,海洋贻贝是近海生态系统中的基石物种,在海洋食物链中起到承上启下的作用,以海洋贻贝为媒介监测海洋环境具有代表性和优越性。
彗星检测又被称为单细胞凝胶电泳实验,是一种在单细胞水平开展基因损伤检测的方法,也是海洋贻贝中敏感、稳定的生物标志物之一。当海洋贻贝细胞DNA受到海洋环境污染物(有机环境污染物、无机环境污染物等)损伤时,化学键会发生断裂,导致DNA超螺旋结构受损。通过使用裂解液和碱性电泳液,可以将断链和在碱性条件下易变性的小片段从DNA超螺旋结构中分离出来。在电泳电场的作用下,这些片段向阳极移动,损伤程度较低的大分子DNA片段迁移速度较慢,留在核区基本还能保持细胞核形态,形成类似彗星的头部(简称慧头)。而损伤程度较高的小分子DNA片段迁移速度较快,逸出细胞核区域呈现拖尾形态,形成类似彗星的尾巴(简称彗尾)。海洋贻贝DNA损伤程度越高,其DNA分子片段化越严重,彗尾就越明显(见附图1)。彗星检测利用这一原理检测海洋贻贝DNA损伤,具备操作简单、耗时短、准确性高以及高度灵敏的优点。
目前,海洋贻贝彗星检测主要依赖人工阅片的方式,并使用一些常见的分析软件,其中包括OpenComet、CaspLab(CASP)和Comet Assay IV。
OpenComet是Image J软件的一个彗星分析插件,它可以对彗星图像进行半自动识别,并具有结果可溯源的优点。然而,它对彗星图像的质量要求较高,可能会将杂质或堆叠细胞误认为彗星,从而导致结果偏差。CaspLab(CASP)是一款免费的分析软件,可以进行人工分析彗星图像,但其通量较低,对分析人员的专业性要求较高,且软件的稳定性较差。Comet Assay IV是一款付费的彗星分析软件,虽然分析性能稳定,但它依赖于人工识别,并且价格较高。
此外,人工阅片还存在以下缺陷:1)检测效率较低、检测通量较小以及误差相对较大;2)对检测人员的专业性要求高,并且检测人员的主观性也会在一定程度上影响实验结果。
因此,亟待开发一种准确度高、检测通量高、标准化结果并且不依赖于人工的智能判断方法,对海洋环境早期检测和预警。
发明内容
为解决上述技术问题,本发明一方面提供一种海洋环境污染早期检测和预警方法,其特征在于,包括以下步骤:
1)图像采集:采集待测海区的贻贝,采用单细胞电泳实验将所述贻贝制成样品,对所述样品染色后,采集所述样品中的细胞图像;
2)数据库构建:基于现有的贻贝细胞彗星图像,进行细胞分类模型训练和彗头识别模型训练,从而构建所述数据库;
3)参数计算:将步骤1)采集的所述细胞图像输入步骤2)所述数据库,所述数据库对所述细胞图像进行识别,并计算彗尾DNA百分比Tail DNA%;
4)污染预警:根据步骤3)计算的所述Tail DNA%水平对所述贻贝细胞DNA损伤等级进行判定,根据所述损伤等级进一步对海洋环境污染做早期预警。
利用彗星检测来表征海洋贻贝的基因损伤程度主要可以分析以下指标:性状指标(彗星细胞率)、距离指标(彗星总长、彗尾长度、彗头半径、彗尾半径)和强度指标(彗尾DNA百分比、彗头DNA百分比、彗头面积、彗尾面积)等(见附图2)。其中参数彗尾DNA百分比(TailDNA%)具有高度敏感性,其在低剂量范围内与DNA损伤呈线性关系,根据Tail DNA%变化水平可以监测低剂量海洋污染,同时可以反映出污染严重程度,以起到早期预警的作用。
进一步,所述Tail DNA%的计算方法如下:获取所述细胞图像中整个彗星的荧光强度L和彗头的荧光强度l,所述计算公式为:
进一步,所述Tail DNA%水平对海洋贻贝细胞DNA损伤等级判定方法如下:TailDNA%<5%,0级,无损伤;5%≤Tail DNA%<20%,1级,轻度损伤;20%≤Tail DNA%<40%,2级,中度损伤;Tail DNA%≥40%,3级,高度损伤。
进一步,所述贻贝细胞DNA损伤等级预警海洋早期污染方法如下:0级,无预警,说明海洋环境无污染;1级,蓝色预警,说明海洋环境轻度污染;2级,黄色预警,说明海洋环境中度污染;3级,红色预警,说明海洋环境重度污染。
进一步,步骤2)中构建所述数据库的方法如下:
①图像采集:获取大量贻贝细胞彗星的图像数据用于训练细胞分类模型;截取所述图像中的彗星细胞部分,重新组织彗星细胞数据集,将彗星细胞数据集分为训练集和测试集,建立用于训练和评估彗头识别模型;
②数据标注:对所述训练集和所述测试集的图像数据进行标注,所述标注方法包括绘制边界框,所述边界框标记出每个细胞的位置和边界;细胞分类模型为每个图像中的细胞添加标签信息,其中Stack代表细胞堆叠,Impurity代表杂质,Comet代表彗星;细胞识别模型中Head代表彗星头部;
③模型训练:利用迁移学习的方法,使用COCO数据集上预训练模型的权重初始化YOLOv8模型,使用所述YOLOv8算法分别训练细胞分类模型和彗头识别模型;在训练所述细胞分类模型的过程中,利用所述标注的图像数据集进行训练,将所述图像数据输入到YOLOv8模型中,并通过前向传播获取预测结果;在训练所述彗头识别模型的过程中,使用YOLOv8算法,并利用所述标注的图像数据集进行训练,通过前向传播获取预测结果;
④优化模型训练:使用交叉熵损失函数和随机梯度下降(SGD)优化算法,对所述细胞分类模型和所述彗头识别模型进行前向传播,计算损失;反向传播、参数更新和多次迭代对模型进行优化,以提高模型的准确性和泛化能力;
⑤集成模型:将训练好的所述细胞分类模型和所述彗头识别模型集成在一个算法中,所述算法被称为Tail DNA百分比算法,所述算法可以同时进行细胞分类和彗头识别。
进一步,步骤3)中所述的参数计算方法如下:
①图像输入:将采集的贻贝的细胞图像输入到所述Tail DNA百分比算法中,所算法读取所述细胞图像的相关信息;
②细胞分类:利用训练好的所述细胞分类模型,对所述细胞图像中的细胞进行分类,筛除疑似杂质和堆叠细胞,提取彗星细胞的荧光强度和位置信息;
③自动计数:在所述Tail DNA百分比算法中增加计数功能,使所述算法可以对识别到的彗星细胞进行自动计数;所述自动计数的最大数值,即为所述细胞图像中存在的彗星细胞的数量;
④彗头识别:利用训练好的所述彗头识别模型进行预测,从经过所述细胞分类处理的原图像中批量提取出所述彗星细胞,形成一系列新图像;
⑤计算Tail DNA%:读取步骤④中所述一系列新图像中每一个彗星细胞图像,获取每一个彗星细胞图像中彗星的荧光强度L和彗头的荧光强度l,运用所述公式计算每一个彗星细胞的Tail DNA%,计算所有彗星细胞Tail DNA%的算数平均值,得到所述一系列新图像的Tail DNA%。
进一步,所述一系列新图像中包括至少200个彗星细胞;进一步,至少包括300个彗星细胞;进一步,至少包括500个彗星细胞。彗星细胞的数量越多,结果越准确。但彗星细胞数量过多,检测耗费时间也会越长。综合考虑检测结果准确性和检测效率,所述一系列新图像中包括至少200个彗星细胞。
进一步,所述参数计算方法还包括:
⑥结果标注:将计算得到的结果标注在原图像中识别到的彗星细胞位置上,从而可以直观清晰地读取结果。
另一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述检测和预警方法。
另一方面,本发明提供一种计算装置,其特征在于,包括处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述检测和预警方法。
本发明通过构建基于深度学习的海洋贻贝彗星识别模型,运用先进的计算机视觉算法,简化了海洋贻贝彗星检测技术,提高了海洋贻贝DNA损伤检测效率和精度。
本发明的目的是提供一种基于深度学习的海洋贻贝DNA损伤检测方法,从而将其应用于海域污染监测。通过图像识别和机器学习算法优化,实现对海洋贻贝彗星图像的高精度、快速分析。所输出Tail DNA%与海域污染物的浓度具有明显正相关关系,海洋贻贝彗星检测可为海域污染预警监测提供指导作用。目前,我国在利用智能图像处理技术对海洋贻贝彗星进行检测以实现海洋环境监测目标方面尚处于初级阶段,存在一定空白需要深入开发。该技术在海洋环境监测领域存在广阔应用前景,未来应重点研究与发展,以开拓新的途径应对监测中存在的挑战。
本发明具有以下有益效果:
1)准确性:通过使用训练好的细胞分类模型和彗头识别模型,该方法可以实现对海洋贻贝彗星图像的准确识别和计数。模型经过训练和调优,具有较高的准确性,可以有效地区分彗星细胞和其他细胞类型,并准确测量彗头和彗尾的尺寸。
2)自动化:该方法通过集成算法和自动计数功能,实现了对海洋贻贝彗星的自动识别和计数。这种自动化的特点大大提高了识别和计数的效率,减少了人工操作的工作量和时间消耗。
3)彗头识别和彗尾分析:该方法不仅能够识别彗星细胞的整体形状和位置,还能够分析彗头和彗尾的荧光强度,并计算彗尾的DNA百分比。这为研究人员提供了更多关于DNA损伤程度的信息,有助于深入理解海洋贻贝的生物学特征和环境适应性。
4)结果可视化和统计报告:通过将计算结果标注在原图像中,研究人员可以直观地观察和读取识别结果。此外,根据计数结果和DNA百分比等数据,可以生成相应的统计报告,包括彗星细胞率、Tail DNA%和DNA损伤等级等。这些统计报告提供了对海洋贻贝群体DNA损伤程度的整体评估。
5)技术创新:本发明引入了深度学习技术,结合图像处理和机器学习算法,填补了国内海洋环境监测领域在贻贝彗星检测方面的技术空白。
附图说明
图1为海洋贻贝单细胞凝胶电泳图像。
图2为海洋贻贝彗星细胞检测。
图3为本申请整体技术路线图。
图4为单细胞电泳实验制备海洋贻贝样品及图像采集。
图5为细胞分类模型与彗头识别模型权重参数训练。
图6为训练数据集示例。
图7为基于深度学习的海洋贻贝彗星细胞识别及计数。
图8为人工阅片(以CASP软件为例)。
图9为海洋贻贝彗星图片与污染物浓度之间的关系。
具体实施方式
特别说明的是,本申请的海洋贻贝样品可以采用本领域中任意一种单细胞凝胶电泳实验制备。任意一种单细胞凝胶电泳实验制备的样品图像,均可以采用本申请的方法检测。为简化专利文本,以下仅描述一种单细胞凝胶电泳实验制备样品;该描述不意味着其他单细胞凝胶电泳实验不能用于本申请贻贝样品制备。
(一)单细胞凝胶电泳(也称彗星实验)制备海洋贻贝样品及图像采集
1. 实验材料:待测海区海洋贻贝、眼科剪刀、镊子、低熔点琼脂糖、正常熔点琼脂糖、氯化钠、氢氧化钠、曲拉通X-100、三氨基甲烷、乙二胺四乙酸二钠、盐酸、二甲基亚砜、溴化乙锭、过氧化氢、载玻片、盖玻片、载玻片夹、锥形瓶、离心管(1.5 mL)、无菌注射器(1mL)、移液器、吸头、离心机、彗星电泳槽、电泳电源、水浴锅、微波炉、荧光显微镜等。
2. 海洋贻贝血细胞提取:用剪刀从贻贝腹侧将壳撬开,排空内部的海水, 从贻贝的后闭壳肌中抽取400 μL血淋巴,在4℃,5000 rpm条件下离心2 min,得到去除上清液后的细胞团。
3. 铺胶与固定:在载玻片表面预先涂覆1.5%(w/v)的正常熔点琼脂糖,并让琼脂糖在载玻片上过夜干燥,备用。而后,取180 μL低熔点琼脂糖(0.75% w/v,熔点37℃),将②中得到的细胞团重悬于其中,然后吸取80 μL细胞重悬液滴于预铺有正常熔点琼脂糖的载玻片上(每个载玻片上含有2滴)。迅速将盖玻片覆盖在液滴上,并将胶片转移到4℃的冰箱中,固定至少1 h。
4. 裂解:待琼脂糖充分凝固后,取下盖玻片,将胶片置于新鲜配制的细胞裂解液工作液中(包含3.5 M氯化钠、100 mM乙二胺四乙酸二钠、10 mM三氨基甲烷、0.2 M氢氧化钠、10%二甲基亚砜(v/v)和1%曲拉通X-100(v/v)),进行1 h的裂解。使核膜被破坏,从而释放出DNA。
5. 解旋与电泳:将裂解后的胶片置于彗星电泳槽中,倒入新鲜配制的电泳液(1mM乙二胺四乙酸二钠、0.3 M氢氧化钠)解旋30 min,使DNA双链发生解旋。然后在相同电泳液中进行电泳(25 V恒压20 min)。
6. 中性化:将电泳后的胶片置于装有中性缓冲液(0.4 M三氨基甲烷、pH7.5)的染色缸中清洗3次(每次10 min)。
7. 染色与彗星图像采集:用20 μL溴化乙锭对彗星胶片进行染色并置于荧光显微镜下观察,在400×放大倍数下随机拍摄至少200个细胞。
图1为采用本申请的单细胞凝胶电泳实验制备海洋贻贝样品后,用荧光显微镜拍摄的图像。其中,(A)为未受损海洋贻贝细胞;(B)为受损海洋贻贝细胞,细胞呈现出彗星状。
(二)基于深度学习的海洋贻贝彗星检测
1、数据库构建:细胞分类与慧头识别模型权重参数训练
为区分出含有不同类型细胞的图像中的彗星,训练细胞分类模型,该模型用于区分图像中的细胞堆叠,杂质和彗星;为了获取彗尾的长度,以监测细胞的受损程度,训练彗头识别模型,形成权重参数文件,具体流程如下:
①图像采集:通过高分辨率图像采集设备,获取大量贻贝彗星的图像数据用于训练细胞分类模型;从该图像中截取彗星细胞部分,重新组织彗星细胞数据集用于训练彗头识别模型,将采集到的图像数据划分训练集和测试集,用于训练和评估识别模型。
②数据标注:对训练集和测试集的图像数据进行标注,标注包括通过绘制边界框的方式,准确地标记出每个细胞的位置和边界。为每个图像中的细胞添加标签信息,细胞分类模型中Stack代表细胞堆叠,Impurity代表杂质,Comet代表彗星;细胞识别模型中Head代表彗星头部。
③模型训练:利用深度学习算法YOLOv8进行目标识别,通过迁移学习,使用COCO数据集上预训练模型的权重初始化YOLOv8模型,通过训练细胞分类模型和彗头识别模型的YOLOv8模型来准确地分类细胞和识别彗头。
使用YOLOv8算法分别训练细胞分类模型和彗头识别模型。在细胞分类模型的训练过程中,利用标注的图像数据集进行训练。将图像数据输入到YOLOv8模型中,并通过前向传播获取预测结果。同样,在彗头识别模型的训练过程中,使用YOLOv8算法,并利用标注的图像数据集进行训练,通过前向传播获取预测结果。
④优化模型训练:使用交叉熵损失函数和随机梯度下降(Stochastic GradientDescent,SGD)优化算法,对所述细胞分类模型和所述彗头识别模型进行前向传播,计算损失,反向传播、参数更新和多次迭代对模型进行优化,以提高模型的准确性和泛化能力。
⑤集成模型:将训练好的所述细胞分类模型和所述彗头识别模型集成在一个算法中,所述算法被称为Tail DNA百分比算法,所述算法可以同时进行细胞分类和彗头识别。
3、基于训练模型的海洋贻贝彗星图像识别及参数计算
①图像输入:将需要识别的海洋贻贝彗星图像输入到Tail DNA百分比算法中,算法会读取图像的相关信息。
②细胞分类:首先利用已训练好的细胞分类模型,对图像中的细胞进行预测分类,筛除疑似杂质和细胞堆叠,提取出彗星细胞的荧光强度和位置信息,所述位置信息用于识别目标在图像中的坐标,用于计算彗星细胞长度。
③自动计数:在算法内增加计数功能,使其可以对识别到的彗星进行自动计数。通过这个功能,我们可以得到自动计数的最大数值,即图像中存在的彗星细胞数量。
④彗头识别:利用训练好的彗头识别模型进行预测,从经过细胞分类处理的原图像中批量提取出彗星细胞,形成一系列新图像,并按生成顺序依次编号为Fig X,其中X为生成的顺序,总计提取200个彗星细胞;
在另外一个实施例中,提取300个彗星细胞。
⑤计算Tail DNA%:读取④中一系列新图像中每一个彗星细胞图像,获取每一个彗星细胞图像中彗头的荧光强度L和彗头部分的荧光强度l,利用L和l值计算得到彗尾部位的荧光强度(L-l)。进而运用公式计算,每一个彗星细胞的TailDNA%值记为TX,其中X为生成顺序。取200个彗星细胞Tail DNA%值的算数平均值,得到一系列新图像的Tail DNA%值。
⑥结果标注:将计算得到的结果标注在原图像中识别到的彗星位置上,这样可以直观清晰地读取结果。
4、污染预警
根据计算的一系列新图像的Tail DNA%值对所述贻贝细胞DNA损伤等级进行判定,根据所述损伤等级进一步对海洋环境污染做早期预警,具体见下表。
表1 海洋贻贝DNA损伤等级与海洋环境污染早期预警判定标准
Tail DNA% 损伤程度 等级 海洋环境污染程度
<5% 无损伤 0级 无预警
5%≤Tail DNA%<20% 轻度损伤 1级 蓝色预警
20%≤Tail DNA%<40% 中度损伤 2级 黄色预警
≥40% 高度损伤 3级 红色预警
(三)与人工阅片对比
将上述(一)中采集的图像,采用熟练人工和生疏人工两种方法对海洋贻贝彗星图像进行分析,分析方法如下:以CASP软件为例,对图像中的彗星细胞进行人工识别,利用计数框对Tail DNA %结果进行计算(见附图8)。人工选取200个细胞,计算每一个细胞的TailDNA%,最后计算Tail DNA%的算数平均值。
采用本方法和人工阅片得到的结果,见下表2。
表2 三种海洋贻贝彗星分析方法结果对比
类型 Tail DNA % 损伤等级 显著性差异 用时/min
本方法 32.2±3.8 2 a 1
人工阅片(熟练) 39.2±1.2 2 a 6
人工阅片(生疏) 46.9±2.1 3 b 12
人工阅片(熟练)可相对快速识别彗星细胞并计算,人工阅片(生疏)识别彗星的准确度低且耗时长。本方法和人工阅片(熟练)所得的Tail DNA %分别为32.2±3.8和39.2±1.2,两者不存在显著性差异。相比之下,人工阅片(生疏)所得的Tail DNA %结果为46.9±2.1,与其余两种方法都存在显著差异。此外,本方法在保证识别结果准确的基础上,大大提升了分析效率(阅片时间/min:本方法1<熟练人工阅片6<生疏人工阅片12)。
(四)方法验证
为进一步验证,本发明的方法可以应用于海洋环境污染早期检测和预警,采用以下实验方法:
1)模拟海洋环境污染:取氯化铅溶于超纯水,制备氯化铅溶液储备液,将储备液按照一定比例加入培养体系,获得不同浓度梯度氯化铅胁迫组(5、50、500 μg/L),分别模拟不同程度海洋环境污染:轻度污染(铅浓度5 μg/L)、中度污染(铅浓度50 μg/L)和重度污染(铅浓度500 μg/L)。同时设置空白对照组(仅人工海水)和阳性对照组(1000 μM过氧化氢处理)。
2)贻贝饲养:将贻贝置于不同处理组中培养3天,每天更换培养体系,并根据不同铅浓度在培养体系中添加对应的铅溶液储备液。
3)实验室模拟铅胁迫3天后,按照上述(一)中描述单细胞电泳实验方法,提取贻贝血细胞并获得贻贝彗星实验细胞样品,并用荧光显微镜采集样品图像。
4)方法验证:将步骤3)采集的贻贝细胞图像,输入到上述(二)基于深度学习的海洋贻贝彗星检测方法中,对所述方法进行验证。
实验结果:
表3 方法验证实验结果
组别 Tail DNA% 损伤程度 等级 海洋环境污染程度
空白对照组 4.8 无损伤 0级 无预警
5 μg/L 铅浓度组 14.4 轻度损伤 1级 蓝色预警
50 μg/L 铅浓度组 21.6 中度损伤 2级 黄色预警
500 μg/L 铅浓度组 28.3 中度损伤 2级 黄色预警
1000 μM过氧化氢 36.2 中度损伤 2级 黄色预警
如上表3和图9所示,结果证明彗尾DNA百分比(Tail DNA%)具有高度敏感性,TailDNA%值与DNA损伤呈线性关系,Tail DNA%值越大,证明海洋贻贝DNA受损越严重。同时,海洋贻贝DNA受损程度也能准确反应海洋环境污染程度,通过不同铅浓度模拟不同程度的海洋环境污染,发现随着海洋环境污染程度加剧(铅浓度逐步升高),海洋贻贝DNA受损程度加剧。因此,采用本申请的方法,能迅速、准确地对海洋环境污染做出早期检测和预警。本实验结果进一步验证了本方法的可行性和准确性,填补了国内海洋环境监测领域在贻贝彗星检测方面的技术空白。

Claims (7)

1.一种海洋环境污染早期检测和预警方法,其特征在于,包括以下步骤:
1)图像采集:采集待测海区的贻贝,采用单细胞电泳实验将所述贻贝制成样品,对所述样品染色后,采集所述样品中的细胞图像;
2)数据库构建:基于现有的贻贝细胞彗星图像,进行细胞分类模型训练和彗头识别模型训练,从而构建所述数据库,构建方法如下:
①图像采集:获取大量贻贝细胞彗星的图像数据用于训练细胞分类模型;截取所述图像中的彗星细胞部分,重新组织彗星细胞数据集,将彗星细胞数据划分为训练集和测试集,用于训练和评估彗头识别模型;
②数据标注:对所述训练集和所述测试集的图像数据进行标注,标注方法包括绘制边界框,所述边界框标记出每个细胞的位置和边界;细胞分类模型为每个图像中的细胞添加标签信息,其中Stack代表细胞堆叠,Impurity代表杂质,Comet代表彗星;细胞识别模型中Head代表彗星头部;
③模型训练:利用深度学习算法YOLOv8进行目标识别,通过迁移学习,使用COCO数据集上预训练模型的权重初始化YOLOv8模型,使用YOLOv8算法分别训练细胞分类模型和彗头识别模型;在训练所述细胞分类模型的过程中,利用所述标注的图像数据集进行训练,将所述图像数据输入到YOLOv8模型中,并通过前向传播获取预测结果;在训练所述彗头识别模型的过程中,使用YOLOv8算法,并利用所述标注的图像数据集进行训练,通过前向传播获取预测结果;
④优化模型训练:使用交叉熵损失函数和随机梯度下降优化算法,对所述细胞分类模型和所述彗头识别模型进行前向传播,计算损失;反向传播、参数更新和多次迭代对模型进行优化,以提高模型的准确性和泛化能力;
⑤集成模型:将训练好的所述细胞分类模型和所述彗头识别模型集成在一个算法中,所述算法被称为Tail DNA百分比算法,所述算法同时进行细胞分类和彗头识别;
3)参数计算:将步骤1)采集的所述细胞图像输入步骤2)所述数据库,所述数据库对所述细胞图像进行识别,并计算彗尾DNA百分比Tail DNA%;计算方法如下:
①图像输入:将采集的贻贝的细胞图像输入到Tail DNA百分比算法中,所算法读取所述细胞图像的相关信息;
②细胞分类:利用训练好的所述细胞分类模型,对所述细胞图像中的细胞进行预测分类,筛除疑似杂质和堆叠细胞,提取彗星细胞的荧光强度和位置信息;
③自动计数:在所述Tail DNA百分比算法中增加计数功能,使所述算法对识别到的彗星细胞进行自动计数;所述自动计数的最大数值,即为所述细胞图像中存在的彗星细胞的数量;
④彗头识别:利用训练好的所述彗头识别模型进行预测,从经过所述细胞分类处理的原图像中批量提取出所述彗星细胞,形成一系列新图像;
⑤计算Tail DNA%:读取步骤④中所述一系列新图像中每一个彗星细胞图像,获取每一个彗星细胞图像中彗星的荧光强度L和彗头的荧光强度l,运用Tail DNA%的计算公式计算每一个彗星细胞的Tail DNA%;所述Tail DNA%的计算公式如下:
计算所有彗星细胞Tail DNA%的算数平均值,得到所述一系列新图像的Tail DNA%;
4)污染预警:根据步骤3)计算的所述Tail DNA%水平对所述贻贝细胞DNA损伤等级进行判定,根据所述损伤等级进一步对海洋环境污染做早期预警。
2.根据权利要求1所述的方法,其特征在于,Tail DNA%水平对海洋贻贝细胞DNA损伤等级判定如下:Tail DNA%<5%,0级,无损伤;5%≤Tail DNA%<20%,1级,轻度损伤;20%≤TailDNA%<40%,2级,中度损伤;Tail DNA%≥40%,3级,高度损伤。
3.根据权利要求2所述的方法,其特征在于,贻贝细胞DNA损伤等级预警海洋早期污染如下:0级,无预警,说明海洋环境无污染;1级,蓝色预警,说明海洋环境轻度污染;2级,黄色预警,说明海洋环境中度污染;3级,红色预警,说明海洋环境重度污染。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述一系列新图像中包括至少200个彗星细胞。
5.根据权利要求1-3中任一项所述的方法,其特征在于,参数计算还包括:
⑥结果标注:将计算得到的结果标注在原图像中识别到的彗星细胞位置上,从而直观清晰地读取结果。
6.一种计算机可读存储介质,所述存储介质上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
7.一种计算装置,其特征在于,包括处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-5中任一所述的方法。
CN202410091595.XA 2024-01-23 2024-01-23 一种海洋环境污染早期检测和预警方法 Active CN117611588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410091595.XA CN117611588B (zh) 2024-01-23 2024-01-23 一种海洋环境污染早期检测和预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410091595.XA CN117611588B (zh) 2024-01-23 2024-01-23 一种海洋环境污染早期检测和预警方法

Publications (2)

Publication Number Publication Date
CN117611588A CN117611588A (zh) 2024-02-27
CN117611588B true CN117611588B (zh) 2024-05-24

Family

ID=89953829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410091595.XA Active CN117611588B (zh) 2024-01-23 2024-01-23 一种海洋环境污染早期检测和预警方法

Country Status (1)

Country Link
CN (1) CN117611588B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007024612A (ja) * 2005-07-14 2007-02-01 Matsushita Ecology Systems Co Ltd コメットアッセイ解析方法およびコメットアッセイ画像解析装置およびコメットアッセイ解析装置
RU2404453C1 (ru) * 2009-05-04 2010-11-20 Учреждение Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН Способ обработки и анализа изображений кометоподобных объектов, полученных методом "днк-комет"
CN105044191A (zh) * 2015-07-24 2015-11-11 哈尔滨工业大学 一种鱼类肌肉组织细胞基因损伤检测的彗星实验方法
CN105891305A (zh) * 2016-06-15 2016-08-24 深圳烟草工业有限责任公司 一种卷烟烟气冷凝物生物安全性的检测方法
CN106018529A (zh) * 2016-07-07 2016-10-12 中国科学院重庆绿色智能技术研究院 一种单细胞凝胶电泳检测细胞dna损伤的试剂盒及方法
CN106442909A (zh) * 2016-09-14 2017-02-22 中国海洋大学 一种定量评价海洋环境变化的方法
CN106568824A (zh) * 2016-11-08 2017-04-19 浙江大学 复合重金属胁迫下贻贝dna损伤的检测方法
GB201711561D0 (en) * 2017-07-18 2017-08-30 Spermcomet Ltd Method and apparatus
CN112782144A (zh) * 2021-01-21 2021-05-11 长沙学院 一种基于dna损伤修复缺陷活细胞彗星检测水体中有机污染物毒性的方法
CN113688948A (zh) * 2021-10-11 2021-11-23 中核检修有限公司 一种基于YOLO v5的附着海生物种类识别方法
CN114943900A (zh) * 2022-05-13 2022-08-26 南方海洋科学与工程广东省实验室(广州) 基于深度学习的海洋环境质量等级评价方法、装置及介质
CN117253229A (zh) * 2023-11-17 2023-12-19 浙江大学海南研究院 基于深度学习的海洋贻贝微核细胞识别与计数方法及应用

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007024612A (ja) * 2005-07-14 2007-02-01 Matsushita Ecology Systems Co Ltd コメットアッセイ解析方法およびコメットアッセイ画像解析装置およびコメットアッセイ解析装置
RU2404453C1 (ru) * 2009-05-04 2010-11-20 Учреждение Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН Способ обработки и анализа изображений кометоподобных объектов, полученных методом "днк-комет"
CN105044191A (zh) * 2015-07-24 2015-11-11 哈尔滨工业大学 一种鱼类肌肉组织细胞基因损伤检测的彗星实验方法
CN105891305A (zh) * 2016-06-15 2016-08-24 深圳烟草工业有限责任公司 一种卷烟烟气冷凝物生物安全性的检测方法
CN106018529A (zh) * 2016-07-07 2016-10-12 中国科学院重庆绿色智能技术研究院 一种单细胞凝胶电泳检测细胞dna损伤的试剂盒及方法
CN106442909A (zh) * 2016-09-14 2017-02-22 中国海洋大学 一种定量评价海洋环境变化的方法
CN106568824A (zh) * 2016-11-08 2017-04-19 浙江大学 复合重金属胁迫下贻贝dna损伤的检测方法
GB201711561D0 (en) * 2017-07-18 2017-08-30 Spermcomet Ltd Method and apparatus
CN112782144A (zh) * 2021-01-21 2021-05-11 长沙学院 一种基于dna损伤修复缺陷活细胞彗星检测水体中有机污染物毒性的方法
CN113688948A (zh) * 2021-10-11 2021-11-23 中核检修有限公司 一种基于YOLO v5的附着海生物种类识别方法
CN114943900A (zh) * 2022-05-13 2022-08-26 南方海洋科学与工程广东省实验室(广州) 基于深度学习的海洋环境质量等级评价方法、装置及介质
CN117253229A (zh) * 2023-11-17 2023-12-19 浙江大学海南研究院 基于深度学习的海洋贻贝微核细胞识别与计数方法及应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
三种典型POPs对紫贻贝不同组织DNA损伤的比较研究;周海龙 等;《海洋科学》;20111231;第35卷(第02期);第32-37页 *
单细胞凝胶电泳技术在海洋环境监测中的应用;宛立 等;《Conference on Environmental Pollution and Public Health (CEPPH 2012)》;20121231;第307-312页 *
基于 YOLO 的贻贝检测算法;董兆鹏 等;《上海海洋大学学报》;20230824;第1-13页 *
多环芳烃对海洋贝类多生物水平毒性效应的研究进展;张翼飞 等;《生态毒理学报》;20190228;第14卷(第1期);第18-29页 *

Also Published As

Publication number Publication date
CN117611588A (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
Peniuk et al. Identification and quantification of suspended algae and bacteria populations using flow cytometry: applications for algae biofuel and biochemical growth systems
CN103616356A (zh) 一种船舶压载水中微藻的分类装置和分类方法
CN113658640B (zh) 一种淡水生态系统健康评价方法
CN104946740A (zh) 一种海洋褐潮生物群落结构的检测方法
CN110616269A (zh) 一种基于生物体响应监测评价莱州湾海洋牧场环境质量的方法
CN113450317A (zh) 一种针对妇科临床微生物感染的免疫荧光图像检测方法
CN117611588B (zh) 一种海洋环境污染早期检测和预警方法
CN107988408B (zh) 一种鉴定浒苔近缘种的引物对、dna条形码及其应用和检测方法
CN112183459B (zh) 一种基于进化多目标优化的遥感水质图像分类方法
Monchamp et al. Comparative analysis of zooplankton diversity in freshwaters: What can we gain from metagenomic analysis?
CN109457017B (zh) 一种快速定量硅藻细胞密度的分子检测方法
CN110277139B (zh) 一种基于互联网的微生物限度检查系统及方法
CN101231229A (zh) 液体含菌量非染色自动计数方法
Zhang et al. Environmental DNA metabarcoding serves as a promising method for aquatic species monitoring and management: A review focused on its workflow, applications, challenges and prospects
CN116757998A (zh) 基于ai的ctc细胞和ctc样细胞的筛查方法及装置
CN111310792A (zh) 一种基于决策树的药敏实验结果识别方法与系统
CN108986096A (zh) 一种基于三维荧光光谱与Tchebichef矩的混合油液辨识方法
Penna et al. Detection and identification of toxic microalgae by the use of innovative molecular methods
CN110616271B (zh) 一种定量检测环境中红耳龟生物量的特异性引物及其检测方法和应用
Kabiraj et al. Species Identification in Diatoms using DNA Barcoding: An Overview
CN101892310A (zh) Dgge技术在检测浮游植物群落结构中的使用方法
CN106754323A (zh) 一种微生物基因检测分析仪
CN117253229B (zh) 基于深度学习的海洋贻贝微核细胞识别与计数方法及应用
Chen et al. An Active Learning Model Production Method for Electric Power Inspection Image Multi-target Detection
CyToMETry Artificial neural networks contribute to the identification of cryptomonad taxa

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant