CN117314908B - 一种烤烟病毒溯源方法、介质及系统 - Google Patents
一种烤烟病毒溯源方法、介质及系统 Download PDFInfo
- Publication number
- CN117314908B CN117314908B CN202311604743.5A CN202311604743A CN117314908B CN 117314908 B CN117314908 B CN 117314908B CN 202311604743 A CN202311604743 A CN 202311604743A CN 117314908 B CN117314908 B CN 117314908B
- Authority
- CN
- China
- Prior art keywords
- flue
- cured tobacco
- image
- tracing
- tobacco
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 155
- 241000208125 Nicotiana Species 0.000 title claims abstract description 151
- 241000700605 Viruses Species 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000000007 visual effect Effects 0.000 claims abstract description 32
- 230000005540 biological transmission Effects 0.000 claims abstract description 9
- 208000015181 infectious disease Diseases 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 15
- 230000003902 lesion Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 239000002207 metabolite Substances 0.000 claims description 9
- 102000004169 proteins and genes Human genes 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000003708 edge detection Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012805 post-processing Methods 0.000 claims description 5
- 244000061176 Nicotiana tabacum Species 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004949 mass spectrometry Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 8
- 230000009385 viral infection Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000002503 metabolic effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种烤烟病毒溯源方法、介质及系统,属于烤烟病毒溯源技术领域,该烤烟病毒溯源方法、介质及系统包括:构建带有烤烟病毒的烤烟的蛋白质组学、代谢组学、图像视觉特征的综合指纹;建立烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型;获取待溯源区域的烤烟的图像;根据关系模型,计算待溯源区域的烤烟的细胞指纹;根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度,判断所述待溯源区域是否为目标病毒的传播地。本发明提供的烤烟病毒溯源方法、介质及系统有效解决了在烤烟病毒溯源过程中,存在需要做大量生物实验导致耗时长,不能快速溯源的技术问题。
Description
技术领域
本发明属于烤烟病毒溯源技术领域,具体而言,涉及一种烤烟病毒溯源方法、介质及系统。
背景技术
传统的烟草病毒溯源主要依赖于生物学实验方法。典型的技术路线是:收集病毒感染烤烟样本,通过组织培养、PCR扩增、克隆识别等实验手段分离鉴定病毒,获得病毒的遗传序列信息。然后在疑似病毒来源地区采集大量烤烟样本,重复 ABOVE实验流程,获得所有区域烤烟的病毒遗传信息。最后利用生物信息学工具比对不同地区烤烟样本的病毒基因/基因组序列,根据序列相似性判定病毒的传播方向,进而推断病毒的地理来源。
这种基于实验分离鉴定的传统方法存在以下问题:1)需要进行大量的样品收集、样品前处理和样品检测等实验操作,非常耗时耗力;2)病毒的分离过程复杂,受样本状态、操作过程等影响,容易引入人为误差;3)依赖于病毒的遗传信息进行溯源,需要确保收集到足够代表性的样本,否则可能导致结果偏差。
综上,利用传统实验方法进行烤烟病毒溯源,耗时长、成本高,并且结果容易受样本量及操作过程影响。随着烤烟种植区域扩大,如果仍沿用这种逐步推进的方法,很难满足快速溯源的需求。这成为制约烤烟病毒溯源与防控的瓶颈。
发明内容
有鉴于此,本发明提供一种烤烟病毒溯源方法、介质及系统,能够解决在烤烟病毒溯源过程中,存在需要做大量生物实验导致耗时长,不能快速溯源的技术问题。
本发明是这样实现的:
本发明的第一方面提供一种烤烟病毒溯源方法,其中,包括以下步骤:
S10、构建带有烤烟病毒的烤烟的蛋白质组学、代谢组学、图像视觉特征的综合指纹;
S20、建立烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型;
S30、获取待溯源区域的烤烟的图像;
S40、根据关系模型,计算待溯源区域的烤烟的细胞指纹;
S50、根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度,判断所述待溯源区域是否为目标病毒的传播地。
在上述技术方案的基础上,本发明的一种烤烟病毒溯源方法还可以做如下改进:
其中,所述的烤烟的蛋白质组学、代谢组学、图像视觉特征的获取方法为:
收集烤烟病毒感染烟叶的细胞样本;
提取所述细胞样本中的蛋白质和代谢产物;
利用质谱技术分析所提取的蛋白质组学和代谢组学特征;
同时采集感染烟叶的部位图像;
对烟叶部位图像进行分割,获得感染区域的切片图像;
提取所述烟叶部位图像和切片图像的颜色、质地、病变区的视觉特征作为图像视觉特征。
进一步的,所述对烟叶部位图像进行分割,获得感染区域的切片图像的步骤,具体包括:
对输入的烟叶部位图像进行预处理,包括转换为灰度图,中值滤波去噪,校正图像失真,得到预处理后的图像;
在预处理图像上,采用分割算法对烟叶进行区域分割;
对分割结果进行后处理,包括开闭运算去噪或轮廓拟合,最终得到精确的感染区域切片图像。
进一步的,所述提取所述烟叶部位图像和切片图像的颜色、质地、病变区的视觉特征作为图像视觉特征的步骤,具体包括:
在得到的感染区域切片图像上,采集分割图像的RGB三通道直方图,统计感染区域的颜色分布特征;
采用基于GLCM矩阵的方法对分割图像进行质地特征分析,提取质地特征至少包括对比度、熵值;
计算分割图像的形状特征,描述感染区域的形态,所述形状特征至少包括Hu不变矩、圆形度;
计算分割图像的病变覆盖率,反映感染程度,所述病变覆盖率具体是一棵烤烟株的外表面感染区域所占表面积的比例;
将上述得到的颜色分布特征、质地特征、形状特征、病变覆盖率特征,组成烟叶图像的视觉特征向量。
其中,所述关系模型采用机器学习方法建立。
进一步的,所述对烟叶部位图像进行分割采用的是基于边缘检测和区域生长的分割算法。
其中,所述根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度步骤中,使用的相似度计算方法为余弦相似度。
其中,所述判断所述待溯源区域是否为目标病毒的传播地的步骤中,判断标准为:如果待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹相似,则说明待溯源烤烟受目标病毒感染,判定为病毒的传播源地。
本发明的第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的烤烟病毒溯源方法。
本发明的第三方面提供一种烤烟病毒溯源系统,其中,包含上述的计算机可读存储介质。
与现有技术相比较,本发明提供的一种烤烟病毒溯源方法、介质及系统的有益效果是:节省了样品采集和样品处理的时间。本发明直接利用病毒感染区域的烤烟图像、组织和代谢物,不需要进行病毒的分离培养和鉴定,避免了繁杂的样品处理步骤,可以在较短时间内完成数据采集。建立的指纹模型综合多源信息。本发明整合了基于图像、蛋白质组和代谢组的特征指纹,从不同层面反映了烤烟对病毒的响应,指纹信息量丰富,可以充分代表病毒感染的状态。这比仅依赖单一指标更全面和准确,有效解决了在烤烟病毒溯源过程中,存在需要做大量生物实验导致耗时长,不能快速溯源的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种烤烟病毒溯源方法的流程图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,是本发明第一方面提供一种烤烟病毒溯源方法的流程图,本方法包括以下步骤:
S10、构建带有烤烟病毒的烤烟的蛋白质组学、代谢组学、图像视觉特征的综合指纹;
S20、建立烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型;
S30、获取待溯源区域的烤烟的图像;
S40、根据关系模型,计算待溯源区域的烤烟的细胞指纹;
S50、根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度,判断待溯源区域是否为目标病毒的传播地。
下面对每个步骤的具体实施方式进行详细描述:
步骤S10的具体实施方式是:
1) 收集不同品种的烤烟样本,并检测是否感染目标病毒。将感染目标病毒的烤烟样本标记为实验组,未感染的标记为对照组。每个组至少收集20个样本。
2) 对实验组和对照组的烤烟样本进行蛋白质组学分析。具体步骤包括:提取烤烟组织中的蛋白质,进行酶解得到肽段,使用液相色谱-质谱联用技术(LC-MS)对肽段进行分离鉴定,得到每个样本的蛋白质表达谱。使用差异表达分析方法,比较实验组与对照组在蛋白质表达谱上的差异,筛选出与目标病毒感染相关的差异表达蛋白。这些差异表达的蛋白质可以构成烤烟-病毒感染的蛋白质组学指纹。
3) 对实验组和对照组的烤烟样本进行代谢组学分析。具体步骤包括:提取烤烟组织中的代谢产物,使用气相色谱-质谱联用技术(GC-MS)对代谢产物进行分离鉴定,得到每个样本的代谢表达谱。使用差异表达分析方法,比较实验组与对照组在代谢表达谱上的差异,筛选出与目标病毒感染相关的差异表达代谢物。这些差异表达的代谢物可以构成烤烟-病毒感染的代谢组学指纹。
4) 收集实验组烤烟样本的图像,使用图像处理算法提取烤烟叶片的颜色、形态、脉络等视觉特征,构建烤烟图像视觉特征矩阵。
5) 利用多元统计分析方法,整合蛋白质组学指纹、代谢组学指纹和图像视觉特征,构建烤烟-病毒感染的综合指纹。该指纹可以有效反映病毒感染对烤烟的影响,用于后续的溯源判断。
上述方法的效果是:
1) 应用蛋白质组学和代谢组学技术,从分子层面筛选出与目标病毒感染相关的差异表达分子,提高了指纹的特异性。
2) 结合图像视觉特征,从形态结构层面反映病毒感染的影响,提高了指纹的敏感性。
3) 多元统计分析整合多源异构数据,构建信息量丰富的综合指纹,提高了指纹的分类和预测能力。
4) 该方法操作简便,结果可靠,为后续溯源判断提供了有效的指纹参考。
在步骤S10中,所述的烤烟的蛋白质组学、代谢组学、图像视觉特征的获取方法为:
收集烤烟病毒感染烟叶的细胞样本;
提取所述细胞样本中的蛋白质和代谢产物;
利用质谱技术分析所提取的蛋白质组学和代谢组学特征;
同时采集感染烟叶的部位图像;
对烟叶部位图像进行分割,获得感染区域的切片图像;
提取所述烟叶部位图像和切片图像的颜色、质地、病变区等视觉特征作为图像视觉特征;
其中对烟叶图像分割和特征提取的具体实施方式描述如下:
烟叶图像分割
对输入的烟叶部位图像进行预处理,包括转换为灰度图,中值滤波去噪,校正图像失真等,得到预处理后的图像。
在预处理图像上,采用分割算法对烟叶进行区域分割,如基于边缘检测的分割方法。检测烟叶边缘,并以感染区域内的点为种子,依靠区域生长算法逐步将感染区域与正常区域分割开。
对分割结果进行后处理,包括开闭运算去噪或轮廓拟合,最终得到精确的感染区域切片图像。
这一步骤的具体实施可以描述如下:
设原始烟叶图像为,进行预处理后得到图像/>。采用基于边缘检测和区域生长的分割算法,具体步骤为:
(1) 进行边缘检测,得到边缘图像:
其中,为边缘检测操作,如Canny边缘检测。
(2) 选择感染区域内种子点,进行种子填充:
伪代码表示如下:
其中,邻域像素集在灰度值上与种子点/>相近,以阈值/>判定,符合的像素加入分割区域/>。
(3) 迭代生长,直到分割区域不再变化,得到最终分割图像/>。
(4) 对进行开闭运算等后处理,得到精确的感染区域切片图像/>。
下一步,图像视觉特征提取
在得到的感染区域切片图像上,采集分割图像的RGB三通道直方图,统计感染区域的颜色分布特征;
采用基于GLCM矩阵的方法对分割图像进行质地特征分析,提取质地特征至少包括对比度、熵值;
计算分割图像的形状特征,描述感染区域的形态,所述形状特征至少包括Hu不变矩、圆形度;
计算分割图像的病变覆盖率,反映感染程度,所述病变覆盖率具体是一棵烤烟株的外表面感染区域所占表面积的比例;
将上述得到的颜色分布特征、质地特征、形状特征、病变覆盖率特征,组成烟叶图像的视觉特征向量。
这一步骤的具体实施可以描述如下:
对分割图像,提取以下视觉特征:
颜色特征:RGB直方图
质地特征:基于GLCM的对比度、熵值等
形状特征:Hu不变矩、圆形度等
覆盖率:
最终得到视觉特征向量:
。
步骤S20的目的是建立烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型。其具体实施方式可以采用机器学习方法,主要分为以下步骤:
构建训练数据集
收集多批次的烤烟样本,包括病毒感染组和非感染正常组。对每批样本,进行病毒检测获得感染状态标签,提取细胞指纹特征/>,并拍摄烟叶图像采集视觉特征/>。构建训练数据集:
其中,为样本数量。
特征融合
将细胞指纹特征和图像特征进行拼接,获得融合特征:
模型训练
基于训练数据,采用机器学习算法训练关系模型,如支持向量机(SVM)、随机森林等。以感染状态/>为预测目标,融合特征/>为输入,训练分类模型:/>。以训练好的模型作为烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型。
可选的,模型评估
在独立的验证数据集上,评估模型的分类性能,如准确率、ROC曲线下面积等。通过交叉验证确保模型泛化能力。
可选的,模型优化
调整算法超参数,选择适合的特征提取和融合方法,重复训练测试过程,获得最优模型。
可选的,输出关系模型
基于训练好的最优模型,建立细胞指纹特征和图像特征与病毒感染状态的关系模型。
以上方法综合利用了细胞层面的指纹信息和图像视觉特征,通过机器学习特征融合和模型训练,建立了烤烟病毒感染与可检测特征之间的关系模型。该模型可以实现基于新烤烟样本的图像,反推测亦得到相应的细胞指纹信息,为后续的溯源判断提供基础。
步骤S30是获取待溯源区域的烤烟图像,其详细技术方案如下:
采样设计
按照统计学的随机采样原则,在待溯源烤烟区域选择N个代表性种植区(假设共M个)进行取样,确保样本量和覆盖面能代表整个区域:
其中,是从种植区i抽取的样本量。
图像采集
对每个烤烟株样本,获取L个的图像:
同时,对每个样本捕获RGB三通道图像:
质量检测
检测图像的质量,如清晰度、对比度等,剔除质量差的图像。
可选的,归一化处理
调整所有图像到相同大小, 像素。
通过上述流程,得到质量统一的待溯源区域烤烟图像集,为后续分析建模提供数据输入。
步骤S40是依据构建好的关系模型,对待溯源区域的烤烟图像计算对应的细胞指纹信息,其详细实施流程为:
图像预处理
对待溯源区域烤烟的图像进行预处理,包括图像增强、去噪等,得到预处理后的图像。
特征提取
在预处理后的图像上,提取与训练过程相同的视觉特征子集/>,包括颜色、质地、形状等n维特征:
模型推理
将提取的图像特征输入到预训练的关系模型/>中,进行推理计算得到细胞指纹预测输出/>:
其中,表示烤烟图像对应预测的m维细胞指纹。
后处理
对模型输出的细胞指纹进行后处理,如去噪、特征选择等,得到细化的预测细胞指纹特征。
通过上述流程,实现了根据新烤烟图像,利用预构建的关系模型反向推导出细胞指纹信息,为后续溯源判断提供依据。该方法避免了重复提取细胞指纹的工作,提供了高效的溯源分析手段。
步骤S50是基于计算得到的待溯源区域烤烟的细胞指纹,判断与目标病毒指纹的相似度,其具体流程如下:
定义指纹向量
设待溯源烤烟细胞指纹为,目标病毒指纹为/>,均为m维向量:
计算向量距离或相似度
计算与/>之间的欧式距离d:
或余弦相似度s:
确定相似度
基于预设的阈值,判断向量相似度,一般的/>,具体判断方式如下:
;
或
溯源判断
如果指纹向量相似,则说明待溯源烤烟受目标病毒感染,判定为病毒的传播源地。
上述方法通过精确计算指纹向量之间的数学距离或相似度,实现了溯源烤烟与目标病毒的判定。相比传统方法,该技术手段更加准确客观。
下面是每个步骤的技术效果:
S10 构建烤烟-病毒感染综合指纹技术效果: 综合多源信息,提高指纹的代表性;结合图像、组织和代谢层面,指纹信息量大;分子特征高度特异,敏感反映病毒感染;
S20 建立图像特征与细胞指纹的关系模型技术效果:图像特征与细胞指纹关联性强;模型分类性能高,准确预测细胞指纹;避免重复提取指纹,提高检测效率;
S30 获取待溯源区域烤烟图像技术效果:采样代表性强,覆盖面广;图像标准统一,质量可控;为模型输入提供数据支撑;
S40 计算待溯源烤烟的细胞指纹技术效果:快速获得指纹,无需重复检测; 指纹准确反映区域烤烟状态;为溯源判断提供关键参考;
S50 判断指纹相似度,实现溯源技术效果:相似度计算标准化、定量;溯源判断准确可靠;技术过程简便,结果明确。
具体的,本发明的原理是:
1. 基于病毒感染的烤烟多源信息指纹建模
本发明利用先进的组学技术手段,从分子、组织和表型层面全方位采集烤烟受病毒感染后的特征变化,建立信息量丰富的综合指纹模型。
具体而言,利用蛋白质组学和代谢组学实验技术,检测感染烤烟的关键蛋白表达变化和代谢物含量变化,找到与特定病毒高度相关的差异分子,作为特异性蛋白质组和代谢组指纹。这些分子指纹反映了植株对病毒入侵的分子响应机制,是判断病毒感染状态的重要指标。
同时,本发明通过图像分析技术,提取病毒感染区域的视觉特征,如颜色、质地、形态等特征,建立视觉指纹。这综合反映了病毒对烟叶外部形态的影响。
将上述多源异质数据进行整合,构建信息丰富的烤烟-病毒感染综合指纹。这种指纹可作为判断特定病毒感染的“特征模板”,用于后续的溯源分析。
2. 基于图像预测指纹的模型构建与应用
本发明通过机器学习技术,建立烤烟图像特征与细胞指纹之间的关系模型。该模型经训练后,可以只根据烤烟图像输入,准确预测对应的细胞层面的指纹信息。
这种图像与指纹的映射关系避免了针对每批烤烟重复进行复杂的指纹检测,大幅简化和加快了溯源过程:仅需获取烤烟图像,即可快速获得所对应的细胞及分子指纹,并与目标病毒指纹进行比对,判定感染状态,实现溯源与判断。
上述技术原理集成了图像处理、机器学习、多组学实验技术与方法,构建了新型的基于烤烟表型指标的快速溯源思路,突破了传统单一依赖目标病原体检测的技术限制,实现了溯源研究的技术与方法升级。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种烤烟病毒溯源方法,其特征在于,包括以下步骤:
S10、构建带有烤烟病毒的烤烟的蛋白质组学、代谢组学、图像视觉特征的综合指纹;
S20、建立烤烟病毒感染细胞指纹与烤烟图像特征之间的关系模型;
S30、获取待溯源区域的烤烟的图像;
S40、根据关系模型,计算待溯源区域的烤烟的细胞指纹;
S50、根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度,判断所述待溯源区域是否为目标病毒的传播地;
其中,所述的烤烟的蛋白质组学、代谢组学、图像视觉特征的获取方法为:
收集烤烟病毒感染烟叶的细胞样本;
提取所述细胞样本中的蛋白质和代谢产物;
利用质谱技术分析所提取的蛋白质组学和代谢组学特征;
同时采集感染烟叶的部位图像;
对烟叶部位图像进行分割,获得感染区域的切片图像;
提取所述烟叶部位图像和切片图像的颜色、质地、病变区的视觉特征作为图像视觉特征;
其中,所述提取所述烟叶部位图像和切片图像的颜色、质地、病变区的视觉特征作为图像视觉特征的步骤,具体包括:
在得到的感染区域切片图像上,采集分割图像的RGB三通道直方图,统计感染区域的颜色分布特征;
采用基于GLCM矩阵的方法对分割图像进行质地特征分析,提取质地特征至少包括对比度、熵值;
计算分割图像的形状特征,描述感染区域的形态,所述形状特征至少包括Hu不变矩、圆形度;
计算分割图像的病变覆盖率,反映感染程度,所述病变覆盖率具体是一棵烤烟株的外表面感染区域所占表面积的比例;
将上述得到的颜色分布特征、质地特征、形状特征、病变覆盖率特征,组成烟叶图像的视觉特征向量。
2.根据权利要求1所述的一种烤烟病毒溯源方法,其特征在于,所述对烟叶部位图像进行分割,获得感染区域的切片图像的步骤,具体包括:
对输入的烟叶部位图像进行预处理,包括转换为灰度图,中值滤波去噪,校正图像失真,得到预处理后的图像;
在预处理图像上,采用分割算法对烟叶进行区域分割;
对分割结果进行后处理,包括开闭运算去噪或轮廓拟合,最终得到精确的感染区域切片图像。
3.根据权利要求1所述的一种烤烟病毒溯源方法,其特征在于,所述关系模型采用机器学习方法建立。
4.根据权利要求1所述的一种烤烟病毒溯源方法,其特征在于,所述对烟叶部位图像进行分割采用的是基于边缘检测和区域生长的分割算法。
5.根据权利要求1所述的一种烤烟病毒溯源方法,其特征在于,所述根据得到的待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹的相似度步骤中,使用的相似度计算方法为余弦相似度。
6.根据权利要求1所述的一种烤烟病毒溯源方法,其特征在于,所述判断所述待溯源区域是否为目标病毒的传播地的步骤中,判断标准为:如果待溯源区域的烤烟的细胞指纹判断溯源目标病毒的对应的细胞指纹相似,则说明待溯源烤烟受目标病毒感染,判定为病毒的传播源地。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行权利要求1-6任一项所述的烤烟病毒溯源方法。
8.一种烤烟病毒溯源系统,其特征在于,包含权利要求7所述的计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311604743.5A CN117314908B (zh) | 2023-11-29 | 2023-11-29 | 一种烤烟病毒溯源方法、介质及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311604743.5A CN117314908B (zh) | 2023-11-29 | 2023-11-29 | 一种烤烟病毒溯源方法、介质及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117314908A CN117314908A (zh) | 2023-12-29 |
CN117314908B true CN117314908B (zh) | 2024-03-01 |
Family
ID=89281481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311604743.5A Active CN117314908B (zh) | 2023-11-29 | 2023-11-29 | 一种烤烟病毒溯源方法、介质及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117314908B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109727645A (zh) * | 2017-10-27 | 2019-05-07 | 达索系统美国公司 | 生物序列指纹 |
CN113593638A (zh) * | 2021-05-20 | 2021-11-02 | 福建农林大学 | 药用太子参病毒基因组全长快速鉴定、克隆技术 |
CN113610540A (zh) * | 2021-07-09 | 2021-11-05 | 北京农业信息技术研究中心 | 一种河蟹防伪溯源方法及系统 |
WO2022001623A1 (zh) * | 2020-06-30 | 2022-01-06 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像处理方法、装置、设备及存储介质 |
CN114115394A (zh) * | 2021-11-08 | 2022-03-01 | 中国农业科学院烟草研究所 | 一种烟叶智能烘烤控制系统及方法 |
WO2022170145A1 (en) * | 2021-02-05 | 2022-08-11 | Viqi, Inc. | Machine learning for early detection of cellular morphological changes |
CN115950979A (zh) * | 2022-12-22 | 2023-04-11 | 江苏中烟工业有限责任公司 | 一种用于复杂基质烟草提取物产地溯源的方法 |
CN116433976A (zh) * | 2023-04-14 | 2023-07-14 | 首都医科大学附属北京儿童医院 | 图像处理方法、装置、设备和存储介质 |
CN116469485A (zh) * | 2023-03-20 | 2023-07-21 | 昆明理工大学 | 一种针对多种病毒的新型活性化合物计算筛选方法 |
CN116883026A (zh) * | 2023-09-06 | 2023-10-13 | 深圳市深信信息技术有限公司 | 基于大数据的农产品产地溯源方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8609928B2 (en) * | 2010-07-15 | 2013-12-17 | Vilmorin & Cie | Squash leaf curl virus (SLCV) resistance in cucurbits |
-
2023
- 2023-11-29 CN CN202311604743.5A patent/CN117314908B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109727645A (zh) * | 2017-10-27 | 2019-05-07 | 达索系统美国公司 | 生物序列指纹 |
WO2022001623A1 (zh) * | 2020-06-30 | 2022-01-06 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像处理方法、装置、设备及存储介质 |
WO2022170145A1 (en) * | 2021-02-05 | 2022-08-11 | Viqi, Inc. | Machine learning for early detection of cellular morphological changes |
CN113593638A (zh) * | 2021-05-20 | 2021-11-02 | 福建农林大学 | 药用太子参病毒基因组全长快速鉴定、克隆技术 |
CN113610540A (zh) * | 2021-07-09 | 2021-11-05 | 北京农业信息技术研究中心 | 一种河蟹防伪溯源方法及系统 |
CN114115394A (zh) * | 2021-11-08 | 2022-03-01 | 中国农业科学院烟草研究所 | 一种烟叶智能烘烤控制系统及方法 |
CN115950979A (zh) * | 2022-12-22 | 2023-04-11 | 江苏中烟工业有限责任公司 | 一种用于复杂基质烟草提取物产地溯源的方法 |
CN116469485A (zh) * | 2023-03-20 | 2023-07-21 | 昆明理工大学 | 一种针对多种病毒的新型活性化合物计算筛选方法 |
CN116433976A (zh) * | 2023-04-14 | 2023-07-14 | 首都医科大学附属北京儿童医院 | 图像处理方法、装置、设备和存储介质 |
CN116883026A (zh) * | 2023-09-06 | 2023-10-13 | 深圳市深信信息技术有限公司 | 基于大数据的农产品产地溯源方法及系统 |
Non-Patent Citations (3)
Title |
---|
Hyperspectral imaging for early identification of strawberry leaves diseases with machine learning and spectral fingerprint features;Qiyou Jiang等;《Infrared Physics & Technology》;第118卷;1-9 * |
基于GC-IMS的不同产地烟草中挥发性风味物质分析;郝捷等;《轻工学报》;第38卷(第2期);87-93+117 * |
烟草指纹图谱技术的研究进展和展望;孙敬国等;《湖北农业科学》;第51卷(第11期);13-17 * |
Also Published As
Publication number | Publication date |
---|---|
CN117314908A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7231631B2 (ja) | 腫瘍空間異質性およびインターマーカ異質性の計算方法 | |
US10671833B2 (en) | Analyzing digital holographic microscopy data for hematology applications | |
EP3486836B1 (en) | Image analysis method, apparatus, program, and learned deep learning algorithm | |
Liu et al. | Detection of aphids in wheat fields using a computer vision technique | |
CN108846835B (zh) | 基于深度可分离卷积网络的图像变化检测方法 | |
Gamarra et al. | Split and merge watershed: A two-step method for cell segmentation in fluorescence microscopy images | |
KR102108050B1 (ko) | 증강 컨볼루션 네트워크를 통한 유방암 조직학 이미지 분류 방법 및 그 장치 | |
Pan et al. | Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks | |
Di Ruberto et al. | A leucocytes count system from blood smear images: Segmentation and counting of white blood cells based on learning by sampling | |
Wang et al. | Convolutional neural network based automatic pest monitoring system using hand-held mobile image analysis towards non-site-specific wild environment | |
WO2021146705A1 (en) | Non-tumor segmentation to support tumor detection and analysis | |
CN112132166A (zh) | 一种数字细胞病理图像智能分析方法、系统及装置 | |
Li et al. | GIS-based detection of grain boundaries | |
CN115294377A (zh) | 一种道路裂缝的识别系统及方法 | |
Zhang et al. | Research on application of classification model based on stack generalization in staging of cervical tissue pathological images | |
Kalinli et al. | Performance comparison of machine learning methods for prognosis of hormone receptor status in breast cancer tissue samples | |
Yang et al. | The devil is in the details: a small-lesion sensitive weakly supervised learning framework for prostate cancer detection and grading | |
CN113310934A (zh) | 骆驼奶中掺加奶牛奶及其掺加比例的快速鉴定方法 | |
Zhang et al. | A novel concavity based method for automatic segmentation of touching cells in microfluidic chips | |
CN117314908B (zh) | 一种烤烟病毒溯源方法、介质及系统 | |
Khamael et al. | Using adapted JSEG algorithm with fuzzy C mean for segmentation and counting of white blood cell and nucleus images | |
Schüffler et al. | Computational TMA analysis and cell nucleus classification of renal cell carcinoma | |
Joshi et al. | Detection and classification of plant diseases using soft computing techniques | |
Rashwan et al. | A fuzzy-watershed based algorithm for protein spot detection in 2DGE images | |
CN112703531A (zh) | 生成组织图像的注释数据 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |