CN112712031A - 一种病毒颗粒的识别方法及装置 - Google Patents

一种病毒颗粒的识别方法及装置 Download PDF

Info

Publication number
CN112712031A
CN112712031A CN202011618067.3A CN202011618067A CN112712031A CN 112712031 A CN112712031 A CN 112712031A CN 202011618067 A CN202011618067 A CN 202011618067A CN 112712031 A CN112712031 A CN 112712031A
Authority
CN
China
Prior art keywords
virus particle
virus
electron microscope
sample
cryo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011618067.3A
Other languages
English (en)
Other versions
CN112712031B (zh
Inventor
陈龙
谢培福
郭振乾
刘传
管峥
郭春龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shuimu Future Beijing Technology Co ltd
Original Assignee
Shuimu Future Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shuimu Future Beijing Technology Co ltd filed Critical Shuimu Future Beijing Technology Co ltd
Priority to CN202011618067.3A priority Critical patent/CN112712031B/zh
Publication of CN112712031A publication Critical patent/CN112712031A/zh
Application granted granted Critical
Publication of CN112712031B publication Critical patent/CN112712031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明公开了一种病毒颗粒的识别方法及装置,方法包括获取病毒颗粒样本;利用冷冻电镜对病毒颗粒样本进行水合态成像,获得目标图像;通过预创建的病毒颗粒识别模型对目标图像进行识别,获得单个病毒颗粒的识别结果,识别结果包括病毒颗粒样本为实心、病毒颗粒样本为空心或者病毒颗粒样本为部分实心的一种;病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。本发明利用病毒颗粒识别模型识别出空心病毒颗粒、实心病毒颗粒以及部分实心病毒颗粒,提升了识别准确性,并且不受应用场景的限制,解决了当前基因治疗领域在生产工艺过程中,病毒颗粒含量鉴定的高通量检测能力不足的难题。

Description

一种病毒颗粒的识别方法及装置
技术领域
本发明涉及生物技术领域,特别是涉及一种病毒颗粒的识别方法及装置。
背景技术
病毒样颗粒(Virus-Like Particles,VLP)和复制缺陷的病毒如腺相关病毒(Adeno-associated Virus,AAV),不能增殖,在制药工业领域被广泛作为基因传递载体。尤其是AAV宿主细胞范围广,体内表达时间长,具有快速的响应时间和高速的表达效率,不会导致人类疾病,是最优前景的病毒基因治疗载体。基因载体的遗传物质含量与治疗效率密切相关,需要对基因药物的遗传物资含量进行准确的评估,从而为进入下一步生产流程提供可靠的质量控制标准。此外,建立可视化、高通量的病毒颗粒基因组含量量化方法,对生产工业的开发、优化和提速至关重要。特别地,对病毒近生理状态下的检测,可以为生产工艺的优化提供直观参考。
目前,利用分析超速离心(analyticalultracentrifugation,AUC)技术,通过核酸定量和衣壳定量来区分空心病毒颗粒和实心病毒颗粒,可以分析AAV实心比和其他AAV亚群的定量信息,然后AUC的低通量限制了其在工艺开发中的应用。现有技术中也有通过负染电镜成像技术对病毒颗粒进行成像,并进行空、实心的区分,但是在该方法中在制样过程中,重金属染料可能会渗透到病毒内部的空腔中,对于病毒颗粒的空、实心的区分会带来一定的假阳性和假阴性结果。此外,染料的厚度难以控制,会对观测结果造成无法预测的影响。可见,现有技术中对病毒颗粒进行空、实心区分时均会存在一定的缺陷,无法满足生产工艺的实际需求。
发明内容
针对于上述问题,本发明提供一种病毒颗粒的识别方法及装置,实现了提升了病毒颗粒识别准确性,满足了生产工艺的实际需求。
为了实现上述目的,本发明提供了如下技术方案:
一种病毒颗粒的识别方法,所述方法包括:
获取病毒颗粒样本;
利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像;
通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得单个病毒颗粒的识别结果,所述识别结果包括所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的一种;所述病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。
可选地,所述利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像,包括:
依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;
对所述冷冻电镜样品进行图像采集,获得目标图像。
可选地,所述方法还包括:
获取基于病毒颗粒样本的冷冻电镜数据集,包括:
利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;
对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;
对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒颗粒、部分实心病毒颗粒或者实心病毒颗粒的一种,所述部分实心病毒颗粒为非空心病毒颗粒且非实心病毒颗粒。
可选地,所述对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,包括:
对所述每一冷冻电镜图像进行图像校正,获得校正后的图像;
对校正后的图像进行病毒颗粒挑选,获得包括目标病毒颗的冷冻电镜图像;
基于所述冷冻电镜图像中病毒颗粒的特征,生成所述冷冻电镜图像的标注信息;
将标注后的冷冻电镜图像确定为冷冻电镜数据集。
可选地,所述方法还包括:
基于所述基于病毒颗粒样本的冷冻数据集,创建病毒颗粒识别模型,包括:
对所述基于病毒颗粒样本的冷冻数据集进行划分,得到训练集和测试集;
利用所述训练集进行训练,获得初始识别模型;
基于所述测试集对所述初始识别模型进行模型参数调整,获得病毒颗粒识别模型。
一种病毒颗粒的识别装置,所述装置包括:
获取单元,用于获取病毒颗粒样本;
成像单元,用于利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像;
识别单元,用于通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得单个病毒颗粒的识别结果,所述识别结果包括所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的一种;所述病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。
可选地,所述成像单元包括:
处理子单元,用于依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;
采集子单元,用于对所述冷冻电镜样品进行图像采集,获得目标图像。
可选地,所述装置还包括:
样本获取单元,用于获取基于病毒颗粒样本的冷冻电镜数据集,所述样本获取单元包括:
分类子单元,用于利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;
成像子单元,用于对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;
标注子单元,用于对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒颗粒、部分实心病毒颗粒或者实心病毒颗粒的一种,所述部分实心病毒颗粒为非空心病毒颗粒且非实心病毒颗粒。
可选地,所述标注子单元具体用于:
对所述每一冷冻电镜图像进行图像校正,获得校正后的图像;
对校正后的图像进行病毒颗粒挑选,获得包括目标病毒颗的冷冻电镜图像;
基于所述冷冻电镜图像中病毒颗粒的特征,生成所述冷冻电镜图像的标注信息;
将标注后的冷冻电镜图像确定为冷冻电镜数据集。
可选地,所述装置还包括:
创建单元,用于基于所述基于病毒颗粒样本的冷冻数据集,创建病毒颗粒识别模型,所述创建单元包括:
划分子单元,用于对所述基于病毒颗粒样本的冷冻数据集进行划分,得到训练集和测试集;
训练子单元,用于利用所述训练集进行训练,获得初始识别模型;
调整子单元,用于基于所述测试集对所述初始识别模型进行模型参数调整,获得病毒颗粒识别模型。
一种存储介质,所述存储介质存储有可执行指令,所述指令被处理器执行时实现如上任意一项所述的病毒颗粒的识别方法。
一种电子设备,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序具体用于实现如上中任意一项所述的病毒颗粒的识别方法。
相较于现有技术,本发明提供了一种病毒颗粒的识别方法及装置,方法包括获取病毒颗粒样本;利用冷冻电镜对病毒颗粒样本进行水合态成像,获得目标图像;通过预创建的病毒颗粒识别模型对目标图像进行识别,获得单个病毒颗粒的识别结果,识别结果包括病毒颗粒样本为实心、病毒颗粒样本为空心或者病毒颗粒样本为部分实心的一种;病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。在本发明利用病毒颗粒识别模型对通过冷冻电镜成像的病毒颗粒样本对应的目标图像进行特征识别,可以识别出空心病毒颗粒、实心病毒颗粒以及部分实心病毒颗粒,提升了识别准确性,并且不受应用场景的限制,解决了当前基因治疗领域在生产工艺过程中,病毒颗粒含量鉴定的高通量检测能力不足的难题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种病毒颗粒的识别方法的流程示意图;
图2为本发明实施例提供的一种获取病毒颗粒样本集的示意图;
图3为本发明实施例提供的一种基于卷积神经网络的病毒分类器的示意图;
图4为本发明实施例提供的一种病毒颗粒的识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种病毒颗粒的识别方法,其基于卷积神经网络的深度学习分类框架,强化病毒内部梯度含量的特征提取能力,不仅可以识别出实心病毒颗粒、空心病毒颗粒,还实现了部分实心病毒的成像表征量化。
实施例一
参见图1,其示出了本申请实施例提供的一种病毒颗粒的识别方法的流程示意图,所述方法可以包括以下步骤:
S101、获取病毒颗粒样本。
病毒颗粒样本是需要进行识别的病毒颗粒,在发明实施例中并不对病毒种类进行限制,如该病毒颗粒样本可以是病毒样颗粒(VLP)的样本,也可以是复制缺陷的病毒如腺相关病毒(AAV)的样本。
S102、利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像。
在本发明实施例中并不是直接对病毒颗粒样本进行识别,而是利用冷冻电镜技术对病毒颗粒样本直接进行水合态成像表征,获得目标图像为冷冻电镜成像的图像。采用冷冻电镜成像可以保持病毒天然状态下的结果,冷冻水合态下的电镜成像可以看到颗粒的内部成分,便于后续对病毒颗粒的识别。
S103、通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得识别结果。
病毒颗粒识别模型具有能够识别出病毒颗粒的空心、实心、部分实心的情况,需要说明的是,在本发明实施例中的部分实现是指除了空心和实心以外的所有情况,如部分实心可以是包括25%的实心,也可以是包括50%的实心。输入病毒颗粒识别模型的是目标图像,即利用冷冻电镜对病毒颗粒样本进行水合态的成像,输出的是病毒颗粒样本的识别结果。该病毒颗粒识别模型的训练样本为基于病毒颗粒样本的冷冻电镜数据集。即在获得了病毒颗粒样本后,可以利用AUC技术进行病毒分类,得到不同亚群病毒的样品。在同样的冷冻电镜制样和成像条件下,对病毒进行成像,并进行单颗粒病毒的挑选,至此得到带有不同亚群病毒注释的训练集。对于该过程将在本发明的后续实施例中进行详细说明,在此不进行赘述。
本发明实施例一提供了一种病毒颗粒的识别方法,方法包括获取病毒颗粒样本;利用冷冻电镜对病毒颗粒样本进行水合态成像,获得目标图像;通过预创建的病毒颗粒识别模型对目标图像进行识别,获得单个病毒颗粒的识别结果,识别结果包括病毒颗粒样本为实心、病毒颗粒样本为空心或者病毒颗粒样本为部分实心的一种;病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。在本发明利用病毒颗粒识别模型对通过冷冻电镜成像的病毒颗粒样本对应的目标图像进行特征识别,可以识别出空心病毒颗粒、实心病毒颗粒以及部分实心病毒颗粒,提升了识别准确性,并且不受应用场景的限制,满足了实际需求。
实施例二
在本发明实施例二中对利用的冷冻电镜水合态成像以及病毒颗粒识别模型的训练样本进行说明。对应的,所述利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像,包括:依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;对所述冷冻电镜样品进行图像采集,获得目标图像。
其中,利用冷冻电镜设备,通过其实现单个病毒颗粒水合态成像。以单个基因药物载体病毒为例进行说明。
为了能够准确成像,获取病毒颗粒样本时,需要保证样品结构在溶液中的稳定,没有解聚或者聚集。其中,冷冻电镜样品制备条件可以按照冷冻电镜样品的制备要求进行确定。例如,按照冷冻电镜样品制备要求,对所述病毒颗粒样本进行冷冻处理,使得获得的冷冻电镜样品能够保持天然的未染色水合状态。
具体的,在获得冷冻电镜样品的过程可以包括:
(1)选择合适的载网型号;(2)对该型号的载网进行亲水化处理,使载网表面容易吸附病毒颗粒;(3)使用半自动化快速投入冷冻制样机,将吸附有病毒颗粒的载网在液态乙烷中快速冷冻,在载网孔或支持膜上形成厚度约几十纳米的玻璃态薄冰,病毒颗粒则被分散包埋在冰层中形成冷冻样品;(4)将载网转移至载网盒中并存储在液氮中。
在冷冻电镜成像设备中观察冷冻水合态样品中每个病毒颗粒的形态,在对样品成像过程中,确保电镜按照制造商的说明调试和校准,并且相机的背底是均匀的。确定合适的区域,选取要拍摄照片的载网孔,重复图像采集的步骤,直到获取所需数量的图像为止,以对应的格式进行保存,例如可以采用16位tiff格式保存。
在本发明实施例中病毒颗粒识别模型的训练样本是通过AUC(分析超速离心)技术和冷冻电镜成像技术获得的。以腺相关病毒(Adeno-associated Virus,AAV)为例,AUC技术可以提供不同内部基因组含量的亚群AAV载体的定量分析,得到实心病毒、空心病毒、含部分基因组的病毒。在同样的制样和成像条件下,进行冷冻电镜成像,得到AUC技术注释的病毒含量的冷冻电镜成像的训练集,进一步训练深度学习分类器,实现部分实心病毒的特征提取。
参见图2,其示出了本发明实施例提供的一种获取病毒颗粒样本集的示意图。在该实施例中病毒颗粒样本集是指基于病毒颗粒样本的冷冻电镜数据集。在获得病毒样品后,利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒、部分实心病毒或者实心病毒。需要说明的是,在该过程中还需要对病毒颗粒进行挑选,以保证空心病毒、实心病毒和部分实心病毒对应的冷冻电镜成像的图像数量满足能够进行模型训练的数量要求,从而能够使得训练得到的病毒颗粒识别模型能够充分学习到上述病毒颗粒的特征。并且部分实心是指既不是空心也不是实心,可以根据应用场景的需求对部分实心进行进一步限定,例如某些应用场景需要识别单个病毒颗粒是否为50%的实心和25%的实心,则样本集中需要有50%的实心和25%的实心的冷冻电镜数据,这样基于该样本训练出来的病毒颗粒识别模型,可以在识别部分实心的时候能够准确识别是否属于50%的实心或者25%的实心。因此,本发明实施例中并不对部分实心具体的实心占比范围进行限制,可以根据应用场景进行确定,即根据识别需求,确定样本中包括的病毒颗粒的种类,如包括哪种类型的部分实心,从而使得对应的训练样本训练得到的病毒颗粒识别模型能够满足识别需求。
在一种实施方式中,所述对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为病毒颗粒样本集,包括:
对所述每一冷冻电镜图像进行图像校正,获得校正后的图像;对校正后的图像进行病毒颗粒挑选,获得包括目标病毒颗粒的冷冻电镜图像;基于所述冷冻电镜图像中病毒颗粒的特征,生成所述冷冻电镜图像的标注信息;将将标注后的冷冻电镜图像确定为冷冻电镜数据集。其中,目标颗粒是指可用于空心、实心、部分实心的鉴定,且剔除损坏的病毒颗粒或者水污染等干扰因素。
在对冷冻电镜图像进行对应信息标注时需进行标准化处理:先通过低通滤波与归一化处理,再实现病毒颗粒挑选与对齐,实现了冷冻水合态成像病毒的挑选。具体的:
(1)对冷冻电镜图像进行帧与帧之间的漂移校正,并将多帧合并,采用低通滤波的方式提示图像信噪比,对图像进行归一化处理,实现图像电子剂量曝光矫正,其中,低通滤波的方式包括但不局限于均值滤波、中值滤波、频域低通滤波等,归一化处理包括但不局限于将每张图像除以所有像素均值。
(2)将病毒颗粒进行挑选,可以采用自动挑颗粒算法(例如Relion自动挑颗粒方法),也可以采取模板搜索方法,或者基于目标检测的神经网络挑选方法,本发明实施例对此不进行限制。
需要说明的是在本发明实施例中可以采用通过AUC技术进行病毒分类,得到不同亚群病毒的样品,然后通过冷冻电镜成像进行单颗粒病毒的挑选,实现标注有空心、实心、半实心等信息的训练集。当然也可以采用对病毒颗粒进行人为标注的方式来获得训练集,对此本发明实施例不进行限制。
实施例三
在本发明实施例三中描述了创建病毒颗粒识别模型的过程,其基于病毒颗粒样本集,创建病毒颗粒识别模型。对所述基于病毒颗粒样本的冷冻数据集进行划分,得到训练集和测试集;利用所述训练集进行训练,获得初始识别模型;基于所述测试集对所述初始识别模型进行模型参数调整,获得病毒颗粒识别模型。需要说明的是,本发明实施例中的病毒颗粒识别模型是一种基于卷积神经网络的分类器,即可以自动对冷冻电镜成像的图像进行自动识别,以获得所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的识别结果。
参见图3,其示出了本发明实施例提供的一种基于卷积神经网络的病毒分类器的示意图,但是本发明实施例中采用的病毒分类器并不局限于图3所示。采用卷积神经网络进行特征提取,可以更好地提取病毒的内部遗传物质含量特征。神经网络由连续连接的神经元层组成,神经元是能够执行线性和非线性操作的小型处理单元。每个神经元的参数在学习过程中优化。本发明采用的卷积神经网络,神经元以卷积方式应用,这允许处理相邻像素的信息冗余。每一个卷积层自动从数据中提取各种特定特征,依次应用这些层可以逐步计算高级特征,从而形成病毒图像特征的分层或多尺度表示。
举例说明,本发明采用ResNet50网络架构进行分类器的搭建。ResNet50是50层残差网络:卷积层的大小是3×3的滤波器filter,此模型的输入大小固定为224×224。模型以平均池化层和带有softmax的1000维全连接层结束。具体网络结构如图3所示并描述如下:
(1)、输入:残差网络(ResNet50)的缺省输入图像尺寸为224×224。
(2)、1组卷积:1层卷积层,大小为7×7,filter数量为64,卷积核遍历特征图时每步移动的步长stride=(2,2);最大池化层max pooling,大小为3×3,stride(步长)=(2,2)。
(3)、3组卷积:convolution block(卷积块)有3层卷积层,每一层filters的数量分别为64,64,256;2个identity block(标识块)结构和convolution block一样,shortcut路径有所差异。
(4)、4组卷积:convolution block有3层卷积层,每一层filters的数量128,128,512;3个identity block结构和convolution block一样。
(5)、6组卷积:convolution block有3层卷积层,每一层filters的数量256,256,1024;5个identity block结构和convolution block一样。
(6)、3组卷积:3层卷积层,大小为3×3,每一层filters的数量分别为512,512,2048;2个identity block,结构和convolution block一样。
(7)、平均池化层(average pooling)后得到一个2048维向量,接上一个映射到1000维的全连阶层(fullconnection,FC),通过softmax回归模型输出病毒的分类结果。
在shortcut路径中,对相关参数的设置,使得残差块的输入和输出的特征图尺寸一致,从而进行相加处理,避免深层网络的梯度消失和退化问题。convolution block完成下采样,卷积步长stride为2,特征图长宽减半。输入和输出的最优(shortcut)路径通过1×1conv通道数加倍,保证残差块的输入和输出的特征图尺寸一致。identity block输入和输出的shortcut路径不作处理,残差块的输入和输出的特征图尺寸一致。
在现有的数据和训练网络参数的情况下,随着不断整合新的注释数据,可以实现智能分类器持续优化,更新模型参数,强化模型对病毒内部基因组含量的表征,实现大数据驱动的智能分类器的学习能力升级。
本发明实施例通过冷冻电镜成像实现了部分实心病毒,甚至更精细的亚群病毒的表征量化;基于AUC技术对病毒内部含量的注释,冷冻电镜成像和卷积神经网络的深度学习分类器,实现亚群病毒的高通量定量检测分析;基于深度学习的病毒颗粒智能分类,极大地避免了人为介入的病毒颗粒分选。对已有的标注数据进行整合,基于新的注释数据对已有模型参数进行微调,大数据驱动强化分类器的迁移能力,实现了模型学习能力的升级。
实施例四
在本发明实施例还提供了一种病毒颗粒的识别装置,参见图4所述装置包括:
获取单元10,用于获取病毒颗粒样本;
成像单元20,用于利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像;
识别单元30,用于通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得单个病毒颗粒的识别结果,所述识别结果包括所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的一种;所述病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。
在装置实施例的基础上,所述成像单元包括:
处理子单元,用于依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;
采集子单元,用于对所述冷冻电镜样品进行图像采集,获得目标图像。
可选地,所述装置还包括:
样本获取单元,用于获取获取基于病毒颗粒样本的冷冻电镜数据集,所述样本获取单元包括:
分类子单元,用于利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;
成像子单元,用于对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;
标注子单元,用于对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒颗粒、部分实心病毒颗粒或者实心病毒颗粒的一种,所述部分实心病毒颗粒为非空心病毒颗粒且非实心病毒颗粒。
可选地,所述标注子单元具体用于:
对所述每一冷冻电镜图像进行图像校正,获得校正后的图像;
对校正后的图像进行病毒颗粒挑选,获得包括目标病毒颗的冷冻电镜图像;
基于所述冷冻电镜图像中病毒颗粒的特征,生成所述冷冻电镜图像的标注信息;
将标注后的冷冻电镜图像确定为冷冻电镜数据集。
可选地,所述装置还包括:
创建单元,用于基于所述基于病毒颗粒样本的冷冻数据集,创建病毒颗粒识别模型,所述创建单元包括:
划分子单元,用于对所述基于病毒颗粒样本的冷冻数据集进行划分,得到训练集和测试集;
训练子单元,用于利用所述训练集进行训练,获得初始识别模型;
调整子单元,用于基于所述测试集对所述初始识别模型进行模型参数调整,获得病毒颗粒识别模型。
本发明提供了一种病毒颗粒的识别装置,获取单元获取病毒颗粒样本;成像单元利用冷冻电镜对病毒颗粒样本进行水合态成像,获得目标图像;识别单元通过预创建的病毒颗粒识别模型对目标图像进行识别,获得识别结果,识别结果包括病毒颗粒样本为实心、病毒颗粒样本为空心或者病毒颗粒样本为部分实心的一种;病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。在本发明利用病毒颗粒识别模型对通过冷冻电镜成像的病毒颗粒样本对应的目标图像进行特征识别,可以识别出空心病毒颗粒、实心病毒颗粒以及部分实心病毒颗粒,提升了识别准确性,并且不受应用场景的限制,满足了实际需求。
基于前述实施例,本申请的实施例提供存储介质,所述存储介质存储有可执行指令,所述指令被处理器执行时实现如上任意一项所述的病毒颗粒的识别方法。
本发明实施例还提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于执行所述程序,所述程序具体用于实现如上中任意一项所述的病毒颗粒的识别方法。
需要说明的是,上述处理器或CPU可以为特定用途集成电路(ApplicationSpecific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable GateArray,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
需要说明的是,上述计算机存储介质/存储器可以是只读存储器(Read OnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种病毒颗粒的识别方法,其特征在于,所述方法包括:
获取病毒颗粒样本;
利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像;
通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得单个病毒颗粒的识别结果,所述识别结果包括所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的一种;所述病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像,包括:
依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;
对所述冷冻电镜样品进行图像采集,获得目标图像。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取基于病毒颗粒样本的冷冻电镜数据集,包括:
利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;
对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;
对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒颗粒、部分实心病毒颗粒或者实心病毒颗粒的一种,所述部分实心病毒颗粒为非空心病毒颗粒且非实心病毒颗粒。
4.根据权利要求3所述的方法,其特征在于,所述对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,包括:
对所述每一冷冻电镜图像进行图像校正,获得校正后的图像;
对校正后的图像进行病毒颗粒挑选,获得包括目标病毒颗的冷冻电镜图像;
基于所述冷冻电镜图像中病毒颗粒的特征,生成所述冷冻电镜图像的标注信息;
将标注后的冷冻电镜图像确定为冷冻电镜数据集。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于所述基于病毒颗粒样本的冷冻数据集,创建病毒颗粒识别模型,包括:
对所述基于病毒颗粒样本的冷冻数据集进行划分,得到训练集和测试集;
利用所述训练集进行训练,获得初始识别模型;
基于所述测试集对所述初始识别模型进行模型参数调整,获得病毒颗粒识别模型。
6.一种病毒颗粒的识别装置,其特征在于,所述装置包括:
获取单元,用于获取病毒颗粒样本;
成像单元,用于利用冷冻电镜对所述病毒颗粒样本进行水合态成像,获得目标图像;
识别单元,用于通过预创建的病毒颗粒识别模型对所述目标图像进行识别,获得单个病毒颗粒的识别结果,所述识别结果包括所述病毒颗粒样本为实心、所述病毒颗粒样本为空心或者所述病毒颗粒样本为部分实心的一种;所述病毒颗粒识别模型是基于病毒颗粒样本的冷冻电镜数据集进行训练得到的神经网络模型。
7.根据权利要求6所述的装置,其特征在于,所述成像单元包括:
处理子单元,用于依据冷冻电镜样品制备条件,对所述病毒颗粒样本进行冷冻处理,获得满足所述制备条件的冷冻电镜样品;
采集子单元,用于对所述冷冻电镜样品进行图像采集,获得目标图像。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
样本获取单元,用于获取基于病毒颗粒样本的冷冻电镜数据集,所述样本获取单元包括:
分类子单元,用于利用分析超速离心对病毒颗粒样品进行分类,获得不同亚群的病毒颗粒;
成像子单元,用于对所述不同亚群的病毒颗粒进行冷冻电镜成像,获得若干冷冻电镜图像;
标注子单元,用于对每一冷冻电镜图像进行信息标注,将标注后的冷冻电镜图像确定为基于病毒颗粒样本的冷冻电镜数据集,其中,在冷冻电镜图像所标注的信息为空心病毒颗粒、部分实心病毒颗粒或者实心病毒颗粒的一种,所述部分实心病毒颗粒为非空心病毒颗粒且非实心病毒颗粒。
9.一种存储介质,其特征在于,所述存储介质存储有可执行指令,所述指令被处理器执行时实现如权利要求1-5中任意一项所述的病毒颗粒的识别方法。
10.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序具体用于实现如权利要求1-5中任意一项所述的病毒颗粒的识别方法。
CN202011618067.3A 2020-12-31 2020-12-31 一种病毒颗粒的识别方法及装置 Active CN112712031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011618067.3A CN112712031B (zh) 2020-12-31 2020-12-31 一种病毒颗粒的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011618067.3A CN112712031B (zh) 2020-12-31 2020-12-31 一种病毒颗粒的识别方法及装置

Publications (2)

Publication Number Publication Date
CN112712031A true CN112712031A (zh) 2021-04-27
CN112712031B CN112712031B (zh) 2024-05-14

Family

ID=75547465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011618067.3A Active CN112712031B (zh) 2020-12-31 2020-12-31 一种病毒颗粒的识别方法及装置

Country Status (1)

Country Link
CN (1) CN112712031B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643230A (zh) * 2021-06-22 2021-11-12 清华大学 用于冷冻电镜生物大分子颗粒识别的持续学习方法及系统
CN115359057A (zh) * 2022-10-20 2022-11-18 中国科学院自动化研究所 基于深度学习的冷冻电镜颗粒挑选方法、装置和电子设备
WO2023238756A1 (ja) * 2022-06-07 2023-12-14 国立大学法人 東京大学 ウイルス粒子検出方法、情報処理装置及びウイルス粒子検出プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004016222A2 (en) * 2002-08-16 2004-02-26 Ohio University Hepatitis c viral-like particle purification
CN105907724A (zh) * 2016-07-02 2016-08-31 中国食品药品检定研究院 一种脊髓灰质炎ⅱ型病毒单克隆抗体及其应用
CN110032761A (zh) * 2019-03-07 2019-07-19 浙江工业大学 一种冷冻电镜单颗粒成像数据的分类方法
US20200339961A1 (en) * 2019-04-26 2020-10-29 Case Western Reserve University Freeze dried viral nanoparticle constructs

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004016222A2 (en) * 2002-08-16 2004-02-26 Ohio University Hepatitis c viral-like particle purification
CN105907724A (zh) * 2016-07-02 2016-08-31 中国食品药品检定研究院 一种脊髓灰质炎ⅱ型病毒单克隆抗体及其应用
CN110032761A (zh) * 2019-03-07 2019-07-19 浙江工业大学 一种冷冻电镜单颗粒成像数据的分类方法
US20200339961A1 (en) * 2019-04-26 2020-10-29 Case Western Reserve University Freeze dried viral nanoparticle constructs

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YANAN ZHU, ET AL: "A deep convolutional neural network approach to single-particle recognition in cryo-electron microscopy", BMC BIOINFORMATICS》, pages 1 - 10 *
曾智坤,等: "脊髓灰质炎病毒颗粒分离纯化方法学评价", 中国生物制品学杂志》, vol. 33, no. 3, pages 312 - 315 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643230A (zh) * 2021-06-22 2021-11-12 清华大学 用于冷冻电镜生物大分子颗粒识别的持续学习方法及系统
WO2023238756A1 (ja) * 2022-06-07 2023-12-14 国立大学法人 東京大学 ウイルス粒子検出方法、情報処理装置及びウイルス粒子検出プログラム
CN115359057A (zh) * 2022-10-20 2022-11-18 中国科学院自动化研究所 基于深度学习的冷冻电镜颗粒挑选方法、装置和电子设备
CN115359057B (zh) * 2022-10-20 2023-03-28 中国科学院自动化研究所 基于深度学习的冷冻电镜颗粒挑选方法、装置和电子设备

Also Published As

Publication number Publication date
CN112712031B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
Wagner et al. SPHIRE-crYOLO is a fast and accurate fully automated particle picker for cryo-EM
US11205266B2 (en) Systems and methods for detection of structures and/or patterns in images
Li et al. DeepMitosis: Mitosis detection via deep detection, verification and segmentation networks
Gupta et al. Deep learning in image cytometry: a review
Chan et al. A comprehensive analysis of weakly-supervised semantic segmentation in different image domains
Pedraza et al. Glomerulus classification with convolutional neural networks
Mishra et al. Convolutional neural network for histopathological analysis of osteosarcoma
Liu et al. A novel cell detection method using deep convolutional neural network and maximum-weight independent set
Li et al. Deep convolutional neural networks for detecting secondary structures in protein density maps from cryo-electron microscopy
US11346764B2 (en) Image-based assay using intelligent monitoring structures
CN112712031A (zh) 一种病毒颗粒的识别方法及装置
Xu et al. Deep learning-based subdivision approach for large scale macromolecules structure recovery from electron cryo tomograms
Singh et al. Breast cancer detection and classification of histopathological images
AU2018369869B2 (en) Classification of a population of objects by convolutional dictionary learning with class proportion data
WO2018207261A1 (ja) 画像解析装置
WO2021232616A1 (zh) 目标细胞株的筛选方法、系统、服务器及存储介质
Wang et al. Biological image analysis using deep learning-based methods: literature review
CN112949750A (zh) 一种图像分类方法及计算机可读存储介质
Chang et al. Multireference level set for the characterization of nuclear morphology in glioblastoma multiforme
Ahmed et al. Segmentation techniques for morphometric measurements of blood cells: Overview and research challenges
Sáez et al. Neuromuscular disease classification system
Tikkanen et al. Training based cell detection from bright-field microscope images
Krishna et al. Stain normalized breast histopathology image recognition using convolutional neural networks for cancer detection
Fernandez et al. Artificial intelligence methods for predictive image-based grading of human cancers
CN107609585A (zh) 一种基于卷积神经网络的体液细胞显微图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant