CN109815870A - 细胞表型图像定量分析的高通量功能基因筛选方法及系统 - Google Patents

细胞表型图像定量分析的高通量功能基因筛选方法及系统 Download PDF

Info

Publication number
CN109815870A
CN109815870A CN201910041846.2A CN201910041846A CN109815870A CN 109815870 A CN109815870 A CN 109815870A CN 201910041846 A CN201910041846 A CN 201910041846A CN 109815870 A CN109815870 A CN 109815870A
Authority
CN
China
Prior art keywords
screened
phenotype
cell
image
functional gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910041846.2A
Other languages
English (en)
Other versions
CN109815870B (zh
Inventor
薛宇
宁万山
郭亚萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201910041846.2A priority Critical patent/CN109815870B/zh
Publication of CN109815870A publication Critical patent/CN109815870A/zh
Application granted granted Critical
Publication of CN109815870B publication Critical patent/CN109815870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了细胞表型图像定量分析的高通量功能基因筛选方法及系统,属于基因筛选技术领域。利用全自动荧光显微镜拍取得到有待筛选表型和无待筛选表型的细胞图像;分别转化成有待筛选表型和无待筛选表型的黑白二值图像;再分割成包含单个有待筛选表型细胞的图像和包含单个无待筛选表型细胞的图像;将包含单个有待筛选表型细胞的图像在有待筛选表型的细胞图像中对应的部分作为阳性训练集,将包含单个无待筛选表型细胞的图像在无待筛选表型的细胞图像中对应的部分作为阴性训练集,得到能识别细胞表型的最终模型;将待筛选基因敲除或者过表达细胞的图像经过最终模型识别,得到待筛选基因与表型的关联性。本方法提高了筛选效率和准确程度。

Description

细胞表型图像定量分析的高通量功能基因筛选方法及系统
技术领域
本发明涉及基因筛选技术领域,更具体地,涉及一种细胞表型图像定量分析的高通量功能基因筛选方法及系统。
背景技术
许多实验学家致力于鉴定与特定细胞行为有关的功能基因,构建基因与表型的联系,这有助于人类解读基因,认识疾病,研发药物。比如细胞自噬的异常与包括癌症在内的多种疾病的发生密切相关。日本科学家大隅良典通过酵母基因筛选实验发现调控自噬的关键基因,因为其在细胞自噬的贡献,获颁发2016年获得诺贝尔医学奖。大隅良典公开了一种使用SDS-PAGE来检测GFP-ATG8剪切的技术,这种技术利用GFP-ATG8与GFP在不连续缓冲系统的迁移率不同而将这两种蛋白质分开,通过定量分析单基因缺陷或者高表达的细胞中GFP-ATG8与GFP的比值大小,从而鉴定此单个基因与自噬表型的关系。
为了验证基因与自噬的关系,首先必须利用模式生物进行基因筛选实验,验证基因与自噬表型的关系。在中国发明专利CN201610017008.8中公开了一种使用NtAtg8-pFF19-GFP质粒和激光共聚焦显微镜观察烟草中自噬现象的基因定位方法,这种方法鉴定基因与自噬表型的关系时需要首先将此质粒转入单基因缺陷或者高表达的细胞中,然后人工操作激光共聚焦显微镜对此细胞进行图像拍摄。
在这两种分别使用激光共聚焦显微镜和SDS-PAGE检测自噬的技术中,由于需要手工对逐个单个基因缺陷或者高表达的细胞进行操作,一天只能鉴定几个基因,而人类有两万多个基因,使用上述技术进行基因筛选实验,通量低,费时费力,并且通过人工分析荧光图像、搜索目标区域和提取图像特征,无法客观准确的对表型定量,从而无法根据时间点和表型影响程度对基因进行排序和分类,从而构建基因相互作用网络。此外,在这两种技术都对人健康有一定的影响,从而不能实现高通量的全基因组筛选。
发明内容
本发明解决了现有技术中细胞筛选技术中通量低,且对细胞表型无法精确定量的技术问题,提供了一种高通量功能基因筛选方法,从而大大提高了筛选效率,提高了结果的准确程度,并可以将功能基因按其对细胞表型影响的时间点和程度进行排序和分类,从而构建基因相互作用网络。
按照本发明的目的,提供了一种细胞表型图像定量分析的高通量功能基因筛选方法,含有以下步骤:
(1)利用全自动荧光显微镜拍取得到有待筛选表型的细胞图像和无所述待筛选表型的细胞图像;所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像中均具有荧光标记,所述荧光标记用于识别有待筛选表型的细胞图像中的待筛选表型,以及区分无所述待筛选表型的细胞图像中不具有所述待筛选表型;
(2)将步骤(1)所述的有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像;所述黑白二值图像中细胞区域为白色,细胞区域以外为黑色;
(3)将步骤(2)中所述的有待筛选表型的黑白二值图像分割成包含单个有待筛选表型细胞的图像,将步骤(2)中无所述待筛选表型的黑白二值图像分割成包含单个无所述待筛选表型细胞的图像;
(4)将步骤(3)所述包含单个有待筛选表型细胞的图像中的细胞区域在步骤(1)所述的有待筛选表型的细胞图像中对应的细胞区域作为阳性训练集,将步骤(3)中包含单个无所述待筛选表型细胞的图像中的细胞区域在步骤(1)中的无所述待筛选表型的细胞图像中对应的细胞区域作为阴性训练集;利用ImageNet数据集创建预训练模型,将所述阳性训练集和阴性训练集在所述预训练模型上进行迁移学习,得到能识别细胞表型的最终模型;
(5)利用全自动荧光显微镜拍取得到待筛选功能基因敲除细胞或待筛选功能基因过表达细胞各个不同时间点的细胞荧光图像,以及待筛选功能基因正常表达细胞各个不同时间点的细胞荧光图像;将所述细胞荧光图像转化成黑白二值图像;再将所述黑白二值图像分割成包含单个细胞区域的图像;将所述包含单个细胞区域的图像在所述细胞荧光图像中对应的细胞区域作为测试集;
(6)利用步骤(4)所述最终模型对步骤(5)所述测试集进行表型分类,以判断所述测试集是否具有阳性训练集中的待筛选表型;若待筛选功能基因敲除细胞中或待筛选功能基因过表达细胞中各个时间点有阳性训练集待筛选表型的细胞的比例分别与待筛选功能基因正常表达细胞各个时间点有阳性训练集待筛选表型的细胞的比例相同,则所述待筛选功能基因不是控制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因。
优选地,步骤(3)中所述分割成包含单个有待筛选表型细胞的图像,含有以下步骤:
S1:所述包含单个有待筛选表型细胞的图像中细胞区块的加权质心的横坐标和纵坐标分别由以下公式计算:
其中,m为单个白色区块中像素点个数;xi和yi分别是所述单个白色区块中像素点i的横坐标和纵坐标;f(xi,yi)为所述单个白色区块中像素点i的像素值;将所述单个白色区块中水平方向最多的白色像素点个数作为水平方向的直径,将该白色区块中垂直方向最多的白色像素点的个数作为垂直方向的直径;如果x大于等于水平方向的直径和/或y大于等于垂直方向的直径,这舍弃该白色区块;如果x小于水平方向直径且y小于垂直方向的直径,则保留该白色区块;
S2:将步骤S1中保留的白色区块的加权质心作为圆心,以所述圆心周围的黑白交界点为轮廓点,去除在白色区块轮廓之外的白色像素点,剩余的部分则为包含单个有待筛选表型细胞的图像。
优选地,步骤(2)中利用腐蚀算法去除所述二值图像的噪点,并利用膨胀算法连接所述二值图像中细胞的破损区域。
优选地,步骤(1)所述待筛选表型为细胞自噬表型、细胞周期表型、细胞凋亡表型、细胞器形态表型或细胞癌变表型。
优选地,步骤(1)所述荧光标记为绿色荧光标记。
优选地,步骤(2)采用Otsu阀值法处理有待筛选表型的细胞图像和无所述待筛选表型的细胞图像,使所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像。
优选地,步骤(1)还包括对有待筛选表型的细胞图像和无所述待筛选表型的细胞图像进行反卷积去噪的步骤。
优选地,步骤(1)所述待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别至少为100张。
按照本发明的另一方面,提供了一种细胞表型图像定量分析的高通量功能基因筛选系统,包括:
细胞图像获取模块:所述细胞图像获取模块用于利用全自动荧光显微镜拍取得到有待筛选表型的细胞图像和无所述待筛选表型的细胞图像;所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像中均具有荧光标记,所述荧光标记用于识别有待筛选表型的细胞图像中的待筛选表型,以及区分无所述待筛选表型的细胞图像中不具有所述待筛选表型;
黑白二值图像获取模块:所述黑白二值图像获取模块用于将有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像;所述黑白二值图像中细胞区域为白色,细胞区域以外为黑色;
黑白二值图像分割模块:所述黑白二值图像分割模块用于将有待筛选表型的黑白二值图像分割成包含单个有待筛选表型细胞的图像,将无所述待筛选表型的黑白二值图像分割成包含单个无所述待筛选表型细胞的图像;
细胞表型识别模型构建模块:所述细胞表型识别模型构建模块用于将包含单个有待筛选表型细胞的图像中的细胞区域在所述的有待筛选表型的细胞图像中对应的细胞区域作为阳性训练集,将包含单个无所述待筛选表型细胞的图像中的细胞区域在无所述待筛选表型的细胞图像中对应的细胞区域作为阴性训练集;利用ImageNet数据集创建预训练模型,将所述阳性训练集和阴性训练集在所述预训练模型上进行迁移学习,得到能识别细胞表型的最终模型;
测试集构建模块:所述测试集构建模块用于利用全自动荧光显微镜拍取得到待筛选功能基因敲除细胞或待筛选功能基因过表达细胞各个不同时间点的细胞荧光图像,以及待筛选功能基因正常表达细胞各个不同时间点的细胞荧光图像;将所述细胞荧光图像转化成黑白二值图像;再将所述黑白二值图像分割成包含单个细胞区域的图像;将所述包含单个细胞区域的图像在所述细胞荧光图像中对应的细胞区域作为测试集;
待筛选基因分类模块:所述待筛选基因分类模块用于利用所述最终模型对所述测试集进行表型分类,以判断所述测试集是否具有阳性训练集中的待筛选表型;若待筛选功能基因敲除细胞中或待筛选功能基因过表达细胞中各个时间点有阳性训练集待筛选表型的细胞的比例分别与待筛选功能基因正常表达细胞各个时间点有阳性训练集待筛选表型的细胞的比例相同,则所述待筛选功能基因不是控制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要具备以下的有益效果:
(1)本发明方法通过荧光自动显微镜拍摄表型图像,利用构建的能识别细胞表型的模型识别细胞表型,相比较人工分析细胞表型,大大提高了基因的筛选效率,同时提高结果的准确性。本发明中所用的全自动荧光显微镜平均每秒拍摄1张包括500个细胞的图像,最终模型对细胞表型识别通过独立测试集测试达到0.968的AUC性能,模型图像识别速度快,每秒可以识别500个细胞左右。本发明所述方法重复性好,多次识别表型结果一致。本发明中的全自动化荧光显微镜相较于共聚焦显微镜可以短时间内自动拍摄海量图像,拍摄期间无需人为参与,大大减少了工作量,降低了对人体健康的影响。针对全自动化荧光显微镜拍摄图像构建图像识别模型,利用ImageNet数据集创建预训练模型,将阳性训练集和阴性训练集在所述预训练模型上进行迁移学习,得到能识别细胞表型的最终模型。在该最终模型上,可准确识别出待筛选功能基因的细胞表型,提高了筛选结果的准确程度,减少人为因素的影响。
(2)本发明通过统计每个时间点每个基因对应的表型细胞比例(如自噬细胞比例),反映了基因的重要程度。并可以通过蛋白质相互作用信息,建立基因相互作用网络,进一步确定重要的节点基因。
(3)本发明优选地对有表型的细胞图像和无表型的细胞图形进行反卷积去噪,提高图像的对比度和清晰度,进一步增加了图像后期处理的准确性。本发明优选地采用Otsu阀值法处理有待筛选表型的细胞图像和无所述待筛选表型的细胞图像,使所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像。得到的黑白二值图像不受图像亮度和对比度的影响,按图像的灰度特性,将图像分成细胞和背景两部分。
(4)本发明优选地利用腐蚀算法去除二值图像的噪点,并利用膨胀算法连接所述二值图像中细胞的破损区域。二值图像中白色细胞区域出现粘连,并有噪点,利用腐蚀算法减少白色细胞粘连区域以及去除噪点;阈值分割中造成的细胞白色区域破损用膨胀算法连接得到完整细胞区域。
(5)本发明在分割得到单个细胞的过程中,优选地先计算白色区块的加权质心,若加权质心在白色区块之外,则舍弃白色区块,保留的白色区块的加权质心作为圆心,以所述圆心周围的黑白交界点为轮廓点,去除在白色区块轮廓之外的白色像素点,剩余的部分则为包含单个细胞的图像。
附图说明
图1是自噬细胞与野生型细胞的表型差异:图1(a)为减氮条件下,atg1敲除后在0h的细胞表型,此时未自噬;图1(b)为减氮条件下,atg1敲除后在2h的细胞表型,此时未发生自噬;图1(c)为减氮条件下,SNF1敲除后在0h的细胞表型,此时未自噬;图1(d)为减氮条件下,SNF1敲除后在2h的细胞表型,此时发生自噬。
图2是基于海量细胞表型图像定量分析的高通量基因筛选方法的流程图。
图3为对模型进行独立测试的ROC图。
图4(a)和图4(b)分别为未自噬和自噬的细胞表型;图4(c)、图4(d)、图4(e)和图4(f)分别为FMP48、SWE1、FUS3和CTK-N敲除1h后的细胞表型。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1
将iEKPD数据库中103个的磷酸化调控子基因进行筛选,筛选其是否与自噬相关基因。
1、生成训练集:导入GFP-Atg8进入酵母细胞其表达并产生绿色荧光,利用FM4-64标记液泡,使其产生红色荧光,表型产生条件有减氮以及rapamycin诱导(雷帕霉素诱导)等。细胞0小时为无自噬表型细胞,在减氮条件下,2小时后细胞发生自噬。利用全自动荧光显微镜生成大量有表型的细胞和无表型的细胞图像。
2、图像处理:通过增强对比度以及反卷积去噪以强化荧光信号。反卷积去噪:使用不同大小的PSF(点扩散函数)恢复模糊图像,分析并重建PSF,从而改善恢复图像。
3、采用了多阀值Otsu法来分割不同亮度的细胞,生成二值分割图像。
然后“修补”二值分割图:
(1)用腐蚀算法来去除较小的噪点。
(2)当细胞膜贴着液泡时,细胞会被分割成若干断裂区域,用膨胀算法来连接断裂区域。
4、将图像分割成以细胞为中心的小图,并去除小图中的其他细胞。将有表型的细胞小图作为阳性训练集,无表型的细胞小图作为阴性训练集。一共得到2000个自噬细胞图像,2000个未自噬细胞图像。细胞分割的具体步骤为:
S1:有表型的细胞小图中细胞区块加权质心的的横坐标和纵坐标分别由以下公式计算:
白色区块为潜在的细胞区块,该公式中m为单个白色区块中像素点个数;xi和yi分别是所述单个白色区块中像素点i的横坐标和纵坐标;f(xi,yi)为所述单个白色区块中像素点i的像素值;将所述单个白色区块中水平方向最多的白色像素点个数作为水平方向的直径,将该白色区块中垂直方向最多的白色像素点的个数作为垂直方向的直径;如果x大于等于水平方向的直径和/或y大于等于垂直方向的直径,这舍弃该白色区块;如果x小于水平方向直径且y小于垂直方向的直径,则保留该白色区块;
S2:将步骤S1中保留的白色区块的加权质心作为圆心,以所述圆心周围的黑白交界点为轮廓点,去除在白色区块轮廓之外的白色像素点,剩余的部分则为包含单个细胞的图像。
5、训练模型以及性能评估,如图3所示,通过独立测试测得AUC为0.968:
(1)利用VGG16作为预训练模型,增加全局平均池化层,增加全连接层,softmax激活函数用作分类,组合预训练模型与新加层。
(2)只训练新加层,冻结VGG16所有层,用细胞图片在原模型基础上进行迁移学习得到最终模型,通过交叉验证以及独立测试检验模型的准确性和鲁棒性。
6、将基因敲除的细胞利用导入GFP-Atg8,FM4-64标记液泡产生绿色和红色荧光,置入减氮培养基,依次注入96孔板的不同的孔内,将96孔板置于全自动荧光显微镜的载物台上准备拍照。
7、显微镜依次扫描96孔板,生成大量细胞表型图像,平均每秒产生一张图像,每张图像500细胞左右。
8、利用训练好的模型对其进行表型定量,如图4所示,图4(a)和图4(b)分别为未自噬和自噬的细胞表型;图4(c)、图4(d)、图4(e)和图4(f)分别为FMP48、SWE1、FUS3和CTK-N敲除1h后的细胞表型,此时自噬细胞与未自噬细胞比分别为38%,35%,26%和15%,说明FMP48、SWE1、FUS3和CTK-N敲除对细胞自噬产生影响,其中自噬越少的CTK-N敲除对自噬的影响最大。
实施例2
图1(a)为减氮条件下,atg1敲除后在0h的细胞表型,此时未自噬;图1(b)为减氮条件下,atg1敲除后在2h的细胞表型,此时未发生自噬;图1(c)为减氮条件下,SNF1敲除后在0h的细胞表型,此时未自噬;图1(d)为减氮条件下,SNF1敲除后在2h的细胞表型,此时发生自噬。如图1(d)所示,当细胞自噬时,GFP-Atg8进入FM4-64标记的液泡;如图1(a)、图1(b)和图1(c)所示,当细胞未自噬时,GFP-Atg8主要定位于液泡外。我们可以让计算机学习识别此表型上的差异从而区分自噬和未自噬的细胞。
图2为基于海量细胞表型图像定量分析的高通量基因筛选方法的流程图。如图2中所示,我们首先对酵母细胞进行单个基因敲除或高表达,制备细胞悬浮液,将悬浮液注入96孔板并待细胞沉底后,利用自动化荧光显微镜对基因敲除或高表达的细胞在多个时间点进行自动成像,获取海量图像,针对自动荧光显微镜所拍摄图像噪声较多,细胞分层严重,z轴重叠等缺陷;噪声即图像模糊;z轴重叠指出现在液泡上方或者下方的GFP-Atg8,与液泡在z轴上形成重叠,从而造成其出现在液泡内部的假象。控制细胞液浓度为0.6-0.9OD,并待细胞沉底后拍摄效果最佳,并尽可能多的拍摄图像,利用反卷积去噪,液泡定位法可以减轻这些问题,并利用深度学习算法对图片中的细胞表型进行定量分析,可以达到0.968的AUC,从而可以准确高效的实现全基因组筛选,并将这些自噬相关基因按其对细胞自噬影响的时间点和程度进行排序和分类,从而构建基因相互作用网络。最后,根据酵母和人的同源关系,在人类中进行基因功能验证。
当然,基于海量细胞表型图像定量分析的高通量基因筛选方法也可以用于其他细胞表型的功能基因筛选,如控制细胞器形态基因,细胞周期基因,细胞凋亡基因和细胞癌变基因等。通过计算包含正常细胞器细胞与包含其他形态细胞器的细胞比例来衡量基因对细胞器形态的影响。通过识别图像中细胞数量来衡量基因对细胞周期的影响,细胞数量越多,说明细胞周期越短。通过存活细胞与死亡细胞的比例来衡量基因对细胞凋亡的影响,死亡细胞的比例越大,说明细胞凋亡程度越高。通过正常细胞与癌细胞的比例来衡量基因对细胞癌变的影响。
总之,本发明方法利用全自动显微镜的高效拍摄,利用改进的图像处理方法弥补全自动显微镜的缺陷,利用深度学习算法学习表型差异并对海量图像进行准确的定量分析,从而使全基因组筛选实现高通量和快速的特点迅速,使细胞表型定量分析客观且准确。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,含有以下步骤:
(1)利用全自动荧光显微镜拍取得到有待筛选表型的细胞图像和无所述待筛选表型的细胞图像;所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像中均具有荧光标记,所述荧光标记用于识别有待筛选表型的细胞图像中的待筛选表型,以及区分无所述待筛选表型的细胞图像中不具有所述待筛选表型;
(2)将步骤(1)所述的有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像;所述黑白二值图像中细胞区域为白色,细胞区域以外为黑色;
(3)将步骤(2)中所述的有待筛选表型的黑白二值图像分割成包含单个有待筛选表型细胞的图像,将步骤(2)中无所述待筛选表型的黑白二值图像分割成包含单个无所述待筛选表型细胞的图像;
(4)将步骤(3)所述包含单个有待筛选表型细胞的图像中的细胞区域在步骤(1)所述的有待筛选表型的细胞图像中对应的细胞区域作为阳性训练集,将步骤(3)中包含单个无所述待筛选表型细胞的图像中的细胞区域在步骤(1)中的无所述待筛选表型的细胞图像中对应的细胞区域作为阴性训练集;利用ImageNet数据集创建预训练模型,将所述阳性训练集和阴性训练集在所述预训练模型上进行迁移学习,得到能识别细胞表型的最终模型;
(5)利用全自动荧光显微镜拍取得到待筛选功能基因敲除细胞或待筛选功能基因过表达细胞各个不同时间点的细胞荧光图像,以及待筛选功能基因正常表达细胞各个不同时间点的细胞荧光图像;将所述细胞荧光图像转化成黑白二值图像;再将所述黑白二值图像分割成包含单个细胞区域的图像;将所述包含单个细胞区域的图像在所述细胞荧光图像中对应的细胞区域作为测试集;
(6)利用步骤(4)所述最终模型对步骤(5)所述测试集进行表型分类,以判断所述测试集是否具有阳性训练集中的待筛选表型;若待筛选功能基因敲除细胞中或待筛选功能基因过表达细胞中各个时间点有阳性训练集待筛选表型的细胞的比例分别与待筛选功能基因正常表达细胞各个时间点有阳性训练集待筛选表型的细胞的比例相同,则所述待筛选功能基因不是控制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因。
2.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(3)中所述分割成包含单个有待筛选表型细胞的图像,含有以下步骤:
S1:所述包含单个有待筛选表型细胞的图像中细胞区块的加权质心的横坐标和纵坐标分别由以下公式计算:
其中,m为单个白色区块中像素点个数;xi和yi分别是所述单个白色区块中像素点i的横坐标和纵坐标;f(xi,yi)为所述单个白色区块中像素点i的像素值;将所述单个白色区块中水平方向最多的白色像素点个数作为水平方向的直径,将该白色区块中垂直方向最多的白色像素点的个数作为垂直方向的直径;如果x大于等于水平方向的直径和/或y大于等于垂直方向的直径,这舍弃该白色区块;如果x小于水平方向直径且y小于垂直方向的直径,则保留该白色区块;
S2:将步骤S1中保留的白色区块的加权质心作为圆心,以所述圆心周围的黑白交界点为轮廓点,去除在白色区块轮廓之外的白色像素点,剩余的部分则为包含单个有待筛选表型细胞的图像。
3.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(2)中利用腐蚀算法去除所述二值图像的噪点,并利用膨胀算法连接所述二值图像中细胞的破损区域。
4.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(1)所述待筛选表型为细胞自噬表型、细胞周期表型、细胞凋亡表型、细胞器形态表型或细胞癌变表型。
5.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(1)所述荧光标记为绿色荧光标记。
6.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(2)采用Otsu阀值法处理有待筛选表型的细胞图像和无所述待筛选表型的细胞图像,使所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像。
7.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(1)还包括对有待筛选表型的细胞图像和无所述待筛选表型的细胞图像进行反卷积去噪的步骤。
8.如权利要求1所述的细胞表型图像定量分析的高通量功能基因筛选方法,其特征在于,步骤(1)所述待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别至少为100张。
9.一种细胞表型图像定量分析的高通量功能基因筛选系统,其特征在于,包括:
细胞图像获取模块:所述细胞图像获取模块用于利用全自动荧光显微镜拍取得到有待筛选表型的细胞图像和无所述待筛选表型的细胞图像;所述有待筛选表型的细胞图像和无所述待筛选表型的细胞图像中均具有荧光标记,所述荧光标记用于识别有待筛选表型的细胞图像中的待筛选表型,以及区分无所述待筛选表型的细胞图像中不具有所述待筛选表型;
黑白二值图像获取模块:所述黑白二值图像获取模块用于将有待筛选表型的细胞图像和无所述待筛选表型的细胞图像分别转化成有待筛选表型的黑白二值图像和无所述待筛选表型的黑白二值图像;所述黑白二值图像中细胞区域为白色,细胞区域以外为黑色;
黑白二值图像分割模块:所述黑白二值图像分割模块用于将有待筛选表型的黑白二值图像分割成包含单个有待筛选表型细胞的图像,将无所述待筛选表型的黑白二值图像分割成包含单个无所述待筛选表型细胞的图像;
细胞表型识别模型构建模块:所述细胞表型识别模型构建模块用于将包含单个有待筛选表型细胞的图像中的细胞区域在所述的有待筛选表型的细胞图像中对应的细胞区域作为阳性训练集,将包含单个无所述待筛选表型细胞的图像中的细胞区域在无所述待筛选表型的细胞图像中对应的细胞区域作为阴性训练集;利用ImageNet数据集创建预训练模型,将所述阳性训练集和阴性训练集在所述预训练模型上进行迁移学习,得到能识别细胞表型的最终模型;
测试集构建模块:所述测试集构建模块用于利用全自动荧光显微镜拍取得到待筛选功能基因敲除细胞或待筛选功能基因过表达细胞各个不同时间点的细胞荧光图像,以及待筛选功能基因正常表达细胞各个不同时间点的细胞荧光图像;将所述细胞荧光图像转化成黑白二值图像;再将所述黑白二值图像分割成包含单个细胞区域的图像;将所述包含单个细胞区域的图像在所述细胞荧光图像中对应的细胞区域作为测试集;
待筛选基因分类模块:所述待筛选基因分类模块用于利用所述最终模型对所述测试集进行表型分类,以判断所述测试集是否具有阳性训练集中的待筛选表型;若待筛选功能基因敲除细胞中或待筛选功能基因过表达细胞中各个时间点有阳性训练集待筛选表型的细胞的比例分别与待筛选功能基因正常表达细胞各个时间点有阳性训练集待筛选表型的细胞的比例相同,则所述待筛选功能基因不是控制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例下降,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因敲除细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点抑制该待筛选表型的基因;若待筛选功能基因过表达细胞中某时间点有阳性训练集待筛选表型的细胞的比例上升,则所述待筛选功能基因是在该时间点促进该待筛选表型的基因。
CN201910041846.2A 2019-01-17 2019-01-17 细胞表型图像定量分析的高通量功能基因筛选方法及系统 Active CN109815870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910041846.2A CN109815870B (zh) 2019-01-17 2019-01-17 细胞表型图像定量分析的高通量功能基因筛选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910041846.2A CN109815870B (zh) 2019-01-17 2019-01-17 细胞表型图像定量分析的高通量功能基因筛选方法及系统

Publications (2)

Publication Number Publication Date
CN109815870A true CN109815870A (zh) 2019-05-28
CN109815870B CN109815870B (zh) 2021-02-05

Family

ID=66604480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910041846.2A Active CN109815870B (zh) 2019-01-17 2019-01-17 细胞表型图像定量分析的高通量功能基因筛选方法及系统

Country Status (1)

Country Link
CN (1) CN109815870B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245157A (zh) * 2019-05-31 2019-09-17 华中科技大学 一种基于概率密度估计的数据差异分析方法及系统
CN111598029A (zh) * 2020-05-21 2020-08-28 东莞太力生物工程有限公司 目标细胞株的筛选方法、系统、服务器及存储介质
CN112001329A (zh) * 2020-08-26 2020-11-27 东莞太力生物工程有限公司 蛋白表达量的预测方法、装置、计算机设备和存储介质
CN112037862A (zh) * 2020-08-26 2020-12-04 东莞太力生物工程有限公司 基于卷积神经网络的细胞筛选方法和装置
WO2022042509A1 (zh) * 2020-08-26 2022-03-03 深圳太力生物技术有限责任公司 基于表达量预测模型的细胞筛选方法和装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101797390A (zh) * 2009-02-06 2010-08-11 北京大学 基因rab13的拮抗剂的应用及包含该拮抗剂的药物
CN102449639A (zh) * 2009-06-02 2012-05-09 通用电气医疗集团英国有限公司 图像分析
CN103994964A (zh) * 2014-05-23 2014-08-20 天津大学 针对荧光显微图像的凋亡细胞形态的量化分析方法
CN104198697A (zh) * 2014-08-20 2014-12-10 武汉大学 离心力和剪应力应答基因1(recs1)在治疗血管损伤后再狭窄中的功能和应用
CN105678810A (zh) * 2016-01-12 2016-06-15 上海交通大学 基于全局和局部层次最优的细胞跟踪方法
CN106446833A (zh) * 2016-09-27 2017-02-22 湖南商学院 一种用于复杂场景图像识别的多通道仿生视觉方法
CN106480090A (zh) * 2016-10-08 2017-03-08 杭州电子科技大学 一种促进细胞移植和基因表达的转基因载体系统及其应用
CN107356515A (zh) * 2017-07-20 2017-11-17 上海睿钰生物科技有限公司 一种荧光图像的荧光强度确定方法和系统
CN107492090A (zh) * 2016-06-09 2017-12-19 西门子保健有限责任公司 根据合成数据利用机器学习的基于图像的肿瘤表型分析
CN108795858A (zh) * 2017-04-28 2018-11-13 深圳宾德生物技术有限公司 高抗癌活性t细胞的筛选方法和应用
CN109035326A (zh) * 2018-06-19 2018-12-18 北京理工大学 基于亚像素图像识别的高精度定位技术
CN109069870A (zh) * 2016-02-24 2018-12-21 洛克菲勒大学 基于胚胎细胞的用于亨廷顿氏病的治疗候选物筛选系统、模型及它们的应用
CN109191467A (zh) * 2018-08-01 2019-01-11 华中科技大学鄂州工业技术研究院 一种细胞自噬表型的预测方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101797390A (zh) * 2009-02-06 2010-08-11 北京大学 基因rab13的拮抗剂的应用及包含该拮抗剂的药物
CN102449639A (zh) * 2009-06-02 2012-05-09 通用电气医疗集团英国有限公司 图像分析
CN103994964A (zh) * 2014-05-23 2014-08-20 天津大学 针对荧光显微图像的凋亡细胞形态的量化分析方法
CN104198697A (zh) * 2014-08-20 2014-12-10 武汉大学 离心力和剪应力应答基因1(recs1)在治疗血管损伤后再狭窄中的功能和应用
CN105678810A (zh) * 2016-01-12 2016-06-15 上海交通大学 基于全局和局部层次最优的细胞跟踪方法
CN109069870A (zh) * 2016-02-24 2018-12-21 洛克菲勒大学 基于胚胎细胞的用于亨廷顿氏病的治疗候选物筛选系统、模型及它们的应用
CN107492090A (zh) * 2016-06-09 2017-12-19 西门子保健有限责任公司 根据合成数据利用机器学习的基于图像的肿瘤表型分析
CN106446833A (zh) * 2016-09-27 2017-02-22 湖南商学院 一种用于复杂场景图像识别的多通道仿生视觉方法
CN106480090A (zh) * 2016-10-08 2017-03-08 杭州电子科技大学 一种促进细胞移植和基因表达的转基因载体系统及其应用
CN108795858A (zh) * 2017-04-28 2018-11-13 深圳宾德生物技术有限公司 高抗癌活性t细胞的筛选方法和应用
CN107356515A (zh) * 2017-07-20 2017-11-17 上海睿钰生物科技有限公司 一种荧光图像的荧光强度确定方法和系统
CN109035326A (zh) * 2018-06-19 2018-12-18 北京理工大学 基于亚像素图像识别的高精度定位技术
CN109191467A (zh) * 2018-08-01 2019-01-11 华中科技大学鄂州工业技术研究院 一种细胞自噬表型的预测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OLIVER DURR: "Deep learning for single cell phenotype classification in", 《SIBS 2017》 *
吴小杰: "基于反卷积网络的图像去噪及分类方法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245157A (zh) * 2019-05-31 2019-09-17 华中科技大学 一种基于概率密度估计的数据差异分析方法及系统
CN110245157B (zh) * 2019-05-31 2021-06-11 华中科技大学 一种基于概率密度估计的数据差异分析方法及系统
CN111598029A (zh) * 2020-05-21 2020-08-28 东莞太力生物工程有限公司 目标细胞株的筛选方法、系统、服务器及存储介质
CN112001329A (zh) * 2020-08-26 2020-11-27 东莞太力生物工程有限公司 蛋白表达量的预测方法、装置、计算机设备和存储介质
CN112037862A (zh) * 2020-08-26 2020-12-04 东莞太力生物工程有限公司 基于卷积神经网络的细胞筛选方法和装置
CN112001329B (zh) * 2020-08-26 2021-11-30 深圳太力生物技术有限责任公司 蛋白表达量的预测方法、装置、计算机设备和存储介质
WO2022042506A1 (zh) * 2020-08-26 2022-03-03 深圳太力生物技术有限责任公司 基于卷积神经网络的细胞筛选方法和装置
WO2022042509A1 (zh) * 2020-08-26 2022-03-03 深圳太力生物技术有限责任公司 基于表达量预测模型的细胞筛选方法和装置
WO2022042510A1 (zh) * 2020-08-26 2022-03-03 深圳太力生物技术有限责任公司 蛋白表达量的预测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109815870B (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN109815870A (zh) 细胞表型图像定量分析的高通量功能基因筛选方法及系统
US11669971B2 (en) Colony contrast gathering
CN110660052B (zh) 一种基于深度学习的热轧带钢表面缺陷检测方法
US7796815B2 (en) Image analysis of biological objects
CN103518224B (zh) 用于分析微生物生长的方法
CN113454733A (zh) 用于预后组织模式识别的多实例学习器
CN108510004B (zh) 一种基于深度残差网络的细胞分类方法及系统
CN106529499A (zh) 基于傅里叶描述子和步态能量图融合特征的步态识别方法
CN108447080A (zh) 基于分层数据关联和卷积神经网络的目标跟踪方法、系统和存储介质
US9147104B2 (en) Systems and methods for processing low contrast images
CN108052886A (zh) 一种小麦条锈病菌夏孢子自动统计计数方法
CN110533648A (zh) 一种黑头识别处理方法及系统
CN114387596A (zh) 细胞病理涂片自动判读系统
CN111598029B (zh) 目标细胞株的筛选方法、系统、服务器及存储介质
CN109472790A (zh) 一种机械零件缺陷检测方法及系统
Aggarwal et al. Protein Subcellular Localization Prediction by Concatenation of Convolutional Blocks for Deep Features Extraction from Microscopic Images
CN106845558A (zh) 路面检测的方法和装置
CN101762448B (zh) 一种粒子分类方法及粒子检测装置
CN113853607A (zh) 用于监测菌落的细菌生长和预测菌落生物量的系统和方法
CN110675363A (zh) 一种针对宫颈细胞的dna指数自动计算方法
CN110032973A (zh) 一种基于人工智能的无监督寄生虫分类方法及系统
US11966842B2 (en) Systems and methods to train a cell object detector
CN109697450A (zh) 细胞分类方法
Ljosa et al. Probabilistic segmentation and analysis of horizontal cells
Zimmer From microbes to numbers: extracting meaningful quantities from images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant