CN112001329B

CN112001329B - 蛋白表达量的预测方法、装置、计算机设备和存储介质

Info

Publication number: CN112001329B
Application number: CN202010870702.0A
Authority: CN
Inventors: 陈亮; 韩晓健; 李争尔; 梁国龙
Original assignee: Shenzhen Taili Biotechnology Co ltd
Current assignee: Shenzhen Taili Biotechnology Co.,Ltd.
Priority date: 2020-08-26
Filing date: 2020-08-26
Publication date: 2021-11-30
Anticipated expiration: 2040-08-26
Also published as: WO2022042510A1; CN112001329A

Abstract

本申请涉及一种蛋白表达量的预测方法、装置、计算机设备和存储介质。包括：获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；将多张待测细胞灰度图输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；根据所述目标生成网络模型的输出，得到所述多个待测细胞分别对应的预测荧光图；根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量，实现了根据细胞灰度图快速确定培养池中各个细胞的蛋白表达量，避免反复进行培养和筛选，有效提高培养过程中细胞的蛋白表达量的预测效率。

Description

蛋白表达量的预测方法、装置、计算机设备和存储介质

技术领域

本申请涉及生物技术领域，特别是涉及一种蛋白表达量的预测方法、装置、计算机设备和存储介质。

背景技术

随着基因工程技术的不断发展，从细胞池中分离出能够表达特定产物的单克隆细胞株已成为生物领域中的常见需求。

在现有技术中，可以对细胞池中的细胞进行转染，并采用有限稀释法对细胞池进行处理，得到单细胞，进而可以采用单细胞培养具有同质性的细胞群体，即细胞株，并测试细胞株中细胞的目的蛋白表达量，筛选其中目的蛋白表达水平高的细胞株。

然而，有限稀释法过程繁琐，需要反复地对细胞进行培养和筛选后，才计算目的蛋白表达量，导致蛋白表达量的预测效率低下，耗时十分长。

发明内容

基于此，有必要针对上述技术问题，提供一种蛋白表达量的预测方法、装置、计算机设备和存储介质。

一种蛋白表达量的预测方法，所述方法包括：

获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；

将多张待测细胞灰度图输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；

根据所述目标生成网络模型的输出，得到所述多个待测细胞分别对应的预测荧光图；

根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量。

可选地，所述将多张待测细胞灰度图输入目标生成网络模型，包括：

根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级；

从多个待测细胞中确定蛋白表达能力等级满足预设条件的多个目标细胞；

将所述多个目标细胞分别对应的待测细胞灰度图，输入所述目标生成网络模型。

可选地，所述根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级，包括：

将各个待测细胞的待测细胞灰度图输入细胞分类网络模型；所述细胞分类网络模型采用具有蛋白表达量标签的多张训练细胞灰度图对初始卷积神经网络训练得到；所述蛋白表达量标签用于表征各训练细胞灰度图中细胞的蛋白表达能力等级；所述细胞分类网络模型用于检测输入模型的细胞灰度图中细胞的蛋白表达能力等级；

根据所述细胞分类网络模型的输出，确定各个待测细胞中的蛋白表达能力等级。

可选地，还包括：

获取训练细胞灰度图及其对应的真实荧光图；

确定所述真实荧光图中绿色通道对应的数值；

根据所述真实荧光图中绿色通道对应的数值，确定对应的所述训练细胞灰度图中细胞的真实蛋白表达量，以及所述真实蛋白量对应的蛋白表达能力等级，并基于所述蛋白表达能力等级得到所述训练细胞灰度图的蛋白表达量标签；

采用所述蛋白表达量标签和所述训练细胞灰度图对初始卷积神经网络进行训练，得到细胞分类网络模型。

可选地，还包括：

获取生成式对抗网络模型、训练细胞灰度图及其对应的真实荧光图；所述生成式对抗网络模型包括待训练的生成网络模型和判别网络模型；

将所述训练细胞灰度图输入所述生成网络模型，获取所述生成网络模型输出的待判别荧光图；

将所述待判别荧光图和所述真实荧光图输入所述判别网络模型，获取所述待判别荧光图对应的判别结果；

根据所述判别结果，调整所述判别网络模型的网络参数；

当所述判别网络模型训练了设定次数时，切换为对所述生成网络模型进行训练；交替训练所述生成网络模型和所述判别网络模型，直到得到目标生成网络模型。

可选地，所述根据所述判别结果，调整所述生成网络模型的网络参数，直到得到目标生成网络模型，包括：

当所述判别结果表征所述待判别荧光图为假，根据所述待判别荧光图、所述真实荧光图和所述判别网络模型，计算所述生成网络模型的损失误差；

根据所述损失误差，调整所述生成网络模型的网络参数。

可选地，还包括

对所述多个待测细胞分别对应的蛋白表达量进行排序，并从排序后的多个蛋白表达量中，将排序最前的预设数量的蛋白表达量确定为目标表达量；

获取所述目标表达量对应的目标灰度图，并将所述目标灰度图对应的待测细胞确定为用于培养细胞株的目标细胞。

一种蛋白表达量的预测装置，所述装置包括：

待测细胞灰度图获取模块，用于获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；

第一输入模块，用于将多张待测细胞灰度图输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；

预测荧光图获取模块，用于根据所述目标生成网络模型的输出，得到所述多个待测细胞分别对应的预测荧光图；

蛋白表达量确定模块，用于根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上所述的蛋白表达量的预测方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序所述计算机程序被处理器执行时实现如上所述的蛋白表达量的预测方法的步骤。

上述一种蛋白表达量的预测方法、装置、计算机设备和存储介质，通过获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图，将多张待测细胞灰度图输入目标生成网络模型，该目标生成网络模型可以采用多张训练细胞灰度图对生成式对抗网络模型训练得到，多张训练细胞灰度图可以分别具有对应的荧光图标签；进而可以根据目标生成网络模型的输出，得到多个待测细胞分别对应的预测荧光图，并根据预测荧光图，确定多个待测细胞分别对应的蛋白表达量，实现了根据细胞灰度图快速确定培养池中各个细胞的蛋白表达量，避免反复进行培养和筛选后才能进行蛋白表达量的评估，有效提高培养过程中细胞的蛋白表达量的预测效率，缩短蛋白表达量的评估周期。

附图说明

图1为一个实施例中一种蛋白表达量的预测方法的流程示意图；

图2为一个实施例中一种目标生成网络模型训练步骤的流程示意图；

图3a为一个实施例中一种训练细胞灰度图；

图3b为一个实施例中一种训练细胞荧光图；

图4为一个实施例中一种细胞筛选方法的流程示意图；

图5为一个实施例中一种细胞分类网络模型训练步骤的流程示意图；

图6为一个实施例中另一种细胞筛选方法的流程示意图；

图7为一个实施例中一种蛋白表达量的预测装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

为了便于对本发明实施例的理解，先对现有技术进行说明。

在现有技术中，在筛选目的蛋白表达水平高的细胞株时，需要采用有限稀释法对细胞培养池中的细胞进行处理，反复进行培养和筛选后，才计算目的蛋白表达量，整个过程需要耗时6个月以上，在消耗大量人力物力的同时，难以满足产业化、规模化生产的需求。针对现有技术中存在的缺点，本申请提供了一种蛋白表达量的预测方法、装置、计算机设备和存储介质。

在一个实施例中，如图1所示，提供了一种蛋白表达量的预测方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

步骤101，获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；

作为一示例，待测细胞可以是经过转染技术处理后的细胞，待测细胞可以是在处理后未能获得外源DNA片段的细胞，也可以是已获得外源DNA片段但未整合染色体中的细胞，或者是外源DNA片段已整合到染色体中的细胞。待测细胞灰度图可以是待测细胞的灰度图。

在实际应用中，可以对细胞培养池中的多个细胞进行转染，使得细胞培养池中的部分或全部细胞可以获得外源DNA片段。在进行转染处理后，可以通过显微摄影设备获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图。

步骤102，将多张待测细胞灰度图输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；

作为一示例，训练细胞灰度图可以是用于训练生成式对抗网络模型的细胞灰度图，训练细胞灰度图中的细胞可以是经过转染处理后的细胞。

在得到多张待测细胞灰度图后，可以将多张待测细胞灰度图输入目标生成网络模型。具体而言，目标生成网络模型，可以采用具有荧光图标签的多张训练细胞灰度图对生成式对抗网络模型进行训练得到，其中，荧光图标签可以是训练细胞灰度图对应的真实荧光图。

步骤103，根据所述目标生成网络模型的输出，得到所述多个待测细胞分别对应的预测荧光图；

在将多张待测细胞灰度图输入目标生成网络模型，可以根据目标生成网络模型的输出，得到多个待测细胞分别对应的预测荧光图。在实际应用中，目标生成网络模型可以根据输入的待测细胞灰度图生成对应的预测荧光图。

在实际应用中，可以对细胞染色后进行拍摄，得到荧光图。然而，细胞在染色后会失去活性，难以继续繁殖。在本申请中，采用目标生成网络模型对细胞的荧光图进行预测，可以在保持细胞活性时，得到细胞的荧光图像。

步骤104，根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量。

在获取预测荧光图后，可以根据多个待测细胞分别对应的预测荧光图，确定多个待测细胞分别对应的蛋白表达量。

在本实施例中，通过获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图，将多张待测细胞灰度图输入目标生成网络模型，该目标生成网络模型可以采用多张训练细胞灰度图对生成式对抗网络模型训练得到，多张训练细胞灰度图可以分别具有对应的荧光图标签；进而可以根据目标生成网络模型的输出，得到多个待测细胞分别对应的预测荧光图，并根据预测荧光图，确定多个待测细胞分别对应的蛋白表达量，实现了根据细胞灰度图快速确定培养池中各个细胞的蛋白表达量，避免反复进行培养和筛选后才能进行蛋白表达量的评估，有效提高培养过程中细胞的蛋白表达量的预测效率，缩短蛋白表达量的评估周期。

在一个实施例中，如图2所示，所述方法还可以包括如下步骤：

步骤201，获取生成式对抗网络模型、训练细胞灰度图及其对应的真实荧光图；所述生成式对抗网络模型包括待训练的生成网络模型和判别网络模型；

具体而言，可以设置作为训练集的细胞，并对该细胞进行拍摄，分别获取训练细胞灰度图和对应的真实荧光图。

其中，作为训练集的细胞，可以是细胞培养池中经过转染技术处理后的细胞，该细胞可以是在处理后未能获得外源DNA片段的细胞，也可以是已获得外源DNA片段但未整合染色体中的细胞，或者是外源DNA片段已整合到染色体中的细胞。训练细胞灰度图及其对应的真实荧光图，可以是在相同的拍摄条件下，针对相同的细胞进行拍摄得到的灰度图和荧光图，例如图3a和图3b。

在实际应用中，可以获取生成式对抗网络模型，训练细胞灰度图，以及训练细胞灰度图对应的真实荧光图；生成式对抗网络模型中可以包括待训练的生成网络模型和判别网络模型。

其中，判别网络模型可以由卷积层、最大池化层和全连接层组成，例如，可以由3层卷积层、2层最大池化层和1层全连接层组成。

生成网络模型可以由卷积层，最大池化层和反卷积层组成，在生成网络模型中，训练细胞灰度图经过卷积层进行一次卷积操作以及经过最大池化层进行一次池化操作，确定为进行一次下采样操作，通过若干次的下采样操作，从训练细胞灰度图中提取细胞特征图。

针对生成网络模型中的反卷积层，经过反卷积层进行一次反卷积操作，确定为进行一次上采样操作，由此采用已提取的细胞特征图生成待判别荧光图。

步骤202，将所述训练细胞灰度图输入所述生成网络模型，获取所述生成网络模型输出的待判别荧光图；

在实际应用中，可以将训练细胞灰度图输入生成网络模型，并获取生成网络模型输出的待判别荧光图，其中，生成网络模型可以根据输入的训练细胞灰度图，生成由该模型预测的待判别荧光图。

具体的，训练细胞灰度图在输入生成网络模型后，可以进行第一预设次数的下采样操作，其中，通过最大池化层可以在保留细胞特征的同时，对特征图进行压缩。

在获取细胞特征向量后，生成网络模型对获取的细胞特征向量进行第二预设次数的上采样操作，生成待判别荧光图，其中，第一预设次数和第二预设次数可以都是五次。

步骤203，将所述待判别荧光图和所述真实荧光图输入所述判别网络模型，获取所述待判别荧光图对应的判别结果；

在得到待判别荧光图后，可以将待判别荧光图和真实荧光图输入判别网络模型，并获取判别网络模型输出的判别结果。其中，判别网络模型可以根据已知为真实的真实荧光图，对待判别荧光图的真实性进行判断，判断该图片是否为真实的荧光图并输出判别结果。其中，当判别网络模型输出结果为1时，可以表征待判别荧光图为真，当输出结果为0时，可以表征待判别荧光图为假。

步骤204，根据所述判别结果，调整所述判别网络模型的网络参数；

在得到判别结果后，可以对生成网络模型的网络参数进行调整，知道得到网络参数满足预设条件的目标生成网络模型。

在实际应用中，生成网络模型和判别网络模型交替进行训练，具体的，可以先对判别网络模型进行训练，在训练时，固定生成网络模型的网络参数，将蛋白表达量标签和生成网络模型生成预测荧光图输入到判别网络模型中，并根据判别结果调整判别网络模型的网络参数。

步骤205，当所述判别网络模型训练了设定次数时，切换为对所述生成网络模型进行训练；交替训练所述生成网络模型和所述判别网络模型，直到得到目标生成网络模型。

当判别网络模型的训练次数达到设定次数时，可以将判别网络模型当前的网络参数固定，切换为对生成网络模型的训练，如此交替训练生成网络模型和判别网络模型，直到得到目标生成网络模型。

在本实施例中，通过交替训练生成网络模型和判别网络模型，可以在调整网络参数的过程中，通过不断优化的判别网络模型对生成网络模型进行监督，建立训练细胞灰度图和待判别荧光图之间的关系。

在一个实施例中，所述对所述生成网络模型进行训练，可以包括如下步骤：

将所述训练细胞灰度图输入所述生成网络模型，获取所述生成网络模型输出的待判别荧光图；将所述待判别荧光图和所述真实荧光图输入所述判别网络模型，获取所述待判别荧光图对应的判别结果；当所述判别结果表征所述待判别荧光图为假，根据所述待判别荧光图、所述真实荧光图和所述判别网络模型，计算所述生成网络模型的损失误差；根据所述损失误差，调整所述生成网络模型的网络参数。

在具体实现中，当判别结果表征待判别荧光图为假时，可以结合待判别荧光图、真实荧光图和判别网络模型，计算生成网络模型当前的损失误差，并根据损失误差对生成网络模型的网络参数进行调整，更新生成网络模型。其中，在调整生成网络模型参数时，可以采用反向传播算法调整生成网络模型的参数。

在更新后，可以确定网络参数的当前调整次数，并判断当前调整次数是否小于预设阈值，若是，可以确定当前的网络参数需继续调整，返回将训练细胞灰度图输入生成网络模型，获取生成网络模型输出的待判别荧光图的步骤，并将新生成的待判别荧光图和真实荧光图输入判别网络模型，获取判别结果，继续对生成网络模型进行训练；若是，可以切户为对判别网络模型的训练。

在交替训练预设次数后，可以在当前生成网络模型对应的损失误差已收敛并且不再变化时，基于当前生成网络模的网络参数生成目标生成网络模型。

例如，在训练生成网络模型时，判别器的参数可以设置为不可调整，当初次将训练细胞灰度图输入待训练的生成网络模型时，由于模型未收敛，网络参数可以是随机生成的，则首次生成的待判别荧光图将被判别网络模型确定为假图，生成网络模型可以通过代价函数获取损失误差，并通过反向传播算法对网络参数进行调整，不断降低损失误差。当判别网络模型判定待判别荧光图为真图时，判别网络模型与生成网络模型达到平衡。

在本实施例中，可以根据损失误差，调整生成网络模型的网络参数，不断地对生成网络模型进行优化，使生成网络模型进行优化可以产生更逼真的荧光图。

在一个实施例中，如图4所示，所述将多张待测细胞灰度图输入目标生成网络模型，可以包括：

步骤401，根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级；

作为一示例，蛋白表达能力等级用于表征细胞产生目的蛋白的能力，可以分为多个不同的等级，例如，可以分为高水平表达、中水平表达、低水平表达和不表达四个等级。

在实际应用中，在获取各个待测细胞的待测细胞灰度图后，可以基于多张待测细胞灰度图，确定对应的各个待测细胞的蛋白表达能力等级。

步骤402，从多个待测细胞中确定蛋白表达能力等级满足预设条件的多个目标细胞；

在确定各个待测细胞对应的蛋白表达能力登记后，可以从多个待测细胞中，确定蛋白表达能力登记满足预设条件的多个目标细胞，其中，预设条件可以是具有指定的蛋白表达能力等级。

例如，在确定各个待测细胞对应的蛋白表达能力等级后，例如将各个待测细胞划分为高水平表达、中水平表达、低水平表达和不表达四个等级后，可以将高表达水平的待测细胞确定为目标细胞。

步骤403，将所述多个目标细胞分别对应的待测细胞灰度图，输入所述目标生成网络模型。

在确定多个目标细胞后，可以将多个目标细胞分别对应的待测细胞灰度图，输入目标生成网络模型。

在本实施例中，根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级，从多个待测细胞中确定蛋白表达能力等级满足预设条件的多个目标细胞，并将多个目标细胞分别对应的待测细胞灰度图，输入目标生成网络模型，可以对待测细胞进行初步筛选，从而将蛋白表达能力较差或不表达的细胞在细胞筛除，避免在筛选高蛋白表达能力细胞的过程中，因蛋白表达能力低或不表达的细胞带来预测干扰。

在一个实施例中，所述根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级，可以包括如下步骤：

将各个待测细胞的待测细胞灰度图输入细胞分类网络模型；所述细胞分类网络模型采用具有蛋白表达量标签的多张训练细胞灰度图对初始卷积神经网络训练得到；所述蛋白表达量标签用于表征各训练细胞灰度图中细胞的蛋白表达能力等级；所述细胞分类网络模型用于检测输入模型的细胞灰度图中细胞的蛋白表达能力等级；根据所述细胞分类网络模型的输出，确定各个待测细胞中的蛋白表达能力等级。

在实际应用中，可以预先设置有细胞分类网络模型，细胞分类网络模型可以采用具有蛋白表达量标签的多张训练细胞灰度图，对初始卷积神经网络进行训练得到，其中，蛋白表达量标签可以表征各个训练细胞灰度图中细胞的蛋白表达能力等级。通过细胞分类网络模型，可以预测输入模型的细胞灰度图中细胞的蛋白表达能力等级。

基于此，在得到各个待测细胞的待测细胞灰度图后，可以将多张待测细胞灰度图输入细胞分类网络模型，确定各个待测细胞的蛋白表达能力等级。

在本实施例中，将各个待测细胞的待测细胞灰度图输入细胞分类网络模型，并根据细胞分类网络模型的输出，确定各个待测细胞中的蛋白表达能力等级，可以根据细胞灰度图，快速高效地对待测细胞的蛋白表达能力等级进行初步评估。

在一个实施例中，如图5所示，还可以包括如下步骤：

步骤501，获取训练细胞灰度图及其对应的真实荧光图；

在实际应用中，可以获取训练细胞灰度图及其对应的真实荧光图。

步骤502，确定所述真实荧光图中绿色通道对应的数值；

在实际应用中，通过目的基因(例如外源DNA片段)生成的蛋白质，可以在特定波长下发出荧光。在得到真实荧光图后，可以确定真实荧光图中绿色通道对应的数值，即真实荧光图片的G值，其中，G值也可以称为荧光值。

步骤503，根据所述真实荧光图中绿色通道对应的数值，确定对应的所述训练细胞灰度图中细胞的真实蛋白表达量，以及所述真实蛋白量对应的蛋白表达能力等级，并基于所述蛋白表达能力等级得到所述训练细胞灰度图的蛋白表达量标签；

在确定绿色通道对应的数值，可以基于该数值，确定对应的训练细胞灰度图中细胞的真实蛋白表达量，以及与该真实蛋白表达量对应的蛋白表达能力等级，进而可以采用蛋白表达能力等级确定训练细胞灰度图的蛋白表达量标签。

具体而言，荧光值与蛋白表达量之间可以为正相关的关系，通过获取荧光值与蛋白表达量之间的数量映射关系，可以采用荧光值确定真实蛋白表达量。

在得到训练细胞灰度图中细胞的真实蛋白表达量，可以获取预设的等级划分列表，通过等级划分列表，可以确定当真实蛋白表达量属于一数值范围时，其对应的蛋白表达能力等级。根据真实蛋白表达量和等级划分列表，可以确定与真实蛋白表达量对应的蛋白表达能力等级。

步骤504，采用所述蛋白表达量标签和所述训练细胞灰度图对初始卷积神经网络进行训练，得到细胞分类网络模型。

在得到蛋白表达量标签后，可以采用具有蛋白表达量标签的训练细胞灰度图对初始卷积神经网络进行训练，得到细胞分类网络模型。

在实际应用中，初始卷积神经网络可以包括第一网络结构、第二网络结构、第三网络结构和第四网络结构。

其中，第一网络结构可以是10层卷积层组成的特征提取网络，第一网络结构可用于从训练细胞灰度图中提取训练细胞特征，训练细胞特征可以分别输入至第二网络结构、第三网络结构和第四网络结构。

第二网络结构可以包括1层卷积层和全局平均池化层，第二网络结构可以与第一网络结构连接，并将第一网络结构输出的训练细胞特征输入卷积层，经卷积层和全局平均池化层处理后，得到第一细胞特征向量。

第三网络结构可以包括2层卷积和全局最大池化层，第三网络结构可以与第一网络结构连接，并将第一网络结构输出的训练细胞特征输入卷积层，经2层卷积层和全局最大池化层处理后，得到第二细胞特征向量。

第四网络结构可以包括2层卷积和全局平均池化层，第三网络结构可以与第一网络结构连接，并将第一网络结构输出的训练细胞特征输入卷积层，经2层卷积层和全局平均池化层处理后，得到第三细胞特征向量。

在获取第一细胞特征向量、第二细胞特征向量和第三细胞特征向量后，可以确定每个网络结构对应的权重，并对第一细胞特征向量、第二细胞特征向量和第三细胞特征向量进行加权求和，加权求和后的结果即为训练细胞灰度图中细胞的分类结果，即细胞对应的蛋白表达能力等级。

在本实施例中，获取训练细胞灰度图及其对应的真实荧光图，确定真实荧光图中绿色通道对应的数值，根据该数值，确定对应的训练细胞灰度图中细胞的真实蛋白表达量，采用蛋白表达量标签和训练细胞灰度对初始卷积神经网络进行训练，能够以真实荧光图的荧光值作为中间变量，对蛋白表达量进行量化后再确定蛋白表达能力等级，得到准确的蛋白表达量标签，为细胞分类网络模型的训练提供准确的训练数据。

在一个实施例中，所述根据多张预测荧光图，确定多个待测细胞分别对应的蛋白表达量，可以包括如下步骤：

确定多张预测荧光图中绿色通道分别对应的数值；根据多个预测荧光图绿色通道对应的数值，确定多个待测细胞分别对应的蛋白表达量。

在获取多张预测荧光图后，可以确定多张预测荧光图中绿色通道分别对应的数值，即预测荧光图的G值，并基于预测荧光图绿色通道对应的数值，确定多个待测细胞分别对应的蛋白表达量。

在实际应用中，荧光图的G值与蛋白表达量之间可以为正相关的关系，通过获取荧光图的G值与蛋白表达量之间的数量映射关系，可以采用荧光图的G值确定待测细胞对应的蛋白表达量。

在本实施例中，根据多个预测荧光图绿色通道对应的数值，确定多个待测细胞分别对应的蛋白表达量，能够以预测荧光图绿色通道对应的数值作为中间变量，对待测细胞灰度图中细胞的蛋白表达量进行量化。

在一个实施例中，还包括：

对所述多个待测细胞分别对应的蛋白表达量进行排序，并从排序后的多个蛋白表达量中，将排序最前的预设数量的蛋白表达量确定为目标表达量；获取所述目标表达量对应的目标灰度图，并将所述目标灰度图对应的待测细胞确定为用于培养细胞株的目标细胞。

在具体实现中，在得到多个待测细胞分别对应的蛋白表达量后，可以对多个蛋白表达量进行排序，并从排序后的蛋白表达量中，将排序最前的预设数量的蛋白表达量确定为目标表达量。

具体的，可以对多个待测细胞分别对应的蛋白表达量进行降序排列，即由大到小进行排序，在排序后，可以将前N名对应的蛋白表达量，确定为目标表达量。当然，在实际应用中，还可以将超过预设表达量阈值的蛋白表达量确定为目标表达量。

在确定目标表达量后，可以确定目标表达量对应的待测细胞灰度图，并将待测细胞灰度图对应的待测细胞，确定为用于培养细胞株的目标细胞。

在本实施例中，对多个蛋白表达量进行排序，并根据排序后的多个蛋白表达量，从多个待测细胞中，将蛋白表达量排序最前的预设数量的细胞确定为目标细胞，能够快速筛选具有高蛋白表达量的细胞，既减少了筛选工作量，又有效缩短细胞筛选周期。

在一个实施例中，所述获取训练细胞灰度图，可以包括如下步骤：

获取用于模型训练的原始细胞灰度图，并对所述原始细胞灰度图进行归一化处理；对处理后的原始细胞灰度图进行数据增强处理，得到训练细胞灰度图；所述数据增强处理包括以下任一项或多项：旋转处理、翻转处理、对比度增强处理、随机剪裁处理。

在具体实现中，可以获取用于模型训练的原始细胞灰度图，并对原始细胞灰度图进行归一化处理，其中，原始细胞灰度图可以是使用显微镜对作为训练集的细胞拍摄的灰度图。

在进行归一化处理后，可以对处理后的原始细胞灰度图进行数据增强处理，例如对图像进行旋转、翻转、随机剪裁，或者增强图像的对比度。

在本实施例中，通过对处理后的原始细胞灰度图进行数据增强处理，得到训练细胞灰度图，可以增加用于训练初始卷积神经网络模型的训练细胞灰度图，在训练样本不足的情况下，快速扩大训练样本，为初始卷积神经网络模型的训练提供数据支撑。

为了使本领域技术人员能够更好地理解上述步骤，以下通过一个例子对本申请实施例加以示例性说明，但应当理解的是，本申请实施例并不限于此。

如图6所示，可以通过显微镜拍摄细胞的灰度图像(即本申请中的待测细胞灰度图)，并将灰度图像输入训练好的细胞分类网络模型，通过细胞分类网络模型的输出结果，得到高荧光表达细胞，即蛋白表达能力等级为高水平的细胞。在确定高荧光表达细胞后，可以使用目标生成网络模型，对高荧光表达细胞的荧光图进行预测，获得预测的细胞荧光图片(即本申请中的预测荧光图)。

针对每个细胞对应的灰度图，都可以输入至细胞分类网络模型，获得分类结果，针对分类结果中具有高蛋白表达量的细胞，在生成对应的细胞荧光图片后，可以检测是否完成所有灰度图像的处理，若否，可以返回对灰度图像进行分析，通过细胞分类模型得到具有高蛋白表达量的细胞的步骤；若是，可以根据预测的细胞荧光图片，计算细胞的蛋白表达量。

在获取多个细胞对应的蛋白表达量后，可以对多个蛋白表达量进行排序，并按照预设筛选提交从多个细胞中筛选目标细胞，生成并提交筛选报告。

应该理解的是，虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图7所示，提供了一种蛋白表达量的预测装置，所述装置可以包括：

待测细胞灰度图获取模块701，用于获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；

第一输入模块702，用于将多张待测细胞灰度图输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；

预测荧光图获取模块703，用于根据所述目标生成网络模型的输出，得到所述多个待测细胞分别对应的预测荧光图；

蛋白表达量确定模块704，用于根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量。

在一个实施例中，所述第一输入模块702包括：

第一表达能力等级确定子模块，用于根据各个待测细胞的待测细胞灰度图，确定各个待测细胞中的蛋白表达能力等级；

筛选子模块，用于从多个待测细胞中确定蛋白表达能力等级满足预设条件的多个目标细胞；

第二输入子模块，用于将所述多个目标细胞分别对应的待测细胞灰度图，输入所述目标生成网络模型。

在一个实施例中，所述表达能力等级确定子模块包括：

第三输入单元，用于将各个待测细胞的待测细胞灰度图输入细胞分类网络模型；所述细胞分类网络模型采用具有蛋白表达量标签的多张训练细胞灰度图对初始卷积神经网络训练得到；所述蛋白表达量标签用于表征各训练细胞灰度图中细胞的蛋白表达能力等级；所述细胞分类网络模型用于检测输入模型的细胞灰度图中细胞的蛋白表达能力等级；

输出单元，用于根据所述细胞分类网络模型的输出，确定各个待测细胞中的蛋白表达能力等级。

在一个实施例中，所述装置还可以包括：

真实荧光图获取模块，用于获取训练细胞灰度图及其对应的真实荧光图；

第一荧光值确定模块，用于确定所述真实荧光图中绿色通道对应的数值；

第二表达能力等级确定模块，用于根据所述绿色通道对应的数值，确定对应的所述训练细胞灰度图中细胞的真实蛋白表达量，以及所述真实蛋白量对应的蛋白表达能力等级，并基于所述蛋白表达能力等级得到所述训练细胞灰度图的蛋白表达量标签；

细胞分类网络模型生成模块，用于采用所述蛋白表达量标签和所述训练细胞灰度对初始卷积神经网络进行训练，得到细胞分类网络模型。

在一个实施例中，所述装置还可以包括：

第一模型获取模块，用于获取生成式对抗网络模型、训练细胞灰度图及其对应的真实荧光图；所述生成式对抗网络模型包括待训练的生成网络模型和判别网络模型；

第一待判别荧光图生成模块，用于将所述训练细胞灰度图输入所述生成网络模型，获取所述生成网络模型输出的待判别荧光图；

判别结果获取模块，用于将所述待判别荧光图和所述真实荧光图输入所述判别网络模型，获取所述待判别荧光图对应的判别结果；

判别网络参数调整模块，用于根据所述判别结果，调整所述判别网络模型的网络参数；

模型训练切换模块，用于当所述判别网络模型训练了设定次数时，切换为对所述生成网络模型进行训练；交替训练所述生成网络模型和所述判别网络模型，直到得到目标生成网络模型。

在一个实施例中，所述模型训练切换模块包括：

第二模型获取子模块，用于将所述训练细胞灰度图输入所述生成网络模型，获取所述生成网络模型输出的待判别荧光图；

第二待判别荧光图生成子模块，用于将所述待判别荧光图和所述真实荧光图输入所述判别网络模型，获取所述待判别荧光图对应的判别结果；

损失误差确定子模块，用于当所述判别结果表征所述待判别荧光图为假，根据所述待判别荧光图、所述真实荧光图和所述判别网络模型，计算所述生成网络模型的损失误差；

生成网络参数调整子模块，用于根据所述损失误差，调整所述生成网络模型的网络参数。

在一个实施例中，所述蛋白表达量确定模块包括：

第二荧光值确定子模块，用于确定多张预测荧光图中绿色通道分别对应的数值；

映射子模块，用于根据多个预测荧光图中绿色通道对应的数值，确定多个待测细胞分别对应的蛋白表达量。

在一个实施例中，所述装置还可以包括：

排序模块，用于对所述多个待测细胞分别对应的蛋白表达量进行排序，并从排序后的多个蛋白表达量中，将排序最前的预设数量的蛋白表达量确定为目标表达量；

目标细胞确定模块，用于获取所述目标表达量对应的目标灰度图，并将所述目标灰度图对应的待测细胞确定为用于培养细胞株的目标细胞。

关于一种蛋白表达量的预测装置的具体限定可以参见上文中对于一种蛋白表达量的预测方法的限定，在此不再赘述。上述一种蛋白表达量的预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种蛋白表达量的预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

在一个实施例中，处理器执行计算机程序时还实现上述其他实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，计算机程序被处理器执行时还实现上述其他实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种蛋白表达量的预测方法，其特征在于，所述方法包括：

获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；所述待测细胞为经过转染技术处理的细胞，基于转染的目的基因所生成的蛋白质，在特定波长下产生荧光；

根据所述细胞分类网络模型的输出，确定各个待测细胞中的蛋白表达能力等级；

将所述多个目标细胞分别对应的待测细胞灰度图，输入目标生成网络模型；所述目标生成网络模型采用多张训练细胞灰度图对生成式对抗网络模型训练得到；所述多张训练细胞灰度图分别具有对应的荧光图标签；所述荧光图标签为训练细胞灰度图对应的真实荧光图；

根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量；所述蛋白表达量基于所述预测荧光图对应的荧光值确定。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取训练细胞灰度图及其对应的真实荧光图；

确定所述真实荧光图中绿色通道对应的数值；

根据所述真实荧光图中绿色通道对应的数值，确定对应的所述训练细胞灰度图中细胞的真实蛋白表达量，以及所述真实蛋白表达量对应的蛋白表达能力等级，并基于所述蛋白表达能力等级得到所述训练细胞灰度图的蛋白表达量标签；

3.根据权利要求1所述的方法，其特征在于，还包括：

根据所述判别结果，调整所述判别网络模型的网络参数；

4.根据权利要求3所述的方法，其特征在于，所述对所述生成网络模型进行训练，包括：

根据所述损失误差，调整所述生成网络模型的网络参数。

5.根据权利要求1所述的方法，其特征在于，所述根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量，包括：

确定多张预测荧光图中绿色通道分别对应的数值；

根据多个预测荧光图绿色通道对应的数值，确定多个待测细胞分别对应的蛋白表达量。

6.根据权利要求1所述的方法，其特征在于，还包括：

7.根据权利要求2所述的方法，其特征在于，所述获取训练细胞灰度图，包括：

获取用于模型训练的原始细胞灰度图，并对所述原始细胞灰度图进行归一化处理；

对处理后的原始细胞灰度图进行数据增强处理，得到训练细胞灰度图；所述数据增强处理包括以下任一项或多项：旋转处理、翻转处理、对比度增强处理、随机剪裁处理。

8.一种蛋白表达量的预测装置，其特征在于，所述装置包括：

待测细胞灰度图获取模块，用于获取细胞培养池中多个待测细胞分别对应的待测细胞灰度图；所述待测细胞为经过转染技术处理的细胞，基于转染的目的基因所生成的蛋白质，在特定波长下产生荧光；

蛋白表达量确定模块，用于根据所述预测荧光图，确定所述多个待测细胞分别对应的蛋白表达量；所述蛋白表达量基于所述预测荧光图对应的荧光值确定；

所述第一输入模块包括：

第二输入子模块，用于将所述多个目标细胞分别对应的待测细胞灰度图，输入所述目标生成网络模型；

所述第一表达能力等级确定子模块包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的蛋白表达量的预测方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的蛋白表达量的预测方法的步骤。