WO2020211403A1

WO2020211403A1 - 电泳图的识别方法、装置、设备及存储介质

Info

Publication number: WO2020211403A1
Application number: PCT/CN2019/123944
Authority: WO
Inventors: 赵文妍; 丁砚书; 段广有; 闵文波; 葛毅; 廖国娟
Original assignee: 苏州金唯智生物科技有限公司
Priority date: 2019-04-15
Filing date: 2019-12-09
Publication date: 2020-10-22
Also published as: CN110033449B; CN110033449A

Abstract

一种电泳图的识别方法、装置、设备及存储介质，通过获取样本的电泳图，识别电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像（S110），然后提取每个条带图像中预设数量的像素值，构成每个条带图像的目标像素矩阵（S120），最后将每个目标像素矩阵输入预先训练的预测模型进行预测，以得到样本的目标加样量（S130）。

Description

电泳图的识别方法、装置、设备及存储介质

本申请要求在2019年4月15日提交中国专利局、申请号为201910299112.4的中国专利申请的优先权，以上申请的全部内容通过引用结合在本申请中。

技术领域

本公开涉及电泳技术领域，例如涉及一种电泳图的识别方法、装置、设备及存储介质。

背景技术

电泳是指在外加直流电源的作用下，胶体微粒在分散介质里向阴极或阳极作定向移动的现象。利用电泳现象使物质分离的技术叫做电泳技术。

电泳技术在生物化学领域得到了广泛的应用。通过电泳技术将一个混合物样品在支持介质上分成条带，并在光密度计上进行扫描而获得的记录图谱称为电泳图。根据电泳图中条带的形状及颜色可以确定混合物样品的跑胶情况，进而确定该混合物样品在后续试验中的加样量。

然而，目前阶段，对于电泳图中胶图的识别及判断都是通过人工来实现的，即工作人员根据往常的经验判断电泳图中的胶图，由于人工判断与识别带有一定的主观性，导致电泳图中胶图的识别结果存在较大的差异。

发明内容

本公开提供一种电泳图的识别方法、装置、设备及存储介质，以解决电泳图中胶图的识别结果存在差异的问题。

本发明实施例提供了一种电泳图的识别方法，包括：

获取样本的电泳图，识别所述电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像；

提取每个所述条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵；

将每个所述目标像素矩阵输入预先训练好的预测模型进行预测，以得到样本的目标加样量。

本发明实施例还提供了一种电泳图的识别装置，包括：

识别模块，设置为获取样本的电泳图，识别所述电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像；

提取模块，设置为提取每个所述条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵；

输入模块，设置为将所述目标像素矩阵输入预先训练好的预测模型进行预测，以得到所述样本的目标加样量。

本发明实施例还提供了一种设备，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的电泳图的识别方法。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的电泳图的识别方法。

本实施例的技术方案，采用图像识别的技术对样本的电泳图进行识别，并形成条带图像的目标像素矩阵，输入到预先训练好的预测模型中，预测模型输出样本后续试验时的目标加样量。这样可以使得电泳图的识别结果有一个统一的规范，避免了由于人工判断与识别带有一定的主观性而导致电泳图中胶图图像的识别结果存在差异的问题。

附图说明

图1为本发明实施例一提供的电泳图的识别方法的流程图；

图2为本发明实施例二提供的电泳图的识别方法的流程图；

图3为本发明实施例三提供的电泳图的识别装置的结构示意图；

图4为本发明实施例四提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作详细说明。

实施例一

图1为本发明实施例一提供的电泳图的识别方法的流程图，本实施例可适用于识别电泳图，并确定样本后续试验时的目标加样量的情况，该方法可以由电泳图的识别装置来执行。

首先，需要说明的是，电泳是一种常见的分析方法。带电荷的分子和微粒在分离介质中迁移，分离介质在两个电极之间经受电场、可用等电点(Isoelectric point，pI)、分子量、电荷或这些因素的组合来使蛋白质分离。在一实施方式中，所述分离介质通常为凝胶。

分离凝胶通常置于支撑件上，并且分离凝胶的两个相对的端部接触呈溶液形式或者刚性形式的电极缓冲剂。电极可插入包含电极缓冲剂的容器中。来自电解质和离子存储器的缓冲溶液使pH(酸碱度)值和其他参数保持恒定。在分离之后，用不同的方式检测和识别分子。例如：通过对凝胶着色直观地进行检测和识别，或者，利用光学手段，诸如：用激光扫描仪等扫描经着色的凝胶或带标记样本，或者对它们成像。

例如，本实施例中的电泳图的识别方法就是对激光扫描仪扫描得到的凝胶图像进行识别和判断。

如图1所示，本发明实施例提供的电泳图的识别方法包括如下步骤：

S110、获取样本的电泳图，识别电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像。

在本实施例中，凝胶电泳通常用来分离生物分子，诸如：蛋白质、缩氨酸、核酸等。样本可以是蛋白质样本、缩氨酸或者核酸样本等。例如，样本可以是人体、哺乳动物组织、细胞溶菌或细菌、昆虫或酵母细胞系统等。需要说明的是，本实施例中仅对样本进行说明，而非限定。

样本的电泳图可以理解为当前样本加入凝胶中，经过电泳得到的图谱。胶图图像的边框可以理解为包含所有待识别的条带图像构成的胶图图像的边框。

在一实施方式中，可以从激光扫描仪中获取当前样本的电泳图。例如，可以在接收到获取指令之后，从激光扫描仪中获取当前样本的电泳图。在本实施例中，可以根据实际情况设计获取指令的接收方式，例如：在检测到激光扫描仪中扫描到电泳图之后，则生成并接收到获取指令。又如，在检测到用于对电泳图的识别装置的点击操作之后，则生成并接收到获取指令。

在本实施例中，采用了canny边缘检测法和Laplacian边缘检测算法相结合的方式准确的定位出胶图图像的边框。采用canny边缘检测法和Laplacian边缘检测算法相结合的方式，准确地将整个电泳图中有目标位置的位置将变为白色，其余位置均默认为背景像素，并将背景色素变为黑色。这样整张电泳图中就只有黑白两种颜色，然后运用形态学的方法将目标位置进行膨胀腐蚀，这样可以消除目标位置内部的黑点，准确定位出物体，定位出胶图图像的边框。需要说明的是，本实施例中的目标位置是指胶图图像的边框之内所包含的条带图像。

S120、提取每个条带图像中预设数量的像素值，构成每个条带图像的目标像素矩阵。

在本实施例中，条带图像是由多个像素点构成的，每个像素点都有其对应的像素值。

在本实施例中，将每个条带图像中的像素点转换为其对应的像素值，这样，每个条带图像都可以得到的由像素值构成的矩阵，这个由像素值构成的矩阵，称为原始像素矩阵。

在一实施方式中，在每个原始像素矩阵中，查找每一列的最大值。假设原始像素矩阵为N行M列的矩阵，其中，M和N均为正整数。相应地，在每个原始像素矩阵中，查找每一列的像素最大值，可以找到M个列最大像素值。其中，所述列最大像素值是指原始像素矩阵中每一列中的最大像素值。然后将M个列最大像素值进行比较，获取M个列最大像素值中的最大值作为目标最大像素值。根据目标最大像素值以及预设的规则，确定目标像素矩阵。

在本实施例中，每个条带图像分别对应一个原始像素矩阵和一个目标像素矩阵。即在电泳图中，目标像素矩阵的数量和条带图像的数量相等。

S130、将每个目标像素矩阵输入预先训练好的预测模型进行预测，以得到样本的目标加样量。

在本实施例中，样本的目标加样量可以理解为在后续的试验中，当前样本需要在凝胶中增加的样本重量。

在本实施例中，条带图像按照一定的顺序在电泳图中排列，将多个目标像素矩阵按照条带图像在电泳图中的排列顺序依次输入预先训练的预测模型，预测模型输出当前样本的目标加样量。

本发明实施例提供的电泳图的识别方法，通过获取样本的电泳图，并识别出电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像，然后提取每个条带图像中预设数量的像素值，构成每个条带图像的目标像素矩阵，最后将每个目标像素矩阵输入预先训练好的预测模型进行预测，以得到样本的目标加样量。本实施例的技术方案，采用图像识别的技术对样本的电泳图进行识别，并形成条带图像的目标像素矩阵，输入到预先训练好的预测模型中，预测模型输出该样本后续试验时的目标加样量。这样可以使得电泳图的识别结果有一个统一的规范，避免了由于人工判断与识别带有一定的主观性而导致电泳图中胶图图像的识别结果存在差异的问题。

实施例二

图2为本发明实施例二提供的电泳图的识别方法的流程图，在上述实施例的基础上，本发明实施例优化了电泳图的识别方法，如图2所示，优化后的电泳图的识别方法主要包括如下步骤：

S210、通过边缘检测算法识别出所述电泳图的胶图图像区域。

在本实施例中，采用canny边缘检测法和Laplacian边缘检测算法相结合的方式准确地定位出胶图图像的边框。需要说明的是，本实施例中，对边缘检测算法不做限定，可以根据实际情况设计、选择合适的边缘检测算法识别出胶图图像区域。

S220、消除电泳图中的背景区域和胶图图像区域中的干扰像素点，得到至少一个初级胶图图像。

在本实施例中，电泳图中的背景区域是指电泳图中除去条带区域之外的其他区域，条带区域中的干扰像素点可以理解为条带区域中的非白色的像素点。

在本实施例中，将整个电泳图中有条带区域的位置将变为白色，其余位置均默认为背景区域，并将背景区域的像素点变为黑色。这样整张电泳图中就只有黑白两种颜色。然后运用形态学的方法将目标位置进行膨胀腐蚀，这样可以消除目标位置内部的黑点，准确定位出物体，定位出胶图图像的边框。

S230、对每个初级条带图像进行预处理，得到每个初级条带图像对应的初级像素矩阵。

在一实施方式中，如果电泳图存在倾斜的情况，则根据坐标系对电泳图进行调整，得到放正的电泳图。

在本实施例中，对每个初级胶图图像进行预处理可以理解为对每个条带图像进行除燥、归一化处理，得到每个初级胶图图像对应的初级像素矩阵。初级像素矩阵是指初级胶图图像中的像素点对应的像素值构成的像素矩阵。

S240、计算初级像素矩阵中的行众数和列众数。

在本实施例中，众数是一组数据中出现次数最多的数值。行众数是指初级像素矩阵中每行数据中出现次数最多的值，列众数是指初级像素矩阵中每列数据中出现次数最多的值。

在本实施例中，计算初级像素矩阵每行的行众数和每列的列众数。需要说明的是，本实施例中，仅对行众数以及列众数进行说明而非限定，可以根据实际情况采取合适的方法进行计算。

S250、根据行众数与背景众数的比较结果以及列众数与背景众数的比较结果，对每个初级胶图图像进行校正，得到胶图图像的边框。

在本实施例中，背景众数是指背景区域中像素点的像素值中的众数。背景众数的计算方式和行众数以及列众数的计算方式可以相同，也可以不同，能够计算出背景众数即可。

需要说明的是，在确定初级胶图图像的过程中应用了形态学的方法将目标位置进行膨胀腐蚀，因此，在目标位置附近的边框也会被确定为目标位置，这时，需要对目标位置进行进一步地校正。

在一实施方式中，如果行众数小于或等于背景众数，则将行众数对应的行像素进行消除。在本实施例中，如果列众数小于或等于背景众数，则说明该列众数所属的列中包含了背景区域中像素点的像素值，则将列众数对应的列像素进行消除，即将该列众数对应的列中的像素点变成与背景区域中像素点相同的颜色。

如果所述列众数小于或等于所述背景众数，则将所述列众数对应的列像素进行消除。在本实施例中，如果行众数小于或等于背景众数，则说明该行众数所属的行中包含了背景区域中像素点的像素值，则将行众数对应的行像素进行消除，即将该行众数对应的行中的像素点变成与背景区域中像素点相同的颜色。

S260、对每个条带图像，提取该条带图像中像素值构成原始像素矩阵。

S270、计算原始像素矩阵中每列像素值的列最大像素值，得到M个列最大像素值，其中，M为原始像素矩阵的列数。

在本实施例中，列最大像素值可以理解为原始像素矩阵中，以列为单位，确定的每一列中的最大像素值。在每个原始像素矩阵中，查找每一列的最大值。假设原始像素矩阵为N行M列的矩阵，其中，M和N均为正整数。相应地，在每个原始像素矩阵中，查找每一列的像素最大值，可以找到M个列最大像素值。

S280、根据M个列最大像素值的比较结果，获取预设数量的像素值构成条带图像的目标像素矩阵。

在一实施方式中，将M个列最大像素值进行比较，并将M个列最大像素值中的最大值确定为目标最大像素值；如果原始像素矩阵存在一个目标最大像素值，则将目标最大像素值所属列以及与目标最大像素值所属列相邻的两列，构成目标像素矩阵。

如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列相邻，或者，所述原始像素矩阵中目标最大像素值的个数大于等于3且至少两个相同的目标最大像素值分别所属的列相邻，则将第一列最大像素值与第二列最大像素值进行比较；如果所述第一列最大像素值大于所述第二列最大像素值，则将所述第一列最大像素值作为相邻列最大像素值；如果所述第一列最大像素值小于所述第二列最大像素值，将所述第二列最大像素值作为相邻列最大像素值；将两个相同的目标最大像素值所属列以及相邻列最大像素值所属列，构成目标像素矩阵。

第一列最大像素值可以理解为第一目标最大像素值左侧的列最大像素值，第二列最大像素值可以理解为第二目标最大像素值右侧的列最大像素值。其中，在所述原始像素矩阵中，第一目标最大像素值位于所述第二目标最大像素值的左侧。相邻列最大像素值可以理解为第一列最大像素值和第二列最大像素值中数值比较大的像素值。

在一实施方式中，如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列不相邻，则确定第一目标最大像素值所属列与第二目标最大像素值所属列之间间隔的列数；如果所述第一目标最大像素值所属列与第二目标最大像素值所属列之间间隔的列数为1，则将所述第一目标最大像素值所属列、第二目标最大像素值所属列以及两个相同的目标最大像素值所属列之间的间隔列，构成目标像素矩阵。

如果原始像素矩阵中目标最大像素值的个数大于等于3且至少3个目标最大像素值所属列连续，则确定列连续长度，其中，所述列连续长度是目标最大像素值所属列连续存在的列个数；在所述列连续长度最大的每个列中，取任意3个连续的目标最大像素值所属列构成目标像素矩阵。

S290、将每个目标像素矩阵按照预设顺序输入预先训练好的预测模型进行预测，以得到样本的目标加样量。

本发明实施例提供的电泳图的识别方法，通过获取样本的电泳图，并识别出电泳图中的胶图图像的边框，然后提取每个条带图像中预设数量的像素值，构成每个条带图像的目标像素矩阵，最后将每个目标像素矩阵按照预设顺序输入预先训练好的预测模型进行预测，以得到样本的目标加样量。本实施例的技术方案，采用图像识别的技术对电泳图进行识别，并形成条带图像的目标像素矩阵，输入到预先训练好的预测模型中，预测模型输出样本在后续试验中的目标加样量。这样可以使得电泳图的识别结果有一个统一的规范，避免了由于人工判断与识别带有一定的主观性而导致电泳图中胶图图像的识别结果存在差异的问题。

在上述实施例的基础上，本实施例提供一种聚合酶链式反应(Polymerase Chain Reaction，PCR)电泳图的识别方法。在PCR电泳图的识别过程中，有一个比较重要的部分为条带图像大小的识别。需要把每个条带图像与对应的标准条带图像进行比较，因为标准条带图像中有9条条带，每条条带都表示不同的片段大小。

在一实施方式中，所述方法还包括：提取胶图图像中每个条带图像对应的条带像素矩阵的每一列中位数，其中，所述胶图图像包括标准条带图像和非标准条带图像；根据所述标准条带图像对应的条带像素矩阵的每一列中位数，以及非标准条带图像对应的条带像素矩阵的每一列中位数，确定每个非标准条带图像在胶图图像中的位置。

从标准条带图像对应的条带像素矩阵中的每一列取出其中位数，根据每一列的中位数可以得到一个中位数的分布情况，并取所述中位数中的最大值，每一个最大值则表示为一条条带，将每条条带对应的中位数中的最大值与标准条带图像中像素的最大值进行比较，可以定位每个固定片段的条带在电泳图中的位置，同理对每个条带图像进行上述操作，可以得出每个条带图像大小的范围。

实施例三

图3为本发明实施例三提供的电泳图的识别装置的结构示意图，本实施例可适用于识别电泳图，并确定样本在后续试验中的目标加样量的情况，如图3所示，本实施例提供的电泳图的识别装置主要包括：识别模块310、提取模块320和输入模块330。

其中，识别模块310，设置为获取样本的电泳图，识别所述电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像；

提取模块320，设置为提取每个条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵；

输入模块330，设置为将每个所述目标像素矩阵输入预先训练好的预测模型进行预测，以得到样本的目标加样量。

本发明实施例提供的电泳图的识别装置，通过获取样本的电泳图，识别电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像，然后提取每个条带图像中预设数量的像素值，构成每个条带图像的目标像素矩阵，最后将每个目标像素矩阵输入预先训练好的预测模型进行预测，以得到当前样本的目标加样量。本实施例的技术方案，采用图像识别的技术对样本的电泳图进行识别，并形成条带图像的目标像素矩阵，输入到预先训练好的预测模型中，预测模型输出该样本后续试验时的目标加样量。这样可以使得电泳图的识别结果有一个统一的规范，避免了由于人工判断与识别带有一定的主观性而导致电泳图中胶图图像的识别结果存在差异的问题。

在一实施方式中，所述识别模块310包括：

识别单元，设置为通过边缘检测算法识别出所述电泳图的胶图图像区域；

消除单元，设置为消除所述电泳图中的背景区域以及所述胶图图像区域中的干扰像素点，得到至少一个初级胶图图像。

在一实施方式中，所述识别模块310还包括：

预处理单元，设置为对每个所述初级条带图像进行预处理，得到每个所述初级条带图像对应的初级像素矩阵；

第一计算单元，设置为计算每个所述初级像素矩阵中的行众数和列众数；

校正单元，设置为根据所述行众数与背景众数的比较结果以及所述列众数与背景众数的比较结果，对每个所述初级条带图像进行校正，得到所述胶图图像的边框。

在一实施方式中，校正单元是设置为如果所述行众数小于或等于所述背景众数，则将所述行众数对应的行像素进行消除；如果所述列众数小于或等于所述背景众数，则将所述列众数对应的列像素进行消除。

在一实施方式中，所述装置还包括：

中位数有提取模块，设置为提取所述胶图图像中每个条带图像对应的条带像素矩阵的每一列中位数，其中，所述胶图图像包括标准条带图像和非标准条带图像；

条带图像确定模块，设置为根据所述标准条带图像对应的条带像素矩阵的每一列中位数，以及所述非标准条带图像对应的条带像素矩阵的每一列中位数，确定每个非标准条带图像在所述胶图图像中的位置。

在一实施方式中，提取模块320包括：

提取单元，设置为对每个所述条带图像，提取所述条带图像中像素值构成原始像素矩阵；

第二计算单元，设置为计算所述原始像素矩阵中每列像素值的列最大像素值，得到M个列最大像素值，其中，M为所述原始像素矩阵的列数；

获取单元，设置为根据所述M个列最大像素值的比较结果，获取预设数量的像素值构成所述条带图像的目标像素矩阵。

在一实施方式中，获取单元是设置为将所述M个列最大像素值进行比较，并将所述M个列最大像素值中的最大值确定为目标最大像素值；如果所述原始像素矩阵存在一个目标最大像素值，则将所述目标最大像素值所属列以及与所述目标最大像素值所属列相邻的两列，构成目标像素矩阵。

在一实施方式中，获取单元是设置为如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列相邻，或者，所述原始像素矩阵中目标最大像素值的个数大于等于3且至少两个相同的目标最大像素值分别所属的列相邻，则将第一列最大像素值与第二列最大像素值进行比较；如果所述第一列最大像素值大于所述第二列最大像素值，则将所述第一列最大像素值作为相邻列最大像素值；如果所述第一列最大像素值小于所述第二列最大像素值，将所述第二列最大像素值作为相邻列最大像素值；将两个相同的目标最大像素值所属列以及相邻列最大像素值所属列，构成目标像素矩阵。

在一实施方式中，获取单元是设置为如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列不相邻，则确定第一目标最大像素值所属列与第二目标最大像素值所属列之间间隔的列数；如果所述第一目标最大像素值所属列与所述第二目标最大像素值所属列之间间隔的列数为1，则将所述第一目标最大像素值所属列、所述第二目标最大像素值所属列以及两个相同的目标最大像素值所属列之间的间隔列，构成目标像素矩阵。

在一实施方式中，获取单元是设置为如果所述原始像素矩阵中目标最大像素值的个数大于等于3且至少3个目标最大像素值所属列连续，则确定列连续长度，其中，所述列连续长度是目标最大像素值所属列连续存在的列个数；在所述列连续长度最大的每个列中，取任意3个连续的目标最大像素值所属列构成目标像素矩阵。

本发明实施例所提供的电泳图的识别装置可执行本发明任意实施例所提供的电泳图的识别方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4为本发明实施例四提供的一种设备的结构示意图，如图4所示，该设备包括处理器410、存储器420、输入装置430和输出装置440；设备中处理器410的数量可以是一个或多个，图4中以一个处理器410为例；设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接，图4中以通过总线连接为例。

存储器420作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的电泳图的识别方法对应的程序指令/模块(例如，电泳图的识别装置中的识别模块310、提取模块320和输入模块330)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的电泳图的识别方法。

存储器420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储依据终端的使用所创建的数据等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器420可进一步包括相对于处理器410远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置430可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种电泳图的识别方法，该方法包括：

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的电泳图的识别方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述的方法。

值得注意的是，上述电泳图的识别装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本公开的保护范围。

Claims

一种电泳图的识别方法，包括：

获取样本的电泳图，识别所述电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像；

提取每个所述条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵；

将每个所述目标像素矩阵输入预先训练好的预测模型进行预测，以得到所述样本的目标加样量。
根据权利要求1所述的方法，其中，识别所述电泳图中的胶图图像的边框，包括：

通过边缘检测算法识别出所述电泳图的胶图图像区域；

消除所述电泳图中的背景区域和所述胶图图像区域中的干扰像素点，得到至少一个初级胶图图像。
根据权利要求2所述的方法，其中，识别所述电泳图中的胶图图像的边框，还包括：

对每个所述初级胶图图像进行预处理，得到每个所述初级胶图图像对应的初级像素矩阵；

计算每个所述初级像素矩阵中的行众数和列众数；

根据所述行众数与背景众数的比较结果以及所述列众数与背景众数的比较结果，对每个所述初级条带图像进行校正，得到所述胶图图像的边框。
根据权利要求3所述的方法，其中，所述根据所述行众数与背景众数的比较结果以及所述列众数与背景众数的比较结果，对每个所述初级胶图图像进行校正，包括：

如果所述行众数小于或等于所述背景众数，则将所述行众数对应的行像素进行消除；

如果所述列众数小于或等于所述背景众数，则将所述列众数对应的列像素进行消除。
根据权利要求1所述的方法，还包括：

提取所述胶图图像中每个条带图像对应的条带像素矩阵的每一列中位数，其中，所述胶图图像包括标准条带图像和非标准条带图像；

根据所述标准条带图像对应的条带像素矩阵的每一列中位数，以及所述非标准条带图像对应的条带像素矩阵的每一列中位数，确定每个非标准条带图像在所述胶图图像中的位置。
根据权利要求1所述的方法，其中，所述提取每个所述条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵，包括：

对每个所述条带图像，提取所述条带图像中像素值构成原始像素矩阵；

计算所述原始像素矩阵中每列像素值的列最大像素值，得到M个列最大像素值，其中，M为所述原始像素矩阵的列数且M为正整数；

根据所述M个列最大像素值的比较结果，获取预设数量的像素值构成所述条带图像的目标像素矩阵。
根据权利要求6所述的方法，其中，所述根据所述M个列最大像素值的比较结果，获取预设数量的像素值构成目标像素矩阵，包括：

将所述M个列最大像素值进行比较，并将所述M个列最大像素值中的最大值确定为目标最大像素值；

如果所述原始像素矩阵存在一个目标最大像素值，则将所述目标最大像素值所属列以及与所述目标最大像素值所属列相邻的两列，构成目标像素矩阵。
根据权利要求7所述的方法，其中，所述根据M个列最大像素值的比较结果，获取预设数量的像素值构成目标像素矩阵，还包括：

如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列相邻，或者，所述原始像素矩阵中目标最大像素值的个数大于等于3且至少两个相同的目标最大像素值分别所属的列相邻，则将第一列最大像素值与第二列最大像素值进行比较；

如果所述第一列最大像素值大于所述第二列最大像素值，则将所述第一列最大像素值作为相邻列最大像素值；

如果所述第一列最大像素值小于所述第二列最大像素值，将所述第二列最大像素值作为相邻列最大像素值；

将两个相同的目标最大像素值所属列以及相邻列最大像素值所属列，构成目标像素矩阵。
根据权利要求7所述的方法，其中，所述根据M个列最大像素值的比较结果，获取预设数量的像素值构成目标像素矩阵，还包括：

如果所述原始像素矩阵仅存在两个相同的目标最大像素值且两个相同的目标最大像素值分别所属的列不相邻，则确定第一目标最大像素值所属列与第二目标最大像素值所属列之间间隔的列数；

如果所述第一目标最大像素值所属列与所述第二目标最大像素值所属列之间间隔的列数为1，则将所述第一目标最大像素值所属列、所述第二目标最大像素值所属列以及两个相同的目标最大像素值所属列之间的间隔列，构成目标像素矩阵。
根据权利要求7所述的方法，其中，所述根据M个列最大像素值的比较结果，获取预设数量的像素值构成目标像素矩阵，还包括：

如果所述原始像素矩阵中目标最大像素值的个数大于等于3且至少3个目标最大像素值所属列连续，则确定列连续长度，其中，所述列连续长度是目标最大像素值所属列连续存在的列个数；

在所述列连续长度最大的每个列中，取任意3个连续的目标最大像素值所属列构成目标像素矩阵。
一种电泳图的识别装置，包括：

识别模块，设置为获取样本的电泳图，识别所述电泳图中的胶图图像的边框，其中，所述胶图图像包括至少一个条带图像；

提取模块，设置为提取每个所述条带图像中预设数量的像素值，构成每个所述条带图像的目标像素矩阵；

输入模块，设置为将每个所述目标像素矩阵输入预先训练好的预测模型，以得到所述样本的目标加样量。
一种设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10任一所述的电泳图的识别方法。
一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如权利要求1-10任一所述的电泳图的识别方法。