WO2021143700A1

WO2021143700A1 - 生物芯片的数据处理方法、装置、终端及可读介质

Info

Publication number: WO2021143700A1
Application number: PCT/CN2021/071365
Authority: WO
Inventors: 吴琼; 赵子健; 史永明; 黄继景; 唐大伟; 刘宗民
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-01-14
Filing date: 2021-01-13
Publication date: 2021-07-22
Also published as: US11875549B2; US20230154137A1; CN113192098B; CN113192098A

Abstract

一种生物芯片的数据处理方法，包括：获取待检测的生物芯片图像；对生物芯片图像进行二值化处理，得到二值图像；在行方向上对二值图像进行形态学膨胀操作，得到第一图像，在列方向上对二值图像进行形态学膨胀操作，得到第二图像；通过在行方向对第一图像进行连通域检测以及在列方向对第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。

Description

生物芯片的数据处理方法、装置、终端及可读介质

本申请要求于2020年1月14日提交中国专利局、申请号为202010037639.2、发明名称为“生物芯片的数据处理方法、装置、终端及可读介质”的中国专利申请的优先权，其内容应理解为通过引用的方式并入本申请中。

技术领域

本文涉及但不限于图像处理技术领域，尤指一种生物芯片的数据处理方法、装置、终端及可读介质。

背景技术

生物芯片技术将一定数量的生物化学反应空间固定于一定面积的基片。在使用时，加载测试样本到生物芯片上，提供反应条件令反应发生，然后利用已有技术可检测到的光、电信号等作为反应发生强度或发生与否的判断依据，间接获取测试样本的生物信息。生物芯片克服传统需要多次重复实验的弊端，节约人力、样本量，提高了检测精度，是现代生命科学研究的重要手段。

已有的生物芯片样本点检测方法主要有参数依赖方法、标记辅助方法、基于神经网络的自动检测方法、基于边缘检测和网格划分的自动检测方法。其中，参数依赖方法，依赖于人工设定或输入的生物芯片参数，比如行列坐标、腔室位置模板等，在使用时必须知晓生物芯片参数并准确输入方能得到检测结果，这在生物芯片种类多样或参数缺失的情况会造成人力成本的提高。标记辅助方法需要在生物芯片上设计辅助标记，适用于分析来自单一生产方的生物芯片，但是目前的生物芯片来自不同生产方，不同生产方的生物芯片的辅助标记的设计方式不唯一，导致标记辅助方法的兼容性不佳、灵活性较差。已有的基于神经网络的自动检测方法和基于边缘检测和网格划分的自动检测方法的算法实现较为复杂、计算复杂度较高。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本公开实施例提供了一种生物芯片的数据处理方法、装置、终端及可读介质，可以兼容多种生物芯片设计并降低计算复杂度。

一方面，本公开实施例提供了一种生物芯片的数据处理方法，包括：获取待检测的生物芯片图像；对生物芯片图像进行二值化处理，得到二值图像；在行方向上对二值图像进行形态学膨胀操作，得到第一图像，在列方向上对二值图像进行形态学膨胀操作，得到第二图像；通过在行方向对第一图像进行连通域检测以及在列方向对所述第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。

另一方面，本公开实施例提供一种生物芯片的数据处理装置，包括：图像获取模块，配置为获取待检测的生物芯片图像；二值化处理模块，配置为对生物芯片图像进行二值化处理，得到二值图像；形态学操作模块，配置为在行方向上对二值图像进行形态学膨胀操作，得到第一图像，在列方向上对二值图像进行形态学膨胀操作，得到第二图像；第一检测模块，配置为通过在行方向对第一图像进行连通域检测以及在列方向对第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。

另一方面，本公开实施例提供一种数据处理终端，包括：存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现如上所述的生物芯片的数据处理方法的步骤。

另一方面，本公开实施例提供一种计算机可读介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的生物芯片的数据处理方法的步骤。

本公开实施例通过对生物芯片图像进行二值化处理，并对得到的二值图像进行形态学膨胀操作和连通域检测，可以自适应得到生物芯片的样本点阵列的行数、列数以及每一样本点的中心位置信息，从而支持实现生物芯片的样本点检测。本公开实施例可以兼容多种生物芯片设计，而且实现过程简单，计算复杂度较低。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

附图用来提供对本公开技术方案的理解，并且构成说明书的一部分，与本公开的实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。附图中至少一个部件的形状和大小不反映真实比例，目的只是示意说明本公开内容。

图1为本公开至少一实施例提供的生物芯片的数据处理方法的流程图；

图2为本公开至少一实施例提供的生物芯片的数据处理方法的一种示例流程图；

图3为本公开至少一实施例的待检测的生物芯片图像的一个示例图；

图4为本公开至少一实施例的输出结果的示例图；

图5为本公开至少一实施例提供的生物芯片的数据处理方法的另一示例流程图；

图6为本公开至少一实施例提供的生物芯片的数据处理装置的示意图；

图7为本公开至少一实施例提供的生物芯片的数据处理装置的一种示例图；

图8为本公开至少一实施例提供的生物芯片的数据处理装置的另一示例图；

图9为本公开至少一实施例提供的数据处理终端的示例图。

具体实施方式

本公开描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本领域的普通技术人员来说显而易见的是，在本公开所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在实施方式中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。

本公开包括并设想了与本领域普通技术人员已知的特征和元件的组合。本公开已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本公开中示出或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行至少一种修改和改变。

此外，在描述具有代表性的实施例时，说明书可能已经将方法或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法或过程的权利要求不应限于按照所写顺序执行它们的步骤，本领域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本公开实施例的精神和范围内。

本公开实施例提供一种生物芯片的数据处理方法、装置、终端及可读介质，可以兼容多种生物芯片设计，并降低计算复杂度。本公开实施例提供的数据处理方法通过对生物芯片加载测试样本后得到的生物芯片图像进行分析，来获取测试样本的生物信息。本实施例提供的数据处理方法可以适用于阵列型生物荧光芯片。

图1为本公开至少一实施例提供的生物芯片的数据处理方法的流程图。如图1所示，本实施例提供的生物芯片的数据处理方法，包括：

步骤S11、获取待检测的生物芯片图像；

步骤S12、对生物芯片图像进行二值化处理，得到二值图像；

步骤S13、在行方向上对二值图像进行形态学膨胀操作，得到第一图像，在列方向上对二值图像进行形态学膨胀操作，得到第二图像；

步骤S14、通过在行方向对第一图像进行连通域检测以及在列方向对第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。

在本实施例中，行方向可以为样本点阵列的水平方向，列方向可以为样本点阵列的竖直方向。本实施例针对准直的样本点阵列进行自适应检测，其中，准直的样本点阵列可以指样本点阵列的行方向与水平方向平行或两者之间的角度在误差范围内、样本点阵列的列方向与竖直方向平行或两者之间的角度在误差范围内。当生物芯片图像内的样本点阵列存在倾斜角度时，可以先对生物芯片图像进行准直调整后，再按照本实施例的数据处理方法进行自适应检测。

在一些示例性实施例中，生物芯片图像中的样本点可以为圆形或矩形。然而，本公开对此并不限定。

在一些示例性实施方式中，步骤S13中，在行方向上对二值图像进行形态学膨胀操作，得到第一图像，可以包括：在行方向上根据第一膨胀算子对二值图像进行形态学膨胀操作，得到第一图像，其中，第一图像中行方向上的一个连通域表示一行样本点。

步骤S13中，在列方向上对二值图像进行形态学膨胀操作，得到第二图像，可以包括：在列方向上根据第二膨胀算子对二值图像进行形态学膨胀操作，得到第二图像，其中，第二图像中列方向上的一个连通域表示一列的样本点。

在一些示例性实施方式中，第一膨胀算子在行方向上的取值为生物芯片图像的宽度，第二膨胀算子在列方向上的取值为生物芯片图像的高度。此外，第一膨胀算子在列方向上的取值可以为1，第二膨胀算子在行方向上的取值可以为1。然而，本公开对此并不限定。生物芯片图像的宽度为生物芯片图像沿水平方向的长度，生物芯片图像的高度为生物芯片图像沿竖直方向的长度。

在一示例性实施方式中，步骤S14可以包括：通过检测第一图像中行方向上的连通域，确定样本点阵列的行数以及每一行样本点在列方向上的中心位置信息；通过检测第二图像中列方向上的连通域，确定样本点阵列的列数以及每一列样本点在行方向上的中心位置信息；根据每一行样本点在列方向上的中心位置信息以及每一列样本点在行方向上的中心位置信息，得到每一样本点的中心位置信息。其中，中心位置信息可以包括在根据生物芯片图像确定的图像像素坐标系中的坐标值。其中，每一行样本点在列方向上的中心位置信息可以存储在一个一维向量中，该一维向量的长度即为样本点阵列的行数；每一列样本点在行方向上的中心位置信息可以存储在一个一维向量中，该一维向量的长度即为样本点阵列的列数。然而，本公开对此并不限定。在其他实现方式中，样本点阵列的行数以及每一行样本点在列方向上的中心位置信息可以通过一个二维向量进行存储，比如，二维向量可以记录行编号以及对应的中心位置信息。

在一些示例性实施方式中，通过检测第一图像中在行方向上的连通域，确定样本点阵列的行数以及每一行样本点在列方向上的中心位置信息，可以包括：基于第一图像，利用开源计算机视觉库(OpenCV，Open Source Computer Vision Library)中的findContours函数得到样本点阵列的行数以及每一行样本点在列方向上的中心位置信息。

通过检测第二图像中在列方向上的连通域，确定样本点阵列的列数以及每一列样本点在行方向上的中心位置信息，可以包括：基于第二图像，利用OpenCV中的findContours函数得到样本点阵列的列数以及每一列样本点在行方向上的中心位置信息。

在本示例性实施方式中，通过借用OpenCV中的findContours函数，可以简化算法实现。然而，本公开对此并不限定。在其他实现方式中，可以采用其他已有的边缘检测算法或自定义的边缘检测算法来检测连通域。

在一些示例性实施方式中，本实施例提供的数据处理方法还可以包括：对生物芯片图像进行二值化处理，得到目标图像，或者，对生物芯片图像进行二值化处理和形态学操作，得到目标图像，其中，得到目标图像进行的二值化处理所采用的阈值大于得到二值图像进行的二值化处理所采用的阈值；基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置。

在本示例性实施方式中，形态学操作可以包括膨胀操作、或者膨胀操作和腐蚀操作。通过形态学操作可以消除噪点影响，从而提高对图像噪声的鲁棒性，提高计算可靠性。

在一些示例性实施方式中，基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置，可以包括：

基于样本点阵列的行数和列数，得到初始化的样本点检测矩阵(比如，样本点检测矩阵初始化为零矩阵)；

基于样本点阵列中每一样本点的中心位置信息，遍历目标图像内每个样本点的中心位置对应的像素值和该样本点的中心位置的邻域对应的像素值；当检测到目标图像内任一样本点的中心位置对应的像素值或该样本点的中心位置的邻域对应的像素值为第一数值(比如，255)，则更新样本点检测矩阵内该样本点对应位置的元素值为第三数值(比如，1)；当检测到目标图像内任一样本点的中心位置对应的像素值或该样本点的中心位置的邻域对应的像素值为第二数值(比如，0)，则将样本点检测矩阵内该样本点对应位置的元素值保持为初始值；

根据遍历目标图像得到的样本点检测矩阵内第三数值的位置，确定阳性样本点在样本点阵列中的位置。

在本示例性实施方式中，可以遍历每个样本点的中心位置及其四邻域对应的像素值，或者，可以遍历每个样本点的中心位置及其八邻域对应的像素值。然而，本公开对此并不限定。

在本示例性实施方式中，通过在目标图像中对每个样本点的中心位置及其邻域对应的像素值进行遍历，来进行样本点的阴阳性检测，从而对样本点阵列中的阳性样本点进行定位。

在一些示例性实施方式中，本实施例的数据处理方法还可以包括：基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点的个数；或者，基于目标图像，利用OpenCV中的findContours函数得到样本点阵列中阳性样本点的个数。

示例性地，在基于样本点检测矩阵对阳性样本点进行定位之后，可以统计样本点检测矩阵内第三数值的总数目，即为阳性样本点的个数；或者，可以将阳性样本点的个数初始化为0，在基于每一样本点的中心位置信息对目标图像进行遍历的过程中，当检测到目标图像内样本点的中心位置或中心位置的邻域对应的像素值为第一数值，则更新阳性样本点的个数，即累加1，在遍历完成后可以得到样本点阵列中阳性样本点的个数。

下面通过示例性的实施过程对本实施例提供的数据处理方法进行详细说明。

图2为本公开至少一实施例提供的生物芯片的数据处理方法的一个示例流程图。本示例性实施例用于对阵列型荧光生物芯片的样本点阵列中的阳性样本点进行计数和定位。

本示例性实施例的数据处理方法的时间复杂度可以为线性型O(n)，空间复杂度可以为O(n)。然而，本公开对此并不限定。

如图2所示，本示例性实施例提供的数据处理方法，包括以下过程：

步骤S21、获取待检测的生物芯片图像，其中，待检测的生物芯片图像可以记为im_ori。

在本示例性实施例中，在加载测试样本到生物芯片后，提供反应条件令反应发生，通过摄像技术可以得到待检测的生物芯片图像，例如图3所示。

在一些示例中，若待检测的生物芯片图像内的样本点阵列发生倾斜，则需要对生物芯片图像进行调整，使得样本点阵列准直后再进行后续处理。本公开对于图像准直的处理方式并不限定。

在本示例性实施例中，以生物芯片图像的左上角为原点定义图像像素坐标系，其中，行方向可以为水平方向，平行于横坐标轴(比如图3所示的X轴)，列方向可以为竖直方向，平行于纵坐标轴(比如图3所示的Y轴)。然而，本公开对此并不限定。在其他实现方式中，图像像素坐标系的原点可以为生物芯片图像的左下角或右上角等。

步骤S22、采用大津(Otsu)算法对生物芯片图像im_ori进行二值化处理，得到二值图像，例如记为im_bin。其中，通过Otsu算法可以得到二值化处理的阈值T1。然而，本公开对此并不限定。在其他实现方式中，可以采用其他二值化算法，或者，可以采用默认的阈值进行二值化处理。

在本示例性实施例中，针对图3所示的生物芯片图像，通过步骤S22的二值化处理得到的二值图像的白色区域(灰度值为255)代表芯片样本点，黑色区域(灰度值为0)代表芯片背景。然而，本公开对此并不限定。在其他实现方式中，二值图像的白色区域可以代表芯片背景，黑色区域代表芯片样本点。

步骤S23、在水平方向(即行方向)上对二值图像im_bin进行形态学膨胀操作，得到第一图像，例如记为im_bin_h。本步骤采用第一膨胀算子进行形态学膨胀操作，其中，第一膨胀算子在水平方向上的取值可以为生物芯片图像的宽度，第一膨胀算子在竖直方向上的取值可以为1，比如，第一膨胀算子可以为生物芯片图像的宽度*1。然而，本公开对此并不限定。第一膨胀算子可以为其他取值，只要保证通过膨胀操作使得每一行样本点形成一个连通域即可。

通过步骤S23可以在二值图像中形成多个连通域，且每一行样本点可以形成一个连通域。

步骤S24、通过对第一图像im_bin_h进行连通域检测，确定样本点阵列的行数以及每一行样本点在列方向上的中心位置信息(比如，中心坐标值)，得到第一向量coo_h。

在本步骤中，可以利用OpenCV中的findContours函数得到腔室阵列(即样本点阵列)的行数以及对应每一行在竖直方向上的中心坐标值(即，每一行中心的纵坐标值)，将中心坐标值按从上到下的顺序存入第一向量coo_h。其中，第一向量coo_h可以为一个一维向量，第一向量coo_h内存储的是每行样本点中心的纵坐标值，向量长度表示样本点阵列的行数。然而，本公开对此并不限定。在其他实现方式中，可以采用二维向量记录行编号以及每一行在竖直方向上的中心坐标值。

其中，findContours函数的输入可以为第一图像im_bin_h，输出可以是每一个连通域的轮廓点的集合，根据findContours函数的输出信息可以计算每个连通域的中心对应的纵坐标值，并将纵坐标值依次存入第一向量coo_h。

通过步骤S24可以自适应得到样本点阵列的行数以及每一行的中心位置信息。

步骤S25、在竖直方向(即列方向)上对二值图像im_bin进行形态学膨胀操作，得到第二图像，例如记为im_bin_v。本步骤采用第二膨胀算子进行形态学膨胀操作，其中，第二膨胀算子在竖直方向上的取值可以为生物芯片图像的高度，第二膨胀算子在水平方向上的取值可以为1，比如，第二膨胀算子可以为1*生物芯片图像的高度。然而，本公开对此并不限定。第二膨胀算子可以为其他取值，只要保证通过膨胀操作使得每一列样本点形成一个连通域即可。

通过步骤S25可以在二值图像中形成多个连通域，每一列样本点可以形成一个连通域。

步骤S26、通过对第二图像im_bin_v进行连通域检测，确定样本点阵列的列数以及每一列样本点的中心位置信息(比如，中心坐标值)，得到第二向量coo_v。

在本步骤中，可以利用OpenCV中的findContours函数得到腔室阵列的列数以及对应每一列在水平方向上的中心坐标值(即，每一列中心的横坐标值)，将中心坐标值按从左到右的顺序存入第二向量coo_v。其中，第二向量coo_v可以为一个一维向量，第二向量coo_v内存储的是每列样本点中心的横坐标值，向量长度表示样本点阵列的总列数。然而，本公开对此并不限定。在其他实现方式中，可以采用二维向量记录列编号以及每一列在水平方向上的中心坐标值。

其中，findContours函数的输入可以为第二图像im_bin_v，输出可以是每一个连通域的轮廓点的集合，根据findContours函数的输出信息可以计算每个连通域的中心对应的横坐标值，并将横坐标值依次存入第二向量coo_v。

通过步骤S26可以自适应得到样本点阵列的列数以及每一列的中心位置信息。

步骤S27、初始化样本点检测矩阵sample_loc为零矩阵，其中，样本点检测矩阵sample_loc的行数为步骤S24得到的第一向量coo_h的向量长度，列数为步骤S26得到的第二向量coo_v的向量长度。

本步骤初始化得到的样本点检测矩阵sample_loc可以用于记录后续的阳性样本点的检测结果。

步骤S28、对生物芯片图像im_ori进行二值化处理和形态学操作，得到目标图像，例如记为im_bin_positive。在本步骤中，先对生物芯片图像进行二值化处理，然后对得到的二值图像进行形态学操作，以消除噪点影响，提高对图像噪声的鲁棒性，并增强运算的可靠性。

本步骤中进行的二值化处理所采用的阈值T2大于步骤S22所采用的阈值T1，例如，T2＝T1+50。然而，本公开对此并不限定。

本步骤中的形态学操作可以包括膨胀操作，或者，膨胀操作和腐蚀操作。比如，本步骤的形态学膨胀操作的膨胀算子可以为5*5。然而，本公开对此并不限定。

步骤S29、对于步骤28得到的目标图像im_bin_positive，遍历样本点中心位置对应的像素值以及中心位置的四邻域对应的像素值，根据遍历结果，更新样本点检测矩阵sample_loc。

以目标图像中的白色区域(灰度值为255)代表芯片样本点，黑色区域(灰度值为0)代表芯片背景为例，在目标图像的像素值遍历过程中，当检测到样本点中心位置对应的像素值为255，或者，样本点中心位置的四邻域中至少一个邻域对应的像素值为255，则将样本点检测矩阵sample_loc中该样本点对应位置的元素值赋值为1，否则保持样本点检测矩阵sample_loc中该样本点对应位置的元素值不变，即仍为0。

以目标图像中的白色区域(灰度值为255)代表芯片背景，黑色区域(灰度值为0)代表芯片样本点为例，在目标图像的像素值遍历过程中，当检测到样本点中心位置对应的像素值为0，或者，样本点中心位置的四邻域中至少一个邻域对应的像素值为0，则将样本点检测矩阵sample_loc中该样本点对应位置的元素值赋值为1，否则保持样本点检测矩阵sample_loc中该样本点对应位置的元素值不变，即仍为0。

在本步骤中，样本点中心位置可以根据步骤S24得到的第一向量coo_h和步骤S26得到第二向量coo_v确定。比如，在第一行第一列的样本点中心位置可以根据第一向量coo_h中第一个坐标值与第二向量coo_v中第一个坐标值来确定，其中，第一向量coo_h中第一个坐标值为样本点中心的纵坐标值，第二向量coo_v中第一个坐标值为样本点中心的横坐标值。同理，第i行第j列的样本点中心位置为第一向量coo_h中第i个坐标值为纵坐标值、第二向量coo_v中第j个坐标值为横坐标值所确定的坐标位置。其中，i、j均为正整数，且i小于或等于总行数，j小于或等于总列数。

本公开对于遍历的样本点中心位置的邻域数目并不限定。比如，在其他实现方式中，可以遍历目标图像的样本点中心位置对应的像素值以及中心位置的八邻域对应的像素值。

步骤S30、根据步骤S29更新后的样本点检测矩阵sample_loc，确定阳性样本点的位置和个数(即样本点检测矩阵sample_loc中的非零元素个数)。其中，样本点位置矩阵sample_loc中元素值为1的位置指示阳性样本点，元素值为0的位置指示阴性样本点。

在一些示例性实施方式中，基于图3所示的生物芯片图像通过本实施例的处理可以得到如下所示的样本点检测矩阵sample_loc：

[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1；

1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0；

0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,1；

1,0,0,0,0,0,0,0,1,1,1,0,0,0,0,0,1,1,1,1,1,1,0,0,0,0,0,0,0；

0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1；

1,0,0,1,1,0,0,0,0,0,1,1,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0；

1,0,0,0,0,0,1,1,0,0,0,1,1,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0；

0,1,1,0,1,0,1,0,0,1,0,0,0,1,0,0,1,0,0,1,1,0,0,0,0,0,0,1,1；

0,1,1,0,0,1,0,0,0,1,0,1,0,0,1,0,0,1,1,1,0,0,1,0,1,1,0,0,0；

0,0,0,1,1,0,1,0,0,0,0,0,0,0,1,0,1,1,1,1,0,0,0,0,0,0,0,1,0；

1,0,0,0,0,0,0,1,0,0,0,0,0,1,1,0,0,0,0,0,1,0,0,0,0,1,0,1,1；

0,0,0,0,0,0,0,0,1,1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0；

0,0,0,0,0,0,0,1,0,1,0,1,1,1,0,0,0,0,1,1,0,0,1,0,0,0,0,1,0；

1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0；

0,1,0,0,0,1,1,1,0,0,1,0,0,0,1,0,0,1,1,0,0,1,1,0,0,0,1,1,0；

0,0,1,1,0,0,1,0,0,0,0,0,1,1,1,0,0,0,0,0,0,0,0,1,0,0,0,0,1；

0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,1,0,0,1,1,0,1,1,0,0,0,0,0；

1,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1；

1,1,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0]

本示例性实施例中，根据样本点检测矩阵sample_loc中的非零元素个数可知，图3所示的生物芯片图像中的阳性样本点个数为137。

在本示例性实施例中，可以根据样本点检测矩阵中非零元素的位置来对阳性样本点进行定位，比如，上述样本点检测矩阵中第二行第一列的元素值为1，则可以确定样本点阵列中第二行第一列的样本点为阳性样本点。

在一些示例性实施方式中，当初始化的样本点检测矩阵sample_loc中元素值均为1，则在本步骤S29中，可以将检测到的阳性样本点的位置对应的元素值更新为0，将阴性样本点的位置对应的元素值保持为1；然后，可以通过统计样本点检测矩阵sample_loc中元素值为0的个数来得到阳性样本点个数。

在一些示例性实施方式中，在得到样本点检测矩阵sample_loc之后，可以将样本点检测矩阵sample_loc的结果叠加到待检测的生物芯片图像，得到如图4所示的可视化结果，以便于直观了解阳性样本点的位置和数目。

本实施例提供的数据处理方法基于图像二值化处理、形态学操作以及连通域检测，借助OpenCV中的函数实现对生物芯片图像中样本点阵列进行自动检测，得到自适应的样本点阵列信息(样本点阵列的行数、列数以及每一样本点的中心位置信息)，并基于样本点阵列信息可以检测到阳性样本点的位置以及个数。本实施例提供的数据处理方法可以降低计算复杂度，提高运算速度，兼容多种芯片设计，而且，可以有效排除样本点周围噪声的影响，对图像噪声的鲁棒性较佳，从而增加了算法可靠性。

图5为本公开至少一实施例提供的生物芯片的数据处理方法的另一示例流程图。如图5所示，本实施例提供数据处理方法包括步骤S31至步骤S41。本实施例提供的数据处理方法与图2所示的数据处理方法的区别在于：阳性样本点的个数的确定方式不同。

在本示例性实施例中，在步骤S41，基于步骤S38得到的目标图像，利用OpenCV中的findContours函数，得到样本点阵列中阳性样本点的个数。其中，通过findContours函数对目标图像进行连通域检测，检测到的连通域总数即为阳性样本点的个数。

在步骤S40中，根据更新后的样本点检测矩阵sample_loc，对阳性样本点定位。关于阳性样本点的定位方式可以参照图2所示实施例的说明。

本示例性实施例的其余步骤均可以参照图2所示实施例的说明，故于此不再赘述。

图6为本公开至少一实施例提供的生物芯片的数据处理装置的示意图。如图6所示，本实施例提供的数据处理装置，包括：图像获取模块11、二值化处理模块12、形态学操作模块13及第一检测模块14。图像获取模块11，配置为获取待检测的生物芯片图像；二值化处理模块12，配置为对生物芯片图像进行二值化处理，得到二值图像；形态学操作模块13，配置为在行方向上对二值图像进行形态学膨胀操作，得到第一图像，在列方向上对二值图像进行形态学膨胀操作，得到第二图像；第一检测模块14，配置为通过在行方向对第一图像进行连通域检测以及在列方向对第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。

在一些示例性实施方式中，形态学操作模块13配置为通过以下方式在行方向上对二值图像进行形态学膨胀操作，得到第一图像：在行方向上根据第一膨胀算子对二值图像进行形态学膨胀操作，得到第一图像，其中，第一图像中行方向上的一个连通域表示一行样本点。形态学操作模块13配置为通过以下方式在列方向上对二值图像进行形态学膨胀操作，得到第二图像：在列方向上根据第二膨胀算子对二值图像进行形态学膨胀操作，得到第二图像，其中，第二图像中列方向上的一个连通域表示一列的样本点。

在一些示例性实施方式中，第一膨胀算子在行方向上的取值为生物芯片图像的宽度，第二膨胀算子在列方向上的取值为生物芯片图像的高度。

在一些示例性实施方式中，第一检测模块14配置为通过以下方式通过在行方向对第一图像进行连通域检测以及在列方向对第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息：通过检测第一图像中在行方向上的连通域，确定样本点阵列的行数以及每一行样本点在列方向上的中心位置信息；通过检测第二图像中在列方向上的连通域，确定样本点阵列的列数以及每一列样本点在行方向上的中心位置信息；根据每一行样本点在列方向上的中心位置信息以及每一列样本点在行方向上的中心位置信息，得到每一样本点的中心位置信息。

在一些示例性实施方式中，第一检测模块14配置为通过以下方式通过检测第一图像中在行方向上的连通域，确定样本点阵列的行数以及每一行样本点在列方向上的中心位置信息：基于第一图像，利用OpenCV中的findContours函数得到样本点阵列的行数以及每一行样本点在列方向上的中心位置信息。第一检测模块14配置为通过以下方式通过检测第二图像中在列方向上的连通域，确定样本点阵列的列数以及每一列样本点在行方向上的中心位置信息：基于第二图像，利用OpenCV中的findContours函数得到样本点阵列的列数以及每一列样本点在行方向上的中心位置信息。

在一些示例性实施方式中，如图7所示，二值化处理模块12，还配置为对生物芯片图像进行二值化处理，得到目标图像。或者，二值化处理模块12和形态学操作模块13还配置为依次对生物芯片图像进行二值化处理和形态学操作，得到目标图像。其中，得到目标图像进行的二值化处理所采用的阈值大于得到二值图像进行的二值化处理所采用的阈值。

如图7所示，本示例性实施例提供的数据处理装置还可以包括：第二检测模块15，配置为基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点的位置信息。

在一些示例性实施方式中，第二检测模块15配置为通过以下方式基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置：基于样本点阵列的行数和列数，得到初始化的样本点检测矩阵；基于样本点阵列中每一样本点的中心位置信息，遍历目标图像内每个样本点的中心位置对应的像素值和所述样本点的中心位置的邻域对应的像素值；当检测到目标图像内任一样本点的中心位置对应的像素值或所述样本点的中心位置的邻域对应的像素值为第一数值，则更新样本点检测矩阵内所述样本点对应位置的元素值为第三数值；当检测到目标图像内任一样本点的中心位置对应的像素值或所述样本点的中心位置的邻域对应的像素值为第二数值，则将样本点检测矩阵内所述样本点对应位置的元素值保持为初始值；根据遍历目标图像得到的样本点检测矩阵内第三数值的位置，确定阳性样本点在样本点阵列中的位置。

在一些示例性实施方式中，如图8所示，本实施例的数据处理装置还可以包括：第三检测模块16，配置为基于样本点阵列的行数、列数以及每一样本点的中心位置信息，对目标图像进行样本点检测，确定阳性样本点的个数；或者，基于目标图像，利用OpenCV中的findContours函数得到样本点阵列中阳性样本点的个数。

关于本实施例提供的生物芯片的数据处理装置的相关说明可以参照上述方法实施例的描述，故于此不再赘述。

本公开实施例还提供一种数据处理终端，包括：存储器和处理器，存储器存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的生物芯片的数据处理方法的步骤。

图9为本公开至少一实施例提供的数据处理终端的示例图。如图9所示，在一个示例中，数据处理终端包括：处理器21、存储器22、总线系统23和显示器24，其中，处理器21、存储器22和显示器24通过该总线系统23相连，存储器22配置为存储指令，处理器21配置为执行存储器22存储的指令，以控制显示器24的显示内容。

在一些示例性实施方式中，处理器21可以是中央处理单元(CPU，Central Processing Unit)，处理器21还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在一些示例性实施方式中，存储器22可以包括只读存储器和随机存取存储器，并向处理器21提供指令和数据。存储器22的一部分还可以包括非易失性随机存取存储器。例如，存储器22还可以存储设备类型的信息。

在一些示例性实施方式中，总线系统23除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图9中将至少一种总线都标为总线系统23。

在一些示例性实施方式中，上述数据处理装置所执行的处理可以通过处理器21中的硬件的集成逻辑电路或者软件形式的指令完成。即本公开实施例所公开的方法的步骤可以体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等存储介质中。该存储介质位于存储器22，处理器21读取存储器22中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

此外，本公开实施例还提供一种计算机可读介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的数据处理方法的步骤。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上显示和描述了本公开的基本原理和主要特征和本公开的优点。本公开不受上述实施例的限制，上述实施例和说明书中描述的只是说明本公开的原理，在不脱离本公开精神和范围的前提下，本公开还会有多种变化和改进，这些变化和改进都落入要求保护的本公开范围内。

Claims

一种生物芯片的数据处理方法，包括：

获取待检测的生物芯片图像；

对所述生物芯片图像进行二值化处理，得到二值图像；

在行方向上对所述二值图像进行形态学膨胀操作，得到第一图像，在列方向上对所述二值图像进行形态学膨胀操作，得到第二图像；

通过在所述行方向对所述第一图像进行连通域检测以及在所述列方向对所述第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。
根据权利要求1所述的数据处理方法，其中，所述在行方向上对所述二值图像进行形态学膨胀操作，得到第一图像，包括：在所述行方向上根据第一膨胀算子对所述二值图像进行形态学膨胀操作，得到第一图像，其中，所述第一图像中行方向上的一个连通域表示一行样本点；

所述在列方向上对所述二值图像进行形态学膨胀操作，得到第二图像，包括：在所述列方向上根据第二膨胀算子对所述二值图像进行形态学膨胀操作，得到第二图像，其中，所述第二图像中列方向上的一个连通域表示一列的样本点。
根据权利要求2所述的数据处理方法，其中，所述第一膨胀算子在行方向上的取值为所述生物芯片图像的宽度，所述第二膨胀算子在列方向上的取值为所述生物芯片图像的高度。
根据权利要求1所述的数据处理方法，其中，所述通过在所述行方向对所述第一图像进行连通域检测以及在所述列方向对所述第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息，包括：

通过检测所述第一图像中在所述行方向上的连通域，确定所述样本点阵列的行数以及每一行样本点在列方向上的中心位置信息；

通过检测所述第二图像中在所述列方向上的连通域，确定所述样本点阵列的列数以及每一列样本点在行方向上的中心位置信息；

根据每一行样本点在列方向上的中心位置信息以及每一列样本点在行方向上的中心位置信息，得到每一样本点的中心位置信息。
根据权利要求4所述的数据处理方法，其中，所述通过检测所述第一图像中在所述行方向上的连通域，确定所述样本点阵列的行数以及每一行样本点在列方向上的中心位置信息，包括：基于所述第一图像，利用开源计算机视觉库OpenCV中的findContours函数得到所述样本点阵列的行数以及每一行样本点在列方向上的中心位置信息；

所述通过检测所述第二图像中在所述列方向上的连通域，确定所述样本点阵列的列数以及每一列样本点在行方向上的中心位置信息，包括：基于所述第二图像，利用OpenCV中的findContours函数得到所述样本点阵列的列数以及每一列样本点在行方向上的中心位置信息。
根据权利要求1至5中任一项所述的数据处理方法，还包括：

对所述生物芯片图像进行二值化处理，得到目标图像，或者，对所述生物芯片图像进行二值化处理和形态学操作，得到目标图像；其中，得到所述目标图像进行的二值化处理所采用的阈值大于得到所述二值图像进行的二值化处理所采用的阈值；

基于所述样本点阵列的行数、列数以及每一样本点的中心位置信息，对所述目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置。
根据权利要求6所述的数据处理方法，其中，所述基于所述样本点阵列的行数、列数以及每一样本点的中心位置信息，对所述目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置，包括：

基于所述样本点阵列的行数和列数，得到初始化的样本点检测矩阵；

基于所述样本点阵列中每一样本点的中心位置信息，遍历所述目标图像内每个样本点的中心位置对应的像素值和所述样本点的中心位置的邻域对应的像素值；当检测到所述目标图像内任一样本点的中心位置对应的像素值或所述样本点的中心位置的邻域对应的像素值为第一数值，则更新所述样本点检测矩阵内所述样本点对应位置的元素值为第三数值；当检测到所述目标图像内任一样本点的中心位置对应的像素值或所述样本点的中心位置的邻域对应的像素值为第二数值，则将所述样本点检测矩阵内所述样本点对应位置的元素值保持为初始值；

根据遍历所述目标图像得到的样本点检测矩阵内第三数值的位置，确定阳性样本点在样本点阵列中的位置。
根据权利要求6所述的数据处理方法，还包括：

基于所述样本点阵列的行数、列数以及每一样本点的中心位置信息，对所述目标图像进行样本点检测，确定阳性样本点的个数；或者，

基于所述目标图像，利用开源计算机视觉库OpenCV中的findContours函数得到所述样本点阵列中阳性样本点的个数。
一种生物芯片的数据处理装置，包括：

图像获取模块，配置为获取待检测的生物芯片图像；

二值化处理模块，配置为对所述生物芯片图像进行二值化处理，得到二值图像；

形态学操作模块，配置为在行方向上对所述二值图像进行形态学膨胀操作，得到第一图像，在列方向上对所述二值图像进行形态学膨胀操作，得到第二图像；

第一检测模块，配置为通过在所述行方向对所述第一图像进行连通域检测以及在所述列方向对所述第二图像进行连通域检测，确定样本点阵列的行数、列数以及每一样本点的中心位置信息。
根据权利要求9所述的数据处理装置，其中，所述二值化处理模块，还配置为对所述生物芯片图像进行二值化处理，得到目标图像；或者，所述二值化处理模块和形态学操作模块还配置为依次对所述生物芯片图像进行二值化处理和形态学操作，得到目标图像；其中，得到所述目标图像进行的二值化处理所采用的阈值大于得到所述二值图像进行的二值化处理所采用的阈值；

所述数据处理装置还包括：第二检测模块，配置为基于所述样本点阵列的行数、列数以及每一样本点的中心位置信息，对所述目标图像进行样本点检测，确定阳性样本点在样本点阵列中的位置。
根据权利要求10所述的数据处理装置，还包括：第三检测模块，配置为基于所述样本点阵列的行数、列数以及每一样本点的中心位置信息，对所述目标图像进行样本点检测，确定阳性样本点的个数；或者，基于所述目标图像，利用开源计算机视觉库OpenCV中的findContours函数得到所述样本点阵列中阳性样本点的个数。
一种数据处理终端，包括：存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的生物芯片的数据处理方法的步骤。
一种计算机可读介质，存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的生物芯片的数据处理方法的步骤。