CN113822838A - 碱基识别设备及碱基识别方法 - Google Patents
碱基识别设备及碱基识别方法 Download PDFInfo
- Publication number
- CN113822838A CN113822838A CN202010556365.8A CN202010556365A CN113822838A CN 113822838 A CN113822838 A CN 113822838A CN 202010556365 A CN202010556365 A CN 202010556365A CN 113822838 A CN113822838 A CN 113822838A
- Authority
- CN
- China
- Prior art keywords
- module
- images
- base recognition
- image
- fpga module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 22
- 238000010606 normalization Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000002073 fluorescence micrograph Methods 0.000 claims description 4
- 238000007667 floating Methods 0.000 claims description 3
- 239000000835 fiber Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000005265 energy consumption Methods 0.000 abstract description 3
- 238000012163 sequencing technique Methods 0.000 description 16
- 108020004414 DNA Proteins 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
- G06T7/337—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10064—Fluorescence image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30072—Microarray; Biochip, DNA array; Well plate
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种碱基识别设备,包括:至少一个FPGA模块,以及与该至少一个FPGA模块通讯连接的内置服务器。本发明还提供碱基识别方法。本发明可以提高执行碱基识别的计算效率,以及降低计算平台的能耗和成本。
Description
技术领域
本发明涉及基因测序技术领域,尤其涉及一种碱基识别设备及碱基识别方法。
背景技术
基因测序是指分析特定DNA片段的碱基序列,即腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C)与鸟嘌呤(G)的排列方式。二代测序技术又称为大规模平行测序或者深度测序,以其高通量,低成本,较高的测序准确性的特点,在临床和科研应用中最为广泛。二代测序的核心原理是边合成边测序,其基本包括文库构建,单克隆DNA簇的生成和测序反应,可以同时分析阵列上的DNA样本。其中装载DNA的反应载体是芯片,DNA在芯片上进行反应,通过测定反应连接的荧光基团,判定该位置碱基序列。通过光学系统和科学相机可以采集芯片上的DNA荧光信号,并转化为数字信号。
二代测序核心原理为边合成边测序,每一次生化反应,合成一个碱基,测序仪需要对芯片采集一次荧光信号,这样的一次过程称为一个循环。其结果就是每一个循环,可以测得芯片点阵上的DNA序列上的一个碱基。通过若干个循环,即可获得芯片点阵上的DNA序列。
随着基因测序仪数据通量的不断提升,对碱基识别算法的处理速度要求也越来越高,现有的碱基识别算法一般是由高性能计算机,即单一CPU的x86架构服务器来实现。
现有技术方案有两大缺点,一是数据处理带宽受限于主机PCIE通道带宽限制,二是处理能力受限于CPU的处理能力。因此,需要高PCIE通道带宽和高性能CPU的计算机主机。而高性能的计算机主机成本极其昂贵。如果采用低性能计算机主机,即带宽和CPU不能满足要求,则会出现反应速度慢,准确率低等问题。
发明内容
鉴于以上内容,有必要提供一种碱基识别设备及碱基识别方法,可有效提高碱基识别的计算效率,降低计算平台的能耗和成本。
所述碱基识别设备包括:至少一个FPGA模块,以及与该至少一个FPGA模块通讯连接的内置服务器。
优选地,该碱基识别设备还包括:ARM模块和相机接口模块。
优选地,所述至少一个FPGA模块通过光纤接口与所述内置服务器连接,该至少一个FPGA模块通过PCIE接口与所述ARM模块连接,该至少一个FPGA模块通过高速连接器与所述相机接口模块连接,所述ARM模块通过以太网接口与所述内置服务器通讯连接。
优选地,所述相机接口模块可拆卸地与所述至少一个FPGA模块通讯连接。
优选地,所述相机接口模块包括:ESD保护芯片、接口驱动芯片、所述高速连接器、控制模块、供电模块,其中,信号从所述相机进入所述相机接口模块后,经所述ESD保护芯片后进入所述接口驱动芯片,通过所述高速连接器进入所述至少一个FPGA模块,所述至少一个FPGA模块通过所述高速连接器与所述控制模块通信,利用所述控制模块控制所述供电模块完成链路供电控制。
优选地,所述ARM模块从所述内置服务器接收算法程序的浮点类型的配置参数,并将该配置参数转换为所述至少一个FPGA模块所需要的定点化参数;其中,所述配置参数包括碱基识别过程中图像配准时所需的配准参数;所述配准参数包括:每张图像的像素区域的数目N、在每张图像的所有像素区域所需寻找的特征点数目M,其中,N和M均为正整数。
优选地,所述至少一个FPGA模块的数量为两个。
所述碱基识别方法包括:利用至少一个FPGA模块从相机接口模块获取多张图像,所述多张图像分别为携带有碱基信号的荧光图像;利用所述至少一个FPGA模块从所述多张图像中的每张图像识别碱基信息;利用所述至少一个FPGA模块将所述碱基信息传输至内置服务器;及利用所述内置服务器备份所述碱基信息。
优选地,所述利用所述至少一个FPGA模块从所述多张图像中的每张图像识别碱基信息包括:对所述多张图像进行配准,以获取所述多张图像中的每张图像的特征点的位置;针对经过配准的所述多张图像中的每张图像,识别该每张图像的每个有效信号的位置;提取该每张图像中的每个有效信号的亮度信息;基于该每张图像中的每个有效信号的位置以及每个有效信号的亮度信息对所述多张图像作亮度归一化处理;针对经过亮度归一化处理的所述多张图像中的每张图像,校正该每张图像的亮度,由此获得经过校准的多张图像;及从经过校准的所述多张图像中的每张图像识别所述碱基信息。
优选地,所述对所述多张图像进行配准,以获取所述多张图像中的每张图像的特征点的位置包括:确定所述多张图像中的每张图像的像素区域的数目N,以及确定在该N个像素区域所需寻找的特征点数目M;及利用多个并行的特征点寻找模块分别同时从每张图像的所述N个像素区域中寻找所述M个特征点,并获取该M个特征点中每个特征点的坐标。
相较于现有技术,所述碱基识别设备及碱基识别方法,可有效提高碱基识别的计算效率,降低计算平台的能耗和成本。
附图说明
图1是本发明较佳实施例的碱基识别设备的架构图。
图2是本发明较佳实施例的相机接口模块的架构图。
图3是本发明较佳实施例的碱基识别方法的流程图。
图4是利用本发明提供的碱基识别设备实现碱基识别的性能指标与利用CPU实现碱基识别的性能指标的比对结果。
主要元件符号说明
碱基识别设备 | 1 |
FPGA模块 | 10 |
内置服务器 | 11 |
ARM模块 | 12 |
相机接口模块 | 13 |
相机 | 3 |
存储服务器 | 2 |
ESD保护芯片 | 131 |
接口驱动芯片 | 132 |
板对板连接器 | 133 |
控制模块 | 134 |
供电模块 | 135 |
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
参阅图1所示,为本发明较佳实施例提供的碱基识别设备的架构图。
本实施例中,碱基识别设备1包括至少一个FPGA(Field Programmable GateArray,现场可编程逻辑门阵列)模块10,以及与该至少一个FPGA模块10通讯连接的内置服务器11、ARM(Advanced RISC Machine,进阶精简指令集机器)模块12、以及相机接口模块13。所述ARM模块12还与所述内置服务器11通讯连接。
在一个实施例中,所述至少一个FPGA模块10通过光纤接口与所述内置服务器11连接。所述内置服务器11可以与远程服务器例如存储服务器2无线通讯连接。
在一个实施例中,所述至少一个FPGA模块10通过PCIE接口与所述ARM模块12连接。
在一个实施例中,所述至少一个FPGA模块10通过高速连接器与所述相机接口模块13连接。该所述相机接口模块13用于与一个或多个相机3通讯连接。由此,所述至少一个FPGA模块10从所述相机接口模块13获取到所述一个或多个相机3分别所拍摄的图像。
需要说明的是,所述高速连接器可以是PMC连接器、HSMC连接器、FMC连接器。本实施例为FMC连接器。
本实施例中,所述相机接口模块13可以以可拆卸的方式与所述至少一个FPGA模块10通讯连接。所述相机接口模块13的功能包括,但不限于,EMC防护、过流保护、过流检测、端口供电控制、总线驱动能力增强、连接器状态检测等。
在一个实施例中,所述相机3为具有高分辨率的相机。所述相机3的接口类型可以为CoaXPress、Camera Link、Camera Link HS、PCIE、USB、Ethernet,或者其他类型例如SFP、SFP+等。对应地,所述相机接口模块13可以替换为与所述相机3的接口类型对应的相机接口板。
参阅图2所示,在一个实施例中,所述相机接口模块13包括ESD(ElectrostaticDischarge,静电放电)保护芯片131、接口驱动芯片132、板对板连接器133、控制模块134,以及供电模块135。
具体地,信号从所述相机3进入所述相机接口模块13后,经ESD保护芯片131后进入接口驱动芯片132,通过板对板连接器133(也即是所述高速连接器)进入所述至少一个FPGA模块10。所述至少一个FPGA模块10通过板对板连接器133与控制模块134通信,利用控制模块134控制供电模块135完成链路(例如CXP链路)供电控制。
需要说明的是,信号从相机3过来后先经过ESD保护芯片131可实现防静电保护。所述接口驱动芯片132将信号转换为FPGA模块10可识别的信号。在其他实施例中,所述相机接口模块13可以集成在所述相机3中或者集成在所述FPGA模块10中。
在一个实施例中,所述ARM模块12通过以太网接口与所述内置服务器11通讯连接。
在一个实施例中,所述至少一个FPGA模块10还外接多个DDRSDRAM(双倍速率同步动态随机存储器)。由此,当所述至少一个FPGA模块10在执行算法程序(例如,碱基识别程序)时所产生的中间数据需要进行缓存以及读取时,该至少一个FPGA模块10可以对所述多个DDR SDRAM中的其中一个或多个DDR SDRAM执行写操作,以及对所述多个DDR SDRAM中的另外一个或多个DDRSDRAM执行数据读取操作,从而实现乒乓读写的操作。这样同一个DDRSDRAM同一时刻只有读操作,或者只有写操作,从而降低DDRSDRAM带宽风险。解决数据带宽比较大时,一个DDR SDRAM的读写带宽可能满足不了算法处理需求的问题。
本实施例中,所述FPGA模块10也可以称为FPGA芯片。该FPGA模块10可以是例如赛灵思(Xilinx)公司所生产的FPGA芯片。
需要说明的是,本实施例利用所述至少一个FPGA模块10可实现多核处理器的优势:如可以创建自定义应用处理器,通过并行管道(Pipes)和多管线层(Pipeline stages)来实现二维并行数据处理,由此在一个时钟周期里可以完成大量的计算。用户可根据需要实现的算法程序的特点在一个或多个FPGA模块10上定制所需要的算法架构,使算法程序的处理速度和性能功耗比均高于GPU和CPU。
例如,假设碱基识别过程中图像配准时需要在图像中的N个像素区域中寻找特征点(N为正整数),因此,FPGA模块10可以定制N个并行的特征点寻找模块,利用该N个并行的特征点寻找模块分别同时从所述N个像素区域中寻找特征点,从而一次性可以找全特征点,无需执行N次寻找,提高碱基识别效率。所述特征点寻找模块为软件模块,可以预先存储在所述至少一个FPGA模块10中。
还需要说明的是,本实施例使用ARM模块12的优势在于成本低,功耗低。本实施例中,ARM模块12可以用于对碱基识别设备1的配置管理。例如,对碱基识别设备1的温度,版本信息等的管理。
举例而言,ARM模块12可以设置第一阈值和第二阈值。所述第二阈值大于所述第一阈值。ARM模块12利用温度感测器(图中未示出)实时感测所述碱基识别设备1的温度。ARM模块12确定所述碱基识别设备1的温度是否大于第一阈值。当确定所述碱基识别设备1的温度大于所述第一阈值时,ARM模块12则调高所述碱基识别设备1的风扇(图中未示出)的转速以进一步对所述碱基识别设备1降温。当所述碱基识别设备1的温度大于所述第二阈值时,ARM模块12则关闭所述碱基识别设备1的电源,以实现对碱基识别设备1的保护。
需要说明的是,所述版本信息是指安装于所述碱基识别设备1的软硬件的版本号,方便用户根据该软硬件的版本号升级维护。
此外,ARM模块12还有一个桥梁的作用,可以从内置服务器11接收算法程序(例如碱基识别程序)的浮点类型的配置参数,并将该配置参数转换为所述至少一个FPGA模块10所需要的定点化参数,以及将转化后的所述配置参数发送给所述至少一个FPGA模块10。
本实施例中,所述配置参数包括,但不限于,碱基识别过程中图像配准时所需的配准参数。所述配准参数包括,每张图像的像素区域的数目N、在每张图像的所有像素区域所需寻找的特征点数目M,其中,N和M均为正整数。
ARM模块12也可以将所述至少一个FPGA模块10执行算法程序过程中所获得的信息传递给内置服务器11,实现所述至少一个FPGA模块10与内置服务器11的信息交互功能。
需要说明的是,在不考虑功耗和成本的情况下,也可以将ARM模块12集成在内置服务器11中。
还需要说明的是,内置服务器11不但可以用于管理所述配置参数,也可用于对测序芯片(图中未示出)的位置进行校准。此外,内置服务器11还可以在本地硬盘备份所述算法程序最终得到的信息。例如,所述碱基识别程序最终得到的碱基信息。
本实施例中,内置服务器11也可以将本地备份的数据上传到远程服务器例如存储服务器2中。本实施例中,由于主要由所述至少一个FPGA模块10来执行算法程序,因此内置服务器11可选用较低性能的CPU。
另外还需要说明的是,上述提及的算法程序(例如碱基识别程序)可以存储在所述至少一个FPGA模块10中,由此,所述至少一个FPGA模块10可以通过执行该算法程序以达成该算法程序的功能。以所述算法程序为碱基识别程序为例,所述至少一个FPGA模块10通过执行该碱基识别程序则可以达成碱基识别功能(具体可参下面对图3的介绍)。当然,所述算法程序也可以是用于实现其他功能的软件程序。
图3是本发明较佳实施例提供的利用图1所示的碱基识别设备进行碱基识别的方法的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
本实施例以所述碱基识别设备1包括两个FPGA模块10为例说明。为便于清楚简单说明本发明,以下将该两个FPGA模块10分别为称为第一FPGA模块和第二FPGA模块。
步骤S1、第一FPGA模块从所述相机接口模块13获取多张图像。本实施例中,所述多张图像为一个或者多个相机3所拍摄的携带有碱基信号的荧光图像。
步骤S2、第一FPGA模块对所述多张图像进行配准。
需要说明的是,第一FPGA模块执行图像配准时首先需要确定配准参数,该配准参数包括,但不限于,所述多张图像中的每张图像的像素区域的数目N、在每张图像的所有像素区域所需寻找的特征点数目M,其中,N和M均为正整数。本实施例中,每个像素区域包括多个像素点。在一个实施例中,每个像素区域所包括的像素点的数目相同。需要说明的是,一个像素区域与测序芯片(图中未示出)的其中一个区块对应。本实施例中,所述特征点是指像素区域的交叉点。具体地,所述特征点是指所述N个像素区域中的任意四个像素区域的交叉点。
本实施例中,所述配准参数为浮点类型的参数,预先存储在所述内置服务器11中。ARM模块12可以从内置服务器11获取所述配准参数,并将该配准参数转换为第一FPGA模块所需要的定点化参数,并发送给所述第一FPGA模块。由此,所述第一FPGA模块可以获得所述配准参数。
第一FPGA模块对所述多张图像进行配准,以获取每张图像的特征点的坐标。
本实施例中,所述对所述多张图像进行配准,以获取每张图像的特征点的坐标包括(a1)-(a2):
(a1)确定所述多张图像中的每张图像的像素区域的数目N,以及确定在该N个像素区域所需寻找的特征点数目M。
如上所述,第一FPGA模块可以从ARM模块12获得所述配准参数,由此可以确定所述多张图像中的每张图像的像素区域的数目N,以及确定在该N个像素区域所需寻找的特征点数目M。
在一个实施例中,第一FPGA模块可以向所述ARM模块12发出请求获取所述配准参数的信号。所述ARM模块12于接收到该信号时向所述从内置服务器11获取所述配准参数,将该配准参数转换为第一FPGA模块所需要的定点化参数,并发送给所述第一FPGA模块。
(a2)利用多个(例如N个)并行的特征点寻找模块分别同时从每张图像的所述N个像素区域中寻找所述M个特征点,并获取该M个特征点中每个特征点的坐标。
如前面所述,所述特征点寻找模块为软件模块,可以预先存储在所述第一FPGA模块中。所述第一FPGA模块可以通过执行所述多个(例如N个)并行的特征点寻找模块,利用该多个并行的特征点寻找模块分别同时从所述N个像素区域中寻找所述M个特征点,从而一次性可以找全特征点,无需执行多次寻找,提高碱基识别效率。
需要说明的是,本实施例中,当第一FPGA模块对所述多张图像进行配准的过程中,该第一FPGA模块需要缓存及读取数据时,该第一FPGA模块可以对外接的一个DDR SDRAM(为便于清楚简单说明本发明,这里称为“第一DDR SDRAM”)执行写操作,以及对外接的另外一个DDR SDRAM(为便于清楚简单说明本发明,这里称为“第二DDR SDRAM”)执行数据读取操作,从而实现乒乓读写的操作。这样同一个DDR SDRAM同一时刻只有读操作,或者只有写操作,从而降低DDR SDRAM带宽风险。解决数据带宽比较大时,一个DDRSDRAM的读写带宽可能满足不了算法处理需求的问题。
步骤S3、第一FPGA模块针对经过配准的所述多张图像中的每张图像,识别该每张图像的每个有效信号的位置,并提取该每张图像中的每个有效信号的亮度信息。
本实施例中,所述有效信号也即是指亮度值大于预设值的像素点。每个有效信号的位置是指每个有效信号在对应图像中的坐标。
本实施例中,第一FPGA模块可以根据所述特征点的坐标以及每个像素区域的大小来识别每个有效信号的位置。
同样需要说明的是,本实施例中,当第一FPGA模块识别每张图像的每个有效信号的位置;提取该每张图像中的每个有效信号的亮度信息的过程中,该第一FPGA模块需要缓存及读取数据时,该第一FPGA模块可以对所述第一DDR SDRAM执行写操作,以及对所述第二DDR SDRAM执行数据读取操作,从而实现乒乓读写的操作。解决数据带宽比较大时,一个DDRSDRAM的读写带宽可能满足不了算法处理需求的问题。
步骤S4、第一FPGA模块基于所述每张图像中的每个有效信号的位置以及每个有效信号的亮度信息对所述多张图像作亮度归一化处理。
需要说明的是,对所述多张图像作亮度归一化处理,也即是将不同通道的亮度信息统一到同一个动态范围内。
例如,第一FPGA模块可以将所述多张图像中,对应相同位置的有效信号的亮度调整到同一个动态范围。
本实施例中,对所述多张图像作亮度归一化处理是为了使得所述多张图像的亮度更加均衡,避免所述多张图像中的部分图像过亮或过暗。
本实施例中,当第一FPGA模块对所述多张图像作亮度归一化处理的过程中,该第一FPGA模块需要缓存及读取数据时,该第一FPGA模块可以对外接的第三DDR SDRAM执行写操作,以及对外接的第四DDR SDRAM执行数据读取操作,从而实现乒乓读写的操作。所述第三DDR SDRAM和第四DDR SDRAM为不同于所述第一DDRSDRAM和第二DDR SDRAM的DDR SDRAM。
步骤S5、针对经过亮度归一化处理的所述多张图像中的每张图像,所述第二FPGA模块校正该每张图像的亮度,由此获得经过校准的多张图像。
本实施例中,所述第二FPGA模块可以使用多元线性回归的方法校正该每张图像的亮度。
同样地,当所述第二FPGA模块校正每张图像的亮度的过程中,该第二FPGA模块需要缓存及读取数据时,该第二FPGA模块可以对所述第三DDR SDRAM执行写操作,以及对所述第四DDR SDRAM执行数据读取操作,从而实现乒乓读写的操作。解决数据带宽比较大时,一个DDR SDRAM的读写带宽可能满足不了算法处理需求的问题。
步骤S6、所述第二FPGA模块从经过校准的所述多张图像中的每张图像识别碱基信息。
步骤S7、所述第二FPGA模块将所述碱基信息传输至内置服务器11。内置服务器11将所述碱基信息备份到本地的硬盘。
在一个实施例中,所述第二FPGA模块可以先将所识别的碱基信息存储到一个指定文件中,然后将该指定文件传输至所述内置服务器11。
在一个实施例中,所述内置服务器11还可以将所备份的所述碱基信息传输到远程服务器例如存储服务器2进行备份。
需要说明的是,在其他实施例中,上述步骤S1-S7也可由同一个FPGA模块10来执行。
参阅图4所示,为利用本发明的碱基识别设备1所包括的两个FPGA模块10实现碱基识别与现有技术中利用CPU来实现碱基识别的性能指标比对结果。
具体是基于分别对三组样本(样本1、样本2,以及样本3)来实现碱基识别的比对结果。该三组样本分别为不同分辨率的图片(也叫测序图片,即携带有碱基信号的荧光图像)。其中,“GAP”代表两者(即利用所述两个FPGA模块10实现碱基识别与利用CPU实现碱基识别)之间的性能指标的差异。其中,“GAP”为正数时表示前者(即利用所述两个FPGA模块10实现碱基识别)的性能指标优于后者(即利用CPU实现碱基识别)的性能指标;“GAP”为负数时表示前者的性能指标差于后者的性能指标;如果“GAP”为负数,且“GAP”的值属于预定的指标范围内(例如在0至-0.5%期间以内),则认为前者(即利用所述两个FPGA模块10实现碱基识别)的性能指标符合预期。
本实施例中,性能指标“Q30”代表碱基识别的正确率是99.999%。性能指标“MappingRate”代表测序数据与标准参考序列的数据进行比对,序列一致的碱基占测序碱基总数的比率。“MappingRate”的值越高代表测序数据的质量越好。性能指标“AvgErrRate”代表测序数据与标准参考序列的数据进行比对,序列一致的碱基中的错误碱基的比例。
从图4中可以看到,前者的性能指标“Q30”优于后者的性能指标“Q30”,而前者和后者在性能指标“MappingRate”和“AvgErrRate”的性能相当。因此,利用本发明提供的碱基识别设备实现碱基识别的方法具有和利用CPU实现碱基识别的方法相当的准确率。而使用本发明提供的碱基识别设备实现碱基识别的方法所需的图像处理时间仅为现有技术中利用CPU实现碱基识别的方法所需的图像处理时间的一半。此外,使用本发明提供的碱基识别设备实现碱基识别的方法所需内存相较于现有技术中利用CPU实现碱基识别的方法减少250GB。使用本发明提供的碱基识别设备实现碱基识别的方法的成本和功耗相较于现有技术中利用CPU实现碱基识别的方法的成本和功耗可分别降低30%。
另外需要说明的是,本发明提供的碱基识别的方法步骤中,部分步骤可以由相机3来执行,从而减轻FPGA模块10的成本和功耗。该部分步骤包括上述步骤中关于图像配准、亮度提取、以及亮度归一化的步骤。
如果将部分步骤迁移到相机3,由相机3来执行,则FPGA模块10可以更改为更小更低成本的模块,也可以考虑将FPGA模块10做成独立模块,类似相机采集卡,或者加速卡集成到内置服务器内部。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种碱基识别设备,其特征在于,该碱基识别设备包括:至少一个FPGA模块,以及与该至少一个FPGA模块通讯连接的内置服务器。
2.如权利要求1所述的碱基识别设备,其特征在于,该碱基识别设备还包括:ARM模块和相机接口模块。
3.如权利要求2所述的碱基识别设备,其特征在于,所述至少一个FPGA模块通过光纤接口与所述内置服务器连接,该至少一个FPGA模块通过PCIE接口与所述ARM模块连接,该至少一个FPGA模块通过高速连接器与所述相机接口模块连接,所述ARM模块通过以太网接口与所述内置服务器通讯连接。
4.如权利要求3所述的碱基识别设备,其特征在于,所述相机接口模块可拆卸地与所述至少一个FPGA模块通讯连接。
5.如权利要求4所述的碱基识别设备,其特征在于,所述相机接口模块包括:ESD保护芯片、接口驱动芯片、所述高速连接器、控制模块、供电模块,其中,信号从所述相机进入所述相机接口模块后,经所述ESD保护芯片后进入所述接口驱动芯片,通过所述高速连接器进入所述至少一个FPGA模块,所述至少一个FPGA模块通过所述高速连接器与所述控制模块通信,利用所述控制模块控制所述供电模块完成链路供电控制。
6.如权利要求3所述的碱基识别设备,其特征在于,所述ARM模块从所述内置服务器接收算法程序的浮点类型的配置参数,并将该配置参数转换为所述至少一个FPGA模块所需要的定点化参数;
其中,所述配置参数包括碱基识别过程中图像配准时所需的配准参数;所述配准参数包括:每张图像的像素区域的数目N、在每张图像的所有像素区域所需寻找的特征点数目M,其中,N和M均为正整数。
7.如权利要求1所述的碱基识别设备,其特征在于,所述至少一个FPGA模块的数量为两个。
8.一种利用权利要求1所述的碱基识别设备实现的碱基识别方法,其特征在于,该碱基识别方法包括:
利用至少一个FPGA模块从相机接口模块获取多张图像,所述多张图像分别为携带有碱基信号的荧光图像;
利用所述至少一个FPGA模块从所述多张图像中的每张图像识别碱基信息;
利用所述至少一个FPGA模块将所述碱基信息传输至内置服务器;及
利用所述内置服务器备份所述碱基信息。
9.如权利要求8所述的碱基识别方法,其特征在于,所述利用所述至少一个FPGA模块从所述多张图像中的每张图像识别碱基信息包括:
对所述多张图像进行配准,以获取所述多张图像中的每张图像的特征点的位置;
针对经过配准的所述多张图像中的每张图像,识别该每张图像的每个有效信号的位置;
提取该每张图像中的每个有效信号的亮度信息;
基于该每张图像中的每个有效信号的位置以及每个有效信号的亮度信息对所述多张图像作亮度归一化处理;
针对经过亮度归一化处理的所述多张图像中的每张图像,校正该每张图像的亮度,由此获得经过校准的多张图像;及
从经过校准的所述多张图像中的每张图像识别所述碱基信息。
10.如权利要求9所述的碱基识别方法,其特征在于,所述对所述多张图像进行配准,以获取所述多张图像中的每张图像的特征点的位置包括:
确定所述多张图像中的每张图像的像素区域的数目N,以及确定在该N个像素区域所需寻找的特征点数目M;及
利用多个并行的特征点寻找模块分别同时从每张图像的所述N个像素区域中寻找所述M个特征点,并获取该M个特征点中每个特征点的坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010556365.8A CN113822838A (zh) | 2020-06-17 | 2020-06-17 | 碱基识别设备及碱基识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010556365.8A CN113822838A (zh) | 2020-06-17 | 2020-06-17 | 碱基识别设备及碱基识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113822838A true CN113822838A (zh) | 2021-12-21 |
Family
ID=78924353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010556365.8A Pending CN113822838A (zh) | 2020-06-17 | 2020-06-17 | 碱基识别设备及碱基识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113822838A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363403A (zh) * | 2023-05-26 | 2023-06-30 | 深圳赛陆医疗科技有限公司 | 用于基因样本的图像识别方法、图像识别系统和存储介质 |
-
2020
- 2020-06-17 CN CN202010556365.8A patent/CN113822838A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363403A (zh) * | 2023-05-26 | 2023-06-30 | 深圳赛陆医疗科技有限公司 | 用于基因样本的图像识别方法、图像识别系统和存储介质 |
CN116363403B (zh) * | 2023-05-26 | 2023-08-11 | 深圳赛陆医疗科技有限公司 | 用于基因样本的图像识别方法、图像识别系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111915596A (zh) | 一种肺结节良恶性预测方法及装置 | |
CN103345382A (zh) | 一种cpu+gpu群核超算系统及sift特征匹配并行计算方法 | |
US7480400B2 (en) | Detection of fiber pathways | |
CN114691585B (zh) | 多处理器流水线架构 | |
JP2022059564A (ja) | 複数次元のビジュアルアナリティクスのための空間的にスパースなニューラルネットワークアクセラレータ | |
CN113408472B (zh) | 目标重识别模型的训练方法、目标重识别方法及装置 | |
CN111951274A (zh) | 图像分割方法、系统、可读存储介质和设备 | |
US9536042B2 (en) | Using RNAi imaging data for gene interaction network construction | |
CN113822838A (zh) | 碱基识别设备及碱基识别方法 | |
US8549261B2 (en) | Parallel computing apparatus and parallel computing method | |
JP7204786B2 (ja) | 視覚的検索方法、装置、コンピュータ機器及び記憶媒体 | |
Zhang et al. | Research of real-time image acquisition system based on ARM 7 for agricultural environmental monitoring | |
KR102354476B1 (ko) | 뉴럴 네트워크를 이용한 방광병변 진단 시스템 제공방법 및 그 시스템 | |
Chen et al. | Bi-deformation-UNet: recombination of differential channels for printed surface defect detection | |
AU741705B2 (en) | Pipeline processor for medical and biological image analysis | |
CN112085788B (zh) | 回环检测方法、装置、计算机可读存储介质及移动装置 | |
Qureshi et al. | Genome sequence alignment-design space exploration for optimal performance and energy architectures | |
Wang et al. | Brain tumor segmentation via multi-modalities interactive feature learning | |
US9569584B2 (en) | Combining RNAi imaging data with genomic data for gene interaction network construction | |
Kuo et al. | Applications of deep learning to road sign detection in dvr images | |
Ke et al. | Analyzing the Interplay Between Random Shuffling and Storage Devices for Efficient Machine Learning | |
Donglin et al. | Parallel realization of SIFT feature abstraction based on GPU using TEGRA K1 | |
Chen et al. | Insulator Fault Detection in Aerial Images based on the Mixed-grouped Fire Single-shot Multibox Detector. | |
US20240029863A1 (en) | System and method for managing storage and image interpretation | |
CN110647826A (zh) | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 518083 the comprehensive building of Beishan industrial zone and 11 2 buildings in Yantian District, Shenzhen, Guangdong. Applicant after: Shenzhen Huada Zhizao Technology Co.,Ltd. Address before: 518083 the comprehensive building of Beishan industrial zone and 11 2 buildings in Yantian District, Shenzhen, Guangdong. Applicant before: MGI TECH Co.,Ltd. |