WO2020037571A1 - 基于图像构建测序模板的方法、装置和计算机程序产品 - Google Patents

基于图像构建测序模板的方法、装置和计算机程序产品 Download PDF

Info

Publication number
WO2020037571A1
WO2020037571A1 PCT/CN2018/101816 CN2018101816W WO2020037571A1 WO 2020037571 A1 WO2020037571 A1 WO 2020037571A1 CN 2018101816 W CN2018101816 W CN 2018101816W WO 2020037571 A1 WO2020037571 A1 WO 2020037571A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
bright spot
pixel
bright
bright spots
Prior art date
Application number
PCT/CN2018/101816
Other languages
English (en)
French (fr)
Inventor
李林森
徐伟彬
金欢
姜泽飞
周志良
颜钦
Original Assignee
深圳市真迈生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳市真迈生物科技有限公司 filed Critical 深圳市真迈生物科技有限公司
Priority to PCT/CN2018/101816 priority Critical patent/WO2020037571A1/zh
Publication of WO2020037571A1 publication Critical patent/WO2020037571A1/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

一种基于图像构建测序模板的方法和装置,其中,图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一、第二、第三和第四图像,第一图像包括M1和M2,第二图像包括N1和N2,第三图像包括P1和P2,第四图像包括Q1和Q2,该方法包括:合并第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应测序模板的亮斑集合(S10)。该方法对图像上的亮斑直接取并集,能够快速简便地获取完整准确的对应核酸模板的亮斑集合。

Description

基于图像构建测序模板的方法、装置和计算机程序产品 技术领域
本发明涉及本发明涉及图像处理和信息识别领域,特别地,涉及一种基于图像构建测序模板的方法、一种碱基识别方法、一种基于图像构建测序模板的装置、一种碱基识别装置和一种计算机程序产品。
背景技术
在相关技术中,包括在基于成像系统多次对生化反应中的核酸分子(模板)进行图像采集以测定该核酸分子的核苷酸顺序的测序平台中,如何处理以及关联多次不同时间点所采集的图像包括图像上的信息,以有效且准确地获得核酸模板的至少一部分的核苷酸组成和顺序,是值得关注的问题。
发明内容
本发明实施方式旨在至少解决相关技术中存在的技术问题之一或者至少提供一种可选择的实用方案。
依据本发明的一个实施方式,提供一种基于图像构建测序模板的方法,所称的图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,方法包括:合并第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应测序模板的亮斑集合。
依据本发明的另一个实施方式,提供一种基于图像构建测序模板的装置,所称的图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,装置包括:合并单元,用于合并第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应测序模板的亮斑集合。该装置用以实施上述本发明任一实施方式中的基于图像构建测序模板的方法。
依据本发明的一个实施方式,提供一种计算机可读存储介质,用于存储供计算机执行的程序,执行所述程序包括完成上述任一实施方式中的基于图像构建测序模板的方法。计算机可读存储介质包括但不限于只读存储器、随机存储器、磁盘或光盘等。
依据本发明的一个实施方式,还提供一种计算机程序产品,包括指令,指令在计算机执行程序时,使计算机执行上述本发明实施方式中的基于图像构建测序模板的方法。
上述基于图像构建测序模板的的方法、装置、计算机可读存储介质和/或计算机程序产品通过对图像 上的亮斑直接进行合并处理,能够快速简便地构建出对应核酸分子(测序模板)的亮斑集合。构建得的亮斑集合能有效、准确且全面的反映测序模板的信息,利于进一步的碱基的准确识别(base call),即准确识别获取模板核酸的至少一部分的核苷酸序列。
依据本发明的另一个实施方式,提供一种碱基识别方法,该方法包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述本发明实施方式中的基于图像构建测序模板的方法、装置、计算机可读存储介质和/或计算机程序产品来构建获取。
依据本发明的一个实施方式,提供一种碱基识别装置,该装置用于实施上述本发明实施方式中的碱基识别方法,包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述本发明实施方式中的基于图像构建测序模板的方法和/或装置构建获得。
依据本发明的一个实施方式,提供一种计算机可读存储介质,用于存储供计算机执行的程序,执行所述程序包括完成上述任一实施方式中的碱基识别方法。计算机可读存储介质包括但不限于只读存储器、随机存储器、磁盘或光盘等。
依据本发明的一个实施方式,还提供一种计算机程序产品,该产品包括实现碱基识别的指令,该指令在计算机执行所称的程序时,使该计算机执行上述本发明实施方式中的碱基识别的方法。
利用该碱基识别方法、装置、计算机可读存储介质和/或计算机程序产品,基于构建得的对应测序模板的亮斑集合,能够识别碱基延伸反应时与模板核酸结合的碱基的类型,能够用于实现模板核酸序列的准确测定。
利用上述碱基识别方法、装置、计算机可读存储介质和/或计算机程序产品,基于构建得的对应测序模板的亮斑集合,能够识别碱基延伸反应时与模板核酸结合的碱基的类型,能够用于实现模板核酸序列的准确测定。
本发明实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实施方式的实践了解到。
附图说明
图1是本发明具体实施方式中的基于图像构建测序模板的方法的流程示意图。
图2是本发明具体实施方式中的对图像Repeat1-20中的亮斑进行合并的过程及结果以获得测序模板的示意图。
图3是本发明的具体实施方式中的纠偏过程和纠偏结果的示意图。
图4是本发明具体实施方式中的候选亮斑的对应的矩阵以及连同像素示意图。
图5是本发明具体实施方式中的以像素点矩阵的中心像素点为中心的m1*m2范围的像素值示意图。
图6是本发明具体实施方式中的依据第二亮斑检测阈值进行判定之前和之后的亮斑检测结果对比示意图。
图7是本发明具体实施方式中的基于图像构建测序模板的装置的结构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“第一”、“第二”、“第三”、“第四”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者顺序。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本发明实施方式所称的测序,也称为序列测定,指核酸序列测定,包括DNA测序和/或RNA测序,包括长片段测序和/或短片段测序。
测序可以通过测序平台进行,测序平台可选择但不限于Illumina公司的Hisq/Miseq/Nextseq测序平台、Thermo Fisher/Life Technologies公司的Ion Torrent平台、华大基因的BGISEQ平台和单分子测序平台;测序方式可以选择单端测序,也可以选择双末端测序;获得的测序结果/数据即测读出来的片段,称为读段(reads)。读段的长度称为读长。
请参阅图1,本发明实施方式提供一种基于图像构建测序模板的方法,所称的图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,方法包括:S10合并第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应测序模板的亮斑集合。所称的“亮斑”也称为“亮点”(spots或peaks),指图像上的发光点,一个发光点占有至少一个像素点。所称“像素点”同“像素”。
该方法通过对图像上的亮斑直接进行合并处理,能够快速简便地构建出对应核酸分子(测序模板)的亮斑集合。构建得的亮斑集合能有效、准确且全面的反映测序模板的信息,利于进一步的碱基的准确识别(base call),即准确识别获取模板核酸的至少一部分的核苷酸序列。
所称的一轮测序反应,顺序和/或同时实现一次四种类型碱基延伸反应,可以是四种类型碱基反应底物(例如核苷酸类似物/碱基类似物)同时于一个碱基延伸反应体系中实现一轮测序反应,可以是两种类型碱基类似物于一个碱基延伸反应体系中、另外两种类型反应底物于下一个碱基延伸反应体系以实现一轮测序反应,也可以是一种类型碱基类似物于一个碱基延伸反应体系中、依次在四个连续的碱基延伸反应体系中加入该四种类型碱基类似物以实现一轮测序反应。可知,第一图像、第二图像、第三图像和第四图像可以采集自两次碱基延伸反应或者更多次的碱基延伸反应。另外,一个碱基延伸反应可能包含一次图像采集,也可能包含多次图像采集。
在一个示例中,一轮测序反应包括多次碱基延伸反应,例如单色测序,利用的四种类型碱基对应的反应底物(核苷酸类似物)均带有同一种荧光染料,一轮测序反应包括四次碱基延伸反应(4repeats),对于一个视野来说,一次碱基延伸反应包含一次图像采集,图像M1、图像N1、图像P1和图像Q1分别为来自一轮测序反应的四次碱基延伸反应的同一视野。
在另一个示例中,例如单分子双色测序反应,利用的四种类型碱基对应的反应底物(核苷酸类似物)中的两种带有一种荧光染料、另两种带有另一种不同激发波长的荧光染料,一轮测序反应包括两次碱基延伸反应,带有不同染料的两种类型碱基反应底物于一次碱基延伸反应中进行结合反应,对于一个视野, 一次碱基延伸反应包括两次于不同激发波长下的图像采集,图像M1、图像N1、图像P1和图像Q1分别来自一轮测序反应的两次碱基延伸反应的两种激发波长下的同一视野。
在又一个示例中,一轮测序反应包括一次碱基延伸反应,例如二代测序平台的双色测序反应,四种类型碱基反应底物(例如核苷酸类似物)分别带有染料a、带有染料b、带有染料a和染料b以及不带任何染料,染料a和染料b的激发波长不一样;四种类型反应底物于同一次碱基延伸反应中实现一轮测序反应,一次碱基延伸反应包括两次于不同激发波长下的图像采集,第一图像同第三图像、第二图像同第四图像,图像M1和图像N1分别来自不同轮测序反应或者同一轮测序反应中的不同激发波长下的同一视野。
发明人设计测试模板(template)构建算法发现,在部分模板构建算法中,由于部分亮斑在构建模板过程中被丢弃,且一般地,采集自第一轮测序反应的图像信息对template构建的影响远大于采集自后续反应该视野的图像,容易损失对应测序模板的亮斑。在某些具体实施方式中,S10包括:(a)合并图像N1上的亮斑至图像M1中,获得一次合并图像M1,对于一次合并图像M1中的重合亮斑依据重合亮斑包含的亮斑的数目进行计数标记,对于非重合亮斑记为1,在一次合并图像M1中的距离小于第一预定像素的多个亮斑为一个重合亮斑;(b)以图像P1、图像Q1、图像M2、图像N2、图像P2或图像Q2替代图像N1,以一次合并图像M1替代图像M1,多次进行(a)直至完成所有图像上的亮斑的合并,获得原始亮斑集合;(c)去除原始亮斑集合中的标记为1的亮斑,以获得对应测序模板的亮斑集合。如此,能够平衡不同轮测序反应的图像的权重,获得更多更准确的模板亮斑,能够快速简便且准确地获取对应测序模板的亮斑集,利于准确识别碱基获得下机数据。
在一个示例中,所使用的成像系统,电子传感器的尺寸为6.5μm,显微镜放大倍率60倍,能看到的最小尺寸就是0.1μm。对应核酸分子的亮斑的大小一般为小于10*10像素。
所称的第一预定像素,在一个示例中,设置为1.05像素。如此,能够准确的进行重合亮斑的判断,利于测序模板的准确构建。
在一个示例中,设置一个空模板(TemplateVec)承载第1-20Repeats相同视野的图像上的亮斑(Peaks)的合并结果,每次合并都对合并成功的亮斑进行计数,所有合并完成后,去掉计数为1的点。具体地,将图像Repeat1的peaks合并至TemplateVec时,由于初始时TemplateVec上没有任何亮斑,所以TemplateVec中亮斑总数等于图像Repeat1上的亮斑数,且所有亮斑计数为1;将图像Repeat2上的亮斑合并至TemplateVec时,先判断每个Repeat2的亮斑在TemplateVec中是否有距离小于1.05像素的亮斑,若有则合并在一起得重合亮斑,取这两个亮斑中的任一个的位置作为该重合亮斑的位置或者取这两个亮斑的平均位置作为该重合亮斑的位置,并对该重合亮斑计数加1;若不存在距离小于1.05像素的亮斑,则把该亮斑追加至TemplateVec中,计数为1;重复上述步骤直至完成图像Repeat20上的亮斑合并至TemplateVec;最后,对TemplateVec中的亮斑进行筛选,去除计数为1的亮斑。
而由于不同的加入顺序的原因,某些早期距离较远的亮斑,在合并后,会成为近距离亮斑,在一个示例中,进一步对TemplateVec内距离小于1.05像素的亮斑进行再一次合并。如此,利于获得更准确的测序模板。图2示意上述测序模板构建过程,图中的圆圈示意亮斑。
在某些具体实施方式中,图像为经过配准的图像。如此,利于准确地获取对应与测序模板的亮斑集合。
本发明实施方式对实现图像配准即纠偏的方式不作限制。在一些示例中,利用如下方法进行图像配准,包括:基于参考图像对待配准图像进行第一配准,参考图像和待配准图像对应相同对象,参考图像和待配准图像均包含多个亮斑,包括确定待配准图像上的预定区域和参考图像上的相应预定区域的第一 偏移量,基于第一偏移量移动待配准图像上的所有亮斑,获得第一配准后的待配准图像;基于参考图像对第一配准后的待配准图像进行第二配准,包括合并第一配准后的待配准图像和参考图像,获得合并图像,计算合并图像上的预定区域的所有重合亮斑的偏移量,以确定第二偏移量,距离小于预定像素的两个或多个亮斑为一个重合亮斑,基于该第二偏移量移动第一配准后的待配准图像上的所有亮斑,以实现对待配准图像的配准。该图像配准方法通过两次关联配准,可相对称为粗配准和细配准,包括利用图像上的亮斑进行细配准,能够基于少量数据信息快速地实现图像的高精度纠偏,特别适于高精度图像纠偏要求的场景。例如,单分子级别的图像检测,比如来自第三代测序平台的测序反应的图像。所称单分子级别指分辨率为单个或少数几个分子的大小,例如10个、8个、5个、4个或3个以下分子。
在某些具体实施方式中,待配准图像即构建测序模板的图像来自利用光学成像原理进行序列测定的测序平台。所称的测序,也称为序列测定,指核酸序列测定,包括DNA测序和/或RNA测序,包括长片段测序和/或短片段测序,测序生化反应包括碱基的延伸。测序可以通过测序平台进行,测序平台可选择但不限于Illumina公司的Hisq/Miseq/Nextseq测序平台、Thermo Fisher/Life Technologies公司的Ion Torrent平台、华大基因的BGISEQ平台和单分子测序平台;测序方式可以选择单端测序,也可以选择双末端测序;获得的测序结果/数据即测读出来的片段,称为读段(reads),读段的长度称为读长。所称的“亮斑”对应延伸碱基或碱基簇的光学信号。
所称的图像上的预定区域,可以是整个图像,也可以是图像的一部分。在一个示例中,图像上的预定区域为图像的一部分,例如为图像中心的512*512区域。所称的图像中心,为该视野的中心,成像系统的光轴与成像平面的交点可称为图像中心点,以该中心点为中心的区域可视为图像中心区域。
在某些具体实施方式中,待配准图像来自核酸测序平台,该平台包括成像系统和核酸样本承载系统,带有光学检测标记的待测核酸分子固定于反应器中,该反应器也称为芯片,芯片装载在一个可移动台子上,通过该移动台子带动芯片运动来实现对位于芯片不同位置(不同视野)的待测核酸分子进行图像采集。一般地,光学系统和/或移动台子的运动存在精度限制,例如,指令指定运动至某个位置和该机械结构实际运动达到的位置存在偏差,特别是在对精度高要求的应用情景,由此,在依据指令移动硬件以对不同时间点的同一位置(视野)进行多次图像采集的过程中,不同时间点采集的同一视野的多个图像难以完全对齐,对该些图像进行纠偏对齐,有利于基于该多个时间点采集的多个图像中的信息的变化来准确确定核酸分子核苷酸顺序。
在某些具体实施方式中,所称的参考图像是通过构建获得的,参考图像可以在对待配准图像进行配准时构建,也可以预先构建保存需要时调用。
在一些示例中,构建参考图像包括:获取第五图像和第六图像,第五图像和第六图像与待配准图像对应相同对象;基于第五图像对第六图像进行粗配准,包括确定第六图像和第五图像的偏移量,基于该偏移量移动第六图像,获得粗配准后的第六图像;合并第五图像和粗配准后的第六图像,以获得参考图像,第五图像和第六图像均包含多个亮斑。如此,利用构建获得包含更多或相对更完整的信息的图像,利用该图像作为纠偏的基准,利于实现更准确的图像配准。对于核酸序列测定得到的图像,利用多个图像进行参考图像构建,利于使得该参考图像获得完整的对应核酸分子的亮斑信息,利于基于亮斑的图像纠偏。
在一些实施例中,第五图像、第六图像分别来自核酸序列测定反应(测序反应)的不同时刻的同一个视野。在一个示例中,一轮测序反应包括多次碱基延伸反应,例如单色测序,利用的四种类型碱基对应的反应底物(核苷酸类似物)均带有同一种荧光染料,一轮测序反应包括四次碱基延伸反应(4repeats),对于一个视野来说,一次碱基延伸反应包含一次图像采集,第五图像和第六图像分别来自不同次的碱基 延伸反应的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。
在另一个示例中,单分子双色测序反应,利用的四种类型碱基对应的反应底物(核苷酸类似物)中的两种带有一种荧光染料、另两种带有另一种不同激发波长的荧光染料,一轮测序反应包括两次碱基延伸反应,带有不同染料的两种类型碱基反应底物于一次碱基延伸反应中进行结合反应,对于一个视野,一次碱基延伸反应包括两次于不同激发波长下的图像采集,第五图像和第六图像分别来自不同次的碱基延伸反应或者同一次碱基延伸反应中的不同激发波长下的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。
在又一个示例中,一轮测序反应包括一次碱基延伸反应,例如二代测序平台的双色测序反应,四种类型碱基反应底物(例如核苷酸类似物)分别带有染料a、带有染料b、带有染料a和染料b以及不带任何染料,染料a和染料b的激发波长不一样;四种类型反应底物于同一次碱基延伸反应中实现一轮测序反应,第五图像和第六图像分别来自不同轮测序反应或者同一轮测序反应中的不同激发波长下的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。
第五图像和/或第六图像,可以是一个图像也可以是多个图像。在一个示例中,第五图像为第一图像,第六图像为第二图像。进一步地,在一些具体实施方式中,还包括利用第七图像和第八图像构建所称的参考图像,待配准图像、第五图像、第六图像、第七图像和第八图像来自测序反应的相同视野,第五图像、第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的视野,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,构建参考图像还包括:基于第五图像对第七图像进行粗配准,包括确定第七图像和第五图像的偏移量,基于该偏移量移动第七图像,获得粗配准后的第七图像;基于第五图像对第八图像进行粗配准,包括确定第八图像和第五图像的偏移量,基于该偏移量移动第八图像,获得粗配准后的第八图像;合并第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得参考图像。
本发明实施方式对第一配准的实现方式不作限制,例如可利用傅里叶变换,使用频域配准,确定第一偏移量。具体地,例如可参考Kenji TAKITA et al,IEICE TRANS.FUNDAMENTALS,VOL.E86-A,NO.8AUGUST 2003.中的纯相位相关函数(Phase-Only Correlation Function)中的二维离散傅里叶变换确定第一偏移量、第六图像和第五图像的偏移量、第七图像和第五图像的偏移量和/或第八图像和第五图像的偏移量。第一配准/粗配准可达到1像素(1pixel)的精度。如此,可快速准确地确定第一偏移量和/或构建利于精确纠偏的参考图像。
在某些具体实施方式中,参考图像和待配准图像为二值化图像。如此,利于减少运算量快速纠偏。
在一个示例中,待纠偏图像和参考图像均为二值化图像,即图像中的各个像素非a即b,例如a为1,b为0,像素标记为1的较像素标记为0的亮,或者说强度大;参考图像是利用一轮测序反应的四次碱基延伸反应的图像repeat1、repeat2、repeat3和repeat4构建的,第五图像、第六图像选自图像repeat1-4中的任一个、两个或三个。
在一个示例中,第五图像为图像repeat1,图像repeat2、repeat3和repeat4为第六图像,基于图像图像repeat1依次对图像repeat2-4进行粗配准,分别获得粗配准后的图像repeat2-4;合并图像repeat1和粗配准后的图像repeat2-4,获得参考图像。所称的合并图像为合并图像中的重合亮斑。主要基于对应核酸分子的亮斑的大小和成像系统分辨率,在一个示例中,设定两个图像上距离不大于1.5个像素的两个亮斑为重合亮斑。这里,采用4个repeat的合成的图像中心区域作为参考图像,一来利于使得参考图像具 有足够量的亮斑,利于后续配准,二来检测及定位出的图像中心区域中的亮斑,亮斑信息是相对更准确的,利于准确配准。
在一个示例中,进行如下步骤对图像进行纠偏:1)对采集自另一轮测序反应的一次碱基延伸反应的某个视野的图像repeat5进行粗纠偏,repeat5为二值化后的图像,取该图像中心例如512*512区域,与repeat1-4合成的中心图像(相应参考图像的中心512*512区域),进行二维离散傅里叶变换,使用频域配准,得到偏移量offset(x0,y0),即实现图像粗配准,x0、y0能达到1pixel的精度;2)将上述粗配准后的图像和参考图像基于图像上的亮斑进行合并(merge),包括计算repeat5图像的中心区域内与参考图像相应区域内的重合亮斑的偏移量offset(x1,y1)=待纠偏图像的该亮斑的坐标位置-参考图像上的相应亮斑的坐标位置,可表示为offset(x1,y1)=curRepeatPoints-basePoints;求取所有重合亮斑的平均偏移量,从而得到[0,0]到[1,1]范围内的细偏移量。在一个示例中,设定两个图像上距离不大于1.5个像素的两个亮斑为重合亮斑;3)综上,得到一个视野图像(fov)不同cycle的偏移量(x0,y0)-(x1,y1),对于一个亮斑(peak)可表示为:curRepeatPoints+(x0,y0)-(x1,y1),curRepeatPoints表示该亮斑原始坐标,即在纠偏前的图像中的坐标。上述图像纠偏获得的纠偏结果具有较高的准确性,且纠偏精度小于或等于0.1像素。图3示意纠偏过程及结果,图3中,基于图像A对图像C进行纠偏,图像A和图像C中的圆圈表示亮斑、相同数字标记的亮斑为重合亮斑,图像C->A表示纠偏结果,即图像C对齐至图像A的结果。
本发明的实施方式对图像上亮斑的识别检测方式不作限定。在某些具体实施方式中,进行图像配准还包括识别亮斑,包括利用k1*k2矩阵对图像进行亮斑检测,判定矩阵的中心像素值不小于矩阵非中心任一像素值的矩阵对应一个候选亮斑,以及确定候选亮斑是否为亮斑,k1和k2均为大于1的奇数,k1*k2矩阵包含k1*k2个像素点。所称的图像选自待配准图像、构建参考图像的图像中的至少一个。利用该方式检测图像上的亮斑,能够快速有效地实现图像上的亮斑(spots或peaks)的检测,特别是对采集自核酸序列测定反应的图像。该方法对待检测图像即原始输入数据没有特别的限制,适用于任何利用光学检测原理进行核酸序列测定的平台所产生的图像的处理分析,包括但不限于二代和三代测序,具有高准确性和高效的特点,能从图像中获取更多的代表序列的信息。特别是对于随机图像及高准确度要求的信号识别,尤其具有优势。
在一些实施例中,图像来自核酸序列测定反应,核酸分子上带有光学可检测标记,利如荧光标记,荧光分子在特定波长激光照射下能够被激发发出荧光,通过成像系统采集图像。采集到的图像包括可能与荧光分子所在位置相对应的光斑/亮斑。可以理解地,当处于焦面位置时,所采集到的图像中的与荧光分子所在位置相对应的亮斑的尺寸较小且亮度较高;当位于非焦面位置时,所采集到的图像中的与荧光分子所在位置相对应的亮斑的尺寸较大且亮度较低。另外,视野中的可能存在其它非目标或者后续难以利用的物质/信息,比如杂质等;进一步地,在对单分子视野进行拍照中,大量分子聚集(簇)等也会干扰目标单分子信息采集。所称的单分子为一个少数几个分子,例如分子数目不大于10,例如为一个、两个、三个、四个、五个、六个、八个或者十个。
在一些示例中,矩阵的中心像素值大于第一预设值,矩阵非中心任一像素值大于第二预设值,第一预设值和第二预设值与图像的平均像素值相关。
在一些实施例中,可以利用k1*k2矩阵对图像进行遍历检测,所称的第一预设值和/或第二预设值的设置与该图像的平均像素值相关。对于灰度图像,像素值同灰度值。k1*k2矩阵,k1、k2可以相等也可以不相等。在一个示例中,成像系统相关参数为:物镜60倍,电子传感器的尺寸为6.5μm,经过显微镜成的像再经过电子传感器,能看到的最小尺寸为0.1μm,获得的图像或者输入的图像可为512*512、 1024*1024或2048*2048的16位的灰度或彩色图像,k1和k2的取值范围均为大于1且小于10。在一个示例中,k1=k2=3;在另一个示例中,k1=k2=5。若图像是彩色图像,彩色图像的一个像素点具有三个像素值,可以将彩色图像转化为灰度图像,再进行亮斑检测,以降低图像检测过程的计算量和复杂度。可选择但不限于利用浮点算法、整数方法、移位方法或平均值法等将非灰度图像转换成灰度图像。
在一个示例中,发明人经过大量图像处理统计,取第一预设值为该图像的平均像素的1.4倍,取第二预设值为该图像的平均像素值的1.1倍,能够排除干扰、获得来自于光学检测标记的亮斑检测结果。
可利用大小、与理想亮斑的相似程度和/或强度来对候选亮斑进一步进行筛选判断。在某些具体实施方式中,利用候选亮斑对应的连通域的大小来定量反映比较图像上候选亮斑的大小,以此来筛选判断候选亮斑是否为要的亮斑。
在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑对应的连通域的大小Area=A*B,判定对应的连通域的大小大于第三预设值的候选亮斑为一个亮斑,A表示以该候选亮斑对应的矩阵的中心的所在行的相连像素/连通像素的大小,B表示以该候选亮斑对应的矩阵的中心的所在列的相连像素/连通像素的大小,定义一个k1*k2矩阵中大于平均像素值的相连像素为一个所称的候选亮斑对应的连通域。如此,能够能够有效获得对应标记分子且符合后续序列识别的亮斑,获得核酸序列信息。
在一个例子中,以该图像的平均像素值作为基准,相邻的不小于平均像素值的两个或多个像素为所称的相连像素/连通像素(pixel connectivity),如图4所示,加粗加大的表示候选亮斑对应的矩阵的中心,粗线框表示候选亮斑对应的3*3矩阵,标记为1的像素为不小于该图像的平均像素值的像素点,标记为0的像素为小于平均像素值的像素点,可看出A=3,B=6,该候选亮斑对应的连通域的大小为A*B=3*6。
所称的第三预设值可依据该图像上所有候选亮斑对应的连通域的大小这一信息来确定。例如通过计算该图上各候选亮斑对应的连通域的大小,取亮斑的连通域大小的平均值代表该图像一个特性,作为第三预设值;又例如,可将该图像上各个候选亮斑对应的连通域大小按从小到大排序,取第50、第60、第70、第80或第90百分位数连通域大小作为该第三预设值。如此,可有效获得亮斑信息,利于后续识别核酸序列。
在某些示例中,通过统计设置参数来定量反映比较候选亮斑的强度特征,以此来筛选候选亮斑。在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑的分值Score=((k1*k2-1)CV-EV)/((CV+EV)/(k1*k2)),判定分值大于第四预设值的候选亮斑为一个亮斑,CV表示候选亮斑对应的矩阵的中心像素值,EV表示亮斑对应的矩阵的非中心像素值的总和。如此,能够能够有效获得对应标记分子且符合后续序列识别的亮斑,获得核酸序列信息。
所称的第四预设值可依据该图像上所有候选亮斑的分值的大小这一信息来确定。例如,当该图像上的候选亮斑的数量大于一定数目符合统计上对量的要求,例如该图像上候选亮斑的数目大于30,可计算且将该图像的所有候选亮斑的Score值按升序排序,第四预设值可设置为第50、第60、第70、第80或90分位数Score值,如此,可排除掉小于第50、第60、第70、第80或第90分位数Score值的候选亮斑,利于有效获得目标亮斑,利于后续碱基序列准确识别。进行该处理或者说该筛选设置的依据是,一般地,认为中心与边缘强度/像素值差异大且汇聚的亮斑为与待检分子所在位置相对应的亮斑。一般情况下,图像上的候选亮斑的数量大于50、大于100或大于1000。
在某些示例中,结合形态和强度/亮度对候选亮斑进行筛选。在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑对应的连通域的大小Area=A*B,以及计算一个候选亮斑的分值Score=((k1*k2-1)CV-EV)/((CV+EV)/(k1*k2)),A表示以该候选亮斑对应的矩阵的中心的所在行的相连像素/连通像素的大小,B表示以该候选亮斑对应的矩阵的中心的所在列的相连像素/连通像素的大小,定 义一个k1*k2矩阵中大于平均像素值的相连像素为一个所称的候选亮斑对应的连通域,CV表示候选亮斑对应的矩阵的中心像素值,EV表示亮斑对应的矩阵的非中心像素值的总和;判定对应的连通域的大小大于第三预设值且分值大于第四预设值的候选亮斑为一个亮斑。如此,能够有效地获得对应核酸分子且利于后续序列识别的亮斑信息。对于所称的第三预设值和/或第四预设值,可以参照前面具体实施方式进行考虑和设置。
在某些具体实施方式中,图像配准方法还包括亮斑识别检测,包括:预处理图像,获得预处理后的图像,所称的图像选自第一图像、第二图像、第三图像、第四图像、第五图像、第六图像、第七图像和第八图像中的至少一个;确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;基于预处理后的图像确定第一亮斑检测阈值c1;基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为r1*r2,r1和r2均为大于1的奇数,r1*r2像素点矩阵包含r1*r2个像素点,b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于2/3*r1*r2,以及c)在预处理后的图像中的像素点矩阵的中心像素点的像素值大于第三预设值,并且满足g1*g2>c1,g1为以像素点矩阵的中心像素点为中心的m1*m2范围的二维高斯分布的相关系数,g2为该m1*m2范围的像素,m1和m2均为大于1的奇数,m1*m2范围包含m1*m2个像素点;以及确定候选亮斑是否为亮斑。利用该方式检测图像上的亮斑,包括利用发明人通过大量数据训练确定的判断条件或判断条件的组合,能够快速有效地实现图像上的亮斑的检测,特别是对采集自核酸序列测定反应的图像。该方法对待检测图像即原始输入数据没有特别的限制,适用于任何利用光学检测原理进行核酸序列测定的平台所产生的图像的处理分析,包括但不限于二代和三代测序,具有高准确性和高效的特点,能从图像中获取更多的代表序列的信息。特别是对于随机图像及高准确度要求的信号识别,尤其具有优势。
对于灰度图像,像素值同灰度值。若图像是彩色图像,彩色图像的一个像素点具有三个像素值,可以将彩色图像转化为灰度图像,再进行亮斑检测,以降低图像检测过程的计算量和复杂度。可选择但不限于利用浮点算法、整数方法、移位方法或平均值法等将非灰度图像转换成灰度图像。
在一些实施例中,预处理图像包括:利用开运算确定图像的背景;基于背景,利用顶帽运算将图像转化为第一图像;对第一图像进行高斯模糊处理,获得第二图像;对第二图像进行锐化,以获得所称的预处理后的图像。如此,能对图像进行有效的降噪或者说提高图像的信噪比,利于亮斑的准确检测。开运算是一种形态学处理,即先膨胀后腐蚀的过程,腐蚀操作会使得前景(感兴趣的部分)变小,而膨胀会使得前景变大;开运算可以用来消除小物体,在纤细点处分离物体,并且在平滑较大物体的边界的同时不明显改变其面积。该实施方式对图像做开运算的结构元p1*p2(用来处理图像的基本模板)的大小不作特别限制,p1和p2为奇数。在一个示例中,结构元p1*p2可以为15*15、31*31等,最终都能够获得利于后续处理分析的预处理后的图像。
顶帽运算往往用来分离比临近点(亮点/亮斑)亮一些的斑块,在一幅图像具有大幅的背景,而微小物品比较有规律的情况下,可以使用顶帽运算进行背景提取。在一个示例中,对图像进行顶帽变换包括先对图像做开运算,进而利用原图像减去开运算结果,获得第一图像即顶帽变换后的图像。顶帽变换的数学表达式为dst=tophat(src,element)=src-open(src,element)。发明人认为,开运算的结果放大了裂缝或者 局部低亮度的区域,因此从原图中减去开运算后的图,得到的图像突出了比原图轮廓周围的区域更明亮的区域,这一操作与选择的核的大小相关,可以认为与亮点/亮斑的预期大小相关,若亮点不是预期大小,处理后的效果会使得整张图产生许多小凸起,具体可以参考虚焦图片,即亮点/亮斑晕染成一团。在一个示例中,亮点的预期大小即选择的核的大小为3*3,得到的顶帽变换后的图像利于后续进一步去噪处理。高斯模糊(Gaussian Blur)也称为高斯滤波,是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。在一个示例中,对第一图像进行高斯模糊处理,在OpenCV中使用高斯滤波GaussianBlur函数进行,高斯分布参数Sigma取0.9,所使用的二维滤波器矩阵(卷积核)是3*3,从图像角度看经过该高斯模糊处理后,第一图像上的小突起被抹平,图像边缘光滑。进一步地,对第二图像即高斯过滤后的图像进行锐化,例如进行二维拉普拉斯锐化,从图像角度看经过处理后,边缘被锐化,高斯模糊后的图像得以恢复。
在一些实施例中,简化预处理后的图像包括:基于背景和预处理后的图像,确定临界值;比较预处理后的图像上的像素点的像素值与临界值,对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,获得简化图像。如此,根据发明人大量测试数据总结的确定临界值的方式以及确定的临界值,据此将预处理后的图像简化,例如二值化,利于后续亮斑准确检测,利于后续碱基准确识别、获得高质量数据等。
具体地,在一些示例中,获得简化图像包括:将预处理后获得的锐化后的结果除以开运算结果,获得和图像像素点对应的一组数值;通过该组数值,确定二值化预处理后的图像的临界值。例如,可将该组数值按大小升序排列,取该组数值中第20、30或40百分位数对应的数值作为二值化临界值/阈值。如此,获得的二值化图像利于后续亮斑的准确检测识别。
在一个示例中,图像预处理时的开运算的结构元为p1*p2,所称的将预处理后的图像(锐化后的结果)除以开运算结果,获得一组和结构元一样大小的数组/矩阵p1*p2,在每个数组中,将该数组包含的p1*p2个数值按大小升序排列,取该数组中第三十百分位数对应的数值作为该区域(数值矩阵)的二值化临界值/阈值,如此,分别确定阈值对图像上的各个区域进行二值化,最终获得的二值化结果在去噪的同时更加突出所需信息,利于后续亮斑的准确检测。
在一些示例中,利用大津法进行第一亮斑检测阈值的确定。大津法(OTSU算法)也可称为最大类间方差法,大津法利用类间方差最大来分割图像,意味着错分概率小,准确性高。假设预处理后的图像的前景和背景的分割阈值为T(c1),属于前景的像素点数占整幅图像的比例为w 0,其平均灰度为μ 0;属于背景的像素点数占整幅图像的比例为w 1,其平均灰度为μ 1。待处理图像的总平均灰度记为μ,类间方差记为var,则有:μ=ω 0011;var=ω 00-μ) 211-μ) 2,将后者代入前者,得到等价公式:var=ω 0ω 110) 2。采用遍历的方法得到使类间方差最大的分割阈值T,即为所求的第一亮斑检测阈值c1。
在一些实施例中,基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判断同时满足a)-c)三个条件的像素点矩阵为一个候选亮斑。如此,能有效地提高后续基于亮斑信息确定核酸序列的准确性和下机数据的质量。
具体地,在一个示例中,候选亮斑的判定需要满足的条件包括a),k1、k2可以相等也可以不相等。在一个示例中,成像系统相关参数为:物镜60倍,电子传感器的尺寸为6.5μm,经过显微镜成的像再经过电子传感器,能看到的最小尺寸为0.1μm,获得的图像或者输入的图像可为512*512、1024*1024或2048*2048的16位的灰度或彩色图像,k1和k2的取值范围均为大于1且小于10。在一个示例中,在一个预处理后的图像中,依据亮斑的预期大小设置k1=k2=3;在另一个示例中,设置k1=k2=5。
在一个示例中,候选亮斑的判定需要满足的条件包括b),在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值,并且该像素点矩阵的连通像素大于2/3*k1*k2,即中心像素点的像素值大于临界值且连通像素大于矩阵的三分之二。这里,相邻的像素值都为第二预设值的两个或多个像素为所称的相连像素/连通像素(pixel connectivity),例如,简化图像为二值化图像,第一预设值为0,第二预设值为1,如图4所示,加粗加大的表示所称的像素点矩阵的中心,粗线框表示像素点矩阵3*3,即k1=k2=3,该矩阵的中心像素点的像素值为1,连通像素为4,小于2/3*k1*k2=6,该像素点矩阵不满足条件b),非候选亮斑。
在一个示例中,候选亮斑的判定需要满足的条件包括c),在预处理图像中,g2为修正后的m1*m2范围的像素,即为修正后的m1*m2范围像素总和。在一个例子中,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正,例如,如图5所示,m1=m2=5,所称的简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例为13/25(13个“1”),修正后的g2为原来的13/25。如此,利于更准确的检测识别亮斑,利于后续亮斑信息的分析读取。
在一些示例中,所称的判定候选亮斑是否为亮斑还包括:基于预处理后的图像确定第二亮斑检测阈值,以及判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。在具体示例中,以候选亮斑的坐标所在的像素点的像素值作为该候选亮斑的像素值。通过利用基于预处理后的图像确定的第二亮斑检测阈值对候选亮斑的进一步筛选,能够排除掉至少一部分更可能是图像背景但亮度(强度)和/或形状表现为“亮斑”的亮斑,利于后续基于亮斑的序列的准确识别,提高下机数据的质量。
在一个示例中,可利用重心法获取候选亮斑的坐标,包括亚像素级坐标。利用双线性插值法计算候选亮斑的坐标位置的灰度值。
在某些具体示例中,判定候选亮斑是否为亮斑包括:将预处理后的图像划分为预定大小的一组区域(block),对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值;对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。如此,区分图像的不同区域的差异比如光强的整体落差,分开进行亮斑的进一步检测识别,利于准确识别亮斑并且获得更多的亮斑。
所称的将预处理后的图像划分为预定大小的一组区域(block),block之间可以有重叠也可以没有重叠。在一个示例中,block之间没有重叠。在一些实施例中,预处理后的图像的大小不小于512*512,例如为512*512、1024*1024、1800*1800或者2056*2056等,所称预定大小的区域可以设为为200*200。如此,利于快速计算判断识别亮斑。
在一些实施例中,确定该区域对应的第二亮斑检测阈值时,对每个block中的像素点的像素值按大小进行升序排列,取p10+(p10-p1)*4.1作为该block对应的第二亮斑检测阈值,即该block的背景,p1表示第百分之一分位的像素值,p10表示第百分之十分位的像素值。该阈值是发明人通过大量数据训练测试得出的较为稳定的阈值,能够消除大量背景上的亮斑。可以理解地,当光学系统调整,图像整体像素分布发生改变时,此阈值可能需要适当调整。图6为进行该处理之前和之后的亮斑检测结果对比示意 图,即排除掉区域背景前后的亮斑检测结果示意图,图6的上半部分为作该处理后的亮斑检测结果、下半部分为不作该处理的亮斑检测结果,十字标记的为候选亮斑或亮斑。
本发明的实施方式还提供一种碱基识别方法,包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述任一实施例中的基于图像构建测序模板的方法获得。
上述对任一实施方式中的基于图像构建测序模板的方法的技术特征和优点的描述,同样适用本发明这一实施方式中的碱基识别方法,在此不再赘述。
具体地,可以利用遍历的方式将获自碱基延伸反应的图像上的亮斑与构建的亮斑集合进行匹配。在某些具体实施方式中,对应测序模板的亮斑集合中存在与获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定获自碱基延伸反应的图像上的该亮斑匹配上对应测序模板的亮斑集合。在一个示例中,所称的第三预定像素为2。如此,能够实现碱基的准确识别,获得模板的部分碱基序列(读段)。
上述在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
本发明的实施方式还提供一种基于图像构建测序模板的装置100,如图7所示,用于实施上述本发明任一实施例中的基于图像构建测序模板的方法,所称的图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,该装置100包括:合并单元110,用于合并第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应测序模板的亮斑集合。上述对本发明任一实施例中的基于图像构建测序模板的方法的技术特征和优点的描述,同样适用本发明这一实施方式中的装置100,在此不再赘述。
例如,在合并单元110中,合并第一图像、第二图像、第三图像和第四图像上的亮斑,包括:(a)合并图像N1上的亮斑至图像M1中,获得一次合并图像M1,对于一次合并图像M1中的重合亮斑依据重合亮斑包含的亮斑的数目进行计数标记,对于非重合亮斑记为1,在一次合并图像M1中的距离小于第一预定像素的多个亮斑为一个重合亮斑;(b)以图像P1、图像Q1、图像M2、图像N2、图像P2或 图像Q2替代图像N1,以一次合并图像M1替代图像M1,多次进行(a)直至完成所有图像上的亮斑的合并,获得原始亮斑集合;(c)去除原始亮斑集合中的标记为1的亮斑,以获得对应测序模板的亮斑集合。
在一些示例中,图像为经过配准的图像。
在一些示例中,还包括配准单元108,利用配准单元进行图像配准,包括用于:基于参考图像对待配准图像进行第一配准,参考图像和待配准图像对应相同视野,包括,确定待配准图像上的预定区域和参考图像上的相应预定区域的第一偏移量,基于第一偏移量移动待配准图像上的所有亮斑,获得第一配准后的待配准图像;基于参考图像对第一配准后的待配准图像进行第二配准,包括,合并第一配准后的待配准图像和参考图像,获得合并图像,计算合并图像上的预定区域的所有第二重合亮斑的偏移量,以确定第二偏移量,在合并图像上的距离小于第二预定像素的多个亮斑为一个第二重合亮斑,基于该第二偏移量移动第一配准后的待配准图像上的所有亮斑,以实现对待配准图像的配准。
在一些示例中,参考图像通过构建获得,配准单元108还包括参考图像构建模块,利用参考图像构建模块构建参考图像包括:获取第五图像和第六图像,第五图像和第六图像与待配准图像对应相同视野;
基于第五图像对第六图像进行粗配准,包括确定第六图像和第五图像的偏移量,基于该偏移量移动第六图像,获得粗配准后的第六图像;合并第五图像和粗配准后的第六图像,以获得参考图像。
在一些示例中,在参考图像构建模块中,构建参考图像还包括利用第七图像和第八图像,待配准图像、第五图像、第六图像、第七图像和第八图像来自测序反应的相同视野,第五图像、第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的视野,构建参考图像还包括:基于第五图像对第七图像进行粗配准,包括确定第七图像和第五图像的偏移量,基于该偏移量移动第七图像,获得粗配准后的第七图像;基于第五图像对第八图像进行粗配准,包括确定第八图像和第五图像的偏移量,基于该偏移量移动第八图像,获得粗配准后的第八图像;合并第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得参考图像。
在一些示例中,参考图像和待配准图像为二值化图像。
在一些示例中,利用二维离散傅里叶变换确定第一偏移量、第六图像和第五图像的偏移量、第七图像和第五图像的偏移量和/或第八图像和第五图像的偏移量。
在一些示例中,还包括亮斑检测单元106,亮斑检测单元106用于:预处理图像,获得预处理后的图像;确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;基于预处理后的图像确定第一亮斑检测阈值c1;基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为k1*k2,k1和k2均为大于1的奇数,k1*k2像素点矩阵包含k1*k2个像素点,b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于2/3*k1*k2,以及c)在预处理后的图像中的像素点矩阵的中心像素点的像素值大于第三预设值,并且满足g1*g2>c1,g1为以像素点矩阵的中心像素点为中心的m1*m2范围的二维高斯分布的相关系数,g2为该m1*m2范围的像素,m1和m2均为大于1的奇数,m1*m2范围包含m1*m2个像素点。
在一些示例中,亮斑检测单元106还包括用于判定候选亮斑是否为亮斑,包括:基于预处理后的图像确定第二亮斑检测阈值,以及判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。
在一些示例中,候选亮斑的像素值为该候选亮斑的坐标所在的像素点的像素值。
在一些示例中,在亮斑检测单元106中判定候选亮斑是否为亮斑包括:将预处理后的图像划分为预定大小的一组区域,对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值,对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。
在一些示例中,在亮斑检测单元106中预处理图像,包括:利用开运算确定图像的背景,基于背景,利用顶帽运算将图像转化为第一图像,对第一图像进行高斯模糊处理,获得第二图像,对第二图像进行锐化,获得预处理后的图像。
在一些示例中,在亮斑检测单元106中确定临界值以简化预处理后的图像,获得简化图像,包括:基于背景和预处理后的图像,确定临界值,比较预处理后的图像上的像素点的像素值与临界值,以获得简化图像。
在一些示例中,g2为修正后的m1*m2范围的像素,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正。
本发明的实施方式还提供一种碱基识别装置1000,该装置用以实现上述本发明任一具体实施方式中的碱基识别方法,该装置1000用于将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述任一实施例中的基于图像构建测序模板的方法和/或基于图像构建测序模板的装置构建。
具体地,在碱基识别装置1000中,对应测序模板的亮斑集合中存在与获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定获自碱基延伸反应的图像上的该亮斑匹配上对应测序模板的亮斑集合。
依据本发明的实施方式,还提供一种计算机程序产品,该产品包括实现基于图像构建测序模板的指令,指令在计算机执行程序时,使计算机执行上述本发明任一具体实施方式中的基于图像构建测序模板的方法。
依据本发明的实施方式,还提供另一种计算机程序产品,该产品包括实现碱基识别的指令,指令在计算机执行程序时,使计算机执行上述本发明任一具体实施方式中的碱基识别方法。
本领域技术人员知晓,除了以纯计算机可读程序代码方式实现控制器/处理器外,完全可以通过将方法步骤进行逻辑变成来使得控制器以逻辑门、开关、专用集成电路、可编辑逻辑控制器和嵌入微控制器等的形式来实现相同的功能。因此,这种控制器/处理器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的的软件模块又可以是硬件部件内的结构。
在本说明书的描述中,一个实施方式、一些实施方式、一个或一些具体实施方式、一个或一些实施例、示例等的描述意指结合该实施方式或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。
在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构等特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (36)

  1. 一种基于图像构建测序模板的方法,其特征在于,所述图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分所述核酸分子在所述图像上表现为亮斑,所述第一图像包括图像M1和图像M2,所述第二图像包括图像N1和图像N2,所述第三图像包括图像P1和图像P2,所述第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,
    图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,所述方法包括:
    合并所述第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应所述测序模板的亮斑集合。
  2. 权利要求1的方法,其特征在于,所述合并所述第一图像、第二图像、第三图像和第四图像上的亮斑,包括:
    (a)合并图像N1上的亮斑至图像M1中,获得一次合并图像M1,对于一次合并图像M1中的重合亮斑依据重合亮斑包含的亮斑的数目进行计数标记,对于非重合亮斑记为1,在所述一次合并图像M1中的距离小于第一预定像素的多个亮斑为一个所述重合亮斑;
    (b)以图像P1、图像Q1、图像M2、图像N2、图像P2或图像Q2替代所述图像N1,以一次合并图像M1替代所述图像M1,多次进行(a)直至完成所有图像上的亮斑的合并,获得原始亮斑集合;
    (c)去除所述原始亮斑集合中的标记为1的亮斑,以获得所述对应测序模板的亮斑集合。
  3. 权利要求1或2的方法,其特征在于,所述图像为经过配准的图像。
  4. 权利要求3的方法,其特征在于,配准所述图像,包括:
    基于参考图像对待配准图像进行第一配准,所述参考图像和所述待配准图像对应相同视野,包括,
    确定所述待配准图像上的预定区域和所述参考图像上的相应预定区域的第一偏移量,基于所述第一偏移量移动所述待配准图像上的所有亮斑,获得第一配准后的待配准图像;
    基于所述参考图像对第一配准后的待配准图像进行第二配准,包括,
    合并所述第一配准后的待配准图像和所述参考图像,获得合并图像,
    计算所述合并图像上的预定区域的所有第二重合亮斑的偏移量,以确定第二偏移量,在所述合并图像上的距离小于第二预定像素的多个亮斑为一个所述第二重合亮斑,
    基于该第二偏移量移动所述第一配准后的待配准图像上的所有亮斑,以实现对所述待配准图像的配准。
  5. 权利要求4的方法,其特征在于,所述参考图像通过构建获得,构建所述参考图像包括:
    获取第五图像和第六图像,所述第五图像和所述第六图像与所述待配准图像对应相同视野;
    基于第五图像对第六图像进行粗配准,包括确定所述第六图像和所述第五图像的偏移量,基于该偏移量移动所述第六图像,获得粗配准后的第六图像;
    合并所述第五图像和粗配准后的第六图像,以获得所述参考图像。
  6. 权利要求5的方法,其特征在于,构建所述参考图像还包括利用第七图像和第八图像,所述待配准图像、第五图像、第六图像、第七图像和第八图像来自测序反应的相同视野,所述第五图像、 第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的所述视野,构建所述参考图像还包括:
    基于第五图像对第七图像进行粗配准,包括确定所述第七图像和所述第五图像的偏移量,基于该偏移量移动所述第七图像,获得粗配准后的第七图像;
    基于第五图像对第八图像进行粗配准,包括确定所述第八图像和所述第五图像的偏移量,基于该偏移量移动所述第八图像,获得粗配准后的第八图像;
    合并所述第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得所述参考图像。
  7. 权利要求4-6任一方法,其特征在于,所述参考图像和所述待配准图像为二值化图像。
  8. 权利要求4-7任一方法,其特征在于,利用二维离散傅里叶变换确定所述第一偏移量、所述第六图像和所述第五图像的偏移量、所述第七图像和所述第五图像的偏移量和/或所述第八图像和所述第五图像的偏移量。
  9. 权利要求1-8任一方法,其特征在于,还包括检测图像上的亮斑,包括:
    预处理图像,获得预处理后的图像;
    确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;
    基于预处理后的图像确定第一亮斑检测阈值c1;
    基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,
    a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为k1*k2,k1和k2均为大于1的奇数,k1*k2像素点矩阵包含k1*k2个像素点,
    b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于2/3*k1*k2,以及
    c)在预处理后的图像中的像素点矩阵的中心像素点的像素值大于第三预设值,并且满足g1*g2>c1,g1为以像素点矩阵的中心像素点为中心的m1*m2范围的二维高斯分布的相关系数,g2为该m1*m2范围的像素,m1和m2均为大于1的奇数,m1*m2范围包含m1*m2个像素点。
  10. 权利要求9的方法,其特征在于,还包括判定候选亮斑是否为亮斑,包括:
    基于预处理后的图像确定第二亮斑检测阈值,以及
    判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。
  11. 权利要求10的方法,其特征在于,候选亮斑的像素值为该候选亮斑的坐标所在的像素点的像素值。
  12. 权利要求10或11的方法,其特征在于,判定候选亮斑是否为亮斑包括:
    将预处理后的图像划分为预定大小的一组区域,
    对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值,
    对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。
  13. 权利要求9-12任一方法,其特征在于,预处理图像,包括:
    利用开运算确定图像的背景,
    基于背景,利用顶帽运算将图像转化为第一图像,
    对第一图像进行高斯模糊处理,获得第二图像,
    对第二图像进行锐化,获得预处理后的图像。
  14. 权利要求13的方法,其特征在于,确定临界值以简化预处理后的图像,获得简化图像,包括:
    基于背景和预处理后的图像,确定临界值,
    比较预处理后的图像上的像素点的像素值与临界值,以获得简化图像。
  15. 权利要求9-14任一方法,其特征在于,g2为修正后的m1*m2范围的像素,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正。
  16. 一种碱基识别方法,其特征在于,包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行所述碱基识别,所述获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分所述核酸分子在所述获自碱基延伸反应的图像上表现为亮斑,所述对应测序模板的亮斑集合通过权利要求1-15任一方法构建。
  17. 权利要求16的方法,其特征在于,所述对应测序模板的亮斑集合中存在与所述获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定所述获自碱基延伸反应的图像上的该亮斑匹配上所述对应测序模板的亮斑集合。
  18. 一种基于图像构建测序模板的装置,其特征在于,所述图像包括分别对应A/U、T、G和C四种类型碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野具有多个带有光学可检测标记的核酸分子,至少一部分所述核酸分子在所述图像上表现为亮斑,所述第一图像包括图像M1和图像M2,所述第二图像包括图像N1和图像N2,所述第三图像包括图像P1和图像P2,所述第四图像包括图像Q1和图像Q2,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,
    图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,所述装置包括:
    合并单元,用于合并所述第一图像、第二图像、第三图像和第四图像上的亮斑,记录相同位置上的亮斑的数目,去除数目为1的亮斑,以获得对应所述测序模板的亮斑集合。
  19. 权利要求18的装置,其特征在于,在所述合并单元中,合并所述第一图像、第二图像、第三图像和第四图像上的亮斑,包括:
    (a)合并图像N1上的亮斑至图像M1中,获得一次合并图像M1,对于一次合并图像M1中的重合亮斑依据重合亮斑包含的亮斑的数目进行计数标记,对于非重合亮斑记为1,在所述一次合并图像M1中的距离小于第一预定像素的多个亮斑为一个所述重合亮斑;
    (b)以图像P1、图像Q1、图像M2、图像N2、图像P2或图像Q2替代所述图像N1,以一次合并图像M1替代所述图像M1,多次进行(a)直至完成所有图像上的亮斑的合并,获得原始亮斑集合;
    (c)去除所述原始亮斑集合中的标记为1的亮斑,以获得所述对应测序模板的亮斑集合。
  20. 权利要求18或19的装置,其特征在于,所述图像为经过配准的图像。
  21. 权利要求20的装置,其特征在于,还包括配准单元,利用所述配准单元进行图像配准,包括用于:
    基于参考图像对待配准图像进行第一配准,所述参考图像和所述待配准图像对应相同视野,包括,
    确定所述待配准图像上的预定区域和所述参考图像上的相应预定区域的第一偏移量,基于所述第一偏移量移动所述待配准图像上的所有亮斑,获得第一配准后的待配准图像;
    基于所述参考图像对第一配准后的待配准图像进行第二配准,包括,
    合并所述第一配准后的待配准图像和所述参考图像,获得合并图像,
    计算所述合并图像上的预定区域的所有第二重合亮斑的偏移量,以确定第二偏移量,在所述合并图像上的距离小于第二预定像素的多个亮斑为一个所述第二重合亮斑,
    基于该第二偏移量移动所述第一配准后的待配准图像上的所有亮斑,以实现对所述待配准图像的配准。
  22. 权利要求21的装置,其特征在于,所述参考图像通过构建获得,所述配准单元还包括参考图像构建模块,利用所述参考图像构建模块构建参考图像包括:
    获取第五图像和第六图像,所述第五图像和所述第六图像与所述待配准图像对应相同视野;
    基于第五图像对第六图像进行粗配准,包括确定所述第六图像和所述第五图像的偏移量,基于该偏移量移动所述第六图像,获得粗配准后的第六图像;
    合并所述第五图像和粗配准后的第六图像,以获得所述参考图像。
  23. 权利要求22的装置,其特征在于,在所述参考图像构建模块中,构建所述参考图像还包括利用第七图像和第八图像,所述待配准图像、第五图像、第六图像、第七图像和第八图像来自测序反应的相同视野,所述第五图像、第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的所述视野,构建所述参考图像还包括:
    基于第五图像对第七图像进行粗配准,包括确定所述第七图像和所述第五图像的偏移量,基于该偏移量移动所述第七图像,获得粗配准后的第七图像;
    基于第五图像对第八图像进行粗配准,包括确定所述第八图像和所述第五图像的偏移量,基于该偏移量移动所述第八图像,获得粗配准后的第八图像;
    合并所述第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得所述参考图像。
  24. 权利要求21-23任一装置,其特征在于,所述参考图像和所述待配准图像为二值化图像。
  25. 权利要求21-24任一装置,其特征在于,利用二维离散傅里叶变换确定所述第一偏移量、所述第六图像和所述第五图像的偏移量、所述第七图像和所述第五图像的偏移量和/或所述第八图像和所述第五图像的偏移量。
  26. 权利要求18-25任一装置,其特征在于,还包括亮斑检测单元,所述亮斑检测单元用于:
    预处理图像,获得预处理后的图像;
    确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;
    基于预处理后的图像确定第一亮斑检测阈值c1;
    基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,
    a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为k1*k2,k1和k2均为大于1的奇数,k1*k2像素点矩阵包含k1*k2个像素点,
    b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于2/3*k1*k2,以及
    c)在预处理后的图像中的像素点矩阵的中心像素点的像素值大于第三预设值,并且满足g1*g2>c1,g1为以像素点矩阵的中心像素点为中心的m1*m2范围的二维高斯分布的相关系数,g2为该m1*m2范围的像素,m1和m2均为大于1的奇数,m1*m2范围包含m1*m2个像素点。
  27. 权利要求26的装置,其特征在于,所述亮斑检测单元还包括用于判定候选亮斑是否为亮斑,包括:
    基于预处理后的图像确定第二亮斑检测阈值,以及
    判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。
  28. 权利要求27的装置,其特征在于,候选亮斑的像素值为该候选亮斑的坐标所在的像素点的像素值。
  29. 权利要求27或28的装置,其特征在于,在所述亮斑检测单元中判定候选亮斑是否为亮斑包括:
    将预处理后的图像划分为预定大小的一组区域,
    对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值,
    对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。
  30. 权利要求26-29任一装置,其特征在于,在所述亮斑检测单元中预处理图像,包括:
    利用开运算确定图像的背景,
    基于背景,利用顶帽运算将图像转化为第一图像,
    对第一图像进行高斯模糊处理,获得第二图像,
    对第二图像进行锐化,获得预处理后的图像。
  31. 权利要求26的装置,其特征在于,在所述亮斑检测单元中确定临界值以简化预处理后的图像,获得简化图像,包括:
    基于背景和预处理后的图像,确定临界值,
    比较预处理后的图像上的像素点的像素值与临界值,以获得简化图像。
  32. 权利要求26-31任一装置,其特征在于,g2为修正后的m1*m2范围的像素,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正。
  33. 一种碱基识别装置,其特征在于,包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行所述碱基识别,所述获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分所述核酸分子在所述获自碱基延伸反应的图像上表现为亮斑,所述对应测序模板的亮斑集合通过权利要求26-32任一装置构建。
  34. 权利要33的装置,其特征在于,所述对应测序模板的亮斑集合中存在与所述获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定所述获自碱基延伸反应的图像上的该亮斑匹配上所述对应测序模板的亮斑集合。
  35. 一种计算机程序产品,包括指令,所述指令在所述计算机执行所述程序时,使所述计算机执行权利要求1-15任一方法。
  36. 一种计算机程序产品,包括指令,所述指令在所述计算机执行所述程序时,使所述计算机执行权利要求16或17的方法。
PCT/CN2018/101816 2018-08-22 2018-08-22 基于图像构建测序模板的方法、装置和计算机程序产品 WO2020037571A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/101816 WO2020037571A1 (zh) 2018-08-22 2018-08-22 基于图像构建测序模板的方法、装置和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/101816 WO2020037571A1 (zh) 2018-08-22 2018-08-22 基于图像构建测序模板的方法、装置和计算机程序产品

Publications (1)

Publication Number Publication Date
WO2020037571A1 true WO2020037571A1 (zh) 2020-02-27

Family

ID=69592155

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/101816 WO2020037571A1 (zh) 2018-08-22 2018-08-22 基于图像构建测序模板的方法、装置和计算机程序产品

Country Status (1)

Country Link
WO (1) WO2020037571A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023246091A1 (zh) * 2022-06-20 2023-12-28 深圳赛陆医疗科技有限公司 图像配准和模板构建方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321535A (zh) * 2011-09-01 2012-01-18 盛司潼 一种对生物样品处理及测序进行自动化控制的方法及系统
US20170044599A1 (en) * 2014-04-24 2017-02-16 Diassess Inc. Colorimetric Detection of Nucleic Acid Amplification
CN106434856A (zh) * 2015-08-06 2017-02-22 深圳华大基因研究院 一种测序仪运行测试的方法
CN108034699A (zh) * 2017-11-22 2018-05-15 深圳市瀚海基因生物科技有限公司 一种检测核苷酸特异性和/或非特异性吸附的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321535A (zh) * 2011-09-01 2012-01-18 盛司潼 一种对生物样品处理及测序进行自动化控制的方法及系统
US20170044599A1 (en) * 2014-04-24 2017-02-16 Diassess Inc. Colorimetric Detection of Nucleic Acid Amplification
CN106434856A (zh) * 2015-08-06 2017-02-22 深圳华大基因研究院 一种测序仪运行测试的方法
CN108034699A (zh) * 2017-11-22 2018-05-15 深圳市瀚海基因生物科技有限公司 一种检测核苷酸特异性和/或非特异性吸附的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023246091A1 (zh) * 2022-06-20 2023-12-28 深圳赛陆医疗科技有限公司 图像配准和模板构建方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
WO2021030952A1 (zh) 碱基识别方法、系统、计算机程序产品和测序系统
CN107945150B (zh) 基因测序的图像处理方法及系统及计算机可读存储介质
WO2020037573A1 (zh) 检测图像上的亮斑的方法、装置和计算机程序产品
WO2020037572A1 (zh) 检测图像上的亮斑的方法和装置、图像配准方法和装置
EP3306566B1 (en) Method and system for processing image
US20080056610A1 (en) Image Processor, Microscope System, and Area Specifying Program
JP6791245B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US20100034444A1 (en) Image analysis
CN112289377B (zh) 检测图像上的亮斑的方法、装置和计算机程序产品
CN112289381B (zh) 基于图像构建测序模板的方法、装置和计算机产品
CN110246139B (zh) 基于双阈值的浮游生物原位图像roi快速提取方法
WO2020037571A1 (zh) 基于图像构建测序模板的方法、装置和计算机程序产品
Marcuzzo et al. Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging
WO2020037574A1 (zh) 基于图像构建测序模板的方法、碱基识别方法和装置
WO2020037570A1 (zh) 图像配准方法、装置和计算机程序产品
US8824768B1 (en) Fertilization test method and apparatus
CN112285070B (zh) 检测图像上的亮斑的方法和装置、图像配准方法和装置
CN112288783B (zh) 基于图像构建测序模板的方法、碱基识别方法和装置
CN110031471B (zh) 大口径光学元件表面缺陷增长分析方法、系统、装置
Marcuzzo et al. Automatic cell segmentation from confocal microscopy images of the Arabidopsis root
CN112288781A (zh) 图像配准方法、装置和计算机程序产品
Liu et al. Medical image segmentation and retrieval via deformable models
Marcuzzo et al. A hybrid approach for Arabidopsis root cell image segmentation
CN110120118A (zh) 一种拼接币的识别系统
CN112183210A (zh) 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18930741

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18930741

Country of ref document: EP

Kind code of ref document: A1