CN110021354B - 用于测序的曝光方法、测序方法及装置和存储介质 - Google Patents

用于测序的曝光方法、测序方法及装置和存储介质 Download PDF

Info

Publication number
CN110021354B
CN110021354B CN201710633419.4A CN201710633419A CN110021354B CN 110021354 B CN110021354 B CN 110021354B CN 201710633419 A CN201710633419 A CN 201710633419A CN 110021354 B CN110021354 B CN 110021354B
Authority
CN
China
Prior art keywords
sequencing
exposure time
cycle
exposure
exp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710633419.4A
Other languages
English (en)
Other versions
CN110021354A (zh
Inventor
马可心
李计广
章文蔚
刘二凯
王静静
尹素琴
陈奥
徐崇钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MGI Tech Co Ltd
Complete Genomics Inc
Original Assignee
MGI Tech Co Ltd
Complete Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MGI Tech Co Ltd, Complete Genomics Inc filed Critical MGI Tech Co Ltd
Priority to CN201710633419.4A priority Critical patent/CN110021354B/zh
Publication of CN110021354A publication Critical patent/CN110021354A/zh
Application granted granted Critical
Publication of CN110021354B publication Critical patent/CN110021354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Signal Processing (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种用于测序的曝光方法、测序方法及装置和存储介质。本发明的曝光方法,包括在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。本发明解决了曝光时间过高或过低引起的问题,可以较好地平衡曝光带来的利与弊,适用于长读长的测序,在测序前期保证测序质量不会下降较多,也为测序后期留有充分的余地,保障整体测序水平,解决测序前期对测序后期以及整体测序的影响。

Description

用于测序的曝光方法、测序方法及装置和存储介质
技术领域
本发明涉及测序技术领域,具体涉及一种用于测序的曝光方法、测序方法及装置和存储介质。
背景技术
对于二代测序技术而言,费用更低、通量更高、速度更快是其主要优点,但是读长相对较短是二代测序的主要缺点。二代测序速度不断成倍翻番,但是数据处理成了二代测序主要的瓶颈。短读长测序平台虽然能快速给出庞大的数据片段,但是要给出确定的装配结论,实际的数据处理比测序要困难许多。因此,长读长就显得尤为重要,但是长读长测序是一个非常大的挑战,想要获得一个准确的长读长测序结果是非常困难的。
在测序过程中,随着测序读长的不断提高,待测序的DNA链会由于化学试剂、光学系统拍照以及自然的损伤等因素遭到不同程度的破坏,其中光学系统拍照的破坏是一个比较重要的因素。因此,为了能够让测序顺利进行,采集图像过程中选择的曝光时间就显得尤为重要。理论上,针对双端测序,一链的曝光会影响一链的结果、二链的结果以及整体的结果,二链的曝光会影响二链的结果和整体的结果;针对单端测序,其曝光时间将直接影响该测序结果的好坏。
在二代测序过程中,采集图像是获得测序信息的一个关键步骤,能否获得更加准确的测序结果是基于图像采集,因此就涉及到采集过程中的曝光时间,过低的曝光时间在图像采集初期也许并不会影响图像质量,但是后期将不易采集较为清晰的图像,无法准确地得到正确的碱基序列,为测序的准确性带来阻碍;但是,如果为得到较好的结果而盲目地提高曝光时间,虽然有时在短读长时可以得到质量较好的数据,但是从长远来看对于长读长的测序带来一定的弊端,因为过度的曝光会对核酸序列造成不可逆的伤害,使其不能够维持其特有的结构特征完成测序,造成整体测序的失败。
虽然针对目前的测序读长,现有技术中的不同曝光模式能够取得较好的效果,但是这种曝光模式在进行更长读长测序时,就会出现不乐观的结果:在测序后期出现严重的荧光信号偏低、质量值变差、错误率升高等现象,对整体测序结果带来巨大影响,导致整体测序结果极不理想。因此,为长读长的测序找寻一种新的曝光方法迫在眉睫。
发明内容
本发明提供一种用于测序的曝光方法、测序方法及装置和存储介质,解决了曝光时间过高或过低引起的问题,可以较好地平衡曝光带来的利与弊,适用于长读长的测序,在测序前期保证测序质量不会下降较多,也为测序后期留有充分的余地,保障整体测序水平,解决测序前期对测序后期以及整体测序的影响。
根据第一方面,一种实施例中提供一种用于测序的曝光方法,包括在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
进一步地,上述方法按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
根据第二方面,一种实施例中提供一种测序方法,包括图像采集过程,在上述图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
进一步地,上述方法按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
根据第三方面,一种实施例中提供一种用于测序的曝光装置,在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
进一步地,按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
根据第四方面,一种实施例中提供一种测序装置,包括曝光装置,上述曝光装置在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
进一步地,上述曝光装置按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
根据第五方面,一种实施例中提供一种用于测序的曝光装置,包括:
存储器,用于存储程序;
处理器,用于通过执行上述存储器存储的程序以实现如第一方面的方法。
根据第六方面,一种实施例中提供一种计算机可读存储介质,包括程序,上述程序能够被处理器执行以实现如第一方面的方法。
本发明采用梯度曝光方式,解决了在测序过程中由于曝光时间过高或过低引起的问题,可以较好的平衡曝光带来的利与弊,尽可能得到更加准确的测序结果。本发明的曝光设计方法既保证前一段测序质量,又把前一段的曝光时间对后一段的影响降低至最小,使整个测序得到较为理想的结果,较为适合应对长读长的高难度挑战。
附图说明
图1为本发明一实施例中不同曝光时间对测序数据量的比对情况;
图2为本发明一实施例中不同曝光时间对有效核酸序列数比率的影响;
图3为本发明一实施例中曝光时间与测序质量值的关系;
图4为本发明一实施例中曝光时间与测序错误率的关系;
图5为本发明另一实施例中不同曝光时间对测序数据量的比对情况;
图6为本发明另一实施例中不同曝光时间对有效核酸序列数比率的影响;
图7为本发明另一实施例中曝光时间与测序质量值的关系;
图8为本发明另一实施例中曝光时间与测序错误率的关系。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本发明相关的一些操作并没有在说明书中显示或者描述,这是为了避免本发明的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
本发明一种实施例中提供一种用于测序的曝光方法,包括在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
理论上,曝光时间低于10ms则无法成像,高于140ms则对DNA损伤很大,无法继续进行完整测序。因此,曝光时间在从10ms至140ms范围内选择。
在本发明实施例中,曝光时间的梯度增加可以按照各种不同的梯度形式进行。例如,一种方式是,每一个循环比前一个循环增加一个固定量的时间,比如0.5ms。另一种方式是,按照指数形式对曝光时间进行梯度增加。
本发明实施例提供一种最佳的曝光时间的梯度增加方式,按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
按照上述公式确定每一当前循环的曝光时间,既保证测序前期的测序质量,又将测序前期的曝光时间对后期的影响降低至最小,从而使整体测序达到最好。
考虑到如果按照线性函数计算出曝光时间,则其增长速度过快,使其无法平稳增加或递减,因此采用指数函数即公式中的Exp,即以自然常数e为底的指数函数。函数方法确定后,需要设定起始曝光时间(大于10ms的某一个值)和终止曝光时间(小于140ms的某一个值),以此来限定在一个合适的曝光范围内,使其能够达到明显的效果。因此,公式中常数A表示第一曝光时间常数,决定起始曝光时间的大小;常数B表示第二曝光时间常数,与常数A一起决定终止曝光时间的大小。指数函数会由于其指数的不同而呈现出不同的增长速度,因此需要设置一个可以控制曝光时间缓慢平稳增加的系数C,即曝光时间控制系数。根据指数函数的特点,Exp(C·cycle#/N-D)是一个从大于0小于1的某个值(比如0.01)逐渐增加到接近1(比如0.99)的过程,所以需要设置一个常数保证整个函数可以归一化,即曝光时间归一化系数D。确定好曝光时间的范围和速度后,就要控制每个当前循环的曝光数与总循环数的函数关系,公式中cycle#指当前测序循环数,常数N指测序总循环数(比如200)。使用该公式时,已知测序总循环数N,根据要控制的起始曝光时间和终止曝光时间设置常数A、B和C,即可根据cycle#计算出每个当前循环的曝光时间。
在本发明实施例中,A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。在本发明一个实施例中,采用单端测序,随着测序循环的进行,曝光时间从22ms梯度增加到100ms,在另一个实施例中,随着测序循环的进行,曝光时间从34ms梯度增加到100ms。在本发明的其它实施例中,采用双端测序,一链曝光时间从43ms梯度增加到53ms,二链曝光时间从50ms梯度增加到82ms;在另一个实施例中,一链曝光时间从36ms梯度增加到47ms,二链曝光时间从50ms梯度增加到82ms。常数C可以取2~3范围内的任意数值,例如2.1、2.5、2.8等。
在本发明实施例的用于测序的曝光方法的基础上,本发明实施例还提供一种测序方法,包括图像采集过程,在上述图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
本发明的测序方法可以是单端测序或双端测序方法,可以是任何使用光学系统曝光的测序平台,包括但不限于Illumina的Solexa平台、罗氏的454平台、ABI的SoLID平台、Life的Ion torrent平台以及BGI的CG平台等。
在本发明的最佳实施例中,按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
相应地,本发明实施例还提供一种用于测序的曝光装置,在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
在本发明的最佳实施例中,按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
相应地,本发明实施例还提供一种测序装置,包括曝光装置,上述曝光装置在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光。
在本发明的最佳实施例中,按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数;A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
因此,本发明一种实施例中提供一种用于测序的曝光装置,包括:存储器,用于存储程序;处理器,用于通过执行上述存储器存储的程序以实现如上实施例中的用于测序的曝光方法。
本发明一种实施例中提供一种计算机可读存储介质,包括程序,上述程序能够被处理器执行以实现如上实施例中的用于测序的曝光方法。
本发明采用梯度曝光方式,解决了在测序过程中由于曝光时间过高或过低引起的问题,可以较好的平衡曝光带来的利与弊,尽可能得到更加准确的测序结果。本发明的曝光设计方法既保证前一段测序质量,又把前一段的曝光时间对后一段的影响降低至最小,使整个测序得到较为理想的结果,较为适合应对长读长的高难度挑战。
以下通过实施例详细说明本发明的技术方案,应当理解,以下实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例1
本实施例基于华大基因的测序仪BGISEQ-500RS平台;使用的试剂来源于该测序仪配套使用的建库试剂盒以及单端上机测序试剂盒;使用的验证样本来源于大肠杆菌;在验证过程中用到的测序仪、试剂操作等过程参照该平台的使用方法;以SE200测序为例,进行梯度曝光时间的设计范围是10~140ms。
本实施例设计三组曝光时间进行对比:
第一组:保持整体曝光时间维持在100ms,即维持恒定曝光时间。
第二组:按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=30,B=70,C=3,D=3,N=200,使曝光时间从34ms梯度变化到100ms,即设定在设计范围内的曝光时间变化。
第三组:按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=10,B=90,C=2,D=2,N=200,使曝光时间从22ms梯度变化到100ms,即设定在设计范围内的曝光时间变化。
在测序开始前,将以上设计的曝光时间拷贝到Excel表格中,安装到BGISEQ-500RS曝光文件所在位置使用即可。
图1示出了本实施例中不同曝光时间对测序数据量的比对情况。横坐标是不同的曝光时间,纵坐标代表测序结果可比对到标准序列的数据量,在一定程度上可以代表测序结果的好坏程度。结果显示,第二、三组数据即根据本发明实施例的方法设置的曝光时间,可以得到比第一组100ms单一曝光的数据量多,证明梯度曝光方法比单一曝光会产生更好的效果。
图2示出了本实施例中不同曝光时间对有效核酸序列数比率的影响。横坐标是不同的曝光时间,纵坐标代表有效核酸序列数比率,该指标在一定程度上可以展示出此次测序结果的数据情况。结果显示,第二、三组数据即根据本发明实施例的方法设置的曝光时间,可以得到比第一组100ms单一曝光的有效核酸序列数比率高,证明梯度曝光方法比单一曝光会产生更好的效果。
图3示出了本实施例中曝光时间与测序质量值的关系。横坐标是不同的曝光时间,纵坐标代表测序质量值,该指标在一定程度上可以展示出此次测序结果质量情况。结果显示,第二、三组数据即根据本发明实施例的方法设置的曝光时间,可以得到比第一组100ms单一曝光的质量值高,证明梯度曝光方法比单一曝光会产生更好的效果。
图4示出了本实施例中曝光时间与测序错误率的关系。横坐标是不同的曝光时间,纵坐标代表测序错误率,该指标在一定程度上可以展示出此次测序结果的准确率。结果显示,第二、三组数据即根据本发明实施例的方法设置的曝光时间,可以得到比第一组100ms单一曝光的错误率低,证明梯度曝光方法比单一曝光会产生更好的效果。
实施例2
本实施案例是基于华大基因的测序仪BGISEQ-500RS平台;使用的试剂均来源于该测序仪配套使用的建库试剂盒以及双端测序试剂盒(以下简称PE100试剂盒);使用的验证样本来源于大肠杆菌;在验证过程中用到的测序仪、试剂操作等过程参照该平台的使用方法;本实施案例以PE100测序为例,进行梯度曝光系数的设计范围是10~130ms。
本实施例设计五组曝光时间进行对比:
第一组:按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=40.6,B=13.8,C=2,D=2,N=100,使一链曝光时间从43ms梯度增加到53ms,二链曝光时间前一段用50ms,后一段用80ms。
第二组:一链曝光时间保持在50ms,二链链曝光时间前一段用50ms,后一段用80ms。
第三组:一链曝光时间前一段使用30ms,后一段使用50ms,二链曝光时间前一段用50ms,后一段用80ms。
第四组:按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=40.6,B=13.8,C=2,D=2,N=100,使一链曝光时间从43ms梯度增加到53ms,按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=48,B=35,C=3,D=3,N=100,使二链曝光时间从50ms梯度增加到82ms。
第五组:按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=36,B=12,C=3,D=3,N=100,使一链曝光时间从36ms梯度增加到47ms,按照曝光时间(ms)=A+B·Exp(C·cycle#/N-D),其中,A=48,B=35,C=3,D=3,N=100,使二链曝光时间从50ms梯度增加到82ms。
在测序开始前,将以上设计的曝光时间拷贝到Excel表格中,安装到BGISEQ-500RS曝光文件所在位置使用即可。
图5示出了本实施例中不同曝光时间对测序数据量的比对情况。横坐标是不同的曝光系时间,其中第一行的曝光时间代表PE100测序中的一链曝光设计,第二行代表PE100测序中的二链曝光设计;纵坐标代表测序结果可比对到标准序列的情况,在一定程度上可以代表测序结果的好坏程度。结果显示,第四、五组数据即根据本发明实施例的方法设置的曝光时间,能够得到比单一曝光或只有一段梯度曝光的数据量多。
图6示出了本实施例中不同曝光时间对有效核酸序列数比率的影响。横坐标是不同的曝光时间,其中第一行的曝光时间代表PE100测序中的一链曝光设计,第二行代表PE100测序中的二链曝光设计;纵坐标代表有效核酸序列数比率,即可有效产出数据的读长占所有数据的比例,在一定程度上可以展示出此次测序结果的数据情况。结果显示,第四、五组数据即根据本发明实施例的方法设置的曝光时间,可以得到比单一曝光或只有一段梯度曝光高的有效核酸序列比对率。
图7示出了本实施例中曝光时间与测序质量值的关系。质量值即Q30指准确率可达到99.9%;横坐标是不同的曝光时间,其中第一行的曝光时间代表PE100测序中的一链曝光设计,第二行代表PE100测序中的二链曝光设计;纵坐标代表测序质量值,在一定程度上可以展示出此次测序结果的准确率。结果显示,第四、五组数据即根据本发明实施例的方法设置的曝光时间,可以得到比单一曝光或只有一段梯度曝光高的质量值。
图8示出了本实施例中曝光时间与测序错误率的关系。横坐标是不同的曝光时间,其中第一行的曝光时间代表PE100测序中的一链曝光设计,第二行代表PE100测序中的二链曝光设计;纵坐标代表测序错误率,在一定程度上可以展示出此次测序结果的准确率。结果显示,第四、五组数据即根据本发明实施例的方法设置的曝光时间,可以得到比单一曝光或只有一段梯度曝光低的错误率。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种用于测序的曝光方法,其特征在于,所述方法包括在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光;所述方法按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数。
2.根据权利要求1所述的曝光方法,其特征在于,A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
3.一种测序方法,其特征在于,所述测序方法包括图像采集过程,在所述图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光;所述方法按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数。
4.根据权利要求3所述的测序方法,其特征在于,A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
5.一种用于测序的曝光装置,其特征在于,所述曝光装置在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光;按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数。
6.根据权利要求5所述的曝光装置,其特征在于,A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
7.一种测序装置,其特征在于,所述测序装置包括曝光装置,所述曝光装置在图像采集过程中,从起始循环至终止循环,按照曝光时间从10ms至140ms范围内梯度增加的方式进行曝光;所述曝光装置按照如下公式确定每一当前循环的曝光时间:
曝光时间(ms)=A+B·Exp(C·cycle#/N-D),
其中,A表示第一曝光时间常数,B表示第二曝光时间常数,C表示曝光时间控制系数,D表示曝光时间归一化系数,cycle#表示当前测序循环数,N表示测序总循环数,Exp表示以自然常数e为底的指数函数。
8.根据权利要求7所述的测序装置,其特征在于,A>10,A+B<140,C=2~3,C≤D,0<Exp(C·cycle#/N-D)<1。
9.一种用于测序的曝光装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1或2所述的方法。
10.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1或2所述的方法。
CN201710633419.4A 2017-07-28 2017-07-28 用于测序的曝光方法、测序方法及装置和存储介质 Active CN110021354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710633419.4A CN110021354B (zh) 2017-07-28 2017-07-28 用于测序的曝光方法、测序方法及装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710633419.4A CN110021354B (zh) 2017-07-28 2017-07-28 用于测序的曝光方法、测序方法及装置和存储介质

Publications (2)

Publication Number Publication Date
CN110021354A CN110021354A (zh) 2019-07-16
CN110021354B true CN110021354B (zh) 2021-06-29

Family

ID=67186013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710633419.4A Active CN110021354B (zh) 2017-07-28 2017-07-28 用于测序的曝光方法、测序方法及装置和存储介质

Country Status (1)

Country Link
CN (1) CN110021354B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081307A (zh) * 2009-11-26 2011-06-01 上海微电子装备有限公司 光刻机曝光剂量控制方法
CN106237384A (zh) * 2015-06-09 2016-12-21 中国科学院苏州纳米技术与纳米仿生研究所 复合梯度浓度生物活性因子组织支架、其制备方法及应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081307A (zh) * 2009-11-26 2011-06-01 上海微电子装备有限公司 光刻机曝光剂量控制方法
CN106237384A (zh) * 2015-06-09 2016-12-21 中国科学院苏州纳米技术与纳米仿生研究所 复合梯度浓度生物活性因子组织支架、其制备方法及应用

Also Published As

Publication number Publication date
CN110021354A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
Trapnell et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation
Uyeda et al. A novel Bayesian method for inferring and interpreting the dynamics of adaptive landscapes from phylogenetic comparative data
CN110663049B (zh) 神经网络优化器搜索
Clarke et al. Comparative analysis of de novo transcriptome assembly
CN110957009A (zh) 一种基于深度混合网络的单细胞转录组缺失值填补方法
US11334646B2 (en) Information processing apparatus and method for controlling sampling apparatus
KR102425673B1 (ko) 시퀀싱 데이터 리드 재정렬 방법
Avdeyev et al. Dirichlet diffusion score model for biological sequence generation
US20200082910A1 (en) Systems and Methods for Determining Effects of Genetic Variation of Splice Site Selection
CN105874460B (zh) 识别靶序列的至少一个碱基的方法、可读介质及设备
CN110021354B (zh) 用于测序的曝光方法、测序方法及装置和存储介质
CN116502699A (zh) 基于对比学习通过能量函数引导从扩散模型采样的方法
Theis et al. RNA 3D modules in genome-wide predictions of RNA 2D structure
US20160098517A1 (en) Apparatus and method for detecting internal tandem duplication
CN109063128A (zh) 集成核密度估计器窗口参数优化方法、装置及终端设备
CN109445279B (zh) 参数调整方法及电子设备
Kao et al. naiveBayesCall: An efficient model-based base-calling algorithm for high-throughput sequencing
CN111737417A (zh) 修正自然语言生成结果的方法和装置
CN111445949A (zh) 利用纳米孔测序数据的高原多倍体鱼类基因组注释方法
WO2015062183A1 (en) Method and apparatus for separating quality levels in sequence data and sequencing longer reads
CN110309491B (zh) 一种基于局部高斯混合模型的暂态相位划分方法及系统
Deng et al. dsplicetype: A multivariate model for detecting various types of differential splicing events using rna-seq
CN117496275B (zh) 基于类增学习的深度图像分类网络训练方法、电子设备及存储介质
CN115938353B (zh) 语音样本分布式采样方法、系统、存储介质和电子设备
Bingöl Gatekeeper-GPU: Accelerated pre-alignment Filtering in Short Read Mapping

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518083 the comprehensive building of Beishan industrial zone and 11 2 buildings in Yantian District, Shenzhen, Guangdong.

Applicant after: Shenzhen Huada Zhizao Technology Co., Ltd

Applicant after: COMPLETE GENOMICS Inc.

Address before: 518083 the comprehensive building of Beishan industrial zone and 11 2 buildings in Yantian District, Shenzhen, Guangdong.

Applicant before: Shenzhen Huada Zhizao Technology Co.,Ltd.

Applicant before: COMPLETE GENOMICS Inc.

GR01 Patent grant
GR01 Patent grant